英特尔收购威尼斯美食全能店背后的逻辑

来源:内容来自《老实人谭鑫》,老实人,谢谢 4月中旬,英特尔宣布收购一家名为Omnitek的英国公司,以“增强现场可编程门阵列在视频和视觉领域的产品组合” Omnitek对许多人来说不是一个非常熟悉的名字。 那么,为什么它会受到英特尔的青睐,这次收购背后的技术逻辑是什么,让老师在本文中为大家深入分析一下 (OmnitekCEO和创始人,Omnitek的照片)谁是Omnitek)Omnitek不是传统的初创公司。它成立于1998年,总部位于英格兰南部的巴辛斯托克,如下图所示 巴辛斯托克小镇是英国最著名的经济和技术中心之一,巴宝莉就是从这里诞生的。 这里是许多世界知名大公司的总部或欧洲总部,包括许多半导体和技术公司,如索尼、摩托罗拉、意大利爱立信等。华为的欧洲总部也曾位于这个小镇。 虽然Omnitek成立已有20多年,但员工总数只有40人左右,而且没有公共融资记录。 从这些方面来看,Omnitek只能被视为一家中型甚至小型公司。 然而,在过去的20年里,Omnitek已经开发并积累了220多个FPGA硬件知识产权、相应的软件系统和开发平台,如下图所示。 (Omnitek图片)这些FPGAIP主要专注于视频和图像处理,包括旋转、变形、3D映射、利用FPGA对超高清视频图像进行编码和解码,如下图所示。 (Omnitek图片)这些应用一直是FPGA的传统应用领域,尤其是在视频会议、投影、显示屏等场合。 因此,如收购后的官方新闻稿所述,此次收购将大大加强英特尔FPGA在视频和图像处理领域的知识产权资源。 然而,老师注意到Omnitek在2018年底发布了自主开发的深度学习处理器(DPU)。 Omnitek声称,与市场上任何类似的基于现场可编程门阵列的产品相比,DPU拥有50%的性能优势。 同时,与GPU相比,这款DPU在给定功耗或成本限制下也具有更优异的性能。 在各种类型的人工智能处理器xPU一个接一个出现的时候,Omnitek是一个大胆而自信的官员。 老石认为,这也是英特尔收购Omnitek背后的主要逻辑。 “表面上最强”的FPGA深度学习处理器使用FPGA加速人工智能应用硬件主要有以下优点:1 .现场可编程门阵列芯片具有大量的数字信号处理器硬核资源、分布式片上存储器和大量的可编程逻辑资源,非常有利于神经网络的硬件实现 2.FPGA具有很强的灵活性,可以根据不同的需求和应用进行编程,并调整相应的硬件结构 3.FPGA可以处理任意精度的算术运算 4.高端现场可编程门阵列(FPGA)通常是基于最新的半导体工艺节点制造的,并且具有不同的产品系列和尺寸。它提供高性能,同时考虑到低功耗和低成本。 5.除了人工智能相关的知识产权之外,现场可编程门阵列(FPGA)还有大量成熟的知识产权资源,因此可以快速与人工智能知识产权集成,为特定的应用场景构建一个完整的系统方案 基于这些优势,Omnitek选择了FPGA作为其深度学习处理器的主要实现平台,这与包括微软在内的业界许多公司一样,如下图所示。 (来自微软的图片)事实上,与微软在“脑电波项目”中使用的DPU相比,Omnitek的DPU在使用模式上有许多相似之处 这种DPU,也被称为软分布式处理单元(SoftDPU),其特征在于提供了一种基本的硬件架构来加速深层神经网络的计算。同时,它提供了完整的软件编程接口和编译器,使上层用户能够使用高级语言配置神经网络。 这种架构的主要优势是软件和硬件的完全解耦,这也使得用户不需要掌握与硬件相关的专业知识,因此他们只需要专注于算法和模型本身的设计,并且可以通过Python和C/C++等高级语言来调整和配置模型 与高级综合相比,这种基于可编程门阵列的DPU设计方法在性能、开发灵活性、编译时间等方面具有明显优势。 与微软DPU相比,Omnitek的DPU有自己独特的特点。 其系统架构图如下 (Omnitek图片)可以看出,用户可以使用主流机器学习框架(如TensorFlow、Caffe或OpenVINO)构建的模型,或者自己用高级语言编写的模型,通过DPU编译器生成特定微码,这与微软DPU使用数据流图的方式不同。 这些微码将用于在现场可编程门阵列上配置DPU数据处理流水线,如下图所示 (Omnitek图片)Omnitek)OmnitekDPU的另一个主要功能是它可以通过编程来调整不同DNN拓扑的支持效率。 一般来说,某些DNN硬件加速器通常是为某些DNN拓扑设计的 以谷歌的TPU为例,它对于阿尔法狗使用的有线电视新闻网模型(CNN0)有很高的运行效率,平均性能也可以达到86个点,如下图所示。 然而,对于其他有线电视新闻网型号,如谷歌眼镜(CNN1),谷歌TPU只能实现46.2%的运营效率,其性能也骤降至14.1台 因此,不同的有线电视网络模型对单个硬件架构的实际性能有很大影响 除了有线电视新闻网,RNN和MLP等其他DNN拓扑结构与有线电视新闻网有明显不同的特点 此外,随着人工智能理论研究的不断推进,其他更新颖的网络拓扑也必将不断涌现。 因此,如果使用相同的硬件架构“平等对待”这些DNN拓扑,肯定无法获得令人满意的性能。 (Omnitek图片)在这种情况下,只有现场可编程门阵列能够快速调整硬件结构以适应不同的网络拓扑,这是专用集成电路或图形处理器无法实现的 这是OmnitekDPU的另一个主要特性 此外,OmnitekDPU还使用“片上网络(NoC)”技术在多个处理器之间互连和共享数据,如下图所示 NoC是目前大型芯片上数据共享和高速传输的新技术。在赛勒斯最新的ACAP建筑中,也使用了NoC技术(Omnitek的图片)性能。Omnitek发布了在英特尔Arria10GX1150FPGA上实现的DPU性能数据,如下所示 仅从上面的数字,特别是TOPS专栏,我们只能说它不令人满意。 然而,性能功耗比(GOPS/瓦)相对较高,这反映了FPGA的低功耗优势。 同时,考虑到Arria10是一种基于20纳米工艺的现场可编程门阵列,可以预期,当使用更先进的现场可编程门阵列,如Stratix 10(14纳米)或Agelix(10纳米)时,上述数字无疑会有很大提高。 事实上,Omnitek也有使用昔兰尼16纳米超大规模+现场可编程门阵列(FPGA)获得的性能结果,这比上述数据有明显的提高。这篇文章不会再给它了。欢迎感兴趣的读者在老舍谭鑫的背景下回复《DPU》。 结论Omnitek作为一家已经工作了20年的视频FPGAIP提供商,刚刚进入人工智能芯片领域,依靠技术积累开发出了地球表面最强大的深度学习处理器,随后被英特尔收购。这一系列的操作真是令人眼花缭乱。 对于英特尔而言,此次收购不仅加强了其在视频和图像处理领域的FPGAIP组合,还直接获得了Omnitek成熟的DPU软硬件方案 这无疑进一步扩大了英特尔在人工智能领域的产品布局和多样性。 Omnitek的官方网站列出了许多公司的核心价值观,有趣的一点是,它允许员工有灵活的工作时间,因为公司“理解所有员工很难维持‘九到五’个小时的工作时间。” 今天,当996流行的时候,它无疑更值得思考,工作和生活,这是我们应该追求的好消息。 *免责声明:这篇文章最初是作者写的 这篇文章的内容是作者的个人观点。重印半导体行业观察只是为了传达不同的观点。这并不意味着半导体行业观察同意或支持这一观点。如果您有任何异议,请联系半导体行业观察。

未经允许不得转载:澳门威尼斯人app » 英特尔收购威尼斯美食全能店背后的逻辑
分享到:
赞(0)

评论抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址