马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
英特尔公司今天宣布以20亿美元收购Habana Labs。该公司总部位于以色列,是一家为数据中心提供可编程深度学习加速器的厂商。此次收购将增强英特尔的人工智能产品组合,并加快其在快速增长的人工智能芯片新兴市场的发展。但是,AI初创公司的数据中心芯片将如何与现有产品线匹配?
英特尔公司今天宣布以20亿美元收购Habana Labs。该公司总部位于以色列,是一家为数据中心提供可编程深度学习加速器的厂商,在世界各地雇佣了大约150名员工。此次收购将增强英特尔的人工智能产品组合,并加快其在快速增长的人工智能芯片新兴市场的发展。英特尔预计,到2024年,这一市场规模将超过250亿美元 。
从智能边缘到数据中心完善AI产品
英特尔数据平台事业部执行副总裁兼总经理孙纳颐(Navin Shenoy)认为:“此次收购推进了我们的人工智能战略,即:从智能边缘到数据中心,为客户提供适合各种性能需求的解决方案。具体来说,通过高性能训练处理器系列产品和基于标准的编程环境,Habana Labs大大增强了我们数据中心人工智能产品的实力,以应对不断变化的人工智能负载。”
收购完成后,Habana将作为一个独立的业务部门,并将继续由当前管理团队来领导。 Habana将向英特尔数据平台事业部报告,该事业部也是英特尔广泛的数据中心人工智能技术的大本营。此次收购将使Habana能够充分利用英特尔人工智能能力,其中包括过去三年人工智能软件、算法和研究方面的深厚专业知识和积累的大量资源,将有助于Habana不断扩展并加速发展。
Habana董事长Avigdor Willenz同意担任该业务部门以及英特尔的高级顾问。Habana的总部将继续设于以色列不变,该地英特尔也有长期投资和布局。此次交易之前,英特尔投资是Habana的投资方。
孙纳颐同时表示:“我们了解到,客户们在寻求易于编程的专用人工智能解决方案时,也需要在各种工作负载和神经网络拓扑上拥有卓越的可扩展性能,而Habana在这些方面的骄人纪录有目共睹,因此我们很高兴Habana这样的人工智能团队加入英特尔。我们整合后的知识产权和专业知识,将为数据中心的人工智能工作负载提供无与伦比的计算性能和效率。”
Habana首席执行官David Dahan表示:“由于之前就有英特尔的投资,我们很幸运能够了解英特尔的业务并与之合作,如今,我们很高兴正式加入英特尔大家庭。英特尔创建了世界一流的人工智能团队和能力。我们很高兴与英特尔合作,加快并扩展我们的业务。携起手来,我们将更快地为客户带来更多人工智能创新。”
展望未来,英特尔计划充分利用不断增长的人工智能技术产品组合和人工智能人才,为客户的人工智能工作负载提供无与伦比的计算性能和效率。
英特尔的人工智能战略基于这样一个信念:要想充分利用人工智能的力量来改进业务成果,就需要广泛的软硬件技术组合以及完整的生态系统支持。现在,英特尔人工智能解决方案正在帮助客户把数据转化为业务价值,并为公司带来可观的收入。2019年,英特尔预计人工智能业务带动的收入将超过35亿美元,同比增长20%以上。英特尔和Habana将共同为数据中心加速带来一流的人工智能产品,满足客户不断变化的需求。
Habana vs Nervana
此次收购对Nervana产品线(与Habana产品直接竞争)的意义仍然存有疑问。
早在2016年,英特尔就以大约4亿美元的价格收购Nervana。上个月,Nervana推出了自己的数据中心训练和推理处理器——NNP-T和NNP-I。
尽管收购两个相互竞争性的芯片似乎是一个奇怪的策略,但其中有很多利害关系。英特尔预计,2019年人工智能的收入将超过35亿美元(同比增长20%)。因此,它不能选错马。支持两匹马,甚至将最好的马与最好的骑师结合在一起(在这种情况下,可能是Habana的芯片与Nervana的软件结合)可能是更好的选择。
Habana:Gaudi and Goya
Habana的Goya推理芯片于2018年9月推出,现已在市场上销售实现商用。其在极具竞争力的包络功率中具有超大的吞吐量和超低的实时延迟,由此展现出自身卓越的推理性能。随着人工智能工作负载的不断增加,对计算、内存和连接的要求也越来越高,Gaudi训练产品和Goya推理产品能够提一个丰富的、易于编程的开发环境,能够帮助客户部署差异化解决方案。在100 W功率下运行时,它可以以1.3毫秒的延迟,每秒1.3ms的延迟处理15,000 ResNet-50图像(图像的数量是竞争平台的5倍以上)。
Habana于2019年6月推出了其Gaudi训练芯片,目前正在向超大规模客户提供样品。与使用同等数量GPU构建的系统相比,基于Gaudi的大节点训练系统的吞吐量预计将增加4倍。Gaudi旨在让系统实现高效灵活的横向、纵向扩展。训练ResNet-50网络时,Gaudi可以每秒处理1,650张图像,批处理大小为64。该吞吐量以140 W的功耗提供。
这两款芯片均具有八个VLIW SIMD(超长指令字,单指令多数据)矢量处理器内核,Habana称其为张量处理器内核(TPC),它们是专为AI工作负载设计的。
Gaudi架构的关键之一是其片上RoCE(通过融合以太网进行远程直接内存访问)网络。 Habana表示,该芯片直接在处理器芯片上提供10个100 Gigabit以太网端口,这在当时的AI加速器世界中是独一无二的(竞争解决方案需要额外的芯片进行连接; Nvidia之前正是出于这项技术而收购了Mellanox)。
片上RoCE使扩展性变得容易;可以使用基于标准的非专有接口来构建具有数十种芯片的大型训练系统。无疑,此功能对英特尔的数据中心客户具有吸引力。 Habana的技术与英特尔对超大规模处理器的访问结合在一起,并得到了计算巨头广泛资源的支持,这很可能会被证明是非常成功的组合。 |