[IT/数码] Nvidia开放NVLink,支持第三方定制CPU和AI加速器

[复制链接]
查看11 | 回复0 | 7 小时前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?立即注册

×


00381761ebf117.png
据外媒报道,Nvidia在本周的Computex大会上推出了NVLink Fusion功能,原本仅限于Nvidia CPU、GPU之间互连的技术,现在不仅支持其他定制CPU与Nvidia GPU互连,同时也支持Nvidia CPU/GPU与第三方AI加速器的互连。
NVLink是Nvidia推出的高速互连技术,通过连接系统中的多个GPU组成一个性能更强的“GPU”,比如GB200 NVL144系统中72个GPU间的互连就使用NVLink技术。目前NVLink技术已经发展到第五代,支持每GPU高达1.8TB/s的带宽(单向900GB/s),最多可连接72个GPU。
Nvidia推出的NVLink Fusion技术实际上是将NVLink技术开放,允许第三方的半定制加速器利用NVLink进行高速互连。
据Nvidia介绍,NVLink Fusion提供两种配置:第一种是将定制CPU连接到Nvidia GPU;第二种则是Nvidia Grace(CPU)或Vera GPU与其他非Nvidia加速器进行连接。这意味着,用户依然无法摆脱Nvidia,连接的一方中必须得是Nvidia产品,不管是CPU还是GPU。当然,连接的另一方也必须支持NVLink。
003819180f9609.png
据介绍,联发科、Marvell、Alchip、Astera Labs、Synopsys和Cadence都承诺支持NVLink技术。同时,富士通和高通计划使用NVLink技术来开发定制CPU。但Intel和AMD并没有出现在支持者名单中。
Nvidia为什么会开放NVLink技术?一方面或许是大客户的强硬需求,另一方面则可能是来自UALink(Ultra Accelerator Link Consortium,超级加速器链路联盟)的压力。
众所周知,Nvidia GPU的大客户是微软、AWS、Meta等为代表的互联网大厂或云巨头。巨头们每年会花数十亿乃至数百亿美元在数据中心基础设施方面,为了成本节省,通常会定制包括处理器、AI加速器在内的各种服务器组件。而作为CPU与GPU、GPU与GPU之间的高速互连技术NVLink,巨头们必然会要求Nvidia开放,以方便巨头们更灵活地设计、定制服务器。就如SSD应用初期,Meta要求Fusion-IO开源其SSD连接技术一样。
面对巨头们的要求,强势如Nvidia也不得不进行相应的妥协,但依然保留了其核心优势,即用NVLink技术互连的一方,必须得有Nvidia产品(不管是CPU还是GPU),这就意味着NVLink Fusion对大多数用户并无实际意义,顶多是在已有Nvidia产品系统中混插一些其他AI加速器,但由此产生的使用、管理与维护复杂度是否真的值得,就只能用户自行评估了。
NVLink技术并非不可替代,实际上业界早在开发新的处理器间高速互连技术了。UALink就是其中最具潜力的技术之一。UALink技术是UALink联盟推出的一项处理器间高速互连技术,于今年4月发布了第一个规范——UALink 200G,即最高可达200Gbps或单通道约50GB/s的带宽,最多可支持1024个加速器互连。
003821ccac31a5.png
UALink技术路线图
看起来UALink 200 Gbps(单向50GB/s)对比NVLink的1.8TB/s(单向900GB/s)并无优势?但需要注意的是,NVLink互连的1.8TB/s也是通过聚合多个通道来实现的,UALink当然也可以实现同样的效果,且UALink连接的加速器数量更多(意味着组成的“GPU”算力更高),在聚合通道和端口方面也更加灵活。
并且,相比于Nvidia的盟友(联发科、Marvell)几乎大多是芯片设计商(本身并非最终用户),UALink联盟的成员则大多是互联网云巨头(亚马逊、Google、微软与Meta等),Intel和AMD也在UALink联盟中,且均为董事会成员。这也就解释了Intel、AMD为何不在NVLink支持者名单中,因为他们在大力推广UALink。
这让我想起了一些往事。
大约在十年前(2015年前后),Intel在数据中心领域如日中天,打得IBM的Power小机节节败退。为了阻挡Intel的攻势,IBM宣布开源Power服务器(即OpenPOWER),所有用户都可以使用Power服务器技术,同时还拉拢Nvidia,当时的Nvidia就贡献了NVLink技术。
从技术上看,POWER处理器无愧于“地表最强处理器”的称号,但奈何IBM只是为了搅Intel局:OpenPOWER仅限于双路服务器,且很多IBM专有(收费)技术,所以这个OpenPOWER联盟最终也就无疾而终(尽管Google成规模部署了OpenPOWER服务器)。而在OpenPOWER宣布之初,业内很多人就将这一联盟调侃称之为“失败者联盟”……
十年河东,现在如日中天的Nvidia究竟怀着什么样目的推出的NVLink Fusion,或许只有时间知道。



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

hdy

546

主题

342

回帖

594

积分

二级逆天

积分
594