[最新新闻] AI集群Scale-UP市场需求攀升,英伟达开放NVLink Fusion应对博通以太布局

[复制链接]
查看9 | 回复0 | 前天 22:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?立即注册

×

随着AI超节点机柜逐渐被市场验证(英伟达NV72、华为384等)Scale-UP网络互联市场需求攀升,黄教主一边用自己的NVLINK技术大杀四方,一边发现博通、marvell等 ASCI厂商在给各大云厂商定制的算力芯片,使用的Scale-UP网络技术逐渐由PCIE变成了博通的 以太网交换芯片,而且Scale-UP网络的市场规模比Scale-OUT更大,与其将这块业务丢给博通,不如自己接过来,直接卖自己的NV 交换芯片。
于是在2025年5月台北国际电脑展上,英伟达开方了NVLink Fusion技术,标志着该公司从封闭的硬件供应商向开放的AI基础设施解决方案提供商的战略转型。这项基于NVLink高速互连架构的IP授权技术,允许第三方CPU与英伟达AI芯片(如Grace CPU、Blackwell GPU)混合部署,实现异构计算环境下的无缝通信。
225633c0b43ef0.png

NVLink Fusion通过开放硬件接口与维持软件生态的双重策略,既巩固了英伟达在AI基础设施领域的中心地位,又巧妙应对了全球芯片禁令带来的市场挑战。这项技术的推出将重塑AI芯片行业的竞争格局,加速异构计算的普及,并为中国台湾等地区带来新的发展机遇。
一、NVLink Fusion的技术原理与架构特点
NVLink Fusion核心技术原理基于英伟达已验证的NVLink-C2C(Chip-to-Chip)互连技术,该技术采用先进的封装技术,能效比NVIDIA芯片上的PCIe Gen 5高出25倍,面积效率提高90倍,可实现每秒900GB乃至更高的一致互联带宽。NVLink Fusion与NVLink-C2C形成互补关系:C2C支持芯片级互连(如CPU-GPU裸片直连),而Fusion则通过IP授权将互连能力扩展到第三方CPU/ASIC,形成更广泛的系统级集成。
在性能方面,NVLink Fusion展现出明显优势。实测数据显示,在70B模型推理中,NVLink 3.0的单次all reduce延迟仅为603μs,而PCIe 4.0高达11369μs,总通信开销减少约90%。这种低延迟特性对于AI训练和推理至关重要,因为它避免了GPU在等待数据时的闲置,极大提高了GPU利用率。此外,NVLink Fusion还支持Arm AMBA一致性集线器接口(AMBA CHI)和CXL工业标准协议,实现了设备间的互操作性。
二、英伟达推出NVLink Fusion的战略目的
英伟达推出NVLink Fusion的核心战略目的在于通过开放硬件接口与维持软件生态的双重策略,巩固其在AI基础设施领域的中心地位。这一策略既是对全球AI芯片市场格局变化的回应,也是英伟达应对美国对华芯片禁令的灵活举措。
首先,英伟达面临来自云服务商和ASIC厂商(主要是博通)的挑战。谷歌、微软和亚马逊等云提供商已开发出自己的定制处理器(如谷歌TPU、微软Maia),这些ASIC在特定应用场景下具有成本优势。
英伟达通过NVLink Fusion技术,允许这些竞争对手将英伟达GPU与自家ASIC结合使用,既缓解了直接竞争的压力,又确保了英伟达在AI基础设施中的核心地位。"NVLink代表了英伟达计划在基于ASIC的数据中心中占有份额,而ASIC传统上被视为英伟达的竞争对手。"
其次,NVLink Fusion是英伟达应对美国对华芯片禁令的重要布局。随着H20芯片在中国的禁售。英伟达CEO黄仁勋在台北Computex上表示,"针对英伟达H20芯片的额外禁令令人深感痛苦,但这不会阻止我们继续在中国市场发展。"他特别强调,英伟达将联合台积电、富士康在中国台湾建立AI超级计算机,并在上海设立新研发中心,这些举措都与NVLink Fusion生态密切相关。
第三,NVLink Fusion体现了英伟达从硬件供应商向AI基础设施解决方案提供商的转型。黄仁勋在演讲中明确表示:"NVLink Fusion是为了让你可以构建半定制的人工智能基础设施,而不仅仅是半定制的芯片。"这一转变使英伟达能够提供更灵活的解决方案,满足不同客户的需求,同时通过CUDA软件生态保持长期竞争力。
最后,NVLink Fusion也是英伟达推动全球AI算力普及的战略举措。通过与联发科、Marvell、富士通等合作伙伴的合作,英伟达能够将高端AI技术下沉到更广泛的市场,包括边缘计算和中小企业。黄仁勋强调:"AI工厂的部署权,逐步下沉至个人开发者。"这表明英伟达希望通过NVLink Fusion技术,将AI算力从云端扩展到端侧,形成完整的AI生态系统。
三、中美AI竞争的影响
美国仍会不遗余力的对中国进行AI科技封锁,高端算力芯片禁售、高端HBM存储芯片禁售后,剩下的只有高端网络,英伟达也是想利用这一点来规避禁令向中国出售进一步裁剪后的GPU芯片,但我觉得早晚这个点也会被美国堵上。
SemiAnalysis 是一家专注于半导体和人工智能行业的独立研究与分析公司。在其近期的一篇分析文章中就指出了高端网络对AI集群的重要性,并呼吁美国政府关注修补高端网络存在的漏洞。
报告中指出:单个GPU并非孤立存在,而是由数万个芯片组成的集群的一部分。在集群中,同步性较好的较慢worker(工作节点 ),其性能可与不同步的较快worker相当。这体现了计算(单个工作线程速度)与互连(GPU同步)之间的关联。
在芯片连接技术方面,有 “纵向扩展(Scale - up)” 和 “横向扩展(Scale - out)” 两种标准技术。Nvidia的NVLink是 “纵向扩展” 网络的典型代表,侧重于较小的芯片 “小队”;InfiniBand或以太网则是 “横向扩展” 网络的示例,侧重于芯片 “军团” 。
计算能力固然重要,但高互连带宽能实现更快的芯片聚合。即便芯片的特定计算性能受限,通过互连和内存带宽,也能将数千个芯片整合成强大的内聚单元,削弱了单纯控制芯片计算性能的意义。
因此,芯片出口管制需采用更全面的方法。合理的管制框架应着眼于整个芯片集群,而非单个芯片。出口管制应聚焦于达成最终目标,而非限制某一可被绕开的单一技术属性。统一的集群级框架更为全面,从长远看能减少管制漏洞,助力美国在更多维度维持领先,而非仅依靠高计算性能芯片。
22563303ccc5eb.png


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

hdy

507

主题

338

回帖

540

积分

二级逆天

积分
540