AI集群Scale-UP市场需求攀升，英伟达开放NVLink Fusion应对博通以太布局

显示全部楼层 · 前天 22:56

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区

您需要登录才可以下载或查看，没有账号？立即注册

×

随着AI超节点机柜逐渐被市场验证（英伟达NV72、华为384等）Scale-UP网络互联市场需求攀升，黄教主一边用自己的NVLINK技术大杀四方，一边发现博通、marvell等 ASCI厂商在给各大云厂商定制的算力芯片，使用的Scale-UP网络技术逐渐由PCIE变成了博通的以太网交换芯片，而且Scale-UP网络的市场规模比Scale-OUT更大，与其将这块业务丢给博通，不如自己接过来，直接卖自己的NV 交换芯片。

于是在2025年5月台北国际电脑展上，英伟达开方了NVLink Fusion技术，标志着该公司从封闭的硬件供应商向开放的AI基础设施解决方案提供商的战略转型。这项基于NVLink高速互连架构的IP授权技术，允许第三方CPU与英伟达AI芯片(如Grace CPU、Blackwell GPU)混合部署，实现异构计算环境下的无缝通信。

NVLink Fusion通过开放硬件接口与维持软件生态的双重策略，既巩固了英伟达在AI基础设施领域的中心地位，又巧妙应对了全球芯片禁令带来的市场挑战。这项技术的推出将重塑AI芯片行业的竞争格局，加速异构计算的普及，并为中国台湾等地区带来新的发展机遇。

一、NVLink Fusion的技术原理与架构特点

NVLink Fusion核心技术原理基于英伟达已验证的NVLink-C2C(Chip-to-Chip)互连技术，该技术采用先进的封装技术，能效比NVIDIA芯片上的PCIe Gen 5高出25倍，面积效率提高90倍，可实现每秒900GB乃至更高的一致互联带宽。NVLink Fusion与NVLink-C2C形成互补关系：C2C支持芯片级互连（如CPU-GPU裸片直连），而Fusion则通过IP授权将互连能力扩展到第三方CPU/ASIC，形成更广泛的系统级集成。

在性能方面，NVLink Fusion展现出明显优势。实测数据显示，在70B模型推理中，NVLink 3.0的单次all reduce延迟仅为603μs，而PCIe 4.0高达11369μs，总通信开销减少约90%。这种低延迟特性对于AI训练和推理至关重要，因为它避免了GPU在等待数据时的闲置，极大提高了GPU利用率。此外，NVLink Fusion还支持Arm AMBA一致性集线器接口（AMBA CHI）和CXL工业标准协议，实现了设备间的互操作性。

二、英伟达推出NVLink Fusion的战略目的

英伟达推出NVLink Fusion的核心战略目的在于通过开放硬件接口与维持软件生态的双重策略，巩固其在AI基础设施领域的中心地位。这一策略既是对全球AI芯片市场格局变化的回应，也是英伟达应对美国对华芯片禁令的灵活举措。

首先，英伟达面临来自云服务商和ASIC厂商（主要是博通）的挑战。谷歌、微软和亚马逊等云提供商已开发出自己的定制处理器（如谷歌TPU、微软Maia），这些ASIC在特定应用场景下具有成本优势。

英伟达通过NVLink Fusion技术，允许这些竞争对手将英伟达GPU与自家ASIC结合使用，既缓解了直接竞争的压力，又确保了英伟达在AI基础设施中的核心地位。"NVLink代表了英伟达计划在基于ASIC的数据中心中占有份额，而ASIC传统上被视为英伟达的竞争对手。"

其次，NVLink Fusion是英伟达应对美国对华芯片禁令的重要布局。随着H20芯片在中国的禁售。英伟达CEO黄仁勋在台北Computex上表示，"针对英伟达H20芯片的额外禁令令人深感痛苦，但这不会阻止我们继续在中国市场发展。"他特别强调，英伟达将联合台积电、富士康在中国台湾建立AI超级计算机，并在上海设立新研发中心，这些举措都与NVLink Fusion生态密切相关。

第三，NVLink Fusion体现了英伟达从硬件供应商向AI基础设施解决方案提供商的转型。黄仁勋在演讲中明确表示："NVLink Fusion是为了让你可以构建半定制的人工智能基础设施，而不仅仅是半定制的芯片。"这一转变使英伟达能够提供更灵活的解决方案，满足不同客户的需求，同时通过CUDA软件生态保持长期竞争力。

最后，NVLink Fusion也是英伟达推动全球AI算力普及的战略举措。通过与联发科、Marvell、富士通等合作伙伴的合作，英伟达能够将高端AI技术下沉到更广泛的市场，包括边缘计算和中小企业。黄仁勋强调："AI工厂的部署权，逐步下沉至个人开发者。"这表明英伟达希望通过NVLink Fusion技术，将AI算力从云端扩展到端侧，形成完整的AI生态系统。

三、中美AI竞争的影响

美国仍会不遗余力的对中国进行AI科技封锁，高端算力芯片禁售、高端HBM存储芯片禁售后，剩下的只有高端网络，英伟达也是想利用这一点来规避禁令向中国出售进一步裁剪后的GPU芯片，但我觉得早晚这个点也会被美国堵上。

SemiAnalysis 是一家专注于半导体和人工智能行业的独立研究与分析公司。在其近期的一篇分析文章中就指出了高端网络对AI集群的重要性，并呼吁美国政府关注修补高端网络存在的漏洞。

报告中指出：单个GPU并非孤立存在，而是由数万个芯片组成的集群的一部分。在集群中，同步性较好的较慢worker（工作节点），其性能可与不同步的较快worker相当。这体现了计算（单个工作线程速度）与互连（GPU同步）之间的关联。

在芯片连接技术方面，有 “纵向扩展（Scale - up）” 和 “横向扩展（Scale - out）” 两种标准技术。Nvidia的NVLink是 “纵向扩展” 网络的典型代表，侧重于较小的芯片 “小队”；InfiniBand或以太网则是 “横向扩展” 网络的示例，侧重于芯片 “军团” 。

计算能力固然重要，但高互连带宽能实现更快的芯片聚合。即便芯片的特定计算性能受限，通过互连和内存带宽，也能将数千个芯片整合成强大的内聚单元，削弱了单纯控制芯片计算性能的意义。

因此，芯片出口管制需采用更全面的方法。合理的管制框架应着眼于整个芯片集群，而非单个芯片。出口管制应聚焦于达成最终目标，而非限制某一可被绕开的单一技术属性。统一的集群级框架更为全面，从长远看能减少管制漏洞，助力美国在更多维度维持领先，而非仅依靠高计算性能芯片。

[最新新闻] AI集群Scale-UP市场需求攀升，英伟达开放NVLink Fusion应对博通以太布局

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区