马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
本帖最后由 hdy 于 2025-4-30 03:01 编辑
▌Nvidia 的高功耗 AI 芯片推动液冷技术前进 Nvidia 最新的 H100 芯片在 SXM 插座上运行时功耗高达 700 瓦,而在 PCI-E 配置下功耗仍然高达 400 瓦。因此,2024 年成为数据中心行业普遍关注液冷技术的一年,也就不足为奇了。 AI 的爆炸式增长迫使数据中心运营商跳出传统的空气冷却方案,寻找更加高效的冷却方式,以保持 IT 系统的高效运行。
▌液冷解决方案迎来突破性发展 在 AI 计算需求激增的背景下,数据中心业主和运营商不得不为全新的绿色数据中心设计液冷系统,同时还要考虑现有数据中心的改造和升级。 目前,这些计算负载的需求似乎仍在不断增长,无论是在 功耗、冷却、带宽 还是 数据存储 方面。例如,Nvidia 即将推出的 Blackwell 系列 GPU 进一步提升了功耗需求: •B200 GPU 的功耗预计可达 1,200W •GB200(由两个 B200 GPU 及 Grace CPU 组成) 甚至可能达到 2,700W 这一变化意味着,单一GPU代际功耗增长高达 300%,充分反映了 AI 计算系统不断攀升的能源需求。 ▌液冷市场增长迅猛,预计 2028 年将达 168 亿美元 液冷市场正在迎来高速发展,分析机构预计 数据中心冷却市场将在 2028 年达到 168 亿美元,年均复合增长率(CAGR)高达 25%,其中液冷技术是最大推动力。 随着 AI 计算负载的不断扩大,超高密度 AI 机柜 正逐渐成为现实。这些机柜的功耗可高达 100kW,其内部设备价值可能超过 1,000 万美元/机柜,通常依赖于直触式液冷或浸没式液冷。这种转变带来了供电、空间和冷却 等方面的严峻挑战,以适应前所未有的计算负载。 在确定 AI 计算冷却策略之前,业主和运营商必须评估广泛的工程因素,不仅要考虑供应链限制,还要兼顾长期的企业 ESG(环境、社会、治理)和可持续发展目标。
▌直触式液冷 vs. 浸没式液冷:谁将主导市场?
在众多液冷解决方案中,冷板技术和直触式液冷似乎最受欢迎。 •直触式液冷,特别是 冷板液冷,因其在高密度计算环境中的高效性及与现有数据中心基础设施的兼容性,成为最常见的选择。 •对于新建数据中心,浸没式液冷部署可能会增加,采用 单相或两相冷却技术。
▌厂商推动液冷技术创新 自 2022 年底 以来,液冷厂商一直在努力平衡创新与风险管理,并推出了新方案,一些方案甚至模糊了直触式液冷与浸没式液冷的界限。
1. Accelsius NeuCool 两相直触式液冷 2024 年 4 月,Accelsius 推出了 NeuCool 两相直触式液冷解决方案,其工作原理如下: •采用介电制冷剂,在吸收高功率 CPU/GPU 的热量时蒸发,形成冷却循环。 •蒸汽随后被冷凝并重新循环,从而形成高效冷却回路。 •该系统可支持 单个插座高达 2,200W,并能为 100kW 机柜 提供冷却。 •还能用于老旧空气冷却设备的升级,其专利 CPU/GPU “蒸发器”可直接替代传统散热器,无需更改设备结构。 •可选水冷或无水冷设计,具有模块化结构,适用于 边缘计算到超大规模数据中心 的不同需求。
2. Chilldyne 直触式液冷:真空防泄漏技术 Chilldyne 推出了一个创新性的直触式液冷方案,可有效防止泄漏。 •该系统通过真空吸力 使冷却液在 CPU/GPU 冷板 之间流动。 •如果冷却管破裂,真空系统会防止液体泄漏,并自动吸入空气,确保冷却液不会外溢。 •该系统持续监测压力变化,一旦发生异常会向运营商发出警报。 •在某些配置下,该系统可以隔离受影响区域,以最小化对其他组件的影响。 •2024 年 7 月,Chilldyne 进一步推出了即插即用(Plug-and-Play)液冷入门套件,支持 150kW 机柜冷却,为数据中心现代化改造提供便捷解决方案。
3. Asperitas、LiquidStack、Submer:押注浸没式液冷 一些厂商则将目光投向新建数据中心,如 Asperitas、LiquidStack 和 Submer,他们专注于 浸没式液冷 方案。 •浸没式液冷 采用 单相或两相技术,即将服务器完全浸入介电液体,通过液体高效传热将热量带走。 •优点:冷却效率极高,适用于超高密度计算负载。 •挑战:需要重新设计数据中心架构,与现有空气冷却系统兼容性较低。
▌液冷普及的挑战 尽管液冷具有长远的节能优势,但它仍面临几个主要阻碍因素: 1.前期投资高:无论是改造旧数据中心还是新建数据中心,液冷方案的设备投入成本较大。 2.低密度数据中心难以推广:对 AI 或 HPC 需求不高 的数据中心,仍然可以依赖空气冷却,无需升级液冷系统。 3.缺乏标准化:液冷系统的管路、分配单元(CDU)、储液罐等组件 不同厂商间缺乏统一标准,导致兼容性问题。 4.监管与可持续性压力:某些冷却液对环境影响较大,需要特殊处理和回收,增加了企业的运营成本。
▌未来展望:液冷市场仍有巨大增长空间 尽管面临挑战,液冷市场仍然拥有广阔的增长潜力。随着行业标准化推进,以及厂商不断创新以降低风险,液冷的应用范围将进一步扩大。 毕竟,物理定律不会改变:每增加 1W 功率,就需要移除 1W 热量。
|