马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
AMD在2025年Computex上宣布,Radeon Open Compute(ROCm)软件平台新增对Strix Halo APU和Radeon RX 9000系列GPU的支持。这个举动有点出乎意料,我们可能低估了AMD的边缘AI技术在消费级市场的应用。ROCm 6.4.1版本的发布,不仅强化了AMD在AI领域的软件生态,还为用户带来了强大的本地AI计算能力,标志着AI从专业领域向普通消费者的普及迈出重要一步。
ROCm是AMD为高性能计算和AI应用开发的核心软件堆栈,用来提供开源、跨平台的GPU加速解决方案。最新发布的ROCm 6.4.1版本首次将支持范围扩展至消费级硬件,这一更新使AMD能够通过软件优化释放硬件潜力,让普通用户也能运行复杂的AI工作负载。Strix Halo APU是AMD面向高端移动计算市场的旗舰产品,集成了16个Zen 5架构核心、40个RDNA 3.5计算单元以及XDNA 2 AI引擎,AI性能高达50 TOPS(每秒万亿次运算)。这一配置使其在处理AI推理和训练任务时表现出色,特别适合边缘AI场景,如本地大语言模型(LLM)运行和图像生成。ROCm通过支持PyTorch 2.5/2.6、ONNX Runtime等AI库,优化了Strix Halo的AI性能,使用户能够充分利用XDNA 2引擎和RDNA 3.5计算单元,大幅提升计算效率。 Radeon RX 9000系列GPU基于RDNA 4架构,定位于主流桌面市场,包含RX 9070和RX 9070 XT两款型号。这些GPU配备第二代AI加速器和第三代光追加速器,拥有高达64个计算单元和4096个流处理器。ROCm 6.4.1为这些GPU提供了硬件加速支持,使其能够运行Megatron-LM等AI框架。这意味着普通消费者可以在本地运行生成式AI应用,如Stable Diffusion,极大降低了AI应用的硬件门槛。其中RX 9070 XT基于Navi 48芯片,配备16GB GDDR6内存(256位总线,18-20 Gbps速率,带宽达640 GB/s),最大时钟频率可达3.1 GHz,总板功耗约260W。RX 9070性能稍逊,但仍足以媲美前代RX 7900 GRE。RDNA 4架构在FP16运算上实现每周期翻倍,FP8运算能力较RDNA 3提升八倍(支持稀疏性),为AI加速提供了硬件基础。配合FidelityFX Super Resolution 4(FSR 4),RX 9000系列在游戏和AI应用中实现了更高的帧率和图像质量。
AMD在软件生态的跨平台兼容性上也取得突破。ROCm 6.4.1支持OpenSuSE等Linux发行版,并计划在2025年下半年扩展至Ubuntu和Red Hat EPEL。此外,AMD宣布ROCm将支持Windows平台,预计2025年第三季度推出PyTorch预览版,7月推出ONNX Runtime Execution Provider(ONNX-EP)。微软近期开源的Windows Subsystem for Linux(WSL)进一步增强了ROCm的兼容性,AMD表示ROCm在WSL环境中运行良好。这为Windows开发者提供了便捷途径,使其能在熟悉的操作系统中访问ROCm生态,开发基于AMD硬件的AI应用。WSL的支持降低了开发门槛,有望吸引更多开发者加入AMD生态。 AMD的更新正值边缘AI市场快速增长之际。全球AI PC市场预计到2027年将达到数千亿美元规模,消费级设备对本地AI算力的需求日益增加。ROCm的开源特性和对消费级硬件的支持,使AMD直接挑战NVIDIA的CUDA平台。CUDA凭借广泛的开发者支持和成熟生态长期占据主导,但其闭源性质和高昂硬件成本限制了在消费市场的普及。ROCm的优化填补了消费级AI软件生态的空白,为AMD赢得了竞争优势。Strix Halo APU的性能使其成为高端游戏本和AI工作站的理想选择,其40个RDNA 3.5计算单元的性能接近RX 7600独显,足以应对主流游戏和内容创作需求。RX 9000系列GPU通过主流定位和亲民价格,吸引了预算有限的玩家和AI爱好者。
AMD的ROCm扩展计划展现了红厂在AI领域的长期布局。2025年下半年,ROCm将支持更多Linux发行版和Windows平台,开发者生态有望进一步壮大。与微软的合作(如ONNX和Windows ML框架的支持)将增强ROCm在跨平台开发中的竞争力。对于消费者而言,ROCm 6.4.1降低了AI使用门槛,无论是运行本地LLM、生成高质量图像,还是优化游戏体验,AMD的软硬件结合都提供了强大支持。未来,随着ROCm生态的完善和AI应用的普及,AMD有望在边缘AI市场占据更大份额,为用户带来更智能、便捷的计算体验。
|