[业界/制造] AMD 2.0时代将至,MI450X将如何助其挑战英伟达(二):文化突围,重构开发者生态剑指CUDA霸权

[复制链接]
查看14 | 回复0 | 昨天 19:58 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 hdy 于 2025-5-14 20:03 编辑

19580701a3c458.png
AMD的文化转型——重燃紧迫感接受是走出困境的最后一步。AMD终于承认了其巨大的软件生态差距,现在可以着手解决问题,在软件与硬件竞赛中争取超越NVIDIA的机会。AMD已重振旗鼓,但NVIDIA仍在全力冲刺,AMD必须与之齐头并进甚至更快才能实现赶超。NVIDIA员工深知,要在竞争激烈的市场中保持领先地位,有时需要投入额外时间。AMD要想获胜,就必须付出至少与NVIDIA同等甚至更多的努力与智慧。我们已看到这种转变的明确迹象。
195807aab8a211.png
聚焦目标、充满进取心的团队实现逆袭的案例比比皆是。xAI与OpenAI的竞争就印证了:当企业文化转向紧迫感驱动的"战时状态",企业能以惊人速度缩小与竞争对手的差距。
1958081eb82d7b.png
我们看到AMD内部已开始涌现大量体现这种动能的实例。其重点发力领域之一是产品路线图,目标是在整机架解决方案上与NVIDIA实现平起平坐。本文后续将详细解析我们对AMD整机架MI450X解决方案的预测。另一例证是AMD过去四个月在AI软件栈领域取得的快速进展。其训练与推理性能及开箱即用体验均展现出显著提升,甚至直接采用了SemiAnalysis的代码作为训练基准测试工具。2025年1月,AMD终于觉醒——正是开发者铸就了NVIDIA CUDA的辉煌,于是正式启动开发者关系(devrel)部门,承认赢得开发者对ROCm生态的成功至关重要。目前该团队由Anush Elangovan领军,他身兼多职:既是线下活动的现场技术大使,也是Tech Twitter等社交媒体论坛的官方发声者。AMD在开发者生态建设上持续加码。今年六月将推出开发者云平台,重点强化社区互动。这直接源于SemiAnalysis此前对AMD缩小生态差距的建议 195808d821f543.png
在基准测试结果可复现性方面,AMD已超越NVIDIA。AMD开始发布清晰易懂的操作指南,让用户和开发者能复现其基准测试结果,而非发布无法验证的夸大性能数据。典型案例如其发布的MLPerf Inference 5.0测试复现指南——NVIDIA在最新MLPerf测试中并未提供类似说明。CUDA的真正护城河CUDA的最大优势不仅在于内部软件团队,更在于其生态系统:400万外部开发者在CUDA平台构建应用,数千家企业与众多AI实验室及初创公司参与其中。这种良性循环催生出工具链、教程与现成内核组成的飞轮效应,既降低新用户门槛,又助力资深开发者持续创新。庞大的开发者基数使得行业经验得以快速传播。繁荣生态的成果显而易见:无论是新型注意力算法、状态空间模型还是高吞吐量服务引擎,突破性创新几乎总是首发于CUDA平台,更早获得反馈并得到深度优化,进而吸引新一代开发者涌入。集体智慧的威力清晰可见:当研究者发布革命性内核时,CUDA版本往往当日上线。Tri Dao的FlashAttention论文发布时即附CUDA参考代码,而ROCm团队耗时数季度才实现自主优化版本;选择性状态空间模型同样如此——原作者仅发布CUDA实现,AMD工程师不得不自行移植至ROCm。在服务端,UC Berkeley的vLLM和SGLang维护者主要基于NVIDIA GPU开发,待CUDA路径稳定后才协助AMD内部团队移植至ROCm。海量外部开发者还加速了CUDA生态的漏洞修复。反观ROCm,去年我们发现的多个关键漏洞(如2024版ROCm的torch.scaled_dot_product_attention API缺陷)从发现到修复耗时数月,而该API在现代Transformer模型的核心注意力层中至关重要。开发者优先战略自2025年1月起,AMD高调推行"开发者优先"战略,呼应史蒂夫·鲍尔默的经典口号,效仿黄仁勋的成功路径。在TensorWave"超越CUDA2025"峰会上,AMD人工智能软件负责人Anush用三个掷地有声的词语定义ROCm未来——"开发者,开发者,开发者"。我们预计这一理念将在AMD六月主题演讲中得到更广泛传播。AMD终于领悟:CUda的不可战胜不仅源于卓越硬件,更在于外部开发者大军。对其新战略我们持积极态度。
19580821d6cfd5.png
Anush躬身实践"开发者优先"理念:在Tech Twitter与GitHub收集反馈,在ROCm频发故障时充当客服(这种情况屡见不鲜),亲自解答技术问题。这种亲力亲为值得肯定,但AMD开发者关系团队仍处于"骨架"状态——除Anush外基本没有全职开发者关系工程师。虽然AMD已启动相关招聘,但要追赶NVIDIA的"布道者军团",至少需要20+专职工程师来组织线下黑客松与技术沙龙。NVIDIA年度GTC开发者大会堪称"AI界超级碗",单周举办500余场技术深度研讨会与实战训练营,内容覆盖从PyTorch、JAX到CUTLASS、CUDA C++乃至汇编与性能分析的全栈技术,为外部开发者提供可靠的学习与创新平台。反观AMD,仍缺乏类似GTC的多轨开发者大会。其六月"推进AI"活动虽适合发布产品路线图,但本质上仍是少量主题演讲加预制视频——与GTC的深度代码实验室和分论坛不可同日而语。若AMD真心推行开发者优先战略,就应创办年度线下ROCm开发者大会:设立3-4天并行议程,涵盖内核编写、图编译器、HIP/Triton迁移、MI300集群调优及ROCm工具链实时调试等内容,配合由20+专职工程师团队组织的现场黑客马拉松与区域路演,最终为ROCm用户打造分享实战经验、暴露系统瓶颈、构建社群纽带的平台——这正是CUDA社区离不开GTC的关键。
195809a2df98c9.png
文化试金石尽管George Hotz本可接受AMD早前提供的云端MI300X系统(含完整BMC访问权限),但他坚持要物理硬件以便"直接操控金属"。AMD最初犹豫不决——即便Hotz目标是帮助完善其GPU开源工具链。当广受尊敬的PyTorch联合创始人Soumith Chintala发推支持Hotz获得物理设备时,这场僵局演变为公众事件。 19580972aed251.png
我们认为舆论压力奏效:Hotz在3月8日的博客透露AMD最终让步,寄送两台MI300X设备。至此AMD通过"文化测试"。此举对AMD声誉的提升远超技术层面——向知名黑客寄送实体芯片传递出"开发者优先"的新理念,这是单纯市场投入无法换取的品牌资产,也将这场Twitter风波转化为彰显AMD文化转型的正面案例。除支持Hotz外,AMD还可通过向学术实验室捐赠实体GPU获取声誉红利。黄仁勋与Ian Buck早有向学界捐赠GPU的传统(最早可追溯至2014年),今年更向卡内基梅隆Catalyst实验室、伯克利Sky实验室、UCSD HaoAI实验室等机构捐赠镀金版B200设备,并提供免费云GPU资源。
19581055c39c6e.png
1958101129648c.png


1958101d40ab3d.png
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

hdy

280

主题

319

回帖

714

积分

二级逆天

积分
714