设为首页
收藏本站
开启辅助访问
切换到宽版
充值积分
登录
立即注册
论坛
BBS
PCB培训
电子学堂
服务器下载
视频教程汇总
软件汇总
老吴B站
封装搜索
论坛小店
任务升级
在线电子书
搜索
搜索
每日签到
资源
设计指南
PCB展
原理图
云盘下载
安装包
维修图纸
社区
Allegro
PADS论坛
AD论坛
EMC论坛
PCB论坛
单片机
学习
视频汇总
电子书
PCB培训
学员入口
培训公告
老吴专栏
个人
封装搜索
升级经验
个人中心
每日签到
积分转换
充值升级
本版
用户
AMD 2.0时代将至,MI450X将如何助其挑战英
8层设计 安霸 A2S 高清摄像机 PCB+原理图HD
10层设计PCBAT91SAM9M10-G45-EK_REVA2-开发
12层设计EP2C35F672 PCB板EP2C35_672FBG
AMD 2.0时代将至,MI450X将如何助其挑战英
24小时热门
(抢先版)Cadence Allegro17.4羊皮卷
老吴 你知道你逆天网站为什么走不远吗?
天线原理与设计 天线原理与设计
西电-印刷电路板(PCB)设计指南
无线秘籍:射频电路设计入门
微波原理与技术 微波原理与技术
微波器件测量手册 矢量网络分析仪高级测量
AMD 2.0时代将至,MI450X将如何助其挑战英
信号完整性与电源完整性分析 中文版第三版
7天热门
Allegro超强最全模仿PADS快捷键实现Z切换层
国产飞腾2000+X100的PCB参考设计
PADS和ALLEGRO 零基础-6层板课堂录像申请免费学
PCIE X8 20路并行3M采样率AD采集卡,XC7K325T-2FGG900I+2片DD
老吴 你知道你逆天网站为什么走不远吗?
新岸线NL6621M_QFN88原理图PCB共享
户外装备 摄像机安霸A12S75+MCP+WIFI 原理图和PCB
Q5手表项目归档文件+H1H2蓝牙耳机归档文件
sidekey-FPC按键板AXE610124
逆天PCB论坛
»
论坛
›
综合论坛
›
逆天资讯
›
AMD 2.0时代将至,MI450X将如何助其挑战英伟达(二): ...
返回列表
发新帖
[业界/制造]
AMD 2.0时代将至,MI450X将如何助其挑战英伟达(二):文化突围,重构开发者生态剑指CUDA霸权
[复制链接]
14
|
0
|
昨天 19:58
|
显示全部楼层
|
阅读模式
通知:本站禁止用系统自带的Edge浏览器下载资料。否则下载失败浪费积分。
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
本帖最后由 hdy 于 2025-5-14 20:03 编辑
AMD的文化转型——重燃紧迫感
接受是走出困境的最后一步。AMD终于承认了其巨大的软件生态差距,现在可以着手解决问题,在软件与硬件竞赛中争取超越NVIDIA的机会。AMD已重振旗鼓,但NVIDIA仍在全力冲刺,AMD必须与之齐头并进甚至更快才能实现赶超。NVIDIA员工深知,要在竞争激烈的市场中保持领先地位,有时需要投入额外时间。AMD要想获胜,就必须付出至少与NVIDIA同等甚至更多的努力与智慧。我们已看到这种转变的明确迹象。
聚焦目标、充满进取心的团队实现逆袭的案例比比皆是。xAI与OpenAI的竞争就印证了:当企业文化转向紧迫感驱动的"战时状态",企业能以惊人速度缩小与竞争对手的差距。
我们看到AMD内部已开始涌现大量体现这种动能的实例。其重点发力领域之一是产品路线图,目标是在整机架解决方案上与NVIDIA实现平起平坐。本文后续将详细解析我们对AMD整机架MI450X解决方案的预测。
另一例证是AMD过去四个月在AI软件栈领域取得的快速进展。其训练与推理性能及开箱即用体验均展现出显著提升,甚至直接采用了SemiAnalysis的代码作为训练基准测试工具。
2025年1月,AMD终于觉醒——正是开发者铸就了NVIDIA CUDA的辉煌,于是正式启动开发者关系(devrel)部门,承认赢得开发者对ROCm生态的成功至关重要。目前该团队由Anush Elangovan领军,他身兼多职:既是线下活动的现场技术大使,也是Tech Twitter等社交媒体论坛的官方发声者。
AMD在开发者生态建设上持续加码。今年六月将推出开发者云平台,重点强化社区互动。这直接源于SemiAnalysis此前对AMD缩小生态差距的建议
在基准测试结果可复现性方面,AMD已超越NVIDIA。AMD开始发布清晰易懂的操作指南,让用户和开发者能复现其基准测试结果,而非发布无法验证的夸大性能数据。典型案例如其发布的MLPerf Inference 5.0测试复现指南——NVIDIA在最新MLPerf测试中并未提供类似说明。
CUDA的真正护城河
CUDA的最大优势不仅在于内部软件团队,更在于其生态系统:400万外部开发者在CUDA平台构建应用,数千家企业与众多AI实验室及初创公司参与其中。这种良性循环催生出工具链、教程与现成内核组成的飞轮效应,既降低新用户门槛,又助力资深开发者持续创新。庞大的开发者基数使得行业经验得以快速传播。
繁荣生态的成果显而易见:无论是新型注意力算法、状态空间模型还是高吞吐量服务引擎,突破性创新几乎总是首发于CUDA平台,更早获得反馈并得到深度优化,进而吸引新一代开发者涌入。
集体智慧的威力清晰可见:当研究者发布革命性内核时,CUDA版本往往当日上线。Tri Dao的FlashAttention论文发布时即附CUDA参考代码,而ROCm团队耗时数季度才实现自主优化版本;选择性状态空间模型同样如此——原作者仅发布CUDA实现,AMD工程师不得不自行移植至ROCm。在服务端,UC Berkeley的vLLM和SGLang维护者主要基于NVIDIA GPU开发,待CUDA路径稳定后才协助AMD内部团队移植至ROCm。
海量外部开发者还加速了CUDA生态的漏洞修复。反观ROCm,去年我们发现的多个关键漏洞(如2024版ROCm的torch.scaled_dot_product_attention API缺陷)从发现到修复耗时数月,而该API在现代Transformer模型的核心注意力层中至关重要。
开发者优先战略
自2025年1月起,AMD高调推行"开发者优先"战略,呼应史蒂夫·鲍尔默的经典口号,效仿黄仁勋的成功路径。在TensorWave"超越CUDA2025"峰会上,AMD人工智能软件负责人Anush用三个掷地有声的词语定义ROCm未来——"开发者,开发者,开发者"。我们预计这一理念将在AMD六月主题演讲中得到更广泛传播。AMD终于领悟:CUda的不可战胜不仅源于卓越硬件,更在于外部开发者大军。对其新战略我们持积极态度。
Anush躬身实践"开发者优先"理念:在Tech Twitter与GitHub收集反馈,在ROCm频发故障时充当客服(这种情况屡见不鲜),亲自解答技术问题。这种亲力亲为值得肯定,但AMD开发者关系团队仍处于"骨架"状态——除Anush外基本没有全职开发者关系工程师。虽然AMD已启动相关招聘,但要追赶NVIDIA的"布道者军团",至少需要20+专职工程师来组织线下黑客松与技术沙龙。
NVIDIA年度GTC开发者大会堪称"AI界超级碗",单周举办500余场技术深度研讨会与实战训练营,内容覆盖从PyTorch、JAX到CUTLASS、CUDA C++乃至汇编与性能分析的全栈技术,为外部开发者提供可靠的学习与创新平台。
反观AMD,仍缺乏类似GTC的多轨开发者大会。其六月"推进AI"活动虽适合发布产品路线图,但本质上仍是少量主题演讲加预制视频——与GTC的深度代码实验室和分论坛不可同日而语。若AMD真心推行开发者优先战略,就应创办年度线下ROCm开发者大会:设立3-4天并行议程,涵盖内核编写、图编译器、HIP/Triton迁移、MI300集群调优及ROCm工具链实时调试等内容,配合由20+专职工程师团队组织的现场黑客马拉松与区域路演,最终为ROCm用户打造分享实战经验、暴露系统瓶颈、构建社群纽带的平台——这正是CUDA社区离不开GTC的关键。
文化试金石
尽管George Hotz本可接受AMD早前提供的云端MI300X系统(含完整BMC访问权限),但他坚持要物理硬件以便"直接操控金属"。AMD最初犹豫不决——即便Hotz目标是帮助完善其GPU开源工具链。当广受尊敬的PyTorch联合创始人Soumith Chintala发推支持Hotz获得物理设备时,这场僵局演变为公众事件。
我们认为舆论压力奏效:Hotz在3月8日的博客透露AMD最终让步,寄送两台MI300X设备。至此AMD通过"文化测试"。此举对AMD声誉的提升远超技术层面——向知名黑客寄送实体芯片传递出"开发者优先"的新理念,这是单纯市场投入无法换取的品牌资产,也将这场Twitter风波转化为彰显AMD文化转型的正面案例。
除支持Hotz外,AMD还可通过向学术实验室捐赠实体GPU获取声誉红利。黄仁勋与Ian Buck早有向学界捐赠GPU的传统(最早可追溯至2014年),今年更向卡内基梅隆Catalyst实验室、伯克利Sky实验室、UCSD HaoAI实验室等机构捐赠镀金版B200设备,并提供免费云GPU资源。
《《《 点击这里展开全文 》》》
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
hdy
280
主题
319
回帖
714
积分
二级逆天
二级逆天, 积分 714, 距离下一级还需 9286 积分
二级逆天, 积分 714, 距离下一级还需 9286 积分
积分
714
加好友
发消息
回复楼主
返回列表
逆天资讯
51单片机 | STM32 | AVR
FPGA | CPLD | DSP
ARM论坛
数 | 模电子
拆机 | DIY | 维修
程序开发
手机平板论坛
Layoutguide指南 | Checklist
维修图纸固件程序
DataSheet | 规格书 | 数据手册
综合论坛
图文推荐
户外装备 摄像机安霸A12S75+MCP+WIFI 原理图和PCB
前天 16:35
有的时候会被PCBA上面的电解电容等电到,做一个放电的装置,放电电阻10R 20W是否好用?阻值有没有什么讲究
前天 14:30
[Anomaly Detection]PaDim:一种用于异常检测和定位的patch分布建模框架
3 天前
高频与低功耗之争:MMIC与PMIC的技术边界与应用选择
3 天前
申请第三阶段的课程
前天 11:35
热门排行
1
PADS9.5完整版+破解文件+安装教程 免费下载(2021年更新)
2
PADS 9.5 破解版 破解文件下载,注册文件下载,和谐
3
逆天PCB论坛-服务器大量共享资料
4
PADS 9.5 全中文版本出来了,PADS9.5 完整版免费下载
5
新手必学的原理图
6
pads9.5实战攻略与高速pcb设计.pdf 高清扫描版[完整
7
论坛会员人数20万,发一波福利,500个名额,每人80金币
8
史上最强精品PADS视屏,电子,PDF各种格式教程大全
9
回帖奖励-每人100金币-先到先得-200个名额
10
PADS9.5 视频教程百度网盘高速下载,在线看[精讲]-重新补充