AMD 抢先发布 7nm 服务器芯片 “米兰”

leslie_aqiang · 发表于 2021-3-16 21:31:38

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区

您需要登录才可以下载或查看，没有账号？立即注册

×

3月16日，当地时间周一AMD发布名为“米兰”（Milan）的服务器芯片，旨在从竞争对手英特尔手中夺取更多的市场份额。

AMD表示，公司最新发布的“米兰”服务器芯片比目前最好的数据中心芯片处理速度更快。据悉，AMD完成该芯片的设计，并委托台积电采用7纳米芯片制造工艺来实现量产。
在AMD服务器处理器的演进路线图上，“米兰”具有重要的战略位置，经历了前两代的“那不勒斯”和“罗马”之后，对于实现在数据中心市场的进一步攻城略地，“米兰”被寄予厚望。

发布会上，AMD高级副总裁兼服务器业务总经理DanMcNamara，AMD全球院士、Zen核心首席设计师MikeClark，AMD院士及SoC架构师NoahBeck，AMDEPYC产品管理全球副总裁RamPeddibhotla等接受了集微网在内的媒体采访，从架构、设计、产品等方面详细介绍了“米兰”背后的更多细节。

DanMcNamara表示，“米兰”的发布将会进一步巩固AMD在数据中心市场中的地位，无论是从核心还是系统层面都体现出优越的性能。对于市场用户而言，在整体拥有成本方面，“米兰”将带来更高的价值，同时AMD也在加速布局生态，推出围绕“米兰”的更多应用。
7nmZen3架构19%IPC性能提升
自2017年重返数据中心市场开始，AMD一直追求架构上的创新以及由此带来的性能飞越，从Zen1到到Zen3，都在IPC性能表现方面实现了显著提升。如采用Zen2架构的“罗马”发布时，实现了较上一代15%的IPC性能提升，而此次Zen3架构，实现了约19%的IPC性能提高，远高于行业平均水平。

据MikeClark介绍，要实现这样的进步，必须在整个架构的每个环节去分别优化。首先，在Zen3上，AMD改善了分支预测的功能，不仅提高了准确性同时能够更快的到达目标，同时在系统中能发出更快指令，更高指数的吞吐量，增加了更多的流水线提高吞吐量，同时也为推理方面的工作负载去更强的赋能。从四核到八核都让整个通讯的速度加快，效果更完善，即使是在线程数比较低的系统中由于能够实现共享内存调用，可以降低有效的内存访问的延迟。

具体而言，从Zen2到Zen3，在前端改进方面，AMD将BTB提高了一倍，达到1024。同时增加了分支预测器的带宽，另外在分支预测中消除了冒泡现象，因为冒泡现象在很多架构中是常见问题，能够更快的从误测中去恢复，能够更快的寻址。

MikeClark表示，对于更大的服务器工作负载而言，Zen3可以更无缝的在opcache和Icache切换，实现现更高颗粒度的流水线切换。

在执行部分，Zen3首先针对整数设置了专用的分支和ST数据拣选器，有更大的窗口，减少了某些运行时延，在浮点方面增加两个位宽的调度和分发，更快的FMAC周期，还有两条INT8的IMAC流水线。
在加载存储这部分Zen3有三个加载和两个存储，操作灵活性增加，也对内存依赖性的检测做了优化，同时对于这些非常随机内存的操作我们也提供了6个页表查询器去实现更好的TLB查询。

在指令集方面，在加速、加密和解密算法上Zen3扩展了AVX2指令到256位。MikeClark指出安全是改进最大的部分，首先对SEV的改进，限制中断的注入，限制恶意管理程序注入SEV-ES访客中断/异常类型，还有能够将调试寄存器添加到交换状态中。

此外，MikeClark介绍，在一代EPYC产品投入市场时，行业正在遭遇幽灵攻击，现在看当时的应对方式并不是最优解，但到目前三代时，应该说AMD从架构方面已经做好了强防御，同时对性能的折损也能够降到最低，在提升的IPC性能的同时，也大大增强了系统的安全性和稳定性。

目前AMD采用与第三方芯片制造商合作的方式量产。而英特尔采用的是自行制造芯片的不同战略，但最近一代芯片制造技术的延迟令其备受困扰。相比而言，“米兰”芯片及其前辈的表现都超过了英特尔芯片，帮助AMD抢到了更多市场份额，并赢得了Alphabet旗下谷歌等客户的青睐。

不过英特尔即将反击。分析师预计，英特尔将在未来几周推出最新的“冰湖”（IceLake）服务器芯片，这将是首款采用英特尔10纳米制造工艺量产的服务器芯片。英特尔10纳米制造工艺所生产芯片的性能相当于7纳米制造工艺的“米兰”芯片。
无论这两款芯片的速度如何，但AMD仍有望拥有一些优势，比如每个芯片上的计算内核数更多，这使得芯片可以同时处理更多的软件应用程序。
[sub][/sub][sup][/sup][strike][/strike]