我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 5576|回复: 0

[DIY详解] AMD Ryzen Threadripper 1950X/华擎X399 Professional Gaming评测

[复制链接]
  • TA的每日心情

    6 天前
  • 签到天数: 68 天

    [LV.6]常住居民II

    1万

    主题

    8193

    回帖

    5万

    积分

    三级逆天

    积分
    53625

    终身成就奖特殊贡献奖原创先锋奖金点子奖优秀斑竹奖宣传大使奖

    发表于 2017-9-16 11:47:14 | 显示全部楼层 |阅读模式









    目录
    前言
    第一章、主板外观以及拆解
    第二章、测试平台搭建
    第三章、BIOS特色以及软件设置

    第四章、测试
    第一节、根骨
    1、Die和CCX之间的关系
    2、Infinity Fabric
    3、UMA和NUMA
    第二节、系统稳定性测试
    第三节、对比测试
    1、3DMARK
    2、CINEBENCH R15
    3、AIDA64
    4、SPECviewperf®12
    总结

    前言


    自古华擎出妖板,一直对华擎的感觉是半民用、半专业,华擎有很多这种混合定位的好产品,比如:X99E-ITX/AC、X99 TAICHI、AB350-ITX/AC都 是老高忍不住在京东预售中就开始抢购的产品,究其原因其实华擎也有自己的工业主板品牌:永擎!有永擎的工业主板设计的底子,所以华擎的民用板子才能涉及更多的工作站服务器的特性进去,让人觉得妖气十足、妖孽难挡!

    ASROCK X399 Professional Gaming作为X399系列中华擎的旗舰板定位自然是高端,但是作为华硕华擎技嘉微星四大家之中的旗舰主板,这块板又是最便宜的一块。




    第一章、主板外观以及拆解




    华擎这一代产品一概过去的大红大黑配色,而是专注于钛极灰配色,X399 Professional Gaming采用的这是这种配色,PCIE GEN3 X16四条插槽全部使用了金属包被设计,美观的同时加强了接口的插拔的耐用指数。四通道内存支持3600+的内存频率,并且支持DDR2133 2400 2666的ECC UDIMM内存,这个特性相比起来INTEL的X299就显得有诚意的多!对于INTEL以往的平台来说:

    I7I9平台不支持ECC和REG ECC内存、
    XEON E3搭配的C632 C622平台支持ECC UDIMM内存,
    而XEON E5搭配的C612 X99平台则支持ECC和REG ECC内存,

    而X399平台等于直接送你一个ECC UDIMM内存的支持,从工作站服务器定位来说就高出I7 I9一档,但是不同厂家的X399对ECC的内存支持度不同,这归结于DIMM的设计和BIOS的支持,华擎X399 Professional Gaming是确定支持ECC UDIMM内存的!





    从设计中的流行元素来说,IO盔甲、金属包被PCIE槽、夸张的MOS和PCH散热片、音效特区、WIFI、板载POWER ON/RESET/CLEAR CMOS这些该有的都有。


    IO挡板区从左往右分别是:
    第一排CLEAR CMOS
    第二排PS2+CPU内建USB3.1 GEN1X2
    第三排WIFI IPEX、第三排CPU内建USB3.1 GEN1X2
    第四排音效专区
    第五排10G LAN+CPU内建USB3.1 GEN1X2
    第六排1G LAN+CPU内建USB3.1 GEN1X2
    第七排1G LAN+X399内建USB3.1 GEN2 Type-A+Type-C


    这片板的存储接口是8XSATA6G、PCIE GEN3 X4的M2三条,其中M2-1和一个U2接口共享带宽,需要注意的是SATA全部是X399 PCH芯片搭载,而M2和U2则全部使用CPU内建的原生PCIE GEN3通道。在SATA口附近的一个PCIE 6P接口用来保证多显卡互联的供电!


    X399 Professional Gaming的设计也有很多可圈可点的小细节,HD AUDIO的插针就设计了2个,可以正插也可以侧插,这样极大的方便的机箱走线的规整性!


    下面对主板进行一番拆解


    使得IO装甲、散热片完全分离




    X399 PCH的散热片



    X399的CPU VRM部分和SoC VRM部分的热管散热。


    IO盔甲



    裸板一观


    CPU VRM、SoC VRM、DIMM VRM设计


    主板背面用来给VRM滤波的钽电容


    ASROCK X399 Professional Gaming的供电设计分为三区:

    CPU VRM:图中CPU左侧黄色区域使用8相供电设计,PMW方案是IOR35201+IOR3555M X8+DRMOS X8
    SoC VRM:图中CPU左上方黄色区域使用3相供电设计,PMW方案是IOR35201+IOR3555M X3+DRMOS X8
    DIMM VRM:图中CPU右上方和右下方均使用2相供电设计,方案是 uP1674D+DG39AD X2

    对于X399上的TR CPU庞大的CPU和SoC规模来说,华擎的设计很规矩,CPU VRM中的IOR35201 6+2相实打实的,没有去搞什么堆料倍相供电的噱头 ,所以TR CPU的供电应该归纳为8相CPU VRM+3相SoC VRM共11相

    内存的供电使用两组相同的2相分别负责DIMM A1 B1 C1 D1和A2 B2 C2 D2,共4相。

    ASROCK X399 Professional Gaming的CPU供电也很有趣,并不像别的厂家采用双8PIN并排在一起的设计,而是在主板的两端设计4+8PIN,我想了很久,这样做的唯一的好处就可以保证更长的给电距离和缓解集中给电的PCB压力。遵循了IC PCB设计中的就近原则进行供电设计。避免集中供电带来的供电线和PCB供电走线高热的现象,而同时电力会更加充足。


    X399的PCH芯片是由ASMEDIA代工,代号ASM2016B


    AQUANTIA的10G网卡相信大家都不陌生了,AQC107是一颗集成了MAC和PHY一体化的10G网络芯片,其实这颗芯片安装驱动有很多有意思的地方!



    我发现安装官网驱动之后,可以在更新驱动里面选择安装ASUS XG-C100C 10G网卡驱动和ROG AREION 10G网卡驱动,而且都有数字签名。






    所以面对这送来的豪礼,你当仁不让的会选择ASUS驱动了,哈哈哈,实际测试的话,ASUS两个驱动差不多,但是比AQUANTIA原厂驱动要更稳定延迟更低一点。亲测可用!估计这个ASROCK没法说也不能说,就如同NETGEAR A6200网卡用ASUS AC55驱动更好一样,但是NETGEAR从来只享受但是不说!


    ASROCK X399 Professional Gaming的主要板载IC如上图:

    黄色:AQUANTIA AQC107--集成PHY和MAC的10G网卡
    黑色:PI3EQX芯片2颗--USB3.1供电强化
    玫红:ASM1543--Typc-C切换芯片
    黄色:INTEL I211AT两颗--INTEL带独立MAC和PHY的千兆网卡芯片
    绿色:ALC1220--REALTEK公司的HD 7.1声卡
    蓝色:N5532--来自德州仪器TI的N5532运放芯片
    黄绿:NUVOTON NCT6779D--主板的灵魂,NUVOTON公司出品的系统IO控制和监控芯片
    红色:AMD ASM2016B--AMD X399 PCH芯片,ASMEDIA代工生产
    浅蓝:ASM1480两颗--PCIE带宽切换芯片,在M2-1和U2接口之间切换PCIE带宽。
    紫红:ICS 9VRS4883BKLF--ICS公司出产的时钟发生器芯片。



    当然我这个粗浅级别的拆解自然是画不出BOM表的,但是推出BLOCK图还是没问题的,所以画了一张来说明一下这张主板的BLOCK布局:

    一、PCIE GEN的分配:

    1、AMD Ryzen Threadripper CPU

    AMD Ryzen Threadripper CPU有64条PCIE GEN3通道可供分配

    插槽1:PCIE  X 16 -- PCIE GEN3 X 16带宽
    插槽2:PCIE  X 16 -- PCIE GEN3 X 8带宽
    插槽3:PCIE  X 16 -- PCIE GEN3 X 16带宽
    插槽4:PCIE  X 16 -- PCIE GEN3 X 8带宽
    插槽5:M2-1/U2 -- PCIE GEN3 X 4带宽
    插槽6:M2-2 -- PCIE GEN3 X 4带宽
    插槽7:M2-3 -- PCIE GEN3 X 4带宽
    连接X399 PCH芯片--PCIE GEN3 X 4带宽

    2、X399 PCH芯片

    连接AMD Ryzen Threadripper CPU--PCIE GEN3 X 4带宽
    AQUANTIA AQC107 10G网卡--PCIE GEN2 X 4带宽
    INTEL I211AT 1G网卡--PCIE GEN2 X 1带宽
    INTEL I211AT 1G网卡--PCIE GEN2 X 1带宽
    INTEL 3168NGW无线网卡--PCIE GEN2 X 1带宽
    插槽8:PCIE  X 1 -- PCIE GEN2 X 1带宽

    二、系统IO管理

    系统IO管理:NCT 6779D芯片--侦测主板的温度电压,
    RGB管理:下接的N76E885AT20芯片--管理主板的PCH散热片下面的RGB LED灯效和2个AURA RGB4PIN接口
    风扇管理:下接的NCT3943S芯片5颗--管理五个4PIN风扇接口

    第二章、测试平台搭建


    AMD Ryzen Threadripper 1950X




    看到这颗CPU就想到周星驰电影中的一句经典对白:砂锅大的拳头你见过没有?

    真的!拳头大的CPU我是第一次见到!

    为了准确测量主板的DRAM效能,我分别选择了3套内存:



    1、宇瞻黑豹灯条DDR4 2400 8GBX4(SKhynix MFR)



    2、GSKILL 幻光戟DDR4 3200 C16 8GBX4(SKhynix MFR)
    3、镁光VLP DDR4 2400 ECC 16GBX4

    AMD Radeon VEGA Fronter Edition显示卡


    酷冷至尊冰神240 RGB水冷散热器


    EVGA 850G2金牌全模组电源




    测试机架展示



    细节一览,下面是PCH芯片的RGB特效:

    冷头和内存的呼吸联动


    整机光效


    参与测试和对比的平台

    CPUAMD Ryzen Threadripper 1950XINTEL XEON E5 2696 V3
    主板华擎X399 Professional Gaming华擎X99E ITX/AC
    显卡AMD Radeon VEGA FEAMD Radeon VEGA FE
    高频内存芝奇幻光戟DDR4 3200 C16 8GBX4(OC 3333)NA
    中频内存宇瞻黑豹DDR4 2400 C16 8GBX4(OC 2666)NA
    ECC内存镁光VLP DDR4 2400 ECC 16GBX4镁光VLP DDR4 2400 ECC 16GBX2
    电源EVGA 850 G2海盗船SF600
    SSDLITEON T10 480G/T11 512GB/INTEL 750 U2 1.2TBLITEON T10 480G/T11 512GB/INTEL 750 U2 1.2TB
    散热器酷冷至尊冰神240 RGB水冷捷豹4U 风冷



    由于INTEL XEON E5 2696 V3我已经刷过ASROCK X99E ITX/AC 鸡血第二版的BIOS,所以满载运行可以全核心最高3.4G,睿频的话,会有12核在3.8G 6核在3.2G,这是我这颗CPU的体质过关,被华擎小妖板王再鸡血加成一下,一时很难遇到对手!也是我的工作站系统绝对的主力!

    关于驱动的话:
    8月25日发的X399 PCH驱动17.30,号称打通了CPU和VEGA之间的Infinity Fabric直连通道,会增效5%。
    另外一个是8月14日发布的RADEON VEGA FE 17.8.2BETA版驱动,这就是这次评测所使用的最新驱动,区别于早期的评测。

    第三章、BIOS特色以及软件设置


    BIOS主界面


    这个CPU我不太建议去超频,因为目前来说超频的压力在于散热,散热压不住CPU的核心在95度以内的话,性能不升反而会降低。内存倒是可以超一下。


    两个内存电压?你没有看错,1950X其实是两组双通道内存控制器组成的。




    1950X有UMA和NUMA两种内存设置模式,CHANNEL就是NUMA,DIE就是UMA,默认是AUTO也是UMA模式,SOCKET其实是针对EPYC双路系统的每一个CPU插槽的设定,这里没有作用。


    板载调试端口LED默认是关闭,点开后选择RUNTIME CPU TEMP功能就可以在主板自检过后,DEBUG灯实时显示CPU的表面温度!



    软件而言,华擎的F-STREAM则是一个在WINDOWS界面下直观反应BIOS参数和系统监控的软件



    监控电压温度和风扇转速



    实时调整风扇转速



    第四章、测试

    第一节、根骨

    1、Die和CCX之间的关系

    1950X 16核心32线程 主频3.4G,睿频其实根据电压和温度还有节能机制有个自调整过程,最高可达4.2G,内存控制器支持四通道,内置PCIE GEN3 X 64条。
    改成NUMA节点视图模式可以很直观看到两个NUMA节点!

    要测试这片CPU其实最重要的的是了解构架也就是所谓的根骨。


    网络上疯传的开盖图,钎焊无疑,至于散热效能怎么样要测了才知道!内含有4个Die,AMD也称之为Zeppelin


    按照开盖图,我找猫画虎先假装解析一下!其实Die也好,Zeppelin也好,都是一个意思,等于一个RYZEN R7的规格。


    按照AMD的说法,4个Die里对角线位置有2个是死的,另外两个对角线位置的Die是实际可用的。官方给予的解释是:四个Die中只有两个是真实的,另外两个只是为了保持电气等平衡而设置的“占位符”。说真话,官方说法是不是真的,我很怀疑,因为占位保持电气平衡也不用做个Die出来,这个成本太高了把,明显说不通透,那么我很怀疑是GF的产能问题,导致第一批AMD Ryzen Threadripper 1950X不得不去在4Die的EPYC的产线去生产,所以因为抢时间就直接拿4Die屏蔽一下就出厂了。这种事情RYZEN上屏蔽CCX也是常见的阉割手法,唯一的疑惑就是是否以后会有神人无意中发现一个金桥触点,直接破解了成32C64T就好玩了。


    每个Die由两个CCX组成,CCX之间、Die之间使用Infinity Fabric总线相连。


    CCX=“CPU Complex”(CCX),也就是“CPU复合体”的意思。
    每一个CPU复合体内包含四个Zen CPU核心,但它们是彼此完全独立的,每个核心都有自己的64KB一级指令缓存、32KB一级数据缓存、512KB二级缓存,但是8MB的三级缓存为四个核心共享,以低位寻址交错(low-order address interleave)的方式分为四个2MB容量的区块,不过任何一个核心访问三级缓存的延迟都是完全相同的。

    2、Infinity Fabric



    AMD HyperTransport的后继者Infinity Fabric是用于CPU,PCIe,I / O和内存之间数据交换的高速互连。Infinity Fabric也用于芯片内数据通信,将AMD Ryzen,Threadripper和Epyc CPU之间的多个CCX(CPU Complexes)连接在一起。




    AMD的Infinity Fabric设计由两个不同的部分组成:可扩展控制结构(SCF)和可伸缩数据结构(SDF)。
    Infinity Scalable Control Fabric(SCF)负责控制的,包括电源管理,安全性以及维护芯片运行的任何内容。

    举例为:CPU之间、Die之间、CCX之间、CPU GPU之间的交互。

    Infinity Scalable Data Fabric(SDF)主要负责传输数据的,SDF将内存和计算组件结合在一起,因此,SDF的延迟必须足够低以最小化管芯间数据交换的影响,并且必须将其设计为可扩展以支持多个管芯,AMD声称SDF可以很好地扩展到64个内核。

    举例为:CPU或者GPU与内存之间的数据传输。


    网上大神很多,也经常讨论一些关于CCX之间数据传输带宽是多大,Die之间传输数据带宽是多大,但是说到最后解释只有一个:Infinity Fabric总线决定这一切,如何决定要看AMD设计!

    其实我也尝试画了一下1950X架构图,可以看到一个Die之中的两个CCX之间是通过SDF进行数据传输的,而SDF的带宽直接由接驳其上的双通道内存控制器所决定,我们假设使用双通道DDR2666内存,每个通道带宽19.87GB/S,那么双通道即为38.74GB/S,所以SDF的带宽即为38.74GB/S,由于两个CCX之间必须通过SDF进行交互,所以两个CCX之间的数据传输带宽也是38.74GB/S。

    对于Die之间而言的话,由于两个Die之间的数据传输是通过SDF上接驳的GMI总线进行传输,单向均为38.74GB/S,所以两个Die之间为双向的38.74GB/S带宽传输,因为双向,所以AMD直接乘以2定义为77.48GB/S的Die to Die带宽。

    也确实因为这个原理,所以1950X对内存频率很敏感,高频内存所获得的性能加成就会提高!


    所以你看到AMD PPT上102.22GB/S的Die to Die带宽也别吃惊,他是设定在DDR3200内存下,双向的带宽总和而已!AMD PPT的节奏按照以往的经验就是雷声大雨点小,所以这次好不容易拿出一把利剑出来,老百姓质疑的声音还是比较大的,所以对于AMD来说最缺乏的不是公关,也不是实力,是老百姓的信任度!

    3、UMA和NUMA

    RYZEN Threadripper 1950X有两种内存管理模式,分别是Distributed Mode(UMA)和Local Mode(NUMA)模式。

    Distributed Mode(UMA)就是主板默认的模式,结构就是用一个Die0通过SDP来同时四个通道内存控制器,然后另外一个Die1通过SDF与Die0交互联通,共同使用四通道内存,CPU将自身呈现为统一的内存访问节点,AMD称之为“分布式模式”。这种模式的弱点在于统一管理近端和远端的两个内存控制器,由于路径长短必然产生不同的延迟,AMD PPT显示在DDR3200下,近端内存延迟78纳秒,远端内存延迟133纳秒。


    Local Mode(NUMA)模式其实就是Die0和1分别使用自己对应的双通道内存控制器来使用内存,然后Die0和1之间通过通过SDF交互联通,这样每一个Die和双通道内存控制器对应的内存就成为一个独立的NUMA节点,操作系统将使用在最靠近数据所在内存的MUMA节点上运行的应用程序。在将工作和数据分配给另一个节点之前,操作系统尽可能地将应用程序的工作负载和内存保留在一个节点内。在大多数情况下,表现的特点是可能在某些应用程序表现中以较低带宽为代价获得具有最低内存延迟。






    内存频率对CPU内核互联一致性耗时的影响

    测试使用SISOFT SANDRA 2017版本测试多内核之间的效率然后数据列表


    内存频率在2666 C16下的内核之间交互的一致性耗时统计表


    内存频率在3333 C16下的内核之间交互的一致性耗时统计表

    灰色区域:CCX内部核心之间的测试耗时,耗时最少!
    黄色区域:Die内跨CCX的核心之间测试耗时,耗时一般!
    绿色区域:不同Die之间跨CCX的核心之间的测试耗时,耗时最高!

    DDR3333明显比DDR2666普遍耗时更低!测试下来UMA模式和NUMA模式的核心之间交互耗时的情况几乎没有区别!



    AMD的RYZEN MASTER是一个监控多核心睿频的好工具,其中的创作者模式实际就是16C32T的UMA模式,比较适合日常使用,而游戏模式则是屏蔽了一半核心的NUMA模式,用来兼容游戏的最大核心容许数,其实我觉得不是蛋疼不会有人在1950X屏蔽一半核心去使用的,如果游戏都需要屏蔽的话,我为何不去买一颗1700X或者1800X来专门玩游戏?1950X本质就是一个极为类似双路RYZEN R7 1800X的产品,既然选择这个产品,当然是作为一台生产力工具的定位而出现的,更多的是对工作性能极度的渴求。

    第二节、系统稳定性测试


    为了测试最大稳定性,默认频率下,酷冷240水冷,风扇手动开最大转速,冷头开最大转速,使用AIDA64 FPU单烤运行5小时47分钟,CPU主频一直稳定在3.4G,没有降频,此时CPU核心温度稳定在89度,表面温度稳定在46度,主板温度则始终控制在39度非常稳定!这一切看起来很美好,但是一旦1.38V 手动锁定一个4G,CPU立马核心温度达到95度以上,触发降频保护,CPU开始降频,性能不增反减!所以这个CPU我相信大部分的人都无法在超频状态下日常使用,除非液氮或者更高规格的分体式水冷。

    第三节、对比测试

    1、3DMARK


    3DMark 包含了针对你的硬件,一切必备的基准测试。凭借其广泛的基准测试项目,你可以测试一路到最新的 4K 游戏 PC。最新的 3DMark 包含了 Time Spy,是针对最新显卡的一个 DirectX 12 基准测试。

    FIRE STRIKE ULTRA使用限制为Direct3D 11级的DirectX 11引擎,适用于检测DirectX 11的硬件,分辨率是3840X2160,是首个面向4K分辨率的基准测试。


    这个测试里面会发现普遍UMA模式会比NUMA模式的CPU物理分要高一些,大约5%,总分变化不大是因为这个测试还是偏向显卡本身的权重更高一些。而UMA模式下,DDR3333C16比DDR2400C16四通道的物理分要高5%左右!这个测试里面,E5 2696 V3+双通道2133C16可以和1950X+DDR3333C16四通道几乎打平!
    Time Spy,充分融入了DX12的相关革新技术,严格考核显卡和CPU的DX12性能。一座太空博物馆内无数藏品,每个场景都有丰富的细节和阴影,堪称是目前画面最为复杂的性能测试场景。图形测试渲染分辨率2560X1440。

    这个测试下UMA模式和NUMA模式下的CPU分差距被进一步放大,2400频率下在27%,2666频率下在21%,3333频率下在17%,对于总分也有一定差距,2400频率下不到1%、2666频率下接近3%,而3333频率下达到4%。

    所以如果只是针对游戏而言,UMA模式会比NUMA模式更加适合!而X399出产设置将UMA设定为默认设置确实是有道理的!

    2、CINEBENCH R15



    作为老牌的渲染性能测试软件而言,NUMA模式所带来的收益明显高于UMA模式,DDR3333 UMA模式下,1950X已经非常接近2696 V3,当开启NUMA模式则直接破了2900分。但是即使效能最差的2400 UMA模式和效能最高的3333 NUMA模式,差距也不过4.5%而已。

    3、AIDA64



    E5 2696 V3双通道2133内存读写请无视,我们看1950X的,普遍NUMA模式下比UMA模式下的内存读写以及复制要高不少,综合来说NUMA要比UMA的内存读写复制高4-7%左右!


    再来看看内存延迟,几乎和上面的结论是一致的,NUMA模式的延迟也表现得比UMA模式小得多!这其实和NUMA模式下CCX优先访问离自己较近的内存有关!


    再来看下单精度和双精度的浮点运算能力,从2400-3333内存下,无论UMA还是NUMA模式几乎没有区别。


    SHA-1、AES256的加解密性能在2400-3333内存下,无论UMA还是NUMA模式几乎没有区别。RYZEN构架有一个秘密武器就是是SHA HWA,可以对SHA加解密进行加速,除了SHA2-512不能加速之外,其余的几乎都可以加速,所以在这个测试,完全是AMD在虐狗!

    以上这两个测试其实充分反映了E5 2696 V3的构架还有定制版CPU的性能定向性,IBM所定制的2696V3明显在浮点运算中大幅加强性能甚至可以达到1950X的2倍,但是在加解密系统里面却连1950X一半的性能都达不到,后者则完全是RYZEN所支持的秘密武器SHA HWA所导致的结果!


    4、SPECviewperf®12

    华擎X399 Professional Gaming既然有着一些专业特性,我们直接测试一下专业设计软件的效能评估一下!

    SPECviewperf®12.1是基于专业应用上衡量专业工作站系统显卡性能的一个新版本,带来了全新的8个专业图形测试场景, 包括Energy、Medical、Catia、Cero、Maya、SNX以及主要基于OpenGL 4.0架构的Solidworks和首次添加基于DirextX架构的Showcas。


    SPECviewperf®12测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过6000万个定点数据,能够充分反映出工作站的专业性能,其专业性将有望成为新一代的专业测试基淮, 是专业图形性能的测试标杆。



    Solidwork 2012测试是从Dassault Systemes的SolidWorks 2013 SP1应用程序的轨迹创建的。视图中使用的模型的大小从2.1到2100万个顶点,其中包括应用程序支持的众多渲染模式,包括阴影模式,边缘阴影,环境遮挡,着色器和环境映射。

    这个测试表现出来的特点就是1950X在NUMA模式要略好于UMA模式下,但是差距不大,在DDR2666下,已经达到E5 2696 V3 的性能!


    SIEMENS NX8.0测试是西门子PLM NX 8.0应用程序生成的图形工作负载的痕迹创建的,型号尺寸范围为7.15至8.45万个顶点,包括应用支持的许多渲染模式,包括线框,抗锯齿,阴影,边缘阴影和工作室模式。

    这个测试表现出来的特征是1950X的UMA模式明显要略好于NUMA模式,即使是2400ECC四通也可以完胜E5 2696 V3 2133ECC双通效能。


    Autodesk Showcase 2013应用程序的运行轨迹创建的测试,使用的模型由800万个顶点组成,也是SPECviewperf中第一个设置DX渲染功能的视图。视图中包含的渲染模式包括阴影,投影阴影和自阴影。

    这个测试是典型的NUMA模式强势项目,全盘压制E5 2696 V3。


    EDICAL测试是3D体积网格的2D投影的典型体绘制应用程序的代表。模型其中最有代表性的是从MRI获取的一组3D切面的扫描照片组成的4D心脏数据,由斯坦福大学医学院放射学系和Lucile Packard儿童医院提供,雄鹿甲虫数据由维也纳技术大学提供。CPU计算与视角对齐的一系列切面,然后发送到GPU进行纹理化和进一步计算,如传递函数查找,照明和剪辑以显示内部结构。最后将切片混合在一起呈现一个完整的图像。

    本测试是个典型的内存频率敏感型,UMA也好,NUMA也好差别并不大,而内存频率直接决定效能,1950X要在3333频率下才能超越E5 2696 V3。


    抓取Autodesk的Maya 2013生成的图形工作量轨迹创建的测试脚本,模型大小为727,500个顶点。包括应用程序支持的众多渲染模式,包括阴影模式,环境遮挡,多样本抗锯齿和透明度。

    NUMA模式典型敏感性测试,1950X要在2666 NUMA模式下才可以超越E5 2696 V3!


    ENERGY是地震和油气田中典型的体积渲染应用的代表。类似于MRI或CT等医学成像,是地球物理测量通过内置于3D网格的地下生成图像切片。体积渲染提供了这种3D体积网格的2D投影,利用三线性插值调用3D纹理的硬件支持,其中的3D数据集都使用简单的随机函数生成。

    这个测试其实是非典型案例,内存频率也好,还是UMA NUMA模式都不能发挥什么作用,1950X各种内存频率和模式的组合都和E5 2696 V3差不多,拉不开差距,只能说旗鼓相当!


    抓取Creo 2™应用程序从PTC生成的图形工作量轨迹创建的测试脚本,测试规模从20到4800万个顶点,包括线框,抗锯齿,阴影,边缘阴影和阴影反射模式等众多渲染模式。

    本测试是个典型的NUMA模式敏感性测试,2400ECC内存 NUMA模式下1950X可以超越E5 2696 V3!


    抓取Dassault Systemes的CATIA V6 R2012应用程序生成的图形工作量轨迹创建的测试脚本,模型大小范围从5.1到2100万个顶点。测试包括线框,抗锯齿,阴影,边缘阴影,景深和环境遮挡等渲染模式。

    本测试再次爆出典型的NUMA敏感性测试,其实2400ECC-3333的频率差距并没有在测试中占到什么大便宜,客观来说,用什么内存差距都都大,只要开启NUMA,就能超越E5 2696 V3。


    抓取AUTODESK的3ds Max 2016生成的图形工作量轨迹而创建的测试脚本,几个测试在窗口上并入了多个视图,每个使用不同的渲染方法,渲染样式反映了主要市场中最常用的样式,包括逼真,阴影和线框。

    这个测试是个较为奇怪的案例,NUMA敏感类型,但是2400 2666 3333随着内存频率的递增,NUMA模式的优势反而在逐渐的减小,而NUMA模式受益最高的竟然是2400频率下,而到了3333,NUMA UMA模式则几乎没有什么区别了,这个测试必须要内存达到3333才可以达到E5 2696 V3性能水准。

    总结




    关于CPU和内存

    1、当游戏的时候选择高频内存UMA模式可以获得更好的性能。

    2、而渲染的时候选择高频内存NUMA模式会比UMA更快一些,但是貌似高频内存在渲染中存在的性价比并不高,2400-3333大约4.5%的性能差距。


    3、从事与浮点运算和加解密运算来说,内存的性能加成很小,UMA和NUMA模式的差距也被淡化了,可以说,内存模式和内存频率在这个环节几乎没有作用。


    4、而SPECviewperf®12专业软件测试其实暴露了一个问题,不同的专业设计软件开启合适的内存模式收益大于盲目追求高频内存。

    而根据测试结果来说,其实高频内存的加成有限,而正儿八经的工作党相信会更倾向于2400-2666的DDR4 ECC UDIMM内存或者2400内存小超一下到2666使用也是不错的选择,因为越是较为依赖内存效能来提高CPU效率的CPU,往往内存出错所带来的后果会更加严重,在1950X上跑极限内存娱乐一下可以,但是真用来干活的话可靠性就大为降低,我在测试SPEC大飞机模型的时候就发现2400 2666非常顺滑的过去了,而3333内存此刻会发生报错的情况,所以1950X这颗CPU在对内存频率敏感的同时,也对内存在高频下的稳定性非常敏感!



    关于主板


    说实话,随着INTEL X299平台的ECC阉割,X399真正面对的对手应该是C422芯片组,而1950X真正的对手也应该是XEON W系列。


    现在的工作站主板,随着众多的NVME M.2乃至U2接口的普及,磁盘读写IO大幅上升,搭配万兆网卡已经是大势所趋,华擎X399 Professional Gaming双千兆MAC和PHY一体化封装的I211AT网卡加上AQC的万兆网卡俨然是一台准服务器的配置了!在市面上所有的X399主板里面,也仅有A开头的两家两块旗舰达到这样的网络配置!


    在7天7夜的测试过程中,主板的温度始终稳定在38-42度之间,而其间偶尔用手指触碰供电的散热片几乎摸不到什么温度,X399 PCH散热片也只能感觉到微温,11相的CPU+SoC VRM供电以及2+2的内存VRAM供电设计也已经达到了旗舰级的配置,对ECC UDIMM内存的支持让消费者在XEON之外有了另一个工作站选择。


    缺点:板载的INTEL 3168 AC 无线网卡实在拿不出手,这个级别的主板,不说配一张802.11AD的网卡,至少也应该是一颗BCM4366 4X4 MU-MIMO的AC,再不济也应该是一张BCM4360 3X3MIMO,建议网络无线强迫症者直接给3168无线模块拆下来更换INTEL 8260级别的2X2MIMO网卡。

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    论坛开启做任务可以
    额外奖励金币快速赚
    积分升级了


    Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

    本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

    平平安安
    TOP
    快速回复 返回顶部 返回列表