我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 12995|回复: 2

[DIY详解] NVIDIA Quadro P4000专业显示卡评测

[复制链接]
  • TA的每日心情

    6 天前
  • 签到天数: 68 天

    [LV.6]常住居民II

    1万

    主题

    8193

    回帖

    5万

    积分

    三级逆天

    积分
    53625

    终身成就奖特殊贡献奖原创先锋奖金点子奖优秀斑竹奖宣传大使奖

    发表于 2017-11-1 15:58:41 | 显示全部楼层 |阅读模式
    前言

    NVIDIA于2016年秋季发布的Pascal核心系列专业卡P6000和P5000之后,今年年初在
    SolidWorks World大会上又发布了
    QUADRO GP100、P4000、P2000、P1000、P600以及P400,自此Pascal战线所有的QUADRO专业卡布局完毕。而其中在P4000刷新了单槽最强专业卡的的记录。

    QUADRO P4000主要特性一览




    QUADRO P4000为单槽全高专业显卡,1792 CUDA核心,256位8GB的GDDR5显存,功耗105W,单6PIN外接供电,4个DP1.4的视频输出接口同时支持4个4K分辨率120HZ刷新或者4个5K分辨率60HZ刷新。
    大陆丽台国行定价在6500附近。从参数和计算力来看,P4000已经可以和M5000抗衡,而M4000则完全不是对手了。
    外观









    丽台国行QUADRO P4000的包装一眼看去就渗透出一股浓烈的NV公版风格说到行货NVIDIA的专业卡,在全球也只有两家在做,丽台和PNY,而中国大陆只有丽台一家在做,所以要买国行,基本没得选择,只有丽台啦。



    RMA政策是三年硬件质保,并且享受免费的电话和邮件的技术支持。



    说实话要做起专业卡这块牌子,并不是财力雄厚就可以做好的,这块牌子必须要有强大的技术储备,尤其是技术服务这块,行业客户大部分都是有锁定的开发项目和对应的开发软件,技术服务就像一个技术指导,必须将客户的使用引导到一个正确的方向上来,更要命的是一些GPU相关软件开发类的公司本身产品就在开发中,需要技术服务确认的细节更多,专业卡并不像游戏卡只需要搞定游戏就高枕无忧,做好专业卡更重要的是做好完善的技术支持和服务,这一点就需要有一批专业程度很高的工程师针对不同的项目去解决用户使用过程中产生的问题。



    专业卡的开箱



    两个字:朴素




    其实我很喜欢这类素净的包装风格,不罗嗦不废话不塞小广告,不捆绑乱七八糟的软件和游戏。


    全家福


    驱动光盘、说明书和质保卡


    两根DP转DVI的线,这个线有很多讲究,DP转DVI也分为主动被动两种:

    在DP输出接口上可以既发送原生的DP信号,也可以发送HDMI或者DVI信号,具体发送什么取决于显示设备。如果显示设备的接口本身就是DP,那么显卡自然发送DP信号过来,如果显示设备的接口是DVI,那么显卡则会发送DVI信号,此时,就需要一个转接线,来做转换。通常来说最便宜的方式就是使用DP被动线,DP被动线实际上只是做了一个电平转换,理论上来说效果是一样的,但由于有的转换器的质量不过关,导致转换之后信号的质量不理想。

    主动线是把自己模拟成一个DP的接收设备,然后让显卡直接发送DP信号,再由它来完成DP到DVI信号的协议转换,这里面自然有很复杂的电路运算通过转化芯片来完成,比如使用
    parade公司生产的PS181芯片,
    主动线的好处是输出的信号质量比被动式的好,同时可以支持DP HUB,价格自然比被动式的贵很多,一般都是在几百元左右。

    QUADRO P4000很特别,将2D输出运算的转化模块集成到了GPU SoC内部了,所以直接用几十块的DP转DVI的被动线就可以输出很高的质量,无论是DP还是转化后的DVI-D SL接口均可以支持10-12BIT的1024-4096灰阶显示医疗用显示器。
    立体声的接头卡
    本体三面观
    单槽卡在顶部并没有QUADRO的LOGO,只有一个型号标识
    顶部有两组HB SLI的金手指,一个立体声接口,一个链接SNYC II同步卡的接口



    4张P4000通过一张QUADRO SYNC II的子卡可实现16屏幕的扩展,8张P4000+2张QUADRO SYNC II可实现32屏幕的扩展,NVIDIA称之为MOSAIC技术。




    涡轮散热风扇




    出风口




    单6PIN供电链接




    4个DP1.4支持4个4K 120HZ输出或者4个5K 60HZ输出。同时也
    可以支持10-12BIT的1024-4096灰阶显示。

    平台

    测试平台的组件尽量按照丽台WINFAST WS800制图工作站为参考进行配置:
    CPU:INTEL XEON E5 2696 V3
    鸡血之后,18C 36T 可达12C 3.8G主频 6C 3.2G主频,全核心同时满载3.4G主频
    主板:ASROCK X99E-ITX/AC (已刷E5 V3鸡血固件第二版)
    散热:酷龙4U
    内存:镁光VLP DDR4 2400 ECC UDIMM 16GB X 2
    SSD:INTEL 750 U2 1.2T/MSI M.2 TO U.2 KIT
    电源:SILVERSTONE SX500-LG
    机箱:PRIMA P115EA
    虽然这个X99只有双通道内存,但是依然高规
    装上QUADRO P4000

    细节
    对比测试对象选用了我自己的AMD VEGA FE、NVIDIA GTX1080 FE 和 另外一个朋友远程在线提供测试的GTX1080Ti FE和TITAN Xp。
    参考价格分别是:
    NVIDIA QUADRO P4000 RMB 6588
    NVIDIA TITAN Xp RMB 9699
    NVIDIA GTX1080TI RMB 5999
    NVIDIA GTX1080  RMB 3999
    AMD VEGA FE RMB 9999
    测试平台CPU-Z参数
    丽台国行QUADRO P4000的核心频率基准1202MHz,BOOST频率1480MHz,1792个CUDA单元,显存使用镁光的256Bit 8GB GDDR5频率1901MHz。
    显示器使用AOC旗舰制图显示器LV323HUPX,32寸4K IPS-AMVA面板,DP直连,直接输出10Bit完全动态范围的色彩。
    操作系统:WINDOWS 10 X64 专业版1709
    驱动:Quadro P4000--NVIDIA QUADRO DRIVER RELEASE 387.95 WHQL
    驱动:Geforce GTX TITAN Xp--NVIDIA GeForce Game Ready Driver 385.12 BETA
    驱动:Geforce GTX1080Ti--NVIDIA GeForce Game Ready Driver 385.28 WHQL
    驱动:Geforce GTX1080--NVIDIA GeForce Game Ready Driver 385.28 WHQL
    驱动:Radeon Vega Frontier Edition--AMD Radeon Vega Graphics Driver 17.8.2 BETA

    测试

    1、3DMARK





    3DMARK其实是对QUADRO卡一种游戏性能的摸索,硬体规格直接影响这个测试的结果,P4000果不其然,接近GTX1060 6GB的测试成绩!

    2、AIDA64 GPGPU




    在NVIDIA QUADRO驱动面板中,可以设定P4000的使用模式,专用于图形模式 或者 同时用于图像和计算,当开启专用图形模式时候,AIDA64的GPGPU是无法进行测试的,因为此时P4000的OPEN CL效能是完全关闭状态。



    我们将P4000设定在 同时用于图像和计算 模式,此刻OPEN CL才被打开,可以进行OPEN CL有关的计算。



    在这个测试中,QUADRO P4000的测试成绩确实是垫底的,AMD VEGA FE的强势在于双精度计算的大幅提升,单精度运算12854 GFLOPS仅次于13484 GFLOPS的TTXP,但是VEGA FE的双精度确实很好达到了817.2GFLOPS接近TTXP的双倍,而INT1-16运算的24-BIT INT运算也以10415 GFLOPS的速度超出TTXP两倍以上。而32-BIT INT运算则被TTXP超越了2倍,总体来说,VEGA FE无论单精度还是INT运算并不弱于TTXP多少,而双精度运算更是独步天下。所以P4000这张卡确实要配上XEON E5 2696 V3这种双精度很给力的CPU,在进行双精度计算的时候,用CPU去弥补P4000的不足!很显然,P4000只是QUADRO并不是GEFORCE或者TESLA,并不擅长计算。

    3、CINEBENCH R15




    CineBench R15主要用来测试显卡的OpenGL效能测试,首先开启P4000的图形模式进行测试



    可以看出,尽管QUADRO P4000的硬体规格和对比的几张游戏和半专业显卡相去甚远,但是OPEN GL效能197.77FPS也只是仅次于TITAN Xp,大幅超越GTX1080TI、GTX1080和VEGA FE,这里QUADRO专业驱动的OPEN GL效能表现的极为强大。



    开启图形和计算模式,此时P4000 OPEN GL得分189.99FPS和纯图形模式差距不大,这个得分也是可以牢牢跟紧TITAN Xp的。

    4、SPECviewpref 12.1




    当然大家会说这是一张专业卡,用游戏来测试不符合产品定位,确实!专业显卡测试则是通过SPECviewperf®12.1来表现的,SPECviewperf是一个由C语言编写简单易用的OpenGL性能测试程序,用于测量运行在OpenGL应用程序接口之下的系统3D图形性能。测试中的文件称为场景,表现了一个流行的来自真实应用程序的图形渲染和操作创建的混合。

    SPECviewperf®12测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过6000万个定点数据,能够充分反映出工作站的专业性能,其专业性将有望成为新一代的专业测试基淮, 是专业图形性能的测试标杆。


    SPECviewperf®12.1是基于专业应用上衡量显卡性能的一个新版本,带来了全新的8个专业图形测试场景, 包括Energy、Medical、Catia、Cero、Maya、SNX以及主要基于OpenGL 4.0架构的Solidworks和首次添加基于DirextX架构的Showcase。



    P4000测试结果



    抓取AUTODESK的3ds Max 2016生成的图形工作量轨迹而创建的测试脚本,几个测试在窗口上并入了多个视图,每个使用不同的渲染方法,渲染样式反映了主要市场中最常用的样式,包括逼真,阴影和线框。

    这个测试专业显卡几乎没有任何特效加成,完全看的是GPU的规格,所以P4000也无法获取更多的性能加成,TTXp和GTX1080TI因为其更高的GPU规格和更多的CUDA核心规模分别位于第一第二,P4000竟然越过了规格强大很多的GTX1080和VEGA FE位于第三,很让人诧异,其实3DSMAX从2015之后就没有什么认证驱动了,貌似AUTODESK放开了GPU的支持度,无论游戏卡还是专业卡都支持,但是从硬体规格来说,P4000的这个逆袭说明AUTODESK对QUADRO专业驱动还是有很大的加成存在。



    抓取Dassault Systemes的CATIA V6 R2012应用程序生成的图形工作量轨迹创建的测试脚本,模型大小范围从5.1到2100万个顶点。测试包括线框,抗锯齿,阴影,边缘阴影,景深和环境遮挡等渲染模式。TTXp极高的规格被NVIDIA浓墨重彩的加强专业性能,以至于一时无敌,第二名是P4000。



    达索的软件一向是完全偏向NVIDIA QUADRO优化,而且有认证驱动,当然我们的测试结果也说明了这一点。



    设计制造类软件翘楚PTC Creo 2™应用程序从PTC生成的图形工作量轨迹创建的测试脚本,测试规模从20到4800万个顶点,包括线框,抗锯齿,阴影,边缘阴影和阴影反射模式等众多渲染模式。

    这个测试又是典型的N重金投资系列,NVIDIA专业驱动的优化是最大的性能提升需求,TTXP有最新鸡血专业驱动护体,直接超越了自家的P4000专业卡的效能,P4000位列第二,而1080和1080TI则是落后了一半以上,VEGA FE虽然很努力,但是N重金就是N重金,这个测试VEGA FE只能位于第三名。PTC给人的感觉就是表面上会说我很宽容只要是GPU我都支持,而且我不认证GPU,但是他们却去认证DELL HP带有专业GPU的工作站系统,最后得到的结论一样是专业卡保平安!



    ENERGY是地震和油气田中典型的体积渲染应用的代表。类似于MRI或CT等医学成像,是地球物理测量通过内置于3D网格的地下生成图像切片。体积渲染提供了这种3D体积网格的2D投影,利用三线性插值调用3D纹理的硬件支持,其中的3D数据集都使用简单的随机函数生成。

    这个测试,P4000和TTXP是非常接近的性能分别位于前两位,这完全是因为专业驱动的优化,因为很接近TTXp规格的GTX1080TI的性能完全得不到充分的发挥,还不如规格落后但是优化到位的P4000。



    Autodesk的Maya 2013生成的图形工作量轨迹创建的测试脚本,模型大小为727,500个顶点。包括应用程序支持的众多渲染模式,包括阴影模式,环境遮挡,多样本抗锯齿和透明度。

    按道理说这个测试版本应该没有专业驱动认证的,却一直N卡重金优化的软件,A卡的弱项,N卡整体被加速推进效能,而P4000明显被1080拉开差距,这个软件专业显卡并没有得到逆天的优化,还是GPU规格制胜,VEGA FE完全吃亏在AN的区别优化上,而和P4000几乎差不多,拉不开差距。

    那么在更新MAYA 2015 2016 2017版本里面,NVIDIA发布了IRAY和METER RAY的MAYA渲染器插件来支持高速的GPU,但是这个渲染器只有90天的免费使用时间,后期需要收费。



    MEDICAL测试是3D体积网格的2D投影的典型体绘制应用程序的代表,本质是一个3D的虚拟化显示计算能力。模型其中最有代表性的是从MRI获取的一组3D切面的扫描照片组成的4D心脏数据,由斯坦福大学医学院放射学系和Lucile Packard儿童医院提供,雄鹿甲虫数据由维也纳技术大学提供。CPU计算与视角对齐的一系列切面,然后发送到GPU进行纹理化和进一步计算,如传递函数查找,照明和剪辑以显示内部结构。最后将切片混合在一起呈现一个完整的图像。虽然这个环节里VEGA FE爆出了NO1的成绩,高规格和大显存很明显是这个测试环节的优势,TTXP以非常微弱的差距紧随其后,而P4000也战胜了比自己规格强大很多的GTX1080。

    而实际医学工作中,QUADRO的应用也是很广泛的,尤其在影像医学领域的显示能力上,影像学使用的3M 5M医用灰阶显示器和普通显示器的区别比较大。



    普通显示器:8bit- 256灰阶,用于显示彩色图象,无灰阶要求,使用普通显卡。


    医用显示器:10bit~12bit1024~4096灰阶),用于显示X光灰阶图象,于诊断相关。从黑色到白色的渐变过程,医疗液晶可以显示1024~4096的灰阶方块,显示的灰阶数越多,灰阶的过渡越平滑,显示出来的病理表现层次就越多,所以一般都需求QUADRO类的专业显卡。



    一般来说,影像诊断工作站会至少有两台显示器,一台3M或者4M灰阶医用显示器,一台用于撰写影像分析报告,医生的平均读片时间的长短往往代表着分析的细致程度,医疗影像有着天然的识别难度,它的分辨率、维度都很高,比如X光片的像素是3000x3000,CT是 512x512且有250个层面,一个病人信息量、图像像素都非常庞大,而有时候病变就隐藏在一个很小的地方,完全依靠医生的眼球去分析影像结论的周期相对比较漫长,CT的读片时间较为复杂的需要读1个多小时,PET-CT就更不用说了,这时候桌面就要增加第三台显示器了,用于对影像图像学的深度学习分析使用。这时候QUADRO P4000是可以同时保证彩色和灰阶显示器都在最佳状态下正常工作的,且灰阶显示器是可以显示10bit~12bit的1024~4096灰阶的。


    上图中为影像学深度学习服务器使用NVIDIA 的DGX-1,双路XEON E5 2698 V4,256GB ECC REG DDR4内存,TESLA P100 X 8块,使用infervision推想出品的AI-Scholar系统进行分析。




    影像医师通过点选数据库里的同一病人的套片联通深度学习的AI-Scholar分析平台进行深度学习分析



    在深度学习的分析过程中,实际的GPU占有率并不高是因为完全依靠后面的DGX-1深度学习机在进行分析处理。



    处理完毕后可以通过AI分析显示出可能出现的影像学病理推断供医生参考审核使用。



    多纬度的影像学图片通过深度学习还可以获得更丰富的病理可能性分析,供医生进行深度的病理排查。


    那么一般一个较为复杂的病例人工分析所耗费的时间至少也在30分钟以上,完全医生的眼球去分析影像,漏诊率也很高,通过深度学习筛查影像的病理特征得出可能性的初步结论只需要1分钟,然后医生再去对这些结论进行筛查平均判定也仅仅需要1-5分钟,大大缩短病人的诊疗时间,也同时大大降低了影像学的漏诊率。以上就是一个典型的QUADRO+TESLA在AI医疗中的应用,QUADRO用于前端的精细化预览,TESLA用于后端的专业化深度学习算力分析。



    Autodesk Showcase 2013应用程序的运行轨迹创建的测试,使用的模型由800万个顶点组成,也是SPECviewperf中第一个设置DX渲染功能的视图。视图中包含的渲染模式包括阴影,投影阴影和自阴影。

    这个测试而言,似乎并不认所谓的专业显卡优化,是真正按照游戏性能说话的专业软件,游戏性能高,这个测试就高,很明显,1080TI是当中的最强游戏卡。



    SIEMENS NX8.0测试是西门子PLM NX 8.0应用程序生成的图形工作负载的痕迹创建的,型号尺寸范围为7.15至8.45万个顶点,包括应用支持的许多渲染模式,包括线框,抗锯齿,阴影,边缘阴影和工作室模式。



    这个测试而言,完全是A无视游戏显卡,无论1080还是1080TI都超不过10分,而鸡血驱动加成的TTXP也不过80分左右,而VEGA FE由于其准专业特性则仅次于QUADRO P4000,而硬体规格落后很多的P4000却制霸全场,这个结果其实不难解读,从上面这份SIEMENS的认证硬件列表里就不难看出,除了AMD和NVIDIA的专业显卡还有INTEL的XEON所带的工作站版本集显之外,其余的硬件一律不给认证。



    Solidworks 2012测试是从Dassault Systemes的SolidWorks 2013 SP1应用程序的轨迹创建的。视图中使用的模型的大小从2.1到2100万个顶点,其中包括应用程序支持的众多渲染模式,包括阴影模式,边缘阴影,环境遮挡,着色器和环境映射。

    这个测试中完全是专业显卡天下,确切来说VEGA FE和TTXP都不算是完整的专业显卡,但是这个测试的性能梯度分布是非常明显的,专业显卡》半专业显卡》游戏显卡,所以P4000的硬件规格竟然也一样称霸。

    而其实对于SOLIDWORKS这个软件而言,更高的版本比如2015 2016 2017中QUADRO的优势会持续增加。



    就拿SOLIDWORKS 2015 SP5来说,受支持的NVDIA的显示卡只有TESLA和QUADRO有SOLIDWORK认证的优化驱动,目前P4000且只有一个认证的驱动版本376.84,其他诸如GEFORCE或者TITAN Xp均无认证驱动,所以不难理解为什么QUADRO在SOLIDWORKS中无可取代的地位了。



    SOLIDWORKS 2018则是直接不再有NVIDIA消费级游戏显卡的测试版兼容驱动了,你找不到兼容测试的NVIDIA消费级显卡列表。



    而认证驱动仅仅支持32款专业显示卡,而太老的专业显卡依然不给予驱动认证。



    而同时支持可视化硬件、多头硬件加速和所有的REALVIEW功能的显示卡仅限于QUADRO 6000以及以上型号,再次对专业卡提出一个新高度!



    其实面对专业软件认证驱动,NVIDIA做的工作非常的全面,当这些专业软件厂家犹抱琵琶半遮面羞于承认专业GPU驱动认证的时候,NVIDIA在上面这个网址里早已说透了这一层关系,无论软件厂家在官网承认也好不承认也罢,NVIDIA为QUADRO投资出去的花出去的每一分钱都在这里得到了体现。

    5、典型功耗





    从功耗来说,我使用了桌面待机来测试轻功耗负载,用FURMARK和ETH MINER挖矿同时进行来测试最大功耗负载,可以看出,无论待机还是满载,VEGA FE都是功耗最高的,待机117W满载391W,而TTXP待机仅99W,满载341W。在能耗比上,VEGA FE真的无优势可言,而P4000是令人惊叹的,待机72W,满载183W。

    总结

    QUADRO P4000 无论性能还是规格还是能耗比,都足以秒杀上一代的高规产品M5000,6K多的价格非常接近消费级显卡的价格,而实际的专业级应用测试在很多项目中都是领先于规格超越其很多的消费级显卡的,更重要的是,在几乎所有的专业级软件中都可以找到QUADRO P4000适用的认证驱动,这才是QUADRO真正的软实力价值体现,另其输出的色彩和灰阶准确度也是非常适合精密制造乃至医学成像等多个领域,如果你只是需要很高的游戏性能而偶尔玩一下专业软件的话,TTXp会更加适合你;如果你是个对性能和色彩要求非常执着的工业产品乃至动漫的设计者,或者一个对电气性能要求非常苛刻的电气工程师,或者一个对影像照片层次感和显示清晰度要求非常高的医学工作者,P4000都会是一个极其具有性价比的专业卡选择。
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    594

    回帖

    5

    积分

    二级逆天

    反物质

    积分
    5

    社区居民终身成就奖

    QQ
    发表于 2017-11-2 09:33:59 | 显示全部楼层
    组合的可能性——无穷!
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-5-31 11:54
  • 签到天数: 1 天

    [LV.1]初来乍到

    19

    主题

    1682

    回帖

    770

    积分

    二级逆天

    积分
    770

    社区居民忠实会员社区劳模终身成就奖

    QQ
    发表于 2017-11-9 08:57:28 | 显示全部楼层
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    论坛开启做任务可以
    额外奖励金币快速赚
    积分升级了


    Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

    本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

    平平安安
    TOP
    快速回复 返回顶部 返回列表