马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
Xilinx在MLPerf中获得了Resnet-50测试第一
日前,MLPerf组织公布了一系列测试结果,NVIDIA在第二版MLPerf Inference中赢得了针对数据中心和边缘计算系统的所有六个应用领域的所有测试。其中,浪潮AI服务器NF5488A5支持8颗第三代NVlink全互联的NVIDIA A100 GPU,一举创造18项性能纪录;宁畅信息产业(北京)有限公司搭载NVIDIA T4 /A100 GPU卡的Nettrix X640 G30 AI服务器,在ResNet、BERT、DLRM等基准测试中取得30项世界第一成绩。
尽管很多都是NVIDIA的成就,但FPGA供应商Xilinx也获得了一点点成绩,以下来自Xilinx的官方博客:
最新MLPerf组织发布了最新一轮机器学习性能测试结果。MLPerf于2018年推出,由超过23个组织组成的开源社区,其任务是定义一套标准化ML基准。该小组的ML推理基准测试提供了一个共同认可的过程来衡量不同类型的加速器和系统如何快速有效地执行训练过的神经网络。
Xilinx第一次直接参加了此次测试。虽然仅仅取得了一些成绩,但我们很高兴能够在图像分类类别中取得领导地位。我们与Mipsology合作,严格接受了标准测试。
测试系统使用Alveo U250加速卡,基于Mipsology优化的特定域架构(DSA)。我们基于Alveo的定制DSA在离线模式下以5011图像/秒的速度执行基于ResNet-50基准的图像分类任务的效率。ResNet-50以图像/秒为单位测量图像分类性能。
我们实现了最高的性能/峰值(TOP/s)。它是一种性能效率的度量,本质上意味着,在给定X个硬件峰值计算量的情况下,我们提供了最高的吞吐量性能。
MLPerf结果还表明,与我们发布的数据表性能相比,我们实现了100%的可用TOP/s。这一令人印象深刻的结果表明,纸上的原始峰值并不总是真实世界性能。我们的设备架构为AI应用提供了更高的效率(有效的TOP/s与峰值TOP/s相比)。市场上的大多数供应商只能提供其峰值峰值的一小部分,效率通常达到40%。更重要的是,ML应用程序不仅仅是AI处理。它们通常需要ML前后的处理函数,这些函数会竞争系统带宽并导致系统级瓶颈。我们的适应性平台的强大之处在于,它们还可以加速这些关键的非人工智能功能,并构建应用程序级流媒体管道,以避免系统瓶颈,从而实现整个应用程序的加速。我们在保持TensorFlow和Pythorch框架可编程性的同时,也取得了领先的成果,而不需要用户具备硬件专业知识。
MLPerf正在迅速成为业界衡量ML性能的标准。这是MLPerf推理基准测试(v0.7)的第二个版本,它吸引了1200多个友商来进行评审。ML推理是一个快速增长的市场,如自动驾驶和基于人工智能的视频监控,需要计算机视觉任务,如图像分类和目标检测。这些复杂的计算工作负载需要不同级别的吞吐量、延迟和功率才能高效运行,这就是Xilinx和我们的自适应计算产品的亮点所在。
MLPerf基准测试结果强调了我们的自适应计算设备为人工智能应用提供的高效吞吐量和低延迟性能。我们对这些最初的MLPerf结果感到兴奋,并期待参与下一个版本。 |