马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
自适应计算加速平台(ACAP)是赛灵思(Xilinx)在2018年推出的一个高度集成的多核异构计算平台,能根据各种应用与工作负载的需求从硬件层对其进行灵活修改。ACAP历经四年研发,累积研发投资逾10亿美元,超过1500名软硬件工程师参与其中,公司上下对其寄予了极高的期望。
赛灵思CEO Victor Peng此前在接受媒体采访时称,虽然FPGA与Zynq SoC技术当前仍然是公司业务的核心,但赛灵思今后将不再仅仅是一家FPGA企业,尤其是伴随着ACAP的发明,赛灵思在当前以及未来将为数据中心与主流市场创造更多新的价值。
ACAP首款产品Versal的名字来源于两个词,一个是多样性,一个是通用性。产品组合包括Versal基础系列(Versal Prime)、Versal旗舰系列(Versal Premium)系列和HBM系列。此外,还包括AI核心系列(AI Core)、AI边缘系列(AI Edge)和AI射频系列(AI RF)。率先亮相的Prime系列和AI Core系列已于2019年下半年实现全面供货,而最新推出的Versal Premium系列,则是目前业界带宽最高、计算密度最高的自适应平台。
Versal Premium的硬核秘密
“目前无论是在数据中心还是在核心城域,每年带宽的年复合增长率都高达51%,那些来自视频流、企业、物联网和智能器件的数据是主要推动力。”赛灵思产品线营销与管理高级总监Sumit Shah说,随着5G时代的到来,带宽规模将会增长100倍以上,传统网络在以下三大方向上的变化将最为明显:首先是核心网扩展,5G核心年复合增长率预计为313%;其次,安全和分析成为网络运营商最关心的内容;第三,端口的密度和带宽呈几何级倍数增长,端口速度远超摩尔定律,传统器件已经跟不上计算密度的发展。
赛灵思产品线营销与管理高级总监Sumit Shah 在这一背景下,Versal Premium采用了台积电7nm工艺制造,系统逻辑单元从最小160万个到最高740万个,自适应引擎LUT数量从最低72万个到最高340万个,可提供比当前主流FPGA高3倍的吞吐量和2倍的计算密度,并内置以太网、Interlaken和加密引擎,专为在散热条件和空间受限的环境下运行最高带宽网络,以及那些需要可扩展、灵活应变应用加速的云提供商而设计。预计将于2021年上半年开始为早期用户提供样品。
112Gbps PAM4收发器、数百GbE(千兆位以太网)和Interlaken连接、高速加密以及内置DMA、支持CCIX和CXL支持的PCIe Gen5是Versal Premium的新颖和独到之处。配合Vitis统一软件平台与Vivado设计套件,开发人员可以使用自己熟悉的框架和工具(TensorFlow、Caffe、PyTorch、Vitis、VIVADO)来进行开发。
赛灵思高端ACAP与FPGA高级产品线经理Mike Thompson表示,Versal ACAP非常重要的差异化特点就是具有片上可编程网络。“传统高性能、高带宽的设计经常会遇到路径上的瓶颈,而片上可编程网络可以解决这个问题,可以在所有引擎之间、用户逻辑器件和连接界面之间实现通信,而无需额外资源。”他说。
赛灵思高端ACAP与FPGA高级产品线经理Mike Thompson Versal Premium系列提供了高达9Tb/s的可扩展、自适应串行带宽。具体方法是将112G PAM4收发器与集成的网络功能模块用于核心网、城域网和数据中心互联(DCI)基础设施,将每端口带宽密度提高两倍,并降低时延高达50%。
这种预制连接可实现安全的多太位以太网(multi-terabit Ethernet),灵活支持各种数据速率与协议。通道化以太网硬核能够以最小占板空间提供高达5Tb/s的吞吐量,同时高速加密引擎可提供高达1.6Tb/s的加密线路速率吞吐量,并支持AES-GCM-256/128、MACsec和IPsec 。
以5G市场为例,Mike Thompson说5G运营商目前使用的是Versal AI Core系列,到今年年底应该能够大规模生产。而核心网建设要比无线网的投资晚2-3年,所以高峰应该出现在2023年,对于一些想要通过部署最尖端的技术来占领市场份额的客户,现在用Versal Premium开始开发设计,正好能够赶上这一机遇。
通过将超过120TB/s的片上存储器带宽与可定制存储器层级相结合,Versal Premium能够减少数据移动从而消除相应的关键瓶颈,与此同时,还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium 提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。
从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。具体到AI性能方面,Versal Premium系列在Yolov2(608×608)对象检测模型下,性能分别是英伟达V100和T4的4.6倍和7.7倍;在异常检测AI方面(随机森林算法),性能是英特尔Xeon的65倍。
具体到Versal Premium系列,其高效的表现主要源自对应用处理器、实时处理器、平台控制器、存储器界面以及多种连接进行的丰富集成。在Mike Thompson看来,如果用软件逻辑去实现以太网Interlaken或加密引擎,需要很多FPGA资源才能实现。但Versal Premium采用的ASIC硬核方式大幅提升了效率,网络硬核IP集成提供了等效22个16nm FPGA的逻辑密度。这样的配置使得开发者能够更加专注于差异化,而无需分散精力在基础架构设计与连接上,同时可以帮助客户降低资本支出与运营成本。
同时,Versal Premium在同一器件上提供32G、58G和112G收发器的广泛选择,允许厂商扩展主流100G系统、增加400G部署,并将自己定位为800G以上的厂商。
值得注意的是,与前代Virtex UltraScale+ FPGA相比,Versal Premium功耗降低了60%。在数据中心的应用当中,与前代的FPGA相比可以提供2倍的带宽密度。这意味着,在带宽相同的情况下Versal Premium的机柜空间占用只有前代FPGA的一半,实现了加速功能的优化并大幅降低了总拥有成本。
根据IHS Markit的研究显示,当前安全性已经成为了网络运营商最为关注的问题。Versal Premium ACAP提供1.6Tb/s的行速率加密吞吐量,因此是安全网络的理想平台。它在灵活应变的平台上采用业界唯一的硬化400G通道化高速加密 (HSC)引擎。HSC引擎支持AES-GCM加密/解密、MACsec和IPsec,可实现多层安全性。
但性能如此之高的产品,会不会因为昂贵的价格限制了市场的应用规模? Mike Thompson对此回应称,包括电信、全域网、交通网、数据中心、测试测量在内的很多市场都对Versal Premium表现出了非常浓厚的兴趣,希望尽快拿到Versal Premium去进行前期测试。
“但我必须要强调的是,Versal Premium是一款非常高端的产品,针对的目标群体是希望借此尽早部署最尖端、最先进的技术来获取市场份额的用户,而不是希望能够实现最低成本的客户。”他同时表示,考虑到目前芯片性能的增加和成本的降低,已经很难随着传统的摩尔定律逐步推进,所以Versal Premium具备的高集成度和灵活性将会给用户带来更多价值 |