我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 5209|回复: 1

[移动软件开发] 解密:Achronix 7nm eFPGA的设计方法

[复制链接]

该用户从未签到

44

主题

184

回帖

0

积分

二级逆天

积分
0

终身成就奖特殊贡献奖原创先锋奖

发表于 2018-12-1 09:05:27 | 显示全部楼层 |阅读模式
<div><div style="margin-right: 0px; margin-bottom: 15px; margin-left: 0px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em; margin-top: 0px !important;">在半导体行业,没有比<a href="http://www&#46;elecfans&#46;com/tags/fpga/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>FPGA</u></a>更寡头的市场了,马太效应所建立的护城河让任何一个新玩家都面临着勇气的巨大考验。好在FPGA的竞争并不拒绝方法论角逐的机会,人们很容易在成功者昔日的道路上看到这样的轨迹——创新的设计方法和商业模式。对于新玩家而言,这是一条近道。Achronix进入FPGA市场已经有几年了,除了交付FPGA芯片这种传统模式,向SOC公司提供嵌入式FPGA IP就是他们走“近道”的方法,而在他们最新推出的第四代eFPGA产品Speedcore Gen4 eFPGA IP时,除了TSMC 7nm工艺所产生的对标联想外,其在设计方法上也走了更多。</div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"><strong>算力对硬件提出的要求</strong></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">为<a href="http://www&#46;elecfans&#46;com/tags/ai/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>AI</u></a>、<a href="http://www&#46;elecfans&#46;com/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>机器学习</u></a>这类前沿应用提供技术产品的公司都在面对这类问题:摩尔定律在减速的同时,通信网络带宽在急剧增加,边缘计算,数十亿计的物联网设备,意味着每秒数十亿到数万亿次的运算。传统云和企业数据中心计算资源和通信基础设施无法满足数据速率的指数级增长、快速变化的安全协议、以及许多新的网络和连接要求。传统的多核<a href="http://www&#46;elecfans&#46;com/tags/cpu/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>CPU</u></a>和SoC无法在没有辅助的情况下独立满足这些要求。算力的提升主要依靠针对特定应用和数据集的体系结构进行专门优化。未来的微处理器将包括几个特定于域的核,这些核仅能很好地执行某一类计算,但它们的性能明显优于通用核。</div><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7A/E6/o4YBAFwA3OaAIljJAAJlskyJGHk687&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><img alt="40年来计算性能要求的变化" src="http://file&#46;elecfans&#46;com/web1/M00/7A/E6/o4YBAFwA3OaAIljJAAJlskyJGHk687&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 324px;" /></a></p><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"> </div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-align: center; text-indent: 2em;"><strong><em style="font-weight: normal;">图:这张图显示了40年来计算性能要求的变化</em></strong></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">Achronix 公司市场营销副总裁S<a href="http://www&#46;elecfans&#46;com/tags/te/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>te</u></a>ve Mensor认为,不同应用对于计算的要求不同,如计算加速要求高能耗比,<a href="http://www&#46;elecfans&#46;com/tags/5g/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>5G</u></a>则要求低功耗高性能的可编程硬件,边缘计算要求最低功耗,计算存储需要低功耗低成本,网络加速和智能卡则需要用于CPU卸载的高速率加速器,而汽车驾驶则需要低成本和低功耗的硬件加速。“FPGA最适合AI/ML的这些多元应用场景,”Mensor说。“如果需要通用灵活性,CPU最合适,如果是专用场景,<a href="http://www&#46;elecfans&#46;com/tags/asic/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>ASIC</u></a>最强,但它不可变,应用上不灵活。<a href="http://www&#46;elecfans&#46;com/tags/gpu/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>GPU</u></a>和FPGA是最适合AI计算应用的,相对而言,GPU更适合云端计算,FPGA则是边缘计算。”</div><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7B/54/pIYBAFwA3XSAXyV5AACQIRdgYJM541&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(15, 118, 159); word-break: break-all; outline: 0px;"><img alt="FPGA比CPU更具有功耗上的优势" src="http://file&#46;elecfans&#46;com/web1/M00/7B/54/pIYBAFwA3XSAXyV5AACQIRdgYJM541&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 223px;" /></a></p><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-align: center; text-indent: 2em;"><em><strong>图:FPGA比GPU更具有功耗上的优势</strong></em></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"><strong>新产品的设计方法</strong></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">说回Achronix最新推出的第四代产品,该公司提供给电子发烧友的资料显示其较上一代产品性能提高了60%、功耗降低了50%、芯片面积减少65%,同时保留了原有的Speedcore eFPGA IP的功能。该资料尤其提到了其在AI/ML的算力上提升了3倍。这主要源于Speedcore Gen4架构中,其资源逻辑库单元模块中加入了机器学习处理器(MLP)。作为一种高度灵活的计算引擎,MLP模块与存储器紧密<a href="http://www&#46;elecfans&#46;com/tags/%E8%80%A6%E5%90%88/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>耦合</u></a>,从而为AI/ ML应用提供了高能耗比和低成本的选择。值得注意的是,在不久前,Micron曾宣布他们最新的GDDR6存储器支持这款7nm工艺技术的FPGA芯片,并表示这个组合的成本能够比其他使用可比存储解决方案的FPGA低出一半。</div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">这些性能是怎么提高的?总的来讲是三点:增强的逻辑单元、Speedcore下一代的路由结构、AI/ML专用的<a href="http://www&#46;elecfans&#46;com/tags/dsp/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>DSP</u></a>单元MLP。</div><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7B/54/pIYBAFwA3gCAcv1xAAJbUMF4Zfs127&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><img alt="增强的逻辑单元" src="http://file&#46;elecfans&#46;com/web1/M00/7B/54/pIYBAFwA3gCAcv1xAAJbUMF4Zfs127&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 225px;" /></a></p><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"> </div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-align: center; text-indent: 2em;"><strong><em style="font-weight: normal;">图:这张图显示了增强的逻辑单元</em></strong></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"><span style="text-indent: 2em;">不同于目前FPGA高性能总线专用路由架构,Speedcore下一代的路由结构把高性能专用总线分组路由的总线路由通道与标准路由通道分开,以确保无拥堵,同时,新架构优化了内存和MLP之间运行的总线,并创建巨型分布式运行时可配置交换网络。</span></div><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3c-AHdmzAADYy_KUXVg315&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><img alt="Speedcore下一代的路由结构" src="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3c-AHdmzAADYy_KUXVg315&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 268px;" /></a><br /><em style="text-indent: 24px;"><strong>图:Speedcore下一代的路由结构</strong></em></p><p style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><span style="text-indent: 2em;">此外,该路由结构中还有专用的总线<a href="http://www&#46;elecfans&#46;com/tags/%E5%A4%9A%E8%B7%AF%E5%A4%8D%E7%94%A8%E5%99%A8/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>多路复用器</u></a>,可满足更广泛的多路复用要求。“这种设计使得总线功能的性能提高了2倍,节省了LUT的资源,提高了综合资源利用率。这为高带宽和低延迟应用提供了很好的方案,并在业界首次实现了将网络优化应用于FPGA互连。”Mensor说道。</span></p><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3juADj7iAADrkg6qSWE551&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><img alt="专用总线多路复用器" src="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3juADj7iAADrkg6qSWE551&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 378px;" /></a></p><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"> </div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-align: center; text-indent: 2em;"><strong><em style="font-weight: normal;">图:专用的总线多路复用器</em></strong></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">MLP是一个完整的AI/ML计算引擎,每个MLP包括一个循环<a href="http://www&#46;elecfans&#46;com/tags/%E5%AF%84%E5%AD%98%E5%99%A8/" target="_blank" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><u>寄存器</u></a>文件(Cyclical Register File),它用来存储重用的权重或数据。各MLP与相邻的MLP单元模块和更大的存储单元模块紧密耦合,以提供最高的处理性能、每秒最高的操作次数和最低的功率分集。这些MLP支持各种定点和浮点格式,包括Bfloat16、16位、半精度、24位和单元块浮点。用户可以通过为其应用选择最佳精度来实现精度和性能的均衡。<br /><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; text-indent: 2em; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3sSADNSnAABwlKbm6ys323&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><img alt="MLP块配置" src="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3sSADNSnAABwlKbm6ys323&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 285px;" /></a></p><div style="margin: 0px 0px 15px; padding: 0px; word-wrap: break-word; text-indent: 2em;"> </div><div style="margin: 0px 0px 15px; padding: 0px; word-wrap: break-word; text-align: center; text-indent: 2em;"><strong><em style="font-weight: normal;">图:MLP块配置</em></strong></div></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">为了补充MLP并提高AI/ML的计算密度,Speedcore Gen4 的LUT可以实现比任何独立FPGA芯片产品高出两倍的乘法器。领先的独立FPGA芯片在21个查找表可以中实现6x6乘法器,而Speedcore Gen4仅需在11个LUT中就可实现相同的功能,并可在1 GHz的速率上工作。</div><p align="center" style="margin-bottom: 12px; padding: 0px; word-wrap: break-word; letter-spacing: 0&#46;5px; font-size: 16px; background-color: rgb(255, 255, 255); text-indent: 2em; color: rgb(51, 51, 51) !important; line-height: 30px !important; font-family: &quot;Microsoft yahei&quot;, 微软雅黑 !important;"><a href="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3uGAUXVCAAOgWreUEZY308&#46;jpg" rel="lightbox-img" style="cursor: pointer; text-decoration-line: none; color: rgb(66, 152, 186); word-break: break-all;"><img alt="每个Speedcore都可完全按需定制" src="http://file&#46;elecfans&#46;com/web1/M00/7A/E7/o4YBAFwA3uGAUXVCAAOgWreUEZY308&#46;jpg" style="vertical-align: middle; cursor: pointer; margin: 0px auto; display: block; max-width: 100%; border-radius: 2px; width: 480px; height: 229px;" /></a></p><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"> </div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-align: center; text-indent: 2em;"><strong><em style="font-weight: normal;">图:每个Speedcore都可完全按需定制</em></strong></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;">据悉,第四代Speedcore eFPGA 7nm IP 目前已可提供,交付周期是1个半月,16nm的则会2019年上半年提供。Mensor并没有解释为什么7nm工艺IP比16nm先提供,笔者分析这应该是基于客户需求的商业考虑,毕竟领先FPGA的工艺是7nm,而从先进工艺向后延展,是十分容易的。</div></div><div style="margin: 0px 0px 15px; padding: 0px; color: rgb(51, 51, 51); word-wrap: break-word; font-size: 16px; font-family: 微软雅黑; background-color: rgb(255, 255, 255); text-indent: 2em;"><span style="color: rgb(153, 153, 153); font-size: 13px; text-indent: 0px;">来源:电子发烧友网</span><span style="color: rgb(153, 153, 153); font-size: 13px; text-indent: 0px;"> </span><span class="sp" style="margin: 0px 5px; color: rgb(204, 204, 204); font-size: 13px; text-indent: 0px;">•</span><span style="color: rgb(153, 153, 153); font-size: 13px; text-indent: 0px;"> </span><span style="color: rgb(153, 153, 153); font-size: 13px; text-indent: 0px;">作者:陆楠,电子发烧友</span><span style="color: rgb(153, 153, 153); font-size: 13px; text-indent: 0px;"> </span><span class="time" style="color: rgb(153, 153, 153); font-size: 13px; text-indent: 0px;">2018年11月30日 14:37</span></div>
回复

使用道具 举报

该用户从未签到

18

主题

2467

回帖

0

积分

二级逆天

积分
0

终身成就奖优秀斑竹奖特殊贡献奖

QQ
发表于 2018-12-1 10:49:04 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

论坛开启做任务可以
额外奖励金币快速赚
积分升级了


Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

平平安安
TOP
快速回复 返回顶部 返回列表