我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 817|回复: 11

[零组件/半导体] 为什么FPGA主频比CPU慢,但却可以用来帮CPU加速?

[复制链接]
  • TA的每日心情

    4 小时前
  • 签到天数: 87 天

    [LV.6]常住居民II

    1万

    主题

    8216

    回帖

    5万

    积分

    三级逆天

    积分
    53628

    终身成就奖特殊贡献奖原创先锋奖金点子奖优秀斑竹奖宣传大使奖

    发表于 2020-11-8 08:47:15 | 显示全部楼层 |阅读模式

    马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

    您需要 登录 才可以下载或查看,没有账号?立即注册

    ×
    我们知道,FPGA的频率一般只有几百MHz,而CPU的频率却高达数GHz。那么,有不少网友心中就有一个疑问:“为什么FPGA主频比CPU慢,但却可以用来帮CPU做加速?”。
    今天,EDN就和大家系统性地讨论下这个问题。


    将FPGA主频与CPU相比不妥

    在开始之前,首先要明确一点,将FPGA的主频与CPU比较,实际是风马牛不相及的问题。FPGA和CPU是两种完全不同的器件,前者是专用,是硬件编程,而后者是通用,是软件编程。


                                   
    登录/注册后可看大图
    不同体系结构性能和灵活性的比较。(图片来源:《如何评价微软在数据中心使用 FPGA 代替传统 CPU 的做法?》)
    表面上看,FPGA的时钟频率要低;对于通用计算任务,FPGA设计貌似不如CPU设计。但是实际上,单个FPGA的并行度却比CPU要高得多。FPGA的行为是确定性的,用作硬件加速器没有时间片、线程或资源冲突的问题。它始终以完全相同的速度执行一件事。因此,如果需要低延迟,那么FPGA就可能是最佳选择。

                                   
    登录/注册后可看大图
    计算密集型任务,CPU、GPU、FPGA、ASIC 的数量级比较(以16位整数乘法为例,数字仅为数量级的估计)(图片来源:《如何评价微软在数据中心使用 FPGA 代替传统 CPU 的做法?》)


    FPGA并行计算机制

    如知乎网友young cc所言,虽然CPU主频很高,但其是通用处理器,做某个特定运算(如信号处理,图像处理)可能需要很多个时钟周期。而FPGA可以通过编程重组电路,直接生成专用电路。加上电路并行性,可能做这个特定运算只需要一个时钟周期。
    举例来说,CPU主频为3GHz,FPGA主频为200MHz。若做某个特定运算,CPU需要30个时钟周期,而FPGA只需一个,那么耗时情况是:
    CPU:30/3GHz =10ns;
    FPGA:1/200MHz =5ns。
    可以看到,FPGA做这个特定运算速度比CPU块,能帮助加速。
    另外,CPU的主频是加过流水线之后的。比如是15级流水线,则第一条指令执行了15个时钟周期后才能出结果。
    但是,使用FPGA也不一定总能做加速。
    例如,知乎网友Evan172就表示,使用FPGA做加速,只是在某些强计算和数据处理的方面,因为其硬件电路并行运行和有很多DSP硬核资源供调用的特点,可以工作得更出色。
    FPGA本身也只是辅助角色,起控制的还是CPU本身,所以FPGA并不能代替CPU,只是在完成一件大任务的过程中将某部分任务分解给FPGA可以更好地一起完成任务。在这过程中也会有额外的开销产生,在某些场合,可能用了FPGA而效果更差也是有的。
    另外,通常说的使用FPGA加速比CPU和GPU省电,是指在完成同样的任务下,FPGA耗费的电力比起CPU和GPU更少一些。这是相对而言的,并不是说FPGA本身就一定省电。


    一个有趣的例子:数组加法计算

    知乎用户doing举了一个很有趣的例子。他指出,假设用FPGA完整实现了CPU,然后再跑软件的话,的确比CPU慢。问题是FPGA不会那么干,它会直指问题本质,解决问题。
    例如,有两个数组,其中有256个32位数。现在要把它们对应相加变成一个数组,用CPU写最快大概是这个样子:
    r[0] = a[0] + b[0];
    r[1] = a[1] + b[1];
    ...
    r[255] = a[255] + b[255];
    当然也可能会这么写(在分支预测准确,指令缓存不大的情况下可能更快):
    for (int i = 0; i < 255; i++)
    r = a + b;
    对FPGA来说,也可以用上面相同的写法,不同在于:
    CPU是一个一个加法计算,而FPGA排好逻辑电路,在一个时钟周期内计算完毕。就算CPU主频比FPGA快100倍也赶不上啊。话说后来CPU大量的增加SIMD指令,就有点这个意思,不过这相当于提供库函数,没那么灵活。
    FPGA的并行是真并行,CPU完全没得比。CPU如果想并行最多也就是让多个核并行,但是对于大部分算法实现来说,如上例,多个核之间的同步调度开销远远大于计算开销,就算多个核之间的调用开销可以做的很小,一般CPU也就那几个核,而FPGA只要门足够,想并行几路就可以并行几路。
    所以在做可并行的计算密集型任务时,比如信号处理,网络传输等等FPGA可以帮上忙;但是如果做常见的以串行为主的任务,FPGA的确远远比不上CPU。如果要类比的话,有点像似GPU和CPU之间的关系。
    “当年写Verilog的时候,我就想如果CPU里面自带一块FPGA,应用程序程序可以在初始化期间直接烧一段代码下去,那岂不是很爽。后来,有了能写shader的3D显卡...”


    为什么FPGA成为数据中心尖端技术?

    最后再讨论一个话题,就是为什么FPGA一直是数据中心领域最尖端的技术?
    有人可能认为,再大的问题(算力)都可以通过堆CPU核心来解决。那么,假设有一台强大的48核服务器,即使使用非常高端的FPGA,也很难达到相同的吞吐量。而且,FPGA硬件设计还需要由强大的团队来完成,非常烧钱。
    这时,如果把机会成本和能源效率两者考虑进去,好处就开始显现出来了。
    首先来看能源效率。假设这台48核服务器的功耗为400W并且发热严重,那么就会对数据中心运营不利——能耗和散热是数据中心运营的两项最大支出。而将FPGA连接起来只执行一项任务,就可以实现很高的能效而开销极低。通过正确的设计,可以在实现低功耗的同时获得高吞吐量。
    其次,机会成本(这个问题不太明显)。系统中的CPU内核数量就那么多。购买新的内核并且安装需要花很长时间,而且最好是将通用CPU内核保留用于通用任务(例如虚拟机订阅)。每个CPU核卖不出去就会烧钱。
    当有任务大量占用CPU时间(例如AI推理)时,FPGA就成为了不错的选择。


    一个有关微软Project Catapult项目当中FPGA的趣事

    当年,微软必应团队在其Project Catapult项目中发现,在启用FPGA时,CPU的总体利用率实际上略有上升。所有的人都感到困惑,因为从直觉来看FPGA应该要减少CPU负载。但是后来他们发现,数据中心的业务流量达到了原来的2倍!由于效率提高,流量实现了两倍的负载均衡。由此可见FPGA的强大之处。


    总结

    维基百科的相关词条提到两点:FPGA的优势在于其并行特性,有时对于某些应用而言可以使速度明显变快;可以使用FPGA来对算法中的某些部分加速,也可以在FPGA和通用处理器之间共享部分计算。
    综上,FPGA有两个优点:FPGA并行度远超CPU;CPU是通用电路,FPGA是定制电路。但是也有两个缺点:开发周期长;并不是所有东西都适合FPGA。
    回复

    使用道具 举报

    该用户从未签到

    4

    主题

    1017

    回帖

    0

    积分

    二级逆天

    积分
    0

    终身成就奖原创先锋奖

    发表于 2020-11-8 09:00:50 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    开心
    4 小时前
  • 签到天数: 143 天

    [LV.7]常住居民III

    53

    主题

    3998

    回帖

    2279

    积分

    二级逆天

    积分
    2279

    社区居民终身成就奖特殊贡献奖

    QQ
    发表于 2020-11-8 09:03:46 | 显示全部楼层
    VERY GOOD!
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    7 天前
  • 签到天数: 49 天

    [LV.5]常住居民I

    1

    主题

    1841

    回帖

    1384

    积分

    二级逆天

    积分
    1384

    终身成就奖优秀斑竹奖特殊贡献奖

    发表于 2020-11-8 09:18:17 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-9-7 09:00
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    4981

    回帖

    3456

    积分

    二级逆天

    积分
    3456

    终身成就奖社区居民优秀斑竹奖

    QQ
    发表于 2020-11-8 13:44:35 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    3

    主题

    4632

    回帖

    0

    积分

    PADS20200316初级班

    积分
    0

    终身成就奖特殊贡献奖原创先锋奖优秀斑竹奖

    发表于 2020-11-8 16:59:52 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    5014

    回帖

    16

    积分

    二级逆天

    积分
    16

    社区居民终身成就奖优秀斑竹奖

    QQ
    发表于 2020-11-8 17:44:40 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    19

    主题

    1829

    回帖

    4431

    积分

    PADS-2021国庆特训班

    积分
    4431

    终身成就奖特殊贡献奖优秀斑竹奖

    发表于 2020-11-8 18:41:55 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情

    2024-11-16 20:45
  • 签到天数: 25 天

    [LV.4]偶尔看看III

    0

    主题

    1348

    回帖

    1500

    积分

    二级逆天

    积分
    1500

    终身成就奖社区居民

    QQ
    发表于 2020-11-8 21:59:21 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    郁闷
    2024-11-7 10:22
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    44

    主题

    5762

    回帖

    1万

    积分

    三级逆天

    积分
    10059

    终身成就奖特殊贡献奖原创先锋奖优秀斑竹奖

    QQ
    发表于 2020-11-9 08:09:28 | 显示全部楼层
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    每日签到,有金币领取。


    Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

    本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

    ( 闽ICP备2024076463号-1 ) 论坛技术支持QQ群171867948 ,论坛问题,充值问题请联系QQ1308068381

    平平安安
    TOP
    快速回复 返回顶部 返回列表