论坛风格切换切换到宽版
发帖 回复
返回列表  提醒:不能用迅雷等P2P下载,否则下载失败标(二级)的板块,需二级才能下载,没二级不要购买,下载不了
  • 1060阅读
  • 1回复

[技术讨论]CPU的频率止步于4G,我们触到频率天花板了吗? [复制链接]

上一主题 下一主题
离线shuszhao
 

性别:
帅哥
发帖
18006
金币
36403
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看楼主 倒序阅读 使用道具 0楼 发表于: 2017-11-13
9d{iq"*R  
M B|+F  
f?: o  
v!(B S,  
2\&uO   
W6f?/{Oo8  
8 _0j^oh  
&UH .e  
    YCod\}3  
Q?Vq/3K;  
hMz= \)Pl  
l6ayV  
想要提高CPU的运算效能,不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频,让CPU每个内核更快的算出结果呢?为什么持CPU制程牛耳的Intel,不再勇攀主频高峰了呢? oiYI$ql3L  
回首2004年,Intel雄心勃勃,宣布代码为Prescott超长流水线的奔腾4将会发布4GHz主频CPU,但最后结果是因为种种原因止步于3.8GHz。其后主频不进反退,直到到代号Haswell的酷睿4代(4790K)才真正站上4GHz,继任的broadwell, Skylake, Kabylake和Coffeelake对频率提高又变得无所作为。时间走过了十几年,为什么CPU主频不能继续提高呢?究竟发生了什么?我们是不是已经顶到频率天花板了呢? %rVC3}  
我们知道,想要提高CPU的运算效能,不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频,让CPU每个内核更快的算出结果呢?为什么持CPU制程牛耳的Intel,不再勇攀主频高峰了呢?其实,瓶颈主要在于散热,我们来详细了解一下个中原因。 4:<74B  
yVd}1bX  
Wr"-~PP  
为什么CPU会发热 A&_H%]{<:  
o= VzVg  
从含有1亿4000万个场效应晶体管FET的奔腾4到高达80多亿的Kabylake,Intel忠实的按照摩尔定律增加着晶体管的数目。这么多个FET随着每一次的翻转都在消耗者能量。一个FET的简单示意图如下: 9`kxyh</  
;w ";s$  
当输入低电平时,CL被充电,我们假设a焦耳的电能被储存在电容中。而当输入变成高电平后,这些电能则被释放,a焦耳的能量被释放了出来。因为CL很小,这个a也十分的小,几乎可以忽略不计。但如果我们以1GHz频率翻转这个FET,则能量消耗就是a × 10^9,这就不能忽略了,再加上CPU中有几十亿个FET,消耗的能量变得相当可观。  m~"<k d  
EGWm0 F_  
]5W|^%  
耗能和频率的关系 l<I.;FN^9@  
V'(yrz!   
从图示中,也许你可以直观的看出,能耗和频率是正相关的。这个理解很正确,实际上能耗和频率成线性相关。能耗关系公示是(参考资料2): rvjPm5[t  
K?0f)@\nx  
P代表能耗。C可以简单看作一个常数,它由制程等因素决定;V代表电压;而f就是频率了。理想情况,提高一倍频率,则能耗提高一倍。看起来并不十分严重,不是吗?但实际情况却没有这么简单。 4'JuK{/ A7  
我们这里要引入门延迟(Gate Delay)的概念。简单来说,组成CPU的FET充放电需要一定时间,这个时间就是门延迟。只有在充放电完成后采样才能保证信号的完整性。而这个充放电时间和电压负相关,即电压高,则充放电时间就短。也和制程正相关,即制程越小,充放电时间就短。让我们去除制程的干扰因素,当我们不断提高频率f后,过了某个节点,太快的翻转会造成门延迟跟不上,从而影响数字信号的完整性,从而造成错误。这也是为什么超频到某个阶段会不稳定,随机出错的原因。那么怎么办呢?聪明的你也许想到了超频中常用的办法:加压。对了,可以通过提高电压来减小门延迟,让系统重新稳定下来。 P)x&9OHV  
让我们回头再来看看公式,你会发现电压和功耗可不是线性相关,而是平方的关系!再乘以f,情况就更加糟糕了。我们提高频率,同时不得不提高电压,造成P的大幅提高!我们回忆一下初中学过的y=x^3的函数图: -Z )j"J  
4PG]L`J{  
Y在经过前期缓慢的提高后在a点会开始陡峭的上升。这个a就是转折点,过了它,就划不来了。功耗和频率的关系也大抵如此,我们看两个实际的例子: b*w izd  
i7-2600K频率和功耗的关系 ~/LO @  
Exynos频率和功耗的关系 Gkci_A*  
ARM和X86阵营来看,他们能耗曲线是不是和幂函数图很像? 0LX;Vvo  
m'D_zb9+  
Dizc#!IGU  
不可忽视的其他因素 ST'M<G%4E  
%D|p7&  
现实情况比这个更复杂。实际上,上面公式里的P只是动态能耗。CPU的整体功耗还包括短路功耗和漏电功耗: e= $p(  
?v8.3EE1\o  
短路功耗是在FET翻转时,有个极短时间会有电子直接跑掉。它和电压、频率正相关。 * S4IMfp  
漏电功耗是电子穿透MOSFET的泄漏情况,它和制程与温度有关。 apsR26\^  
综合这些,我们看一个实际的例子: \q9wo*A  
pC<~\RR  
这里的Transition Power就是动态能耗,可以看出它随着频率陡峭上升;短路功耗和频率几乎呈现线性关系;而Static power就是指漏电功耗,它也上升是因为频率上升导致温度上升,从而漏电加重。 %Wy$m?gD  
我们这里引入热密度的概念,即单位面积发出热的数量。从此图看出,随着频率的提高,各种因素综合叠加导致功耗上升严重,而芯片尺寸不变,从而热密度提高很快,现有散热设备短时间内排不出这么多热量,就会造成死机等现象。这也是为什么超频往往需要很好的散热设备的原因。 B:5\+_a!  
OxGKtnAjf  
!DgN@P.o  
一个脑洞 ._2#89V  
v eP)ElX  
我们最后开一个脑洞:假设没有散热问题,没有门延迟,一个完美的世界里,频率有上限吗?这是个很有意思的思考。大家都知道电信号在导线里的传播速度很快,接近光速。我们这里就取光速:每秒30万公里。相信每个略微了解相对论的人都知道光速是物理极限,我们这里不讨论科幻问题。因为没有门延迟,电信号以光速传播。光速,这个数字很大,但我们的频率可是以G为单位,就是10^9,也非常大。在1GHz的情况下,电信号只能传播30cm!10GHz的话,才能传播3cm。晶圆大小是300mm,如果我们做出个和它一样大的CPU,也许最高频率只有1GHz。而现在CPU的die大小差不多1cm,所以理论上30GHz是极限频率! UYJMW S=  
(这里超级简化很多条件,权作脑洞。) .f)&;Af^  
t"[ xx_i  
rN0G|  
结论  l* C>  
8Mx+tA  
经由液氮制冷的加持,CPU的频率在极限玩家的帮助下才能挑战9GHz。这对于我们日常电脑用户来说十分遥远,在可以预见的未来,CPU频率因为热密度的关系并不会大幅提高,我们可能永远也看不到10GHz的硅基CPU。也许只有在抛弃硅或者转换到量子计算,CPU频率才会有翻天覆地的变化。 D; xRgHn  
这并不意味着CPU效能的止步不前,实际上目前的CoffeeLake 3.8G的CPU相比奔腾4的3.8G,Benchmark跑下来效能提高了十几倍,而功耗反倒下降不少!这全拜改进架构的福。在吸取了基于netburst深度流水来提高主频,却被“誉为”高频低能的奔腾4教训后,这也是Intel等芯片制造商努力的方向。 WE;QEA/  


评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

一般

差劲
离线eyangbo

性别:
帅哥
发帖
1026
金币
570
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看该作者 1楼 发表于: 2017-11-14
不错了


快速回复
限150 字节
 
上一个 下一个