论坛风格切换切换到宽版
发帖 回复
返回列表  提醒:不能用迅雷等P2P下载,否则下载失败标(二级)的板块,需二级才能下载,没二级不要购买,下载不了
  • 1074阅读
  • 1回复

[技术讨论]CPU的频率止步于4G,我们触到频率天花板了吗? [复制链接]

上一主题 下一主题
在线shuszhao
 

性别:
帅哥
发帖
18038
金币
36453
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看楼主 倒序阅读 使用道具 0楼 发表于: 2017-11-13
cyI:dvg  
sR$/z9w  
<ou=f'  
AeW_W0j  
O;#0Yg  
Xpmi(~n  
 OF( tCK  
 ixF  
    MWn []'TpH  
C9`x"$  
f[$Z<:D-ve  
c/G^}d%  
想要提高CPU的运算效能,不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频,让CPU每个内核更快的算出结果呢?为什么持CPU制程牛耳的Intel,不再勇攀主频高峰了呢? ;q2e[y  
回首2004年,Intel雄心勃勃,宣布代码为Prescott超长流水线的奔腾4将会发布4GHz主频CPU,但最后结果是因为种种原因止步于3.8GHz。其后主频不进反退,直到到代号Haswell的酷睿4代(4790K)才真正站上4GHz,继任的broadwell, Skylake, Kabylake和Coffeelake对频率提高又变得无所作为。时间走过了十几年,为什么CPU主频不能继续提高呢?究竟发生了什么?我们是不是已经顶到频率天花板了呢? t(- 5l  
我们知道,想要提高CPU的运算效能,不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频,让CPU每个内核更快的算出结果呢?为什么持CPU制程牛耳的Intel,不再勇攀主频高峰了呢?其实,瓶颈主要在于散热,我们来详细了解一下个中原因。 Zu^J X/um  
}RkD7  
eJZt&|7N  
为什么CPU会发热 ,09d"7`X  
|H-zm&h>'  
从含有1亿4000万个场效应晶体管FET的奔腾4到高达80多亿的Kabylake,Intel忠实的按照摩尔定律增加着晶体管的数目。这么多个FET随着每一次的翻转都在消耗者能量。一个FET的简单示意图如下: izP>w*/nO  
;e ^`r;]  
当输入低电平时,CL被充电,我们假设a焦耳的电能被储存在电容中。而当输入变成高电平后,这些电能则被释放,a焦耳的能量被释放了出来。因为CL很小,这个a也十分的小,几乎可以忽略不计。但如果我们以1GHz频率翻转这个FET,则能量消耗就是a × 10^9,这就不能忽略了,再加上CPU中有几十亿个FET,消耗的能量变得相当可观。 VQ`a-DL  
nx`I9j\  
)}R w@70L-  
耗能和频率的关系 :]IY w!_-p  
p GSS   
从图示中,也许你可以直观的看出,能耗和频率是正相关的。这个理解很正确,实际上能耗和频率成线性相关。能耗关系公示是(参考资料2): >z69r0)>  
G(7WUMjl  
P代表能耗。C可以简单看作一个常数,它由制程等因素决定;V代表电压;而f就是频率了。理想情况,提高一倍频率,则能耗提高一倍。看起来并不十分严重,不是吗?但实际情况却没有这么简单。 Hz3KoO &  
我们这里要引入门延迟(Gate Delay)的概念。简单来说,组成CPU的FET充放电需要一定时间,这个时间就是门延迟。只有在充放电完成后采样才能保证信号的完整性。而这个充放电时间和电压负相关,即电压高,则充放电时间就短。也和制程正相关,即制程越小,充放电时间就短。让我们去除制程的干扰因素,当我们不断提高频率f后,过了某个节点,太快的翻转会造成门延迟跟不上,从而影响数字信号的完整性,从而造成错误。这也是为什么超频到某个阶段会不稳定,随机出错的原因。那么怎么办呢?聪明的你也许想到了超频中常用的办法:加压。对了,可以通过提高电压来减小门延迟,让系统重新稳定下来。 k /lDE  
让我们回头再来看看公式,你会发现电压和功耗可不是线性相关,而是平方的关系!再乘以f,情况就更加糟糕了。我们提高频率,同时不得不提高电压,造成P的大幅提高!我们回忆一下初中学过的y=x^3的函数图: C?VNkBJ>\  
^e WD4Vp|4  
Y在经过前期缓慢的提高后在a点会开始陡峭的上升。这个a就是转折点,过了它,就划不来了。功耗和频率的关系也大抵如此,我们看两个实际的例子: 1bJrEXHXy  
i7-2600K频率和功耗的关系 |jyoT%SQ  
Exynos频率和功耗的关系 xw&N[ y5  
ARM和X86阵营来看,他们能耗曲线是不是和幂函数图很像? !qVnziE,,  
[5Pin>]z  
g%f6D%d)A  
不可忽视的其他因素 .t|B6n!  
6"Rw&3D?  
现实情况比这个更复杂。实际上,上面公式里的P只是动态能耗。CPU的整体功耗还包括短路功耗和漏电功耗: 7 a_99? J  
Ln5g"g8gb%  
短路功耗是在FET翻转时,有个极短时间会有电子直接跑掉。它和电压、频率正相关。 A<s9c=d6  
漏电功耗是电子穿透MOSFET的泄漏情况,它和制程与温度有关。 nJ~5ICyd  
综合这些,我们看一个实际的例子: S -KHot ?  
qEV>$>}  
这里的Transition Power就是动态能耗,可以看出它随着频率陡峭上升;短路功耗和频率几乎呈现线性关系;而Static power就是指漏电功耗,它也上升是因为频率上升导致温度上升,从而漏电加重。 5IiZnG u  
我们这里引入热密度的概念,即单位面积发出热的数量。从此图看出,随着频率的提高,各种因素综合叠加导致功耗上升严重,而芯片尺寸不变,从而热密度提高很快,现有散热设备短时间内排不出这么多热量,就会造成死机等现象。这也是为什么超频往往需要很好的散热设备的原因。 IH~[/qNk  
$y+Bril5W  
_+2Jc}Yf  
一个脑洞 Q !G^CG  
g\lEdxm6Sj  
我们最后开一个脑洞:假设没有散热问题,没有门延迟,一个完美的世界里,频率有上限吗?这是个很有意思的思考。大家都知道电信号在导线里的传播速度很快,接近光速。我们这里就取光速:每秒30万公里。相信每个略微了解相对论的人都知道光速是物理极限,我们这里不讨论科幻问题。因为没有门延迟,电信号以光速传播。光速,这个数字很大,但我们的频率可是以G为单位,就是10^9,也非常大。在1GHz的情况下,电信号只能传播30cm!10GHz的话,才能传播3cm。晶圆大小是300mm,如果我们做出个和它一样大的CPU,也许最高频率只有1GHz。而现在CPU的die大小差不多1cm,所以理论上30GHz是极限频率! @a}jnl(2  
(这里超级简化很多条件,权作脑洞。) uu+)r  
* k ^?L  
?mJ&zf|B8  
结论 #Vi:-zyY  
u~q6?*5  
经由液氮制冷的加持,CPU的频率在极限玩家的帮助下才能挑战9GHz。这对于我们日常电脑用户来说十分遥远,在可以预见的未来,CPU频率因为热密度的关系并不会大幅提高,我们可能永远也看不到10GHz的硅基CPU。也许只有在抛弃硅或者转换到量子计算,CPU频率才会有翻天覆地的变化。 lr_c  
这并不意味着CPU效能的止步不前,实际上目前的CoffeeLake 3.8G的CPU相比奔腾4的3.8G,Benchmark跑下来效能提高了十几倍,而功耗反倒下降不少!这全拜改进架构的福。在吸取了基于netburst深度流水来提高主频,却被“誉为”高频低能的奔腾4教训后,这也是Intel等芯片制造商努力的方向。 :LEC[</yvl  


评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

一般

差劲
离线eyangbo

性别:
帅哥
发帖
1026
金币
570
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看该作者 1楼 发表于: 2017-11-14
不错了


快速回复
限150 字节
 
上一个 下一个