[技术讨论]CPU的频率止步于4G，我们触到频率天花板了吗？ [复制链接]

上一主题下一主题查看指定楼层

离线shuszhao

三级逆天

性别:: 帅哥

发帖: 18006

金币: 36403

提示：会员销售的附件,下载积分 = 版块积分 + 销售积分只看楼主倒序阅读使用道具 0楼发表于: 2017-11-13

W6f?/{Oo8

想要提高CPU的运算效能，不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频，让CPU每个内核更快的算出结果呢？为什么持CPU制程牛耳的Intel，不再勇攀主频高峰了呢？
回首2004年，Intel雄心勃勃，宣布代码为Prescott超长流水线的奔腾4将会发布4GHz主频CPU，但最后结果是因为种种原因止步于3.8GHz。其后主频不进反退，直到到代号Haswell的酷睿4代(4790K)才真正站上4GHz，继任的broadwell, Skylake, Kabylake和Coffeelake对频率提高又变得无所作为。时间走过了十几年，为什么CPU主频不能继续提高呢？究竟发生了什么？我们是不是已经顶到频率天花板了呢？
我们知道，想要提高CPU的运算效能，不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频，让CPU每个内核更快的算出结果呢？为什么持CPU制程牛耳的Intel，不再勇攀主频高峰了呢？其实，瓶颈主要在于散热，我们来详细了解一下个中原因。

为什么CPU会发热

从含有1亿4000万个场效应晶体管FET的奔腾4到高达80多亿的Kabylake，Intel忠实的按照摩尔定律增加着晶体管的数目。这么多个FET随着每一次的翻转都在消耗者能量。一个FET的简单示意图如下：

当输入低电平时，CL被充电，我们假设a焦耳的电能被储存在电容中。而当输入变成高电平后，这些电能则被释放，a焦耳的能量被释放了出来。因为CL很小，这个a也十分的小，几乎可以忽略不计。但如果我们以1GHz频率翻转这个FET，则能量消耗就是a × 10^9，这就不能忽略了，再加上CPU中有几十亿个FET，消耗的能量变得相当可观。

耗能和频率的关系

从图示中，也许你可以直观的看出，能耗和频率是正相关的。这个理解很正确，实际上能耗和频率成线性相关。能耗关系公示是(参考资料2)：

P代表能耗。C可以简单看作一个常数，它由制程等因素决定；V代表电压；而f就是频率了。理想情况，提高一倍频率，则能耗提高一倍。看起来并不十分严重，不是吗？但实际情况却没有这么简单。
我们这里要引入门延迟（Gate Delay）的概念。简单来说，组成CPU的FET充放电需要一定时间，这个时间就是门延迟。只有在充放电完成后采样才能保证信号的完整性。而这个充放电时间和电压负相关，即电压高，则充放电时间就短。也和制程正相关，即制程越小，充放电时间就短。让我们去除制程的干扰因素，当我们不断提高频率f后，过了某个节点，太快的翻转会造成门延迟跟不上，从而影响数字信号的完整性，从而造成错误。这也是为什么超频到某个阶段会不稳定，随机出错的原因。那么怎么办呢？聪明的你也许想到了超频中常用的办法：加压。对了，可以通过提高电压来减小门延迟，让系统重新稳定下来。
让我们回头再来看看公式，你会发现电压和功耗可不是线性相关，而是平方的关系！再乘以f，情况就更加糟糕了。我们提高频率，同时不得不提高电压，造成P的大幅提高！我们回忆一下初中学过的y=x^3的函数图：

Y在经过前期缓慢的提高后在a点会开始陡峭的上升。这个a就是转折点，过了它，就划不来了。功耗和频率的关系也大抵如此，我们看两个实际的例子：

i7-2600K频率和功耗的关系

Exynos频率和功耗的关系
从ARM和X86阵营来看，他们能耗曲线是不是和幂函数图很像？

不可忽视的其他因素

现实情况比这个更复杂。实际上，上面公式里的P只是动态能耗。CPU的整体功耗还包括短路功耗和漏电功耗：

短路功耗是在FET翻转时，有个极短时间会有电子直接跑掉。它和电压、频率正相关。
漏电功耗是电子穿透MOSFET的泄漏情况，它和制程与温度有关。
综合这些，我们看一个实际的例子：

这里的Transition Power就是动态能耗，可以看出它随着频率陡峭上升；短路功耗和频率几乎呈现线性关系；而Static power就是指漏电功耗，它也上升是因为频率上升导致温度上升，从而漏电加重。
我们这里引入热密度的概念，即单位面积发出热的数量。从此图看出，随着频率的提高，各种因素综合叠加导致功耗上升严重，而芯片尺寸不变，从而热密度提高很快，现有散热设备短时间内排不出这么多热量，就会造成死机等现象。这也是为什么超频往往需要很好的散热设备的原因。

一个脑洞

我们最后开一个脑洞：假设没有散热问题，没有门延迟，一个完美的世界里，频率有上限吗？这是个很有意思的思考。大家都知道电信号在导线里的传播速度很快，接近光速。我们这里就取光速：每秒30万公里。相信每个略微了解相对论的人都知道光速是物理极限，我们这里不讨论科幻问题。因为没有门延迟，电信号以光速传播。光速，这个数字很大，但我们的频率可是以G为单位，就是10^9，也非常大。在1GHz的情况下，电信号只能传播30cm！10GHz的话，才能传播3cm。晶圆大小是300mm，如果我们做出个和它一样大的CPU，也许最高频率只有1GHz。而现在CPU的die大小差不多1cm，所以理论上30GHz是极限频率！
（这里超级简化很多条件，权作脑洞。）

结论

经由液氮制冷的加持，CPU的频率在极限玩家的帮助下才能挑战9GHz。这对于我们日常电脑用户来说十分遥远，在可以预见的未来，CPU频率因为热密度的关系并不会大幅提高，我们可能永远也看不到10GHz的硅基CPU。也许只有在抛弃硅或者转换到量子计算，CPU频率才会有翻天覆地的变化。
这并不意味着CPU效能的止步不前，实际上目前的CoffeeLake 3.8G的CPU相比奔腾4的3.8G，Benchmark跑下来效能提高了十几倍，而功耗反倒下降不少！这全拜改进架构的福。在吸取了基于netburst深度流水来提高主频，却被“誉为”高频低能的奔腾4教训后，这也是Intel等芯片制造商努力的方向。