0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

酷睿13/14代台式机CPU“缩缸”问题已解决:全面解析+解决方案

looger123 来源:looger123 作者:looger123 2024-09-28 11:01 次阅读

过去这几个月,Intel酷睿13/14代台式机处理器的“缩缸”事件可谓沸沸扬扬。借着Intel发布终极声明的机会,我们尝试对该事件做个盘点、总结和分析。

电子工程专辑虽然并没有全线追Intel酷睿13/14代台式机处理器所谓的“缩缸”事件,不过此事还是在PC行业造成了相当影响的,也算是此前大半年Intel负面新闻不断的佐料之一了。

此事件最早可以追溯到今年上半年。部分用户和企业机构反应,酷睿13/14代处理器存在不稳定的情况,可能在高频点或高负载下,出现死机、蓝屏等现象。部分媒体对“缩缸”的定义是,处理器“体质缩水”,表现为CPU需要更高的电压才能维持稳定运行。

因为最近Intel就此事件发布了应该算是终极声明和最终解决方法。趁此机会,本文总结性质地谈谈事件前因后果——如果你也恰巧在用受影响的处理器,那么也能了解该怎么应对这波问题;顺便聊聊我们对其中问题的看法。

“缩缸”事件前因后果

受到该事件影响的处理器,主要包括面向台式机的酷睿13/14代i9和i7(也有说i5受影响的,只不过可能i5及更低型号发生问题的概率较低)——典型型号带K(如酷睿i9-14900K,酷睿i7-13700KF等),也就是核心数更多、频率更高、可承载更高功耗的那一波。

未有笔记本CPU产品受影响的记录。Intel也在声明中强调了,除酷睿13/14代台式机处理器外,没有发现其他处理器产品受到该问题的影响。

这个问题持续发酵,可能有两个关键点:一是前两个月,部分13/14代酷睿处理器的游戏玩家,在初次启动某些游戏,进行shader编译时,发生编译失败的情况——这是典型的CPU高负载场景;另一,则是部分游戏公司及媒体下场研究和谈论13/14代酷睿处理器可能存在的问题。

Intel在此期间给出了多轮回应,也相继发布了一些BIOS更新尝试解决问题——包括锁PL2、控制CPU的运行电压、修复eTVB问题等策略...6月份,Intel提到会在7月底公布调查结果和解决方案。7月末我们也收到了Intel的官方声明,提及经过调查分析发现,“确定是过高的运行电压导致部分13/14代酷睿处理器出现不稳定情况”。

“...过高的运行电压由微代码算法造成,而该算法向处理器发送了错误的电压请求。”声明中还提到Intel会提供微代码补丁修复过高电压导致的根本问题。

8月份,Intel发布了针对酷睿13/14代台式机处理器的0x129微码更新。这份更新声明中提到,分析发现跨多核的Vmin(最小运行电压)因为升高的电压而大幅提升。升高电压事件(elevatedvoltageevents)随时间累积,就会致使Vmin提升。所以0x129微码更新限制了电压请求,缓解处理器的不稳定。

不过当时Intel仍然提到了还在做持续调查分析,主要是那些会发生Vmin偏移的场景。同期Intel针对受影响处理器提供了延保服务,后文也会进一步提到。

上面这些应该是绝大部分关注此事件的读者,对此的主流认知。不过这次发布的“终极声明”还是言简意赅地给出了事件全貌的,下面尝试仔细研读。

终极声明中导致不稳定的“根因”

最近Intel发布有关此事件的终极声明将此问题称为“VminShiftInstability”(最低运行电压偏移),基于上述解释应该就很好理解了:即Vmin偏移所致的处理器及系统不稳定——这个名称也算得上是一种总结归因。

一般我们说Vmin是处理器能够运行在100%稳定状态的最小电压。“Vminshift”应该是从6月份以来,所有问题的最终呈现;当然“Instability”不稳定,就是用户感受到的结果了。

在这份终极声明中,Intel认为,“VminShiftInstability”的根本原因是“IA内核内的时钟树电路”(aclocktreecircuitwithintheIAcore),“其在升高的电压和温度下容易受到可靠性老化的影响”。“这些情况会导致时钟的占空比偏移和系统不稳定(dutycycleshiftoftheclocksandobservedsysteminstability)”

所谓的时钟树电路,我们也问了一下Copilot,解释是系统或硬件设计中的时钟分布网络。而所谓的时钟分布网络(clockdistributionnetwork),本身是数字电路中的一个系统,提供从中央源到电路各部分的时钟信号

要打比方的话,可以将clockdistribution想象成一棵树,树根就是时钟源(如晶振),时钟信号通往电路的不同组成部分——这个路径也就是树枝;树叶就是最终目的地。时钟分布的目标是确保时钟信号能够同时抵达电路的各部分,最小化延迟和变量。此过程中有好几个关键部件合作,确保时钟信号的准确传递。

从Intel的声明来看,Vminshift问题就与处理器核心内的某时钟树电路有关,该电路在升高的电压和温度下,会发生可靠性下降。随后Intel又说,上述情况会导致“时钟的占空比偏移和系统不稳定”。这里的“时钟的占空比偏移”(dutycycleshiftoftheclock)咋理解呢?

时钟信号的dutycycle,指的应该是时钟信号激活状态下的周期。而dutycycleshift也就是该周期的偏移和变化。比如说,如果dutycycle从50%偏移到60%,整体也就影响到了系统的时序和同步。最终导致了不稳定。(理解差不多就是这样,若Copilot存在模型幻觉或者我们理解有偏差,欢迎各位同学留言指正...

除了这,还原一下问题全貌

基于对这份声明的理解,上述根因应当是导致VminShift的核心原因。不过实际上,在过去几个月间,基于先后发布的多个缓解方案,Intel对于酷睿13/14代台式机处理器不稳定问题有4个阶段的研究和结果公布。

故此,终极声明中,Intel也总结性地回顾了导致VminShift的4个运行场景。前3个问题,在此之前已经修复;而最后一阶段,也是Intel在此次声明中提及、本文前述的“根因”,并着手解决了由此带来的另一个问题。下面就针对这4个阶段或场景,一一谈一谈。

其一是主板供电设置“超出Intel建议设置”——这也是最早Intel在回应该问题时给出的说法。主板厂商的BIOS设定中,可能出厂就解锁PL2、自动超频,或者有各种核心性能强化方案,而没有采用Intel的建议设置:比如之前测过的华硕主板,普遍自带“多核心增强”选项。这里面可能就有增压方案。

wKgZomb4roeAG5w7AAK52NEXwBA292.png

不过我们认为这也合理,尤其旗舰主板市场竞争,谁都希望自家主板能跑出更好看的成绩——在这种情况下,主板厂商都不得不卯足劲儿尝试榨干处理器的每一点性能余量。且这一点可能也佐证了,部分媒体对于Intel酷睿13/14代台式机CPU“出厂即灰烬”的说法。即Intel留给主板厂商的可操作余量其实不及以前那么多。

所以针对这一场景的缓解措施建议,就是在主板BIOS设置中采用IntelDefaultSettings默认设置。

其二,“高温下,eTVB微代码算法”仍然允许酷睿13/14代i9台式机处理器运行在更高性能状态下。eTVB的全称是“EnhancedThermalVelocityBoost”。

对Intel酷睿处理器比较熟悉的读者应该知道,TVB是香港的一家电视台...是Intel于2018年引入的一项威廉希尔官方网站 ,官方文档解释说是当散热和功耗预算仍有空间的情况下,释放CPU额外的性能。一般认为,TVB是一种官超方案,可基于某些负载,进一步提升睿频频率,对游戏之类的应用相当有价值。

Intel此前对该问题的描述是eTVB可能错误计算了频率限制,让处理器(高温下仍)可在高频状态下运行。简单来说,也就是相关于eTVB的某个微码算法出现错误数值。6月份,Intel就发布了0x125微码更新,解决该问题。

wKgaomb4rm6AfuJaAAHb-fokUX0965.png

其三,“频繁和持续请求高电压的微代码SVID算法可能导致最低运行电压偏移”(MicrocodeSVIDalgorithmrequestinghighvoltagesatafrequencyanddurationwhichcancauseVminshift)...

首先所谓的“微代码SVID算法”(microcodeSVIDalgorithm)当然就是处理器微码的一部分,对应算法用于管理和请求处理器的电压,确保针对不同性能状态给出正确的电压。在基于负载和运行状态调节电压的问题上,它对于维持处理器稳定和高效还是比较关键的。

这句话的英文表意,应该是指基于某种模式的高电压请求(不管这里的frequency指的是核心频率,还是请求高电压的操作频率),会导致Vminshift。今年8月,Intel在发现该问题后发布了微码0x129更新,“解决了处理器请求更高电压的问题”。

其四,就是这次终极的微码0x12B更新,尝试解决“微代码和BIOS代码请求升高的核心电压可能会导致最低运行电压偏移,特别是在空闲和/或轻度活动期间”,应当也是伴随前文提到的“根因”分析,所做的终极更新,“解决处理器在空闲和/或轻度活动期间的电压升高需要”。值得一提的是,0x12B也包含前述0x125与0x129更新。

从声明来看,现阶段Intel“正与合作伙伴共同努力,以推出相关的BIOS更新”。主板厂商应该会在后续几周发布对应的BIOS更新。

解决方案,及一点想法和建议

另外,Intel也在声明中提到,实测微码补丁并不会对处理器性能产生多大程度的影响(performanceimpactiswithinrun-to-runvariation)。所以对于正在使用酷睿13/14代台式机处理器的用户而言,当前要做的首先就是去主板厂商的官网看看,是否有对应0x12B微码更新的BIOS版本发布,并做及时更新。

但也需要明确,即如果使用的这些受影响的处理器长期处在Vminshift问题状态下,则过高的电压最终会让CPU及早走向老化。长期高温高压芯片寿命会产生影响,算是个常识。

说具体些,如高压会提升金属互联层的电流密度,长期致电迁移问题;还有所谓的HotCarrierInjection热载流子注入会降低晶体管性能;高温随时间持续,导致PMOS晶体管的阈值电压偏移;以及TDDB电介质随时间变化击穿等等...

所以在保修政策方面,Intel也宣布“为受不稳定问题影响的英特尔酷睿第13/14代盒装/散装台式机处理器延长2年保修期”。已经出现不稳定问题(典型如碰到游戏shader编译过程崩溃问题)的用户,应当考虑申请售后。

wKgZomb3czSAXsp4ABia-yNNado455.png

最后谈一点我们自己的想法。前两个月正值缩缸问题影响最盛之时,我们就猜测,应当是处理器过高的默认电压致不稳定问题发生。主板厂商则在该问题的基础上,基于对极限性能的渴求,又“助推”了一把。所以前期某些仅锁定最高功率的做法,并不能解决问题。

部分使用undervolting方法来降压超频的用户也反应,他们并没有遭遇处理器不稳定问题。感觉这也应当佐证了高温高压是关键。

虽然不清楚,这次公布的根因(核心内的时钟树电路在升高的电压和温度下,发生时钟dutycycle偏移),作为Vminshift的根本原因,与此前包括eTVB,SVID微码算法错误在内的问题,具体是什么样的逻辑关系(猜测可能是微码bug导致根因所致的Vminshift问题进一步恶化,放大了问题),但长期跑在高温高压状态,无疑就是不稳定的问题关键所在。

这段故事落下帷幕,大概也能表现当代芯片设计的变量之多、复杂性提升的现状。EDA厂商过去这段时间的理念宣导,及他们所说的新市场机会,看起来还的确是那么回事…

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    9953

    浏览量

    171700
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10855

    浏览量

    211606
收藏 人收藏

    评论

    相关推荐

    被曝工艺缺陷?英特尔13/14CPU崩溃!官方回应:电压异常

    电子发烧友网报道(文/梁浩斌)上周,海外知名科技频道Gamers Nexus曝光英特尔1314
    的头像 发表于 07-29 00:47 1.1w次阅读
    被曝工艺缺陷?英特尔<b class='flag-5'>13</b>/<b class='flag-5'>14</b><b class='flag-5'>代</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>CPU</b>崩溃!官方回应:电压异常

    英特尔发布Ultra 200S系列台式机处理器

    近日,英特尔正式推出了Ultra 200S系列处理器家族,为台式机平台带来了全新的AI PC功能。此次发布的处理器家族涵盖了5款未锁频的台式机处理器,其中包括备受瞩目的英特尔
    的头像 发表于 10-11 17:36 493次阅读

    服务器cpu台式机cpu区别

    服务器CPU台式机CPU的区别是一个复杂的话题,涉及到多个方面,包括设计、性能、功耗、可靠性、成本等。 服务器CPU台式机
    的头像 发表于 10-10 15:12 1146次阅读

    龙芯中科胡伟武:3B6600 八核桌面 CPU 性能将达到英特尔中高端 12~13 水平

    英特尔公司 Xeon 4314 和 6338。 胡伟武预告,龙芯当前正在研制的 3B6600 八核桌面 CPU 使用成熟工艺 预计单核 / 多核性能可以达到使用先进工艺的中高端 12~13
    发表于 08-13 11:16

    Intel:13/14补丁几乎无损性能!未来所有产品都安全

    快科技8月9日消息,Intel官方宣布,正在向各大OEM、ODM厂商发放0x129版本的微代码补丁,解决在13/14
    的头像 发表于 08-12 10:37 431次阅读
    Intel:<b class='flag-5'>13</b>/<b class='flag-5'>14</b><b class='flag-5'>代</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b>补丁几乎无损性能!未来所有产品都安全

    AMD全新Ryzen 9000 Zen 5台式机CPU爆料:温度和功耗更低

    在科技日新月异的今天,AMD再次凭借其强大的研发实力,为我们带来了下一Ryzen 9000 “Zen 5”台式机CPU的革新。根据知名科技媒体WccFtech的独家报道,这款备受期待的处理器不仅
    的头像 发表于 06-29 15:33 914次阅读

    集特国“芯”商务台式机

    台式机
    jf_10805031
    发布于 :2024年05月13日 15:19:39

    集特智能商务台式机GPC-160

    买国产计算机找集特智能 集特商务台式机GPC-160,这款机型的亮点我今天来给大家一一介绍 首先 160支持海光龙芯申威兆芯五大国产平台的MICRO ATX版型----一五个平台(可以凑齐5颗灵珠
    的头像 发表于 05-09 15:13 324次阅读
    集特智能商务<b class='flag-5'>台式机</b>GPC-160

    1314i9系列高端CPU游戏崩溃问题引发关注

    4 月 10 日讯,亚马逊 ZDNet Korea 报告指出,近期多名电脑用户在采用英特尔第 1314 i9 高端处理器玩游戏
    的头像 发表于 04-10 10:08 2152次阅读

    英特尔14处理器i9-14900KS正式发布

    近日,英特尔再次引领行业潮流,发布了备受瞩目的英特尔®™第14处理器i9-14900KS的完整规格和上市信息。这款台式机处理器无疑为众
    的头像 发表于 03-16 09:29 1173次阅读

    英特尔发布面向发烧友和主流用户的移动、台式机和边缘处理器

    全新英特尔HX和U系列移动处理器为发烧友级和主流的移动系统带来了强大的英特尔平台,并为主流台式机和边缘系统扩展了产品组合。
    的头像 发表于 01-13 10:17 922次阅读

    14亮相!华硕天选5 Pro新配置开售,比13贵500元值吗

    了。而此前华硕天选5 Pro系列的“神秘配置”也已经揭开面纱,配备RTX4060独显、升级到14的游戏本售价8999元起,这价格你觉得怎么样?          再来说说配置。此
    的头像 发表于 01-12 17:42 728次阅读
    <b class='flag-5'>14</b><b class='flag-5'>代</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b>亮相!华硕天选5 Pro新配置开售,比<b class='flag-5'>13</b><b class='flag-5'>代</b>贵500元值吗

    AMD全新的锐龙8000G系列台式机处理器介绍

    在PC芯片方面,AMD则带来了全新的锐龙8000G系列台式机处理器,它是AMD首款同时集成RDNA 3高性能图形核心、Ryzen AI NPU,基于Zen 4架构的新一台式机APU。
    发表于 01-12 10:12 1184次阅读
    AMD全新的锐龙8000G系列<b class='flag-5'>台式机</b>处理器介绍

    14HX处理器+RTX 4090游戏本测评

    最近,各家游戏本厂商都在不断预热搭载第14英特尔HX处理器的游戏本新品,坊间还有爆料称英特尔将为第14
    的头像 发表于 01-10 10:59 2083次阅读
    第<b class='flag-5'>14</b><b class='flag-5'>代</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b>HX处理器+RTX 4090游戏本测评

    Intel 14非K系列型号即将发布

    首批六款K系列型号之后,Intel将在2024年1月7日,也就是大战期间,正式解禁14的非K系列型号。
    的头像 发表于 12-28 10:56 1499次阅读
    Intel <b class='flag-5'>14</b><b class='flag-5'>代</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b>非K系列型号即将发布