教育培训 > CPU里都有几十亿个晶体管,万一坏掉几个还能用吗?

CPU里都有几十亿个晶体管,万一坏掉几个还能用吗?

2020-08-09 10:06阅读(128)

CPU里都有几十亿个晶体管,万一坏掉几个还能用吗?:在悟空问答上的318个问题,只写接地气的科技内容,欢迎关注。CPU,目前人类能够制造的集成度最高的设备,单位

1

在问答上的318个问题,只写接地气的科技内容,欢迎关注。


CPU,目前人类能够制造的集成度最高的设备,单位按照纳米计数,坏掉几个如果就不能用的话,难免也太鸡肋了对吧?实际上如今芯片的制造技术已经相当成熟,有各种各样的方式来避免生产上的硬件错误以及出现错误之后的解决方案:

材料与制造的严谨

首先说生产设备,一旦涉及集成电路,无论是处理器、存储芯片、相机传感器,都需要使用到“光刻机”这个东西,技术有多先进呢?如今能够掌握光刻机技术的国家除了欧美日韩这些发达国家,只剩下中国(比航天、核能掌握的范围还要小)。世界上顶级的光刻机生厂商只有三家:欧洲的ASML、日本的尼康和佳能,很多人说尼康佳能是买相机赚钱的,一台光刻机价格可以到上亿美元,相机这种东西只是副业(手动狗头)。

其次是生产原料,虽然说未来科技发展的核心材料是石墨烯,但是目前还是以多晶硅为主导,想要将多晶硅材料通过光刻机拼成具有规则逻辑的电路,那就需要确保原材料的纯度,目前人类能够造出来最纯的硅材料是12个9(99.9999999999%),过去我们使用在收音机、电视上的芯片,使用的多晶硅纯度至少是6个9,如今使用在手机、电脑这样的芯片中的硅材料,纯度是11个9。(对比起来所谓999纯金算什么......)

最后是生产环节,为了确保不出错误,首先对于样板的打磨(流片)就要3-5次,每次耗时2-3个月,举个例子就是电影《无双》里面,郭富城和周润发为了做出顶级的假币,光是刻板就花了很长的时间,不断修改,最终才能做出与真币一模一样的母版。其次还有工厂的密封,一粒灰尘都不能有,而且建筑周围不能有震动产生,如果修在公路旁边,一辆车开过去引起的细小震动,都可能使加工出的流片出现问题。

错误之后的解决方案

即便大家想尽一切办法确保制造环节不出错误,但是并不可能做到百分之百的完美,始终还是会有问题出现,会留下瑕疵,比如说虽然硅原料的纯度很高,达到了11个9,也就是百亿个硅原子中会夹杂着1个其它原子,看起来应该根本不用担心了。但是,我们考虑极端情况,万一好死不死,整个母片上就是有那么几个其它原子分布在一个区域里面,那肯定就会出现问题了。出现问题,就需要想办法解决了。

如果是比较小的问题,比如说A组块其中的一部分出现问题失效了,那么控制器会记录下这部分的地址,以后不再给这部分通电,但是不会影响整个组块的使用,这种方案在存储芯片上使用较多,比如一个班有1个人得流感了,但是不可能整个班都不上课了是吧。

如果是比较大的问题,比如说A组块中大部分晶体管都出现了异常问题,那么整个A组块都会被停用,比如一个班有一半人得了流感,那这个班不仅仅是听课,还要全体停课隔离观察。但是这样缺失的A组谁来替代呢?芯片设计上都会留有冗余结构,就是用来顶替这个问题的。


最最极端情况,霉到家了,影响到了整个核心的运作怎么办?那就最简单了,把这个核心关掉不就好了,嗯.......八核心处理器关掉两个不就是六核心处理器么;四核心关掉两个不就是双核心么?坦率的讲,你以为英特尔i7、i5、i3这种级别分类是怎么来的(开个玩笑,哈哈哈)

2

这么多答案,没有几个回答正确的,因为这个还是有专业门槛的,答案如下:

第一:如果有几个晶体管(mos)坏掉,不同芯片的结果会不一样,例如逻辑芯片一般都会挂掉;但是存储芯片一般就还好由于有冗余(mos)存在

第二,对于这种情况,同一芯片不同功能模块的结果也不一样,以CPU来说,如果发生在功能模块区,如果有一个mos坏掉,这个CPU就一定有某个功能失效,严重的甚至整体功能都会失效(例如短路了);如果发生在存储缓存区,看情况而言,可能没事,可能有事

第三:正因为一个晶体管坏掉就会导致整个芯片都有可能挂掉,集成电路生产才会要求洁净度要求极高的超净间,才有时时刻刻都在的生产流水线监控(比一般汽车生产什么的流水线要求高太多),才有各种前中后段测试,避免瑕疵品

这也是最体现一个公司生产制造能力的指标:

生产线良率!

我们在这块离全球最强竞争对手还差距很大

3

其实你用的CPU里面可能从买来就不是完整的芯片,因为CPU在生产制造过程中会有一定的良品率,也就是说在晶圆制造和切割阶段就可能有或多或少的瑕疵,这些瑕疵就是损坏的晶体管,但是这些晶体管损坏不一定影响芯片的正常运作,只要把相关的线路和晶体管切断整个芯片还是可以正常工作的。

我们平常看到的8核心、6核心乃至4核心CPU本身可能是同一块晶圆上生产的,但是有些8核CPU可能有两颗有瑕疵,那么就可以屏蔽掉坏掉的核心,直接降价当作6核心或4核心CPU来使用。包括CPU上的缓存部分如果有损坏也是可以通过屏蔽来解决的,当然,如果CPU的关键部分出现问题那么就会直接抛弃,无法使用了。

而对于正式出厂的CPU来说,正常使用中一般是很难损坏的,即使有个别的晶体管坏掉也要看是不是亢余电路的晶体管,或者某些功能部分的晶体管,有的可能影响缓存的性能,有的可能影响内存侦测,但只要不是关键位置和功能的晶体管CPU就仍然可以使用。此外,晶体管怕高温,但是现在的CPU都有高温保护机制,如果温度过高会自动切断电源,但是如果对于短路或者其它原因烧毁的话,这颗CPU肯定就报废了。

4

感谢您的阅读!

冗余设计。这是我们需要知道的第一个名词。所谓的冗余设计又称余度设计技术,是在系统或设备完成任务起关键作用的地方,增加相同功能的部件、元件、通道等等,系统或者设备出现故障的时候,能够让设备正常工作,保证系统或者设备的正常运行!

冗余设计

它是芯片晶体管的备用方案吗?我们一定要知道它是备用方案,并不是说它一定能够保证晶体管能够完全完好无损的运行,这种冗余设计,本身就是一种急救措施,它只能是部分的冗余晶体管,它是不影响整体性的。冗余设计不是万能的,它是一种备用方案,这种方案可能会失灵。

良品率

芯片本身制造工艺复杂,可能一些简单的纰漏就会导致整个芯片的损坏,所以在经过光刻蚀刻的手段将芯片造成来,本身就是一件异常复杂的事情。而芯片生产出来之后,会经过检测,一般封装后,基本上不会出现损坏,除非是人为,或者在高温下等。

DFT技术

一般芯片的步骤是产品定义-设计-验证-逻辑综合-物理设计-生产制造。其中有一个非常重要的环节就是测试芯片是否存在物理异常,在英文中,Design for Testability,意思是可测试性设计,它会将一些特定的结构在设计阶段植入电路,以便进行设计后的测试,它会根据电路结构,对芯片测试,如果得出的结果符合要求,没有发现芯片中的物理异常,比如晶体管损坏等等,就完成了测试。

软硬件协作

如果部分芯片损坏,可能软件会在某些功能上进行协调工作,来弥补这些损坏。

最后的话:基本芯片不会出现几个损坏,冗余设计的作用也不是万能;关键部位损坏,也就废了。

5

欢迎在点击右上角关注:「太平洋电脑网」,感谢您的支持!

第一,出厂之前厂商会做一个检查,检查OK之后才会打包装出售的;

第二,CPU关键部分会做冗余设计,会有替代的部分;

第三,CPU有会有屏蔽的能力

第四,CPU真的很难坏


出厂前有测试

CPU为代表的半导体工艺真的是人类的工艺品的巅峰了,其精细程度前所未有。作为纳米级别的工业品,如果它损坏之后也没有办法可以弥补修改了。所以为了保证CPU能够正常,出厂之前都会有测试的。

冗余设计

在关键部分上,CPU拥有更多的设计,这个设计本身就是给出错之后使用的。芯片会记录出错的单元,并且进行屏蔽。然后由代替的部分进行工作,保证CPU能够运行的。

屏蔽设计

有时候我们会惊讶,为什么有的CPU是6核,有一些是8核,但是他们的体积是一样的大小。实际上,有一些i5芯片是从i7变过来的,他们可能从同一块晶片上切下来,但是因为这一款芯片的体质不好,所以就屏蔽两个核心,然后变成了i5.

CPU真的很难坏

CPU虽然很精细,但是真的很耐用的啊。这是作为人类工业品巅峰的自尊之一,很多消费级的CPU不是因为怀了而被放弃,而是因为性能跟不上了而被闲置的。

除非你人为的暴力使用CPU,那就有可能会坏掉。

当然,如果CPU的生命真的到了尽头了,那就会不断的报错,这个在工业级会比较常见一点。当然,工业级的会有检测机制,差不多的时候就会换了。

6

以前修理一些电子产品的时候,偶尔会碰到某个指示灯或者继电器没有输出了,开始以为是灯或者继电器或者驱动三极管烧了,更换了还是一样,怀疑是线路断线或者漏电,把线路划断了,重新飞线过去,依然没有动作,后来测量CPU的对应输出管脚,居然没有电压,而产品其他功能运行找正常,也就是说CPU的其他功能都正常,只是某个管脚坏了,估计是里边的驱动三极管坏掉了,请关注:机电猫

CPU虽然复杂,但是里边的电路原理并不会特别

普通电路里边有什么元件,不外是电阻,电容,电感,还有二极管,三极管等晶体管。这些电路最早是使用模拟形式的,主要是处理连续变化的模拟量的电路,它把模拟量信号进行放大(缩小),对信号进行一定的运算处理,还有震荡和反馈,调制电路,滤波,解调电路等等。应该说,早期的电路都是模拟电路,特别只有电阻,电容和电感的年代。

晶体管技术发展后,另外一种电路专门用来处理数字信号的,就是数字电路,它主要是研究输入输出逻辑关系的,它分为时序逻辑和组合逻辑两种,是一种量化的电路。因为任何一个模拟量都可以经过量化来处理,而量化后的数据更容易处理,而且传输非常稳定,逻辑可以做得非常复杂,所以数字电路飞快发展,逐步把很多逻辑功能集成到一个芯片里边,芯片集成的晶体管越来越多,出现了各种触发器,逻辑门电路,移位寄存器等,最终就出来微处理器这样一个东西,也就是我们常说的CPU了,它是可以通过软件的方式来修改数字逻辑的,但是硬件的基础,还是很多数字电路组合体,而且今天的CPU还带D/A和A/D接口之类的,也就是说里边包含了一些模拟相关电路。

可以设想一下,传统的电路上,如果某个电阻老化了,或者某个三极管坏了,电路一定是会出现一定的问题的,这个问题影响大小,和这个出问题的元件的重要性有很大关系了。比如只是放大回路上的一个电阻阻值变大了,就会影响模拟量输出的精确度。但是如果是一个电路里边的三极管放大倍数变化了,因为电路里边设计有负反馈之类的,可能会被校准过来。也就是说,这些元件只是性能不良,参数发生了一定的变化,可以利用电路原理来让整体电路功能工作正常。无论如何,如果一个通道上的一个电阻被烧短路了,传统的电路都会无法正常工作下去的,除非有元件能够更换掉它。

但是在一个电路里边,如果设计一个备用的元件,是有点不太现实的,一方面是电路的体积要求比较小,另外对成本要求控制比较严格,而且多个元件还可能会带来多个不可靠,切换起来还要加电路,所以似乎没有什么人真正在传统的电路里边通过双元件来保证一块电路板的可靠性,也就是说电路系统里边,几乎不会使用所谓的元件冗余技术来切换掉坏的元件。

既然CPU里边的电路和普通肉眼能看到的电路本质是一样的东西,所以如果CPU里边某个晶体管坏了,碰巧用上这个晶体管,在一些关键的部位上,比如管脚上,肯定是会造成这个管脚的功能失效的。因为这个管脚一旦失效,除非CPU设计了一套能检测到管脚失效的电路来,否则它本身是不会知道这个管脚工作是否正常的,CPU功能这些多,不可能对每个晶体管都去做所谓的“闭环反馈”检查,如果里边某个晶体管失效,它不大可能可以自我判断和切换的,自我修复可以说是天方夜谭,好比一个人的大脑坏了一个神经元,大脑本身不可能去自我修复的。

CPU生产工艺和传统电路有巨大的差别。

传统的电路板,是先在一块覆铜板上腐蚀(或者其他方法)出来一定的电路图,也就是电路线路,然后在不同的位置上,根据电路图焊接上不同的电子元件。这种做法对焊接工艺的要求比较高,稍微不慎就可能会虚焊,接触不良就会产生大问题。

而且传统的电子元件,往往是使用一些粗糙电的加工和封装工艺,电子元件参次不齐,不同厂家对质量控制不一样,市场上的元件鱼龙混杂,最后组装起来很难保证一致性。所以要通过测试,老化等方式来淘汰一些潜在的问题元件,即使这样,元件出问题的概率还是比较高的。

而CPU,是在一块晶圆上,通过光的方法来腐蚀雕刻出来不同的电子元件,同时加工出来对应的电路。这种晶圆的纯度非常高,材料上比普通电子元件要强很多倍。而是一块东西上加工出来的,一致性非常强,不会存在上边说的不同厂家元件不一样问题,也不会有什么虚焊问题。

从这个角度来看,CPU生产严格依赖于先进的机器设备,同时材料比较特殊,一次性把电路和元件生产出来,这个和传统电路的做法完全是不一样的。因此CPU里边的晶体管虽然高达几十亿个,故障率反而比传统的电路板要低非常多。

当然,也不是说CPU就不会有问题了,如果代工厂的水平不行,生产出来的产品一致性差,这种CPU是不可能卖得掉的。

至于里边可能会有某个晶体管坏了,那往往是在外部原因造成的,比如温度或者电压高于某个值引起的,这种情况CPU也无法修复,这是没有任何维修价值的东西。几十亿的晶体管,也许会有一些出现性能不良,但是依然可以通过电路反馈的原理来补偿,但是如果某个晶体管彻底坏掉了,这个CPU就完全报废了。

7

我是电子及工控技术,我来回答这个问题。中央处理器(CPU)确实有成千上亿颗的晶体管构成,首先我们可以肯定的是CPU里面的晶体管(一般都是MOS管)不要说有几个失效就是有十几个坏掉也照常运行。我们可以对比一下,如果是电路板上的分离晶体管的话对于民用级设备来说损坏一颗晶体管就会导致电路出现“罢工”现象,对于商用级设备或许还可以勉强工作,那么对于军事上所用的设备则是无关紧要了。这就涉及到在设计电路时根据不同的运用级别来采用冗余技术,这样可以提高设备的安全稳定性。

我曾经在一个军事节目上听一位权威专家说在军事上使用的雷达,即使雷达设备上的元件被打坏掉三分之一也能正常工作运行,这就是冗余技术在电路设备上的应用,我想作为比较昂贵的CPU(中央处理器)在设计时也一定会考虑冗余技术的应用。我认为这是一个方面。

下面我想从CPU制作的工艺上再述说一下为何坏掉几个晶体管不会影响CPU的使用。我们知道CPU(中央处理器)是一块巨大规模的集成电路(GLSI),所包含的晶体管元器件数量级数可达十的八次方到十的九次方之间。这么多的器件集成在半导体(以纯净硅为主)衬底上,在半导体工艺上使用的是光刻、扩散、氧化、外延等制作方法,这些工艺方法可以使集成电路里(CPU)的晶体管、二极管等器件相互隔离,然后再采用金属互连的方法实现其电性能。同时在制作过程中需要切割芯片,为了提高CPU的合格率有的还设计了预留了电路,因此CPU(中央处理器)中有几个晶体管虽然坏掉仍然能处于正常工作状态。

以上就是我对这个问题的看法,欢迎大家参与讨论这个话题,敬请关注电子及工控技术。

8

我们知道CPU都是由晶体管组成的,比如麒麟990 5G有103亿晶体管,也是首次在手机芯片中塞进去了100亿以上的晶体管,而A13才85亿晶体管。

一般而言,同样的制程下,晶体管越多,性能也越强。但是事实上,CPU中的晶体管并不是所有的晶体管都是在工作的。

因为在晶体管中,考虑了冗余机制,即如果某些晶体管坏掉了,另外的晶体管要能够顶上来,保证这颗CPU不受影响。

据网上的数据,表示目前在CPU的设计和制造过程中,至少有考虑1-3%的冗余的,就是为了用来确保万一某些晶体管坏了,不影响整颗CPU。

当然,一般而言,晶体管并不会坏的,在设计和制造中,就会经过严格的测试的,同时由于CPU的工作原理,制造工艺,以及材料等原因,晶体管单独坏掉的可能性其实很小小的,就算坏了一点点,也没什么关系的。

所以说,大家基本上不用担心晶体管坏了,目前各大厂商主要是在研发软件,怎么把晶体管的潜能全部发挥出来,而让空闲的晶体管越少越好。

9

“坏掉几个晶体管”,可能在生产过程,也可能在使用过程。我们分开来说。


生产过程

先说结论:对于小厂来说,坏掉任何一个就是废品;对大厂来说,坏掉几个可能降级销售


CPU里的晶体管(或者电路)大体上可分成三部分:

  1. 内部逻辑:如指令译码部分、ALU部分、FPU部分等

  2. 内部存储:如Cache

  3. 外部接口:主要控制芯片管脚接口

其中,内部存储通常占用较大面积,同时,缺陷也大多出现在内部存储区域。

CPU生产出来以后,在封装测试阶段,通过测试设备可探查出大部分“坏掉晶体管”的情况。通常,只要发现有任何损坏,这颗芯片就作为废品处理。


少数大厂(如Intel)发现Cache区存在缺陷,会将坏掉位置所在的Cache区封锁掉,降级销售,如以前的奔腾变赛扬。其它区域发现生产缺陷,同样会将整颗芯片作为废品处理。


使用过程

芯片在使用过程中,内部通常很稳定,不容易出现故障。只有外部接口可能受高压电击等原因造成部分损坏。

通常来说,CPU的外部接口电路中,有一部分不是必需的,比如嵌入式芯片的USB控制器,可能自带几个USB 主端口,坏掉一个,其它的还能用;有的外部接口电路则是必需的,如晶振接口。


总体说来,芯片的任何电路损坏,都不应再使用下去,因为后果未知,可能造成的损失也未知。

10

“极客谈科技”,全新视角、全新思路,伴您遨游神奇的科技世界。

CPU里共计有几十亿个晶体管,坏掉几个非核心晶体管并不会产生多大的影响。

这里面涉及到CPU生产良品率、CPU体质、已经CPU使用年限时长的问题:

  • 生产过程无法保障几十亿个晶体管不出现问题,这里就产生了CPU生产良品率的问题;

  • 同种规格、同种型号,晶体管数量好坏的多少又产生了CPU体质的问题;

  • CPU以稳定、耐用著称,集体管数量好坏又产生了CPU抗老化的问题。

好吧,一次来看看这三个方面共同涉及集体管损坏的问题吧!


CPU个别晶体管损坏能够带来的问题

一、处理器生产良品率的问题

即便使用最先进的制作工艺,也无法保障CPU的几十亿个晶体管不出现问题(设计之初,就进行了冗余的备份)。只能够是尽量确保CPU的良品率。CPU的型号和等级不同,例如大家知道的i7、i5、i3等。晶体管相对损坏较少的芯片,性机能较佳,直接归纳至i7处理器。晶体管损坏较多,会进行一定的功能或性能阉割,归纳至i5、i3处理器等。晶体管损坏过多,如果完全不能够使用,则直接报废。

二、处理器体质的问题

即便是同种规格的CPU,CPU制作的过程难免会出现杂质,导致晶体管损坏,间接决定了CPU体质的不同。体质越高的CPU功耗越低,发热量也就越低,超频性能反而越强。同样型号的处理器,大家就更加喜欢使用超强体质的芯片。这里大家可以使用CPU-Z这款软件来检测自己的CPU体质,下图中的核心电压越低越好。

三、处理器耐老化的问题

CPU一直以稳定、抗老化著称,很少会出现故障。CPU设计之初,已经做出抗老化测试,即便在使用中个别晶体管出现问题也不会影响到处理器的性能(非核心部分的晶体管)。平时在使用过程中,只要注意CPU的散热,非专业人士不要随便超频等。一款处理器的正常使用年限,足够您更换几台电脑。


关于CPU损坏几个晶体管是否还能够使用的问题,您怎么看?

欢迎大家留言讨论,喜欢的点点关注。