從【特斯拉逆變器故障】和【小鵬召回】,看汽車(chē)芯片可靠性
根據(jù)J.D.Power的一份報(bào)告,車(chē)載音頻、通信、娛樂(lè)和導(dǎo)航(ACEN)類(lèi)是質(zhì)量投訴中問(wèn)題最多的領(lǐng)域。作為回應(yīng),近年來(lái)汽車(chē)主機(jī)廠開(kāi)始要求電子元件要使用18年零故障。其原因之一是,如果汽車(chē)一再出現(xiàn)故障,消費(fèi)者就不太可能購(gòu)買(mǎi)同一品牌的汽車(chē)。隨著汽車(chē)中芯片和電子元件數(shù)量的迅速增加,這一問(wèn)題也變得更為嚴(yán)重。
前不久,小鵬汽車(chē)因錫須召回13399輛G3汽車(chē),將免費(fèi)更換逆變器;前后腳,特斯拉新車(chē)Model 3因逆變器故障而“死機(jī)”,卻還一度嘴硬。這不禁讓人想起了半導(dǎo)體器件的可靠性及其相關(guān)的一些問(wèn)題:生命周期、老化失效、零缺陷等。
小鵬和特斯拉可能殊途同歸
小鵬汽車(chē)的問(wèn)題很明白:逆變器直流母線電容上連接銅排螺絲的鍍錫端子錫須可能會(huì)造成高壓直流電正負(fù)極間短路,導(dǎo)致逆變器無(wú)高壓電供應(yīng)。當(dāng)這種情況發(fā)生時(shí),如果車(chē)輛處于停車(chē)狀態(tài),可能無(wú)法再次啟動(dòng);如果車(chē)輛處于行駛狀態(tài),可能導(dǎo)致車(chē)輛失去動(dòng)力,存在安全隱患。
像這樣的地方容易產(chǎn)生錫須
錫須,也叫晶須,是電子產(chǎn)品中一種常見(jiàn)現(xiàn)象。它是一種頭發(fā)狀晶體,可以從焊錫表面自然生長(zhǎng)出來(lái),最常見(jiàn)的金屬是錫、鎘、鋅、銻、銦等。錫須是錫表面生長(zhǎng)的錫晶體,它會(huì)導(dǎo)致電子短路,并引起焊點(diǎn)的機(jī)械破壞。
元件引腳上的錫須
特斯拉故障現(xiàn)象和小鵬類(lèi)似,問(wèn)題或許差不多,應(yīng)給予足夠的重視。專(zhuān)家指出,一些看似不起眼的缺陷卻有可能是一種致命缺陷。一些潛在缺陷可能永遠(yuǎn)不會(huì)導(dǎo)致故障,而其他不太明顯的缺陷可能在某種環(huán)境條件或過(guò)度振動(dòng)下會(huì)變成更嚴(yán)重的問(wèn)題,小鵬汽車(chē)的召回介紹為了解決這個(gè)問(wèn)題。
潛在缺陷與致命缺陷
對(duì)于汽車(chē)來(lái)說(shuō),雖然人們正在努力防止和發(fā)現(xiàn)這類(lèi)缺陷,在出現(xiàn)問(wèn)題時(shí)及時(shí)加以處理更不失為一種亡羊補(bǔ)牢的做法。因此,除了使器件更可靠外,還必須更容易更換。
汽車(chē)零故障何以保證?
ISO 26262的基本要求之一是能夠“優(yōu)雅地”失效。這要么需要一個(gè)冗余系統(tǒng),使電子設(shè)備的成本增加一倍,要么需要能夠利用不是為特定工作設(shè)計(jì)的其他電路。因此,盡管信息娛樂(lè)系統(tǒng)的設(shè)計(jì)可能不會(huì)被認(rèn)為對(duì)安全至關(guān)重要,但在緊急情況下,其性能可能必須與關(guān)鍵系統(tǒng)一樣好。
然而,這帶來(lái)了一個(gè)潛在的問(wèn)題。根據(jù)J.D.Power的一份報(bào)告,車(chē)載音頻、通信、娛樂(lè)和導(dǎo)航(ACEN)類(lèi)是質(zhì)量投訴中問(wèn)題最多的領(lǐng)域。作為回應(yīng),近年來(lái)汽車(chē)主機(jī)廠開(kāi)始要求電子元件要使用18年零故障。其原因之一是,如果汽車(chē)一再出現(xiàn)故障,消費(fèi)者就不太可能購(gòu)買(mǎi)同一品牌的汽車(chē)。隨著汽車(chē)中芯片和電子元件數(shù)量的迅速增加,這一問(wèn)題也變得更為嚴(yán)重。奧迪報(bào)告說(shuō),其高端車(chē)型中有大約有7000個(gè)半導(dǎo)體器件,每天生產(chǎn)大約4000輛汽車(chē)。每百萬(wàn)分之一故障相當(dāng)于每天有24輛有缺陷的汽車(chē)。對(duì)寶馬來(lái)說(shuō),這相當(dāng)于54輛有缺陷的汽車(chē),因?yàn)閷汃R使用了大約一半的電子元件,但每天生產(chǎn)10000輛汽車(chē)。
這還只是個(gè)開(kāi)始,因?yàn)槠?chē)中電子內(nèi)容的數(shù)量正在上升。電子組件很快就會(huì)占到汽車(chē)成本的35%。普華永道認(rèn)為,隨著自動(dòng)駕駛的到來(lái),到2030年將占汽車(chē)成本的50%。想一想,汽車(chē)今天在這里,明天在那里,惡劣的環(huán)境是一個(gè)問(wèn)題。
1995年,汽車(chē)市場(chǎng)將成熟節(jié)點(diǎn)的半導(dǎo)體用在收音機(jī)或電動(dòng)窗等相對(duì)簡(jiǎn)單的系統(tǒng)?,F(xiàn)在,汽車(chē)需要有絕對(duì)最新的技術(shù)來(lái)提供ADAS傳感器所需的所有功能。汽車(chē)行業(yè)已經(jīng)無(wú)法使用已知故障模式和問(wèn)題的五年前的技術(shù)。他們現(xiàn)在正處于最前沿,沒(méi)有人知道這些技術(shù)到底有多穩(wěn)定,也不知道會(huì)出現(xiàn)什么問(wèn)題。
如何量化和發(fā)現(xiàn)致命缺陷
汽車(chē)中有大量的變量,在先進(jìn)節(jié)點(diǎn)設(shè)計(jì)芯片時(shí)也是如此,包括工藝變化到微小缺陷。關(guān)鍵是要理解并量化這些變量,然后利用積累的所有知識(shí),能夠預(yù)測(cè)缺陷并發(fā)現(xiàn)致命缺陷。
從芯片的生命周期中收集數(shù)據(jù)并將其插入反饋回路是可靠性和功能安全性的關(guān)鍵。對(duì)于功能安全,在測(cè)量老化時(shí),可以在某個(gè)時(shí)間點(diǎn)得出結(jié)論,器件已經(jīng)老化到不再安全的程度。然后可以說(shuō)這輛車(chē)需要在故障發(fā)生之前進(jìn)行預(yù)防性維護(hù)。
在過(guò)去,可靠性通常被認(rèn)為是制造過(guò)程的一部分。芯片要在烤箱中烘烤一段時(shí)間,或經(jīng)過(guò)仔細(xì)監(jiān)測(cè)的振動(dòng),以確定器件何時(shí)會(huì)出現(xiàn)故障。雖然在制造之前可以模擬不同的場(chǎng)景,但芯片仍然可能會(huì)失效,但缺陷率會(huì)降低,這取決于對(duì)各種工藝的控制有多嚴(yán)格,以及可以增加多少裕度來(lái)提供某種類(lèi)型的失效接管。這在今天的ECC(錯(cuò)誤檢查和糾正)內(nèi)存中是很常用的方法。
不過(guò),傳統(tǒng)汽車(chē)時(shí)代的一些假設(shè)正在被打破,老化就是其中之一。當(dāng)汽車(chē)停駐并關(guān)閉引擎時(shí),汽車(chē)電子設(shè)備不會(huì)停止老化。即使是在車(chē)庫(kù)里,自動(dòng)駕駛汽車(chē)也永遠(yuǎn)不會(huì)“熄火”。它可能仍然與手機(jī)通信、更新軟件,在后臺(tái)做自我檢查。
芯片能維持的使用壽命因終端市場(chǎng)、器件是否用于安全或任務(wù)關(guān)鍵型應(yīng)用,甚至是否可以輕松更換或遠(yuǎn)程修復(fù)而大相徑庭。
不同行業(yè)芯片的預(yù)期壽命估計(jì)
加速老化測(cè)試是模擬產(chǎn)品在現(xiàn)實(shí)使用條件下各種因素對(duì)產(chǎn)品產(chǎn)生老化的加強(qiáng)實(shí)驗(yàn)過(guò)程。一個(gè)加速因素是溫度,另一個(gè)因素是電壓。如果一個(gè)器件在12V(汽車(chē)電池正常電壓)下工作,那么在24年的時(shí)候,這個(gè)器件已難以工作。不同的參數(shù),如濕度、電壓、溫度、機(jī)械沖擊,這些都是加速系數(shù)。老化可以模擬器件壽命。
現(xiàn)在的問(wèn)題是,如何加速它的壽命?當(dāng)然,需要模擬的是器件在車(chē)?yán)锎蠹s20年的壽命。如果希望在一個(gè)月內(nèi)看到一個(gè)故障,那么就要使用許多組件;如果想看到20年內(nèi)的一次故障,可以添加更多的組件,然后就可以得到更多的運(yùn)行時(shí)間。如果想模擬一臺(tái)設(shè)備在20年內(nèi)出現(xiàn)故障,可以拿1000臺(tái)設(shè)備運(yùn)行一個(gè)小時(shí),即1000工作小時(shí)數(shù)。使用更多組件就可以更快地測(cè)試壽命,因?yàn)檎嬲胍氖茄菔具\(yùn)行小時(shí)數(shù)內(nèi)有多少故障。這就是所謂的FIT(失效率),在109小時(shí)內(nèi)出現(xiàn)一次故障即為1 FIT。
值得一提的是,不同汽車(chē)級(jí)別在時(shí)間質(zhì)量指標(biāo)上有不同的失效率。消費(fèi)類(lèi)級(jí)別的質(zhì)量水平為100 FIT,而安全關(guān)鍵應(yīng)用(如汽車(chē)中控制電池充電的電子器件)可能是0.1 FIT。所以必須根據(jù)器件的分類(lèi)來(lái)模擬生存期。為了計(jì)算不同的加速系數(shù)所產(chǎn)生的影響,可以使用阿倫尼烏斯(Arrhenius)方程。
功能安全與可靠性
毋庸諱言,汽車(chē)電子的可靠性和功能安全性之間關(guān)系緊密。功能安全的重點(diǎn)是避免傷害,而可靠性是說(shuō)汽車(chē)能否工作,而不需要修理。但是隨著自動(dòng)駕駛的增加,兩者會(huì)有很多重疊。
如果石頭擊中傳感器會(huì)發(fā)生什么?除了自身的可靠性之外,我們還必須考慮自動(dòng)駕駛汽車(chē)的功能安全性,其中一些標(biāo)準(zhǔn)是ISO 26262推動(dòng)的。這是在設(shè)計(jì)階段很多工作的核心。只要芯片安全地失效,芯片失效也沒(méi)關(guān)系。這是功能安全的重點(diǎn)。在一輛自動(dòng)駕駛汽車(chē)?yán)?,無(wú)論是芯片故障還是雷擊,不撞車(chē)都是至關(guān)重要的。當(dāng)然,可靠性也很重要。最好芯片不出故障,這既是功能安全的需要,也是質(zhì)量的需要。
失效對(duì)于汽車(chē)行業(yè)至關(guān)重要,而失效的機(jī)會(huì)很多。要想以可控的方式重復(fù)這一過(guò)程,并在生產(chǎn)線內(nèi)部、工廠之間或不同供應(yīng)商之間找到問(wèn)題的根本原因,對(duì)可靠性是一個(gè)重大挑戰(zhàn)。無(wú)論你在做什么,都必須是可重復(fù)的,而且你必須能夠信任它。這使得這些公司的運(yùn)營(yíng)方式發(fā)生了重大轉(zhuǎn)變。
汽車(chē)電子的可靠性要求是由汽車(chē)電子委員會(huì)(AEC)定義和分級(jí)的,AEC Q-100/200是汽車(chē)IC應(yīng)力測(cè)試的標(biāo)準(zhǔn)。熱、濕度和振動(dòng)都是可能破壞芯片的風(fēng)險(xiǎn)因素,但材料、設(shè)計(jì)和制造工藝也會(huì)使芯片或多或少地受到風(fēng)險(xiǎn)因素的影響。這會(huì)變得復(fù)雜,細(xì)節(jié)也很重要。
在整個(gè)開(kāi)發(fā)和鑒定過(guò)程中,需要明智地使用熱機(jī)械建模。例如,聚合物材料在長(zhǎng)時(shí)間高溫下會(huì)發(fā)生永久性變化。取決于環(huán)境,這可能包括材料氧化以及導(dǎo)致脆化的機(jī)械性能變化。濕度也會(huì)導(dǎo)致片芯鈍化層和基板焊接掩模界面的附著力喪失。
冗余需要適度
冗余通常是實(shí)現(xiàn)航空可靠性的方法,但這會(huì)增加開(kāi)支和重量。但對(duì)于汽車(chē)來(lái)說(shuō),冗余需要局限于車(chē)輛內(nèi)的特定系統(tǒng),因?yàn)槠?chē)沒(méi)有那種奢侈,主機(jī)廠只是想省下每一分錢(qián)。
在汽車(chē)?yán)?,冗余是需要平衡的。隨著SoC應(yīng)用的擴(kuò)大,冗余有多種形式。這些技術(shù)是在更高層次上復(fù)制一些CPU或一些功能較差的塊,并確保兩者獲得相同的輸出,如果兩者中的任何一個(gè)顯示不一致的內(nèi)容,則標(biāo)記為一個(gè)問(wèn)題。這允許在操作過(guò)程中進(jìn)行某種程度的自我測(cè)試。這種方法很昂貴,因?yàn)閺?fù)制了整個(gè)塊或處理器。
其他冗余設(shè)計(jì)更為精確。例如在內(nèi)存寄存器級(jí)別,就像邏輯設(shè)計(jì)中的觸發(fā)器,在這里可以找到一些起關(guān)鍵作用的寄存器。要么用一個(gè)更大裕量的器件來(lái)替換它,要么加入三重模塊冗余。因此,從降低成本角度看,它是細(xì)粒度、粗粒度和各種其他技術(shù)的一種平衡。
這還取決于這些芯片是如何使用的,它們是否是復(fù)雜系統(tǒng)的重要組成部分,以及持續(xù)監(jiān)控和反饋的成本是否可以分?jǐn)偟秸麄€(gè)系統(tǒng)價(jià)格中。這不是一個(gè)簡(jiǎn)單的等式,也沒(méi)有簡(jiǎn)單的答案,特別是在先進(jìn)節(jié)點(diǎn),額外的電路會(huì)增加功耗并降低性能。
先進(jìn)節(jié)點(diǎn)的尷尬境地
高級(jí)駕駛員輔助系統(tǒng)(ADAS)和向完全自動(dòng)駕駛方向發(fā)展正在采用最新節(jié)點(diǎn)的半導(dǎo)體制造工藝,而可靠性成為汽車(chē)行業(yè)最關(guān)心的問(wèn)題。雖然成熟的節(jié)點(diǎn)仍然是主流,但汽車(chē)芯片已經(jīng)發(fā)展成為大型復(fù)雜的SoC。其中包括集成到異構(gòu)封裝和配置中的先進(jìn)節(jié)點(diǎn)器件,這些封裝和配置還未經(jīng)嘗試。過(guò)去,電子控制單元通常只有一個(gè)處理器或存儲(chǔ)器單元。情況不再如此,從驗(yàn)證到各種類(lèi)型的測(cè)試,包括符合性測(cè)試,都變得更加嚴(yán)格。
一些汽車(chē)芯片變得越來(lái)越復(fù)雜和小巧玲瓏。車(chē)輛的中央邏輯尤其如此,它需要管理所有其他系統(tǒng)以避免車(chē)輛出現(xiàn)故障。目前的設(shè)計(jì)使用的是7nm和5nm邏輯,這已是芯片制造的前沿,但這些器件必須能夠承受惡劣的環(huán)境,并且比消費(fèi)芯片正常工作至少要長(zhǎng)10年。一個(gè)節(jié)點(diǎn)的一種工藝是否存在問(wèn)題,通常需要五到六年的時(shí)間才能知道。采用5nm到7nm技術(shù),我們不知道會(huì)有什么變化。因此,最近NXP、高通將5nm芯片引入汽車(chē)既是在挑戰(zhàn)誘惑,也要面對(duì)巨大的挑戰(zhàn)。
回顧一下,前不久智能手機(jī)5nm芯片無(wú)一幸免被曝實(shí)際功耗不低,發(fā)熱未減。在封裝和測(cè)試方面,許多人都體驗(yàn)到汽車(chē)出現(xiàn)故障的地方之一是標(biāo)準(zhǔn)塑料或陶瓷,其選擇主要基于成本。這表明,芯片公司的專(zhuān)業(yè)知識(shí)仍然存在差距,一些公司從未涉足汽車(chē)領(lǐng)域,而汽車(chē)供應(yīng)商和主機(jī)廠對(duì)先進(jìn)節(jié)點(diǎn)芯片設(shè)計(jì)和制造中的一些問(wèn)題沒(méi)有經(jīng)驗(yàn)。
盡管主機(jī)廠和Tier 1的要求很?chē)?yán)格,但一定程度的失效是不可避免的。電子設(shè)備會(huì)因各種原因而磨損,芯片可能由于一個(gè)設(shè)計(jì)缺陷,也可能由于芯片蝕刻時(shí)困在薄膜中的塵埃顆?;驓饬鲉?wèn)題而出現(xiàn)問(wèn)題。何況有大量的研究表明,當(dāng)一個(gè)雜散α粒子擊中一個(gè)7nm晶體管時(shí)會(huì)發(fā)生災(zāi)難性的后果。
要控制這樣的問(wèn)題,需要在系統(tǒng)和電路兩個(gè)層面都有深入的了解,但目前還沒(méi)有足夠的數(shù)據(jù)能夠就問(wèn)題可能在哪里爆發(fā)以及為什么爆發(fā)得出好的結(jié)論。
數(shù)據(jù)與可靠性息息相關(guān)
從汽車(chē)上收集有用的數(shù)據(jù),并將其發(fā)送到反饋回路中,將成為汽車(chē)行業(yè)未來(lái)5到10年內(nèi)一項(xiàng)常規(guī)性的工作。主機(jī)廠、芯片設(shè)計(jì)公司、半導(dǎo)體公司都需要通過(guò)正反饋回路來(lái)獲得更詳細(xì)的分析,因此,我們可以對(duì)所使用的設(shè)計(jì)技術(shù)和庫(kù)進(jìn)行適當(dāng)?shù)恼{(diào)整。
實(shí)現(xiàn)這一功能的關(guān)鍵要素之一是從汽車(chē)中傳輸最少的數(shù)據(jù)量。這意味著汽車(chē)本身必須能夠整理出相關(guān)的數(shù)據(jù)和事件。管理所有這些數(shù)據(jù)至關(guān)重要,要考慮太多的數(shù)據(jù)以及如何以一種干凈的方式將其組合在一起。對(duì)于不同類(lèi)型的工具,或者不同類(lèi)型的傳感器,盡管其在物理上不同,來(lái)自不同的供應(yīng)商,但在邏輯上是相同的。通過(guò)識(shí)別所有不同數(shù)據(jù)源中語(yǔ)義相似的內(nèi)容,就可以更輕松地將其轉(zhuǎn)換為一種格式,然后提取出一些有用的結(jié)果。
關(guān)鍵在于理解什么對(duì)可靠性更重要,而這本身就是一項(xiàng)復(fù)雜的任務(wù)。簡(jiǎn)單說(shuō),從汽車(chē)中收集有價(jià)值的信息非常重要。雖然這很難量化,但不能一直發(fā)送所有的數(shù)據(jù)。找到重要的數(shù)據(jù)意味著汽車(chē)或器件要有分析能力,從而最大限度地減少傳輸?shù)皆贫说臄?shù)據(jù)。
在車(chē)輛部署到現(xiàn)場(chǎng)之前,我們必須確保已經(jīng)采取了所有的可靠性和安全措施。通過(guò)組合從生命周期不同階段提取的UCT(通用芯片遙測(cè))數(shù)據(jù),并用額外的數(shù)據(jù)源對(duì)其進(jìn)行擴(kuò)充,價(jià)值鏈上的制造商就可以將質(zhì)量提高10倍,防止質(zhì)量流失或“受傷”。這是通過(guò)高度先進(jìn)的異常檢測(cè)方法,剔除未檢測(cè)到的缺陷,而不影響良率來(lái)實(shí)現(xiàn)的。即使在表征和鑒定過(guò)程中,也應(yīng)對(duì)性能極限進(jìn)行調(diào)整和優(yōu)化,以確保足夠的可靠性裕度。
例如,Synopsys將分析引擎與嵌入芯片中的傳感器和監(jiān)視器相連,利用反饋回路將芯片設(shè)計(jì)和生產(chǎn)各個(gè)階段的豐富數(shù)據(jù)集輸入分析引擎中。
嵌入芯片中的傳感器和監(jiān)視器將豐富數(shù)據(jù)集輸入分析引擎
數(shù)據(jù)的所有權(quán)有助于實(shí)現(xiàn)反饋回路和生命周期管理。從汽車(chē)內(nèi)部芯片的深處收集數(shù)據(jù)正在解決這個(gè)問(wèn)題。如今,數(shù)據(jù)正從汽車(chē)中收集起來(lái),并在主機(jī)廠內(nèi)部共享。隨著時(shí)間的推移,根據(jù)地區(qū)、合法性、收集數(shù)據(jù)的程度以及保護(hù)數(shù)據(jù)的能力,數(shù)據(jù)所有權(quán)將成為整個(gè)設(shè)計(jì)生命周期中進(jìn)行更深入分析的一個(gè)加速器。