輻射對FPGA應(yīng)用的影響及解決方案
以前很多人認(rèn)為,半導(dǎo)體器件只會在太空應(yīng)用中受到輻射的影響,但是隨著半導(dǎo)體工藝的進(jìn)步,很多地面的應(yīng)用也會受到輻射的影響。今天,我們會介紹不同的輻射效應(yīng)和對FPGA的影響,比較不同的FPGA的耐輻射性。
輻射的影響
按照是否能造成原子或者分子的電子脫離,輻射主要分為電離性和非電離性兩大類,如圖1所示。高能粒子或者電磁波包括X射線和γ射線都能夠產(chǎn)生電離的作用。半導(dǎo)體器件受電離性的輻射影響較大,日常應(yīng)用中以粒子引起的電離性輻射最常見,而其中,以α粒子和中子的影響力較大。
圖1 輻射分類
對于太空和地面的應(yīng)用而言,輻射效應(yīng)可以分為兩大類,單事件效應(yīng)(SEE)和總離子劑量/總劑量(TID)。在對地面的應(yīng)用中,單事件效應(yīng)比較普遍,SEE是高能帶電粒子在器件的靈敏區(qū)內(nèi)產(chǎn)生大量帶電粒子的現(xiàn)象,SEE的種類很多,尤其以單事件閉鎖(SEL)和單事件/粒子翻轉(zhuǎn)(SEU)最難處理。當(dāng)輻射在器件內(nèi)造成一定程度的離子化的時候,導(dǎo)通大電流,發(fā)生單事件閉鎖現(xiàn)象,即使在最輕微的情況下,這種閉鎖現(xiàn)象仍會引起芯片循環(huán)上電,嚴(yán)重情況下芯片會永久損壞。但是,值得高興的是,已經(jīng)可以使用芯片設(shè)計和工藝技術(shù)來減少單事件閉鎖發(fā)生的幾率。
一般電子應(yīng)用中遇到的輻射問題來自于天然輻射,包括由太陽和宇宙的影響造成的因素造成。星系宇宙射線(GCR)是指來自于太空的α粒子、重離子和質(zhì)子,而太陽主要發(fā)射電子、質(zhì)子和重離子。中子的體積非常小,能夠輕易穿過大氣層,甚至能穿透整個地球,而且由于其不帶電荷,能逃過地球的輻射帶陷阱,因此到達(dá)地面和半導(dǎo)體產(chǎn)生作用的高能粒子以中子為主。
不同的環(huán)境對產(chǎn)生輻射的影響是不同得,輻射通量隨著高度的上升成指數(shù)增加,在海拔330km時,是太空電子應(yīng)用的所在地,海拔50km是軍用飛機(jī)所能達(dá)到的高度,這里中子和其他粒子的強(qiáng)度都比較高,隨著高度繼續(xù)降低,輻射的通量隨著降低,是商業(yè)飛機(jī)的應(yīng)用高度。
地球上的中子來源分為天然來源和人造來源。天然來源是來自宇宙射線與大氣中的氧和氮的相互作用,中子是太陽耀斑的副產(chǎn)品。人造來源包括核武器、核反應(yīng)堆、醫(yī)療設(shè)備等。
輻射對FPGA器件影響
單粒子翻轉(zhuǎn) (SEU),是指當(dāng)一個重離子撞擊一個電路節(jié)點(diǎn),沉積足夠的電荷使該節(jié)點(diǎn)的狀態(tài)改變。SEU 不僅限于太空應(yīng)用,也會發(fā)生在地面的應(yīng)用,如醫(yī)療、航空電子、汽車、網(wǎng)絡(luò)和基礎(chǔ)設(shè)施。
軟錯誤 (soft error)指存儲器單元或寄存器中可以校正的翻轉(zhuǎn),數(shù)據(jù)被改變,但存儲器單元沒有損壞,一般影響單一比特位,偶爾影響超過一個比特位。
固件錯誤 (firm error)指SRAM FPGA 中配置存儲器的翻轉(zhuǎn),它被稱為“固件”,是因?yàn)殄e誤會一直存在,直到SRAM FPGA重新上電或啟動才能清除。固件錯誤多數(shù)導(dǎo)致功能故障,后果比軟錯誤嚴(yán)重得多,它能夠引起FPGA失效以及整個系統(tǒng)的故障。
FPGA 器件中的輻射影響分為兩大類:數(shù)據(jù)影響(軟錯誤)和配置影響(固件錯誤)。醫(yī)療等地面應(yīng)用中的兩個重要輻射源則包括中子和α粒子。
數(shù)據(jù)影響(軟錯誤)數(shù)據(jù)影響(軟錯誤)包括觸發(fā)器、存儲器單元、組合邏輯單元中的單比特位翻轉(zhuǎn)。如果能夠校正錯誤,則問題不嚴(yán)重,非關(guān)鍵性數(shù)據(jù)可請求重新發(fā)送,對于關(guān)鍵性數(shù)據(jù)可使用 EDAC/FEC、奇偶校驗(yàn)冗余手段來達(dá)到保護(hù)的目的。
配置影響(固件錯誤)是指FPGA 配置元件的單比特位翻轉(zhuǎn),它可以引起 FPGA 故障,也可以影響數(shù)百萬比特位的數(shù)據(jù),甚至可以引發(fā)整個系統(tǒng)的故障。
圖2 中子對集成電路的影響
中子對集成電路的影響如圖2所示,包括:
•中子可能撞擊硅原子,放出重離子
•重離子在 CMOS IC 中引起瞬時電流脈沖
•會改變存儲器單元和觸發(fā)器中的數(shù)據(jù)
輻射如何引發(fā) SRAM FPGA 失效,引起SRAM FPGA 中的配置翻轉(zhuǎn)呢?如圖3所示。
圖3 輻射引發(fā)SRAM FPGA失效
非易失性FPGA
Microsemi非易失性 FPGA 具有配置翻轉(zhuǎn)免疫能力。分為Flash FPGA和反熔絲FPGA,如圖4所示。
圖4 Flash FPGA和反熔絲FPGA
Flash FPGA,高能粒子(大氣中子、太空中的重離子 )不能產(chǎn)生足夠的電荷來讓浮柵錯誤地改變狀態(tài)。
反熔絲FPGA,反熔絲 FPGA 具有一個永久編程的金屬鏈接,不會因高能粒子和其他輻射而發(fā)生改變。
中子導(dǎo)致的數(shù)據(jù)故障(軟錯誤),F(xiàn)lash FPGA 和 SRAM FPGA 的數(shù)據(jù)翻轉(zhuǎn)率相似,這是基于第三方機(jī)構(gòu) iROC Technologies 所做的分析。
翻轉(zhuǎn)率是以每一億小時,每百萬個觸發(fā)器計算,每個故障等于一個D型觸發(fā)器數(shù)據(jù)的翻轉(zhuǎn),可以用EDAC/FEC、奇偶校驗(yàn)、CRC等方法輕易校正。
中子導(dǎo)致的配置故障(固件錯誤),每個故障等于FPGA器件的失效,而越先進(jìn)的工藝通常故障率越高。
深亞微米技術(shù)增加了固件錯誤發(fā)生的概率,半導(dǎo)體的工藝越現(xiàn)金使得由輻射引起的故障率越高,隨著CMOS技術(shù)工藝尺寸繼續(xù)縮小,這對固件錯誤帶來實(shí)質(zhì)性影響。如果器件發(fā)生翻轉(zhuǎn)所需的臨界電荷為QCRIT,QCRIT~VCC×CNODE。更低的電源電壓(VCC)增加了固件錯誤的易感性,使得單粒子翻轉(zhuǎn)更為普遍;更小的柵極面積 (CNODE)使得電容更小,相關(guān)的臨界電荷也會減少,因此也增加了固件錯誤的易感性。在CMOS技術(shù)中,工藝尺寸的縮小,使得柵極面積減小,并使電源電壓降低,這兩個因素都會讓單粒子翻轉(zhuǎn)變得更容易。
Microsemi下一代的Flash FPGA仍將具有固件錯誤免疫能力,由于Flash工藝的特點(diǎn),下一代的Flash FPGA能保持足夠大的浮柵電荷QCRIT可以免受大氣中子的影響。QCRIT與工藝節(jié)點(diǎn)的影響如圖5所示。
高能中子在SRAM FPGA中會產(chǎn)生配置翻轉(zhuǎn)和數(shù)據(jù)翻轉(zhuǎn)兩種效應(yīng)。
配置翻轉(zhuǎn)導(dǎo)致 FPGA 喪失功能,后果十分嚴(yán)重,緩減方式1:三芯片( Triple-Chip )冗余,是把同樣的電路復(fù)制到三個一樣的芯片中,通過表決的方式,當(dāng)其中一個芯片輻射失效,其余的兩個芯片加起來可以仍然可以把正確的結(jié)果算出來。但是這種方式消耗過多的電路板空間及功率,而且需要外部元件進(jìn)行控制和表決。緩減方式2:配置重讀和重載,這種方式不斷重新配置SRAM FPGA把已有的錯誤糾正,但是FPGA有機(jī)會在重載時再次被中子擊中,在高可用系統(tǒng)中是不可接受的。
數(shù)據(jù)翻轉(zhuǎn)導(dǎo)致單一比特位數(shù)據(jù)錯誤,后果取決于數(shù)據(jù)特性。緩減方式簡單,通過FEC、EDAC、數(shù)據(jù)清除,使用容錯性設(shè)計技術(shù)。
整體而言,緩減方式對SRAM FPGA沒有太多作用,因?yàn)榕渲梅D(zhuǎn)占主導(dǎo)地位,而配置元件占SRAM FPGA的大部分面積。
反熔絲和Flash FPGA不存在配置翻轉(zhuǎn), Micorsemi FPGA 器件的配置經(jīng)第三方獨(dú)立實(shí)驗(yàn)室的驗(yàn)證能夠耐受中子、質(zhì)子、γ射線、X 射線以及重離子的影響。反熔絲、Flash 及 SRAM FPGA 出現(xiàn)數(shù)據(jù)翻轉(zhuǎn)的比率相似,導(dǎo)致單一比特位數(shù)據(jù)錯誤,后果取決于數(shù)據(jù)特性。緩減方式簡單,F(xiàn)EC、EDAC、數(shù)據(jù)清除,使用容錯性設(shè)計技術(shù),Micorsemi則已經(jīng)驗(yàn)證了消除數(shù)據(jù)錯誤的緩減技術(shù)。
隨著醫(yī)療設(shè)備變得越來越現(xiàn)金,在醫(yī)療設(shè)備中的電子元件含量不斷增加,使得SEU變得越來越重要,使用輻射源的應(yīng)用很重視SEU免疫力。其中包括
•腫瘤科(使用 X 射線/質(zhì)子源)
•牙科設(shè)備,整形設(shè)備
• CT掃描,透視,乳房X射線攝影設(shè)備
以上這些應(yīng)用的需求需要可靠的劑量、快速和精確的治療、III類/ IV型設(shè)備需要有最小的停機(jī)時間,關(guān)鍵部分的功能不能中斷,不能承受功能性錯誤等。
在網(wǎng)絡(luò)和基礎(chǔ)設(shè)施中的 SEU,在大型的網(wǎng)絡(luò)中往往用到大量的FPGA,特別是一些跨地域的網(wǎng)絡(luò),通常會用到成千上萬的FPGA,其中一個FPGA若發(fā)生問題,也可能會造成整個網(wǎng)絡(luò)的通信影響,特別是一些高海拔的地區(qū),SEU的效應(yīng)更為明顯。根據(jù)統(tǒng)計,在一些大型跨地域的網(wǎng)絡(luò)中,因?yàn)镾EU的引起的通信中斷每幾個小時可能發(fā)生一次,思科公司內(nèi)部也針對SEU提出專門的調(diào)試方案和工作條款。
SEU 的免疫力在航空電子中是非常重要的,例如:飛行計算機(jī),駕駛艙顯示器;引擎控制和監(jiān)控,制動;座艙增壓和空調(diào);電源控制和分配,飛行表面驅(qū)動等。而這些功能如果因?yàn)镾EU而喪失則是不能接受的。
在在汽車電子中的SEU方面,和醫(yī)療應(yīng)用中非常類似,在汽車設(shè)計中,半導(dǎo)體器件的使用越來越普遍,甚至在關(guān)鍵器件中也能看到FPGA的蹤影,在汽車行業(yè)中,新版本的 AEC-Q100 規(guī)范提出 SER(軟錯誤率)的測試需求,使得它成為基于 SRAM 技術(shù)的強(qiáng)制性規(guī)定。
圖5 QCRIT與工藝節(jié)點(diǎn)的影響問答選編
總結(jié)
輻射對于 FPGA 的影響不局限于太空應(yīng)用,SRAM FPGA 器件易于發(fā)生中子引發(fā)的配置錯誤 (固件錯誤),即便在海平面上亦然。
反熔絲和 Flash FPGA 在所有高度上都具有配置故障的免疫能力(獲第三方獨(dú)立研究機(jī)構(gòu)確認(rèn)的數(shù)據(jù)證明)。對于高可用性/高可靠系統(tǒng)的關(guān)鍵任務(wù),應(yīng)該考慮使用反熔絲或Flash FPGA。
問:X射線對FBGA有沒有干擾影響?
答:有的,它可以產(chǎn)生電離性中子而導(dǎo)致SEU。
問:請問FPGA產(chǎn)品出廠之前,通常進(jìn)行輻照效應(yīng)試驗(yàn)嗎?
答:抗輻射系列的是會的。
問:FPGA的抗輻射能力和那些因素?
答:與基本架構(gòu)及工藝有關(guān)。
問:磁環(huán)、磁珠對于輻射的濾波到底有多大幫助呢?如果是3MHz~10MHz的輻射干擾,應(yīng)該怎樣選型磁環(huán)磁珠來對輸入的信號進(jìn)行濾波?
答:這種方法只能對電磁波干擾有作用,對高能粒子無能為力。
問:請問是不是其他的通用MCU容易受到強(qiáng)輻射的影響?Flash的工藝和OTP的工藝受到強(qiáng)輻射的影響會一樣嗎?
答:OTP、Flash都具有抗輻射能力。
問:非易失性FPGA和反熔絲FPGA器件哪種器件更具有抗輻射能力?
答:反熔絲從原理上更好,但是在測試中兩個都未發(fā)現(xiàn)抗輻射失敗現(xiàn)象。
問:如何測試FPGA器件的抗輻射能力?
答:方法有很多,簡單的方法可用FPGA上的存儲器組成一個長列的移位寄存器來比較預(yù)期結(jié)果。
問:在輻射影響方面是配置翻轉(zhuǎn)占主導(dǎo)還是數(shù)據(jù)翻轉(zhuǎn)占主 導(dǎo)?
答:配置翻轉(zhuǎn)主導(dǎo),因?yàn)榕渲脝卧季娣e較大,受影響的機(jī)率也較高。
問:高溫或者低溫對FPGA的容錯能力有影響嗎?
答:在測試中,高溫低溫未發(fā)現(xiàn)異常。但注意器件的工作環(huán)境要求。
問:對于已經(jīng)在使用中的非耐輻射型的FPGA,如何減少輻射的影響?有何建議?
答:使用電路冗余,相當(dāng)于多備份,靈活切換。但這很復(fù)雜,因?yàn)殛P(guān)系到檢測、判決、切換等。功能受到影響是不可避免的,而且就實(shí)際來說,能否實(shí)施還很難說。
問:FPGA的可編程I/O受到輻射粒子的影響會產(chǎn)生什么問題?
答:后果可能非常嚴(yán)重,可能造成IO沖突而導(dǎo)致物理損壞。
問:一般情況下,大功率電機(jī)運(yùn)行中產(chǎn)生的電源干擾,數(shù)據(jù)采集卡或者示波器采集的信號往往發(fā)生很大的失真和高頻諧波干擾,這種干擾對FPGA的影響如何?
答:這種情況屬于EMI/EMC的干擾,與輻射的情況不一樣,但有時候會產(chǎn)生有相同的影響。
問:航空FPGA的設(shè)計,除了反熔絲技術(shù)、三模冗余技術(shù),還有更好的辦法嗎?Microsemi在工藝上又有什么先進(jìn)之處?
答: Flash FPGA也可以使用,大部分Microsemi的抗輻射FPGA除工藝本身以外在片上已包含三模冗余。