當(dāng)前位置:首頁 > 單片機(jī) > 單片機(jī)
[導(dǎo)讀]受電磁干擾影響,單片機(jī)的程序讀取時(shí)會(huì)出錯(cuò),最終造成程序走飛和數(shù)據(jù)出錯(cuò)。目前廣泛采用的看門狗技術(shù)只對(duì)部分程序走飛現(xiàn)象有效,而對(duì)程序執(zhí)行錯(cuò)造成的數(shù)據(jù)錯(cuò)無效。根據(jù)報(bào)道的受干擾而造成數(shù)據(jù)錯(cuò)概率統(tǒng)計(jì)數(shù)據(jù),計(jì)算出引起MCU系統(tǒng)失效的概率已遠(yuǎn)大于功能安全要求的失效率。為了解決這一問題,需要對(duì)讀取的程序指令加以檢驗(yàn)。國外有的單片機(jī)已經(jīng)添加了這一功能,即糾錯(cuò)編碼(ECC)。本文建議一種簡化的檢驗(yàn)功能,它基于并行的CRC檢驗(yàn),提出了求取并行CRC檢驗(yàn)邏輯的方法。

 引言

筆者2008年在本刊發(fā)表過一篇文章《MCU需要改進(jìn)》,本文就為什么要改,如何改作進(jìn)一步的討論??偟膩碚f,因?yàn)閷?duì)功能安全要求的認(rèn)識(shí)深化,改進(jìn)的必要?jiǎng)t突現(xiàn);而且國際上已經(jīng)有了滿足改進(jìn)的產(chǎn)品,改進(jìn)事實(shí)上已開始,不做的人失去的是競(jìng)爭力,改進(jìn)其實(shí)也不復(fù)雜。

1 發(fā)生錯(cuò)的原因與現(xiàn)有對(duì)策

MCU在工作時(shí)會(huì)受到干擾,在一些空間場(chǎng)合,可能遇到粒子轟擊而產(chǎn)生穩(wěn)態(tài)的翻轉(zhuǎn),即所謂single event upset。而一般工業(yè)場(chǎng)合是電源傳導(dǎo)干擾,受干擾時(shí),電源電壓會(huì)瞬間超出或者略微超出MCU的名義工作電壓,線路的穩(wěn)定性就無法保證。由于各單個(gè)邏輯電路工藝過程中總會(huì)有微小差異,電源電壓的略微超出會(huì)在最弱的邏輯電路中造成指令讀錯(cuò)誤和數(shù)據(jù)讀寫錯(cuò)誤。這種錯(cuò)誤最終表現(xiàn)為數(shù)據(jù)的錯(cuò)誤。

國外對(duì)DRAM出錯(cuò)的研究已做得很多,在參考文獻(xiàn)中轉(zhuǎn)述了出錯(cuò)的概率:“谷歌(Google)使用了大量服務(wù)器,2009年的大規(guī)模統(tǒng)計(jì)。出錯(cuò)的概率是2.5~7×10-11error/bit/h。”即8G RAM每小時(shí)會(huì)有5個(gè)錯(cuò)。

現(xiàn)在對(duì)于有功能安全要求的系統(tǒng),安全等級(jí)為SIL2時(shí),出錯(cuò)的概率應(yīng)小于10-7”/h?,F(xiàn)在控制器所用的MCU的Flash與RAM的大小已達(dá)128 K~1 Mb,參考上述概率,如果缺少程序的保護(hù),將會(huì)有1M×7×10-11 error/h=7×10-5 error/h,這遠(yuǎn)大于功能安全要求的出錯(cuò)概率。

從功能安全的角度,系統(tǒng)中任何影響功能的錯(cuò)誤都是應(yīng)該被檢測(cè)出來的,如果這個(gè)錯(cuò)誤危及人類生命或造成設(shè)備的重大損失,那么就必須有防范的措施,必要時(shí)就必須糾正錯(cuò)誤。然而要達(dá)到這種要求是很難的,需要付出很大的代價(jià)。以數(shù)據(jù)錯(cuò)誤為例,人們常常重復(fù)計(jì)算多次,然后把占多數(shù)的結(jié)果代表正確的結(jié)果。這樣,數(shù)據(jù)分享前的結(jié)果都要經(jīng)表決,否則發(fā)現(xiàn)錯(cuò)會(huì)太晚,影響一致性。這就需要更多的硬件資源與開發(fā)成本。即便如此,如果作為表決器的環(huán)節(jié)仍是MCU的一個(gè)程序,它仍然可能會(huì)受錯(cuò)誤指令的干擾,未能完全攔住錯(cuò)誤。

為了節(jié)省成本,更多的應(yīng)用并沒有采用這種冗余與表決的方法。它們往往以不死機(jī)作為目標(biāo),只要不死機(jī),由控制對(duì)象來的新信息就可以重算出新的正確結(jié)果。即使上一次算出的錯(cuò)了,其后果也只延續(xù)了一個(gè)采樣周期。這種策略對(duì)有累積效應(yīng)的應(yīng)用是無效的,就像參考文獻(xiàn)中討論的積分功能會(huì)失敗。又如運(yùn)行結(jié)果與過程密切相關(guān)的應(yīng)用,例如可編程控制器(PLC),數(shù)據(jù)的錯(cuò)誤會(huì)導(dǎo)致控制邏輯的混亂。

保證不死機(jī)的主要措施是采用看門狗技術(shù),如果程序走飛,在一定時(shí)間內(nèi)沒有復(fù)位計(jì)時(shí)器,計(jì)時(shí)器就會(huì)溢出,產(chǎn)生MCU的重新啟動(dòng),重新初始化可以糾正損壞了的數(shù)據(jù)??撮T狗技術(shù)是不管數(shù)據(jù)正確性的,因?yàn)橹噶铄e(cuò)了程序未必走飛,而指令錯(cuò)了數(shù)據(jù)錯(cuò)的可能性極大。

2 錯(cuò)誤現(xiàn)象與錯(cuò)誤校正方案

MCU的指令在讀取時(shí)發(fā)生錯(cuò)誤就會(huì)產(chǎn)生不同的執(zhí)行結(jié)果,在參考文獻(xiàn)中以8051的MOV指令為例,當(dāng)有一位讀錯(cuò)時(shí)就變成跳轉(zhuǎn)、除法、減法、交換、增1等等指令。實(shí)際上大部分MCU都會(huì)有指令錯(cuò)而執(zhí)行結(jié)果錯(cuò)的問題,因?yàn)檫@些指令內(nèi)沒有檢驗(yàn)錯(cuò)的機(jī)制。MC68HC11的LDA指令有1位錯(cuò)時(shí)可能轉(zhuǎn)為加法、減法、送立即數(shù)到累加器B、送狀態(tài)存器、送堆棧指針等指令,如表1所列。

雖然筆者注意到這種出錯(cuò)的可能性比較早(1990年),但是在寫參考文獻(xiàn)時(shí)(2008年)并不知道Freescale公司(2005年)的16位單片機(jī)中已經(jīng)有了對(duì)指令添加檢錯(cuò)與糾錯(cuò)的措施。參考文獻(xiàn)中提到:“當(dāng)系統(tǒng)遇到強(qiáng)干擾時(shí),CPU在讀取指令或數(shù)據(jù)時(shí)可能出現(xiàn)錯(cuò)誤,如果指令或數(shù)據(jù)僅僅是某一位出現(xiàn)錯(cuò)誤,ECC模塊會(huì)自動(dòng)糾正這一位的錯(cuò)誤,使系統(tǒng)照常運(yùn)行,如果出現(xiàn)二位或二位以上的錯(cuò)誤,則ECC會(huì)以中斷方式通知CPU,出現(xiàn)了讀程序錯(cuò)或讀數(shù)據(jù)錯(cuò)。”

根據(jù)參考文獻(xiàn),F(xiàn)reescale公司的16位單片機(jī)MC9S12P128的Flash部分32位的程序有7位特征,構(gòu)成糾錯(cuò)編碼(error correction code),可以糾正1位錯(cuò)和發(fā)現(xiàn)2位錯(cuò)。Flash部分16位的數(shù)據(jù)有6位特征,構(gòu)成糾錯(cuò)編碼ECC,可以糾正1位錯(cuò)和發(fā)現(xiàn)2位錯(cuò)。因此對(duì)指令的檢錯(cuò)糾錯(cuò)已經(jīng)是批量使用了。最近AMD也推出了G系列嵌入式SoC平臺(tái),它也采用了ECC技術(shù)。

ECC技術(shù)在企業(yè)級(jí)服務(wù)器中使用比較早,它考慮了DRAM的特點(diǎn),例如內(nèi)存插條中由多個(gè)芯片構(gòu)成,就從每個(gè)芯片的對(duì)應(yīng)位集合起來,再加校驗(yàn)位。然后又有對(duì)應(yīng)的診斷設(shè)計(jì),可以找出出錯(cuò)多的內(nèi)存條,以便更換。所以它與單片機(jī)上的使用情況還是有區(qū)別的(更換是不可能的),直接照抄是不必要的。

從Freescale公司的ECC可知,它的海明距離HD=3,而且采用了糾錯(cuò)措施。如果僅僅檢錯(cuò),那么實(shí)現(xiàn)起來更簡單一點(diǎn)。檢測(cè)出錯(cuò)后的處理措施就比較容易設(shè)計(jì),例如產(chǎn)生中斷,把該指令重取,由于是硬件中的措施,不必考慮添加入棧/出棧保護(hù)現(xiàn)場(chǎng)的動(dòng)作,開銷很少。如果必要,還可以在另外的地方保存出錯(cuò)統(tǒng)計(jì)信息,以及觸發(fā)更復(fù)雜的保護(hù)措施。

3 簡化報(bào)錯(cuò)與糾錯(cuò)方案

從現(xiàn)在單片機(jī)的發(fā)展趨勢(shì)來看,因?yàn)?2位單片機(jī)價(jià)格的下降,市場(chǎng)將分化為8位與32位兩極。在中國8位機(jī)主要是8051體系,已經(jīng)培育了較大的市場(chǎng)和大量熟悉的人才,而且也有自制8051的能力,所以在8051上添加檢驗(yàn)碼是合理的選擇。如果增加了這一功能,無疑會(huì)提高使用8051系統(tǒng)的可信賴性,提升產(chǎn)品檔次,延長產(chǎn)品的壽命周期。另一方面,其實(shí)現(xiàn)也比較簡單,相信基于ARM的32位機(jī)也會(huì)添加這種指令檢驗(yàn)機(jī)制,成本也要上升。

對(duì)MCU程序加保護(hù)的廠家還不多見,即使是Freescale公司也還沒有對(duì)所有的MCU添加保護(hù),因?yàn)樘砑颖Wo(hù)是要增加成本的,所以添加保護(hù)的方法是值得研究的課題。

對(duì)于8位指令代碼檢錯(cuò),可以選擇低階次的CRC。由參考文獻(xiàn)可知可以選4位CRC,其生成多項(xiàng)式是G=X4+X+1。它可以保證HD=3的數(shù)據(jù)字長為11位,已超過所需的8位。這里因?yàn)閿?shù)據(jù)字8位是一次取出,所以CRC是并行計(jì)算的,由數(shù)據(jù)字到CRC的求取的方法推導(dǎo)如圖1所示。

假定數(shù)據(jù)字用D表示,生成多項(xiàng)式用G表示,Gm為最高階的系數(shù),等于1。那么習(xí)慣的做法在除到Dn位時(shí),判斷Dn值。若Dn=1,則將G和D的對(duì)應(yīng)位對(duì)齊,用模2加法求取余數(shù),Mn-i=Dn-i+Gm-i,用余數(shù)Mn-i代替原來的Dn-i移位。如果Dn=0,則不做加法,Mn-i=Dn-i,然后移位,也可以說用余數(shù)Mn-i代替原來的Dn-i移位。我們的目的是直接由D來產(chǎn)生余數(shù),所以做了修改。修改方法是,當(dāng)對(duì)齊后的Gm- i=1時(shí),取Mn-i=Dn-i+Dn。當(dāng)Gm-i=0時(shí),對(duì)應(yīng)項(xiàng)不做模2加?,F(xiàn)在證明這兩種方法是等效的:

Dn=0,Gm-i=0時(shí),習(xí)慣方法Mn-i=Dn-i;修改方法Mn-i=Dn-i。

Dn=0,Gm-i=1時(shí),習(xí)慣方法Mn-i=Dn-i;修改方法Mn-i=Dn-i+Dn=Dn-i。

Dn=1,Gm-i=0時(shí),習(xí)慣方法Mn-i=Dn-i+Gm-i=Dn-i;修改方法Mn-i=Dn-i。

Dn=1,Gm-i=1時(shí),習(xí)慣方法Mn-i=Dn-i+Gm-i=Dn-i+1;修改方法Mn-i=Dn-i+Dn=Dn-i+1。

現(xiàn)在對(duì)G=X4+X+1時(shí)8位指令的數(shù)據(jù)字用修改方法求取CRC各位的值,為了閱讀方便,將數(shù)據(jù)字的各位用數(shù)字代表,例如7代表D7。參與模2加的各位就以各數(shù)字連寫在一起。例如CRC的最高一位是7 532,它代表D7、D5、D3、D2的模2加法結(jié)果。通過建立真值表,它們最后都可以用組合邏輯來實(shí)現(xiàn),所以在取指完成后就立即可以判出是否有錯(cuò)。求取并行解CRC邏輯的過程如圖2所示。

這種推導(dǎo)并行CRC值的方法也可以用于較長的指令,當(dāng)然,為了避免手算的錯(cuò)誤,應(yīng)該以程序來求,這不是難事。

8位指令用4位CRC保護(hù)開銷是大了一點(diǎn),但是它的保護(hù)強(qiáng)度也大了,對(duì)于16位的指令程序,用二次8位保護(hù),有4個(gè)錯(cuò)是肯定可以檢測(cè)出來的,如果像Freescale技術(shù)用掉6位保護(hù),只能保證有2個(gè)錯(cuò)可以檢測(cè)出來。所以這是折中的方法。

對(duì)于16位指令,可以用5位CRC保護(hù),參考文獻(xiàn)中G=X5+X2+1可以在26位數(shù)據(jù)字長上獲得HD=3。對(duì)于32位指令,可以用6位CRC保護(hù),參考文獻(xiàn)中G=X6+X+1可以在57位數(shù)據(jù)字長上獲得HD=3。由此可見,如果僅檢錯(cuò)而靠重傳作糾錯(cuò),校驗(yàn)項(xiàng)比Freescale都要省一位,用重取指令的方法可以節(jié)省開銷。

這種方法也可以對(duì)數(shù)據(jù)存取加以保護(hù)。在以現(xiàn)有MCU為主的單板嵌入式計(jì)算機(jī)中,添加程序保護(hù)也有很重要的意義,如何實(shí)施是值得研究的課題。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉