當(dāng)前位置:首頁(yè) > EDA > 電子設(shè)計(jì)自動(dòng)化
[導(dǎo)讀]摘要:本文以星載測(cè)控系統(tǒng)為背景,提出了一種基于 Actel Flash FPGA的高可靠設(shè)計(jì)方案。采用不易發(fā)生單粒子翻轉(zhuǎn)的 flash FPGA芯片,結(jié)合 FPGA內(nèi)部的改進(jìn)型三模冗余、分區(qū)設(shè)計(jì)和降級(jí)重構(gòu),實(shí)現(xiàn)了高實(shí)時(shí)、高可靠的系統(tǒng)。

摘要:本文以星載測(cè)控系統(tǒng)為背景,提出了一種基于 Actel Flash FPGA的高可靠設(shè)計(jì)方案。采用不易發(fā)生單粒子翻轉(zhuǎn)的 flash FPGA芯片,結(jié)合 FPGA內(nèi)部的改進(jìn)型三模冗余、分區(qū)設(shè)計(jì)和降級(jí)重構(gòu),實(shí)現(xiàn)了高實(shí)時(shí)、高可靠的系統(tǒng)。

2 引言

在復(fù)雜的空間環(huán)境中存在各種高能粒子和宇宙射線,星載系統(tǒng)的電子器件容易發(fā)生單粒子翻轉(zhuǎn)等錯(cuò)誤,造成整個(gè)系統(tǒng)的崩潰。對(duì)于星載系統(tǒng)而言,可靠性是非常重要的一項(xiàng)性能指標(biāo)。在系統(tǒng)研制時(shí),必須保證系統(tǒng)在局部出現(xiàn)故障時(shí)屏蔽和容忍錯(cuò)誤,把錯(cuò)誤造成的損失降到昀低。比較常用的可靠性措施包括選用抗擾等級(jí)高的元器件和適當(dāng)?shù)钠帘卧O(shè)計(jì)等,但是這些措施都無法絕對(duì)預(yù)防永久性故障的發(fā)生,為了滿足衛(wèi)星可靠性的要求必須進(jìn)行冗余設(shè)計(jì)。

本文中的設(shè)計(jì)就采用 Flash型 FPGA取代了 SRAM型 FPGA,前者在結(jié)構(gòu)上的特點(diǎn)決定了它不容易發(fā)生單粒子翻轉(zhuǎn)等錯(cuò)誤,從而在固件上提高了可靠性。同時(shí)采用了改進(jìn)型的 TMR冗余設(shè)計(jì),在保障可靠性的同時(shí)也兼顧了實(shí)時(shí)性。

3 基本思想和系統(tǒng)實(shí)現(xiàn)

3.1 Flash型 FPGA概述目前廣泛用于電子產(chǎn)品的 FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門陣列)主要有反熔絲型、SRAM型和 Flash型三種。反熔絲型 FPGA利用熔絲點(diǎn)的通斷來存儲(chǔ)編程信息,只能燒寫一次,可靠性很高,但是同時(shí)開發(fā)成本也很高,一般只在成熟正品中使用。

SRAM型 FPGA使用非常廣泛,它的可編程單元是六管結(jié)構(gòu),編程信息是保存在附加的 PROM里的,每次上電時(shí)從 PROM中加載到 FPGA中,斷電后編程內(nèi)容消失。在航天應(yīng)用中,SRAM型 FPGA昀大的缺點(diǎn)是容易發(fā)生單粒子翻轉(zhuǎn)(Single Event Upset, SEU),以及上電加載過程中容易產(chǎn)生錯(cuò)誤指令。

Flash型 FPGA的可編程單元是兩個(gè)三極管組成的 flash開關(guān),其中一個(gè)只在編程時(shí)起傳感器作用,另一個(gè)控制開關(guān)的通斷,兩個(gè)管子共享的浮柵門存儲(chǔ)了編程信息。 Flash型 FPGA無需附加 PROM,上電時(shí)間也很短,另外 flash相比于 SRAM不容易出現(xiàn)單粒子翻轉(zhuǎn),因此 Flash型 FPGA很適合航天應(yīng)用。

本文中的遙控系統(tǒng)采用 Actel公司的 ProASIC plus系列的 APA300芯片。

3.2 系統(tǒng)描述

本文主要實(shí)現(xiàn)了高可靠遙控系統(tǒng)中將地面和星載計(jì)算機(jī)發(fā)送的串行碼字譯碼成對(duì)應(yīng)通道指令脈沖的功能,全部功能在一塊 FPGA中實(shí)現(xiàn)。遙控電路板上采用兩塊相同的 FPGA進(jìn)行雙機(jī)熱備份,通過 54LVC244選擇輸出。每塊 FPGA內(nèi)部又采用了下面描述的改進(jìn)型 TMR設(shè)計(jì)。該系統(tǒng)完成了遙控譯碼的功能,各指令響應(yīng)正常。

本文重點(diǎn)介紹 FPGA片內(nèi)的改進(jìn)型 TMR冗余設(shè)計(jì)。

3.3 改進(jìn)型 TMR設(shè)計(jì)

三模冗余(TMR)是一種常用的容錯(cuò)技術(shù),把需要容錯(cuò)的部分復(fù)制三份,然后由表決器根據(jù)多數(shù)表決原則輸出結(jié)果。TMR屬于靜態(tài)冗余技術(shù),它能夠掩蓋 1個(gè)子系統(tǒng)的錯(cuò)誤,而不能修復(fù)錯(cuò)誤。當(dāng) 2個(gè)或 2個(gè)以上的子系統(tǒng)出錯(cuò),或者表決器出錯(cuò)時(shí),TMR系統(tǒng)將輸出錯(cuò)誤的結(jié)果。TMR技術(shù)的優(yōu)點(diǎn)是簡(jiǎn)單易行,對(duì)于瞬時(shí)出現(xiàn)的錯(cuò)誤具有良好的容錯(cuò)效果,但是代價(jià)是付出了 3倍的面積開銷。

本文設(shè)計(jì)中采用的改進(jìn)型 TMR,實(shí)質(zhì)上是一種 3+n模冗余,N個(gè)子系統(tǒng)中昀多只有三個(gè)子系統(tǒng)同時(shí)處于運(yùn)行狀態(tài),其余的 N-3個(gè)子系統(tǒng)作為備份隊(duì)列,當(dāng)某個(gè)子系統(tǒng)出現(xiàn)錯(cuò)誤時(shí),表決模塊用備份的子系統(tǒng)替換下錯(cuò)誤的子系統(tǒng),繼續(xù)維持 TMR結(jié)構(gòu)。當(dāng)已無備份可用時(shí), 3模冗余系統(tǒng)可以進(jìn)行降級(jí)重構(gòu),由 3模冗余降級(jí)為 1模。由于延長(zhǎng)了三模冗余系統(tǒng)的工作時(shí)間,整個(gè)系統(tǒng)的可靠性得到了很大提高。

考慮到資源消耗與可靠性提高的平衡,本文設(shè)計(jì)中采用了 3+1模結(jié)構(gòu),也就是 3模冗余, 1模備份。3+1模結(jié)構(gòu)的工作方式為:正常時(shí)進(jìn)行三模冗余表決輸出,出現(xiàn)第 1次永久性故障時(shí)表決處理模塊能夠檢測(cè)出錯(cuò)誤,在輸出正常信號(hào)的同時(shí)用備用子系統(tǒng)替換故障子系統(tǒng),繼續(xù)維持 TMR結(jié)構(gòu);出現(xiàn)第 2 次永久故障時(shí),表決處理模塊仍然能夠檢測(cè)出錯(cuò)誤,在輸出正常信號(hào)的同時(shí)切除故障子系統(tǒng),自動(dòng)降級(jí)為單模工作直至單模子系統(tǒng)完全損壞。這種 3+1模結(jié)構(gòu)借鑒了軟件容錯(cuò)中的恢復(fù)塊技術(shù)和動(dòng)態(tài)冗余結(jié)構(gòu),能夠容忍至少 2個(gè)子系統(tǒng)錯(cuò)誤。由于 APA300實(shí)現(xiàn)遙控系統(tǒng)資源余量較大,采用了單片 FPGA片內(nèi)冗余的方案,進(jìn)一步簡(jiǎn)化了系統(tǒng)的復(fù)雜度。

3+1模結(jié)構(gòu)的狀態(tài)轉(zhuǎn)移圖如下, TMR、SMR和 Failure三個(gè)狀態(tài)分別代表三模冗余、單模工作和系統(tǒng)失效。

在設(shè)計(jì)中,通過冗余單元的互鎖機(jī)制(Inter-Lock, IL)來防止錯(cuò)誤數(shù)據(jù)通過冗余單元邊界傳播,為此采用了分區(qū)約束的方法進(jìn)行布局布線設(shè)計(jì)。分區(qū)設(shè)計(jì)不僅能夠隔離錯(cuò)誤,而且可以充分利用 APA300的 Spine分布,減少路徑延遲。

在用戶約束文件 GCF文件中作如下約束:

這四條語句把 U1~U4四個(gè)子系統(tǒng)分別限制在一個(gè) spine內(nèi),除了全局時(shí)鐘線和輸入輸出線以外,子系統(tǒng)之間沒有直接的連接,這樣分區(qū)布局布線以后就能夠有效地隔離錯(cuò)誤。

在保證可靠性的同時(shí),3+1模設(shè)計(jì)昀大程度的保證了輸出的實(shí)時(shí)性,不需要經(jīng)過關(guān)機(jī)等待周期、重發(fā)指令周期或者輸出不確定周期,能夠連續(xù)輸出正確結(jié)果直到系統(tǒng)完全倒向錯(cuò)誤狀態(tài)。為了避免系統(tǒng)重構(gòu)時(shí)過快降級(jí),考慮到很多錯(cuò)誤是瞬時(shí)出現(xiàn)又隨即恢復(fù)的軟錯(cuò)誤,因此設(shè)定錯(cuò)誤出現(xiàn)一定次數(shù)(例如 3次)以后才去掉故障模塊。

對(duì)于 3+1模結(jié)構(gòu),可靠性提高的代價(jià)是付出了 4倍的資源開銷,另外輸出時(shí)間延遲會(huì)略有增加,因?yàn)殛P(guān)鍵路徑上的表決器增加了判斷、替換的邏輯單元。因此這種結(jié)構(gòu)只適用于資源充裕、系統(tǒng)頻率不高的場(chǎng)合。在空間應(yīng)用系統(tǒng)中,工作速度往往不是昀重要的,因而 3+1模結(jié)構(gòu)實(shí)質(zhì)上是用速度換面積(可靠性),在資源不足的情況下可以只對(duì)關(guān)鍵模塊、錯(cuò)誤敏感率高的模塊進(jìn)行冗余,以節(jié)省資源。

4 系統(tǒng)可靠性分析

假設(shè)單機(jī)的可靠性為(運(yùn)行 5年后) , 普通 TMR和本文中改進(jìn)型 TMR的可靠性分別為。由于 2個(gè)以上子系統(tǒng)同時(shí)發(fā)生錯(cuò)誤的概率很小,假定同一時(shí)刻昀多只有一個(gè)子系統(tǒng)發(fā)生錯(cuò)誤。

TMR可以容忍 1個(gè)子系統(tǒng)錯(cuò)誤,可靠性相當(dāng)于 3個(gè)子系統(tǒng)都正常的可靠性加上某一個(gè)子系統(tǒng)錯(cuò)誤、其它兩個(gè)子系統(tǒng)正常的可靠性:

同理,改進(jìn)型 TMR的可靠性相當(dāng)于以下三種情況的可靠性之和:

1)4個(gè)子系統(tǒng)都正常

2)1個(gè)子系統(tǒng)錯(cuò)誤,其它 3個(gè)子系統(tǒng)正常

3)2個(gè)子系統(tǒng)錯(cuò)誤,其它 2個(gè)子系統(tǒng)正常

取一系列的 R0值(0≤R0≤1),按(1)(2)兩式計(jì)算出 RTMR和 RTMR+1如下表 1:

由表 1可以看出, 3+1模結(jié)構(gòu)的可靠性遠(yuǎn)高于 3模冗余和單模工作,特別是在子模塊可靠性降低的情況下提高可靠性的效果更為顯著。

5 結(jié)論

本文提出了一種基于 Flash型 FPGA的高可靠系統(tǒng)解決方案,改進(jìn)型的 TMR冗余利用片內(nèi)備份的子系統(tǒng)替換出錯(cuò)的系統(tǒng),能夠長(zhǎng)期維持 TMR系統(tǒng),有效地提高可靠性。本文所述思想同樣適用于多芯片 /多機(jī)情況下的冗余方案。本系統(tǒng)即將應(yīng)用于某航天型號(hào)設(shè)備中,經(jīng)過初步聯(lián)試證明本系統(tǒng)能夠滿足可靠性和性能的要求。

本文作者創(chuàng)新點(diǎn):1、將 Flash FPGA用于星載測(cè)控系統(tǒng),提高了固件可靠性;2、改進(jìn)型 TMR(3+1模冗余)改善了三模冗余的不足,延長(zhǎng)了系統(tǒng)使用時(shí)間,大大提高了系統(tǒng)的可靠性。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉