基于可配置處理器的嵌入式系統(tǒng)ESL設(shè)計需求
* 算法設(shè)計與實現(xiàn)
* 行為級綜合
* SoC架構(gòu)設(shè)計、仿真及分析
* 構(gòu)建虛擬系統(tǒng)原型
* 功能-架構(gòu)協(xié)同設(shè)計
算法設(shè)計工具允許用戶對算法進(jìn)行描述、仿真,并且可以生成算法實現(xiàn)流程的代碼描述。比如Mathworks的Matlab和Simlink就是這種工具。目前大部分的工具是使用面向數(shù)據(jù)流或數(shù)據(jù)密集型算法進(jìn)行建模,但是也有一些工具,如Mathworks的StateFlow,允許用戶使用有限狀態(tài)機對控制邏輯進(jìn)行描述,并可實現(xiàn)自動生成C代碼。
行為級綜合工具是新一代基于C/C++或SystemC開發(fā)的工具,專門為滿足算法和軟件工程師而非硬件工程師的設(shè)計需要而開發(fā)的。由于使用C/C++,因此仿真速度比使用傳統(tǒng)的RTL方法有了10~1000倍的顯著提高。這也為系統(tǒng)硬件、軟件和算法的聯(lián)合仿真開辟了一條新道路。
用戶通過SoC的架構(gòu)設(shè)計工具使用傳統(tǒng)總線,標(biāo)準(zhǔn)嵌入式處理器庫(如MIPS或ARM),以及其他的一些組件(如存儲器,特殊的硬件模塊和外設(shè)等)來構(gòu)建SoC系統(tǒng)。之后便可以對整個設(shè)計進(jìn)行仿真,通常使用SystemC或C/C++描述的指令集仿真器(ISS)和外圍硬件模塊聯(lián)合仿真。這樣便可分析得到一些系統(tǒng)級的特性,如總線負(fù)荷、競爭,內(nèi)存訪問,處理器負(fù)荷等。這些工具可以從CoWare,ARM,Synopsys等公司得到。
虛擬系統(tǒng)原型工具提供單核或多核SoC平臺的仿真模型,可以以數(shù)十MHz的速度仿真實際系統(tǒng)。系統(tǒng)架構(gòu)師需要在這樣的平臺上運行大量的測試序列,并得到系統(tǒng)性能分析的結(jié)果,軟件開發(fā)人員也可在接近實際的仿真模型中測試他們的嵌入式軟件。
但現(xiàn)今提供的商業(yè)ESL工具沒有一種可以在更早的階段幫助工程師決定系統(tǒng)的基礎(chǔ)架構(gòu),例如決定整個系統(tǒng)需要使用處理器的數(shù)量和種類;需要設(shè)計專門的通信機制還是使用傳統(tǒng)的分級總線;如何將應(yīng)用程序劃分成多個任務(wù),并分配到不同的處理器上運行;如何有效的探索各種可能的設(shè)計方案等?,F(xiàn)在的SoC架構(gòu)設(shè)計工具和ISS要在體系架構(gòu)確定后才有用武之地。
今天的設(shè)計要比上世紀(jì)90年代末處理器加硬件模塊的結(jié)構(gòu)復(fù)雜許多。從最小、最簡單的手持無線設(shè)備到標(biāo)準(zhǔn)的、帶有語音視頻處理功能的蜂窩電話,直至非常復(fù)雜的電子設(shè)備,當(dāng)今的技術(shù)已經(jīng)可以把多顆處理器、多片存儲器、復(fù)雜的片上通信總線網(wǎng)絡(luò),以及由相當(dāng)可觀的硬件模塊組成的協(xié)同工作子系統(tǒng)集成到一顆SoC中。同時應(yīng)用軟件也愈加復(fù)雜,數(shù)百萬行代碼組成的系統(tǒng)軟件已是司空見慣了。因此,使用傳統(tǒng)方法進(jìn)行體系結(jié)構(gòu)設(shè)計變得日益困難,這一切都使得ESL設(shè)計方法學(xué)變得越來越必要。尤其是當(dāng)可配置處理器代替?zhèn)鹘y(tǒng)的固定指令集處理器,可能的設(shè)計方案越來越多時更是如此。
定制指令集處理器(ASIP)
基于特定應(yīng)用定制指令集處理器(ASIP),這一概念在嵌入式系統(tǒng)設(shè)計中變得越來越重要。ASIP的設(shè)計方法學(xué)和開發(fā)工具也在學(xué)術(shù)界和IP設(shè)計領(lǐng)域被提及,并且許多商業(yè)的ESL工具已經(jīng)提供了類似的處理器和協(xié)處理器綜合工具。處理器的指令集大都采用一種中間形式進(jìn)行描述。Tensilica提供的XPRES工具也提供這樣的功能,由Tensilica定義的TIE語言描述的,并且工程師可以應(yīng)用這種語言,進(jìn)一步手動優(yōu)化處理器的特定配置。
如果SoC的設(shè)計是要通過單顆CPU實現(xiàn),也許再增加一些硬件加速器來提升性能,那么現(xiàn)在的這些工具和設(shè)計方??就已經(jīng)足夠了。但事情并非如此簡單,如今已有很多的SoC設(shè)計使用了至少兩顆處理器(一顆是做控制的RISC,另一顆是進(jìn)行數(shù)據(jù)處理的DSP),并且下一代SoC設(shè)計正朝著6~10顆處理器這一方向前進(jìn)。在這種情況下,目前顯然缺乏設(shè)計方??和工具來支持這樣的設(shè)計。
[!--empirenews.page--]使用可配置處理器搭建MPSoC系統(tǒng)
當(dāng)使用多顆處理器尤其是使用可配置處理器來設(shè)計SoC時,將會遇到一些關(guān)鍵問題,包括:
* 一個或一組應(yīng)用需要使用多少顆處理器
* 應(yīng)如何配置、擴(kuò)展這些處理器
* 處理器采用同構(gòu)方式還是異構(gòu)方式
* 處理器之間如何通信?采用標(biāo)準(zhǔn)總線,還是片上網(wǎng)絡(luò)(NoC),采用點到點方式,或是多種方式的組合。
* 如何選擇正確的并行模式,是流水線還是多線程?
* 工程師如何從應(yīng)用程序中提取可并行執(zhí)行的任務(wù)?又怎樣分解他們?
* 在可配置處理器,多處理器,新的通信架構(gòu)以及內(nèi)存選擇等多種可供選擇的技術(shù)下,如何能得到多種設(shè)計方案并進(jìn)行對比?
* 在90nm以下的工藝流程上,如何從10個處理器的設(shè)計擴(kuò)展到100個,甚至1000個處理器?
如今EDA供應(yīng)商所提供的ESL工具還不足以解決這些問題。可配置處理器IP廠商的工具提供了以下流程幫助工程師進(jìn)行設(shè)計:從已有的應(yīng)用程序或算法的軟件代碼開始;分解成多個同步處理進(jìn)程;將各個進(jìn)程分別映射到已經(jīng)優(yōu)化過的處理器上,這些處理器之間有著理想的通信網(wǎng)絡(luò);迭代處理器定義和進(jìn)程映射;分析處理器間通信網(wǎng)絡(luò)的需求;設(shè)計并行控制和調(diào)度模塊;涉及通信網(wǎng)絡(luò)(包括存儲器、總線、隊列等);分析結(jié)果并且迭代其他可能的配置;反復(fù)迭代優(yōu)化直至實現(xiàn)滿足設(shè)計需求的MPSoC系統(tǒng);實現(xiàn)軟件/硬件的具體設(shè)計。
這種自上至下、以應(yīng)用需求為驅(qū)動的設(shè)計流程,在一些MPSoC子系統(tǒng)的應(yīng)用設(shè)計中是非常適合的。尤其是當(dāng)需要一個全新的功能,或者之前的系統(tǒng)設(shè)計方案不足以支持新標(biāo)準(zhǔn)應(yīng)用程序的開發(fā)時,這種從設(shè)計需求和應(yīng)用程序的特征出發(fā)進(jìn)行設(shè)計的方法,往往可以得到最優(yōu)的解決方案。使用這種方法定義系統(tǒng)的體系架構(gòu)時,通過模擬、分析,并迭代得出使用處理器的種類和數(shù)量,內(nèi)存的層次結(jié)構(gòu)以及通信子系統(tǒng)等等是非常有效的。
MPSoC ESL設(shè)計方法需要提供很多功能,這些需要包含在集成開發(fā)環(huán)境(IDE)中,如系統(tǒng)建模,程序映射,各種設(shè)計方案對比,以及對可配置處理器的配置修改。
IDE是最引人注目的部分。Eclipsez作為一個開源軟件,對擴(kuò)展已有的軟件工具、器件、調(diào)試軟件都有很好的支持,而這些功能可以使得MPSoC ESL設(shè)計在更抽象的層次上進(jìn)行。比如可以在Eclipse中加入處理器創(chuàng)建、擴(kuò)展的用戶配置界面,將用戶的配置轉(zhuǎn)化成基于某種特定語言描述的指令擴(kuò)展,之后交給外部的特定編譯器進(jìn)行編譯。因為這一擴(kuò)展被編譯成RTL級的描述,在這種意義下可以使用IDE定制和實現(xiàn)一個軟硬件系統(tǒng)。
IDE軟件提供的項目編輯功能可以支持設(shè)計輸入、修改、映射到特定處理器等操作。同時還要能夠配置處理器、內(nèi)存、通信接口、總線以及外設(shè)等設(shè)備,用以搭建一個完整的系統(tǒng)。IDE還需要支持系統(tǒng)級仿真,可以裝載處理器的ISS,能夠裝載整個系統(tǒng)的仿真模型,靜態(tài)或動態(tài)的追蹤系統(tǒng)級上發(fā)生的事件,能統(tǒng)計處理器的執(zhí)行狀況并記錄數(shù)據(jù),并通過圖形界面向用戶顯示。并需提供分析工具,使得用戶可以方便得到傳輸延遲、資源競爭、處理器等待、內(nèi)存的使用狀況,以及處理器數(shù)據(jù)讀取的平衡狀況等系統(tǒng)級信息。
IP的參數(shù)(meta-data)和一些臨時信息需要使用標(biāo)準(zhǔn)的格式來存儲。近來XML格式被廣泛的使用到工具中,如Mentor Graphics的Platform Express等等?;赬ML格式排版的文件很容易被擴(kuò)展,解析和生成,所以是一種描述存儲系統(tǒng)架構(gòu)和參數(shù)的極具吸引力的方法。
有了系統(tǒng)架構(gòu)的信息,也有了標(biāo)準(zhǔn)格式的ISS模型,便可以生成系統(tǒng)仿真模型用于系統(tǒng)測試。許多已有的ISS支持在SystemC環(huán)境中運行,這樣便可以和總線模型、內(nèi)存模型、硬件模塊模型、外設(shè)模型等其他系統(tǒng)模型在事務(wù)級上進(jìn)行互聯(lián)、仿真。TLM在ESL方??中是一個非常重要的概念,但到目前為止還沒有為TLM上的互操作定義標(biāo)準(zhǔn)。由于沒有一個可用的OSCI TLM標(biāo)準(zhǔn),考慮到OSCI工作的不透明性質(zhì)和其缺乏一個發(fā)展的路線圖,ESL世界里的系統(tǒng)仿真必須繼續(xù)依賴于IP提供商提供的可供互聯(lián)的適配器和用戶自己對“事務(wù)”這一概念的理解。
快速功能仿真,有時也被稱為“虛擬系統(tǒng)原型”,是對周期精確型的TLM模型的重要補充。周期精確型的TLM模型允許對系統(tǒng)運行時的細(xì)節(jié)進(jìn)行分析,每秒鐘只能運行數(shù)千個周期或再多一些,而快速功能仿真則可以數(shù)百萬個周期每秒的速度運行,這對軟件的開發(fā)有著特別的意義。
可配置處理器是高性能MPSoC系統(tǒng)的核心,通過擴(kuò)展指令的自動生成技術(shù)使得在設(shè)計的最后階段仍可修改系統(tǒng)配置。通過在設(shè)計的早期階段自動生成的配置和擴(kuò)展ISA,可將最初的任務(wù)映射到這個處理器上,當(dāng)處理器發(fā)生變化,任務(wù)需要重新被映射時,該過程可以快速反復(fù)迭代進(jìn)行。通過手動對設(shè)計進(jìn)行改善,最終可以通過提高進(jìn)程效率,從而降低處理器頻率,達(dá)到設(shè)計目標(biāo)。自動生成的軟件工具鏈(包括編譯器、ISS、調(diào)試器和IDE擴(kuò)展功能模塊)允許對處理器的每一個修改都可以反映到整體系統(tǒng)中。
本文小結(jié)
復(fù)雜的多顆可配置處理器組成的嵌入式系統(tǒng)設(shè)計對現(xiàn)今的ESL工具提出了更高的要求,這些需求似乎更像是應(yīng)該由IP供應(yīng)商來提供,而不是EDA工具廠商。雖然仍可以使用通用的ESL工具,但具體的流程和特定工具都將是與所使用的IP直接相關(guān)的。