基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計(jì)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
摘要:多DSP信號(hào)處理板廣泛地運(yùn)用于工業(yè)、軍事、通信和醫(yī)療等許多方面。本文介紹一種基于VxWorks實(shí)時(shí)操作系統(tǒng)的ADSP21160的多DSP板設(shè)計(jì),以及該板在數(shù)字式聲納的實(shí)時(shí)信號(hào)處理系統(tǒng)中的應(yīng)用,并介紹在VxWorks實(shí)時(shí)操作系統(tǒng)下的軟件算法仿真和實(shí)現(xiàn)。 關(guān)鍵詞:多DSP陣列 聲納系統(tǒng) VxWorks 近年來(lái),計(jì)算機(jī)產(chǎn)品的應(yīng)用領(lǐng)域越來(lái)越廣,數(shù)字信號(hào)處理器的發(fā)展表現(xiàn)得尤為明顯。DSP芯片制造商和DSP板開(kāi)發(fā)商利用自身的優(yōu)勢(shì)不斷開(kāi)發(fā)出多DSP結(jié)構(gòu)的產(chǎn)品來(lái)滿足這種需求。通常的DSP設(shè)備是與嵌入式系統(tǒng)相結(jié)合,來(lái)實(shí)時(shí)地完成某一特定任務(wù)。隨著信號(hào)采集速度和處理速度的要求越來(lái)越高,許多領(lǐng)域都需要進(jìn)行多處理器運(yùn)算,其中包括醫(yī)學(xué)、圖像處理、軍事、工業(yè)控制、電信等許多領(lǐng)域。多處理器系統(tǒng)可以根據(jù)所需實(shí)現(xiàn)的功能和處理器的性能來(lái)調(diào)節(jié)處理結(jié)點(diǎn)的數(shù)目,使系統(tǒng)達(dá)到最佳的性能價(jià)格比。 實(shí)際上,只有從芯片開(kāi)始仔細(xì)設(shè)計(jì),才能方便地實(shí)現(xiàn)多處理器系統(tǒng)的調(diào)節(jié)功能。這里選用的是AD公司新出品的SHARC級(jí)處理器ADSP21160。 ADSP21160具有很大的片內(nèi)存儲(chǔ)區(qū)、多重內(nèi)部總線結(jié)構(gòu)、獨(dú)立的I/O子系統(tǒng);具有構(gòu)造多處理器系統(tǒng)的所有特點(diǎn),能夠真正支持處理器數(shù)目的可調(diào)節(jié)功能,十分適合組成高性能浮點(diǎn)的多DSP系統(tǒng)。 VxWorks是目前世界上用戶數(shù)量最大的實(shí)時(shí)操作系統(tǒng)。這使它除了具有優(yōu)越的技術(shù)性能之外,還具有豐富的應(yīng)用軟件支持、良好的技術(shù)服務(wù)和可靠的系統(tǒng)穩(wěn)定性。由于它具有以上優(yōu)點(diǎn),本系統(tǒng)中選用了VxWorks作為MVME167的操作系統(tǒng)。 一、ADSP21160的特點(diǎn) ADSP21160 是AD公司采用超級(jí)哈佛結(jié)構(gòu)的一種新產(chǎn)品。21160的匯編代碼與2106x兼容,處理器具有SIMD(單指令流多數(shù)據(jù)流)功能;而2106x只具有SISD(單指令流單數(shù)據(jù)流)功能。為了充分利用這種新的功能,一些指令做了一些改變。ADSP21160包括1個(gè)100/150MHz的運(yùn)算核、雙端片內(nèi)SRAM、1個(gè)支持多處理器的集成在片內(nèi)的I/O處理器和多重內(nèi)部總線以消除I/O瓶頸。 ADSP21160包括2個(gè)運(yùn)算處理單元,具有SIMD功能。處理單元指的是PEX和PEY。PEX始終是有效的,而PEY的有效是通過(guò)設(shè)置MODE1寄存器中的PEYEN位來(lái)實(shí)現(xiàn)的。當(dāng)PEY模式有效時(shí),同一條指令在2個(gè)處理器單元中都得到執(zhí)行,但每一個(gè)處理器單元中的操作數(shù)不同。 SIMD模式在存儲(chǔ)區(qū)和處理器單元之間的數(shù)據(jù)傳輸也是很有作用的。當(dāng)使用SIMD模式,通過(guò)加倍數(shù)據(jù)帶寬來(lái)保證處理器單元的操作。在SIMD模式,當(dāng)使用DAGs來(lái)傳輸數(shù)據(jù)時(shí),存儲(chǔ)區(qū)每次訪問(wèn)所傳輸?shù)氖莾蓚€(gè)數(shù)據(jù)值。 ADSP21160包括4Mbit的片內(nèi)SRAM,分為兩塊,每一塊2Mbit。可以定義為不同字長(zhǎng)的指令和數(shù)據(jù)存儲(chǔ)。每一個(gè)存儲(chǔ)塊的雙端口結(jié)構(gòu)可以使存儲(chǔ)塊獨(dú)立地被運(yùn)算核處理和I/O處理器訪問(wèn)。21160的存儲(chǔ)區(qū)最大可以容納128K的32bit數(shù)據(jù),或256K的16bit數(shù)據(jù),或85K的48bit指令,或其他混合字長(zhǎng)的數(shù)據(jù),但總和最大為4Mbit。所有存儲(chǔ)區(qū)可以16、32、48、64bit字長(zhǎng)的字訪問(wèn)。 外端口支持處理器與片外存儲(chǔ)器及外設(shè)的接口,片外的4G地址空間屬于21160的統(tǒng)一地址空間。 外端口支持同步、異步及同步BURST訪問(wèn)。DMA控制器的操作相對(duì)處理器運(yùn)算核是獨(dú)立和不可見(jiàn)的,即DMA操作可與執(zhí)行指令同時(shí)進(jìn)行。DMA傳輸可以在內(nèi)部存儲(chǔ)區(qū)與外部存儲(chǔ)區(qū)、外圍設(shè)備或主機(jī)之間進(jìn)行。21160共有14個(gè)DMA通道,其中:連接口(linkport)占6個(gè);串口占4個(gè);外端口(external port)占4個(gè)。21160可以通過(guò)DMA傳輸來(lái)下載程序,外圍異步設(shè)備也可以通過(guò)DMA請(qǐng)求/應(yīng)答線來(lái)控制2個(gè)DMA通道。 21160具有許多特點(diǎn)支持多DSP系統(tǒng)。外端口與連接口支持多處理器系統(tǒng)的直接連接,外端口支持統(tǒng)一的地址空間,允許DSP之間互相訪問(wèn)。片內(nèi)具有分布式總線仲裁邏輯,最多支持6片21160和主機(jī)連接。外端口的最大數(shù)據(jù)傳輸率為400MB/s,廣播寫(xiě)信號(hào)可以同時(shí)發(fā)送到各片21160。6個(gè)連接口提供了另一種方法實(shí)現(xiàn)多處理器之間的通信。連接口的最高傳輸速率為600MB/s。 整個(gè)系統(tǒng)基于VME總線。VME總線系統(tǒng)作為最早的國(guó)際通用開(kāi)放式總線,自1981年起,經(jīng)歷了近20年的發(fā)展。其影響不斷擴(kuò)大,功能不斷完善,現(xiàn)已成為性能最好、應(yīng)用最廣的國(guó)際總線標(biāo)準(zhǔn)之一。 根據(jù)設(shè)計(jì)要求,采用了4片ADSP21160。片外共享內(nèi)存SRAM可以被主機(jī)和各片DSP直接訪問(wèn);EPROM用來(lái)存放初始化程序和各片DSP要運(yùn)行的程序,在系統(tǒng)上電后這些程序被下載到各片DSP中;LEDs用來(lái)顯示插件的狀態(tài),如reset、normal等。每一片都有1個(gè)連接口連到插件的前面板,這樣前端采集來(lái)的數(shù)據(jù)就可以很方便地傳輸?shù)蕉郉SP上,而且也使數(shù)據(jù)的傳輸模式更加靈活。 連接口(linkport)是SHARC系列DSP芯片的一個(gè)特點(diǎn)。ADSP21160共有6個(gè)8bit連接口提供額外的I/O服務(wù)。在100MHz時(shí)鐘下運(yùn)行時(shí),每個(gè)連接口可達(dá)100MB/s。連接口尤其適合多處理器間點(diǎn)到點(diǎn)的連接。連接口可以獨(dú)立地同時(shí)操作,通過(guò)連接口的數(shù)據(jù)封裝成48/32bit字長(zhǎng)后,可以從片內(nèi)存儲(chǔ)區(qū)直接被運(yùn)算核讀取或DMA傳輸。每一個(gè)連接口有它自己的雙緩沖I/O寄存器,數(shù)據(jù)傳輸可編程,硬件由時(shí)鐘/應(yīng)答握手線控制。4片DSP使用連接口實(shí)現(xiàn)DSP間兩兩互連。 21160的主機(jī)接口可以很方便地與標(biāo)準(zhǔn)微處理器總線(16/32bit)相連,幾乎不需要額外硬件。主機(jī)通過(guò)21160的外端口對(duì)其進(jìn)行訪問(wèn),存儲(chǔ)區(qū)地址映射為統(tǒng)一的地址空間。4個(gè)DMA通道可以用于主機(jī)接口,代碼和數(shù)據(jù)傳輸?shù)能浖_(kāi)銷很小,主處理器通過(guò)HBR、HBG和REDY信號(hào)線與21160進(jìn)行通信,主機(jī)可以對(duì)片內(nèi)存儲(chǔ)區(qū)進(jìn)行直接讀寫(xiě)。 二、開(kāi)發(fā)環(huán)境Tornado VxWorks的開(kāi)發(fā)環(huán)境是WindRiver公司提供的Tornado。Tornado采用主機(jī)-目標(biāo)機(jī)開(kāi)發(fā)方式,主機(jī)系統(tǒng)可采用運(yùn)行Sun Solaris、HP-UX以及Win95/NT的工作站或個(gè)人計(jì)算機(jī),VxWorks則運(yùn)行在Intel x86、MC68K、PowerPC或SPARC等處理器上。Tornado支持各種主機(jī)-目標(biāo)機(jī)連接方式,如以太網(wǎng)、串行線、在線仿真器和ROM仿真器。 Tornado的體系結(jié)構(gòu)使得許多強(qiáng)有力的開(kāi)發(fā)工具可以用于各種目標(biāo)機(jī)系統(tǒng)和各種主機(jī)-目標(biāo)機(jī)連接方式下,而不受制于目標(biāo)機(jī)的資源和通信機(jī)制。同時(shí)VxWorks具有良好的可剪裁性。因此它適用于各種嵌入式環(huán)境的開(kāi)發(fā),小到資源極其有限的個(gè)人手持式設(shè)備如PDA(Personal Digital Assistant);大到多處理機(jī)系統(tǒng),如VME系統(tǒng)。 Tornado可提供一個(gè)直觀的、可視化的、用戶可擴(kuò)充的開(kāi)發(fā)環(huán)境,極大縮短了開(kāi)發(fā)周期。同時(shí),由于Tornado是一個(gè)完全的開(kāi)放系統(tǒng),使得集成第三方開(kāi)發(fā)工具變得十分容易。 主機(jī)與目標(biāo)機(jī)之間的通信是通過(guò)運(yùn)行各自處理器上的代理進(jìn)程來(lái)完成的,使主機(jī)上的開(kāi)發(fā)工具和目標(biāo)機(jī)的操作系統(tǒng)可以完全脫離相互連接的方式。 為了擺脫主機(jī)-目標(biāo)機(jī)通信帶寬和目標(biāo)機(jī)資源的限制,Tornado將傳統(tǒng)的目標(biāo)機(jī)方的工具遷移到主機(jī)上,如shell、loader和符號(hào)表等。這樣,系統(tǒng)不再需要額外的時(shí)間和帶寬在主機(jī)和目標(biāo)機(jī)之間交換信息,降低了對(duì)連接帶寬的需求,也避免了目標(biāo)機(jī)的資源(如內(nèi)存)被工具或符號(hào)表大量占用,使得應(yīng)用程序擁有更多的系統(tǒng)資源。同時(shí)這種遷移也使得各種主機(jī)開(kāi)發(fā)工具獨(dú)立于目標(biāo)機(jī)存在,從而使同一主機(jī)平臺(tái)上的工具可以用于所有的目標(biāo)機(jī)系統(tǒng)。 作為一個(gè)應(yīng)用軟件開(kāi)發(fā)環(huán)境,Tornado提供了友好的可視化開(kāi)發(fā)界面、交叉編譯環(huán)境、源碼級(jí)調(diào)試工具、目標(biāo)機(jī)命令解釋器和目標(biāo)機(jī)狀態(tài)監(jiān)視器等多種應(yīng)用工具,為應(yīng)用軟件開(kāi)發(fā)提供了一個(gè)高效而可靠的平臺(tái)。 三、程序設(shè)計(jì) 我們選用的DSP開(kāi)發(fā)工具是AD公司提供的VisualDSP。這是一個(gè)集成開(kāi)發(fā)環(huán)境,支持對(duì)SHARC系列DSP芯片的開(kāi)發(fā)。實(shí)時(shí)操作系統(tǒng)VxWorks的開(kāi)發(fā)工具是WindRiver公司的Tornado集成開(kāi)發(fā)工具。VisualDSP可以C語(yǔ)言或匯編語(yǔ)言編寫(xiě)的DSP代碼,最新版本的VisualDSP還支持C++。它還有1個(gè)優(yōu)點(diǎn),就是可以編譯多片DSP的源代碼,并產(chǎn)生下載文件,這就可以很方便地進(jìn)行多DSP系統(tǒng)的軟件模擬。 ADSP21160陣列的設(shè)計(jì)結(jié)構(gòu)使它既可以構(gòu)成單指令流多數(shù)據(jù)流(SIMD)的并行處理機(jī),也可以構(gòu)成多指令流單數(shù)據(jù)流(MISD)或多指令流多數(shù)據(jù)流(MIMD)的流水線處理機(jī),視用戶的要求而定。這兩種并行方案的選擇,簡(jiǎn)單來(lái)說(shuō)就是選擇分割數(shù)據(jù)流還是分割處理工序。SIMD方案的原理如圖1所示。 以下介紹我們實(shí)驗(yàn)室承擔(dān)的水聲信號(hào)處理系統(tǒng)。本系統(tǒng)以VME總線為系統(tǒng)開(kāi)發(fā)平臺(tái),前端調(diào)理模件、模數(shù)轉(zhuǎn)換模件和前端控制模件等為VME插件,采用SHARC級(jí)DSP芯片陣列完成聲納信號(hào)實(shí)時(shí)處理,基于嵌入式實(shí)時(shí)操作系統(tǒng)VxWorks及X窗口系統(tǒng)的中央控制和顯示。 圖2是4片DSP的任務(wù)分配圖。從前端采集來(lái)的信號(hào),經(jīng)波束形成和復(fù)解調(diào),再經(jīng)過(guò)窄帶濾波后的信號(hào)分為兩路,一路送去進(jìn)行幅度檢波,一路做頻域處理。幅度檢波就是對(duì)復(fù)信號(hào)求模,根據(jù)信號(hào)幅度判決有無(wú)目標(biāo)存在。頻域處理分兩種情況:當(dāng)發(fā)射信號(hào)為單頻脈沖時(shí),進(jìn)行功率譜估計(jì),然后根據(jù)多普勒頻移估計(jì)目標(biāo)速度;當(dāng)發(fā)射信號(hào)為雙曲調(diào)頻信號(hào)時(shí),進(jìn)行相關(guān)處理。 聲納綜合數(shù)據(jù)處理主要包括主動(dòng)聲納信號(hào)處理和被動(dòng)聲納信號(hào)處理。其中,主動(dòng)聲納信號(hào)處理又根據(jù)發(fā)射信號(hào)的不同,分為非相干處理、相干處理、功率譜處理。聲納綜合數(shù)據(jù)處理主要完成:目標(biāo)自動(dòng)檢測(cè)、目標(biāo)參數(shù)測(cè)定和動(dòng)目標(biāo)跟蹤。 四、操作流水線 操作流水線是模塊內(nèi)數(shù)據(jù)計(jì)算與I/O的流水線,物理上表現(xiàn)為CPU與I/O端口的DMA之間的并行。在前端處理中由于數(shù)據(jù)率高,通信開(kāi)銷很大。以通信任務(wù)最為繁重的復(fù)解調(diào)和多普勒補(bǔ)償模塊為例,輸入數(shù)據(jù)率為2Mw/s,輸出數(shù)據(jù)率為4Mw/s,高速連接口LinkPort最高速率為100Mw/s,如果采用串行傳輸?shù)脑挘ㄐ艜r(shí)間就將占用60%以上的處理時(shí)間,計(jì)算時(shí)間顯然嚴(yán)重不足。所以必須采用并行執(zhí)行,流程圖如圖3所示。這也是一種異步流水線方式,每次傳送和計(jì)算完成都須要設(shè)置標(biāo)志以通知下一操作。 結(jié)束語(yǔ) 在VxWorks實(shí)時(shí)操作系統(tǒng)下,4片ADSP21160上的程序已經(jīng)通過(guò)模擬輸入和系統(tǒng)測(cè)試。采用SHARC DSP 陣列能夠很好地完成聲納信號(hào)實(shí)時(shí)處理,每一片DSP至少有10%的計(jì)算裕量,基本達(dá)到設(shè)計(jì)要求。 | |
|