ＤＳＰ＋ＦＰＧＡ實(shí)時(shí)信號(hào)處理系統(tǒng)

時(shí)間：2010-11-11 15:11:19

關(guān)鍵字：實(shí)時(shí)信號(hào) 信號(hào)處理系統(tǒng) MIDDOT 線性

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]摘要：簡要敘述了常用的信號(hào)處理系統(tǒng)的類型與處理機(jī)結(jié)構(gòu)，介紹了正逐步得到廣泛應(yīng)用的ＤＳＰ＋ＦＰＧＡ處理機(jī)結(jié)構(gòu)，在此基礎(chǔ)上提出了一種實(shí)時(shí)信號(hào)處理的線性流水陣列，并舉例說明了該結(jié)構(gòu)的具體實(shí)現(xiàn)，最后分析說明了

摘要：簡要敘述了常用的信號(hào)處理系統(tǒng)的類型與處理機(jī)結(jié)構(gòu)，介紹了正逐步得到廣泛應(yīng)用的ＤＳＰ＋ＦＰＧＡ處理機(jī)結(jié)構(gòu)，在此基礎(chǔ)上提出了一種實(shí)時(shí)信號(hào)處理的線性流水陣列，并舉例說明了該結(jié)構(gòu)的具體實(shí)現(xiàn)，最后分析說明了此結(jié)構(gòu)的優(yōu)越性。關(guān)鍵詞：實(shí)時(shí)信號(hào)處理處理機(jī)結(jié)構(gòu) 線性流水陣列實(shí)時(shí)信號(hào)處理系統(tǒng)要求必須具有處理大數(shù)據(jù)量的能力，以保證系統(tǒng)的實(shí)時(shí)性；其次對系統(tǒng)的體積、功耗、穩(wěn)定性等也有較嚴(yán)格的要求。實(shí)時(shí)信號(hào)處理算法中經(jīng)常用到對圖象的求和、求差運(yùn)算，二維梯度運(yùn)算，圖象分割及區(qū)域特征提取等不同層次、不同種類的處理。其中有的運(yùn)算本身結(jié)構(gòu)比較簡單，但是數(shù)據(jù)量大，計(jì)算速度要求高；有些處理對速度并沒有特殊的要求，但計(jì)算方式和控制結(jié)構(gòu)比較復(fù)雜，難以用純硬件實(shí)現(xiàn)。因此，實(shí)時(shí)信號(hào)處理系統(tǒng)是對運(yùn)算速度要求高、運(yùn)算種類多的綜合性信息處理系統(tǒng)。

１信號(hào)處理系統(tǒng)的類型與常用處理機(jī)結(jié)構(gòu)

根據(jù)信號(hào)處理系統(tǒng)在構(gòu)成、處理能力以及計(jì)算問題到硬件結(jié)構(gòu)映射方法的不同，將現(xiàn)代信號(hào)處理系統(tǒng)分為三大類：

·指令集結(jié)構(gòu)（ＩＳＡ）系統(tǒng)。在由各種微處理器、ＤＳＰ處理器或?qū)Ｓ弥噶罴幚砥鞯冉M成的信號(hào)處理系統(tǒng)中，都需要通過系統(tǒng)中的處理器所提供的指令系統(tǒng)（或微代碼）來描述各種算法，并在指令部件的控制下完成對各種可計(jì)算問題的求解。

·硬連線結(jié)構(gòu)系統(tǒng)。主要是指由專用集成電路（ＡＳＩＣ）構(gòu)成的系統(tǒng)，其基本特征是功能固定、通常用于完成特定的算法，這種系統(tǒng)適合于實(shí)現(xiàn)功能固定和數(shù)據(jù)結(jié)構(gòu)明確的計(jì)算問題。不足之處主要在于：設(shè)計(jì)周期長、成本高，且沒有可編程性，可擴(kuò)展性差。

·可重構(gòu)系統(tǒng)?；咎卣魇窍到y(tǒng)中有一個(gè)或多個(gè)可重構(gòu)器件（如ＦＰＧＡ），可重構(gòu)處理器之間或可重構(gòu)處理器與ＩＳＡ結(jié)構(gòu)處理器之間通過互連結(jié)構(gòu)構(gòu)成一個(gè)完整的計(jì)算系統(tǒng)。

從系統(tǒng)信號(hào)處理系統(tǒng)的構(gòu)成方式來看，常用的處理機(jī)結(jié)構(gòu)有下面幾種：單指令流單數(shù)據(jù)流（ＳＩＳＤ）、單指令流多數(shù)據(jù)流（ＳＩＭＤ）、多指令流多數(shù)據(jù)流（ＭＩＭＤ）。

·ＳＩＳＤ結(jié)構(gòu)通常由一個(gè)處理器和一個(gè)存貯器組成，它通過執(zhí)行單一的指令流對單一的數(shù)據(jù)流進(jìn)行操作，指令按順序讀取，數(shù)據(jù)在每一時(shí)刻也只能讀取一個(gè)。弱點(diǎn)是單片處理器處理能力有限，同時(shí)，這種結(jié)構(gòu)也沒有發(fā)揮數(shù)據(jù)處理中的并行性潛力，所以在實(shí)時(shí)系統(tǒng)或高速系統(tǒng)中，很少采用ＳＩＳＤ結(jié)構(gòu)。

· ＳＩＭＤ結(jié)構(gòu)系統(tǒng)由一個(gè)控制器、多個(gè)處理器、多個(gè)存貯模塊和一個(gè)互連網(wǎng)絡(luò)組成。所有“活動(dòng)的”處理器在同一時(shí)刻執(zhí)行同一條指令，但每個(gè)處理器執(zhí)行這條指令時(shí)所用的數(shù)據(jù)是從它本身的存儲(chǔ)模塊中讀取的。對操作種類多的算法，當(dāng)要求存取全局?jǐn)?shù)據(jù)或?qū)τ诓煌臄?shù)據(jù)要求做不同的處理時(shí)，它是無法獨(dú)立勝任的。另外，ＳＩＭＤ一般都要求有較多的處理單元和極高的Ｉ／Ｏ吞吐率，如果系統(tǒng)中沒有足夠多的適合ＳＩＭＤ處理的任務(wù)，采用ＳＩＭＤ是不合算的。

· ＭＩＭＤ結(jié)構(gòu)就是通常所指的多處理機(jī)，典型的ＭＩＭＤ系統(tǒng)由多臺(tái)處理機(jī)、多個(gè)存儲(chǔ)模塊和一個(gè)互連網(wǎng)絡(luò)組成，每臺(tái)處理機(jī)執(zhí)行自己的指令，操作數(shù)也是各取各的。ＭＩＭＤ結(jié)構(gòu)中每個(gè)處理器都可以單獨(dú)編程，因而這種結(jié)構(gòu)的可編程能力是最強(qiáng)的。但由于要用大量的硬件資源解決可編程問題，硬件利用率不高。

２ＤＳＰ＋ＡＳＩＣ結(jié)構(gòu)

隨著大規(guī)?？删幊唐骷陌l(fā)展，采用ＤＳＰ＋ＡＳＩＣ結(jié)構(gòu)的信號(hào)處理系統(tǒng)顯示出了其優(yōu)越性，正逐步得到重視。與通用集成電路相比，ＡＳＩＣ芯片具有體積小、重量輕、功耗低、可靠性高等幾個(gè)方面的優(yōu)勢，而且在大批量應(yīng)用時(shí)，可降低成本。

現(xiàn)場可編程門陣列（ＦＰＧＡ）是在專用ＡＳＩＣ的基礎(chǔ)上發(fā)展出來的，它克服了專用ＡＳＩＣ不夠靈活的缺點(diǎn)。與其他中小規(guī)模集成電路相比，其優(yōu)點(diǎn)主要在于它有很強(qiáng)的靈活性，即其內(nèi)部的具體邏輯功能可以根據(jù)需要配置，對電路的修改和維護(hù)很方便。目前，ＦＰＧＡ的容量已經(jīng)跨過了百萬門級，使得ＦＰＧＡ成為解決系統(tǒng)級設(shè)計(jì)的重要選擇方案之一。

ＤＳＰ＋ＦＰＧＡ結(jié)構(gòu)最大的特點(diǎn)是結(jié)構(gòu)靈活，有較強(qiáng)的通用性，適于模塊化設(shè)計(jì)，從而能夠提高算法效率；同時(shí)其開發(fā)周期較短，系統(tǒng)易于維護(hù)和擴(kuò)展，適合于實(shí)時(shí)信號(hào)處理。

實(shí)時(shí)信號(hào)處理系統(tǒng)中，低層的信號(hào)預(yù)處理算法處理的數(shù)據(jù)量大，對處理速度的要求高，但運(yùn)算結(jié)構(gòu)相對比較簡單，適于用ＦＰＧＡ進(jìn)行硬件實(shí)現(xiàn)，這樣能同時(shí)兼顧速度及靈活性。高層處理算法的特點(diǎn)是所處理的數(shù)據(jù)量較低層算法少，但算法的控制結(jié)構(gòu)復(fù)雜，適于用運(yùn)算速度高、尋址方式靈活、通信機(jī)制強(qiáng)大的ＤＳＰ芯片來實(shí)現(xiàn)。

３線性流水陣列結(jié)構(gòu)

在我們的工作中，設(shè)計(jì)并實(shí)現(xiàn)了一種實(shí)時(shí)信號(hào)處理結(jié)構(gòu)。它采用模塊化設(shè)計(jì)和線性流水陣列結(jié)構(gòu)。

這種線性流水陣列結(jié)構(gòu)具有如下特點(diǎn)：

·接口簡單。各處理單元（ＰＵ）之間采用統(tǒng)一的外部接口。

·易于擴(kuò)充和維護(hù)。各個(gè)ＰＵ的內(nèi)部結(jié)構(gòu)完全相同，而且外部接口統(tǒng)一，所以系統(tǒng)很容易根據(jù)需要進(jìn)行硬件的配置和擴(kuò)充。當(dāng)某個(gè)模塊出現(xiàn)故障時(shí)，也易于更換。

·處理模塊的規(guī)范結(jié)構(gòu)能夠支持多種處理模式，可以適應(yīng)不同的處理算法。

每個(gè)ＰＵ的核心由ＤＳＰ芯片和可重構(gòu)器件ＦＰＧＡ組成，另外還包括一些外圍的輔助電路，如存儲(chǔ)器、先進(jìn)先出（ＦＩＦＯ）器件及ＦＬＡＳＨＲＯＭ等（圖２）?？芍貥?gòu)器件電路與ＤＳＰ處理器相連，利用ＤＳＰ處理器強(qiáng)大的Ｉ／Ｏ功能實(shí)現(xiàn)單元電路內(nèi)部和各個(gè)單元之間的通信。從ＤＳＰ的角度來看，可重構(gòu)器件ＦＰＧＡ相當(dāng)于它的宏功能協(xié)處理器（Ｃｏ－ｐｒｏｃｅｓｓｏｒ）。

ＰＵ中的其他電路輔助核心電路進(jìn)行工作。ＤＳＰ和ＦＰＧＡ各自帶有ＲＡＭ，用于存放處理過程所需要的數(shù)據(jù)及中間結(jié)果。ＦＬＡＳＨＲＯＭ中存儲(chǔ)了ＤＳＰ的執(zhí)行程序和ＦＰＧＡ的配置數(shù)據(jù)。先進(jìn)先出（ＦＩＦＯ）器件則用于實(shí)現(xiàn)信號(hào)處理中常用到的一些操作，如延時(shí)線、順序存儲(chǔ)等。

ＰＵ單獨(dú)做成一塊ＰＣＢ，各級ＰＵ之間通過插座與底板相連。底板的結(jié)構(gòu)很簡單，主要由幾個(gè)串連的插座構(gòu)成，其作用是向各個(gè)ＰＵ提供通信通道和電源供應(yīng)。可以根據(jù)需要安排底板上插座的個(gè)數(shù)，組成多級線性陣列結(jié)構(gòu)。這種模塊化設(shè)計(jì)的突出優(yōu)點(diǎn)在于，它使得對系統(tǒng)的功能擴(kuò)充和維護(hù)變得非常簡單。需要時(shí)，只要插上或更換ＰＵ電路板，就可以實(shí)現(xiàn)系統(tǒng)的擴(kuò)展和故障的排除。每一級ＰＵ中的ＤＳＰ都有通信端口與前級和后級ＰＵ電路板相連，可以很方便地控制和協(xié)調(diào)它們之間的工作。

４應(yīng)用實(shí)例

我們應(yīng)用上述線性流水陣列結(jié)構(gòu)實(shí)現(xiàn)了一個(gè)實(shí)時(shí)目標(biāo)檢測系統(tǒng)，該系統(tǒng)的任務(wù)主要是接收攝像頭輸出的灰度圖象，經(jīng)預(yù)處理、編碼、直線擬合和目標(biāo)識(shí)別后，輸出結(jié)果到ＰＣ機(jī)顯示。在這個(gè)任務(wù)中，預(yù)處理模塊包括抽樣、卷積和編碼等步驟，屬于低層的處理，其運(yùn)算數(shù)據(jù)量大，但運(yùn)算結(jié)構(gòu)較規(guī)則，適于用ＦＰＧＡ進(jìn)行純硬件實(shí)現(xiàn)；而直線擬合及目標(biāo)識(shí)別等高層圖象處理算法，所處理的數(shù)據(jù)量相對較少，但要用到多種數(shù)據(jù)結(jié)構(gòu)，其控制也復(fù)雜得多，我們用ＤＳＰ編程來實(shí)現(xiàn)。

重構(gòu)處理模塊采用的是Ｘｉｌｉｎｘ公司的ＸＣ５２００系列ＦＰＧＡ芯片。這是一種基于ＳＲＡＭ的現(xiàn)場可編程門陣列。表１給出了ＸＣ５２００系列ＦＰＧＡ的一些參數(shù)。

表1 XC5200系列FPGA的一些參數(shù) 器件 XC5204 XC5206 XC5210 XC5215 邏輯單元 480 784 1296 1936 最大邏輯門 6000 10000 16000 23000 多功能塊 10×12 14×14 18×18 22×22 CLB 120 196 324 484 觸發(fā)器 480 784 1296 1936 I/O 124 148 196 244 ＸＣ５２００系列ＦＰＧＡ邏輯功能的實(shí)現(xiàn)由內(nèi)部規(guī)則排列的邏輯單元陣列（ＬＣＡ）來完成，它是ＦＰＧＡ的主要部分。ＬＣＡ的核心是可重構(gòu)邏輯塊（ＣＬＢ），四周是一些輸入／輸出塊（ＩＯＢ）。ＣＬＢ和ＩＯＢ之間通過片內(nèi)的布線資源相連接。ＬＣＡ由配置代碼驅(qū)動(dòng)，ＣＬＢ和ＩＯＢ的具體邏輯功能及它們的互聯(lián)關(guān)系由配置數(shù)據(jù)決定。整個(gè)ＦＰＧＡ模塊的設(shè)計(jì)實(shí)現(xiàn)在Ｘｉｌｉｎｘ公司的Ｆｏｕｎｄａｔｉｏｎ２．１ｉ開發(fā)平臺(tái)上完成。該系統(tǒng)支持設(shè)計(jì)輸入、邏輯仿真、設(shè)計(jì)實(shí)現(xiàn)（設(shè)計(jì)綜合）和時(shí)序仿真等系統(tǒng)開發(fā)全過程。

在選用ＤＳＰ芯片時(shí)，主要應(yīng)考慮性能能否滿足快速判讀算法的要求，具體說就是要求選擇那些指令周期短、數(shù)據(jù)吞吐率高、通信能力強(qiáng)、指令集功能完備的處理器，同時(shí)也要兼顧功耗和開發(fā)支持環(huán)境等因素。表２列出了一些常用微處理器的性能參數(shù)。

我們選擇的是應(yīng)用廣泛、性價(jià)比較高的ＴＭＳ３２０Ｃ４０芯片。它是美國ＴＩ公司推出的為滿足并行處理需求的３２位浮點(diǎn)ＤＳＰ。主要特性如下：

表2 常用微處理器對照表處理器類型 DSP（Motorola) ADSP TMS320 96002 56156 21020 2101 C30 C40 C50 字長/bit 32 16 32 16 32 32 16 指令周期/ns 50 50 50 60 33 25 50 1024浮點(diǎn)FFT時(shí)間/ms 1.04 2.33 0.96 2.07 2.36 1.93 3.42 ·外部時(shí)鐘４０ＭＨｚ，內(nèi)部時(shí)鐘２０ＭＨｚ，所有指令均單周期完成，處理器內(nèi)部采用高度并行機(jī)制，可同時(shí)進(jìn)行多達(dá)１１項(xiàng)各類操作。

·兩套相同的外部數(shù)據(jù)、地址總線，支持局部存儲(chǔ)器和全局共享存儲(chǔ)器。

·６個(gè)高速并行通信口，采用異步傳輸方式，最大速率可達(dá)２０Ｍｂ／ｓ。通過令牌傳遞可靈活實(shí)現(xiàn)數(shù)據(jù)雙向傳輸，這種結(jié)構(gòu)很適合Ｃ４０之間的互連。

·６個(gè)ＤＭＡ通道，每個(gè)通道的最大速率可達(dá)２０Ｍｂ／ｓ。ＤＭＡ內(nèi)部總線與ＣＰＵ的地址、數(shù)據(jù)、指令總線完全分開，避開了總線使用上的瓶頸。

從結(jié)構(gòu)和功能上看，Ｃ４０很適合與可重構(gòu)器件互相配合起來構(gòu)成高速、高精度的實(shí)時(shí)信息處理系統(tǒng)，并完全可以勝任圖像信息的實(shí)時(shí)處理任務(wù)；此外，Ｃ４０的開發(fā)系統(tǒng)也比較完備，支持Ｃ語言和匯編語言編程，能夠方便地進(jìn)行算法移植和軟／硬件的協(xié)同設(shè)計(jì)。

衡量系統(tǒng)的整體性能不僅要看所使用的器件和所能完成的功能，還要看器件之間采用怎樣的互連結(jié)構(gòu)。ＸＣ５２００可以完成模塊級的任務(wù)，起到ＤＳＰ的協(xié)處理器的作用。它的可編程性使它既具有專用集成電路的速度，又具有很高的靈活性。Ｃ４０內(nèi)部結(jié)構(gòu)的主要優(yōu)勢是：所有指令的執(zhí)行時(shí)間都是單周期，指令采用流水線，內(nèi)部的數(shù)據(jù)、地址、指令及ＤＭＡ總線分開，有較多的寄存器。這些特征使它有較高的處理速度。ＦＰＧＡ具有硬件的高速性，而Ｃ４０具有軟件的靈活性，從器件上考察，能夠滿足處理復(fù)雜算法的要求。同時(shí)，Ｃ４０的６個(gè)通信口和６個(gè)ＤＭＡ通道使其能夠在不被中斷的情況下比較從容地應(yīng)付與外界大量的數(shù)據(jù)交換。

從ＰＵ內(nèi)部互連來看，Ｃ４０使用了專用的通信口完成與ＦＰＧＡ的互連，能夠保證在任何情況下ＦＰＧＡ與Ｃ４０的數(shù)據(jù)通道的暢通。另外，ＦＰＧＡ和Ｃ４０各自都有輸入端口，使得系統(tǒng)的處理結(jié)構(gòu)多樣化。比如，ＦＰＧＡ可以作為處理流程中的一個(gè)模塊，獨(dú)立完成某項(xiàng)功能，也可以作為Ｃ４０的協(xié)處理器，通過Ｃ４０的調(diào)用來完成特定的子函數(shù)。底板將互連性延伸到ＰＵ之間，使得多個(gè)電路板能夠組成多處理機(jī)系統(tǒng)。前級的Ｃ４０既可以與下一級的Ｃ４０通信，也可以將數(shù)據(jù)發(fā)送到下一級的ＦＰＧＡ。

綜上所述，本文提出的基于ＤＳＰ＋ＦＰＧＡ的線性流水陣列結(jié)構(gòu)，為設(shè)計(jì)中如何處理軟硬件的關(guān)系提供了一個(gè)較好的解決方案。同時(shí)，該系統(tǒng)具有靈活的處理結(jié)構(gòu)，對不同結(jié)構(gòu)的算法都有較強(qiáng)的適應(yīng)能力，尤其適合實(shí)時(shí)信號(hào)處理任務(wù)。