1 引言
1.1 DSP簡介及基本特點
數字信號的處理離不開算法和實現(xiàn)手段。數字信號處理器(digital signal processor簡稱DSP)。是在模擬信號變換成數字信號以后進行高速實時處理的專用處理器,是實現(xiàn)實時數字信號處理的有力工具。DSP目前廣泛應用于模式識別,數字通信,信號處理,工業(yè)控制等領域。TI公司的TMS320C54X系列DSP有著以下的特點:采用先進的修正增強型哈佛結構,片內共有8條總線(1條程序存儲器總線,3條數據存儲器總線和4條地址總線);高度并行和帶有專用硬件邏輯的CPU設計;高度專業(yè)化的指令系統(tǒng);模塊化結構設計;能降低功耗和提高抗輻射能力的新的靜電設計方法。因此它能高速實時以及靈活地應用于圖像處理、語言處理、頻譜分析、數字濾波、實時控制 等各個領域。TMS320VC5402是54X系列中應用比較廣泛的一種芯片,它有著豐富的接口資源,是一種集數據處理和通信功能于一體的高速微處理器。其操作速率為40~100MIPS。
1.2 PCI局部總線的性能和特點
PCI總線是一種不依附于某個具體處理器的局部總線。從結構上看,PCI是在CPU和原來的系統(tǒng)總線之間插入的一級總線,具體由一個橋接電路實現(xiàn)對這一層的管理,并實現(xiàn)上下之間的接口以協(xié)調數據的傳送。管理器提供了信號緩沖,使之能支持10種外設,并能在高時鐘頻率下保持高性能。PCI總線也支持總線主控技術,允許智能設備在需要時取得總線控制權以加速數據傳送。
2信號處理系統(tǒng)的功能構成
通用信號處理系統(tǒng)一般分為數據采集、數據處理和數據管理3個部分(圖1)。采集部分可以采用通用的數據采集卡,數據管理部分則必須用 PC機才能完成。在信號處理系統(tǒng)中,最費時間,也即影響信號處理系統(tǒng)的實時性的瓶頸是數據的處理部分。數據的處理通常采用微機軟件的方法, 但完全由PC機處理有個缺點,就是信號處理需要的運算主要是數字運算,因相對于通用CPU(GPP)來說,它是采用馮·諾依曼存儲器結構,并不適用于數字信號的運算,不僅會造成處理速度慢,而且占用CPU時間過多,直接影響了PC機對數據的管理。因此,我們提出用另一種方法把信號處理部分從微機軟件中分離出來,交給DSP處理,然后把DSP處理好的數據再傳給PC機管理。該系統(tǒng)的功能構成如圖1所示。這樣不僅可以做到信號處理和數據管理并行進行,而且充分利用DSP對數字信號處理高速,并行的優(yōu)勢,提高了信號處理系統(tǒng)的實時性和穩(wěn)定性。在對信號作連續(xù)的流水處理時,其性能優(yōu)勢更能得以體現(xiàn),同時這也是一個廉價的產品,有著很高的性能價格比。
3 信號處理部分的硬件構成
信號處理部分接口電路的結構如圖2所示。信號處理程序保存在主機中,在上電以后,自舉加載到DSP中,并由固化在DSP的ROM中的 BOOTLOADER來完成。
主要的處理流程是:信號采集卡把模擬的信息轉化為數字的信息,進入PC機;由PC機通過PCI接口把數字的信息傳輸到DSP,保存在SRAM中; DSP從SRAM中讀取數據,對信號進行處理;然后,把處理后的數據再從PCI接口傳回PC機,交給數據管理部分處理。
3.1 PCI接口
為了管理數據和尋址、接口控制、仲裁以及系統(tǒng)運行,PCI接口對單個目標設備需要至少47個引腳,對主控設備最少需要49個引腳。圖3給出了按功能組劃分的引腳,左邊的為必需引腳,右邊的為可選引腳。圖中的信號的方向是對主控設備/ 目標設備的組合而言??傄_數120條(包含電源、地、保留引腳等)。PCI的總線寬度有32位和64位。在本系統(tǒng)中,設備是32位,沒有作64位擴展。
由于PCI總線時鐘高達33MHz,信號線應按微波傳輸線對待,再加上接口邏輯本身的復雜性,設計難度很大。實現(xiàn)接口的辦法:(1)用可編程邏輯器件EPLD或FPGA和用EPLD或FPGA實現(xiàn)。PCI接口的優(yōu)點在于其靈活的可編程性。首先PCI接口可以依據插卡功能進行最優(yōu)化,而不必實現(xiàn)所有的PCI功能,這樣可以節(jié)約系統(tǒng)的邏輯資源;其次可以將PCI插卡上的其他用戶邏輯與PCI接口邏輯集成在一個芯片上,實現(xiàn)緊湊的系統(tǒng)設計;再者當系統(tǒng)升級時,只需對可編程器件重新進行邏輯設計而無需更新PCB版圖。(2)用專用PCI接口芯片實現(xiàn)。專用PCI接口芯片可以實現(xiàn)完整的PCI主控模塊和目標模塊接口功能,將復雜的PCI總線接口轉換為相對簡單的用戶接口。廠商對PCI總線接口進行了嚴格的測試,用戶只要設計轉換后的總線接口即可。從某種意義上講,PCI接口完成的是PCI總線和插卡上的從屬處理器之間的消息傳遞。
由于以上原因,再考慮到系統(tǒng)開發(fā)的成本和周期,用專用接口芯片來實現(xiàn)PCI總線的接口較理想。接口芯片選用的是TI公司的PCI2040。PCI2040 是專門用來和54X或6X橋接的芯片,可以實現(xiàn)與TMS320VC5402的無縫接口 ;可以對端口進行訪問讀寫。PCI2040提供了一個由PCI總線至插卡總線的直通通路(pass-thru)。PCI2040通過這些數據通路將復雜的PCI接口轉換為相對簡單的插卡總線接口。在本系統(tǒng)中,DSP中的資源映射到PC機的內存D9008000~D9008FFF和D9000000~ D9007FFF,中斷請求為11。
PCI2040通過HPI接口與DSP通信,通信流程如下:PCI總線向PCI2040讀寫數據,PCI2040會根據這些命令在HPI口上發(fā)起相應的要求,這個通信過程可以通過編程首先初始化HPI控制寄存器HPIC以及主機地址寄存器HPIA,然后再從主機數據寄存器HPID中讀/寫數據來完成。具體的接口電路如圖4所示:一塊PCI2040最多可以掛接4片 DSP,以用于多DSP系統(tǒng)。
3.2 擴展空間
對信號處理系統(tǒng)來講,DSP芯片所帶的資源常常不能滿足要求。這包括兩個方面,一是程序空間,二是數據空間。對程序空間,可以選擇不同的自舉方式,充分利用PC機的資源。對數據空間有下面幾種解決方法:(1)選擇資源多的芯片,但這會引起成本的上升;(2)改進算法,邊讀取數據邊處理;(3)用一個鎖存器保存高位地址,自己擴展數據空間。這 里采用的方法是在用算法進行邊讀數據邊處理的同時,用SRAM對數據空間進行了擴展??紤]到時序關系,以及TMS320VC5402只能與異步的存儲器連接等因素。選用了TPS73HD318。它是 3.3V,1M×16大小的靜態(tài)RAM,高低位字節(jié)可選,其讀寫速度達到12ns,能夠與DSP的讀寫速度相匹配,無須另加接口時序。對于等待時間的產生,可以用軟件的方法,對等待狀態(tài)寄存器(SWWSR)進行設置。而產生的時延在調試時可以對DSP的時延寄存器進行設置, 以達到最大速度。硬件接口如圖5所示。
4 DSP系統(tǒng)的自舉
所謂自舉(Bootload),就是在上電時從外部加載并執(zhí)行用戶的程序代碼。加載的途徑有:(1)從一個外部的EPROM或FLASH加載;(2)從主機通過HPI總線、并行I/O口、任何一個串行口、用戶定義的地址熱自舉等方式加載。因為信號處理的程序一般都比較大,為了保證這個信號處理系統(tǒng)的通用性和可移植性,需把程序保存在主機中,用HPI總線自舉。HPI是一個8位的并行口,PC機和‘5402通過共享的片內存儲器交換信息。選用HPI自舉方式,需要把HINT和INT2引腳連在一起。復位時,Bootload使HINT置位,從而使 INT2置位。BootloaD讀出中斷標志寄存器(IFR)的bit2位后,即能從HPI口進行自舉。與別的54X系列一個很重要的不同是:5402要檢查數據存儲器的OX7FH位以決定程序的入口地址,用戶程序也要在復位完成后才能加載到HPI的RAM中。
5 驅動程序
因為PCI2040擴展了配置空間,所以,要通過 HPI口實現(xiàn)與DSP的通信,需要驅動程序。如果直接使用DDK來編寫PCI設備的驅動程序,需要大量的Windows底層的知識,難度比較大。因此可以使用別的驅動程序的編寫工具,如Vtools和 WinDrive。我們選用了WinDrive 。Jungo公司的WinDrive與其他驅動程序開發(fā)工具的最大不同是它可以在編程者不太了解Windows內核的情況下編寫驅動程序。這樣,可以把精力主要放在功能的實行上,同時用WinDrive寫成的驅動程序只需作很少的修改就能很方便地適用于各種操作系統(tǒng),如Win dows 9x, Window 2000,Windows NT以及Linux等。編寫過程如下:(1)用WinDrive 的Drive Wiz ard 工具查找所要編寫驅動程序的PCI卡,并用CREATING INF FILE 產生INF 文件,然后添加新硬件;(2)對PCI卡上的配置寄存器,I/O空間,內存范圍,中斷,片內寄存器進行設置;(3)生成源代碼,對它進行功能添加,主要是實現(xiàn)對DSP 片內SRAM的訪問。