TD-SCDMA系統(tǒng)基帶處理的DSP+FPGA實現(xiàn)方案
張俊輝 陳賢亮引言 和傳統(tǒng)的cdma系統(tǒng)相比,第三代移動通信的最大特點在于能支持多種速率的業(yè)務(wù),從話音到分組數(shù)據(jù),再到多媒體業(yè)務(wù),并能根據(jù)具體的業(yè)務(wù)需要,提供必要的帶寬,數(shù)據(jù)處理量非常大。然而,對不同速率業(yè)務(wù)的基帶處理,所需的存儲量、運算量以及處理延時差異很大。因此,采用何種硬件結(jié)構(gòu)才能有效地處理各種業(yè)務(wù)是本文所要探討的問題。 本文首先介紹td-scdma系統(tǒng)無線信道的基帶發(fā)送方案,說明其對多媒體業(yè)務(wù)的支持及實現(xiàn)的復(fù)雜性。然后,從硬件實現(xiàn)角度,進行了dsp和fpga的性能比較,提出dsp+fpga基帶發(fā)送的實現(xiàn)方案,并以基站分系統(tǒng)(bts)的發(fā)送單元為例,具體給出了該實現(xiàn)方案在下行無線信道基帶發(fā)送單元中的應(yīng)用。td-scdma基帶發(fā)送方案 td-scdma系統(tǒng)的基帶處理流程如圖1所示。其中,傳輸信道編碼復(fù)用包括以下一些處理步驟:crc校驗、傳輸塊級聯(lián)/分割、信道編碼、無線幀均衡、第1次交織、無線幀分割、速率匹配、傳輸信道復(fù)用、比特擾碼、物理信道分割、第2次交織、子幀分割、物理信道映射等,如圖2所示。
在圖2中,每個傳輸信道(trch)對應(yīng)一個業(yè)務(wù),由于各種業(yè)務(wù)對時延的要求不同,所以其傳輸時間間隔(tti)是不同的,tti可以是10ms、20ms、40ms或80ms。實現(xiàn)方案
本文提出了dsp+fpga線性流水陣列結(jié)構(gòu)的實現(xiàn)方案:使用dsp與大規(guī)模fpga協(xié)同處理基帶發(fā)送數(shù)據(jù)。該處理單元以dps芯片為核心,構(gòu)造一個小的dsp系統(tǒng)。 在基帶處理單元中,低層的信號預(yù)處理算法處理的數(shù)據(jù)量大,對處理速度的要求高,但運算結(jié)構(gòu)相對比較簡單,因而適于用fpga進行硬件實現(xiàn),這樣能同時兼顧速度及靈活性。相比之下,高層處理算法的特點是所處理的數(shù)據(jù)量較低層算法少,但算法的控制結(jié)構(gòu)復(fù)雜,適于用運算速度高、尋址方式靈活、通信機制強大的dsp芯片來實現(xiàn)。 dsp處理器利用其強大的i/o功能實現(xiàn)單元電路內(nèi)部和各個單元之間的通信。從dsp的角度來看,fpga相當于它的協(xié)處理器。dsp通過本地總線對fpga進行配置、參數(shù)設(shè)置及數(shù)據(jù)交互,實現(xiàn)軟硬件之間的協(xié)同處理。dsp和fpga各自帶有ram,用于存放處理過程所需要的數(shù)據(jù)及中間結(jié)果。除了dsp芯片和fpga外,硬件設(shè)計還包括一些外圍的輔助電路,如flasheeprom、外部存儲器等。其中,flash eeprom中存儲了dsp的執(zhí)行程序;外部存儲器則作為fpga的外部ram擴展,用于存放數(shù)據(jù)處理過程中所需的映射圖樣。基帶處理單元的需求估計 基帶處理單元的需求估計主要包含以下兩個方面: 1.各個業(yè)務(wù)傳輸通道的數(shù)據(jù)處理:以對稱情況下無線信道承載的最高業(yè)務(wù)速率384kbps為例進行分析。傳輸塊大小為336bit,24塊級聯(lián),加上crc,系統(tǒng)在1個10ms幀內(nèi)所要處理的最大數(shù)據(jù)量為8448bit:根據(jù)3 gpp協(xié)議ts25.222規(guī)定的下行數(shù)據(jù)基帶處理流程(見圖2),并按固定位置復(fù)用的方式進行處理,每個數(shù)據(jù)位必須經(jīng)過最多13個環(huán)節(jié)的處理過程,估算平均每環(huán)節(jié)上每比特的處理要求為23條指令。則10ms內(nèi)必須完成的處理指令數(shù)是:8448×13×23=2525952條。對應(yīng)的處理能力要求是252mips。 2.消息處理:包含消息的解釋、對應(yīng)控制參數(shù)的計算、發(fā)給對應(yīng)的fpga。估計不超過一條承載64kbps業(yè)務(wù)的無線信道的基帶數(shù)據(jù)處理的需求。 綜合考慮上述兩個方面,則整個基帶數(shù)據(jù)處理的等效需求是:(8448+2400)×13×23/10ms=324mips 以tms320c5510為例,其主時鐘能工作在160mhz或200mhz,運算速度達400mips?;赾的軟件開發(fā)環(huán)境和匯編級并行處理的優(yōu)化程序,優(yōu)化后的并行執(zhí)行效率一般為80%,等效的處理能力為320mips??梢?,若將整個基帶數(shù)據(jù)處理交給該dsp芯片完成,其處理能力無法滿足整個處理單元的需求,而且,隨著視頻電話、手機電視等大數(shù)據(jù)量業(yè)務(wù)的應(yīng)用,數(shù)據(jù)處理需求量將更大。因此,在基帶處理的實現(xiàn)方案中,數(shù)據(jù)量小的業(yè)務(wù),如隨路信令、amr語音業(yè)務(wù)可由dsp處理;而數(shù)據(jù)量大的業(yè)務(wù),如64kbps、144kbps和384kbps速率的業(yè)務(wù),大部分處理環(huán)節(jié)由fpga完成。具體實現(xiàn)如下: ·dsp作為主控單元,完成數(shù)據(jù)提取、消息解析和部分基帶數(shù)據(jù)處理功能,如第二次交織和成幀等; ·fpga則在dsp的調(diào)度下完成基帶數(shù)據(jù)處理環(huán)節(jié)中大部分比較耗時的處理功能,如:crc校驗、信道編碼、速率匹配等,在接收端可用于viterbi譯碼、聯(lián)合檢測等。 在384kbps業(yè)務(wù)信道加隨路信令的處理中,384rbps業(yè)務(wù)數(shù)據(jù)由dsp通過同步高速接口,以dma方式遞交給fpga,在fpga中處理;而隨路信令因其數(shù)據(jù)量小,在fpga處理3