基于TMS320VC5509實(shí)現(xiàn)MP3解碼
TMS320VC5509(以下簡(jiǎn)稱C5509)是TI公司C5000 DSP 系列中的新一代產(chǎn)品,該芯片最低工作電壓為0.9V,其核的最低功耗僅為0.05MW/MIPS,性能最高可達(dá)800 MIPS。C5509為嵌入式DSP應(yīng)用及高性能儀器儀表、智能機(jī)器人、手持設(shè)備、數(shù)字音頻播放器和數(shù)碼相機(jī)等應(yīng)用提供了有效的解決方案。MP3是指MPEG(活動(dòng)圖像專家組)國(guó)際標(biāo)準(zhǔn)音頻第三層編/解碼,MP3編碼是通過(guò)將音頻信號(hào)由時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào),并根據(jù)人類心理聲學(xué)特征去除部分冗余信息實(shí)現(xiàn)的,ISO/IEC11172-3 Part 3給出了詳細(xì)的編/解碼標(biāo)準(zhǔn)。解碼涉及霍夫曼解碼、修正余弦反變換(IMDCT)、子帶合成等復(fù)雜運(yùn)算模塊。本文利用C5509實(shí)現(xiàn)對(duì)MP3的解碼運(yùn)算。
1 C5509 DSP 處理器的特點(diǎn)和工作原理
1.1 C5509 DSP的性能概述
C5509有32×16bit指令緩沖隊(duì)列,可實(shí)現(xiàn)高效的塊循環(huán)操作;兩個(gè)17×17bit的MAC單元,可在單周期內(nèi)執(zhí)行兩次MAC操作;1個(gè)40bit的ALU、1個(gè)40bit的桶型移位器,4個(gè)40bit的累加器可執(zhí)行比C54系列DSP更高效的算術(shù)運(yùn)算,在400MHz的晶振驅(qū)動(dòng)下,可達(dá)到800MIPS的性能。以44.1kHz采樣率的MP3數(shù)據(jù)流為例,對(duì)128kbit/s數(shù)據(jù)率的MP3數(shù)據(jù)進(jìn)行解碼。霍夫曼解碼、IMDCT、子帶合成等運(yùn)算模塊共需消耗1.3MIPS的CPU資源,對(duì)于平均每秒必須解碼44.6幀數(shù)據(jù)來(lái)講,總運(yùn)算量為44.6×1.3=57.98MIPS,C5509完全可以滿足此速度要求。
C5509還具有128K×16bit的片上RAM,其中包括64KB的DARAM、192KB的SARAM和64KB的片上ROM。
與眾多TMS320系列DSP處理器一樣,C5509采用了哈佛結(jié)構(gòu),共有12組獨(dú)立總線,其中包括3組數(shù)據(jù)讀總線、2組數(shù)據(jù)寫(xiě)總線、5組數(shù)據(jù)地址總線、1組程序讀總線和1組程序地址總線,這些總線并行地為各個(gè)計(jì)算單元提供指令和操作碼,從而為高速的數(shù)據(jù)運(yùn)算提供了有力的保障。
1.2 C5509 DSP的外設(shè)介紹
C5509提供了專用的外部存儲(chǔ)器接口(EMIF),用于控制DSP與外部存儲(chǔ)器之間所有數(shù)據(jù)的傳輸??膳cEMIF無(wú)縫鏈接的存儲(chǔ)器有:異步存儲(chǔ)器(ROM、FLASH、 SRAM)、同步突發(fā)SRAM、同步DRAM(SDRAM),并可支持可選的32、16、8位數(shù)據(jù)訪問(wèn)。對(duì)EMIF編程時(shí),必須根據(jù)實(shí)際的外部存儲(chǔ)器考慮如何分配片內(nèi)使能空間(CE)。通過(guò)EMIF接口,主處理器可將數(shù)據(jù)和程序置于片外,從而節(jié)省了片上硬件資源。
其次,C5509有3個(gè)獨(dú)立的多通道緩存串口(McBSP),使得C5509能夠直接與其他C55xx系列DSP、多媒體數(shù)字信號(hào)編解碼器等設(shè)備高速互連,這些McBSP可以提供全速雙工通信,并支持128通道的收發(fā),接收或者發(fā)送可以選擇使用獨(dú)立的時(shí)鐘,字寬為8、12、16、20、24位任選。
為保證與常見(jiàn)的異步通信模塊進(jìn)行數(shù)據(jù)通信,C5509提供了與TL16C550C等專用異步通信接口IC互連的UART,外部數(shù)據(jù)經(jīng)由TL16C550C進(jìn)出DSP的UART,最終交給片內(nèi)CPU處理。圖1為與C5509配合使用的典型專用異步通信接口IC(TL16C550C)的管腳圖。
C5509的UART每接到數(shù)據(jù)就會(huì)產(chǎn)生相應(yīng)的中斷請(qǐng)求,通知CPU及時(shí)采集數(shù)據(jù),將Rx線上的串行數(shù)據(jù)放入接收寄存器中,在滿足緩沖區(qū)長(zhǎng)度后,寄存器的并行數(shù)據(jù)再交給CPU做后續(xù)處理。
2 解碼算法說(shuō)明
2.1 MP3文件的格式
MP3文件以幀為基本單位,每幀的構(gòu)成如表1所示。由于MP3文件數(shù)據(jù)格式采用了比特池技術(shù),故主數(shù)據(jù)有可能在幀頭之前,具體位置可由幀邊信息所包含的main_data_begin變量獲得。
解碼時(shí)首先將一定長(zhǎng)度(本系統(tǒng)為2kbit)的數(shù)據(jù)讀入C5509的內(nèi)部RAM中,然后尋找?guī)耐阶謘ync_word(FFF)。如果找到同步字,則以其為首的32bit即為幀頭。由幀頭中的校驗(yàn)位可知是否有校驗(yàn)數(shù)據(jù),如無(wú),則其后的256bit數(shù)據(jù)即為幀邊信息。主數(shù)據(jù)一般包含兩個(gè)粒度組(gr)的數(shù)據(jù),每個(gè)粒度組又包含左右聲道(ch)兩部分的數(shù)據(jù)信息,各個(gè)聲道數(shù)據(jù)可獨(dú)立解碼,故將每個(gè)粒度單個(gè)聲道解碼的程序編寫(xiě)為單個(gè)的*.c文件,以適應(yīng)單聲道或者其他MP3格式的解碼。MP3編碼根據(jù)人類心理聲學(xué),將每個(gè)粒度組分為三部分?jǐn)?shù)據(jù):第一部分對(duì)應(yīng)低頻采樣的Big_values(大值區(qū)),用較大絕對(duì)值的量化值存放低頻值;第二部分為Count1區(qū),用絕對(duì)值較小的量化值存放中頻值,所有量化值的可能取值為1,0,-1;第三部分為編碼為零的Zero高頻區(qū),零數(shù)據(jù)無(wú)須在MP3文件中出現(xiàn),只需在解碼時(shí)詢問(wèn)每個(gè)粒度組的計(jì)數(shù)是否已經(jīng)達(dá)到576。若計(jì)數(shù)為576,則說(shuō)明該粒度組已解完576個(gè)頻率線的量化值。
上述幀邊信息存儲(chǔ)了供后續(xù)解碼的全部重要信息。為方便引用,將其定義為結(jié)構(gòu)體。部分元素的定義和注釋如下:
struct Granule {
unsigned part2_3_length; //用以計(jì)算Count1
//區(qū)位置;
unsigned big_values; //用以計(jì)算Big_values
//區(qū)位置;
unsigned table_select[3]; //用以確定查找哪一
//個(gè)霍夫曼表;
……
};
table_select[3]的值就是霍夫曼表的下標(biāo)h,可在解主數(shù)據(jù)時(shí)鎖定某個(gè)具體的霍夫曼表。
2.2 MP3數(shù)據(jù)的霍夫曼解碼原理
如上小節(jié)所述,每個(gè)粒度組的數(shù)據(jù)根據(jù)聲學(xué)特性將0到奈奎斯特頻率的頻率線分為Big_values、Count1和Zero三個(gè)區(qū)。在解碼時(shí),Big_values區(qū)對(duì)應(yīng)的霍夫曼碼表格式如表2所示,而Count1區(qū)碼表格式如表3所示。
存放霍夫曼碼表的文件huffman.h中包含32個(gè)供Big_values區(qū)查詢用的碼表和2個(gè)供Count1區(qū)查詢用的碼表。為了方便快速查得短長(zhǎng)度的編碼值,還增加了輔助表h_cue[34][16]。當(dāng)開(kāi)始解主數(shù)據(jù)時(shí),將定長(zhǎng)(例如32位)數(shù)據(jù)dataword()入棧,首先移出該緩存區(qū)的前四位數(shù)據(jù),作為查輔助表的頭數(shù)據(jù)lead,然后根據(jù)lead值和幀邊信息中的霍夫曼查找表下標(biāo)h,得出輔助表的具體數(shù)據(jù)h_cue[h][lead],這個(gè)數(shù)據(jù)只是指向Big_values區(qū)或者Count1區(qū)某個(gè)表的首地址h_tab,具體要用到該表的哪個(gè)數(shù)據(jù)仍需程序提供一個(gè)偏移量繼續(xù)判斷。此時(shí)可以先由緩存區(qū)中去掉lead四個(gè)位的數(shù)據(jù)與鎖定的霍夫曼表對(duì)比,如果這后面的數(shù)據(jù)與被鎖定的霍夫曼表頭的碼字一致,則可馬上得到解碼的數(shù)據(jù);若是兩個(gè)碼字不一致,則還需由h_cue[h][lead]和h_cue[h][lead+1]的差值得到偏移量,從而最終得到正確的解碼數(shù)據(jù)。(格式如表2和表3所示)。
另外,由于MP3編碼中對(duì)絕對(duì)值小于等于15的量化值直接編碼,對(duì)絕對(duì)值大于15的量化值采用ESC(附加值)編碼,所以在得到加碼數(shù)據(jù)后還需判斷是否要為其添加附加值和符號(hào)位。詳細(xì)的解碼流程如圖2所示。
MP3解碼的主要運(yùn)算量集中在霍夫曼解碼、反量化、IMDCT、子帶合成四個(gè)運(yùn)算模塊,而霍夫曼解碼占整個(gè)運(yùn)算量總和的1/5。利用CCS的Profile工具對(duì)44.1kHz采樣率、128kbps比特率的MP3數(shù)據(jù)進(jìn)行運(yùn)算復(fù)雜度的估算,可得本系統(tǒng)的解碼模塊消耗的運(yùn)算量為1.3MIPS。由此可知,對(duì)于每秒解50幀以上的實(shí)時(shí)解碼,DSP要承擔(dān)65MIPS的運(yùn)算復(fù)雜度,利DSP實(shí)現(xiàn)的本解碼模塊是完全可以勝任的。