基于ADSP-21535的MPEG-4視頻編解碼實現(xiàn)

時間：2012-02-28 06:38:09

關鍵字：視頻編解碼 ADSP MPEG-4 CACHE

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]引言　　數(shù)字視頻的大數(shù)據(jù)量給信息的存儲和傳輸造成了相當大的困難，成為數(shù)字視頻應用的瓶頸之一，數(shù)字視頻壓縮編碼是解決這一問題的有效途徑，但在一些對實時性要求較高的場合，要求快速實現(xiàn)數(shù)字視頻的編解碼。采用

引言

　　數(shù)字視頻的大數(shù)據(jù)量給信息的存儲和傳輸造成了相當大的困難，成為數(shù)字視頻應用的瓶頸之一，數(shù)字視頻壓縮編碼是解決這一問題的有效途徑，但在一些對實時性要求較高的場合，要求快速實現(xiàn)數(shù)字視頻的編解碼。采用DSP器件集成的視頻采集壓縮卡能快速實現(xiàn)視頻壓縮算法，提高處理速度，滿足實時性要求。

　　本文采用Blackfin系列的DSP芯片ADSP-21535來實現(xiàn)MPEG-4視頻編解碼，詳細介紹了硬件和軟件的設計方案。

　　硬件設計

　　總體結構如圖1所示。從圖中可以看出，整個系統(tǒng)包括視頻采集單元、MPEG-4編解碼單元、數(shù)據(jù)存儲單元、邏輯控制單元和視頻顯示單元等。采用Conexant公司的Bt829實現(xiàn)視頻信號采集，數(shù)據(jù)存儲采用Cypress公司的SRAM芯片CY7C104133，視頻顯示單元采用ADI公司的ADV7175，邏輯控制部分采用Altera公司的MAX7000芯片。

　　圖1 視頻編解碼器硬件框圖

　　軟件設計

　　MPEG-4視頻編碼是根據(jù)圖像的內容將其分割成不同的視頻對象VO(Video Object)，然后進行編碼。其編碼過程可由3步來完成，即VO的形成、編碼和復合。它提供了靈活的框架和開放的工具集。

　　基于VOP(Video Object Plane)的編碼，VO是場景中的某個物體，是由時間上連續(xù)的幀畫面序列組成的，而VOP是某一時刻某一幀畫面的VO，VOP編碼是針對某一時刻該幀畫面VO的形狀、運動、紋理等三類信息進行編碼。從類型上看包括幀內IVOP(Intra VOP)、幀間前向因果預測PVOP(Inter Prediction VOP)、幀間雙向非因果預測BVOP(Inter Biderctional Prediction VOP)和全息靈影SVOP(Sprite VOP)。從空間上看它由若干個16×16的宏塊組成，又可分成4個8×8的亮度塊和2個8×8的色差塊。它采用位圖法對VOP的形狀進行編碼。

　　在本文設計的編解碼器中，對于352×288的VOP圖像數(shù)據(jù)編碼采用Y：U：V=4：2：0的格式，即每采樣4個亮度樣本，對應采樣兩個色差樣本。然后，分離不同的幀格式，分別對它們進行編碼和解碼。

　　基于ADSP-21535的MPEG-4編碼優(yōu)化

　　ADSP-21535采用雙MAC的結構，具有正交的類似RISC的微處理器集，主頻可達300MHz，有專門的視頻處理指令、靈活的SRAM和cache結構，是一款在多媒體處理與網(wǎng)絡傳輸應用中極具特色的芯片。因此，在編碼的過程中，應充分考慮芯片的結構和指令特點，實現(xiàn)程序的優(yōu)化。

　　使用硬件結構提高處理速度

　　ADSP-21535內部有兩塊RAM，即L1RAM和L2RAM。L1RAM是核內的高速RAM，可以按照需要定義為cache或SRAM，或者一部分數(shù)據(jù)cache，一部分數(shù)據(jù)SRAM。它可分成16KB指令cache和指令SRAM，也可分成32KB數(shù)據(jù)cache和數(shù)據(jù)RAM。相對來說L2RAM離核較遠，如果程序或數(shù)據(jù)放在L2RAM中直接執(zhí)行，速度會比較慢。因此如果程序的數(shù)據(jù)量較小，可以把程序和數(shù)據(jù)直接放入L1RAM中執(zhí)行。但是對于數(shù)據(jù)量較大的程序來說，有時還有可能把數(shù)據(jù)放在外部存儲器中，如視頻采集數(shù)據(jù)，這時就應該設置好cache允許的數(shù)據(jù)地址和程序地址，然后啟動cache，這樣程序和數(shù)據(jù)就會自動調入L1RAM中執(zhí)行。

　　運動估值搜索算法的并行處理

　　視頻壓縮的關鍵是去除時間與空間的冗余，考慮到幀間的時間相關性強的特點，為了滿足隨機存儲和高壓縮比的要求，一般采用幀間和幀內的編碼技術。在MPEG-4運動搜索算法中是使用條塊匹配算法，需要進行VOP范圍內點的搜索。匹配使當前的圖像與預測圖像的絕對差值和，即SAD最小。

　　SAD的計算是運動估值中最重要的一個環(huán)節(jié)，它直接影響整個運動搜索的速度，這也是圖像數(shù)據(jù)實時壓縮的瓶頸。Blackfin提供了一個極好的硬件指令，可以取出8個單元數(shù)據(jù)同時做4組VIDEO單元的絕對差和。ADSP-21535提供了兩種指令形式來完成這個操作，即SAA(R1：0)和SAA(R1：0，R3：2)(R代表寄存器組高低寄存器互換)，將結果放在A0和A1中(A0和A1為兩個乘法器和累加器，R1和R0、R2和R3為配對的兩個寄存器，一般稱為寄存器組0和寄存器組1)。

　　由于作絕對差和是針對字節(jié)而言，所以起始字節(jié)地址不一定是以4的整數(shù)倍開始，但是每次運算卻必須要取出4個字節(jié)作運算。對于此，Blackfin巧妙地根據(jù)地址的末兩位來確定運算所取的字節(jié)。其地址指針為I0和I1，由I0和R1：0、I1和R3：2來確定運算的8個點。

　　用ADSP-21535計算當前塊與目標宏塊的SAD值的程序在此就不再贅述。

　　結語

　　整個系統(tǒng)使用Visual DSP++3.0進行開發(fā)，通過JTAG口仿真，在CIF格式下(352×288)進行測試。采集的幀率為25fps，對IVOP、PVOP、BVOP同時編碼，平均壓縮一幀需60ms左右，平均壓縮比為40倍左右。從這些數(shù)據(jù)可以看出，用Blackfin實現(xiàn)MPEG-4編解碼方案是可行的，能有效解決傳輸數(shù)據(jù)的瓶頸問題，提高信號的處理速度。同時該芯片的功耗小，性能穩(wěn)定，可實現(xiàn)電源的動態(tài)管理，有利于實現(xiàn)視頻壓縮卡的集成。當然，如果能夠對算法進一步優(yōu)化，就更有利于視頻數(shù)據(jù)的實時處理和傳輸。