基于ADSP-21535的MPEG-4視頻編解碼實現(xiàn)
引言
數(shù)字視頻的大數(shù)據(jù)量給信息的存儲和傳輸造成了相當大的困難,成為數(shù)字視頻應用的瓶頸之一,數(shù)字視頻壓縮編碼是解決這一問題的有效途徑,但在一些對實時性要求較高的場合,要求快速實現(xiàn)數(shù)字視頻的編解碼。采用DSP器件集成的視頻采集壓縮卡能快速實現(xiàn)視頻壓縮算法,提高處理速度,滿足實時性要求。
本文采用Blackfin系列的DSP芯片ADSP-21535來實現(xiàn)MPEG-4視頻編解碼,詳細介紹了硬件和軟件的設計方案。
硬件設計
總體結構如圖1所示。從圖中可以看出,整個系統(tǒng)包括視頻采集單元、MPEG-4編解碼單元、數(shù)據(jù)存儲單元、邏輯控制單元和視頻顯示單元等。采用Conexant公司的Bt829實現(xiàn)視頻信號采集,數(shù)據(jù)存儲采用Cypress公司的SRAM芯片CY7C104133,視頻顯示單元采用ADI公司的ADV7175,邏輯控制部分采用Altera公司的MAX7000芯片。
圖1 視頻編解碼器硬件框圖
軟件設計
MPEG-4視頻編碼是根據(jù)圖像的內容將其分割成不同的視頻對象VO(Video Object),然后進行編碼。其編碼過程可由3步來完成,即VO的形成、編碼和復合。它提供了靈活的框架和開放的工具集。
基于VOP(Video Object Plane)的編碼,VO是場景中的某個物體,是由時間上連續(xù)的幀畫面序列組成的,而VOP是某一時刻某一幀畫面的VO,VOP編碼是針對某一時刻該幀畫面VO的形狀、運動、紋理等三類信息進行編碼。從類型上看包括幀內IVOP(Intra VOP)、幀間前向因果預測PVOP(Inter Prediction VOP)、幀間雙向非因果預測BVOP(Inter Biderctional Prediction VOP)和全息靈影SVOP(Sprite VOP)。從空間上看它由若干個16×16的宏塊組成,又可分成4個8×8的亮度塊和2個8×8的色差塊。它采用位圖法對VOP的形狀進行編碼。
在本文設計的編解碼器中,對于352×288的VOP圖像數(shù)據(jù)編碼采用Y:U:V=4:2:0的格式,即每采樣4個亮度樣本,對應采樣兩個色差樣本。然后,分離不同的幀格式,分別對它們進行編碼和解碼。
基于ADSP-21535的MPEG-4編碼優(yōu)化
ADSP-21535采用雙MAC的結構,具有正交的類似RISC的微處理器集,主頻可達300MHz,有專門的視頻處理指令、靈活的SRAM和cache結構,是一款在多媒體處理與網(wǎng)絡傳輸應用中極具特色的芯片。因此,在編碼的過程中,應充分考慮芯片的結構和指令特點,實現(xiàn)程序的優(yōu)化。
使用硬件結構提高處理速度
ADSP-21535內部有兩塊RAM,即L1RAM和L2RAM。L1RAM是核內的高速RAM,可以按照需要定義為cache或SRAM,或者一部分數(shù)據(jù)cache,一部分數(shù)據(jù)SRAM。它可分成16KB指令cache和指令SRAM,也可分成32KB數(shù)據(jù)cache和數(shù)據(jù)RAM。相對來說L2RAM離核較遠,如果程序或數(shù)據(jù)放在L2RAM中直接執(zhí)行,速度會比較慢。因此如果程序的數(shù)據(jù)量較小,可以把程序和數(shù)據(jù)直接放入L1RAM中執(zhí)行。但是對于數(shù)據(jù)量較大的程序來說,有時還有可能把數(shù)據(jù)放在外部存儲器中,如視頻采集數(shù)據(jù),這時就應該設置好cache允許的數(shù)據(jù)地址和程序地址,然后啟動cache,這樣程序和數(shù)據(jù)就會自動調入L1RAM中執(zhí)行。
運動估值搜索算法的并行處理
視頻壓縮的關鍵是去除時間與空間的冗余,考慮到幀間的時間相關性強的特點,為了滿足隨機存儲和高壓縮比的要求,一般采用幀間和幀內的編碼技術。在MPEG-4運動搜索算法中是使用條塊匹配算法,需要進行VOP范圍內點的搜索。匹配使當前的圖像與預測圖像的絕對差值和,即SAD最小。
SAD的計算是運動估值中最重要的一個環(huán)節(jié),它直接影響整個運動搜索的速度,這也是圖像數(shù)據(jù)實時壓縮的瓶頸。Blackfin提供了一個極好的硬件指令,可以取出8個單元數(shù)據(jù)同時做4組VIDEO單元的絕對差和。ADSP-21535提供了兩種指令形式來完成這個操作,即SAA(R1:0)和SAA(R1:0,R3:2)(R代表寄存器組高低寄存器互換),將結果放在A0和A1中(A0和A1為兩個乘法器和累加器,R1和R0、R2和R3為配對的兩個寄存器,一般稱為寄存器組0和寄存器組1)。
由于作絕對差和是針對字節(jié)而言,所以起始字節(jié)地址不一定是以4的整數(shù)倍開始,但是每次運算卻必須要取出4個字節(jié)作運算。對于此,Blackfin巧妙地根據(jù)地址的末兩位來確定運算所取的字節(jié)。其地址指針為I0和I1,由I0和R1:0、I1和R3:2來確定運算的8個點。
用ADSP-21535計算當前塊與目標宏塊的SAD值的程序在此就不再贅述。
結語
整個系統(tǒng)使用Visual DSP++3.0進行開發(fā),通過JTAG口仿真,在CIF格式下(352×288)進行測試。采集的幀率為25fps,對IVOP、PVOP、BVOP同時編碼,平均壓縮一幀需60ms左右,平均壓縮比為40倍左右。從這些數(shù)據(jù)可以看出,用Blackfin實現(xiàn)MPEG-4編解碼方案是可行的,能有效解決傳輸數(shù)據(jù)的瓶頸問題,提高信號的處理速度。同時該芯片的功耗小,性能穩(wěn)定,可實現(xiàn)電源的動態(tài)管理,有利于實現(xiàn)視頻壓縮卡的集成。當然,如果能夠對算法進一步優(yōu)化,就更有利于視頻數(shù)據(jù)的實時處理和傳輸。