嵌入式多媒體設備的靜止圖像編碼有著廣泛的應用,如照片的拍攝與傳輸。設備處理的圖像越來越大,存儲容量和傳能力都相當有?因而靜止圖像編解碼要求具有較低的運算復雜性、較少的存儲器需求和極好的壓縮性能。目前已經(jīng)制定的靜止圖像壓縮標準主要有JPEG和JPEG2000。JPEG標準在中高速率上壓縮效果較好, 對于細節(jié)分量多的灰度圖像, 當編碼壓縮率低于每像素0.25比特時,視覺失真大,重構圖像存在嚴重的方塊效應,不能很好地適應網(wǎng)絡傳輸圖像的需要。JPEG2000為了降低運算中的存儲器需求,使用分塊技術,對每個小塊進行處理,但采用較小的塊在低碼率時存在與JPEG一樣的方塊效應。因而JPEG2000 在低比特率應用時, 建議不分塊或者分成較大的塊,以保證良好的率失真性能, 但運算復雜性和存儲器需求都極高。
視頻編碼新標準H.264代表著繼/2和MPEG4后的第三代視頻編碼標準。H.264比以前的標準提供了更高的編碼增益。H.264的INTRA幀編碼算法充分利用圖像中的空間相關和變換域的相關性,提供了極高的編碼增益,可以用來對靜止圖像進行編碼。在文獻[1]中H.264采用JM73代碼,JPEG2000 采用Jasper 1.700.5,對標準靜止測試圖像和視頻序列進行測試。測試結果表明:與JPEG2000相比,H.264 INTRA幀具有更高的客觀質量和主觀質量,但譯碼器的運算復雜性卻比JPEG2000低50%左右。在嵌入式設備上,多媒體應用的實時性不僅取決于算法的運算次數(shù),還取決于可得到的存儲器帶寬。CPU的工作頻率越來越高,存儲器的頻率卻增加緩慢,很多算法的瓶頸在于數(shù)據(jù)輸入輸出。有效減小算法的存儲器需求,減少中間結果的存儲需求,可縮減片外存儲器訪問次數(shù),提高應用的實時性能。下面主要討論降低H.264 INTRA幀編碼的運算復雜性和存儲器需求的方法。
H.264 INTRA 16x16 prediction modes (all predicted pixels H and V)
圖2 INTRA 4×4和INTRA 16×16預測
1 減少運算復雜性
H.264 INTRA幀具有比JPEG2000更高的客觀質量,這主要是由于INTRA幀采用的多種幀內(nèi)預測模式較好地去掉了空間冗余。對于平滑的背景區(qū)域采用16×16大小的粗糙預測,共有4種可能的預測方向。對于快速變化的圖像區(qū)域,采用4×4的塊,共有9種預測模式。在預測后,對殘差信號進行整型變換消除頻譜相關性。高效的去方塊效應改善了圖像的信噪比和主觀質量。圖1是H.264的結構流程圖。
從圖1可以看出,在整幀圖像的熵編碼后,對逆整型變換后的重建數(shù)據(jù)進行去方塊效應,去方塊效應后的重建圖像數(shù)據(jù)用作下一幀預測圖像的編碼,或者用于編碼同時顯示重建圖像。的作用主要是壓縮原始數(shù)據(jù)產(chǎn)生輸出碼流,若不需要在本地編碼器中顯示重建圖像(例如衛(wèi)星照片的拍攝),則編碼器中的整幀圖像的去方塊效應可以省去,節(jié)省大約30%的運算。宏塊的幀內(nèi)預測包含9種4×4模式和4種16×16模式如圖2。INTRA 16×16 預測僅僅采用左邊16個像素和上邊16個像素作參考;INTRA 4×4 預測僅僅采用左邊4個像素和上邊9個像素作參考,因而在逆整型變換和重建(逆變換結果與預測值相加)時,僅僅需要計算16×16宏塊的第16行與第16列像素、4×4塊的第4行與第4列像素,沒有必要計算所有的像素。對于16×16的塊,減少224個重建像素的計算。對于4×4的塊,減少8個重建像素的計算。整型變換、量化、逆量化、掃描以及逆變換消耗比較多的編碼時間,可利用在模式選擇時計算的絕對差值和(SAD),提前判斷整型變換后量化系數(shù)全0塊,從而省去全0塊的整型變換、量化、逆量化、掃描以及逆變換這一系列操作 (待續(xù))