圖像壓縮編碼和解碼原理知識介紹

時間：2012-02-21 22:13:14

關(guān)鍵字：解碼原理圖像壓縮編碼數(shù)據(jù)壓縮色度

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 圖像壓縮編碼和解碼原理本節(jié)介紹圖像壓縮編碼的基本原理，圖像數(shù)據(jù)壓縮和解壓縮電路的基本結(jié)構(gòu)。它們是看影碟機電路圖的基礎(chǔ)知識。一、圖像壓縮的基本途徑圖像的數(shù)據(jù)量極大，必須對其數(shù)據(jù)總量大大壓縮，才能夠存儲

圖像壓縮編碼和解碼原理

本節(jié)介紹圖像壓縮編碼的基本原理，圖像數(shù)據(jù)壓縮和解壓縮電路的基本結(jié)構(gòu)。它們是看影碟機電路圖的基礎(chǔ)知識。

一、圖像壓縮的基本途徑
圖像的數(shù)據(jù)量極大，必須對其數(shù)據(jù)總量大大壓縮，才能夠存儲在直徑12cm的光盤上。在實用技術(shù)上，可通過以下途徑來壓縮圖像數(shù)據(jù)的總量。

1、采用亮度(Y)、色度(C)取樣方式
實用彩色電視技術(shù)沒有傳輸、處理紅、藍(lán)、綠三基色信號，而傳輸、處理亮度信號Y和色度信號C。這種處理方法有利于實現(xiàn)彩色電視和黑白電視的兼容，也利于限制彩色電視信號的頻帶寬度。在數(shù)字圖像處理技術(shù)中，仍然采用傳輸、處理亮度信號Y和色度信號C的方法。由于人眼晴對亮度信息敏感，對彩色信息不夠敏感，因而對Y信號以較高清晰度傳送，對C信號以較低清晰度傳送。實際作法是這樣的：對每個亮度Y像素都進行傳送；而將色度C分解為U、V兩個色差信號(或?qū)憺镃b、Cr、B-Y、R-Y)，分別進行傳送；對亮度Y實行逐點取樣，而對色度C則取樣較少。即對應(yīng)于4個亮度取樣點，僅對色度信號取樣1個點，即對U、V像素的取樣較低，各取1個取樣點，這種取樣格式稱為YUV411格式。
采用YUV411取樣格式后，它的數(shù)據(jù)總量將比三基色取樣量格式時減少一半。若采用三種基色取樣方式時，各基色應(yīng)與亮度信號取樣方式一樣，即對每個紅、綠、藍(lán)色采取逐點取樣的方法。采用Y、C傳輸方式時，取樣次數(shù)減少一半，傳輸數(shù)碼也減少一半。人眼睛對色度的敏感程度較低，利用人眼睛這一生理視覺特性，人們在主觀感覺上并沒有感到圖像清晰度下降。顯然，這是壓縮圖像數(shù)據(jù)碼率的一個得力措施。

2、將整幅圖像分割為小區(qū)域進行分割處理
對圖像進行數(shù)據(jù)處理時，對每幀圖像進行分割處理。首先圖像橫向切成若干條，每一條稱為一片，將每一片再縱向切成若干塊，稱宏塊，宏塊是圖像壓縮的基本單位。每個宏塊的彩色圖像可用1個亮度信號Y和兩個色差信號Cb、Cr(即U、V)來表示，或者說，每個宏塊分為三層，一層亮度Y，兩層色度(各為Cb、Cr)，統(tǒng)稱為一個宏塊。
由于人眼睛對亮度、色度的主觀敏感程度不同，通常把亮度宏塊再平均分成4塊，每一小塊稱為像塊或區(qū)塊，詳見示意圖2.2.1。每個區(qū)塊可以進一步分割，稱為像素或像點，像素是構(gòu)成圖像的最小單位。對于數(shù)字圖像來說，每一個像素作為一個取樣點，有一個對應(yīng)的取樣數(shù)值?？梢钥闯?，圖像分割越細(xì)，像素數(shù)越多，取樣點越多，圖像清晰度越高；反之，像素數(shù)越少，圖像清晰度越低。實際上，對圖像壓縮處理，就是對圖像區(qū)塊的數(shù)據(jù)、像素的數(shù)據(jù)進行壓縮處理。

彩電制式不同，分割圖像的具體數(shù)據(jù)將有所變化。例如PAL制，大多數(shù)為625行掃描標(biāo)準(zhǔn)，那么每幀圖像被切為18片，每片再切成22個宏塊，即每幀圖像分成396個宏塊；而525行的NTSC制，每幀圖像被切為15片，每片再切成22個宏塊，即每幀圖像分成330個宏塊。對亮度信號來說，每個宏塊又分為4個區(qū)塊，每個區(qū)塊含有8×8=64個像素，則每個宏塊含有256個像素。但對兩個色差信號來說，宏塊像素數(shù)等于區(qū)塊像素數(shù)，即像素數(shù)是8×8=64個，是亮度像素的1/4。盡管兩色差信號的像素較少，清晰度低，但不影響人眼睛的主觀感覺。在進行數(shù)字圖像處理時，按照圖中各個8×8方塊( 共64塊) 編成次序，再按照編號順序依次處理。也就是說，以8×8像素的方塊作基本操作單元，依次處理每個像素(即取樣點)的取樣數(shù)值。
3、采用幀間和幀內(nèi)數(shù)據(jù)壓縮技術(shù)。
實用電視每秒鐘傳送25－30幀畫面，使畫面變化具有連續(xù)感，電視活動圖像是由各幀畫面差別很小的一系列畫面組成的。各幀畫面的微小變化主要表現(xiàn)于畫面主體部分，畫面的背景差別很小。圖像是由亮度、色度信息來描述的，在各相鄰幀圖像內(nèi)，若分別比較同一相對位置的亮度、色度信號，通常其差別較小。經(jīng)大量統(tǒng)計發(fā)現(xiàn)，在各個像素當(dāng)中僅有10%以下的像素點的亮度差值變化超過去時2%，而色度差值變化在0.1%以下。在各幀圖像中具有大量重復(fù)內(nèi)容，這些重復(fù)內(nèi)容的數(shù)據(jù)屬于多余(冗余)信息，于是，可以通過減少時域冗余信息的方法，即運作幀間數(shù)據(jù)壓縮技術(shù)，來減少圖像傳輸?shù)臄?shù)碼率。
經(jīng)分析發(fā)現(xiàn)，在同一幀畫面內(nèi)也存在相當(dāng)多的冗余信息。對圖像主體部分和眼睛最敏感的部分，應(yīng)當(dāng)準(zhǔn)確、詳細(xì)地處理，需要對每個像素點進行精細(xì)傳輸；但對于圖像非主體部分和眼睛不敏感的部分，則可以進行粗略地處理，即進行信息數(shù)據(jù)的壓縮處理。于是，可以根據(jù)一幀圖像內(nèi)容的具體分布情況，對不同位置可采用不同的數(shù)據(jù)量來傳送，減少傳送圖像的數(shù)據(jù)量，使圖像數(shù)據(jù)得到壓縮。這種壓縮數(shù)據(jù)的方法，是在同一幀圖像的不同空間部位進行數(shù)據(jù)壓縮，稱為空間域冗余壓縮。例如，有一幅人像畫面，其面部和頭部的線條清晰度可以不相同，尤其是眼睛、嘴唇部位表情豐富，線條比較精細(xì)復(fù)雜，是觀眾最注意的部位，應(yīng)當(dāng)用高清晰度傳送；而頭頂部位和面頰側(cè)面，輪廓變化較少，灰度層次變化較小，觀眾不太注意這些部位。顯然，圖像的主要部位，灰度層次變化較大的部位，人眼睛敏感的部位，應(yīng)當(dāng)以較大數(shù)據(jù)量進行精細(xì)傳送；而那些圖像的次要部位，灰度層次變化較小的部位，人眼睛不注意的部位，則可用較少數(shù)據(jù)量進行粗略傳送，甚至于僅僅傳送它們的平均亮度信息。
以下具體討論數(shù)字圖像的數(shù)據(jù)壓縮原理。先討論靜止圖像的數(shù)據(jù)壓縮技術(shù)，即幀內(nèi)數(shù)據(jù)壓縮技術(shù)；然后討論活動圖像的數(shù)據(jù)壓縮技術(shù)，即幀間數(shù)據(jù)壓縮技術(shù)。
二、幀內(nèi)數(shù)據(jù)壓縮技術(shù)
首先對整幅圖像進行分割處理，經(jīng)分割取得最小操作單元。下面按8×8=64個像素組成的區(qū)塊來計論。每一個像素值都可以按一定規(guī)律取樣，例如可對亮度各個像素的亮度值取樣，若每個像素按8bit量化，則每個區(qū)塊的總數(shù)據(jù)量為8bit×64（像素點），即512bit。可見，對全畫面各像素量化處理后數(shù)據(jù)量十分龐大，需要進行數(shù)據(jù)壓縮。通常，經(jīng)過離散余弦變換，Z字型掃描，可變長度編碼等處理過程，可將數(shù)據(jù)總量進行大量壓縮。
1、離散余弦變換（DCT）編碼
(1) 功能簡述
離散余弦變換簡稱為DCT（是英Discrete Cosine Transform的縮寫詞），是一種數(shù)字處理方法，經(jīng)常用于數(shù)據(jù)處理。DCT是多種數(shù)字變換方法的一種，它是把空間域圖像變換到頻率域進行分析的方法。由于DCT的變換核構(gòu)成的基向量與圖像內(nèi)容無關(guān)，而且變換核是可以分離的，既二維DCT可以用兩次一維DCT來完成，使得數(shù)學(xué)運算難度大大簡化，再配以已經(jīng)發(fā)現(xiàn)的其它快速算法，使得DCT編碼得到了廣泛的應(yīng)用。將DCT應(yīng)用于圖像數(shù)據(jù)壓縮，可以減少代表圖像亮度(或色度)層次數(shù)碼信息，達到數(shù)據(jù)壓縮的目的。利用DCT不僅可將圖像編碼，還可以在編碼變換過程發(fā)現(xiàn)圖像細(xì)節(jié)的位置，以便刪去或略去對視覺不敏感的部分，而更加突出視覺的敏感部分，通過選擇主要數(shù)據(jù)來傳輸、重視圖像。
利用DCT壓縮圖像數(shù)據(jù)，主要是根據(jù)圖像信號在頻率域的統(tǒng)計特性。在空間域看來，圖像內(nèi)容千差萬別；但在頻率域上，經(jīng)過對大量圖像的統(tǒng)計分析發(fā)現(xiàn)，圖像經(jīng)過DCT變換后，其頻率系數(shù)的主要成分集中于比較小的范圍，且主要位于低頻部分。利用DCT變換揭示出這種規(guī)律后，可以再采取一些措施把頻譜中能量較小的部分舍棄，盡量保留傳輸頻譜中主要的頻率分量，就能夠達到圖像數(shù)據(jù)壓縮目的。
(2)規(guī)律和特點
①時間域信號的頻譜
對于一個隨時間變化的波形來說，它是隨時間變化的周期信號，它是以一定幅度值為波形的直流平均值，其波形可看成是基波與無數(shù)次諧波疊加而成。其基波振幅最大，然后各次諧波振幅逐漸減小。各次諧波疊加次數(shù)越高，則合成波形越接近于理想矩形波。此分析方法就是應(yīng)用日益廣泛的頻譜分析方法。其中各次正弦波諧波的振幅值經(jīng)常稱為頻譜系數(shù)，將頻譜系數(shù)排列起來，可以組成一個系數(shù)列。上述事實說明，周期性矩形波可以由時間域 (反映幅度－時間關(guān)系)來描述，也可以由頻率域(幅度－頻率關(guān)系)來描述。兩者有互相對應(yīng)的關(guān)系。實際上，各種時間域信號都可以由頻率域的規(guī)律來描述，兩種描述方法存在內(nèi)在的聯(lián)系，可以互相轉(zhuǎn)換。
②空間域信號的頻譜系數(shù)
對于各種空間域分布的信號，也可以進行類似的頻率變換，即將空間域信號轉(zhuǎn)變?yōu)轭l率域信號。DCT就是其中一種頻率分析方法?？蓞㈤唸D2.2.2來說明DCT變換過程。
由圖像內(nèi)取出一個區(qū)塊，分成8×8個像素的64格陣列，即由圖(a)轉(zhuǎn)變?yōu)閳D(b)。經(jīng)過對逐個像素的亮度（或討論色度）數(shù)值取樣，并將像素的亮度數(shù)值列成矩陣形表格，見圖（C）。然后利用離散余弦變換（DCT）可將各空間取樣值轉(zhuǎn)變

為頻率域的數(shù)值，這里稱為DCT系數(shù)。
對于上述64點陣列來說，可得到64個DCT系數(shù)，轉(zhuǎn)換為圖（d）矩形陣列表格。它已經(jīng)將64個點的圖像采樣值組成的陣列，變?yōu)橐粋€直流平均值和63個不同頻率余弦波幅值組成的64個點陣列，并稱為DCT系數(shù)陣列。經(jīng)過上述變換后，已將空間坐標(biāo)的數(shù)據(jù)轉(zhuǎn)換為頻率坐標(biāo)的數(shù)據(jù)，即DCT頻率系數(shù)。原有8×8區(qū)塊的各個像素的數(shù)值取樣量化后，轉(zhuǎn)變?yōu)轭l率域圖像信號的頻譜系數(shù)，即可用64個頻率系數(shù)來表述，稱它們?yōu)?4個“正交基信號”，每個基信號對應(yīng)于64個獨立二維空間頻率中的一個。這些空間頻率是由輸入信號的“頻譜”組成。所得64個變換系數(shù)當(dāng)中，第一項代表直流分量，即64個空間圖像采樣值的平均值，其余63個系數(shù)代表各基信號的幅度。
觀察圖2.3.2（d）數(shù)據(jù)可發(fā)現(xiàn)規(guī)律，矩陣左上角的數(shù)值較大，而右下角的數(shù)值較小，且趨近于零值。于是，可以按照Z字形掃描順序，將各基信號的DCT系數(shù)列成一個表格。Z字形掃描的具體軌跡，如圖2.3.2(e)所示。按照此規(guī)律將DCT系數(shù)排列成數(shù)據(jù)系列，成為DCT系數(shù)編碼順序。經(jīng)過上述處理后，已將二維數(shù)據(jù)量轉(zhuǎn)換為一維數(shù)據(jù)量，該數(shù)列第一項是該區(qū)塊的平均亮度值，后面各項系數(shù)的分布和大小可以反映亮度起伏變化的劇烈程度。若系數(shù)較大，說明亮度起伏較大，該區(qū)域圖像輪廓較細(xì)致；若數(shù)值較小，則說明該區(qū)內(nèi)亮度變化較平緩；若數(shù)值為零，表示數(shù)列中高頻分量數(shù)值為零，亮度電平無變化。在實際數(shù)據(jù)處理過程中，排在后面的系數(shù)值基本上都有是零值，或者趨于零值。由63個系數(shù)集合及變化情況，可反映出該區(qū)塊內(nèi)圖像細(xì)節(jié)情況，即圖像清晰度狀況。
圖（d）矩陣數(shù)值非常具有實用價值。左上角數(shù)值較大，它們代表了圖像信息的直流成分和低頻分量，它是圖像信息的主體部分，也是區(qū)塊內(nèi)信息的主要部分；而右下角數(shù)值較小，它們代表了圖像信息的高頻分量，其幅值原本就比較小，它主要反映圖像的細(xì)節(jié)部分。人眼睛對圖像的亮度信息有較高的相對靈敏度，對圖像的彩色信息不夠敏感；還有，人眼睛對圖像信息的低頻分量具有較高的視覺靈敏度。經(jīng)Z字形字掃描后所形成的數(shù)據(jù)系列，恰好與人眼睛對圖像信息的敏感程度形成良好的對應(yīng)關(guān)系。根據(jù)視覺生理的上述規(guī)律，可對圖像數(shù)據(jù)進行壓縮。
2、DCT系數(shù)的再量化處理
經(jīng)過上述DCT處理的頻率數(shù)據(jù)可以進行再處理，進一步壓縮數(shù)據(jù)量。人眼睛對各種頻率的敏感程度不同，并可取得統(tǒng)計性靈敏度數(shù)值。由此可對每種頻率分量設(shè)定不同的折算值，將前述經(jīng)轉(zhuǎn)換得到的DCT系數(shù)再次進行折算，以便進一步突出視覺效果影響大的成分，而消弱或忽略視覺效果影響小的成分。這種處理方法稱為量化處理，簡稱Q處理。對于64點陣列的64個系數(shù)來說，對應(yīng)了64種不同頻率，可使用64個不同的折算值。通常稱這64個折算值為量化表，每個折算值稱為量化步長，或稱量化值。在64點陣列中，左上角的數(shù)據(jù)量化值較小，右下角的數(shù)據(jù)量化值較大。對DCT系數(shù)的再量化處理，可利用量化器電路來實現(xiàn)。該電路可將區(qū)塊的64個系數(shù)分別除以量化表中對應(yīng)位置量化步長，再進行四舍五入取整后，即可得到經(jīng)過再量化處理的64個數(shù)據(jù)值。
經(jīng)過量化處理后，量化值大的系數(shù)值所得商值較小，也就是數(shù)據(jù)壓縮比較大，原圖像相應(yīng)部分的忽略內(nèi)容較多；量化值小的系數(shù)所得商數(shù)值較大，也就是數(shù)據(jù)壓縮比較小，原圖像相應(yīng)部分不予忽略或極小忽略。于是，經(jīng)過量化處理后的DCT系數(shù)矩陣，可出現(xiàn)許多零值。一般左上角位置的數(shù)據(jù)的商數(shù)是非0，在右下角位置的數(shù)據(jù)的商數(shù)很小，經(jīng)四舍五入取整值后可簡寫為0。在系數(shù)矩陣上出現(xiàn)了許多0值，則大大減少了數(shù)據(jù)量。一方面保留了圖像信息的主體部分，另一方面大大壓縮了像數(shù)據(jù)。
3．可變長度編碼（VLC）
經(jīng)量化處理的系數(shù)矩陣出現(xiàn)了許多0值，若進行Z字形掃描時，后面的系數(shù)將也出現(xiàn)連續(xù)0的狀況。此時，數(shù)據(jù)傳輸總量已經(jīng)明顯減少，但碼位并未減少，仍為64個系數(shù)位。為了進一步壓縮數(shù)據(jù)總量，可采用可變長度編碼，并簡稱VLC(Variable Length Coding)。
通常，采用兩種方法進行可變長度編碼。第一種，是根據(jù)數(shù)據(jù)出現(xiàn)的頻率，分配以不同長度的碼字來代替，對于頻繁出現(xiàn)的數(shù)據(jù)，分配以較短的碼字，那些不經(jīng)常出現(xiàn)的數(shù)據(jù)，則賦予較長的碼字，這樣處理后可減少傳輸?shù)目偞a率。第二種方法，雖然Z字形掃描使系數(shù)列尾部出現(xiàn)多個0個值，但不需要逐位地傳輸0值，僅需傳送表0的“個數(shù)”碼，待重放時再按規(guī)定恢復(fù)為0位，以便填滿矩陣的64位。例如00000，則可表示為50，在解碼時恢復(fù)為00000。
總之，對于靜止畫面來說，采用離散余弦變換，Z字形掃描、量化處理和可變長度編碼等方法，可使圖像數(shù)據(jù)量大大壓縮。在數(shù)據(jù)解碼時，先經(jīng)過可變長度解碼，恢復(fù)為數(shù)據(jù)的固定長度；再對系數(shù)進行反量化，恢復(fù)為原來的DCT頻率系數(shù)；再經(jīng)過反向離散余弦變換，恢復(fù)為圖像的空間坐標(biāo)數(shù)值，即原來圖像的數(shù)據(jù)。
三、幀間數(shù)據(jù)壓縮技術(shù)
對于活動圖像來說，相鄰幀的圖像具有強烈的相關(guān)性。在保存和記錄動態(tài)圖像時，不需要將每一幀圖像的全部信息都記錄和保存下來，可以將前面第一幀圖像全部數(shù)據(jù)都記錄下來，把它看成是靜態(tài)圖像，可用靜態(tài)圖像數(shù)據(jù)壓縮方法來處理。而后面諸幀圖像，可以僅記錄與前面幀圖像有差異的信息。于是，在重放時，利用前面幀圖像的數(shù)據(jù)和后面幀的差異數(shù)據(jù)，即可恢復(fù)出后面幀的圖像。這種處理方法省去許多數(shù)據(jù)。
1、三種畫面
按照MPEG-1標(biāo)準(zhǔn)，傳送的活動畫面可分為3種類型。第1種，是場景更換后的第1幀畫面，它是一種獨立的畫面，這種畫面采用較高清晰度的逐點取樣法進行傳送，此畫面稱為I畫面（內(nèi)碼幀，或稱幀內(nèi)編碼幀）。該畫面信息是由自身畫面決定，不必參考其它畫面。該畫面的數(shù)據(jù)代表了活動圖像的主體內(nèi)容和背景內(nèi)容，它是電視畫面的基礎(chǔ)。第2種，是與I畫面相隔一定時間、活動圖像主體位置在同一背景上已發(fā)生明顯變化的畫面，此畫面稱P畫面（預(yù)測幀，或稱前向預(yù)測編碼幀）。該畫面用前面的I畫面作為參考畫面，該畫面不傳送背景等重復(fù)性信息，僅傳送主體變化的差值，這就省略了一部分細(xì)節(jié)信息，而在重放時依靠幀存儲器將I畫面的主要部分和P畫面的差值進行運算，即可得出新畫面的完整內(nèi)容，它是既有背景又有現(xiàn)時運動主體狀態(tài)的實際畫面。第3種，其情況與P畫面相似，用來傳送在I、P畫面之間的畫面，稱B畫面（雙向預(yù)測幀，或稱雙向預(yù)測內(nèi)插編碼幀）。該畫面僅反映在I、P畫面之間的運動主體變化情況，并用位移矢量（或稱運動矢量等）表示畫面主體移動情況。其信息量更小些。因為在重放它時，既可參考I畫面內(nèi)容，也要參考P畫面內(nèi)容，所以稱為雙向預(yù)測幀。
將一串連續(xù)相關(guān)的畫面分為I、P、B型后，傳輸信息量明顯減少。在P、B畫面當(dāng)中，幾乎不傳送反映實物的象素，僅傳送其主體移動的差值，其具體的處理方法是采用了區(qū)塊對比的方法，在兩個變化的畫面當(dāng)中，將區(qū)塊或宏塊作為處理單元，將一個畫面的宏、區(qū)塊與參與　畫面中鄰近范圍內(nèi)的宏、區(qū)塊進行數(shù)值運算對比，尋找與該塊最相近、誤差最小的區(qū)塊，找到近似的該區(qū)塊后，記錄該區(qū)塊在兩個畫面中的位移值，即為位移矢量以及反映兩畫面的差值量。若位移矢量坐標(biāo)變化為0，說明該塊沒有移動，例如相同的背景景物；若位移矢量值有變化，而區(qū)塊差值為0，則說明景物有移動，而形狀沒有變化，例如飛行中的球類和奔馳的車輛等?？梢?，位移矢量和區(qū)塊差值可在重放時依靠參考畫面得出新畫面的完整場景，而傳送時卻省略了背景和主體內(nèi)容，只傳送代表位移矢量和差值的少量數(shù)據(jù)，使圖像得到大量壓縮。
2、三種畫面的連接
通常，更換場景后的第一幀就是I幀，I幀應(yīng)當(dāng)全幀傳送。從壓縮的程度來看，I畫面的壓縮量最少；P畫面次之，它是以I畫面為基礎(chǔ)；B畫面壓縮最多。為了加大壓縮比，通常在I幀后面相隔2幀（最多3幀）設(shè)置1個P幀，在I、P幀之間都是B幀，在兩個P幀之間也是設(shè)置2～3幀B幀。B幀傳送它與I幀或P幀之間的差值信息，或者P幀與后面P幀或I幀之間的差值信息，或者它與前后I、P幀或P、P幀平均值之間的差值信息。當(dāng)主體內(nèi)容變化愈大時，兩個I畫面之間的幀數(shù)值越?。划?dāng)主體內(nèi)容變化小時，I面畫的間隔可以適當(dāng)大一些?；蛘哒f，B幀、P幀所占比例越大，圖像壓縮比越高。一般兩個I畫面相隔13～15幀，相隔幀數(shù)不宜再多。
下面以15幀為例，說明VCD圖像幀的排列順序。I、P、B三種畫面的典型設(shè)置方式，對NTSC制共約需半秒時間。節(jié)目輸入順序是按實際出現(xiàn)順序排列的，即I、B、B、P、B、B、P、B、B……I、B、B、P……；但為了解碼時便于從I、P畫面插補得到B畫面，在編碼錄制節(jié)目時，將順序改變了，即按照I、P、B、B……順序，即改為按原來0、3、1、2、6、4、5、9、7、8…的畫面順序。解碼時先解出0幀、3幀，再由其插補預(yù)測計算得出1幀、2幀等等。為此，須在解碼器內(nèi)設(shè)置動態(tài)存儲器，將I、P幀先解碼并存儲，再計算出各個B幀。不過最后輸出時，還是應(yīng)當(dāng)按照實際播放順序重組讀出，按正確順序輸出。
VCD采用的幀間壓縮技術(shù)標(biāo)準(zhǔn)，對圖像編碼順序和各幀間隔是有具體規(guī)定的。采用幀壓縮技術(shù)后，各幀之間的信息冗余量大大減少，圖像碼率進一步壓縮，壓縮比可達3-20余倍。
四、圖像壓縮編碼過程和解壓縮過程
1、編碼過程
這里談?wù)刅CD所采用MPEG-1標(biāo)準(zhǔn)的編碼過程。因為相鄰幀畫面相同或基本相同，將這種畫面群的第1幅畫面作為I畫面，將它送入編碼器。編碼器首先將它割裂為許多片、宏塊、區(qū)塊等，將各區(qū)塊分割為8×8=64點陣列，再進行Z字形描述和DCT變換，將64個亮度(或色度)取樣數(shù)值變換為64個DCT系數(shù)，再對64個系數(shù)值分別進行相應(yīng)的量化，經(jīng)量化處理后再進行VLC處理，即得到了代表一個區(qū)塊數(shù)據(jù)的最短的數(shù)碼，至此，完成了該畫面群第1幀的第1列圖像中第1宏塊的編碼。依次類推，可得到第1幀畫面的全部壓縮數(shù)據(jù)編碼。原為二維空間的一幀圖像信息已經(jīng)轉(zhuǎn)變?yōu)橐痪S空間的串行數(shù)據(jù)，這些數(shù)據(jù)被全部存儲起來，成為繼續(xù)進行數(shù)據(jù)處理的基礎(chǔ)。至此，I畫面數(shù)據(jù)處理完畢。
完成第1幀圖像壓縮編碼后，接著輸入第2幀圖像。編碼器按照相同的方法步驟對第2幀進行壓縮編碼，得到第2幀數(shù)據(jù)。此時，編碼器不再將第2幀數(shù)據(jù)進行完整的存儲和傳送，而是將它與第1幀數(shù)據(jù)進行比較運算。若運算中發(fā)現(xiàn)，兩幀間數(shù)據(jù)差別很小時，說明兩幀圖像差別不大，僅將其差值存入存儲器，而舍掉其大部分重復(fù)數(shù)據(jù)。按照此方法再進行第3、第4幀編碼，并進行比較運算，直到找到某一幀，差別較大且超過規(guī)定值時，再將此幀數(shù)據(jù)中與第1幀的差別(包括位移矢量和差值)部分存儲起來，并將此幀數(shù)據(jù)排在第1幀(I幀)后面?zhèn)魉统鋈?，該幀就是P畫面。當(dāng)傳送I、P畫面后，再傳送3、4幀的差別數(shù)據(jù)，這些畫面都是B畫面。它們之間的差別不大，是處于I、P之間的畫面。按照此程序和方法，可再選出許多組P和B畫面。通常，每隔13～15幀后，再設(shè)置一個I畫面，作為后續(xù)畫面的參考基準(zhǔn)。如遇到較新的場景，將出現(xiàn)一幅不相同的新畫面，這幅新出現(xiàn)的畫面也作為I畫面。

圖2.2.3是MPEG-1圖像壓縮編碼器方框圖。代表亮度Y和色度分量CB、CR的二進制數(shù)碼
化信號，首先進入幀改組器(或稱幀重排電路)，將畫面分割為片、宏塊、區(qū)塊。區(qū)塊經(jīng)過比較
運算電路再進入DCT電路、量化器、VLC電路，取得已壓縮數(shù)據(jù)。再將數(shù)據(jù)送到多路混合器和傳輸緩沖器。傳輸緩沖器用于暫存壓縮數(shù)據(jù)，并按照控制指令的先后按時序輸出數(shù)據(jù)。該緩沖器通過調(diào)整器(又稱為量化自適應(yīng)器)與量化器相連接。調(diào)整器可用來檢測緩沖器的緩沖區(qū)的數(shù)據(jù)暫存程度，并根據(jù)暫存數(shù)據(jù)量自動調(diào)整量化步長。在編碼器內(nèi)設(shè)置有反饋通路，它主要包括反量化器(Q-1)、離散余弦逆變換(IDCT)、相加器以及IPB畫面幀存儲器等。反饋回路用于預(yù)測圖像產(chǎn)生，進行畫面分類處理(計算、區(qū)分并處理IPB畫面)，主要用于幀間數(shù)據(jù)壓縮編碼處理。還有，運動預(yù)測和補償電路可用于運動補償。
2、圖像解壓縮電路方框圖
圖像解壓縮電路簡稱為解壓電路、解碼電路。VCD視盤機內(nèi)，經(jīng)過數(shù)字信號解調(diào)電路（CD-DSP）處理后，輸出壓縮編碼視頻數(shù)據(jù)流，需要經(jīng)過視頻解壓縮電路進行數(shù)據(jù)解壓縮，恢復(fù)為未壓縮的視頻信號。解碼過程是編碼的逆過程，圖2.2.4是MPEG-1視頻解壓縮電路方框圖,其電路結(jié)構(gòu)比編碼器稍簡單一些。

圖2.2.4　MPEG-1視頻解壓縮電路方框圖

來自CD-DSP電路的壓縮編碼信號送到輸入緩沖器，然后進入去混合電路，將圖像的編碼模式標(biāo)志，運動向量（位移矢量）和圖像數(shù)據(jù)分離開，分別送往幀存儲器和解壓縮主通道電路。
主通道要處理I、P、B幀數(shù)據(jù)，這些數(shù)據(jù)已經(jīng)按照圖像編碼系列的規(guī)定，以數(shù)據(jù)封包頭標(biāo)指出，這些數(shù)據(jù)分別暫存在緩沖存儲器的存儲區(qū)內(nèi)，根據(jù)數(shù)據(jù)量大小暫存在容量不同的存儲器區(qū)中。在微處理器控制下，先將I畫面數(shù)據(jù)按序取出，送到VLC(可變長度碼解調(diào)器)，按照ROM存放的可變長度碼對照表，逐一將編碼時壓縮的碼位恢復(fù)為壓縮前的DCT量化值，再將各區(qū)塊分為64個數(shù)據(jù)的量化值逐位乘以反量化參數(shù)，這些參數(shù)位于ROM中存放的64位視覺心理模式量化表的相對位置，重新恢復(fù)為DCT頻率系數(shù)，完成反量化過程。
經(jīng)過反量化的數(shù)據(jù)，再送入IDCT(離散余弦逆變換)電路。這是另一次逆變換，也是通過查表法，將反量化值所代表的各頻率余弦分量的幅值進行逆變換，重新恢復(fù)為DCT變換前的圖像(Y、CB、CR)取樣數(shù)據(jù)，從而取得代表圖像壓縮前的區(qū)塊信息。4個區(qū)塊的信息組成一個宏區(qū)塊，若干個宏區(qū)塊組成片，再由若干片組成完整畫面的總數(shù)據(jù)，這就是I幀畫面。這些繁重的相加工作都需要在加法器中進行。
恢復(fù)出來的I幀畫面數(shù)據(jù)存入幀存儲器。I畫面與后續(xù)輸入的P畫面數(shù)據(jù)相加，可恢復(fù)出P畫面，P畫面也存入幀存儲器。然后根據(jù)運動矢量和運動后圖像差值(即B畫面數(shù)據(jù))，與I、P畫面存儲數(shù)據(jù)在加法器中相加，并受編碼模式信號的控制，以便決定I、P圖像的成分多少，從而恢復(fù)出不同前后的B幀畫面。經(jīng)以上處理所得I、P、B各種畫面數(shù)據(jù)都需要存入緩沖存儲器，還要根據(jù)編碼模式的指示及輸出制式的幀頻要求，按照I、B、B、P、B、B、P、B、B…B、I、B、B、P、B…的正常順序進行重新編排，按照一定的速度從幀重排電路輸出。輸出的解壓縮數(shù)據(jù)送到D/A轉(zhuǎn)換器，轉(zhuǎn)變?yōu)镽、G、B三基色模擬信號。
通常，在解壓縮電路還要輔設(shè)視頻編碼器和調(diào)制器。視頻編碼器可將三基色信號編碼為NTSC/PAL制彩色電視信號，并加入同步、消隱、色同步和彩色副載波信號等，以視頻模擬全電視信號形式輸出。這種輸出形式的信號需要輸送到電視接收機的AV輸入端口。但是，有些老式電視機沒有設(shè)置AV輸入端口，為了適應(yīng)這種現(xiàn)象，輸出的視頻全電視信號需要再一次進行高頻調(diào)制，利用調(diào)制器以某個特定頻道的RF調(diào)幅形式輸出電視信號。此時，VCD機需要設(shè)置RF輸出端口，其輸出信號可直接送到電視機的天線輸入端口。