音頻編碼和解碼原理
每張CD光盤重放雙聲道立體聲信號(hào)可達(dá)74分鐘。VCD視盤機(jī)要同時(shí)重放聲音和圖像,圖像信號(hào)數(shù)據(jù)需要壓縮,其伴音信號(hào)數(shù)據(jù)也要壓縮,否則伴音信號(hào)難于存儲(chǔ)到VCD光盤中。
一、伴音壓縮編碼原理
伴音信號(hào)的結(jié)構(gòu)較圖像信號(hào)簡(jiǎn)單一些。伴音信號(hào)的壓縮方法與圖像信號(hào)壓縮技術(shù)有相似性,也要從伴音信號(hào)中剔除冗余信息。人耳朵對(duì)音頻信號(hào)的聽(tīng)覺(jué)靈敏度有其其規(guī)律性,對(duì)于不同頻段或不同聲壓級(jí)的伴音有其特殊的敏感特性。在伴音數(shù)據(jù)壓縮過(guò)程中,主要應(yīng)用了聽(tīng)覺(jué)閾值及掩蔽效應(yīng)等聽(tīng)覺(jué)心理特性。
1、閾值和掩蔽效應(yīng)
(1) 閾值特性
人耳朵對(duì)不同頻率的聲音具有不同的聽(tīng)覺(jué)靈敏度,對(duì)低頻段(例如100Hz以下)和超高頻段(例如16KHZ以上)的聽(tīng)覺(jué)靈敏度較低,而在1K-5KHZ的中音頻段時(shí),聽(tīng)覺(jué)靈敏度明顯提高。通常,將這種現(xiàn)象稱為人耳的閾值特性。若將這種聽(tīng)覺(jué)特性用曲線表示出來(lái),就稱為人耳的閾值特性曲線,閾值特性曲線反映該特性的數(shù)值界限。將曲線界限以下的聲音舍棄掉,對(duì)人耳的實(shí)際聽(tīng)音效果沒(méi)有影響,這些聲音屬于冗余信息。
在伴音壓縮編碼過(guò)程中,應(yīng)當(dāng)將閾值曲線以上的可聽(tīng)頻段的聲音信號(hào)保留住,它是可聽(tīng)頻段的主要成分,而那些聽(tīng)覺(jué)不靈敏的頻段信號(hào)不易被察覺(jué)。應(yīng)當(dāng)保留強(qiáng)大的信號(hào),忽略舍棄弱小的信號(hào)。經(jīng)過(guò)這樣處理的聲音,人耳在聽(tīng)覺(jué)上幾乎察覺(jué)不到其失真。在實(shí)際伴音壓縮編碼過(guò)程中,也要對(duì)不同頻段的聲音數(shù)據(jù)進(jìn)行量化處理??蓪?duì)人耳不敏感頻段采用較粗的量化步長(zhǎng)進(jìn)行量化,可舍棄一些次要信息;而對(duì)人耳敏感頻段則采用較細(xì)小的量化步長(zhǎng),使用較多的碼位來(lái)傳送。
(2)掩蔽效應(yīng)
掩蔽效應(yīng)是人耳的另一個(gè)重要生理特征。如果在一段較窄的頻段上存在兩種聲音信號(hào),當(dāng)一個(gè)強(qiáng)度大于另一個(gè)時(shí),則人耳的聽(tīng)覺(jué)閾值將提高,人耳朵可以聽(tīng)到大音量的聲音信號(hào),而其附近頻率小音量的聲音信號(hào)卻聽(tīng)不到,好像是小音量信號(hào)被大音量信號(hào)掩蔽掉了。由于其它聲音信號(hào)存在而聽(tīng)不到本聲音存在的現(xiàn)象,稱為掩蔽效應(yīng)。
根據(jù)人耳的掩蔽特性,可將大音量附近的小音量信號(hào)舍棄掉,對(duì)實(shí)際聽(tīng)音效果不會(huì)發(fā)生影響。既使保留這些小音量信號(hào),人耳也聽(tīng)不到它們的存在,它屬于伴音信號(hào)中的冗余信息。舍棄掉這些信號(hào),可以進(jìn)一步壓縮伴音數(shù)據(jù)總量。
經(jīng)仔細(xì)觀察,掩蔽效應(yīng)分為兩大類,一類是同時(shí)掩蔽效應(yīng),另一類是短時(shí)掩蔽效應(yīng)。其中,同時(shí)掩蔽效應(yīng)是指同時(shí)存在一個(gè)弱信號(hào)和一個(gè)強(qiáng)信號(hào),兩者頻率接近,強(qiáng)信號(hào)將提高弱信號(hào)的聽(tīng)閾值,將弱信號(hào)的聽(tīng)閾值提高到一定程度時(shí),可使人耳聽(tīng)不到弱信號(hào)。例如,同時(shí)出現(xiàn)A、B兩聲,若A聲的聽(tīng)覺(jué)閾值為50dB,由于存在另一個(gè)不同頻率的B聲,將使A聲的閾值提高到64~68dB,例如取68dB,那么數(shù)值(68~50)dB=18dB,該值稱為掩蔽量。將強(qiáng)大的B聲稱為掩蔽聲,而較弱的A聲稱為被掩蔽聲。上述掩蔽現(xiàn)象說(shuō)明,若僅有A聲時(shí),其聲壓級(jí)50dB以上的聲音可以傳送出去,而50dB以下的聲音將聽(tīng)不到;若同時(shí)出現(xiàn)B聲,B聲具有同時(shí)掩蔽效應(yīng),使得A聲在聲壓級(jí)68dB以下的聲音也聽(tīng)不到了,即50~68dB之間的A聲人耳也聽(tīng)不到了,這些聲音不必傳送,即使傳送也聽(tīng)不到,只須傳送聲壓級(jí)68dB以上的聲音??傊瑸榱颂岣咭粋€(gè)聲音的閾值,可以同時(shí)設(shè)置另一個(gè)聲音,使用這種辦法可以壓縮掉一部分聲音數(shù)據(jù)。在周圍十分安靜的環(huán)境下,人耳可以聽(tīng)到聲壓級(jí)很低的各種頻率聲音,但對(duì)低頻聲和高頻聲的掩蔽閾值較高,即聽(tīng)覺(jué)不靈敏。經(jīng)研究還發(fā)現(xiàn),掩蔽聲越強(qiáng),掩蔽作用越強(qiáng);當(dāng)掩蔽聲與被掩蔽聲的頻率相差越小,掩蔽效果越明顯,兩者頻率相等時(shí),掩蔽效果最佳;低頻聲(設(shè)為B)可有效地掩蔽高頻聲(設(shè)為A),而高頻聲(設(shè)為B)幾乎不能掩蔽低頻聲(設(shè)為A)。因而輸入信號(hào)時(shí),在受掩蔽的頻帶內(nèi)加入更大的噪聲時(shí),人耳也感覺(jué)不到與原始信號(hào)有所區(qū)別。上述的同時(shí)掩蔽效應(yīng),又稱為頻域掩蔽效應(yīng),它主要反映在頻域方面對(duì)掩蔽作用的影響。在聲音壓縮編碼中,更多地使用單頻聲音的掩蔽效應(yīng)。
如果A聲和B聲不同時(shí)出現(xiàn),也可發(fā)生掩蔽作用,稱它為短時(shí)掩蔽效應(yīng)。短時(shí)掩蔽又可分為兩種類型,作用仍可持續(xù)一段時(shí)間,即后向掩蔽和前向掩蔽。后向掩蔽是指掩蔽聲B消失后,其掩蔽作用仍可持續(xù)一段時(shí)間,一般可達(dá)0.5~2秒。掩蔽機(jī)理是人耳的存儲(chǔ)效應(yīng)所致。而前向掩蔽是指被掩蔽聲A出現(xiàn)一段時(shí)間后出現(xiàn)掩蔽聲B,只要A、B聲音隔不太大(一般在0.05~0.2秒以內(nèi)),B也可對(duì)A起掩蔽作用。掩蔽機(jī)理是A聲尚未被人耳感知接受時(shí),強(qiáng)大的B聲已來(lái)臨所致。在實(shí)踐中,后向掩蔽有較高的應(yīng)用價(jià)值。短時(shí)掩蔽效應(yīng)具有很強(qiáng)的時(shí)域結(jié)構(gòu)特性,故又稱為時(shí)域掩蔽效應(yīng)。在聲音壓縮編碼中,應(yīng)兼顧好人耳的頻域和時(shí)域兩種掩蔽效應(yīng)。
2、子帶編碼原理
(1)子帶編碼和解碼過(guò)程
所謂子帶編碼技術(shù),是將原始信號(hào)由時(shí)間域轉(zhuǎn)變?yōu)轭l率域,然后將其分割為若干個(gè)子頻帶,并對(duì)其分別進(jìn)行數(shù)字編碼的技術(shù)。它是利用帶通濾波器(BPF)組把原始信號(hào)分割為若干(例如m個(gè))子頻帶(簡(jiǎn)稱子帶)。
在接收端實(shí)現(xiàn)發(fā)送端的逆過(guò)程。輸入子帶編碼數(shù)據(jù)流,將各子帶信號(hào)分別送到相應(yīng)的數(shù)字解碼電路(共m個(gè))進(jìn)行數(shù)字解調(diào),經(jīng)過(guò)諸路低通濾波器(m路),并重新解調(diào),可把各子帶頻域恢復(fù)為當(dāng)初原始信號(hào)的分布狀態(tài)。最后,將各路子帶輸出信號(hào)送到同步相加器,經(jīng)過(guò)相加恢復(fù)為原始信號(hào),該恢復(fù)的信號(hào)與原始信號(hào)十分相似。
(2)子帶編碼的應(yīng)用
子帶編碼技術(shù)具有突出的優(yōu)點(diǎn)。首先,聲音頻譜各頻率分量的幅度值各不相同,若對(duì)不同子帶分配以合適的比例系數(shù),可以更合理地分別控制各子帶的量化電平數(shù)目和相應(yīng)的重建誤差,使碼率更精確地與各子帶的信號(hào)源特性相匹配。通常,在低頻基音附近,采用較大的比特?cái)?shù)目來(lái)表示取樣值,而在高頻段則可分配以較小的編碼比特。其次,通過(guò)合理分配不同子帶的比特?cái)?shù),可控制總的重建誤差頻譜形狀,通過(guò)與聲學(xué)心理模型相結(jié)合,可將噪聲頻譜按人耳主觀噪聲感知特性來(lái)形成。于是,利用人耳聽(tīng)覺(jué)掩蔽效應(yīng)可節(jié)省大量比特?cái)?shù)。
在采用子帶編碼時(shí),利用了聽(tīng)覺(jué)的掩蔽效應(yīng)進(jìn)行處理。它對(duì)一些子帶信號(hào)予以刪除或大量減少比特?cái)?shù)目,可明顯壓縮傳輸數(shù)據(jù)總量。比如,不存在信號(hào)頻率分量的子帶,被噪聲掩蔽的信號(hào)頻率的子帶,被鄰近強(qiáng)信號(hào)掩蔽的信號(hào)頻率分量子帶等,都可進(jìn)行刪除處理。另外,全系統(tǒng)的傳輸信息量與信號(hào)的頻帶范圍、動(dòng)態(tài)范圍等均有關(guān)系,而動(dòng)態(tài)范圍則決定于量化比特?cái)?shù),若對(duì)信號(hào)引入合理的比特?cái)?shù),可使不同子帶內(nèi)按需要給以不同的比特?cái)?shù),也可壓縮其信息量。
二、MPEG-1音頻編碼方框圖
1、MPEG-1音頻編碼的依據(jù)
MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)采用了心理學(xué)算法。利用感知模型刪去那些聽(tīng)覺(jué)不靈敏的聲音數(shù)據(jù),而使重建的聲音質(zhì)量無(wú)明顯下降。它采用子帶編碼技術(shù),根據(jù)心理聲學(xué)模型取得不同子帶的聽(tīng)覺(jué)掩蔽閾值;對(duì)各子帶的取樣值進(jìn)行動(dòng)態(tài)量化。它根據(jù)不同頻段上大音量信號(hào)所引起的小音量信號(hào)掩蔽閾值的變化規(guī)律,對(duì)不同頻段給以不同的量化步長(zhǎng),以便保留主要信號(hào),而舍棄對(duì)聽(tīng)覺(jué)效果影響很小的成分,經(jīng)過(guò)數(shù)據(jù)壓縮,可取得合理的比特流,將原來(lái)大約1.5Mbit/s的聲音傳輸碼率減少到0.3Mbit/s,即壓縮率可達(dá)到1/5。
2、編碼流程
圖2.3.2是基于MUSICAM(掩蔽模式通用子帶編碼和多路復(fù)用)的MPEG-1音頻壓縮編碼方框圖。輸入信號(hào)是經(jīng)過(guò)取樣的二進(jìn)制PCM數(shù)字音頻信號(hào),取樣頻率可以取44.1KHz、48KHz或32KHz,該音頻數(shù)碼信號(hào)的碼值與原來(lái)采樣信號(hào)的幅度、頻率成正比。
數(shù)字音頻信號(hào)首先進(jìn)入數(shù)字濾波器組,它被分成等帶寬的32個(gè)子頻帶,可由數(shù)字濾波器輸出32個(gè)子帶數(shù)據(jù)信號(hào)。這種處理方法與圖像編碼信號(hào)進(jìn)行DCT變換的作用相似,但不是像圖像信號(hào)那樣分為64種余弦頻率信息,這里僅分成32個(gè)子帶,即將音頻數(shù)據(jù)流改為32種頻率的組合。聲音的分解力低于圖像,這種處理方法是可行的。然后,對(duì)32個(gè)子帶的伴音數(shù)據(jù)進(jìn)行再量化,以便再壓縮數(shù)據(jù)量。對(duì)于各個(gè)子頻帶的量化步長(zhǎng)不相同,量化步長(zhǎng)是根據(jù)人耳的聽(tīng)覺(jué)閾值和掩蔽效應(yīng)而確定的。經(jīng)過(guò)量化處理的已壓縮數(shù)據(jù),保留了伴音信息的主體部分,而舍棄了聽(tīng)覺(jué)效果影響較小的伴音信息。
進(jìn)入編碼系統(tǒng)的輸入信號(hào),分流部分信號(hào)送到并列的1024點(diǎn)快速傅利葉變換器(FFT)進(jìn)行變換,它檢測(cè)輸入信號(hào)每一個(gè)瞬間取樣點(diǎn)在主頻譜分量頻域的分布的強(qiáng)度,經(jīng)變換的信號(hào)送到心理聲學(xué)模型控制單元。根據(jù)聽(tīng)覺(jué)心理聲學(xué)測(cè)量統(tǒng)計(jì)結(jié)果,可以歸納出一個(gè)心理聲學(xué)控制對(duì)照表格,并按照此表格制成控制單元,而單元電路可以集中地反映出人耳的閾值特性和掩蔽特性。
經(jīng)過(guò)量化的32個(gè)子頻帶數(shù)據(jù)已經(jīng)被壓縮,還要加上比例因子、位分配信息等輔助信息,共同加到1位流格式化單元,編碼成為兩個(gè)層次的伴音編碼信號(hào)。它既含有32個(gè)子頻帶的伴音數(shù)碼,又帶有這些數(shù)碼所對(duì)應(yīng)的位分配數(shù)據(jù)和不同頻帶數(shù)據(jù)的強(qiáng)弱比例因子。待將來(lái)數(shù)據(jù)解碼時(shí),可根據(jù)各子頻帶的數(shù)據(jù)恢復(fù)聲音信號(hào),以及壓縮時(shí)碼位分配和強(qiáng)弱比例情況,在進(jìn)行反量化時(shí),參照壓縮時(shí)的程序進(jìn)行還原。
可見(jiàn),伴音的壓縮編碼和圖像處理一樣,也要經(jīng)過(guò)變換、量化、碼位壓縮等處理過(guò)程,它運(yùn)用了許多數(shù)學(xué)模型和心理聽(tīng)覺(jué)測(cè)量的統(tǒng)計(jì)數(shù)據(jù),對(duì)32個(gè)子頻帶和各個(gè)層次信號(hào)的處理也各有不相同的取樣速率。實(shí)際的心理聽(tīng)覺(jué)模型和適時(shí)處理控制過(guò)程十分復(fù)雜。這些算法細(xì)節(jié)都已按硬件方式被固化在解碼芯片中,這些內(nèi)容不能再改變。
3、伴音與圖像的同步
圖像和聲音信號(hào)的壓縮方法有許多不同,圖像數(shù)據(jù)量又遠(yuǎn)遠(yuǎn)大于聲音數(shù)據(jù)量,兩者傳送的數(shù)據(jù)碼率大不相同。每傳送14~15個(gè)視頻數(shù)據(jù)包才傳送1個(gè)音頻數(shù)據(jù)包,而播放聲音和圖像的內(nèi)容又必須作到良好同步,否則將無(wú)法保證視聽(tīng)統(tǒng)一的效果。
為了作到聲圖同步,MPEG-1采用了獨(dú)立的系統(tǒng)時(shí)鐘(簡(jiǎn)稱為STC)作為編碼的參照基準(zhǔn),并將圖像和聲音的數(shù)據(jù)分為許多播放單元。例如,將圖像分為若干幀,將聲音分為若干段落。在數(shù)據(jù)編碼時(shí),在每個(gè)播放單元前面加置一個(gè)展示時(shí)標(biāo)(PTS),或者加置一個(gè)解碼時(shí)標(biāo)(DTS)。當(dāng)這些時(shí)標(biāo)出現(xiàn)時(shí),表示前一個(gè)播放單元已經(jīng)結(jié)束,一個(gè)新的圖像和聲音播放單元立即開(kāi)始。在播放相互對(duì)應(yīng)的同一圖像單元和聲音單元時(shí),可實(shí)現(xiàn)互相同步。
為了使整個(gè)系統(tǒng)在時(shí)鐘在編碼和重放時(shí),聲圖有共同的時(shí)鐘基準(zhǔn),又引入系統(tǒng)參考時(shí)鐘SCR的概念。系統(tǒng)參考時(shí)鐘是一個(gè)實(shí)時(shí)時(shí)鐘,其數(shù)值代表聲圖的實(shí)際播放時(shí)間,用它作為參照基準(zhǔn),以保證聲圖信號(hào)的傳輸時(shí)間保持一致。實(shí)時(shí)時(shí)鐘SCR必須與生活中的真實(shí)時(shí)間一致,要求它的準(zhǔn)確度很高,否則可能發(fā)生聲音和圖像都播快或播慢的現(xiàn)象。為了使SCR時(shí)間基準(zhǔn)穩(wěn)定、準(zhǔn)確,MPEG-1采用了系統(tǒng)時(shí)鐘頻率SCF,以它作為定時(shí)信息的參照基礎(chǔ)。SCF系統(tǒng)時(shí)鐘的頻率是90KHz,頻率誤差為90KHz±4.5KHz。聲圖信號(hào)以SCF為統(tǒng)一的基準(zhǔn),其它定時(shí)信號(hào)SCR、PTS、DTS也是以它為基礎(chǔ)。
三、其它MPEG標(biāo)準(zhǔn)的音頻編碼器
1、MPEG-2音頻編碼方框圖
MPEG-1是處理雙聲道立體聲信號(hào),而MPEG-2是處理5聲道(或7聲道)環(huán)繞立體聲信號(hào),它的重放效果更加逼真。
圖2.3.3是MPEG-2音頻編碼方框圖。它輸入互相獨(dú)立的5聲道音頻信號(hào),有前置左、右主聲道(L、R),前置中央聲道(C),還有后置左、右環(huán)繞聲道(LS、RS)。各聲源經(jīng)過(guò)模-數(shù)轉(zhuǎn)化后,首先進(jìn)入子帶濾波器,每一聲道都要分割為32個(gè)子頻帶,各子帶的帶寬均為750Hz。為了兼容MPEG-1、普通雙聲道立體聲和環(huán)繞模擬立體聲等編碼方式,原來(lái)按MPEG-1編碼的立體聲道能夠擴(kuò)展為多聲道,應(yīng)當(dāng)包括所有5聲道的信息,為此設(shè)置了矩陣變換電路。該電路可生成兼容的傳統(tǒng)立體聲信號(hào)LO、RO,還有經(jīng)過(guò)“加重”的左、中、右、左環(huán)繞、右環(huán)繞聲音信號(hào)(共5路)。對(duì)5路環(huán)繞立體聲信號(hào)進(jìn)行“加重”處理的原因:當(dāng)計(jì)算兼容的立體聲信號(hào)(LO、RO)時(shí),為了防止過(guò)載,已在編碼前對(duì)所有信號(hào)進(jìn)行了衰減,經(jīng)加重處理可以去失真;另外,矩陣轉(zhuǎn)變中也包含了衰減因子和類似相移的處理。
編碼器原始信號(hào)是5路,輸入通道是5個(gè),經(jīng)過(guò)矩陣轉(zhuǎn)化處理后產(chǎn)生了7種聲音信號(hào)。應(yīng)當(dāng)設(shè)置通道選擇電路,它能夠根據(jù)需要,對(duì)7路信號(hào)進(jìn)行合理的選擇處理。該處理過(guò)程決定于解矩陣的過(guò)程,以及傳輸通道的分配信息;合理的通道選擇,有利于減弱人為噪聲加工而引起的噪聲干擾。此外,還設(shè)置了多聲道預(yù)測(cè)計(jì)算電路,用于減少各通道間冗余度。在進(jìn)行多聲道預(yù)測(cè)時(shí),在傳輸通道內(nèi)的兼容信號(hào)LO、RO,可由MPEG-1數(shù)據(jù)計(jì)算出來(lái)。根據(jù)人耳生理聲學(xué)基
礎(chǔ),后級(jí)設(shè)置了動(dòng)態(tài)串話電路,可在給定比特的情況下提高聲音質(zhì)量,或在要求聲音質(zhì)量的前提下降低比特率。但設(shè)置該電路增加了MPEG-2解碼器的復(fù)雜程度。
經(jīng)過(guò)編碼器產(chǎn)生了多種信息,主要有編碼取樣值,比例因子,比特分配數(shù)據(jù),動(dòng)態(tài)串話模式,多聲道預(yù)測(cè)信息,通道預(yù)測(cè)選擇信號(hào)等,諸信息傳遞給復(fù)接成幀模塊電路,最后以MPEG-2比特流形式輸出壓縮編碼信號(hào)。
MPEG-2解碼器基本上是編碼器的逆過(guò)程,其電路結(jié)構(gòu)簡(jiǎn)單一些,運(yùn)算量小一些。解碼器的解碼轉(zhuǎn)換矩陣可輸出5路信號(hào),再經(jīng)過(guò)32分頻子帶濾波器處理,可輸出LS、L、C、R、RS信號(hào);另外,經(jīng)過(guò)量化、SCF和子帶濾波器處理后,還可以取得前置立體聲LO、RO,共計(jì)可輸出7路音頻信號(hào)。
2、MPEG-4音頻解碼
MPEG-4音頻編碼和MPEG-4視頻編碼一樣,具有許多特點(diǎn)和功能,例如可分級(jí)性,有限時(shí)間音頻流,音頻變化/時(shí)間尺度變化,可編輯性,延遲性等。它具優(yōu)越的交互性能和高壓縮比。它不僅利用分級(jí)方法可對(duì)語(yǔ)言和音樂(lè)進(jìn)行編輯,也能解決合成語(yǔ)言和音樂(lè)問(wèn)題,它將成為多媒體世界的一個(gè)主要格式,將成為“全能”的系統(tǒng)。
通過(guò)MPEG-4音頻編碼,可以存儲(chǔ)、傳送多種音頻內(nèi)容。它具有高質(zhì)量的音頻信號(hào)(單聲道、立體聲和多通道)。它采用低碼率編碼,而聲音重放質(zhì)量很高。它可以傳送寬帶語(yǔ)言信號(hào)(例如7KHz寬的語(yǔ)音),也可傳送窄帶寬語(yǔ)言信號(hào)(例如長(zhǎng)途電話)。可以傳輸、制作可理解的各種語(yǔ)音信號(hào)??梢院铣烧Z(yǔ)言,例如進(jìn)行音素或其它記號(hào)為基礎(chǔ)的文本轉(zhuǎn)換;也可以合成音頻,例如支持音樂(lè)描述語(yǔ)言。
四、杜比AC-3技術(shù)
1、什么是杜比AC-3
在杜比定向邏輯環(huán)繞聲技術(shù)的基礎(chǔ)上,于1990年杜比公司與日本先鋒公司合作,采用先進(jìn)的數(shù)位壓縮技術(shù),推出新穎的全數(shù)字化杜比數(shù)碼環(huán)繞聲系統(tǒng)。它可使多聲道信號(hào)有更多的信息被壓縮到雙聲道中去,并將這種系統(tǒng)稱為AC-3。AC是英語(yǔ)“音頻感覺(jué)編碼系統(tǒng)”的縮寫詞。AC-3技術(shù)首先應(yīng)用到電影院,后來(lái)又進(jìn)入普通家庭。
杜比AC-3系統(tǒng)設(shè)置完全獨(dú)立的6個(gè)聲道,即全頻帶的左、中、右、左環(huán)繞和右環(huán)繞聲道,再加上一個(gè)超重低音聲道。由于這樣聲道的結(jié)構(gòu),AC-3系統(tǒng)又稱為5.1聲道。
2、杜比AC-3的基本原理
(1)應(yīng)用聽(tīng)覺(jué)掩蔽效應(yīng)開(kāi)發(fā)出自適應(yīng)編碼系統(tǒng)
AC-3技術(shù)的理論基礎(chǔ),也是利用心理聲學(xué)中的聽(tīng)覺(jué)閾值和掩蔽效應(yīng),但具體技術(shù)上與MPEG標(biāo)準(zhǔn)又有所不同。
對(duì)音頻信號(hào)進(jìn)行數(shù)據(jù)處理時(shí),都要進(jìn)行數(shù)據(jù)壓縮,將沒(méi)有用途或用途不大的數(shù)據(jù)信息忽略掉。為此,可以應(yīng)用聽(tīng)覺(jué)閾值和掩蔽規(guī)律,省略掉那些多余的數(shù)據(jù)信息。杜比公司除運(yùn)用上述聲學(xué)原理外,還運(yùn)用了它擁有的杜比降噪技術(shù),開(kāi)發(fā)出數(shù)碼化的“自適應(yīng)編碼”系統(tǒng)。這是一種極具選擇性和抑制噪聲能力的自適應(yīng)編碼體系。杜比公司依據(jù)音響心理學(xué)的基本原理,在未輸入音樂(lè)信號(hào)時(shí),保持寧?kù)o狀態(tài);當(dāng)輸入音樂(lè)信號(hào)時(shí),對(duì)復(fù)雜的音頻信號(hào)進(jìn)行分析和分解,用較強(qiáng)信號(hào)掩蔽噪聲,刪除聽(tīng)覺(jué)界限以外,或由于頻率相近而音量小的信號(hào),經(jīng)過(guò)這種處理方法,可以大大減少需要處理的數(shù)據(jù)信息。人耳的聽(tīng)覺(jué)范圍是20Hz-20KHz,在如此寬闊的頻帶范圍內(nèi),人耳對(duì)不同頻率的聽(tīng)覺(jué)靈敏度具有極大的差異。杜比AC-3根據(jù)這個(gè)特性,將各聲道的音響頻道劃分為許多大小不等的狹窄頻帶,各個(gè)子頻帶與人耳臨界頻帶的寬度相接近,保留有效的音頻,將不同的噪聲頻率緊跟每個(gè)聲道信號(hào)進(jìn)行編碼,即編碼噪聲只能存在于編碼音頻信號(hào)的頻帶內(nèi)。這樣能夠更陡峭地濾除掉編碼噪聲,將頻帶內(nèi)多余信號(hào)和無(wú)音頻信號(hào)的編碼噪聲降低或除掉,而將有用的音頻信號(hào)保留下來(lái)。AC-3系統(tǒng)精確地運(yùn)用了掩蔽效應(yīng)和“公用位元群”的設(shè)計(jì)方法,使數(shù)據(jù)壓縮效率大大提高,且具有很高水平的音質(zhì)。該系統(tǒng)的比特率是根據(jù)個(gè)別頻譜的需要,或者音源的動(dòng)態(tài)狀況,再分配到每個(gè)窄頻段,它設(shè)計(jì)了內(nèi)置的聽(tīng)覺(jué)掩蓋程序,可讓編碼器改變其頻率靈敏度和時(shí)間分解力,以確保有充足的比特被采用,掩蓋掉噪聲,而良好地記錄音樂(lè)信號(hào)。
為了高效地利用有限的信息傳輸介質(zhì)(光盤、膠片等),它在壓縮音頻信號(hào)時(shí)與其它壓縮系統(tǒng)一樣,利用人耳的聽(tīng)覺(jué)特性,根據(jù)當(dāng)時(shí)的具體情況,將某些聲道的系數(shù)合并(這些聲道系數(shù)反映了那個(gè)頻帶的能量大小),以便提高壓縮率。并不是所有聲道都能進(jìn)行這種合并。編碼器可根據(jù)各聲道的信息特征自動(dòng)決定和調(diào)整,只有相似的聲道才能混合在一起,若壓縮比不要求很高時(shí)也不必合并。一般情況下,合并的起始頻率越高,音質(zhì)就越好,但要求數(shù)據(jù)傳輸速率也越高。當(dāng)取樣頻率為48KHz時(shí),合并的起始頻率應(yīng)為3.42MHz;若取樣頻率為44.1KHz時(shí),起始頻率應(yīng)為3.14MHz。若硬件和軟件搭配適當(dāng),AC-3的音質(zhì)可達(dá)到或接近CD唱片的水平。
(2)杜比AC-3解碼器簡(jiǎn)易方框圖
AC-3解碼器輸入信號(hào)是一組頻譜信號(hào),它是由時(shí)域信號(hào)PCM數(shù)據(jù)經(jīng)過(guò)時(shí)-頻變換而得到。該頻譜數(shù)據(jù)流分為指數(shù)部和尾數(shù)部?jī)刹糠?,指?shù)部分采用差分方式進(jìn)行編碼,編碼后的指數(shù)代表了整個(gè)信號(hào)的頻譜,可作為頻譜包絡(luò)的參數(shù)。其尾數(shù)部分按照比特分配的結(jié)果進(jìn)行量化。于是,量化尾數(shù)和頻譜包絡(luò)形成了AC-3碼流的主要信息,連同其它輔助信號(hào)(例如比特分配等)構(gòu)成了AC-3比特流。
圖2.3.4是AC-3系統(tǒng)的解碼方框圖,它是AC-3編碼的逆過(guò)程。AC-3比特流首先進(jìn)入緩沖級(jí),然后以幀為處理單元進(jìn)行誤碼糾錯(cuò),經(jīng)糾錯(cuò)處理后對(duì)比特流中的固定數(shù)據(jù)(指數(shù)數(shù)據(jù)、匹配系數(shù)、模式符號(hào)等)解碼,使數(shù)據(jù)比特流恢復(fù)為原來(lái)的比特分配。
然后,數(shù)據(jù)信號(hào)分為兩路。其中一路,將比特流恢復(fù)為原來(lái)的比特分配之后,確定尾數(shù)部量化的大小,再對(duì)比特流中的可變數(shù)據(jù)解碼;再接著恢復(fù)高頻成分,為反頻率變換做好準(zhǔn)備。最后,將指數(shù)部數(shù)據(jù)和尾數(shù)部數(shù)據(jù)匯合,變換為固定小數(shù)點(diǎn)數(shù)據(jù),再對(duì)它進(jìn)行頻率變換,以獲得時(shí)間軸數(shù)據(jù)。已經(jīng)恢復(fù)為時(shí)域的數(shù)據(jù)信號(hào)需進(jìn)行窗處理,進(jìn)行重疊加算,即可得到5.1環(huán)繞聲道的輸出信號(hào)。
3、杜比AC-3的特點(diǎn)
(1)配置5.1聲道
將輸入的音頻信號(hào)解碼后,可以輸出5.1聲道信號(hào),其中有3個(gè)前置聲道(L、C、R),還有2個(gè)后置環(huán)繞聲道(LS、RS),它們互相獨(dú)立,頻響寬度都是全聲頻域,即20Hz-20KHz(±0.5dB)及3Hz-20.3KHz(-3dB),各頻道的頻響十分寬闊。目前,廣泛應(yīng)用于音響系統(tǒng)的杜比定向邏輯環(huán)繞聲系統(tǒng),無(wú)法和杜比AC-3頻帶寬度相比。還有,杜比定向邏輯環(huán)繞聲系統(tǒng)實(shí)為4聲道系統(tǒng),即前置左、中、右和后置環(huán)繞聲,它的環(huán)繞聲實(shí)為單聲道環(huán)繞聲,兩個(gè)后置環(huán)繞聲道重放共同的聲音信號(hào),兩聲道采取并聯(lián)甚至串聯(lián)方式;其環(huán)繞聲的頻響被限制在100Hz-7KHz范圍內(nèi);另外,它沒(méi)有設(shè)置獨(dú)立的超低音聲道,它是由前置左、右聲道分離出20Hz-120Hz的超重低音,來(lái)重放具有震撼效果的超重低音。AC-3系統(tǒng)配置了獨(dú)立的超低聲道,其頻響為20Hz-120HZ(±0.5dB)及3Hz-121Hz(-3dB),要求超低音箱的音量比其它各聲道大10dB,具有更加震撼的低效果。
(2)各聲道全數(shù)字化且互相獨(dú)立
AC-3各聲道互相獨(dú)立地?cái)y帶不同信號(hào),是全數(shù)字化音頻信號(hào)。取樣頻率是32、44.1或48KHz,數(shù)據(jù)傳輸量每聲道為32kb/s-640kb/s,在5.1聲道模式下取典型值384kb/s,在雙聲道模式下典型值為192kb/s。經(jīng)過(guò)數(shù)字處理后,5個(gè)主聲道的頻率壓縮在20Hz-20KHz范圍內(nèi)。
(3)可將5.1聲道壓縮輸出
由于AC-3的“比特流”內(nèi)對(duì)每種節(jié)目方式(單聲道、立體聲、環(huán)繞聲等)都有一個(gè)“指導(dǎo)信號(hào)”,能使AC-3自動(dòng)地為使用者指出節(jié)目方式。它可把5.1聲道信號(hào)壓縮為雙聲道,以供給錄制常規(guī)VHS錄像帶,或作為杜比環(huán)繞聲的輸入節(jié)目源,以便與它兼容,它甚至可將5.1聲道信號(hào)壓縮為單聲道輸出。總之,AC-3可輸出5.1聲道杜比環(huán)繞聲、混合4聲道杜比環(huán)繞聲、雙聲道立體聲及單聲道。將5.1聲道數(shù)據(jù)壓縮后所占頻帶較窄,例如可在LD影碟機(jī)的FM調(diào)制的右聲道所占用的頻帶寬度內(nèi),編入AC-3數(shù)據(jù)編碼,輸出AC-3的RF信號(hào),它的中心頻率取在2.88MHz,可由LD原先的模擬輸出右聲道取出頻率為2.88MHz的AC-3編碼信號(hào)。于是,在原有一個(gè)模擬聲道內(nèi)就能夠容納5.1聲道的全部?jī)?nèi)容。
(4)經(jīng)過(guò)聲音時(shí)間校準(zhǔn)使音效極為理想
杜比AC-3將所有聲道通過(guò)“時(shí)間校準(zhǔn)”技術(shù),使每個(gè)揚(yáng)聲器的聲音好像與聆聽(tīng)者的距離相同,以產(chǎn)生更好的音響效果,其環(huán)繞聲效果不僅是前、后、左、右的聲源定位鮮明,上下的音場(chǎng)也清晰可辨。