多媒體技術(shù)應(yīng)用之聲音編碼技術(shù)分析
掃描二維碼
隨時(shí)隨地手機(jī)看文章
前言
多媒體數(shù)據(jù)類型主要有一下幾個(gè)方面:
·圖形和圖像:圖像由象素組成;圖形由圖元組成
文本:最基本的,有多中編碼方式, ASCII碼, 中文的GB碼等等
音頻:WAV文件是計(jì)算機(jī)中最基礎(chǔ)的聲音記錄形式,對聲波信號(hào)進(jìn)行采樣,采樣后經(jīng)過量化形成數(shù)字信號(hào)。MIDI格式的數(shù)據(jù)記錄的實(shí)際是"樂譜"(數(shù)字音視頻技術(shù))。
·動(dòng)畫和視頻: 動(dòng)畫是用計(jì)算機(jī)生成一系列可供實(shí)時(shí)演播的連續(xù)畫面技術(shù)。視頻是由一幅幅拍攝下來的真實(shí)畫面序列組成。
通常情況下,我們將利用計(jì)算機(jī)技術(shù)把文本、圖像、圖形、動(dòng)畫、音頻及視頻等多種媒體綜合一體化,使之建立起邏輯上的聯(lián)系,并能夠?qū)λ鼈儷@取,編碼,編輯,處理,存儲(chǔ),傳輸和再現(xiàn)的技術(shù)稱之為多媒體技術(shù)。在實(shí)際生活中多媒體技術(shù)應(yīng)用是非常廣泛的,下面小編以多媒體技術(shù)中聲音編碼技術(shù)為例(音視頻技術(shù)),詳細(xì)介紹實(shí)際生活中有關(guān)多媒體技術(shù)應(yīng)用的相關(guān)知識(shí)。
1.G.721 ADPCM編碼器
ADPCM 是利用樣本與樣本之間的高度相關(guān)性和量化階自適應(yīng)來壓縮數(shù)據(jù)的一種波形編碼技術(shù)。
CCITT 為此制定了 G.721 推薦標(biāo)準(zhǔn) , 這個(gè)標(biāo)準(zhǔn)叫做 32kb/s 自適應(yīng)差分脈沖Differential Pulse Code Modulation to 24and 40kb/s for Digital Circuit Multiplication Equipment Application , 使用該標(biāo)準(zhǔn)的編碼器的數(shù)據(jù)率可降低到 40kb/s 和24kb/s 。
CCITT 推薦的 G.721 ADPCM 標(biāo)準(zhǔn)是一個(gè)代碼轉(zhuǎn)換系統(tǒng)。它使用 ADPCM 轉(zhuǎn)換技術(shù) , 實(shí)現(xiàn) 64kb/s A 律或μ律 PCM 速率和 32kb/s 速率之間的相互轉(zhuǎn)換。
2.子帶編碼 (SBC)
子帶編碼主要過程是:
①使用一組帶通濾波器 (band-pass filter ,BPF) 把輸入音頻信號(hào)的頻帶分成若干個(gè)連續(xù)的頻段 , 每個(gè)頻段稱為子帶。
②對每個(gè)子帶中的音頻信號(hào)采用單獨(dú)的編碼方案去編碼。
③在信道上傳送時(shí) , 將每個(gè)子帶的代碼復(fù)合起來。
④在接收端譯碼時(shí) , 將每個(gè)子帶的代碼單獨(dú)譯碼 , 然后把它們組合起來 , 還原成原來的音頻信號(hào)。
采用對每個(gè)子帶分別編碼的好處:
第一.對每個(gè)子帶信號(hào)分別進(jìn)行自適應(yīng)控制,量化階(quantization step) 的大小可以按照每個(gè)子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化 , 以減少總的量化噪聲。
·第二,可根據(jù)每個(gè)子帶信號(hào)在感覺上的重要性 , 對每個(gè)子帶分配不同的位數(shù) , 用來表示每個(gè)樣本值。例如 ,在低頻子帶中,為了保護(hù)音調(diào)和共振峰的結(jié)構(gòu),就要求較小的量化階、較多的量化級(jí)數(shù), 即分配較多的位數(shù)來表示樣本值。而話音中的摩擦音和類似噪聲的聲音,通常出現(xiàn)在高頻子帶中,對它分配較少的位數(shù)。
3. 子帶-自適應(yīng)差分脈沖編碼調(diào)制(SB-ADPCM)
采樣率為 8kHz 、 8 位 / 樣本、數(shù)據(jù)率為 64kb/s 的 G.711 標(biāo)準(zhǔn)是 CCITT 為話音信號(hào)頻率為 (300~3400)Hz制定的編譯碼標(biāo)準(zhǔn), 這屬于窄帶音頻信號(hào)編碼。現(xiàn)代的話音編碼技術(shù)已經(jīng)可以減少數(shù)據(jù)率 ,而又不至于顯著降低音質(zhì)。 CCITT 推薦的 8KHz 采樣率、 4 位 / 樣本、 32kb/s 的 G.721 標(biāo)準(zhǔn), 以及 G.721 的擴(kuò)充標(biāo)準(zhǔn) G.723, 都說明了話音壓縮編碼技術(shù)的進(jìn)展。
G.722 是 CCITT 推薦的音頻信號(hào)編碼譯碼標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)是描述音頻信號(hào)帶寬為 7kHz、數(shù)據(jù)率為 64kb/s 的編譯碼原理、算法和計(jì)算細(xì)節(jié)。
G.722 的主要目標(biāo)是保持 64kb/s 的數(shù)據(jù)率 , 而音頻信號(hào)的質(zhì)量要明顯高于 G.711 的質(zhì)量。 G.722 標(biāo)準(zhǔn)把音頻信號(hào)采樣頻率由 8kHz 提高到 16KHz, 是 G.711PCM 采樣率的 2 倍 , 因而要被編碼的信號(hào)頻率由原來的 3.4kHz 擴(kuò)展到 7kHz 。這就使音頻信號(hào)的質(zhì)量有很大改善 , 由數(shù)字電話的話音質(zhì)量提高到調(diào)幅 (AM) 無線電廣播的質(zhì)量。對話音信號(hào)質(zhì)量來說 , 提高采樣率并無多大改善 , 但對音樂一類信號(hào)來說 , 其質(zhì)量卻有很大提高。
G.722編譯碼系統(tǒng)采用自帶自適應(yīng)差分脈沖編碼調(diào)制技術(shù),把頻帶分成兩個(gè)等帶寬的子代分別是高頻子帶和低頻子帶。在每個(gè)等帶寬的子帶中的信號(hào)都用ADPCM進(jìn)行編碼。
4.G.722 SB-ADPCM編譯碼器
為了適應(yīng)可視電話會(huì)議日益增長的迫切需要 ,1988年CITT 為此制定了G.722 推薦標(biāo)準(zhǔn), 叫做 " 數(shù)據(jù)率為 64kb/s 的 7KHz 聲音信號(hào)編碼—— 7kHz Audio-coding with 64kb/s。這個(gè)標(biāo)準(zhǔn)把話音信號(hào)的質(zhì)量由電話質(zhì)量提高到AM 無線電廣播質(zhì)量, 而其數(shù)據(jù)傳輸率仍保持為 64kb/s 。
寬帶話音是指帶寬在 (50~7000)Hz的話音 , 這種話音在可懂度和自然度方面都比帶寬為 (300~3400)Hz 的話音有明顯的提高, 也更容易識(shí)別對方的說話人。
5. 線性預(yù)測編碼(LPC)
線性預(yù)測編碼是一種非常重要的編碼方法。從原理上講 ,LPC 是通過分析話音波形來產(chǎn)生聲道激勵(lì)和轉(zhuǎn)移函數(shù)的參數(shù),對聲音波形的編碼實(shí)際就轉(zhuǎn)化為對這些參數(shù)的編碼,這就使聲音的數(shù)據(jù)量大大減少。在接收端使用 LPC 分析得到的參數(shù) , 通過話音合成器重構(gòu)話音。
合成器實(shí)際上是一個(gè)離散的隨時(shí)間變化的時(shí)變線性濾波器,它代表人的話音生成系統(tǒng)模型 。時(shí)變線性濾波器既當(dāng)作預(yù)測器使用 , 又當(dāng)作合成器使用。分析話音波形時(shí) , 主要是當(dāng)作預(yù)測器使用。隨著話音波形的變化,周期性地使模型地參數(shù)和激勵(lì)條件適合新的要求。
多媒體技術(shù)應(yīng)用前景及展望
多媒體技術(shù)應(yīng)用的前景
家庭教育和個(gè)人娛樂是目前國際多媒體市場的主流
內(nèi)容演示和管理信息系統(tǒng)是多媒體技術(shù)應(yīng)用的重要方面
·多媒體通信和分布式多媒體系統(tǒng)是多媒體技術(shù)今后的發(fā)展方向
多媒體技術(shù)應(yīng)用發(fā)展方向:
一是計(jì)算機(jī)系統(tǒng)本身的多媒體化;
二是多媒體技術(shù)與點(diǎn)播電視、智能化家電、識(shí)別網(wǎng)絡(luò)通信等技術(shù)互相結(jié)合,使多媒體技術(shù)進(jìn)入教育、咨詢、娛樂。企業(yè)管理和辦公室自動(dòng)化等領(lǐng)域;
三是多媒體技術(shù)與控制技術(shù)相互滲透,進(jìn)入工業(yè)自動(dòng)化測控等領(lǐng)域。
總結(jié)
真正的多媒體技術(shù)所涉及的對象是計(jì)算機(jī)技術(shù)的產(chǎn)物,而其他的單純事物,如電影、電視、音響等,均不屬于多媒體技術(shù)的范疇。本文以聲音編碼技術(shù)為例,詳細(xì)介紹實(shí)際生活中有關(guān)多媒體技術(shù)應(yīng)用的相關(guān)知識(shí)及對多媒體技術(shù)應(yīng)用未來發(fā)展前景作了簡單的分析.