當(dāng)前位置:首頁(yè) > 電源 > 數(shù)字電源
[導(dǎo)讀]討論了TD-SCDMA系統(tǒng)中AMR語(yǔ)音編碼的自適應(yīng)機(jī)制,分析了AMR中代數(shù)碼本線性預(yù)測(cè)(ACELP)算法及實(shí)現(xiàn)過(guò)程。該方案可以在一塊TMS320C5510上實(shí)現(xiàn),通過(guò)在TD-SCDMA系統(tǒng)的硬件平臺(tái)上自環(huán)測(cè)試,結(jié)果是理想的。

摘 要:語(yǔ)音編碼方案的選取對(duì)移動(dòng)通信系統(tǒng)的通話質(zhì)量、信道容量等有重要影響。討論了TD-SCDMA系統(tǒng)中AMR語(yǔ)音編碼的自適應(yīng)機(jī)制,分析了AMR中代數(shù)碼本線性預(yù)測(cè)(ACELP)算法及實(shí)現(xiàn)過(guò)程。該方案可以在一塊TMS320C5510上實(shí)現(xiàn),通過(guò)在TD-SCDMA系統(tǒng)的硬件平臺(tái)上自環(huán)測(cè)試,結(jié)果是理想的。

  0 引 言

  在語(yǔ)音編碼領(lǐng)域中,隨著傳輸、處理、存儲(chǔ)等各種信息量的巨增,信息的壓縮處理已成為迫切的要求,基于新的網(wǎng)絡(luò)和新的要求,無(wú)論是從節(jié)省傳輸頻帶資源,還是保持線路通信的高效率等方面來(lái)看,研究采用各種可變速率語(yǔ)音編碼技術(shù)的系統(tǒng)都有重要意義。目前為了適應(yīng)此需要提出了AMR(adaptivemulti-rate)概念,即自適應(yīng)話音編碼器?;趲挼目紤]可分為AMR- NB(AMRNarrowband)和AMR-WB(AMRwideband)。對(duì)于AMR-NB,語(yǔ)音通道帶寬限制為3.7 MHz,采樣頻率為8 kHz,而AMR-WB為7 MHz的帶寬,采樣頻率為16 kHz,但考慮語(yǔ)音的短時(shí)相關(guān)性,每幀長(zhǎng)度均為20 ms。這2種編碼器根據(jù)帶寬的要求雖然選用了不同的速率,但有異曲同工

之處,以下著重介紹在TD-SCDMA中AMR-NB的實(shí)現(xiàn)。此編碼器運(yùn)用了代數(shù)碼本線性預(yù)測(cè)(ACELP)混合編碼方式,也就是數(shù)字語(yǔ)音信號(hào)中既包括若干語(yǔ)音特征參數(shù)又包括部分波形編碼信息,再運(yùn)用這些特征信息重新合成語(yǔ)音信號(hào)的過(guò)程。控制這些參數(shù)的提取數(shù)目,根據(jù)速率要求對(duì)信息進(jìn)行取舍而得到了以下8種速率,混合組成如表1所示的自適應(yīng)語(yǔ)音編碼器。表1中模式AMR-12.20就提取出244比特的參數(shù)信息,而模式AMR-4.70卻只提取了95比特信息。根據(jù)這些比特所含的信息量可以將其分為3類比特class 0,1,2。在信道編碼時(shí)class0和1都將會(huì)使用循環(huán)冗余校驗(yàn)碼進(jìn)行差錯(cuò)檢驗(yàn),對(duì)于class 2則根據(jù)上一幀進(jìn)行恢復(fù)。

  語(yǔ)音編碼或語(yǔ)音壓縮編碼研究的基本問題,就是在給定編碼速率的條件下,如何能得到盡量好的重建語(yǔ)音質(zhì)量。主觀評(píng)定方法符合人類聽話時(shí)對(duì)語(yǔ)音質(zhì)量的感覺得到了廣泛應(yīng)用。常用的方法有平均得分意見(mean opinion score,簡(jiǎn)稱MOS)判定法,表2說(shuō)明了AMR話音編碼器各模式的話音質(zhì)量。

表1

表2

  1 AMR模式選擇的自適應(yīng)機(jī)制

  自適應(yīng)的基本概念是以更加智能的方式解決信源和信道編碼的速率分配問題,使得無(wú)線資源的配置和利用更加靈活和高效。實(shí)際的語(yǔ)音編碼速率取決于信道的條件,它是信道質(zhì)量的函數(shù)。而這部分的工作是解碼器根據(jù)噪聲等測(cè)量參數(shù)協(xié)助基站來(lái)完成的,選擇模式,決定速率快慢。原則上在信道很差的時(shí)候采用速率比較低的編碼器,這樣就能分配給信道編碼更多的比特?cái)?shù)來(lái)實(shí)現(xiàn)糾錯(cuò),實(shí)現(xiàn)更可靠的差錯(cuò)控制,從而有效地抑制錯(cuò)誤發(fā)生,提高話音質(zhì)量[1]。

  在TD-SCDMA系統(tǒng)實(shí)現(xiàn)方面為了便于量化比較而采用了C/I(載干比)這一概念,取其滑動(dòng)平均值,再將此值與一預(yù)先定義好的門限值進(jìn)行比較,來(lái)決定速率的選擇。由于不同的特性,全速率信道和半速率信道就應(yīng)有不同的定義值。在全速率信道,當(dāng)C/I≥13時(shí),MR122的MOS值可以達(dá)到4以上,可以提供很好的性能;9≤C/I<13時(shí),MR122、MR102、MR795都是可以選擇的,速率越低,誤幀率越低;當(dāng)6≤C/I<9時(shí),最好選擇MR74、 MR67、MR59;而當(dāng)C/I<6時(shí)就應(yīng)盡量選擇越低的速率,隨著信道質(zhì)量的下降,誤幀率都會(huì)增加,但相對(duì)選擇的速率低,就能提供相對(duì)較好的話音質(zhì)量。對(duì)于半速率信道,與上述類似,不再累述。下面進(jìn)一步說(shuō)明自適應(yīng)速率選擇的實(shí)現(xiàn)過(guò)程。圖1是完整的說(shuō)明圖。自適應(yīng)要求有2類信息需要傳輸:在下行信道上,需要基站發(fā)送給移動(dòng)臺(tái)1模式選擇測(cè)量命令,而在上行信道上,移動(dòng)臺(tái)將信道測(cè)量信息傳送給基站。這種模式要求傳送信息準(zhǔn)確、可靠、及時(shí),才能有效達(dá)到自適應(yīng)的目的。基站每幀發(fā)送1測(cè)量命令,得到返回信息,通過(guò)比較選擇,選擇1模式用于下一幀。這樣就可以實(shí)現(xiàn)速率間的轉(zhuǎn)換,達(dá)到自適應(yīng)的目的,在速率間的切換會(huì)有一定功率損耗,并且不同速率間的損 耗是不同的,這是在實(shí)現(xiàn)過(guò)程中應(yīng)該考慮的[2,3]。

說(shuō)明圖

    2 AMR編碼器算法

  AMR編碼器算法是基于代數(shù)碼本線性預(yù)測(cè)(ACELP)的混合編碼算法[4,5]?;驹硎窃颊Z(yǔ)音按幀輸入,根據(jù)使合成語(yǔ)音與原始語(yǔ)音的加權(quán)均方誤差最小的準(zhǔn)則,從隨機(jī)碼本和固定碼本中挑選合適的碼矢以代替殘差信號(hào),并將碼矢地址和增益及各濾波器的參數(shù)量化編碼后傳送到接收端;接收端恢復(fù)各濾波器時(shí),采用與發(fā)送端相同的碼本,按照碼矢地址找到該碼矢乘上增益,激勵(lì)合成濾波器,得到合成語(yǔ)音。在編碼部分需要抽取下列典型參數(shù):線性預(yù)測(cè)濾波器系數(shù)(LP),自適應(yīng)碼本(ACB)和固定碼本(FCB)索引以及2種碼本的增益( 見圖2)。下面將分別從編碼和解碼 的角度闡述AMR編解碼方案。

AMR編碼器算法

 ?。?)線性預(yù)測(cè)計(jì)算。LPC濾波器表征語(yǔ)音信號(hào)發(fā)生模型中的聲道模型,圖2中

  其中,A(z)為聲道傳輸函數(shù),ai隨語(yǔ)音幀的變化不斷改變(ai具有短時(shí)穩(wěn)定性)。因此,在每個(gè)語(yǔ)音幀中,需要提取LPC系數(shù)。按其預(yù)測(cè)值與實(shí)際值最小 化均方誤差原則,可得下式:

公式1

  上述正則方程[6]采用Durbin算法進(jìn)行線性預(yù)測(cè)便可得到參數(shù)ak。考慮到線譜頻率(LSF)誤差的相對(duì)獨(dú)立性及有序有界性質(zhì),與線性預(yù)測(cè)參數(shù)(LP)是一一對(duì)應(yīng)的,采用Chebyshev多項(xiàng)式估計(jì)方法是可以相互轉(zhuǎn)換的,因此在考慮傳輸時(shí)用LSF參數(shù)代替LP參數(shù),將其進(jìn)行矢量量化,在解碼部分再對(duì)LP進(jìn)行恢復(fù)。在12.2 kbit/s模式下采用分裂矩陣(SMQ)的方式進(jìn)行矢量量化,在其它模式下采用分裂矢量(SVQ)的方式進(jìn)行矢量量化。由于在12.2kbit/s中,每一幀需要進(jìn)行2次線性預(yù)測(cè)編碼(LPC)分析,所以會(huì)得到2組LSF系數(shù)。AMR在TD-SCDMA系統(tǒng)的具體實(shí)現(xiàn)過(guò)程中將這2組系數(shù)進(jìn)行聯(lián)合量化。也就是將矩陣(r(1),r(2))分為5個(gè)2×2的子陣,分別

進(jìn)行矢量量化,維數(shù)為4,碼本容量分別為128(子陣1),64(子陣5),256(子陣 2,3,4),失真  測(cè)度選擇計(jì)算量最小也有主觀評(píng)價(jià)意義的歐式距離,在碼本搜索過(guò)程中采用了全搜索算法。同樣,對(duì)于其它的編碼速率,有相同的思路和操作步驟,最大的差別就是對(duì)LSF矢量的子陣劃分,它們的劃分方法是采用維數(shù)為3,3和4的3個(gè)子陣(子矢量)。

 ?。?)碼本搜索[4]。TD- SCDMA系統(tǒng)中,AMR自適應(yīng)碼本搜索和代數(shù)碼本搜索是語(yǔ)音合成的關(guān)鍵,它們都是在子幀的基礎(chǔ)上完成的,其中,每個(gè)子幀長(zhǎng)為5 ms,對(duì)應(yīng)4個(gè)樣點(diǎn)。自適應(yīng)碼本表征語(yǔ)音信號(hào)發(fā)生模型中的周期性結(jié)構(gòu),自適應(yīng)碼本搜索通過(guò)一個(gè)長(zhǎng)時(shí)預(yù)測(cè)濾波器(LTP),去除信號(hào)中存在的長(zhǎng)時(shí)相關(guān),使殘差信號(hào)頻譜更加平坦,以便于形成白噪聲激勵(lì)信號(hào),同時(shí)提取基音延遲和對(duì)應(yīng)的基音增益。再經(jīng)過(guò)基音開環(huán)和閉環(huán)分析得到分?jǐn)?shù)基音延遲決定后,自適應(yīng)碼本矢量v (n)通過(guò)在最佳的整數(shù)延遲kopt和相位(分?jǐn)?shù)延遲)t處內(nèi)插就得到

公式2

  代數(shù)碼本表示語(yǔ)音信號(hào)發(fā)生模型中的隨機(jī)信號(hào),根據(jù)感覺加權(quán)均方誤差最小的原則,最終獲得[2]。代數(shù)碼本結(jié)構(gòu)是基于交織單脈沖序列(ISPP)的,其脈沖幅度和位置的取值都要受到一定的限制以滿足一定的代數(shù)結(jié)構(gòu)和比特分配要求,對(duì)于不同速率,脈沖位置和個(gè)數(shù)都選擇不同。而且在系統(tǒng)中,碼本設(shè)計(jì)上改進(jìn)了以前的高斯隨機(jī)碼本結(jié)構(gòu),構(gòu)造了中心削波的重疊碼本。經(jīng)稀疏后,碼本中就會(huì)產(chǎn)生90%的零值。這樣是可以簡(jiǎn)化搜索過(guò)程的。通過(guò)最大化下式可?量,d=Htx2表示目標(biāo)信號(hào)x2(n)和沖激響應(yīng)h′w(n)之間的相關(guān)性。在得到以上參數(shù)后,AMR中系統(tǒng)總共設(shè)計(jì)了3種量化器。AMR-12.2代數(shù)碼本增益的量化是采用6比特標(biāo)量量化器,AMR -4.75是將自適應(yīng)碼本增益和代數(shù)碼本增益進(jìn)行聯(lián)合量化,而對(duì)于其他速率則是按原始語(yǔ)音與合成語(yǔ)音的加權(quán)誤差最小找出目標(biāo)矢量。由于考慮多速率的公用,所以碼本容量較大,這與其他編碼器是不同的。

 ?。?)AMR解碼原理。解碼器分為3大部分:譯碼部分、語(yǔ)音合成和后濾波。在解碼器輸入端,從接收的比特流中獲得LSP矢量、自適應(yīng)碼本和代數(shù)碼本參數(shù)(索引和增益)等。LSP線譜對(duì)參數(shù)還需要轉(zhuǎn)化為線性預(yù)測(cè)濾波器系數(shù),再根據(jù)LP系數(shù)內(nèi)插得到各子幀的合成濾波器系數(shù)。激勵(lì)矢量由自適應(yīng)碼本和代數(shù)碼本經(jīng)各自的增益加權(quán)后獲得,將激勵(lì)矢量輸入合成濾波器得到重建的語(yǔ)音信號(hào)。最后,重建的語(yǔ)音信號(hào)還需要經(jīng)過(guò)后濾波處理。ACELP編碼器編碼的語(yǔ)音可看成是包含了高斯噪聲的原始語(yǔ)音。使用后濾波可以減少合成語(yǔ)音中包含的噪聲信號(hào),從而有效地提高合成語(yǔ)音的語(yǔ)音質(zhì)量。后處理包括兩部分功能:自適應(yīng)后濾波和信號(hào)放大。自適應(yīng)增益控制用于補(bǔ)償合成語(yǔ)音和經(jīng)過(guò)后濾波的合成語(yǔ)音之間的失真。將信號(hào)通過(guò)以下濾波器,就可得到修正的后濾波合成語(yǔ)音。

  3 結(jié)束語(yǔ)

  AMR的提出能提供高質(zhì)量的語(yǔ)音,增強(qiáng)抗信道誤差的能力,通過(guò)低編碼速率靈活配置提高了系統(tǒng)容量,編碼速率根據(jù)無(wú)線環(huán)境和本地容量需求動(dòng)態(tài)選擇不同模式。筆者圍繞AMR語(yǔ)音編碼算法進(jìn)行分析和研究。該算法已在TI公司的TMS320 C5510DSP上采用定點(diǎn)C語(yǔ)音和匯編語(yǔ)言的混合編程實(shí)現(xiàn),并用于TD-SCDMA系統(tǒng)中,運(yùn)算量能降低到20 MIPS左右,通過(guò)在TD-SCDMA系統(tǒng)的硬件平臺(tái)上自環(huán)測(cè)試,可得到良好的通話語(yǔ)音質(zhì)量,結(jié)果是很理想的。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉