基于飛思卡爾MCU的AEC算法實(shí)現(xiàn)
0 引言 voip是在ip網(wǎng)絡(luò)上實(shí)現(xiàn)音視頻及傳真信號(hào)傳輸?shù)囊婚T全新的集成業(yè)務(wù)數(shù)據(jù)網(wǎng)絡(luò)技術(shù)。ip語(yǔ)音傳輸技術(shù)具有節(jié)省帶寬、話費(fèi)低,可方便地集成智能型開(kāi)放體系結(jié)構(gòu)以及多媒體業(yè)務(wù)等優(yōu)勢(shì)。但較之傳統(tǒng)電話,其語(yǔ)音質(zhì)量較差。事實(shí)上,影響因特網(wǎng)語(yǔ)音質(zhì)量的因素是多方面的,關(guān)鍵因素之一是回聲的影響。因此,要提高因特網(wǎng)的語(yǔ)音質(zhì)量,就必須在語(yǔ)音傳輸過(guò)程中進(jìn)行回聲消除。aec是基于自適應(yīng)算法并可用于voip的聲學(xué)回聲消除技術(shù)。而用于aec算法的實(shí)現(xiàn)與研究的硬件平臺(tái)是以freescale公司的mcf5235為核心的開(kāi)發(fā)板。mcf523x系列mcu是首個(gè)以帶有增強(qiáng)型乘加運(yùn)算單元(emac)的coldfire v2內(nèi)核為核心,該產(chǎn)品同時(shí)結(jié)合了增強(qiáng)型時(shí)序處理單元(etpu)和10/100以太網(wǎng)多媒體通道控制模塊(mac)的mcu,因而具有強(qiáng)大的數(shù)據(jù)處理能力和豐富的接口,能夠滿足voip電話終端對(duì)數(shù)據(jù)處理速度以及網(wǎng)絡(luò)通訊安全的要求。1 回聲消除1.1 聲學(xué)回聲消除原理 aec是以揚(yáng)聲器信號(hào)與由它產(chǎn)生的多路徑回聲的相關(guān)性為基礎(chǔ)建立的遠(yuǎn)端信號(hào)語(yǔ)音模型,利用它可對(duì)回聲進(jìn)行估計(jì),并不斷地修改濾波器的系數(shù),以使估計(jì)值更逼近真實(shí)的回聲,然后,將回聲估計(jì)值從話筒的輸人信號(hào)中減去,從而達(dá)到消除回聲之目的?! ÷晫W(xué)回聲消除器的結(jié)構(gòu)原理如圖1所示。其中y(n)代表遠(yuǎn)端語(yǔ)音信號(hào),r(n)代表回聲,x(n)是已經(jīng)疊加了回聲信號(hào)r(n)的近端語(yǔ)音信號(hào)。對(duì)回聲消除器來(lái)說(shuō),可將遠(yuǎn)端信號(hào)作為一個(gè)參考信號(hào),然后由自適應(yīng)濾波器通過(guò)它來(lái)產(chǎn)生回聲的估計(jì)值r′(n),再?gòu)慕藥в谢芈暤恼Z(yǔ)音信號(hào)中減去r′(n),從而估計(jì)出近端輸出信號(hào)μ(n)。在近端未說(shuō)話時(shí),即當(dāng)x(n)=0時(shí),μ(n)即為回聲的殘差信號(hào)e(n)。e(n)的計(jì)算方程為:
e(n)=r(n)-r′(n) (1) 此時(shí),回聲的殘留信號(hào)的理想值應(yīng)為0。1.2 自適應(yīng)fir濾波器 在聲學(xué)回聲消除器里,橫向結(jié)構(gòu)的自適應(yīng)濾波器可通過(guò)參考信號(hào)來(lái)產(chǎn)生回聲的副本,其原理如圖2所示。如果這個(gè)橫向結(jié)構(gòu)的自適應(yīng)濾波器的轉(zhuǎn)換函數(shù)與回聲通道的函數(shù)模型一致,那么,回聲的副本與回聲就應(yīng)該是一致的,這樣,通過(guò)兩者的抵消便可達(dá)到消除回聲之目的。
fir濾波器的最主要特點(diǎn)是沒(méi)有反饋回路,這是一種非遞歸系統(tǒng),它的沖激響應(yīng)是一個(gè)有限長(zhǎng)序列。fir濾波器的輸出計(jì)算公式為:
自適應(yīng)fir濾波器根據(jù)上一刻的近端輸出信號(hào)μ(n)及遠(yuǎn)端語(yǔ)音信號(hào)y(n),并通過(guò)自適應(yīng)算法來(lái)估算當(dāng)前時(shí)刻fir濾波器的系數(shù)ak(n+1)。1.3 lms算法和nlms算法 在輸入信號(hào)和參考信號(hào)都是平穩(wěn)隨機(jī)信號(hào)的情況下,自適應(yīng)濾波器的均方誤差e[e(n)]性能曲面是濾波器加權(quán)系數(shù)ak的二次函數(shù)。其系數(shù)修正算法通常采用可使均方誤差最小的最優(yōu)化求解算法?! ∮捎趯?shí)際的梯度值只能根據(jù)觀測(cè)數(shù)據(jù)估計(jì),因此lms算法提出的一個(gè)基本思想就是用平方誤差e[e2(n)]來(lái)代替均方誤差e[e(n)]。它是對(duì)基本的最速下降算法的改進(jìn),其算法迭代公式為:ak(n+1)=ak(n)+2μe(e)*y(n) (3) 其中y(n)為輸入信號(hào),μ為迭代步長(zhǎng)常量?! ∫?guī)一化lms (nlms)算法可用來(lái)在lms自適應(yīng)濾波器方程里修正fir濾波器的系數(shù)。nlms算法與lms算法幾乎是一樣的,唯一的不同是nlms算法中使用可變步長(zhǎng)控制因子來(lái)代替lms算法中的常量因子。其目的是加快算法的收斂速度。其算法迭代公式為:
其中,μ可由試驗(yàn)來(lái)確定。但應(yīng)注意,μ的選取至關(guān)重要,為了確保收斂,必須滿足0<μ<2。本方案中的自適應(yīng)算法就是采用nlms算法。1.4 語(yǔ)音檢測(cè) 語(yǔ)音活動(dòng)檢測(cè)可用來(lái)確定三種語(yǔ)音狀態(tài):近端講話狀態(tài)、遠(yuǎn)端講話狀態(tài)和雙端講話狀態(tài)。因?yàn)閍ec要根據(jù)不同的語(yǔ)音活動(dòng)狀態(tài)來(lái)進(jìn)行相應(yīng)的處理。它在檢測(cè)到近端語(yǔ)音活動(dòng)狀態(tài)時(shí),濾波器既不進(jìn)行濾波,也不進(jìn)行系數(shù)更新;而在檢測(cè)到雙端語(yǔ)音活動(dòng)狀態(tài)時(shí),將停止濾波器系數(shù)的更新,但要進(jìn)行濾波。由于在只有遠(yuǎn)端語(yǔ)音活動(dòng)的狀態(tài)下,既要進(jìn)行濾波,又要進(jìn)行系數(shù)更新。因此,語(yǔ)音活動(dòng)狀態(tài)檢測(cè)的正確與否在很大程度上會(huì)影響回聲消除的效果。語(yǔ)音活動(dòng)檢測(cè)流程如圖3所示。
雙端講話情況可以通過(guò)設(shè)計(jì)近端話音檢測(cè)器,并采用geigel算法來(lái)判決。利用該算法計(jì)算回聲延時(shí)大小范圍內(nèi)的瞬時(shí)能量比較,具有著良好的性能優(yōu)勢(shì)。其geigel算法描述如下:
式中,n是fir延時(shí)級(jí)數(shù),之所以將r(i)和最近n個(gè)遠(yuǎn)端輸入的