為了節(jié)省成本及時(shí)間,人們?cè)跇I(yè)務(wù)及個(gè)人生活中進(jìn)行面對(duì)面的會(huì)議或會(huì)談的頻率不比以前了。手機(jī)及網(wǎng)絡(luò)電話(VoIP)已經(jīng)成為人們彼此交流方式產(chǎn)生這樣重要變化的推動(dòng)力量。在語音通信方面,要確保提供良好的用戶體驗(yàn),聲音品質(zhì)及噪聲抑制至關(guān)重要。
如今,人們很少體驗(yàn)到真正的安靜,而且我們已經(jīng)對(duì)噪聲變得如此習(xí)慣,以至于大多數(shù)人甚至不會(huì)注意到噪聲的存在。人腦在濾除所聽噪聲方面表現(xiàn)得非常出色,能聽到所有聲音,但只會(huì)留意感興趣的聲音。然而,世界變得越來越嘈雜,利用手機(jī)、膝上型電腦及網(wǎng)絡(luò)攝像頭來進(jìn)行語音通信越來越多,濾除所有噪聲變得更加困難。
由于電子技術(shù)快速進(jìn)步,如今存在著幾種方法及潛在方案來管理噪聲及提升語音清晰度。實(shí)際上,如今已經(jīng)處于眾多新方案上市的蓬勃發(fā)展階段。不同方案的有效性可能差異很大,而且在大多數(shù)情況下,有關(guān)通信效果清晰良好的表述則要綜合看待。對(duì)于指定應(yīng)用而言,清晰地描述一種方案與另一種方案的對(duì)比看似容易,但卻難于做到。
例如,某種旨在提升膝上型電腦通信能力的技術(shù)方案的價(jià)值,與預(yù)計(jì)要使用膝上型電腦的場合高度相關(guān)。使用上網(wǎng)本進(jìn)行Skype通話,就需要使上網(wǎng)本只拾取使用者的聲音,并抑制背景噪聲;而使用相同上網(wǎng)本來錄制講授內(nèi)容的學(xué)生就希望在任何位置從講堂環(huán)境噪聲中有效拾取講話聲音。對(duì)于既定方案而言,在某種場合下可能被評(píng)判為有效,但在其他場合卻無效。折中方案可能在兩方面都表現(xiàn)得次優(yōu),但卻為兩類用戶都提供價(jià)值。
將已有技術(shù)方案移植到使用場合已經(jīng)夠困難,但在零售層級(jí)對(duì)消費(fèi)者有效闡釋音頻差異可能更具挑戰(zhàn)性,因?yàn)樨浖苌纤挟a(chǎn)品的營銷材料中可能都不例外地宣稱具有“極佳音頻性能”。由于零售店銷售員能夠提供的音頻演示機(jī)會(huì)極少,消費(fèi)者的初次購買行為常常會(huì)流于隨機(jī)。
噪聲消減技術(shù)比較提供噪聲消減方案的技術(shù)可以分為三類:電聲、模擬及數(shù)字。
電聲方案涉及麥克風(fēng)元件設(shè)計(jì)、在產(chǎn)品及麥克風(fēng)貼裝的相關(guān)聲學(xué)設(shè)計(jì)中選擇及布設(shè)這些麥克風(fēng)。噪聲消減或壓差麥克風(fēng)是廉價(jià)方案的簡單示例,在某些場合下能夠提供適當(dāng)優(yōu)勢。好的電聲設(shè)計(jì)對(duì)于在任何語音通信設(shè)備上都獲得好性能至關(guān)重要,但可以進(jìn)一步通過更多地使用最新數(shù)字及模擬電路來大幅提升基礎(chǔ)性能。
模擬方案涉及對(duì)麥克風(fēng)或麥克風(fēng)陣列產(chǎn)生的電氣信號(hào)進(jìn)行一些直接處理,如壓縮或定向“到達(dá)時(shí)間”(TOA)類處理這樣的模擬類型簡單方案可能更為高效,因?yàn)樗鼈兪∪チ藬?shù)字轉(zhuǎn)換段。然而,半導(dǎo)體工藝中固有的制造差異會(huì)以數(shù)字工藝著意避免的方式直接影響模擬方案的性能。隨著模擬方案變得更加復(fù)雜,極力提供更多價(jià)值,每個(gè)工藝步驟的性能差異就要配合每個(gè)緊隨其后的步驟。這在實(shí)質(zhì)上就使任何成功的模擬音頻產(chǎn)品保持相對(duì)簡單。模擬方案也欠缺數(shù)字方案可能具有的功能靈活性,因?yàn)槟M系統(tǒng)以硅片設(shè)計(jì)本身來應(yīng)用(信號(hào))處理,而不是在靈活基礎(chǔ)上以軟件層來處理。
數(shù)字方案涉及對(duì)源自麥克風(fēng)的電氣信號(hào)進(jìn)行采樣或量化,從而使計(jì)算機(jī)處理器能夠應(yīng)用可重復(fù)的算法來處理信號(hào)。然后信號(hào)又以數(shù)字形式傳輸或重構(gòu),轉(zhuǎn)換為對(duì)所捕獲語音的增強(qiáng)型模擬再現(xiàn)。由于在當(dāng)今的硅技術(shù)條件下,數(shù)字方案看上去具有眾多固有優(yōu)勢,市場上大多數(shù)方案都屬于這一類,就并不令人驚奇了。
數(shù)字方案可以實(shí)現(xiàn)任何算法,從而消減噪聲或改善麥克風(fēng)拾取的語音質(zhì)量。通常情況下,這些算法包含空域選擇(語音從哪里來)、時(shí)域選擇(什么時(shí)間有或沒有語音)及頻域選擇(語音頻率是高于還是低于噪聲)。某些方案僅著重于這些方面中的某一種,但最佳的方案將結(jié)合所有這些方面,還可能會(huì)以增益控制、高級(jí)環(huán)境建?;蚱渌拍畹刃问絹砑尤肫渌倪M(jìn)特性。
有一種方案嚴(yán)重依賴于空域選擇,即波束形成或定向處理(direcTIonal processing),非常適合于揚(yáng)聲器相對(duì)于麥克風(fēng)的距離已知的應(yīng)用或使用場合。這樣的方法用于筆記本電腦及手機(jī)中,但在提供優(yōu)勢的同時(shí)也承受著固有劣勢。在筆記本電腦中,這種場景非常適合用于視頻通話,聲音拾取限制在攝像頭方向,但它不支持將筆記本電腦用于有幾個(gè)人繞桌而坐的電話會(huì)議。在手機(jī)方面,說話的位置通常嚴(yán)格受限,從而才能提供顯著的環(huán)境噪聲消減效果,但這也表示,如果手機(jī)沒有正好持在恰當(dāng)位置,通話聲音也會(huì)減小。
相比較而言,有類方案憑借對(duì)人們講話的統(tǒng)計(jì),持續(xù)地瞬時(shí)決定哪些講話應(yīng)該保留及哪些應(yīng)該濾除為噪聲,這種方案能夠有效地應(yīng)對(duì)更寬范圍的使用。不利的是,這些方案在區(qū)分講話及噪聲方面的決策并不總是非常準(zhǔn)確,它們調(diào)節(jié)得越厲害,用戶感受到的失真就越厲害,因?yàn)閰^(qū)分失當(dāng),一部分講話被濾除掉了。通常情況下,講話的可理解性得到了維持,但逼真度就受到了損害。在手機(jī)方面,這可能影響不大,因?yàn)闊o線網(wǎng)絡(luò)已經(jīng)降低了聲音的逼真度,但在錄音器等其他應(yīng)用中,逼真度可能就至關(guān)重要了。
最佳的數(shù)字方案通常會(huì)是混合算法,截取各種方法的一部分,并靈巧地結(jié)合在一起。這些方法通常可以適應(yīng)不同的場合,但也常常增添更重的負(fù)擔(dān),針對(duì)各種產(chǎn)品設(shè)計(jì)來調(diào)整或定制更復(fù)雜的算法。
選擇某種技術(shù)方案來提升產(chǎn)品語音質(zhì)量的工程師,在給定方案的音頻性能表現(xiàn)之外,還須顧及對(duì)產(chǎn)品設(shè)計(jì)的影響。某些方案要求特殊的麥克風(fēng)類型,或是要求特定麥克風(fēng)布局及聲學(xué)設(shè)計(jì),可能會(huì)損及產(chǎn)品的整體工業(yè)設(shè)計(jì)或機(jī)械設(shè)計(jì)。某些方案可能會(huì)消耗大量便攜設(shè)備電池電量,或是不能適配印制電路板(PCB)上能用的空間。而且在幾乎每種設(shè)計(jì)中,開發(fā)設(shè)計(jì)成本都會(huì)是一項(xiàng)決定性因素。