一對(duì)一語(yǔ)音聊天場(chǎng)景的技術(shù)難點(diǎn)是什么
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:布谷鳥網(wǎng)絡(luò)科技)
視頻聊天時(shí)候,因?yàn)榭梢钥吹奖舜?,?duì)聲音也不那么在意。而純語(yǔ)音聊天時(shí),人注意力都放在聲音上,對(duì)音質(zhì)的要求更高。
1)整體穩(wěn)定的技術(shù),1 對(duì) 1 語(yǔ)聊的技術(shù)門檻相對(duì)較低,多人語(yǔ)聊和特定場(chǎng)景相對(duì)復(fù)雜,技術(shù)實(shí)現(xiàn)難度比較大。以pia戲?yàn)槔绻?jīng)常出現(xiàn)卡頓、延遲和聽(tīng)不清的情況,會(huì)將營(yíng)造的劇情氣氛破壞殆盡,主播時(shí)不時(shí)要退出重新登錄,無(wú)法全身心投入,用戶聽(tīng)到的是斷斷續(xù)續(xù)的聲音,不能沉浸到劇情中。
自研的音視頻引擎,通過(guò)抖動(dòng)緩沖技術(shù)、前向糾錯(cuò)技術(shù)、丟幀補(bǔ)償技術(shù)減少網(wǎng)絡(luò)抖動(dòng)和弱網(wǎng)環(huán)境下的延遲,保障語(yǔ)音通話低延時(shí)且清晰。讓用戶在復(fù)雜網(wǎng)絡(luò)環(huán)境和多類型手機(jī)的情況下,也能實(shí)現(xiàn)暢通優(yōu)質(zhì)的語(yǔ)音通話。
2)多人聊天的語(yǔ)音前處理,以KTV語(yǔ)聊房為例,在房間當(dāng)中,有人說(shuō)話聲音、歌聲、伴奏都在房間呈現(xiàn),每個(gè)人所處的地方,所用的設(shè)備也不一樣,這就有很大可能出現(xiàn)回聲、噪音,或是某個(gè)人設(shè)備不是很好,發(fā)出的聲音很小。
成熟的語(yǔ)音前處理3A技術(shù):回聲消除(AEC)、噪音抑制(ANS)、音量增益(AGC),杜絕回聲和嘯叫,降噪而無(wú)損音質(zhì)。這樣歌者能展示甜美歌聲,聽(tīng)眾也有良好的聽(tīng)覺(jué)享受。
3)媒體次要信息同步,而在KTV類的場(chǎng)景中,AB兩人輪麥合唱,如果輪到B唱歌時(shí)發(fā)現(xiàn)歌詞沒(méi)同步,就很難唱下去。這當(dāng)中技術(shù)難點(diǎn)就在于歌詞等媒體次要信息是否能做到同步。支持將非媒體信息注入媒體流中,歌詞等媒體次要信息和音視頻信息放在同一個(gè)媒體通道傳輸?shù)?,做到歌詞與歌聲同步展示果。