(文章來源:站長之家)
全球?qū)崟r音視頻開創(chuàng)者聲網(wǎng)Agora宣布推出一站式智能語音識別解決方案,將通過AI智能降噪、聲紋檢測、語音識別等技術(shù),進(jìn)行在線實時語音識別,幫助平臺更智能、高效的識別語音中存在的涉黃、涉政、廣告等違法違規(guī)信息。凈化平臺內(nèi)容質(zhì)量,降低監(jiān)管風(fēng)險,提升用戶體驗。
一段時間以來,網(wǎng)絡(luò)音頻行業(yè)亂象頻出。今年 6 月,國家網(wǎng)信辦針對網(wǎng)絡(luò)音頻亂象問題啟動專項整治行動, 26 款音頻平臺因傳播歷史虛無主義、淫穢色情等內(nèi)容被采取約談、下架、關(guān)停等處罰。
一方面,隨著移動互聯(lián)網(wǎng)的發(fā)展,UGC內(nèi)容生產(chǎn)數(shù)量越來越龐大,ASMR、嬌喘等色情擦邊球內(nèi)容頻頻出現(xiàn)在語音聊天室、直播、短視頻等平臺上;另一方面,相對于圖文和視頻,音頻審核本身在技術(shù)上也更具難度,這大大增加了平臺方的內(nèi)容審核壓力。因此,在國家網(wǎng)信辦強(qiáng)監(jiān)管的大背景下,借助更高效、便捷的語音鑒黃方案加強(qiáng)內(nèi)容審核成為眾多社交、音視頻平臺的剛需。
無論傳統(tǒng)語音審核還是人工審核方案,一直以來各平臺都在積極尋找更高效的內(nèi)容審核方式。在傳統(tǒng)審核方案的對接模式中,企業(yè)想要同時上線直播、鑒黃等功能,需要分別對接CDN廠商、RTC廠商和內(nèi)容審核廠商,并且額外支付CDN拉流成本,通過三步才能拿到內(nèi)容審核結(jié)果,步驟繁瑣、時間成本高且面臨故障風(fēng)險。而單純使用人工鑒黃雖然對新型問題有較強(qiáng)的靈活性,但也面臨人員流動性大、質(zhì)量效率不穩(wěn)定等運營成本。
聲網(wǎng)Agora的一站式智能語音識別解決方案,將上述傳統(tǒng)語音審核和純?nèi)斯ふZ音審核進(jìn)行了優(yōu)化升級,通過自建的全球虛擬實時通信網(wǎng)絡(luò)SD-RTN?,整合目前業(yè)界TOP3 智能語音識別服務(wù)商,為企業(yè)提供可集成實時音視頻、實時錄制和實時智能語音識別的一站式服務(wù),提供市面上最高效、便捷的智能語音識別技術(shù)。
同時,聲網(wǎng)也是目前唯一一家打通人工智能、實時語音識別、實時音視頻三大技術(shù)解決方案的服務(wù)商。使用聲網(wǎng)的一站式服務(wù),企業(yè)無需部署額外SDK、無需自己對接CDN廠商、更無需支付拉流成本,就可同時上線直播(實時音視頻)和鑒黃(實時語音識別)功能,幫助企業(yè)大幅節(jié)省接入成本,真正做到一站式方便接入。
在目前流行的眾多K歌平臺,直播、語音聊天室中,為了追求內(nèi)容效果,用戶在UGC內(nèi)容創(chuàng)作時普遍都會使用背景音樂或音效來營造氛圍,這對平臺進(jìn)行語音識別增加了難度。對于語音識別中常見的噪聲、背景音等音質(zhì)問題,聲網(wǎng)的一站式智能語音識別解決方案融合聲網(wǎng)Agora語音引擎與AI音頻降噪算法,可提供去除背景音、環(huán)境音之后的高音質(zhì)音頻源,在原來算法的基礎(chǔ)上將不良信息的識別率有效提高30%以上。
在語音識別過程中,對于有語義的聲音,系統(tǒng)先將語音識別轉(zhuǎn)成文字,然后再對文字內(nèi)容進(jìn)行識別;而對于無語義的聲音,例如嬌喘、ASMR中的色情擦邊球等,則可以通過聲紋檢測來進(jìn)行識別,再通過內(nèi)容安全引擎判斷是否包含涉黃違法內(nèi)容。這樣“雙管齊下”的方式,可以避免嬌喘等無語義聲音的特殊性帶來的審核漏洞。
聲網(wǎng)通過深度學(xué)習(xí)語音識別技術(shù)與在線實時語音分析,智能識別語音環(huán)境中的廣告、涉黃、涉政、暴恐、謾罵等不良信息,保障語音聊天室、娛樂直播等語音應(yīng)用綠色安全。未來,聲網(wǎng)還會聯(lián)合更多業(yè)界知名智能語音識別服務(wù)商,為企業(yè)持續(xù)提供高效、嚴(yán)格的內(nèi)容審核機(jī)制,促進(jìn)網(wǎng)絡(luò)生態(tài)健康發(fā)展。