一站式智能語(yǔ)音識(shí)別方案將大幅提高工作效率
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:站長(zhǎng)之家)
全球?qū)崟r(shí)音視頻開(kāi)創(chuàng)者聲網(wǎng)Agora宣布推出一站式智能語(yǔ)音識(shí)別解決方案,將通過(guò)AI智能降噪、聲紋檢測(cè)、語(yǔ)音識(shí)別等技術(shù),進(jìn)行在線實(shí)時(shí)語(yǔ)音識(shí)別,幫助平臺(tái)更智能、高效的識(shí)別語(yǔ)音中存在的涉黃、涉政、廣告等違法違規(guī)信息。凈化平臺(tái)內(nèi)容質(zhì)量,降低監(jiān)管風(fēng)險(xiǎn),提升用戶體驗(yàn)。
一段時(shí)間以來(lái),網(wǎng)絡(luò)音頻行業(yè)亂象頻出。今年 6 月,國(guó)家網(wǎng)信辦針對(duì)網(wǎng)絡(luò)音頻亂象問(wèn)題啟動(dòng)專項(xiàng)整治行動(dòng), 26 款音頻平臺(tái)因傳播歷史虛無(wú)主義、淫穢色情等內(nèi)容被采取約談、下架、關(guān)停等處罰。
一方面,隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,UGC內(nèi)容生產(chǎn)數(shù)量越來(lái)越龐大,ASMR、嬌喘等色情擦邊球內(nèi)容頻頻出現(xiàn)在語(yǔ)音聊天室、直播、短視頻等平臺(tái)上;另一方面,相對(duì)于圖文和視頻,音頻審核本身在技術(shù)上也更具難度,這大大增加了平臺(tái)方的內(nèi)容審核壓力。因此,在國(guó)家網(wǎng)信辦強(qiáng)監(jiān)管的大背景下,借助更高效、便捷的語(yǔ)音鑒黃方案加強(qiáng)內(nèi)容審核成為眾多社交、音視頻平臺(tái)的剛需。
無(wú)論傳統(tǒng)語(yǔ)音審核還是人工審核方案,一直以來(lái)各平臺(tái)都在積極尋找更高效的內(nèi)容審核方式。在傳統(tǒng)審核方案的對(duì)接模式中,企業(yè)想要同時(shí)上線直播、鑒黃等功能,需要分別對(duì)接CDN廠商、RTC廠商和內(nèi)容審核廠商,并且額外支付CDN拉流成本,通過(guò)三步才能拿到內(nèi)容審核結(jié)果,步驟繁瑣、時(shí)間成本高且面臨故障風(fēng)險(xiǎn)。而單純使用人工鑒黃雖然對(duì)新型問(wèn)題有較強(qiáng)的靈活性,但也面臨人員流動(dòng)性大、質(zhì)量效率不穩(wěn)定等運(yùn)營(yíng)成本。
聲網(wǎng)Agora的一站式智能語(yǔ)音識(shí)別解決方案,將上述傳統(tǒng)語(yǔ)音審核和純?nèi)斯ふZ(yǔ)音審核進(jìn)行了優(yōu)化升級(jí),通過(guò)自建的全球虛擬實(shí)時(shí)通信網(wǎng)絡(luò)SD-RTN?,整合目前業(yè)界TOP3 智能語(yǔ)音識(shí)別服務(wù)商,為企業(yè)提供可集成實(shí)時(shí)音視頻、實(shí)時(shí)錄制和實(shí)時(shí)智能語(yǔ)音識(shí)別的一站式服務(wù),提供市面上最高效、便捷的智能語(yǔ)音識(shí)別技術(shù)。
同時(shí),聲網(wǎng)也是目前唯一一家打通人工智能、實(shí)時(shí)語(yǔ)音識(shí)別、實(shí)時(shí)音視頻三大技術(shù)解決方案的服務(wù)商。使用聲網(wǎng)的一站式服務(wù),企業(yè)無(wú)需部署額外SDK、無(wú)需自己對(duì)接CDN廠商、更無(wú)需支付拉流成本,就可同時(shí)上線直播(實(shí)時(shí)音視頻)和鑒黃(實(shí)時(shí)語(yǔ)音識(shí)別)功能,幫助企業(yè)大幅節(jié)省接入成本,真正做到一站式方便接入。
在目前流行的眾多K歌平臺(tái),直播、語(yǔ)音聊天室中,為了追求內(nèi)容效果,用戶在UGC內(nèi)容創(chuàng)作時(shí)普遍都會(huì)使用背景音樂(lè)或音效來(lái)營(yíng)造氛圍,這對(duì)平臺(tái)進(jìn)行語(yǔ)音識(shí)別增加了難度。對(duì)于語(yǔ)音識(shí)別中常見(jiàn)的噪聲、背景音等音質(zhì)問(wèn)題,聲網(wǎng)的一站式智能語(yǔ)音識(shí)別解決方案融合聲網(wǎng)Agora語(yǔ)音引擎與AI音頻降噪算法,可提供去除背景音、環(huán)境音之后的高音質(zhì)音頻源,在原來(lái)算法的基礎(chǔ)上將不良信息的識(shí)別率有效提高30%以上。
在語(yǔ)音識(shí)別過(guò)程中,對(duì)于有語(yǔ)義的聲音,系統(tǒng)先將語(yǔ)音識(shí)別轉(zhuǎn)成文字,然后再對(duì)文字內(nèi)容進(jìn)行識(shí)別;而對(duì)于無(wú)語(yǔ)義的聲音,例如嬌喘、ASMR中的色情擦邊球等,則可以通過(guò)聲紋檢測(cè)來(lái)進(jìn)行識(shí)別,再通過(guò)內(nèi)容安全引擎判斷是否包含涉黃違法內(nèi)容。這樣“雙管齊下”的方式,可以避免嬌喘等無(wú)語(yǔ)義聲音的特殊性帶來(lái)的審核漏洞。
聲網(wǎng)通過(guò)深度學(xué)習(xí)語(yǔ)音識(shí)別技術(shù)與在線實(shí)時(shí)語(yǔ)音分析,智能識(shí)別語(yǔ)音環(huán)境中的廣告、涉黃、涉政、暴恐、謾罵等不良信息,保障語(yǔ)音聊天室、娛樂(lè)直播等語(yǔ)音應(yīng)用綠色安全。未來(lái),聲網(wǎng)還會(huì)聯(lián)合更多業(yè)界知名智能語(yǔ)音識(shí)別服務(wù)商,為企業(yè)持續(xù)提供高效、嚴(yán)格的內(nèi)容審核機(jī)制,促進(jìn)網(wǎng)絡(luò)生態(tài)健康發(fā)展。