亞馬遜云科技語音識別服務(wù)Amazon Transcribe在中國區(qū)域上線實時流式轉(zhuǎn)錄
日前,亞馬遜云科技宣布通過與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,在北京區(qū)域和寧夏區(qū)域正式上線Amazon Transcribe Streaming實時流式語音轉(zhuǎn)錄功能。Amazon Transcribe是一項自動語音識別(ASR)服務(wù),可為用戶提供方便快捷的語音轉(zhuǎn)文本服務(wù),使用場景包括轉(zhuǎn)錄客服電話、自動添加字幕、生成會議紀要,以及為媒體資產(chǎn)生成元數(shù)據(jù)、創(chuàng)建完全可搜索的存檔等。Amazon Transcribe根據(jù)轉(zhuǎn)錄的音頻時長、按實際使用量付費,客戶無需花費昂貴的轉(zhuǎn)錄費用,便能讓開發(fā)人員輕松地為其應(yīng)用程序添加語音轉(zhuǎn)文本功能。
Amazon Transcribe能夠快速準確地將語音轉(zhuǎn)換為文本,用戶只需投入很少的時間和費用,便可以達到幾乎與手動轉(zhuǎn)錄相媲美的轉(zhuǎn)錄效果。用戶可以將它應(yīng)用于實時音頻流或批量音頻內(nèi)容,創(chuàng)建包含音頻文件內(nèi)容的應(yīng)用程序。Amazon Transcribe采用深度學(xué)習功能自動添加標點符號和格式,生成時間戳;并且,用戶可以通過轉(zhuǎn)錄控制臺自定義詞匯列表和語言模型,從而為特定領(lǐng)域的詞和詞組生成更準確的轉(zhuǎn)錄,例如產(chǎn)品名稱、技術(shù)術(shù)語等。此外,Amazon Transcribe可以識別和修訂敏感的個人身份信息來保護用戶隱私安全,并通過詞匯表篩選掩蔽或刪除轉(zhuǎn)錄結(jié)果中不文明用語,為客戶提供更好的轉(zhuǎn)錄效果和用戶體驗。
目前,Amazon Transcribe支持多種語言,在批量音頻內(nèi)容處理中支持多達31種語言,在實時流失轉(zhuǎn)錄場景下支持包括中文普通話、澳大利亞英語、英國英語、美國英語、法語、加拿大法語、德語、意大利語、日語、韓語、巴西葡萄牙語和美國西班牙語等在內(nèi)的12種語言。
首汽約車是首汽集團為推動傳統(tǒng)出租車行業(yè)轉(zhuǎn)型升級而打造的網(wǎng)約車出行平臺。在首汽約車的“智能語音解決方案”項目中,亞馬遜云科技幫助客戶一起建立了語音降噪和導(dǎo)航音分離算法模型,先是利用Amazon SageMaker機器學(xué)習服務(wù)進行模型構(gòu)建、訓(xùn)練、調(diào)優(yōu)和部署,再利用Amazon Transcribe人工智能語音服務(wù)將行程錄音自動轉(zhuǎn)化為文字,從而實現(xiàn)通過場景化的關(guān)鍵詞識別分析觸發(fā)安全預(yù)警,結(jié)合后臺安全監(jiān)控人員的人工判斷,讓實時的行程安全監(jiān)控從“可能”變成“現(xiàn)實”。首汽約車副總裁閆磊表示“我們與亞馬遜云科技技術(shù)團隊緊密合作,利用Amazon SageMaker、Amazon Transcribe等服務(wù),實現(xiàn)了智能語音解決方案,將客服人工審核工作量降低了35%、客服人工聽音審核時長縮短了20%,且智能客戶投訴處理的準確率達90%以上,改善了司乘體驗和滿意度,提高了企業(yè)運營效率。”
美國全國運動汽車競賽協(xié)會 (NASCAR) 是一家美國汽車競賽審批和運營公司,以賽車而聞名。NASCAR 發(fā)展部高級總監(jiān)Patrick Carroll表示:“我們選擇使用 Amazon Transcribe,在我們覆蓋195個國家或地區(qū)以及29 種語言的多站點網(wǎng)站上為 NASCAR 的點播內(nèi)容提供字幕。利用 Amazon Transcribe,我們建立了一個自動化的系統(tǒng),這個系統(tǒng)幾乎不需要我們的團隊進行操作,同時讓我們能夠自定義自己需要的語音識別功能。應(yīng)用了 Amazon Transcribe 之后,我們?yōu)?99% 的點播內(nèi)容自動添加了字幕,并且費用比我們最初的估計少97%?!?
Audioburst 是一家擁有超前思維,極富創(chuàng)新力的技術(shù)提供商,他們讓談話音頻的發(fā)現(xiàn)、分發(fā)和個性化發(fā)生了轉(zhuǎn)變,Audioburst 聯(lián)合創(chuàng)始人兼首席技術(shù)官Gal Klein說:“每天,我們分析225,000 分鐘的實時電臺訪談,以形成數(shù)以千計的關(guān)于播放列表和搜索的短主題片段。我們選擇 Amazon Transcribe 是因為它作為出色的語音識別引擎,可幫助我們轉(zhuǎn)錄實時視頻內(nèi)容,用于下游內(nèi)容制作工作流。”