Nuance語音識(shí)別技術(shù)及解決方案
1.語音識(shí)別概述
語音識(shí)別技術(shù),AutomaTIc Speech RecogniTIon,簡(jiǎn)稱ASR,是一種讓機(jī)器聽懂人類語言的技術(shù)。語言是人類進(jìn)行信息交流的最主要、最長(zhǎng)用、最直接的方式。語音識(shí)別技術(shù)是實(shí)現(xiàn)人機(jī)對(duì)話的一項(xiàng)重大突破,在國外近年來發(fā)展十分迅速,其應(yīng)用也逐步得到推廣。近幾年逐漸普及的IVR(自動(dòng)電話應(yīng)答)處理了不少簡(jiǎn)單而又重復(fù)的咨詢工作,節(jié)省了不少人力,但這種按鍵式的語音自動(dòng)應(yīng)答卻讓客戶花費(fèi)很多時(shí)間按指引來完成簡(jiǎn)單的查詢,令用戶倍感不便。
語音識(shí)別無疑可以解決該方面的問題。語音識(shí)別系統(tǒng)的開發(fā)成功,充分發(fā)揮了計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的優(yōu)勢(shì),采用先進(jìn)的人機(jī)對(duì)話方式,擺脫電話按鍵的束縛,人們只要象平常一樣對(duì)著電話簡(jiǎn)單的說出所需服務(wù)項(xiàng)目,即可輕松獲取自動(dòng)系統(tǒng)提供的所需信息。
語音識(shí)別系統(tǒng)結(jié)構(gòu)
2.語音識(shí)別應(yīng)用
Nuance公司是自然語音接口軟件的佼佼者。使用自然語音接口軟件,人們可以通過電話方便安全地獲取信息、服務(wù)并進(jìn)行交易。每天,千千萬萬的人通過撥打運(yùn)行Nuance公司語音識(shí)別、語言理解和聲紋鑒別軟件的電話,進(jìn)行出游預(yù)訂、股票交易、與其它通訊媒體、企業(yè)和互聯(lián)網(wǎng)系統(tǒng)進(jìn)行交往等活動(dòng)。NUANCE的應(yīng)用:美國航空、Bell AtlanTIc、Charles Schwab、家庭購物網(wǎng)絡(luò)、Lloyds TSB、Sears、UPS 。
3.NUANCE語音識(shí)別特點(diǎn)
?。?)海量詞匯、獨(dú)立于講話者的健壯識(shí)別功能
Nuance系統(tǒng)能可靠地對(duì)多種語言進(jìn)行大詞匯量的識(shí)別,并可提供識(shí)別結(jié)果的置信度。該系統(tǒng)對(duì)商業(yè)上使用的大量詞匯提供最準(zhǔn)確的語音識(shí)別技術(shù)。利用Nuance系統(tǒng)開發(fā)的應(yīng)用程序,在市場(chǎng)上具有最高的準(zhǔn)確率。生產(chǎn)中的應(yīng)用程序經(jīng)測(cè)試,準(zhǔn)確性超過96%。
?。?)基于主機(jī)的客戶/服務(wù)機(jī)結(jié)構(gòu)
Nuance系統(tǒng)基于開放式客戶/服務(wù)機(jī)結(jié)構(gòu),特別為大型應(yīng)用程序所需的健壯性和可伸縮性而設(shè)計(jì)。呼叫者的講話由客戶端收集,而識(shí)別和鑒別處理的負(fù)載被平均分配到網(wǎng)絡(luò)上的多個(gè)分開的服務(wù)器上。
?。?)N-Best處理
對(duì)于有些應(yīng)用程序,可能需要識(shí)別引擎產(chǎn)生可能的識(shí)別結(jié)果集,而不是一個(gè)最好的結(jié)果。Nuance系統(tǒng)的N-best識(shí)別處理方法便有這個(gè)功能,它提供了可能的識(shí)別結(jié)果列表,并按可能性從高到低排列。
(4)語法概率
Nuance系統(tǒng)允許對(duì)呼叫者所講的特定詞語或短語的在語法中的概率進(jìn)行指定。當(dāng)被講的詞語或短語的概率可根據(jù)實(shí)際使用進(jìn)行估計(jì)時(shí),非常有用。對(duì)語法增加概率可提高識(shí)別的準(zhǔn)確率和速度。
?。?)降低噪音
當(dāng)進(jìn)來的呼叫包含穩(wěn)定的背景噪音時(shí),Nuance系統(tǒng)通過一種機(jī)制,使識(shí)別服務(wù)器更準(zhǔn)確地進(jìn)行識(shí)別。識(shí)別服務(wù)器將進(jìn)來的話語進(jìn)行增強(qiáng),以有效地將語氣、嗡嗡聲、哼叫聲、噓噓聲等噪聲過濾。如果相當(dāng)數(shù)量的電話均含有穩(wěn)定的背景噪聲,比如在汽車上免提打電話時(shí),這個(gè)機(jī)制效果較理想。
4.基于識(shí)別的應(yīng)用
語音短信本身業(yè)務(wù)、公司電話簿、個(gè)人電話簿、智能點(diǎn)歌、股票查詢和交易、智能信息點(diǎn)播、列車時(shí)刻查詢
(1)基于語音識(shí)別的公司電話簿
公司電話薄應(yīng)用描述
系統(tǒng)能支持多個(gè)接入號(hào)碼,虛擬多個(gè)公司的總機(jī)。并依靠語音識(shí)別技術(shù),智能轉(zhuǎn)接到相應(yīng)的用戶。
流程
用戶撥打接入碼,系統(tǒng)根據(jù)接入碼找到相應(yīng)的公司數(shù)據(jù)庫,同時(shí)提醒用戶說出相應(yīng)的用戶,系統(tǒng)依據(jù)相應(yīng)的用戶查詢數(shù)據(jù)庫,并得到該用戶的號(hào)碼,并通知交換機(jī)將該號(hào)碼接通。
公司電話簿特點(diǎn)
•系統(tǒng)支持電話接入方式
用戶可通過電話修改個(gè)人密碼,個(gè)人上班電話和非上班電話
•系統(tǒng)支持WEB接入方式
• 系統(tǒng)管理員可修改所有信息
• 各公司管理員可增加,刪除,修改本公司的電話信息
?。?)基于語音識(shí)別的點(diǎn)歌功能
功能描述
用戶接入系統(tǒng),提示用戶說出歌名,并依靠語音識(shí)別技術(shù),查找到該歌名,并播放給用戶。
應(yīng)用流程
用戶撥打接入碼,提示用戶說出歌名或歌手名,并依靠語音識(shí)別技術(shù),查找到該歌名或歌手名,若為歌名查詢數(shù)據(jù)庫,得到該歌存儲(chǔ)的路徑,并播放給用戶,若為歌手名,則讀出該歌手的專輯,并提醒用戶選擇,用戶選擇后,讀出該專輯的歌名,并提醒用戶選擇,用戶選擇后,給用戶播放該歌曲。