IBM嵌入式語音識(shí)別技術(shù)無需預(yù)先存儲(chǔ)特殊指令
掃描二維碼
隨時(shí)隨地手機(jī)看文章
ibm日前發(fā)布了其嵌入式viavoice4.4軟件包,其中采用了任意指令識(shí)別和一種創(chuàng)新的語音識(shí)別技術(shù),該技術(shù)容許駕駛員和手持設(shè)備用戶以自然語音發(fā)出指令,而不必存儲(chǔ)特殊的預(yù)定指令。
ibm的嵌入式viavoice4.4為移動(dòng)設(shè)備--例如車載導(dǎo)航系統(tǒng)、免提電話、pda和其它智能設(shè)備提供了較為領(lǐng)先的語音技術(shù)。嵌入式設(shè)備采用ibm語音識(shí)別技術(shù)的應(yīng)用主要有兩種:1.自動(dòng)語音識(shí)別應(yīng)用:利用人類的語音將輸入指令錄入移動(dòng)設(shè)備的;2.文字-語音轉(zhuǎn)換設(shè)備:將文字和來自某種移動(dòng)設(shè)備的信息用合成的人類聲音讀出來。
新產(chǎn)品的設(shè)計(jì)為用戶提供了新的靈活性并提高了嵌入式語音設(shè)備的識(shí)別精度。例如,對(duì)于“收音機(jī)104.3fm”這個(gè)指令,采用ibm的新技術(shù)就容許駕駛員發(fā)出“調(diào)到104.3”或“將收音臺(tái)調(diào)到104.3”或“將收音臺(tái)變到104.3”。采用各種直覺指令就可以把收音臺(tái)調(diào)到期望的信道,因而就不必記憶特殊的指令表。
ibm的嵌入式viavoice4.4具有任意指令識(shí)別的功能,它采用統(tǒng)計(jì)語言建模和語義解釋技術(shù),讓語音識(shí)別系統(tǒng)能夠聽懂用戶的自然語音。任意指令識(shí)別技術(shù)容許人們?cè)谲囕d收音機(jī)、導(dǎo)航系統(tǒng)或手持設(shè)備的語音指令控制中采用未經(jīng)控制設(shè)備存儲(chǔ)的直覺指令組。
在新的軟件包中,通過采用新的聲學(xué)模型、增強(qiáng)的聲學(xué)模型訓(xùn)練技術(shù)和經(jīng)改進(jìn)的語音靜默檢測(cè)方法,改進(jìn)了噪聲條件下的總體識(shí)別精度。該功能對(duì)于處理道路顛簸、按喇叭或鐵路道口噪聲環(huán)境的指令識(shí)別很有效。
ibm表示,該產(chǎn)品“開箱即用”,新用戶可方便地操作系統(tǒng),駕駛員因再也不必記憶特殊字或詞組而可把注意力集中在安全駕駛上。手持設(shè)備用戶可以在正常地進(jìn)行其它行為的同時(shí)流暢地執(zhí)行各種手持設(shè)備功能。新系統(tǒng)不僅容許任意指令識(shí)別,而且可以識(shí)別多種語言的指令。