語(yǔ)音識(shí)別雖然已經(jīng)發(fā)展的如火如荼,但還是有不少問(wèn)題要改進(jìn),就如下面一段和語(yǔ)音識(shí)別相關(guān)的搞笑視頻里。也許,口音差異也是語(yǔ)音識(shí)別的一個(gè)難題。
語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話人識(shí)別及說(shuō)話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話人而非其中所包含的詞匯內(nèi)容。
語(yǔ)音識(shí)別技術(shù)的應(yīng)用包括語(yǔ)音撥號(hào)、語(yǔ)音導(dǎo)航、室內(nèi)設(shè)備控制、語(yǔ)音文檔檢索、簡(jiǎn)單的聽(tīng)寫(xiě)數(shù)據(jù)錄入等。語(yǔ)音識(shí)別技術(shù)與其他自然語(yǔ)言處理技術(shù)如機(jī)器翻譯及語(yǔ)音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語(yǔ)音到語(yǔ)音的翻譯。
語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。
語(yǔ)音識(shí)別以谷歌GoogleNow和蘋(píng)果Siri為代表,將智能手機(jī)的功能帶入到人機(jī)互動(dòng)時(shí)代。除了手機(jī)以外,如三星、LG、聯(lián)想的語(yǔ)音識(shí)別電視,各種安卓、iOS系統(tǒng)的平板幾乎都有語(yǔ)音識(shí)別功能。通過(guò)語(yǔ)音識(shí)別功能,用戶從一定程度上解放了雙手,也讓人們看到了未來(lái)人工智能領(lǐng)域廣闊的應(yīng)用前景。 |