科大訊飛/百度/微軟發(fā)力語(yǔ)音識(shí)別 潛力無(wú)限?
近日,微軟的一份聲明表示,語(yǔ)音識(shí)別技術(shù)的精準(zhǔn)性已經(jīng)能媲美人類。微軟 CEO 薩提亞·納德拉認(rèn)為,這一新突破對(duì)計(jì)算機(jī)行業(yè)的意義不亞于圖形用戶界面,不久后,這種能力將會(huì)普及到整個(gè)計(jì)算機(jī)行業(yè)中。
國(guó)內(nèi)錘子M1發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛的語(yǔ)音識(shí)別技術(shù)快速、精準(zhǔn)地將羅永浩講出的話翻譯成文字,引起滿堂喝彩。
媒體報(bào)道,百度與美國(guó)斯坦福大學(xué)合作推出的語(yǔ)音輸入App ,其比手動(dòng)輸入快3倍,準(zhǔn)確性也更高。
近期發(fā)生的上述三大事件,成功引起了市場(chǎng)對(duì)語(yǔ)音識(shí)別技術(shù)的關(guān)注。
網(wǎng)絡(luò)安全時(shí)代,為何語(yǔ)音識(shí)別技術(shù)不溫不火?
隨著互聯(lián)網(wǎng)技術(shù)不斷普及,我們迎來(lái)了網(wǎng)絡(luò)安全時(shí)代,生物識(shí)別技術(shù)也有了用武之地。
目前,生物識(shí)別技術(shù)中,指紋識(shí)別應(yīng)用最為成熟,且生命力旺盛。
手機(jī)廠商熱衷于讓指紋識(shí)別技術(shù)充當(dāng)解鎖或支付的功能,盡管這一技術(shù)還存在手指脫皮就無(wú)法識(shí)別的問(wèn)題,但手機(jī)廠商并未放棄它。小米最新旗艦手機(jī)小米 5S 甚至還推出了超聲波指紋識(shí)別技術(shù),解決了這一問(wèn)題。
除此之外,媒體報(bào)道,蘋果全新的兩款 Macbook ,也將在電源鍵中集成 Touch ID ,以供用戶指紋解鎖。
人臉識(shí)別方面,隨著支付寶的大力推廣,其在互聯(lián)網(wǎng)金融領(lǐng)域的應(yīng)用前景十分美好。
虹膜識(shí)別技術(shù),是生物識(shí)別領(lǐng)域的“黑科技”,識(shí)別精準(zhǔn)度更高,在對(duì)安全有極高要求的場(chǎng)景下,這一技術(shù)同樣有發(fā)展的空間。
與之相比,語(yǔ)音識(shí)別技術(shù)則發(fā)展的不溫不火。究其原因,應(yīng)用場(chǎng)景尷尬是其中之一。畢竟,比手指接觸設(shè)備、紅外線掃描人臉或虹膜的方式相比,語(yǔ)音識(shí)別需要通過(guò)發(fā)聲的方式進(jìn)行,這樣在有人或者無(wú)人的場(chǎng)景下,這種進(jìn)行身份認(rèn)定的方式都讓人覺(jué)得怪怪的。
找準(zhǔn)應(yīng)用場(chǎng)景,語(yǔ)音識(shí)別潛力無(wú)限早前,重視互聯(lián)網(wǎng)安全的環(huán)境下,語(yǔ)音識(shí)別沒(méi)有發(fā)展的機(jī)會(huì)。隨著物聯(lián)網(wǎng)技術(shù)與人工智能技術(shù)不斷落地,語(yǔ)音識(shí)別迎來(lái)了生機(jī)。
盡管在解鎖、支付方面,語(yǔ)音識(shí)別依舊難以普及,不過(guò),語(yǔ)音識(shí)別將語(yǔ)言轉(zhuǎn)換成文字或者命令的獨(dú)特屬性,有望助力其在更多場(chǎng)景中發(fā)揮作用。
比如,科大訊飛與百度的語(yǔ)音輸入,將語(yǔ)言轉(zhuǎn)換成文字,這是其他幾大生物識(shí)別技術(shù)都無(wú)法處理的事情。以此作為出發(fā)點(diǎn),未來(lái)語(yǔ)音識(shí)別將能用在寫(xiě)作與出版領(lǐng)域。
至于語(yǔ)音轉(zhuǎn)換成命令方面,語(yǔ)音識(shí)別技術(shù)可以做的事情就更多了,比如在消費(fèi)娛樂(lè)領(lǐng)域,VR游戲正是風(fēng)尚,引入語(yǔ)音識(shí)別技術(shù)后,玩家可拋棄游戲手柄,真正做到沉浸式的體驗(yàn)當(dāng)中。
又比如在微軟小娜、蘋果 Siri ,智能家居、車聯(lián)網(wǎng)等領(lǐng)域中,成熟的語(yǔ)音識(shí)別技術(shù)將可讓機(jī)器人迅速理解你的指令,并采取相應(yīng)的措施,生活智能化程度得到極大提高。
要指出的是,在語(yǔ)音轉(zhuǎn)換文字、語(yǔ)音指令方面,語(yǔ)音識(shí)別還存在準(zhǔn)確率待提高、延時(shí)等瓶頸,不過(guò)隨著語(yǔ)音識(shí)別技術(shù)不斷提升,這些問(wèn)題在未來(lái)可以不斷得到改善,語(yǔ)音識(shí)別市場(chǎng)潛力還將繼續(xù)上升。
研究機(jī)構(gòu)指出, 2015 年全球語(yǔ)音識(shí)別市場(chǎng)規(guī)模約為 61.9 億美元,預(yù)計(jì)到2020年可以接近 200 億美元。