繼狀告百度輸入法侵權(quán)上了頭條后,科大訊飛借錘子科技新品發(fā)布會,又上了一次頭條。
2016 年 10 月 18 日晚上,錘子科技發(fā)布了最新旗艦智能手機 M1 與 M1 Plus 。會上,錘子科技創(chuàng)始人羅永浩向公眾展示了新旗艦手機的多項功能,其中科大訊飛超精準的語音輸入贏得了諸多觀眾的掌聲。
據(jù)羅永浩透露,科大訊飛的語音識別率已經(jīng)高達 97 %,如果不是發(fā)給那些非常咬文嚼字的人看的話,經(jīng)過訊飛語音識別的文字基本可以直接發(fā)送。
▲ 訊飛語音輸入獲錘子力挺(Source:錘子科技微博)
語音輸入比鍵盤輸入更加方便(無需用手)、快速(人每分鐘能講出 150 個單詞,卻只能打出 40 個字)的優(yōu)勢,這是其興起的基礎(chǔ)。
科大訊飛的語音輸入,為我們揭示了語音識別應(yīng)用的冰山一角。事實上,除了讓機器將語音轉(zhuǎn)換成文字,語音識別還能將語音信號轉(zhuǎn)換成命令,從而成為互聯(lián)網(wǎng)場景下的控制中心。
語音識別藍海即將到來,三大應(yīng)用引期待
近年,伴隨物聯(lián)網(wǎng)技術(shù)與人工智能技術(shù)不斷落地,語音識別技術(shù)重要性不斷凸顯。“互聯(lián)網(wǎng)女皇”瑪麗·米克爾發(fā)布的 2016 年互聯(lián)網(wǎng)趨勢報告中,將語音識別技術(shù)列為重要的技術(shù)趨勢,瑪麗·米克爾認為,未來的計算界面將可由鍵盤升級至麥克風(fēng)加鍵盤的模式。
另外,亞馬遜的 Echo 音響內(nèi)置了 Amazon Alexa 語音助手、蘋果在手機以及電腦上搭載了 Siri ,微軟推出了小娜與小冰;谷歌正式推出了面向 Android 與 ios 系統(tǒng)的 Allo ……科技大佬們正積極推動語音識別技術(shù)的發(fā)展。
受以上因素刺激,業(yè)界認為,語音識別技術(shù)的藍海即將到來,從業(yè)界的動態(tài)來看,其在搜索引擎、智能家居以及智能汽車三方面的應(yīng)用備受期待。
語音識別將可取代傳統(tǒng)的搜索引擎,成為互聯(lián)網(wǎng)的重要入口。 Amazon Alexa 、 Siri 、微軟小娜、谷歌 Allo 都在為此目標(biāo)努力,取代傳統(tǒng)搜索引擎后,語音識別技術(shù)將可收獲網(wǎng)絡(luò)營銷、用戶調(diào)研、收費問答等多個領(lǐng)域的市場。
智能家居領(lǐng)域,需要將多款遙控設(shè)備集成于一個設(shè)備中,供用戶操作,大多時候,智能手機 APP 充當(dāng)了這一功能。語音識別技術(shù)加入后,通過聲音指令,即可實現(xiàn)對家居環(huán)境中各個聯(lián)網(wǎng)設(shè)備的控制,這種方式更加便捷。
智能汽車領(lǐng)域中,自動駕駛技術(shù)無疑是重點,除此之外,語音識別技術(shù)也能有效提高汽車的智能性。比如可進行全語音交互的地圖導(dǎo)航、又比如駕駛之外的車內(nèi)交互場景(打電話、查詢天氣、播放音樂等)。
延時與準確兩大痛點,語音識別技術(shù)待提升
語音識別技術(shù)前景無疑是美好的,不過,現(xiàn)階段,語音識別還受困于技術(shù)痛點,難以大范圍應(yīng)用,主要體現(xiàn)在延時與準確性兩方面。
在語音轉(zhuǎn)換成文字方面,科大訊飛等企業(yè)速度已經(jīng)比較能讓人接受了,不過在語音指令方面,Siri、微軟小娜等還會有延時的現(xiàn)象,機器理解并采取回應(yīng)的過程需要更多時間,不過一個指令需要用戶等待十秒甚至以上的,則很難被市場接受。
準確性上,有媒體對科大訊飛的語音輸入做過實測,結(jié)果顯示,在語速慢的情況下,科大訊飛語音能很快將語音準確地翻譯成文字;不過,在語速快、中英文夾雜的情況下,準確性有所下降。
另外,語音輸入的準確性還面臨方言以及使用環(huán)境的挑戰(zhàn)。
因此,未來語音識別技術(shù)還需要在速度和準確性上有所提升。尤其是準確性,業(yè)界相信,當(dāng)語音識別技術(shù)準確度提高到99%的時候,將會改寫當(dāng)前人機交互的規(guī)則。