規(guī)劃者談中興新機Grand S II LTE:聲控是下一個浪潮?
北京時間1月14日下午消息,對于第一代智能手機,業(yè)界普遍的看法是,喬布斯將觸摸屏和高效節(jié)能芯片引入手機領(lǐng)域后,引領(lǐng)了智能手機的第一波發(fā)展浪潮。那么智能手機今后的發(fā)展浪潮是什么?在中興通訊手機產(chǎn)品規(guī)劃中心主任丁寧看來,“通過聲音控制一切、真正解放雙手”會是下一步發(fā)展的趨勢。
GrandSIILTE是中興重點打造的智慧語音手機,為了進(jìn)一步描繪語音控制的魅力,丁寧以一段電影片段為例,他說:“在好萊塢大片《2012》里,俄羅斯富商乘坐的豪華飛機需要通過汽車才能著陸,但大家到處都找不到他的賓利車鑰匙了,沒辦法啟動車。這時候,這位俄羅斯富商說了句‘安靜’,然后等大家安靜下來后,他說了一聲‘啟動’,他的賓利車就啟動了。”
“所以,我們認(rèn)為通過聲音控制一切,是更加提升用戶體驗,更便捷操作電子終端的技術(shù)方向。”
當(dāng)然他也坦承,新技術(shù)的成熟需要一個發(fā)展過程,語音識別是一個相對比較難的技術(shù),它需要大數(shù)據(jù),大數(shù)據(jù)傳統(tǒng)的方法是內(nèi)置到產(chǎn)品里面,但產(chǎn)品本身的容量和空間是有限的,當(dāng)有新的詞匯產(chǎn)生的時候,它無法及時更新,造成無法識別的問題。
不過,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,尤其是4G的來臨,語音識別就會有更好的體驗。所有詞匯的解釋、語音的識別,通過高速的網(wǎng)絡(luò)就可以實現(xiàn)高辨識度的語音識別。
中興通訊手機產(chǎn)品規(guī)劃中心主任丁寧
丁寧表示,GrandSIILTE最大的亮點就在于低功耗喚醒和聲紋解鎖。待機狀態(tài)下手機的功耗非常低,在這種情況下,不通過手動操作,通過語音把手機喚醒,并且讓它獨一無二的識別用戶自己的聲音,這就形成了一個真正安全的平臺入口,這是這款手機最有創(chuàng)新的一點。
聲紋認(rèn)證技術(shù),是中興與語音和語言解決方案提供商Nuance合作提供的,用戶可以在設(shè)置選項里設(shè)置兩個聲紋ID分別進(jìn)入常規(guī)桌面和兒童桌面,無需滑行、鍵入,使用密碼或手動操作。
聲紋認(rèn)證設(shè)置
同樣采用了Nuance自然語言理解(NLU)和語音合成技術(shù)的駕駛助手應(yīng)用,主要針對的是駕駛場景,方便用戶在開車時操作手機,通過語音指令,不僅能快速啟動路徑導(dǎo)航功能,還可以實現(xiàn)撥打和接聽電話、收聽短信、播放指定的音樂曲目等等。比如用戶可以說“聯(lián)合廣場在那里”,駕駛助手會啟動谷歌地圖顯示搜索到的目的地導(dǎo)航,并提供語音路線。
駕駛助手應(yīng)用
GrandSIILTE在語音方面的另外一個特色是Hi-FiVoice高保真語音,普通的手機語音有0-4KHz的帶寬,GrandSIILTE有0-8KHz高音頻寬帶,手機的頂端、底端及背面分別嵌入有一枚麥克風(fēng),能在嘈雜的環(huán)境中快速識別用戶的語音指令。但經(jīng)過筆者現(xiàn)場體驗,聲紋識別在嘈雜環(huán)境下的辨識度仍存在一些問題。
GrandSII另外一個跟聲音有關(guān)的應(yīng)用是定向錄音功能,它能夠為用戶提供解說、采訪等多種錄音模式,解說模式指只錄主屏一側(cè)(對準(zhǔn)解說者)聲音,減弱或屏蔽對面和側(cè)面的聲音。
丁寧表示,中興希望通過一些新的技術(shù)創(chuàng)新點,為用戶帶來體驗更好的產(chǎn)品。語音控制技術(shù)的廣泛應(yīng)用,可以解放用戶雙手,打造新的智能手機操作習(xí)慣。
語音識別已經(jīng)有近20年的應(yīng)用歷史,但只是近年來蘋果Siri的推出才廣為人知。從中興GrandSIILTE的現(xiàn)場體驗來看,更好的提高嘈雜環(huán)境下的識別率,是語音識別走向普及的必經(jīng)之路。