國內(nèi)類Siri應(yīng)用頻出 存智能化程度不夠高問題
搭載Siri功能的iPhone4s一經(jīng)推出便在市場上掀起了不小的波瀾。
與以往不同的是,iPhone4s本身并沒有給廣大“果粉”帶來太多的驚喜,反而是嵌入iPhone4s的叫做“Siri”的語音助手火了起來。在iPhone4s還未推出之際,江湖中關(guān)于“Siri”的傳說和猜想就從未間斷過。
Siri是蘋果公司在其產(chǎn)品iPhone4S內(nèi)嵌入的一項語音控制功能,它可以令iPhone4S變身為一臺智能化機器人,利用Siri用戶可以通過手機讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等。
但是蘋果公司極力宣傳的這一功能并沒有得到廣大“果粉”們的認(rèn)可,紐約的一位iPhone4s用戶弗蘭克·法齊奧(FrankM.Fazio)甚至在加州聯(lián)邦法院提起訴訟,指控蘋果發(fā)布的廣告中對Siri功能的描述存在“誤導(dǎo)性和欺騙性信息”。
Siri的稍顯不“成熟”并沒有阻礙語音智能應(yīng)用盛行的趨勢,反而其商業(yè)上的成功使眾多國內(nèi)外商家蠢蠢欲動,摩拳擦掌起來。
國內(nèi)“類Siri”應(yīng)用大量涌現(xiàn)
據(jù)小編的不完全統(tǒng)計,目前在市場上出現(xiàn)的類Siri的語音助手已經(jīng)有十多種,這其中包括國外的iris、Assistant、Evi、cluzee等英文版軟件,也包括國內(nèi)應(yīng)用市場上出現(xiàn)的蟲洞、語點、智能360、Ciriis等中文版的語音助手。
實際上,Siri也并不是手機上出現(xiàn)的第一個智能語音助手。據(jù)悉,最早出現(xiàn)的語音助手是Speaktoit、Vlingo這類工具,但它們的弊端在于只能聽話,不能說話,這在一定程度上桎梏了他們的發(fā)展速度。被蘋果公司收購之后,Siri讓越來越多的智能手機用戶關(guān)注語音助手,它的興起讓人們真正意義上了解到語音助手這項技術(shù)。iPhone4S搭載的Siri則聽、說功能兼具,在一定程度上彌補了前者的不足,也讓人們開始關(guān)注這一領(lǐng)域的發(fā)展。
而市場上出現(xiàn)的類Siri應(yīng)用,給小編的一個最大的感受是智能化程度不夠高。對于一些關(guān)于日常的衣食住行或是相對簡單的問題,這些語音助手基本上都能夠給予相對明確的答復(fù),但是對于一些稍微復(fù)雜的問題,盡管與其交流的時候“雞同鴨講”得挺熱鬧,但通常給出的答案都是模糊兩可或者干脆打起了太極。
“你有男朋友嗎?”“目前智能360想的最多的不是個人問題,而是努力工作。”這是智能360給出的回答。同樣的問題蟲洞給出的回答則顯得很應(yīng)景,“男朋友??我說有的,至于你信不信,反正我是不信。”當(dāng)小編繼續(xù)問道:“美國為什么攻打伊拉克?”蟲洞給出的回答顯得有些裝傻賣萌:“不懂!嗚嗚嗚,我懷疑你是故意欺負(fù)我,我準(zhǔn)備告訴我媽媽。”
技術(shù)壁壘:語音識別+語義分析
對于中國用戶來講,Siri給國內(nèi)用戶帶來的最大困擾就是其不支持中文。據(jù)了解,目前Siri共支持四種語音,即英文、法文、德文和日文。其中英文部分只支持美國、英國和澳大利亞的口音,對于其他國家和地區(qū)的英語口音在識別上還存在困難。
有分析認(rèn)為,聲調(diào)和地方口音龐雜,或許是Siri中文版遲遲未推出的主要原因。一家國外媒體表示,對于語音識別來說,中文極具挑戰(zhàn)性,因為普通話只有400個單音節(jié)聲音,根據(jù)聲調(diào)予以區(qū)別,而且中國還擁有很多種方言和數(shù)不盡的地方口音。
國際巨頭蘋果的劣勢,對本土創(chuàng)業(yè)企業(yè)而言卻是機遇所在,是本土研發(fā)類似Siri產(chǎn)品的最大優(yōu)勢。
小編從智能360這款應(yīng)用的“機器人的聲音”設(shè)置一項了解到,單是機器人的聲音就有12中語音可供選擇,除了傳統(tǒng)意義上的男女普通話和男女童及老人普通話之外,其中還包括臺灣普通話、女生東北話、男聲河南話和女聲陜西話等多種帶有地方特色方言的各式普通話可供選擇。同類中蟲洞在這方面也表現(xiàn)優(yōu)異,它給提供的語音選擇多達(dá)18種,小編嘗試了一下,的確很精準(zhǔn)的抓住了各個地方的發(fā)音技巧和規(guī)律。這個小細(xì)節(jié)或許在一定程度上解釋了中文在韻律上的復(fù)雜性和Siri遲遲沒有推出中文版的原因吧。
此外,基于語音的人機交互智能應(yīng)用,構(gòu)成整個語音系統(tǒng)框架的是兩部分,即語音識別和語義識別。前者是詮釋說話的人說的內(nèi)容是什么,后者則是對話的內(nèi)容進(jìn)行進(jìn)一步的詮釋,要想達(dá)到理想的語音輸出效果,需要二者的完美配合才可以,否則答非所問的窘境仍然無法徹底避免。
通過對目前市面上出現(xiàn)的類Siri語音助手的試驗小編也驗證了“聽懂其音,不解其意”的現(xiàn)狀。這些Siri的效仿者普遍面臨一個共同的問題是,它通常能聽得懂你在說什么,卻不理解你在說什么。換而言之,其實就是它能夠識別到人的語音功能,卻無法準(zhǔn)確的詮釋語義的含義,這也讓很多用戶在用的時候經(jīng)常出現(xiàn)“所問非所答”的令人啼笑皆非的情景。要想達(dá)到理想的人機互動效果,語音和語義上的有機完美結(jié)合才是避免尷尬的最終要做的事情。
專家觀點:不適合創(chuàng)業(yè)公司?
對于國內(nèi)不少開發(fā)者開始拓土這一領(lǐng)域,創(chuàng)新工場CEO李開復(fù)(微博)在微博中稱:“中國Siri或安卓Siri的計劃不太適合創(chuàng)業(yè)公司,因為投入大、風(fēng)險高、技術(shù)難以實現(xiàn)。”對于語音控制這項技術(shù)研究多年為何依然有較大的屏障,李開復(fù)認(rèn)為:“過去30年,總說語音要改變世界,為什么沒有改?有幾個理由,第一是語音識別的精確度不夠,第二是語音應(yīng)用在哪里,靠一小批的語音專家拍腦袋想,不是辦法。”
著名天使投資人薛蠻子(微博)在微博評論:“中國Siri從頭開始創(chuàng)業(yè)難,但有積累有實力的中國企業(yè)還是存在的,關(guān)鍵是要有可持續(xù)發(fā)展性。”
對于語音控制的前景,微軟的創(chuàng)始人蓋茨也曾說過,五年后語音會改變世界。只是,這樣的論調(diào),蓋茨每隔五年都要再說一遍。
也許我們還不清楚實現(xiàn)真正意義上的人機交互還有多遠(yuǎn)的路要走,但是“調(diào)戲類Siri”已經(jīng)成為某類青年的調(diào)侃標(biāo)配,因為它們也的確夠萌、夠2、夠天真。
國內(nèi)類Siri精選:
1.智能360
[!--empirenews.page--]應(yīng)用名稱:智能360
平臺:Android
應(yīng)用類型:語音助手
優(yōu)勢:
1語音識別度較高,語義解析相對同類算是不錯。
2.數(shù)據(jù)庫涉獵較廣,對當(dāng)下的熱點話題能夠很快做出反應(yīng)。對于其不太熟悉的領(lǐng)域,它能很快從互聯(lián)網(wǎng)上查到相應(yīng)信息,呈現(xiàn)在用戶面前。
3.機器人聲音劃分較細(xì),共有12種帶有地方特色的普通話可供用戶選擇。
4.加入了換膚功能,用戶可以選擇自己喜歡的界面。
5.支持語音手寫雙重輸入方式。
改進(jìn):
1.對于稍快的語速識別程度較差,需要放慢說話速度。
2.語音識別的反應(yīng)速度有點慢。
3.需聯(lián)網(wǎng)才可以用,耗費流量。
2.訊飛語點
應(yīng)用名稱:訊飛語點
平臺:Android
應(yīng)用類別:語音助手
優(yōu)勢:
1.界面根據(jù)用戶的試用頻次分為六個板塊,用起來很方便,省去查找的煩惱。
2.語音識別度在同類里算是佼佼者,且反應(yīng)速度相對較快。
3.語音輸出清新自然,不生澀。
改進(jìn):
1.需要聯(lián)網(wǎng)才可以用,耗費流量。
2.需加強對稍微復(fù)雜的問題的把握度,避免雞同鴨語的窘境。
3.頁面顯示較呆板,可以適當(dāng)加些換膚功能。
3.蟲洞
應(yīng)用名稱:蟲洞
平臺:Android
應(yīng)用類別:語音助手
優(yōu)勢:
1.發(fā)音系統(tǒng)強大,共有18種帶有不同地域特點或年齡段的特色語音。
2.嵌入了當(dāng)下流行的LBS定位功能,接入互聯(lián)網(wǎng)后用戶可以很方便的定位到自己所在的地理位置,非常方便。
3.支持語音和手動輸入雙重輸入模式。
改進(jìn):
1.語音和語義準(zhǔn)確度的把握還有待提高和完善。
2.需聯(lián)網(wǎng)后才可以使用,耗費流量太大。
3.界面略顯單調(diào),可適當(dāng)增加換膚功能。