當(dāng)前位置:首頁(yè) > 充電吧 > 充電吧
[導(dǎo)讀]近來(lái)扎克伯格向記者公開(kāi)演示了他2016年的作品,一個(gè)類似Jarvis的人工智能助手,從記者的描述來(lái)看,這人工智能助手大部分時(shí)候還比較不錯(cuò),但在語(yǔ)音交互環(huán)節(jié)則不太理想。

近來(lái)扎克伯格向記者公開(kāi)演示了他2016年的作品,一個(gè)類似Jarvis的人工智能助手,從記者的描述來(lái)看,這人工智能助手大部分時(shí)候還比較不錯(cuò),但在語(yǔ)音交互環(huán)節(jié)則不太理想,對(duì)此媒體做了如下報(bào)道:

扎克伯格還建立了響應(yīng)語(yǔ)音指令的系統(tǒng),并通過(guò)定制iOS應(yīng)用控制。但這部分展示不太理想,他重復(fù)了四次指令才讓系統(tǒng)弄明白:天黑前不要開(kāi)燈。扎克伯格略顯尷尬地說(shuō):“喔,這應(yīng)該是它最失敗的表現(xiàn)了!”。

不過(guò),Jarvis播放音樂(lè)的展示還算成功。扎克伯格下令:“給我們放段音樂(lè)吧!”幾秒鐘后,大衛(wèi)·庫(kù)塔(David Guetta)的《Would I Lie to You》 開(kāi)始通過(guò)客廳揚(yáng)聲器響起來(lái)。他說(shuō)了兩次“把音量調(diào)高”后,系統(tǒng)照做無(wú)誤。最后,他同樣說(shuō)了兩次才讓系統(tǒng)停止播放。

這非常有意思,因?yàn)閺男侣剚?lái)看“天黑前不要開(kāi)燈”和“把音量調(diào)高”的失誤顯然都不是命令理解(語(yǔ)義)上有問(wèn)題,否則你說(shuō)八百遍Jarvis該不好使還是不好使。如果不是語(yǔ)義的問(wèn)題,那顯然就會(huì)和各大公司所宣稱的已經(jīng)被解決的問(wèn)題:語(yǔ)音識(shí)別有關(guān)。

標(biāo)準(zhǔn)環(huán)境解決≠真實(shí)效果好

關(guān)于語(yǔ)音識(shí)別的精度今年官方的報(bào)道一般是這樣的:

11月21日到23日,搜狗、百度和科大訊飛三家公司接連召開(kāi)了三場(chǎng)發(fā)布會(huì)向外界展示了自己在語(yǔ)音識(shí)別和機(jī)器翻譯等方面的最新進(jìn)展。值得注意的是,這三家公司幾乎在同一時(shí)段宣布了各自中文語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到了97%。

類似的報(bào)道也會(huì)發(fā)生在微軟等的身上,我們假設(shè)Facebook做的不是太差,水平也與此類似達(dá)到97%的準(zhǔn)確率。97%的具體含義是100個(gè)單詞上只有3個(gè)錯(cuò)誤(刪除、被替換、被插入),那么問(wèn)題就來(lái)了,如果真實(shí)環(huán)境里真的達(dá)到了這個(gè)精度,那么小扎的演示絕對(duì)不應(yīng)該是上面這個(gè)樣子。

那問(wèn)題出在那里?

關(guān)鍵問(wèn)題并不復(fù)雜,扎克伯格用手機(jī)當(dāng)做家庭里的終端,這樣距離稍微一遠(yuǎn),環(huán)境稍微嘈雜一點(diǎn),那再好的手機(jī)也沒(méi)辦法幫Jarvis聽(tīng)清楚你在說(shuō)什么。手機(jī)本身是設(shè)計(jì)給近場(chǎng)用的,手機(jī)上的語(yǔ)音識(shí)別基本也是給近場(chǎng)優(yōu)化過(guò)的,怎么也不能彌補(bǔ)遠(yuǎn)場(chǎng)上帶來(lái)的不適應(yīng)。

扎克伯格對(duì)此非常坦誠(chéng),他在博客這么寫道:

In the case of Jarvis, training an AI that you'll talk to at close range is also different from training a system you'll talk to from all the way across the room, like Echo. These systems are more specialized than it appears, and that implies we are further off from having general systems than it might seem.

原文:https://www.facebook.com/notes/mark-zuckerberg

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉