什么樣的智能助手才是我們真正想要的？

時(shí)間：2017-02-21 10:33:01

關(guān)鍵字：智能助手智能工具

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]很多人都非常向往科幻作品中未來的日常生活場(chǎng)景 —— 人工智能盡心盡力服務(wù)人類，任何事情只要隨便招呼一聲，機(jī)器系統(tǒng)都會(huì)馬上替你完成。當(dāng)時(shí)我們覺得，這樣的生活實(shí)在是太輕松，太炫酷了。不過當(dāng)這樣的技術(shù) —— 人工智能和數(shù)字助手 —— 開始離我們?cè)絹碓浇臅r(shí)候，大家倒是冷淡了起來。

很多人都非常向往科幻作品中未來的日常生活場(chǎng)景 —— 人工智能盡心盡力服務(wù)人類，任何事情只要隨便招呼一聲，機(jī)器系統(tǒng)都會(huì)馬上替你完成。當(dāng)時(shí)我們覺得，這樣的生活實(shí)在是太輕松，太炫酷了。不過當(dāng)這樣的技術(shù) —— 人工智能和數(shù)字助手 —— 開始離我們?cè)絹碓浇臅r(shí)候，大家倒是冷淡了起來。

其實(shí)我們無法接受人工智能和數(shù)字助手的原因也很簡(jiǎn)單，一是“麻煩”，二是“尷尬”。

早前的計(jì)算機(jī)無法和人進(jìn)行自然流暢的交流溝通，因此我們只能夠用機(jī)器能理解的交互語言去讓它聽從我們的指令。從字符命令到鍵鼠在圖形界面上的菜單操作，再到現(xiàn)在的觸摸圖標(biāo)，都是如此。雖說是個(gè)不得已而為之的解決方案，但這種思路一直發(fā)展了那么多年，經(jīng)過了無數(shù)次優(yōu)化，人們不僅已經(jīng)習(xí)慣了這種模式，而且十分享受它的精確和快速。

與此相比，語音助手需要你用盡可能規(guī)整的語言去告訴它該怎么做，它還有一定的反應(yīng)時(shí)間，還要加上各種各樣的出錯(cuò)可能性。那么，人們自然也就會(huì)喜歡“該是什么就是什么”的傳統(tǒng)交互了。

即使在技術(shù)的發(fā)展下，出錯(cuò)率的問題得到了有效的控制，多數(shù)人也不會(huì)選擇在公共場(chǎng)合中使用數(shù)字助手，其原因自然是因?yàn)?ldquo;尷尬”了。想象一下現(xiàn)在飯局里一群人低頭玩手機(jī)的場(chǎng)景，比起這個(gè)，大家七嘴八舌地對(duì)手機(jī)下指令似乎要詭異得多。即使是獨(dú)身一人在家，肯定也有相當(dāng)一部分人更喜歡默默進(jìn)行操作，而非什么都要經(jīng)過一遍自己的嘴。

業(yè)界的想法

微軟全球執(zhí)行副總裁，這個(gè)軟件巨頭在人工智能領(lǐng)域的領(lǐng)頭人物沈向洋提出了一個(gè)有趣的觀點(diǎn)：人工智能需要的是情感，它不是工具。

這個(gè)說法可能會(huì)讓人們聯(lián)想到電影《機(jī)械公敵》里的那個(gè)機(jī)器人，但沈向洋口中的情感似乎還沒有到那個(gè)地步。他表示，合格的人工智能助手在用戶詢問天氣之后，給出的要不僅僅是具體的天氣信息，它還應(yīng)該能夠提醒用戶多穿衣服、帶上傘。換句話說，人工智能要能理解人類的情感。

沈向洋表示，人類之間的對(duì)話有一個(gè)特點(diǎn)是，并沒有每一句話都有意義，在那些少數(shù)的任務(wù)性話語外，摻雜有許多許多的閑話和廢話。微軟希望的是在這種類似的閑聊中，通過一級(jí)一級(jí)的逐步分析來判斷用戶的情緒和他們真正的需求，然后完成任務(wù)。

正因?yàn)橛羞@樣的野心，沈向洋并不掩飾自己對(duì) AlphaGo 的“吐槽”。他表示，盡管 AlphaGo 的出現(xiàn)是一個(gè)了不起的成就，但它的作用太單一，很難有商業(yè)化前景。這位微軟高管的意思自然不是指 AlphaGo 只會(huì)下圍棋，而是說它僅僅是一種弱人工智能，只能憑借篩選過濾求最優(yōu)解的能力進(jìn)行大數(shù)據(jù)分析，而不能真正走進(jìn)千萬家。

我們想要的助手

正如上文所說，數(shù)字助手要能真正得到人們的喜愛，“自然”和“善解人意”是不可或缺的。Siri 團(tuán)隊(duì)核心成員離開蘋果后開發(fā)了 Viv 助手，開發(fā)者表示它未來能夠僅憑用戶一句“我醉了”就知道主動(dòng)叫車將他送回家。這，距離我們理想中的人工智能和數(shù)字助手開始接近了。

有一種所謂的“恐怖谷效應(yīng)”，指的是當(dāng)一個(gè)擬人物體變得越來越像人的時(shí)候，人類對(duì)它的好感度會(huì)突然從一個(gè)高點(diǎn)跌至感到詭異可怕的程度。擬人物體那種很像人但明顯不是人的狀態(tài)給人們帶來難以言說的恐懼。這種理論挪用到數(shù)字助手領(lǐng)域，它現(xiàn)在那種試圖模擬人類卻一點(diǎn)都不自然的互動(dòng)方式讓人們感到無比生硬和別扭。與此相比，反倒是人去遷就機(jī)器的那種交互方式因?yàn)楹腿巳私换ネ耆灰粯?，不?huì)給我們別扭的感覺。

因此，數(shù)字助手需要做到的不僅僅只是聽懂人類給它的清晰指令，它還需要學(xué)會(huì)理解人類的情緒，做到在人類那種特有的模糊混亂的表述方式里正確理解其需求，這樣才能夠達(dá)到初步被人類所接受的地步。

那么人工智能要嘗試去理解的就不僅僅是話語了，還有用戶的身體狀態(tài)、姿勢(shì)、步態(tài)、面部表情、語氣等信息。此外，要理解人類一段話中的上下文聯(lián)系，人工智能還需要去學(xué)習(xí)更多的人類對(duì)話，把握那些隱藏的東西。還有一點(diǎn)很重要，即使是人和人之間也不總是一直在用語言提出需求的，那么支持一定的文字輸入、手勢(shì)識(shí)別、隱蔽的小動(dòng)作指令，這些都很重要。

未來可期

事實(shí)上沈向洋對(duì)人工智能技術(shù)的發(fā)展相當(dāng)樂觀，他認(rèn)為只需 5 年計(jì)算機(jī)就能獲得比人類更全面的語言理解能力，只需 10 年其視覺處理能力就將勝過人類。

人工智能真的是計(jì)算平臺(tái)的未來嗎?應(yīng)該說答案是肯定的。事實(shí)上人類并不排斥和人工智能交流，否則微軟小冰這個(gè)機(jī)器人在國(guó)內(nèi)也就不會(huì)那么人氣高漲了。在純粹的“調(diào)戲”之外，我們也確實(shí)并不討厭和具有一定信息處理和回饋能力的機(jī)器人交流。電影《鋼鐵俠》里斯塔克和智能管家賈維斯閑聊式的交互，只要技術(shù)能夠做到這一點(diǎn)，那么尷尬生硬感就會(huì)消失 —— 哪怕對(duì)方其實(shí)本質(zhì)上并不能明白你的情感，只是深度學(xué)習(xí)的體現(xiàn)。

可能會(huì)有人擔(dān)憂人工智能給人類帶來的威脅，因?yàn)闆]有感情的機(jī)器人會(huì)選擇的完成任務(wù)的方式和人類預(yù)期的可能并不一樣。關(guān)于這一點(diǎn)，我們就必須得把控好給予它們的權(quán)限范圍。