什么樣的智能助手才是我們真正想要的?
很多人都非常向往科幻作品中未來(lái)的日常生活場(chǎng)景 —— 人工智能盡心盡力服務(wù)人類,任何事情只要隨便招呼一聲,機(jī)器系統(tǒng)都會(huì)馬上替你完成。當(dāng)時(shí)我們覺(jué)得,這樣的生活實(shí)在是太輕松,太炫酷了。不過(guò)當(dāng)這樣的技術(shù) —— 人工智能和數(shù)字助手 —— 開(kāi)始離我們?cè)絹?lái)越近的時(shí)候,大家倒是冷淡了起來(lái)。
其實(shí)我們無(wú)法接受人工智能和數(shù)字助手的原因也很簡(jiǎn)單,一是“麻煩”,二是“尷尬”。
早前的計(jì)算機(jī)無(wú)法和人進(jìn)行自然流暢的交流溝通,因此我們只能夠用機(jī)器能理解的交互語(yǔ)言去讓它聽(tīng)從我們的指令。從字符命令到鍵鼠在圖形界面上的菜單操作,再到現(xiàn)在的觸摸圖標(biāo),都是如此。雖說(shuō)是個(gè)不得已而為之的解決方案,但這種思路一直發(fā)展了那么多年,經(jīng)過(guò)了無(wú)數(shù)次優(yōu)化,人們不僅已經(jīng)習(xí)慣了這種模式,而且十分享受它的精確和快速。
與此相比,語(yǔ)音助手需要你用盡可能規(guī)整的語(yǔ)言去告訴它該怎么做,它還有一定的反應(yīng)時(shí)間,還要加上各種各樣的出錯(cuò)可能性。那么,人們自然也就會(huì)喜歡“該是什么就是什么”的傳統(tǒng)交互了。
即使在技術(shù)的發(fā)展下,出錯(cuò)率的問(wèn)題得到了有效的控制,多數(shù)人也不會(huì)選擇在公共場(chǎng)合中使用數(shù)字助手,其原因自然是因?yàn)?ldquo;尷尬”了。想象一下現(xiàn)在飯局里一群人低頭玩手機(jī)的場(chǎng)景,比起這個(gè),大家七嘴八舌地對(duì)手機(jī)下指令似乎要詭異得多。即使是獨(dú)身一人在家,肯定也有相當(dāng)一部分人更喜歡默默進(jìn)行操作,而非什么都要經(jīng)過(guò)一遍自己的嘴。
業(yè)界的想法
微軟全球執(zhí)行副總裁,這個(gè)軟件巨頭在人工智能領(lǐng)域的領(lǐng)頭人物沈向洋提出了一個(gè)有趣的觀點(diǎn):人工智能需要的是情感,它不是工具。
這個(gè)說(shuō)法可能會(huì)讓人們聯(lián)想到電影《機(jī)械公敵》里的那個(gè)機(jī)器人,但沈向洋口中的情感似乎還沒(méi)有到那個(gè)地步。他表示,合格的人工智能助手在用戶詢問(wèn)天氣之后,給出的要不僅僅是具體的天氣信息,它還應(yīng)該能夠提醒用戶多穿衣服、帶上傘。換句話說(shuō),人工智能要能理解人類的情感。
沈向洋表示,人類之間的對(duì)話有一個(gè)特點(diǎn)是,并沒(méi)有每一句話都有意義,在那些少數(shù)的任務(wù)性話語(yǔ)外,摻雜有許多許多的閑話和廢話。微軟希望的是在這種類似的閑聊中,通過(guò)一級(jí)一級(jí)的逐步分析來(lái)判斷用戶的情緒和他們真正的需求,然后完成任務(wù)。
正因?yàn)橛羞@樣的野心,沈向洋并不掩飾自己對(duì) AlphaGo 的“吐槽”。他表示,盡管 AlphaGo 的出現(xiàn)是一個(gè)了不起的成就,但它的作用太單一,很難有商業(yè)化前景。這位微軟高管的意思自然不是指 AlphaGo 只會(huì)下圍棋,而是說(shuō)它僅僅是一種弱人工智能,只能憑借篩選過(guò)濾求最優(yōu)解的能力進(jìn)行大數(shù)據(jù)分析,而不能真正走進(jìn)千萬(wàn)家。
我們想要的助手
正如上文所說(shuō),數(shù)字助手要能真正得到人們的喜愛(ài),“自然”和“善解人意”是不可或缺的。Siri 團(tuán)隊(duì)核心成員離開(kāi)蘋果后開(kāi)發(fā)了 Viv 助手,開(kāi)發(fā)者表示它未來(lái)能夠僅憑用戶一句“我醉了”就知道主動(dòng)叫車將他送回家。這,距離我們理想中的人工智能和數(shù)字助手開(kāi)始接近了。
有一種所謂的“恐怖谷效應(yīng)”,指的是當(dāng)一個(gè)擬人物體變得越來(lái)越像人的時(shí)候,人類對(duì)它的好感度會(huì)突然從一個(gè)高點(diǎn)跌至感到詭異可怕的程度。擬人物體那種很像人但明顯不是人的狀態(tài)給人們帶來(lái)難以言說(shuō)的恐懼。這種理論挪用到數(shù)字助手領(lǐng)域,它現(xiàn)在那種試圖模擬人類卻一點(diǎn)都不自然的互動(dòng)方式讓人們感到無(wú)比生硬和別扭。與此相比,反倒是人去遷就機(jī)器的那種交互方式因?yàn)楹腿巳私换ネ耆灰粯?,不?huì)給我們別扭的感覺(jué)。
因此,數(shù)字助手需要做到的不僅僅只是聽(tīng)懂人類給它的清晰指令,它還需要學(xué)會(huì)理解人類的情緒,做到在人類那種特有的模糊混亂的表述方式里正確理解其需求,這樣才能夠達(dá)到初步被人類所接受的地步。
那么人工智能要嘗試去理解的就不僅僅是話語(yǔ)了,還有用戶的身體狀態(tài)、姿勢(shì)、步態(tài)、面部表情、語(yǔ)氣等信息。此外,要理解人類一段話中的上下文聯(lián)系,人工智能還需要去學(xué)習(xí)更多的人類對(duì)話,把握那些隱藏的東西。還有一點(diǎn)很重要,即使是人和人之間也不總是一直在用語(yǔ)言提出需求的,那么支持一定的文字輸入、手勢(shì)識(shí)別、隱蔽的小動(dòng)作指令,這些都很重要。
未來(lái)可期
事實(shí)上沈向洋對(duì)人工智能技術(shù)的發(fā)展相當(dāng)樂(lè)觀,他認(rèn)為只需 5 年計(jì)算機(jī)就能獲得比人類更全面的語(yǔ)言理解能力,只需 10 年其視覺(jué)處理能力就將勝過(guò)人類。
人工智能真的是計(jì)算平臺(tái)的未來(lái)嗎?應(yīng)該說(shuō)答案是肯定的。事實(shí)上人類并不排斥和人工智能交流,否則微軟小冰這個(gè)機(jī)器人在國(guó)內(nèi)也就不會(huì)那么人氣高漲了。在純粹的“調(diào)戲”之外,我們也確實(shí)并不討厭和具有一定信息處理和回饋能力的機(jī)器人交流。電影《鋼鐵俠》里斯塔克和智能管家賈維斯閑聊式的交互,只要技術(shù)能夠做到這一點(diǎn),那么尷尬生硬感就會(huì)消失 —— 哪怕對(duì)方其實(shí)本質(zhì)上并不能明白你的情感,只是深度學(xué)習(xí)的體現(xiàn)。
可能會(huì)有人擔(dān)憂人工智能給人類帶來(lái)的威脅,因?yàn)闆](méi)有感情的機(jī)器人會(huì)選擇的完成任務(wù)的方式和人類預(yù)期的可能并不一樣。關(guān)于這一點(diǎn),我們就必須得把控好給予它們的權(quán)限范圍。