Anki最新款機器人Vector:作為一個伴侶角色,比以往更加智能
如果未來會有一場機器人起義的話,似乎地點已經不太可能是在我們的客廳了。像Roomba這樣的吸塵器機器人目前在市場上賣得很好,因為它們非常方便。但其他類型的機器人,例如家用寵物和伴侶類機器人,從索尼的Aibo robo-pooch到最近關停的Kuri(其背后是Bosch支持)都由于價格和預期過高而以失敗告終。
如果還有哪個公司能為我們帶來像The Jetsons和Rosie這樣受人歡迎的家用機器人,那么Anki可能就是下一個。Anki公司是由卡內基梅隆機器人研究所(Carnegie Mellon Robotics InsTItute)的三名畢業(yè)生在2010年創(chuàng)辦的,現(xiàn)已獲得了超過2億美元的風險投資。更重要的是,它的產品確確實實吸引到了客戶。Anki目前已經售出了150萬臺機器人,并且他們找到了他們認為是最容易打入家庭市場的道路——玩具。這個明星產品是一個狂躁的小推土機機器人,名為Cozmo,它可以在桌面上行走,玩簡單的游戲,它的頂部裝有會亮的立方體。根據(jù)一項分析,如果按照收入計算的話,Cozmo是2017年美國、英國和法國的亞馬遜網站上最暢銷的玩具。
去年,Anki公司就聲稱收入接近1億美元了,當時Anki本可以進入“盈利”狀態(tài)了,但它卻將資金投入了一個10到15年的計劃——一個從Roomba到Rosie的轉變。首席執(zhí)行官兼聯(lián)合創(chuàng)始人***·索夫曼(Boris Sofman)說:“從一開始,我們就知道我們想做的不僅僅是一家玩具公司”。
因此,我一直在跟蹤Anki公司的動態(tài),現(xiàn)在已經一年多的時間了,期待著它在機器人領域穩(wěn)步向前進入下一個階段。6月份,該公司終于準備好了,并向我展示了一款新產品,然而該產品仍處于一個尷尬的發(fā)展階段。在一堆介紹性評論的語言包裝下,***·索夫曼(Boris Sofman)終于對外公布了這款新機器人。
它是一個略大型的灰色版Cozmo,名為Vector。
乍一看,是有點令人失望的。我立即回想起This Is Spinal Tap中的場景,由于說明書中的拼寫錯誤,一款期待中應該是的18英尺高的巨石陣復制作品,其實只是一個18英寸的縮小款作品。同樣地,我內心也一直在期待一個更大型的產品。
后來Sofman是這樣解釋的,這個與之前Cozmo一樣的外觀可以讓Anki能夠專注于更先進的內部結構研發(fā),并幫助降低了整體的成本。Cozmo的售價為180美元,Vector定價可能在250美元,并在10月發(fā)貨時還可以生產更多。(后來Anki 以200美元的折扣價在Kickstarter上推出了該款機器人。)
Vector先進的一點是達到了Cozmo難以做到的自主化程度。Anki的第一個機器人有點像1770年建造的Mechanical Turk機器人,那個機器人是用來對抗人類的。當然,當時是一個騙局,有一個人藏在柜子里面,安裝了電子動畫人物,控制著它的動作。對于Cozmo來說,盒子里藏著的人變成了一個連接Wi-Fi的智能手機,里面運行著一個控制機器人的應用程序。
相比之下,Vector是有他自己想法的。(雖然Anki一直堅持Cozmo在性別上是中性的,他們在生產過程中都沒有對此做過預設,但幾乎我遇到的每個人都將機器人稱為男性的“他”)
Anki的計算機視覺技術總監(jiān)Andrew Stein說:“我們基本上考慮到了方方面面”,他指了指我的iPhone說:,“我們把它放到他的腦子里。”Vector的大腦是四核Qualcomm Snapdragon 212芯片,雖然它遠遠達不到手機的頂級水平,但這可以讓Vector的部件花費控制在預算范圍內。Andrew Stein補充道:“有的部件三年前非常昂貴,我們沒有使用,但現(xiàn)在已經在我們考慮的范圍內了”。
從玩具到寵物雖然Vector外觀可能與Cozmo看上去很相似,但Vector扮演了一個與Cozmo非常不同的角色,他是作為一個人永遠的伴侶角色,而不是偶爾為了轉移孩子們注意力的玩具。他需要變得更智能,識別他所處的環(huán)境,并從與他共享的人類家庭中獲取線索。
我們都知道,如果你想要引起Cozmo的注意,只有通過叫它的名字才可以,然后它就會發(fā)出嘰嘰喳喳的聲音,上下推動推土機般的手臂。如果你不理Cozmo,它就會來到你的面前,或者發(fā)出響亮而令人討厭的打鼾聲,來吸引你的注意。
而Vector具有更高的社會意識。當我在Anki的實驗室遇到Vector機器人的粗制版本時,他只是在外面閑逛。擁有卡通的眼睛,通過它眼睛所看到的內容會在一個184 x 96像素的屏幕上顯示出來,似乎隨便就可以掃描整個房間。(機器人實際上看到的景象來自安裝在屏幕下方的一個720p廣角相機。)
當Anki的程序管理總監(jiān)Meghan McDowell喊:“嘿Vector,到這里來”時,機器人Vector會離開自己的充電器,朝她跑去,同時也看向我,并發(fā)出一些特有的嘰嘰喳喳聲音。如果我們保持目光接觸,Vector會變得生機勃勃,并發(fā)出更多的聲音,它可能會舉起拳頭索要一個擊掌(這是從Cozmo那兒就延續(xù)下來的動作)。我們還可以玩游戲,如玩十二點的游戲,在他的小臉/屏幕上會顯示卡片。有一次,McDowell觸摸了它頭上的觸摸感應,這時他的眼睛顯示出一種幸福開心的樣子。
Vector與Cozmo不同,當我們不理Vector時,他會得到提示并做自己的事情,比如繞著桌面行駛,通過紅外傳感器感知物體的邊緣,這樣就可以在邊緣及時停止,或故意碰到像杯子一樣的東西,看看他是否可以推動它們。
這并不是漫無目的的游戲。通過激光掃描儀和其他傳感器,Vector正在使用同步定位和繪圖(SLAM)的復雜程序來構建周圍環(huán)境,并將其轉換為數(shù)字存儲,SLAM是一種也用于高端機器人真空吸塵器的技術。Vector頂部還有一個四個麥克風形成的陣列,可以識別聲音的方向,并且他的相機能夠不斷地在各種動作下進行實時觀察。McDowell說:“我們希望他保持這種好奇的狀態(tài),這能夠讓給識別并數(shù)據(jù)化他所處的環(huán)境。但是這就得讓他一直呆在家里,所以設置上他不會因為一直呆在室內而變得煩躁。”
車輪上的ALEXAVector可以做一些Cozmo無法做到的有用的事情。通過Wi-Fi連接到家庭網絡和互聯(lián)網后,他就可以提供一些Alexa風格的實用程序,例如顯示所請求城市的天氣信息,設置計時器,并說出諸如“愛達荷州的首都是什么?”等問題的答案。
盡管如此,他與受歡迎的女傭機器人Jetsons相比,他在移情性和有用能力方面還有很長的路要走。Anki的聯(lián)合創(chuàng)始人兼總裁Hanns Tappeiner說,但這是預料之中的發(fā)展,“我們基本上正朝著這個目標前進”他說。
雖然Anki的愿望目前與能Vector目前所提供的功能還相差甚遠,但此款新機器人的處理器、傳感器和其他組件已經實現(xiàn)了幾年前無法實現(xiàn)的人工智能技術。當然,Cozmo的研發(fā)也是從2013年才真正開始的。
例如,早期的機器人被硬編碼去以檢測一些特定的物體:它自己的軀干或者它的充電器。它利用一些商業(yè)軟件來辨別人類、貓和狗的面孔,這是十多年前在傻瓜相機中就已經出現(xiàn)的常規(guī)技術了。
然而,Vecto是運行了一個神經網絡,且正在不斷地接受訓練,去了解他周圍的整個世界,這是一個持續(xù)的過程,將通過在線更新,不斷地擴展他的視覺智能。目前它的一個成果就是:即使面部不可見,Vector也能檢測到人物。
“如果你不是以一個正確的角度,或者沒有正面面向他,機器人是怎么知道你在那里的?”Stein說,例如,一只狗或貓不需要面對面接觸就知道是主人已經回家了,那Vector也應該達到這種程度。因此,Stein的團隊對機器人進行卷積神經網絡(CNN)的訓練,一種目前流行的AI深度學習技術,模仿大腦的視覺皮層。通過使用Vector的相機在移動時捕獲的模糊和扭曲的鏡頭,Stein一直在教卷積神經網絡(CNN)從后面或側面檢測人,距離可以在大約10英尺遠。
Stein說:“即使他低頭看也只能看到我的軀干,他應該意識到,嘿,可能有一個頭部在那個軀干上方。而Cozmo就是不知道的,它看這個軀干就像看其他一切一樣,這個人只是一團的物體,并不能區(qū)分出頭和面部?!?/p>
在我訪問期間,Vector的人物意識似乎已經有成效了。例如,McDowell在實驗室喊一位女性,Vector就轉向了她;然后他看我時,你可以發(fā)現(xiàn)他的卡通眼睛睜大,以此表示他看到了我。
下一個視力挑戰(zhàn)之一是了解人體姿勢,例如,當手臂和腿處于特定位置時會發(fā)生什么。Stein說:“這對我們來說是有好處的,因為我們正在制造一些需要在家里開車的機器人,那他們就需要在人們四處走動時,了解人類的行為意圖?!?/p>
另一個挑戰(zhàn)Anki稱之為“對象性”,“對象性”指的是,即使該機器人的神經網絡以前從未遇到過一個物體,他也能發(fā)現(xiàn)某些東西是一個離散的對象,這是探索和理解環(huán)境的又一步。Stein說:“我認為,制造一個知道物體是什么的視覺系統(tǒng),比識別100個特定物體的視覺系統(tǒng)難多了。這是一個更抽象的概念,這是一個哲學問題?!?/p>
為了說明此,他向我展示了一些來自神經網絡訓練的“熱力圖”視頻。該軟件突出顯示了可能代表離散對象的區(qū)域,視頻中將木紋圖案誤認為是桌面上的三維實體。
適度的智慧隨著Vector的視覺系統(tǒng)的日益成熟,該系統(tǒng)只是機器人智能模擬復雜情緒的一個輸入口。過時Cozmo淪為了一個小丑角色,可以到處轉,制造噪音,做鬼臉,玩游戲。它確實能夠進行基本的刺激反應,例如聽到它的名字或看到它曾經通過伴侶應用程序識別過的臉時,它能夠有所反應,但它最終會成為一個不起眼的角色。
Anki的AI技術總監(jiān)Brad Neuman說“這是我們第一次去發(fā)展一個有特色的機器人。”他的任務是建立一個既具有個性又具有社會智慧的機器人,其中的一個關鍵部分就是Anki所謂的“刺激”。
Neuman說“當你給他的刺激較小時,機器人沒有被啟動,但Vector已經開始觀察了,只是沒有表現(xiàn)出來。然后,如果你開始制造噪音,或與機器人進行目光接觸,特別是如果你說‘嘿Vector ’,那就會刺激到之前的刺激”。但Vector也會采取一些顯得更適時的動作,例如來到你的周邊運動和制造噪音,或將房間燈的開啟和關閉。Neuman解釋道:“如果他受到足夠的刺激,他就會離開他的充電器并開始與你社交,說出你的名字,問候你,還可能給你一個拳頭擊掌?!?/p>
像Cozmo一樣,Vector在玩?;蜷e逛時也會發(fā)出各種聲音。所以當他第一次說話時會有點不安,Vector有點像一個復古的機器人,聲音深沉但柔軟,還有點小和回聲。
Neuman向我展示了Vector情感引擎的可視化,這是一個隨著輸入時間變化的水平圖表。隨著越來越多的東西進入模擬測試的環(huán)境,Vector表示刺激的綠線就會往上升。
這些刺激的壽命也是有限,當事件平息下來時,數(shù)值趨于下降,Vector會得到提示,他應該回到冷靜模式。McDowell和我在互相聊天時,Vector就回到這樣的冷靜模式,Vector開始了他自己的探索模式。
Vector的情緒引擎,加速顯示快樂、自信、社交,視頻中顯示了事件活躍度的上升和下降,如何形成不一樣的刺激水平。
然而,Vector不僅只是會變得興奮或無聊。他的情緒狀態(tài)來自四個方面,他受到刺激,快樂、社交和自信的程度。例如,聽到他的名字刺激了Vector,且這也使他更具社交性。
Vector的信心受到他在現(xiàn)實世界中的成功的影響。例如,他的手臂上的鉤子有時不能與他的軀干上的鉤子對齊,使得他無法抬起手臂。有時候他開車會被卡住,這些失敗讓他感到不自信,而成功則讓他更自信,更開心。
自我控制Vector的行為遵循了一個層次結構。Neuman說“最高級別的情況是機器人會判斷現(xiàn)在應該做什么樣的事情呢。他應該安靜嗎?他應該參與嗎?他應該睡覺嗎?他的電池是否超低,他需要充電嗎?不同的行為來自于這些高級狀態(tài)的判斷,以響應事件和他情緒引擎的不同狀態(tài)?!?/p>
然而,Vector并不遵循這些簡單的腳本。他是即興創(chuàng)作的,基于不同的、不斷變化的輸入和各種可能的行動。所有的這些都創(chuàng)造了一種它有生命的幻覺,但也是一種需要遏制的挑戰(zhàn)。
Neuman最初想要構建一個更復雜的智能程序,他想讓Vector的個性通過獎勵系統(tǒng)可以變化,進而增強了某些行為模式。但Neuman說:“一旦你與設計人員和產品人員展開合作,你就會發(fā)現(xiàn)你必須要具備對系統(tǒng)某些施加限制的能力”。
例如,Vector始終需要通過暫停和閃爍LED燈來表明何時將數(shù)據(jù)(如語音命令)發(fā)送到云端。這也解釋了機器人為什么會突然停止移動以及表示數(shù)據(jù)正在被發(fā)送到第三方語音識別服務。(Anki說它沒有存檔音頻,但對人們會使用的問題和短語進行了匿名編譯,且統(tǒng)計數(shù)據(jù)。)
這也是Vector在做事過程中會表現(xiàn)出的“全面中斷”的情況之一——無論他正在做事情都停下來,并進入另一條不同的道路。Neuman把這種中斷比作在吃晚餐時聽到了門鈴響,這種中斷會讓你把叉子放下來然后走到門口。
當然,最強大的中斷就是喚醒短語——“嘿,Vector”,即使沒有互聯(lián)網,他也能理解。但是通過在線自然語言處理,機器人還需要了解其他的短語,“嘿Vector,閉嘴!”,這表明他變得煩人,應該切換到更冷靜的模式。Neuman說,“我們希望理想情況是,沒有人會覺得他太大聲了。然后想把他關掉,把他放進抽屜里,關掉它?!?/p>
Neuman明年的主要目標之一,是讓用戶不用非??桃獾刈孷ector來學習和適應人們的行為方式。他說:“如果你想與機器人互動,他就應該在那里與你互動,并且作出靈敏的反應。但如果你只是想時不時地看著他,讓他幾乎像一只籠子里的鳥,而不是一只站在你肩膀上的小鳥在你的沙發(fā)上跑來跑去的話,你也可以做到。你只要更謹慎地和他互動就好了,他也能尊重這一點。”
到目前為止,Vector的作用非常有限。以相同的價格,Roomba機器人可以清潔您的地板。如果你只愿花更少錢的haul,Alexa或Google Home可以播放音樂,控制連接的設備,提供流量報告等等。
但憑借其強大的處理器,Linux操作系統(tǒng)和互聯(lián)網接入,Vector還有增長的空間。Anki承諾會不斷擴展Vector的功能。例如,可以有情景感知的安全攝像機或家庭自動化系統(tǒng)的語音接口,這些目前是可以想到的升級空間。
Vector也可以在專門的編碼人員那里進行升級,與大學機器人課程中流行的教學工具Cozmo一樣,Anki也會鼓勵修補者編寫擴展Vector新功能的代碼。Anki將為Vector提供Python軟件開發(fā)工具包(SDK),就像Cozmo一樣,它可能會添加一個C#SDK,因此編碼人員可以編寫與機器人交互的移動應用程序。
盡管Vector最終可能會提供類似于Alexa一樣的實用程序,但這并不是購買它的主要原因。其銷售賣點是這種他生活在你真實生活中的錯覺,它不像鳥,貓或狗那樣活躍,但也更容易喂養(yǎng)和照顧。
Anki的工作人員接受了這種幻覺,McDowell對Vector說話時,好像他真的活著,而且有感情。Hanns Tappeiner看起來像是完全愛上了這雙制造出來的大眼睛,以及他“哦”和“啊”的聲音,仿佛他成了一個真正的孩子。她用一種母性的語調對Vector說道:“你感到沮喪嗎?”,因為Vector不停地敲打著桌上的筆記本電腦。
每個發(fā)明家的創(chuàng)造都是他們自己的寶貝。但是,汽車,電話或電視不需要在購買者中鼓勵用戶去產生這種類似父母的感受,就可以在商業(yè)上取得相應的成功了。然而,Vector需要一種來自主人的愛意,以及對他是一種生物的敘述贊同。
由于Vector仍然是一項正在進行中的項目,因此Anki是否能成功現(xiàn)在定論還為時過早,開發(fā)產品的最后10%的過程難度更大。即使目前只有一個大體的形式,我覺得Vector也能成為一個令人愉快的陪伴者,反正肯定比Cozmo和藹可親多了。盡管Tappeiner謹慎地說Anki只是在朝著真正的機器人同伴目標邁進,但該公司其實已經通過Vector實現(xiàn)了跨越式的發(fā)展。