deepmind訓練出人腦模式AI 學會像哺乳動物那樣抄近路
【導讀】:谷歌收購的deepmind可謂是性價比超高了,AlphaGo就是deepmind的杰作,不過這都是過去式了。今日凌晨deepmind公布新突破,訓練出人腦模式的AI,學會像哺乳動物那樣抄近路。
谷歌的deepmind英國團隊在世界頂級學術(shù)雜志《自然》上發(fā)表論文稱,其最新研發(fā)出的一個人工智能程序具有類似哺乳動物一樣的尋路能力,非常類似大腦中網(wǎng)格細胞的工作原理。
神秘的網(wǎng)格細胞:大腦內(nèi)置GPS從家出發(fā)到新的地點,再原路返回,從中選擇盡可能的捷徑,這是絕大多數(shù)動物都能勝任的簡單任務。然而,大腦這種本能的導航機制尚未被完全理解。
科學家們在動物和人類大腦中找到了三種跟認路相關(guān)的細胞,分別是位置細胞、方向細胞和網(wǎng)格細胞。
位置細胞能在主體到達特定地點時放電,從而賦予對過往地點的記憶;方向細胞能感應前進的方向;網(wǎng)格細胞則是最神秘的一種:它們能將整個空間環(huán)境劃分成蜂窩狀的六邊形網(wǎng)格,仿佛地圖上的坐標系。
發(fā)現(xiàn)網(wǎng)格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學或醫(yī)學獎。不過,網(wǎng)格細胞僅僅是在空間環(huán)境中提供GPS定位服務嗎?一些科學家猜測,它們也會參與矢量計算,輔助動物規(guī)劃路徑。
人工神經(jīng)網(wǎng)絡中自動出現(xiàn)類似結(jié)構(gòu)DeepMind團隊決定用人工神經(jīng)網(wǎng)絡檢驗上述猜想。人工神經(jīng)網(wǎng)絡是一種利用多層處理模擬大腦神經(jīng)網(wǎng)絡的運算結(jié)構(gòu)。團隊首先用深度學習算法訓練神經(jīng)網(wǎng)絡學習哺乳動物的覓食運動路徑,利用線速度、角速度等信號在視覺環(huán)境中進行定位。
研究人員隨后發(fā)現(xiàn),一種類似于網(wǎng)格細胞活動特征的結(jié)構(gòu)自動誕生了!在此前的訓練中,研究人員并未刻意引導神經(jīng)網(wǎng)絡產(chǎn)生此種結(jié)構(gòu)。
人工神經(jīng)網(wǎng)絡中自動出現(xiàn)了與大鼠網(wǎng)格細胞(下)類似的網(wǎng)格結(jié)構(gòu)(上)
這再次顯示了深度學習的可喜又可畏之處:這是一種通過大量匹配的輸入和輸出值訓練機器自我摸索的算法,最后得到的機器邏輯是不為人知的黑匣子。正如AlphaGo自動領悟了人類千年棋史上從所未見的“天外飛仙”棋招,這次的神經(jīng)網(wǎng)絡也自動出現(xiàn)了令人驚喜的結(jié)構(gòu)。
迷宮尋路DeepMind團隊隨后利用強化學習檢驗這種網(wǎng)格結(jié)構(gòu)是否能夠進行矢量導航。強化學習被普遍用于訓練游戲AI,人類告訴AI一種游戲的得分獎懲機制,但卻不教授游戲方法,由AI在反復進行游戲、努力爭取更高分的過程中自我進化。后期的AlphaGo就完全擯棄了人類棋譜經(jīng)驗,在純粹的自我對弈中從零進化到更強版本。
研究人員將之前自動出現(xiàn)的網(wǎng)格結(jié)構(gòu)與一個更大型的神經(jīng)網(wǎng)絡架構(gòu)結(jié)合成了人工智能體,置于虛擬現(xiàn)實的游戲環(huán)境中。經(jīng)歷強化學習后,該人工智能在游戲迷宮中向目的地前進的導航能力超越了一般人,達到了職業(yè)游戲玩家水平。它能像哺乳動物一樣尋找新路線和抄近路。
人工智能學習在迷宮中抄近路
最關(guān)鍵的是,當研究人員“靜默”原來的網(wǎng)格結(jié)構(gòu)后,人工智能體的導航能力就會變?nèi)?,判斷目標的距離和方向都更不準確了。
論文作者之一Dharshan Kumaran說道:“我們證明了網(wǎng)格細胞遠不只是給我們提供GPS定位信號,也是一種大腦賴以計算兩個地點間的最短距離的核心導航機制。”
用人工智能代替小白鼠做實驗與一直強調(diào)“人工智能不是仿生學”的Facebook人工智能首席科學家楊立昆(Yann Lecun)不同,天才創(chuàng)始人戴密斯·哈薩比斯(Demis Hassabis)執(zhí)掌的DeepMind熱衷探索人工智能與腦科學的相輔相成。這項研究再一次體現(xiàn)了他們的科學理念:腦科學啟發(fā)下的人工智能算法能反過來幫助人類探索大腦運行機制,從而也更好地理解人工智能的內(nèi)在邏輯。
哈薩比斯評價道:“我們相信人工智能和神經(jīng)科學是相互啟發(fā)的。這項工作就是很好的證明:通過研發(fā)出一個能在復雜環(huán)境中導航的人工智能體,我們對網(wǎng)格細胞在哺乳動物導航中的重要性有了更深的理解。”
DeepMind團隊相信,類似的研究方法還可以用來探索大腦聽覺和控制四肢的機制。在更遠的將來,神經(jīng)科學家們甚至可以用人工智能代替小白鼠來做實驗。