人工智能模型如何去思考物理世界
一項(xiàng)新的數(shù)據(jù)集揭示了人工智能在推理方面的糟糕程度,并表明一種新的混合方法可能是最好的解決方法。
問題:名為“CLEVRER”的數(shù)據(jù)集包括2萬(wàn)個(gè)合成視頻短片和超過30萬(wàn)個(gè)基于視頻中事件的問答配對(duì)。每個(gè)視頻都展示了一個(gè)簡(jiǎn)單的玩具物體的世界,它們?cè)谀M物理中相互碰撞。在其中一個(gè)實(shí)驗(yàn),一個(gè)紅色的橡皮球撞到一個(gè)青色的橡膠圓筒上,青色的橡膠圓筒繼續(xù)打在一個(gè)金屬圓筒上。
這些問題可以分為四類:描述性的(例如,“與青色圓柱碰撞的物體是什么形狀?”)、解釋性的(“是什么導(dǎo)致了灰色圓柱與立方體的碰撞?”)、預(yù)測(cè)性的(“接下來會(huì)發(fā)生什么事件?”)和反事實(shí)的(“沒有灰色物體,哪個(gè)事件不會(huì)發(fā)生?”)。這些問題反映了孩子們?cè)谔剿髦車h(huán)境時(shí)很早就學(xué)會(huì)的許多概念。但后三種需要因果推理才能回答的類別,往往會(huì)阻礙深度學(xué)習(xí)系統(tǒng)。
失?。河晒鸫髮W(xué)、DeepMind和MIT-IBM沃森人工智能實(shí)驗(yàn)室的研究人員創(chuàng)建的數(shù)據(jù)集旨在幫助評(píng)估人工智能系統(tǒng)的推理能力。當(dāng)研究人員用數(shù)據(jù)集測(cè)試了幾種最先進(jìn)的計(jì)算機(jī)視覺和自然語(yǔ)言模型時(shí),他們發(fā)現(xiàn)所有這些模型在描述性問題上都做得很好,但在其他問題上卻做得很差。
新舊結(jié)合:該團(tuán)隊(duì)隨后嘗試了一種結(jié)合深度學(xué)習(xí)和符號(hào)邏輯的新人工智能系統(tǒng)。在20世紀(jì)80年代末被機(jī)器學(xué)習(xí)取代之前,符號(hào)系統(tǒng)曾經(jīng)風(fēng)靡一時(shí)。但這兩種方法都有各自的優(yōu)勢(shì):深度學(xué)習(xí)在可擴(kuò)展性和模式識(shí)別方面更勝一籌;符號(hào)系統(tǒng)更擅長(zhǎng)抽象和推理。
這個(gè)復(fù)合系統(tǒng)被稱為神經(jīng)符號(hào)模型,它利用了這兩方面:一方面使用一個(gè)神經(jīng)網(wǎng)絡(luò)來識(shí)別物體的顏色、形狀和材料;另一方面使用一個(gè)符號(hào)系統(tǒng)來理解物體運(yùn)動(dòng)的物理性質(zhì)和它們之間的因果關(guān)系。它在所有類型的問題上都優(yōu)于現(xiàn)有的模型。
重要性:作為孩子,我們學(xué)會(huì)觀察周圍的世界,推斷事情為什么會(huì)發(fā)生,并預(yù)測(cè)接下來會(huì)發(fā)生什么。這些預(yù)測(cè)幫助我們做出更好的決定,駕馭我們的環(huán)境,保持安全。在機(jī)器中復(fù)制這種因果理解同樣會(huì)使它們以更智能的方式與世界互動(dòng)。