新技術(shù)的發(fā)展將是Facebook AI邁出的重要一步
(文章來源:教育新聞網(wǎng))
Facebook AI Research(FAIR)開發(fā)了一種新的AI,在與Hanabi對(duì)抗時(shí)產(chǎn)生了令人印象深刻的結(jié)果。新的發(fā)展是Facebook AI邁出的重要一步。
Hanabi是一款類似于紙牌的紙牌游戲。盡管大多數(shù)用于此技術(shù)的游戲(例如國(guó)際象棋或圍棋)直接將AI置于人類面前,但Hanabi要求玩家相互合作以實(shí)現(xiàn)共同的目標(biāo)。Facebook雇用機(jī)器人在游戲中協(xié)同工作,直到它們超越了以前使用的AI系統(tǒng)。最新的最佳AI系統(tǒng)在游戲中獲得25分的23.92分,而新的AI系統(tǒng)在25分中達(dá)到24.61分。
早在2月,Google,DeepMind,卡內(nèi)基梅隆大學(xué)和牛津大學(xué)的研究人員提出了Hanabi基準(zhǔn)測(cè)試。他們還包括創(chuàng)建能夠玩游戲的其他AI,并將其稱為“ AI研究的新領(lǐng)域”。研究人員對(duì)新開發(fā)感到興奮,因?yàn)橛糜趲椭鷻C(jī)器人的相同AI可能會(huì)在其他領(lǐng)域使用。一種可能的用途是改善虛擬助手與人互動(dòng)的方式。Facebook AI研究人員Noam Brown談到了新的AI系統(tǒng)。
“與此相關(guān)的令人興奮的事情之一是,我們正在觀察到的改進(jìn)實(shí)際上與深度強(qiáng)化學(xué)習(xí)所觀察到的改進(jìn)正交:您可以將其添加到任何策略之上,它將使它變得更加強(qiáng)大,鮑恩在接受采訪時(shí)表示,他對(duì)VentureBeat進(jìn)行了采訪?!拔覀兛吹降慕Y(jié)果遠(yuǎn)遠(yuǎn)超出了我們或其他研究人員的預(yù)期。實(shí)際上,我們從搜索中獲得的收益要強(qiáng)于過去使用的所有深度強(qiáng)化學(xué)習(xí)算法所獲得的收益?!?/p>
Facebook的AI的新發(fā)展是在研究人員不斷開發(fā)能夠與某些最復(fù)雜的游戲抗衡的軟件的時(shí)候進(jìn)行的。2016年,谷歌的DeepMind的AI系統(tǒng)擊敗了中國(guó)棋盤游戲Go中最出色的人類玩家。Hanabi圍繞團(tuán)隊(duì)合作和戰(zhàn)略而建立,這是AI實(shí)現(xiàn)的重要里程碑,Hanabi現(xiàn)在被認(rèn)為是測(cè)試AI的最佳游戲。在這種環(huán)境下使用時(shí),人工智能可以改善并變得更加復(fù)雜。
Adam Lerer是Facebook研究人員,也是該論文的撰稿人。他說:“我們轉(zhuǎn)向這些合作游戲的原因之一是,我認(rèn)為我們至少在競(jìng)爭(zhēng)性游戲方面還沒有剩下任何游戲?!惫{比(Hanabi)由兩到五名球員組成的團(tuán)隊(duì),每人隨機(jī)獲得一張牌??ㄆ念伾煌野煌臄?shù)字,團(tuán)隊(duì)將它們按顏色和正確的數(shù)字順序放在桌子上。
玩家看不到自己的牌,但隊(duì)友可以看到。允許玩家給別人提示。例如,一個(gè)隊(duì)友可以給出有關(guān)顏色的提示,從而導(dǎo)致另一個(gè)人玩或棄牌。游戲中較復(fù)雜的方面之一是,玩家必須弄清楚線索及其含義。對(duì)于機(jī)器人來說,游戲的這一部分很難弄清他們所擁有的信息。
? ? ? ?