新技術(shù)的發(fā)展將是Facebook AI邁出的重要一步

時(shí)間：2020-05-12 13:42:01

關(guān)鍵字： AI FACEBOOK AN ABI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （文章來源：教育新聞網(wǎng)） Facebook AI Research(FAIR)開發(fā)了一種新的AI，在與Hanabi對(duì)抗時(shí)產(chǎn)生了令人印象深刻的結(jié)果。新的發(fā)展是Facebook AI邁出的重

（文章來源：教育新聞網(wǎng)）

Facebook AI Research(FAIR)開發(fā)了一種新的AI，在與Hanabi對(duì)抗時(shí)產(chǎn)生了令人印象深刻的結(jié)果。新的發(fā)展是Facebook AI邁出的重要一步。

Hanabi是一款類似于紙牌的紙牌游戲。盡管大多數(shù)用于此技術(shù)的游戲(例如國(guó)際象棋或圍棋)直接將AI置于人類面前，但Hanabi要求玩家相互合作以實(shí)現(xiàn)共同的目標(biāo)。Facebook雇用機(jī)器人在游戲中協(xié)同工作，直到它們超越了以前使用的AI系統(tǒng)。最新的最佳AI系統(tǒng)在游戲中獲得25分的23.92分，而新的AI系統(tǒng)在25分中達(dá)到24.61分。

早在2月，Google，DeepMind，卡內(nèi)基梅隆大學(xué)和牛津大學(xué)的研究人員提出了Hanabi基準(zhǔn)測(cè)試。他們還包括創(chuàng)建能夠玩游戲的其他AI，并將其稱為“ AI研究的新領(lǐng)域”。研究人員對(duì)新開發(fā)感到興奮，因?yàn)橛糜趲椭鷻C(jī)器人的相同AI可能會(huì)在其他領(lǐng)域使用。一種可能的用途是改善虛擬助手與人互動(dòng)的方式。Facebook AI研究人員Noam Brown談到了新的AI系統(tǒng)。

“與此相關(guān)的令人興奮的事情之一是，我們正在觀察到的改進(jìn)實(shí)際上與深度強(qiáng)化學(xué)習(xí)所觀察到的改進(jìn)正交：您可以將其添加到任何策略之上，它將使它變得更加強(qiáng)大，鮑恩在接受采訪時(shí)表示，他對(duì)VentureBeat進(jìn)行了采訪?！拔覀兛吹降慕Y(jié)果遠(yuǎn)遠(yuǎn)超出了我們或其他研究人員的預(yù)期。實(shí)際上，我們從搜索中獲得的收益要強(qiáng)于過去使用的所有深度強(qiáng)化學(xué)習(xí)算法所獲得的收益?！?/p>

Facebook的AI的新發(fā)展是在研究人員不斷開發(fā)能夠與某些最復(fù)雜的游戲抗衡的軟件的時(shí)候進(jìn)行的。2016年，谷歌的DeepMind的AI系統(tǒng)擊敗了中國(guó)棋盤游戲Go中最出色的人類玩家。Hanabi圍繞團(tuán)隊(duì)合作和戰(zhàn)略而建立，這是AI實(shí)現(xiàn)的重要里程碑，Hanabi現(xiàn)在被認(rèn)為是測(cè)試AI的最佳游戲。在這種環(huán)境下使用時(shí)，人工智能可以改善并變得更加復(fù)雜。

Adam Lerer是Facebook研究人員，也是該論文的撰稿人。他說：“我們轉(zhuǎn)向這些合作游戲的原因之一是，我認(rèn)為我們至少在競(jìng)爭(zhēng)性游戲方面還沒有剩下任何游戲?！惫{比(Hanabi)由兩到五名球員組成的團(tuán)隊(duì)，每人隨機(jī)獲得一張牌?？ㄆ念伾煌野煌臄?shù)字，團(tuán)隊(duì)將它們按顏色和正確的數(shù)字順序放在桌子上。

玩家看不到自己的牌，但隊(duì)友可以看到。允許玩家給別人提示。例如，一個(gè)隊(duì)友可以給出有關(guān)顏色的提示，從而導(dǎo)致另一個(gè)人玩或棄牌。游戲中較復(fù)雜的方面之一是，玩家必須弄清楚線索及其含義。對(duì)于機(jī)器人來說，游戲的這一部分很難弄清他們所擁有的信息。
? ? ? ?