拳打AlphaLee，腳踢AlphaMaster，全新AlphaZero實現(xiàn)自我學習

時間：2017-10-20 11:03:55

關鍵字： deepmind alphazero

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]據(jù)報道，《自然》雜志刊登了谷歌DeepMind團隊的新成果，名為AlphaZero(暫譯：阿爾法元)的機器系統(tǒng)僅訓練3天就戰(zhàn)勝了AlphaGo Lee，比分100：0，后者就是戰(zhàn)敗李世石的那套，經(jīng)過40天訓練后，Alpha Zero又以89：11戰(zhàn)勝了Alpha Master，即橫掃柯潔的那套。

據(jù)報道，《自然》雜志刊登了谷歌DeepMind團隊的新成果，名為AlphaZero(暫譯：阿爾法元)的機器系統(tǒng)僅訓練3天就戰(zhàn)勝了AlphaGo Lee，比分100：0，后者就是戰(zhàn)敗李世石的那套，經(jīng)過40天訓練后，Alpha Zero又以89：11戰(zhàn)勝了Alpha Master，即橫掃柯潔的那套。

據(jù)介紹，更令人震驚的是，Alpha Zero的設計理念和系統(tǒng)配置完全和Lee/Master不同，它不依托于人類的先驗成果，完全靠自我對弈學習下棋。此前，Lee/Master都是用上千盤人類業(yè)余和專業(yè)棋手的棋譜進行訓練。同時，Zero僅配置了4個TPU，Lee則是48個谷歌TPU計算單元。

對于這一進步，人類圍棋現(xiàn)世界第一柯潔以及前世界冠軍古力分別發(fā)表看法，柯潔稱：“一個純凈、純粹自我學習的alphago是最強的...對于alphago的自我進步來講...人類太多余了。”

古力也慨嘆“20年不抵3天，我們的傷感，人類的進步”，不知道大家如何看待呢。