拳打AlphaLee,腳踢AlphaMaster,全新AlphaZero實現(xiàn)自我學習
據(jù)報道,《自然》雜志刊登了谷歌DeepMind團隊的新成果,名為AlphaZero(暫譯:阿爾法元)的機器系統(tǒng)僅訓練3天就戰(zhàn)勝了AlphaGo Lee,比分100:0,后者就是戰(zhàn)敗李世石的那套,經(jīng)過40天訓練后,Alpha Zero又以89:11戰(zhàn)勝了Alpha Master,即橫掃柯潔的那套。
據(jù)介紹,更令人震驚的是,Alpha Zero的設計理念和系統(tǒng)配置完全和Lee/Master不同,它不依托于人類的先驗成果,完全靠自我對弈學習下棋。此前,Lee/Master都是用上千盤人類業(yè)余和專業(yè)棋手的棋譜進行訓練。同時,Zero僅配置了4個TPU,Lee則是48個谷歌TPU計算單元。
對于這一進步,人類圍棋現(xiàn)世界第一柯潔以及前世界冠軍古力分別發(fā)表看法,柯潔稱:“一個純凈、純粹自我學習的alphago是最強的...對于alphago的自我進步來講...人類太多余了。”
古力也慨嘆“20年不抵3天,我們的傷感,人類的進步”,不知道大家如何看待呢。