拳打AlphaLee,腳踢AlphaMaster,全新AlphaZero實(shí)現(xiàn)自我學(xué)習(xí)
據(jù)報(bào)道,《自然》雜志刊登了谷歌DeepMind團(tuán)隊(duì)的新成果,名為AlphaZero(暫譯:阿爾法元)的機(jī)器系統(tǒng)僅訓(xùn)練3天就戰(zhàn)勝了AlphaGo Lee,比分100:0,后者就是戰(zhàn)敗李世石的那套,經(jīng)過40天訓(xùn)練后,Alpha Zero又以89:11戰(zhàn)勝了Alpha Master,即橫掃柯潔的那套。
據(jù)介紹,更令人震驚的是,Alpha Zero的設(shè)計(jì)理念和系統(tǒng)配置完全和Lee/Master不同,它不依托于人類的先驗(yàn)成果,完全靠自我對(duì)弈學(xué)習(xí)下棋。此前,Lee/Master都是用上千盤人類業(yè)余和專業(yè)棋手的棋譜進(jìn)行訓(xùn)練。同時(shí),Zero僅配置了4個(gè)TPU,Lee則是48個(gè)谷歌TPU計(jì)算單元。
對(duì)于這一進(jìn)步,人類圍棋現(xiàn)世界第一柯潔以及前世界冠軍古力分別發(fā)表看法,柯潔稱:“一個(gè)純凈、純粹自我學(xué)習(xí)的alphago是最強(qiáng)的...對(duì)于alphago的自我進(jìn)步來講...人類太多余了。”
古力也慨嘆“20年不抵3天,我們的傷感,人類的進(jìn)步”,不知道大家如何看待呢。