阿法狗2.0版來了!這次AI就只靠技術(shù)不要棋譜
據(jù)@央視CCTV5報(bào)道,谷歌旗下Deepmind公司近日在德國慕尼黑的DLD創(chuàng)新大會(huì)上正式宣布,將推出真正的2.0版AlphaGo。
新版“阿法狗”將正式摒棄人類棋譜,只靠計(jì)算機(jī)自身深度學(xué)習(xí)的方式成長——即探索“深度學(xué)習(xí)”方式的極限,臻至“圍棋之神”的境界。
2.0版的AlphaGo,將通過數(shù)學(xué)模型下的自我對(duì)局和深度學(xué)習(xí),下出真正屬于人工智能(AI)的圍棋。
谷歌高層拜會(huì)聶衛(wèi)平
柯潔微博
在2017年開年,化身Master的阿法狗風(fēng)卷殘?jiān)仆瓿?0勝,唯一一場平局還是因?yàn)閷?duì)弈者掉線。
當(dāng)時(shí)“棋圣”聶衛(wèi)平就表示:“圍棋遠(yuǎn)不像我們想象的那么簡單,還有巨大的空間等著我們?nèi)祟惾ネ诰颉0⒎ü芬埠?,Master也罷,都是‘圍棋上帝’派來給人類引路的。”
而柯潔則說他一夜無眠,“人類千年的實(shí)戰(zhàn)演練進(jìn)化,計(jì)算機(jī)卻告訴我們,人類全都是錯(cuò)的……”
既然人類的圍棋智慧如今落入下風(fēng),那么人工智能會(huì)帶來怎么樣的圍棋變革呢?
DeepMind公司其實(shí)早已有過設(shè)想——拋棄人類棋譜套路,走AI自己的路。
阿法狗之父:哈薩比斯
該公司創(chuàng)始人哈薩比斯此前在一次采訪中曾透露,他們的團(tuán)隊(duì)正在嘗試訓(xùn)練一個(gè)沒有學(xué)習(xí)過人類棋譜的人工智能。
而當(dāng)Master大殺四方后,也有外界猜測,Master是否也未曾研習(xí)人類棋譜。
但無論是人類套路還是自成一派,阿法狗更可怕的還是它的學(xué)習(xí)能力。
在2015年10月,阿法狗在與歐洲冠軍樊麾的對(duì)弈中就在公平的情況下以5比0完勝。樊麾在接受媒體采訪時(shí)認(rèn)為,阿法狗的可怕在于“從不犯錯(cuò)”。
聶衛(wèi)平和Master對(duì)弈
在樊麾與阿法狗的五盤大戰(zhàn)棋譜被放上網(wǎng)絡(luò)后,就有不少圍棋業(yè)余高手在網(wǎng)絡(luò)上發(fā)表評(píng)論,其中不少人認(rèn)為樊麾這次的棋下得并不出色。
但當(dāng)時(shí)《自然》雜志就寫道,“人類在下棋時(shí)有一個(gè)劣勢,在長時(shí)間比賽后,他們會(huì)犯錯(cuò),但機(jī)器不會(huì)。而且人類或許一年能玩1000局,但機(jī)器一天就能玩100萬局。”
“圍棋AI的學(xué)習(xí)能力非常強(qiáng)大,就像當(dāng)初‘深藍(lán)’第一次輸給了卡斯帕羅夫,但不到一年第二次對(duì)弈就贏了比賽。”
韓國棋院給阿法狗頒發(fā)名譽(yù)九段證書。
據(jù)《自然》雜志介紹,阿法狗的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò):“策略網(wǎng)絡(luò)”(policy network)和 “值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋。
更恐怖的是它的“進(jìn)化”深度學(xué)習(xí)能力,用了2000萬局的對(duì)子對(duì)弈進(jìn)行訓(xùn)練,每一次都能提升棋力。