阿法狗2.0版來了！這次AI就只靠技術(shù)不要棋譜

時(shí)間：2020-08-14 07:39:02

關(guān)鍵字： AI alphago 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 據(jù)@央視CCTV5報(bào)道，谷歌旗下Deepmind公司近日在德國慕尼黑的DLD創(chuàng)新大會(huì)上正式宣布，將推出真正的2.0版AlphaGo。　　新版“阿法狗”將正式摒棄

據(jù)@央視CCTV5報(bào)道，谷歌旗下Deepmind公司近日在德國慕尼黑的DLD創(chuàng)新大會(huì)上正式宣布，將推出真正的2.0版AlphaGo。

　　新版“阿法狗”將正式摒棄人類棋譜，只靠計(jì)算機(jī)自身深度學(xué)習(xí)的方式成長——即探索“深度學(xué)習(xí)”方式的極限，臻至“圍棋之神”的境界。

　　2.0版的AlphaGo，將通過數(shù)學(xué)模型下的自我對(duì)局和深度學(xué)習(xí)，下出真正屬于人工智能（AI）的圍棋。

　　谷歌高層拜會(huì)聶衛(wèi)平

　　柯潔微博

　　在2017年開年，化身Master的阿法狗風(fēng)卷殘?jiān)仆瓿?0勝，唯一一場平局還是因?yàn)閷?duì)弈者掉線。

　　當(dāng)時(shí)“棋圣”聶衛(wèi)平就表示：“圍棋遠(yuǎn)不像我們想象的那么簡單，還有巨大的空間等著我們?nèi)祟惾ネ诰颉０⒎ü芬埠?，Master也罷，都是‘圍棋上帝’派來給人類引路的。”

　　而柯潔則說他一夜無眠，“人類千年的實(shí)戰(zhàn)演練進(jìn)化，計(jì)算機(jī)卻告訴我們，人類全都是錯(cuò)的……”

　　既然人類的圍棋智慧如今落入下風(fēng)，那么人工智能會(huì)帶來怎么樣的圍棋變革呢？

　　DeepMind公司其實(shí)早已有過設(shè)想——拋棄人類棋譜套路，走AI自己的路。

　　阿法狗之父：哈薩比斯

　　該公司創(chuàng)始人哈薩比斯此前在一次采訪中曾透露，他們的團(tuán)隊(duì)正在嘗試訓(xùn)練一個(gè)沒有學(xué)習(xí)過人類棋譜的人工智能。

　　而當(dāng)Master大殺四方后，也有外界猜測，Master是否也未曾研習(xí)人類棋譜。

　　但無論是人類套路還是自成一派，阿法狗更可怕的還是它的學(xué)習(xí)能力。

　　在2015年10月，阿法狗在與歐洲冠軍樊麾的對(duì)弈中就在公平的情況下以5比0完勝。樊麾在接受媒體采訪時(shí)認(rèn)為，阿法狗的可怕在于“從不犯錯(cuò)”。

　　聶衛(wèi)平和Master對(duì)弈

　　在樊麾與阿法狗的五盤大戰(zhàn)棋譜被放上網(wǎng)絡(luò)后，就有不少圍棋業(yè)余高手在網(wǎng)絡(luò)上發(fā)表評(píng)論，其中不少人認(rèn)為樊麾這次的棋下得并不出色。

　　但當(dāng)時(shí)《自然》雜志就寫道，“人類在下棋時(shí)有一個(gè)劣勢，在長時(shí)間比賽后，他們會(huì)犯錯(cuò)，但機(jī)器不會(huì)。而且人類或許一年能玩1000局，但機(jī)器一天就能玩100萬局。”

　　“圍棋AI的學(xué)習(xí)能力非常強(qiáng)大，就像當(dāng)初‘深藍(lán)’第一次輸給了卡斯帕羅夫，但不到一年第二次對(duì)弈就贏了比賽。”

　　韓國棋院給阿法狗頒發(fā)名譽(yù)九段證書。

　　據(jù)《自然》雜志介紹，阿法狗的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)：“策略網(wǎng)絡(luò)”（policy network）和 “值網(wǎng)絡(luò)”（value network）。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步，拋棄明顯的差棋。

　　更恐怖的是它的“進(jìn)化”深度學(xué)習(xí)能力，用了2000萬局的對(duì)子對(duì)弈進(jìn)行訓(xùn)練，每一次都能提升棋力。