李世石:AlphaGo執(zhí)黑有缺陷 下場我要執(zhí)黑
人機(jī)圍棋對決今日進(jìn)行第四場比賽,李世石九段憑借第78“神之一手”讓AlphaGo陷入混亂,最終將AlphaGo首次拖入讀秒,并成功讓 AlphaGo認(rèn)輸,這是人類棋手首次戰(zhàn)勝AlphaGo,在賽后發(fā)布會上,李世石受到了多方稱贊,DeepMind的開發(fā)者還談到了這次比賽中 AlphaGo出現(xiàn)的忽然“崩潰”,表示這次“失利”對AlphaGo非常寶貴。
DeepMind創(chuàng)始人哈薩比斯在賽后發(fā)布會上表示:”衷心祝賀李世石獲勝,讓我們看到他是多么偉大的棋手??碅lphaGo的統(tǒng)計,也知道形勢的變化。李世石下得非常好,給AlphaGo制造了失誤。我們也非常高興,在韓國舉行這個比賽,也是為了看看AlphaGo實力,測試極限、改善提高他,也需要李世石這樣優(yōu)秀的天才棋手。李世石今天下得非常精彩。“
這位DeepMind創(chuàng)始人也談到了這次失利的重要意義:今天的失利是非常寶貴的,我們回去還要改善AlphaGo。最后非常衷心祝愿李世石獲勝。非常期待周二最后一場比賽。
哈薩比斯還在推特表示,在李世石白78“神之一手”后,AlphaGo白79誤以為勝率達(dá)到70%,直到第87手才反應(yīng)過來!
DeepMind的“領(lǐng)隊”、AlphaGo開發(fā)者大衛(wèi)-席爾瓦盛贊了李世石的表現(xiàn),覺得李世石贏得非常漂亮,此外還表示:“AlphaGo是自我對局來進(jìn)行學(xué)習(xí),這樣有可能會存在缺陷。我們不是職業(yè)棋手,正需要進(jìn)行這場比賽,希望能尋找到這樣的缺陷,發(fā)現(xiàn)AlphaGo的極限。今天在棋盤中央就看到了,李世石下得非常漂亮,我們希望能促進(jìn)AlphaGo的進(jìn)步。期待周二的第五局比賽。“
韓語解說宋泰坤九段則在盛贊李世石同時,對第五場比賽表示期待,他說:”祝賀李世石九段!李世石今天獲勝,非常敬佩他,克服了壓力,發(fā)揮出自己的水平,中腹走出了妙手。隨著比賽進(jìn)行,李世石逐漸了解了對手AlphaGo,期待后天第五局比賽更加精彩。“
英語解說麥克雷蒙九段則告訴記者,這是一場非常有趣的比賽,李世石78手令人震驚,估計大多數(shù)對手都會感到驚訝,包括AlphaGo。李世石確實下得非常好。祝賀李世石九段。
以下為發(fā)布會媒體問答實錄:
問:AlphaGo以前的失誤后來發(fā)現(xiàn)是好手,但今天有幾手意外的失誤,將來也會向醫(yī)療領(lǐng)域發(fā)展,是否也會有相似情況?
哈薩比斯:AlphaGo還是初級程序,還不是升級版,并未完善,所以我們就要看看他有何缺陷,希望李世石能幫我們找到缺點。我們需要進(jìn)一步測試,完善他。目前AlphaGo還只是個程序,尚未進(jìn)入醫(yī)療領(lǐng)域,我們當(dāng)然還會進(jìn)行更嚴(yán)格的測試。
問:AlphaGo是否有失誤?
哈薩比斯:AlphaGo有的棋,從職業(yè)棋手角度來看可能并非瞬間直觀的選點,感覺是惡手,但事后看反而可能是好手,當(dāng)然也有可能是失誤。因為AlphaGo是通過計算勝率來選擇落點,處理方式和人不一樣。今天AlphaGo輸了,所以確實是有失誤的。這也看得出李世石的表現(xiàn)非常強。我們舉辦比賽,就是希望通過李世石幫助尋找他的缺陷和測試極限。
問:AlphaGo似乎不會下出差別很大的棋,而是根據(jù)對手實力來下棋,是否之前有設(shè)置評測對手實力?
大衛(wèi)席爾瓦:AlphaGo不會根據(jù)對手來下棋,只是通過計算來確定每步棋勝率是多少,選擇最有可能獲勝的落點。如果勝率低于一定程度就會彈出提示認(rèn)輸,通知黃士杰博士。AlphaGo認(rèn)為對手總是會下出最強手,所以要增加自己最有可能的勝率。
問:今天賽前是否有策略,棋局是否按計劃進(jìn)行,獲勝是否自己表現(xiàn)好還是因AlphaGo失誤?之前說對AlphaGo完全不了解,現(xiàn)在了解多少?信息不對稱是否對您有些不公平。因您的棋譜都能搜集到。
李世石:我覺得AlphaGo并不完美,肯定有弱點的,感覺大致有兩點,他執(zhí)黑下得并不太好,另外當(dāng)我下出意外一手,AlphaGo應(yīng)對可能就會出現(xiàn)失誤。當(dāng)我下出完全沒有想到的棋,AlphaGo整個程序似乎就會出現(xiàn)問題。關(guān)于信息不對等,這并不是最重要的。主要還是我和AlphaGo的棋力對抗,他出現(xiàn)意外失誤并不是關(guān)鍵。
哈薩比斯:AlphaGo并不是針對李世石的棋風(fēng)或棋譜來訓(xùn)練的,是收集所有人類的棋譜,接著通過自我對局來深度學(xué)習(xí),所以沒有專門針對李世石。即使我們要針對李世石來培訓(xùn)AlphaGo,是需要上千萬棋譜的。
問:三連敗后是否會影響信心?最后一局感覺如何?
李世石:三連敗肯定會受到?jīng)_擊,壓力很大。但每次比賽都是很享受的,我并未受到很大沖擊,也很有信心。這局執(zhí)白獲勝,下一局能否不猜先,讓我執(zhí)黑,這樣獲勝更有意義。請問哈薩比斯先生可以嗎?
哈薩比斯和大衛(wèi)席爾瓦對視點了點頭:可以啊,我認(rèn)為沒問題。
李世石:好的,謝謝。
問:感謝今天出色的表現(xiàn),關(guān)于78妙手,當(dāng)時是如何想的?
李世石:當(dāng)時局面非常危險,我想了很久,感覺這是我唯一的選點,非常感謝大家給我這么多表揚。