這不是機(jī)器的勝利,而是一群人戰(zhàn)勝了另一個(gè)人。
第37手
麥克·雷蒙不敢相信自己看到的畫面。他的右手在空中足足停留了兩秒,其間四次扭頭看向電腦屏幕上的棋盤,才把一顆黑棋貼在了AlphaGo剛剛走的位置上。
作為一名職業(yè)9段的圍棋高手,雷蒙已經(jīng)習(xí)慣了把自己的情緒隱藏起來(lái)。他是這次人機(jī)大戰(zhàn)的英文解說(shuō)嘉賓,一本正經(jīng)又慢條斯理的解說(shuō)風(fēng)格,有時(shí)會(huì)讓人犯困。不過(guò)一秒前他臉上的困惑以及隨后的嘴角上揚(yáng),都說(shuō)明了賽場(chǎng)上發(fā)生了一件不同尋常的事,而這一切,剛好被掃過(guò)的特寫鏡頭逮到。
因?yàn)楝F(xiàn)場(chǎng)轉(zhuǎn)播信號(hào)的延遲,古力比雷蒙晚了一分多鐘才看到這一手棋。他的反應(yīng)與雷蒙如出一轍,只不過(guò)更加激烈,“AlphaGo怎么會(huì)下這里?”整個(gè)騰訊的直播間也因這一步棋炸開(kāi)了鍋,國(guó)家圍棋隊(duì)總教練俞斌表示“反常規(guī)”,職業(yè)棋手唐奕覺(jué)得“是業(yè)余水準(zhǔn)”,沒(méi)有人覺(jué)得這是一步“對(duì)”的棋。
李世石抽完本場(chǎng)比賽的第一支煙,回到座位上。他也看到了對(duì)手的這一步棋,第一次露出了疑惑的神情。不過(guò)這種疑惑持續(xù)了只很短的時(shí)間,隨后,他陷入了長(zhǎng)時(shí)間的思考,臉色也變得越來(lái)越難看。“印象中我從沒(méi)見(jiàn)過(guò)職業(yè)高手下這樣的棋,李世石可能也沒(méi)有,所以看得出,他要好好考慮一下。”雷蒙評(píng)論道。
這一幕發(fā)生在“人機(jī)大戰(zhàn)”第二場(chǎng)比賽開(kāi)始后50分鐘,AphaGo所下的第37手。
根據(jù)比賽的規(guī)則,每名選手都有兩個(gè)小時(shí)的常規(guī)時(shí)間,再此期間選手可以任意分配每一步棋的時(shí)間(10秒或者10分鐘)一旦時(shí)間用完,就要進(jìn)入“讀秒”,每步棋考慮時(shí)間不能超過(guò)60秒。
李世石明白,第一場(chǎng)的失利很大程度上是因?yàn)樽约合碌锰欤紤]不周全。在投子認(rèn)輸時(shí),他還有近半小時(shí)的常規(guī)時(shí)間,比AphlaGo少用了25分鐘。因此在第二場(chǎng)比賽中,他有意放慢了每一步棋的節(jié)奏,希望可以考慮得更周全。在這一步棋之前,他的總用時(shí)是25分2秒,比AlphaGo多用的5分鐘幫他換回了盤面上的一點(diǎn)優(yōu)勢(shì),于是他放松地起身,去抽了第一支煙。
AlphaGo無(wú)法感受到李世石心情的變化,所以這一步“怪棋”也不像只是簡(jiǎn)單地想把當(dāng)前的局面攪亂,而是跟前面的36步一樣,進(jìn)行過(guò)分析后的決定。李世石明白這一點(diǎn),也正是因?yàn)槿绱?,他花了更多時(shí)間去思考這棋背后的“深意”。
“當(dāng)你覺(jué)得它足夠厲害時(shí),即使它真的下了一招爛棋,你也會(huì)覺(jué)得它有別的什么意圖,只是自己沒(méi)有看出來(lái)。然后你會(huì)越來(lái)越懷疑自己。”在回顧0比5輸給AlphaGo的心理變化時(shí),樊麾這么告訴騰訊科技。
在賽后接受采訪時(shí),作為裁判的他對(duì)AlphaGo的這一步棋贊不絕口。在此之前,他曾經(jīng)說(shuō)過(guò)“AplhaGo缺點(diǎn)是他無(wú)法理解圍棋之美”,但在這一刻,AlphaGo卻用自己的一步棋讓他體會(huì)到了其中的美和優(yōu)雅。
麥克·雷蒙也感受到了這種“刺激”,他說(shuō)經(jīng)過(guò)這兩天的觀察,自己非常想和AlphaGo下一盤棋。“許多圍棋高手都會(huì)有自己習(xí)慣的套路,尤其是在布局階段。這樣做確卻更加穩(wěn)健,但是下多了也少了許多變化的樂(lè)趣。”雷蒙說(shuō),“而這也是AlphaGo與眾不同的地方。”
15分37秒,這是李世石在這一步棋上花掉的思考時(shí)間。從結(jié)果上看,這一部棋并沒(méi)有對(duì)之后的棋局產(chǎn)生巨大的影響。但在下完這步棋后,他的用時(shí)已經(jīng)比AlphaGo多了20分鐘。有意思的是,李世石比AlphaGo先讀秒的時(shí)間,也恰好是20分鐘。
“今天AlphaGo的表現(xiàn)幾乎是完美的,自始至終沒(méi)有一步棋讓我覺(jué)得它下得不合理。我無(wú)話可說(shuō)。”李世石在第二場(chǎng)比賽后的新聞發(fā)布會(huì)上說(shuō)。
誰(shuí)是李世石?
第二場(chǎng)比賽多花了一個(gè)小時(shí),但從比賽結(jié)束到召開(kāi)發(fā)布會(huì)的進(jìn)間,卻縮短了十幾分鐘。
與第一場(chǎng)結(jié)束后的熱烈討論相比,現(xiàn)場(chǎng)的氣氛更加壓抑。李世石入場(chǎng)沒(méi)有像昨天第一場(chǎng)失利后那么緊張和不安,但卻多了些落寞。一位韓國(guó)媒體鼓起了掌,想給李世石打氣,但單薄的掌聲顯得異常刺耳。
第一場(chǎng)之后,仍然有不少韓國(guó)媒體在為李世石的失利尋找理由,比如下得太快,失誤太多,比如有些輕敵,不太認(rèn)真。這些理由的背后傳統(tǒng)的共同信息是,只要李世石認(rèn)真下,仍然可以取勝。
而在24小時(shí)之后,當(dāng)目睹了AlphaGo是如何從開(kāi)始到結(jié)束掌控主局面,沒(méi)有給李世石任何獲得的機(jī)會(huì),最終又逼迫李世石投子認(rèn)輸后,大家心里對(duì)于誰(shuí)強(qiáng)誰(shuí)弱,已經(jīng)有了一個(gè)答案。而作為韓國(guó)媒體,需要用更多進(jìn)間去接受這種現(xiàn)實(shí)。
在韓國(guó),李世石并不是一個(gè)招媒體喜歡的棋手。
“目中無(wú)人”、“口無(wú)遮攔”、“不尊重對(duì)手和前輩”,你可以在任何一個(gè)韓國(guó)圍棋記者口中得到這些形容李世石的話。在過(guò)去15年,這些標(biāo)簽就像他的成績(jī)一樣耀眼,即使他現(xiàn)在已經(jīng)比過(guò)去收斂許多,這些輕狂之言也時(shí)常會(huì)被翻出,雖然大部分時(shí)間僅僅是作為談資。
比如在2001年第5屆LG杯決賽中輸給前輩李昌鎬之后,年僅18歲的李世石卻說(shuō)“在所有高手中,昌鎬的水平是最差的”,同樣在兩年后的LG杯中,李世石再一次語(yǔ)出驚人,他說(shuō)自己心目中世界冠軍的候選中,沒(méi)有包括馬曉春。在對(duì)尊卑位份異常重視的韓國(guó),李世石常常因此受到媒體詬病。
他還經(jīng)常在大賽前做出樂(lè)觀的預(yù)測(cè),2005年1月第二屆豐田杯,李世石與常昊冠亞軍決賽前,他聲稱自己“有65%至70%的勝算”,盡管當(dāng)時(shí)雙方歷史交手的成績(jī)是1比4;2010年第12屆農(nóng)心杯前,李世石面對(duì)10位中日高手,聲稱要取得“十連勝”。
即便在這兩年有所收斂,但是在接受Google AlphaGo的圍棋挑戰(zhàn)時(shí),李世石仍然在第一時(shí)間表示,比賽將會(huì)是他以5:0取勝。
這一次,李世石不僅是代表韓國(guó),而且是代表人類出戰(zhàn)。這個(gè)巨大的噱頭無(wú)疑刺激到了韓國(guó)媒體們的神經(jīng),只要他能贏,他說(shuō)什么都行。
一時(shí)間,李世石以一種“民族英雄”的形象登上了報(bào)紙和電視的頭版頭條,所有的報(bào)道都在極力渲染這次比賽的重大意義,“從沒(méi)有見(jiàn)過(guò)這么多媒體如此關(guān)心一個(gè)圍棋選手和圍棋比賽”,一位跑了15年圍棋的韓國(guó)記者告訴騰訊科技。
這種關(guān)心的“保質(zhì)期”并沒(méi)有想象得那么久,比賽當(dāng)天那種300多家媒體涌進(jìn)四季酒店,為了提前進(jìn)場(chǎng)占據(jù)一個(gè)有力位置不惜提前一個(gè)小時(shí)排隊(duì)的盛況已經(jīng)不再。來(lái)到現(xiàn)場(chǎng)的韓國(guó)媒體數(shù)量大概只有前一天的70%,中餐自助午餐的消耗速度也不像第一天那么快。
3月8日上午的賽前新聞發(fā)布會(huì),當(dāng)Google DeepMind公司CEO Demis Hassabis在臺(tái)上講解AlphaGo的算法原理時(shí),一大群攝影師沖到了場(chǎng)地前方正中央,拍攝坐在前排的李世石,擋在了Hemis和其它臺(tái)下的記者之間,甚至引起了部分國(guó)際記者的吐槽。
而在3月9日第一場(chǎng)的賽后發(fā)布會(huì)后,位于舞臺(tái)右側(cè)角度里的DeepMind團(tuán)隊(duì)被長(zhǎng)槍短炮團(tuán)團(tuán)圍住,閃光燈閃個(gè)不停。到了3月10日第二場(chǎng)比賽之后,你會(huì)看到這些穿著統(tǒng)一黑T恤的外國(guó)人時(shí)常會(huì)被韓國(guó)記者攔下,用不太流利的英語(yǔ)問(wèn)著關(guān)于AlphaGo,關(guān)于Google的一些問(wèn)題。
李世石不再是鏡頭的全部。越來(lái)越多的媒體想知道,這個(gè)兩次戰(zhàn)勝了李世石的AlphaGo,到底是個(gè)什么玩意?
一支叫AlphaGo的小分隊(duì)
一群穿著統(tǒng)一黑色T恤的年輕人,突然聚集在了國(guó)際媒體直播間門口。他們?cè)谙嗷粽?、擁抱,臉上的笑容,就像是在圣誕節(jié)早晨得到了心儀禮物的孩子。
這是3月9日下午3點(diǎn)30分左右,就在幾分鐘之前,李世石出人意料地做出了投子認(rèn)輸?shù)臎Q定,這也就意味著AlphaGo第一次擊敗了職業(yè)9段圍棋手。媒體們一齊擁向了十幾米外的長(zhǎng)廊兩側(cè),這里是李世石從比賽現(xiàn)場(chǎng)走到發(fā)布會(huì)房間的必經(jīng)之路。
其中一個(gè)年輕人為了躲開(kāi)一個(gè)從身邊匆忙跑過(guò)試圖擠進(jìn)長(zhǎng)廊兩側(cè)的媒體,往后退了一步。他對(duì)身邊的另一個(gè)戴眼鏡的哥們兒聳了聳肩,露出了一副“看我們干的好事”的神情。這時(shí)候,英文解說(shuō)嘉賓Chris Garlock從媒體直播間走了出來(lái)。“太棒了,實(shí)在是太棒了。恭喜你們。”Garlock對(duì)這種小伙子說(shuō)。在說(shuō)這句話時(shí),他似乎還沒(méi)有從剛剛的興奮中緩過(guò)來(lái),當(dāng)李世石投子認(rèn)輸時(shí),他一連喊了三個(gè)“wow”。
黑色T恤背上的AlphaGo字樣暴露了這群人的身份,他們正是來(lái)自DeepMind公司,開(kāi)發(fā)了AlphaGo的那群人。就在幾分鐘之前,他們創(chuàng)造了歷史。
這是一支15人的小分隊(duì),為了這次比賽特地從倫敦飛到韓國(guó),從2月底開(kāi)始,就住在四季酒店,為比賽做著各項(xiàng)準(zhǔn)備。
George Van Den Driessche和Julian Schrittweiser是兩位最主要的工程師,他們的主要任務(wù),就是保證AlphaGo能在這里順利運(yùn)行。“他們?cè)S多與系統(tǒng)相關(guān)的檢查,包括查看各個(gè)接口,準(zhǔn)備備用方案。”DeepMind的創(chuàng)始人,CEO Demis Hassabis告訴騰訊科技。
除了工程師,這個(gè)團(tuán)隊(duì)中還有人專門負(fù)責(zé)IT基礎(chǔ)設(shè)施。盡管韓國(guó)是全球網(wǎng)速第一的國(guó)家,但團(tuán)隊(duì)仍然在酒店鋪設(shè)了特別的網(wǎng)線,保證全球直播過(guò)程中的高速和穩(wěn)定。
另一部分團(tuán)隊(duì)成員則與Google的團(tuán)隊(duì)一起,負(fù)責(zé)比賽的組織。不同顏色的號(hào)碼牌代表不同的權(quán)限,每一個(gè)區(qū)域交接處都有至少兩名安保人員站崗;直播間為國(guó)際媒體和DeepMind團(tuán)隊(duì)專門預(yù)留座位,所有發(fā)布會(huì)和采訪時(shí)間的誤差均不超過(guò)10分鐘。
“我從來(lái)沒(méi)有見(jiàn)過(guò)組織比賽這么細(xì)致的,所有的事情都要排練好多次。”樊麾告訴騰訊科技。作為這次比賽的裁判,他從比賽前5天就來(lái)到了首爾,幫助小分隊(duì)一起準(zhǔn)備。
第一場(chǎng)比賽的賽后發(fā)布會(huì)上,AlphaGo項(xiàng)目的主要負(fù)責(zé)人David Silver和公司CEO Demis Hassabis、李世石一起上臺(tái)接受的采訪。而在離他幾米遠(yuǎn)的地方,小分隊(duì)的成員們聊得正high。發(fā)布會(huì)一結(jié)束,這個(gè)角落就被媒體團(tuán)團(tuán)圍住。他們終于成了主角。
這不是機(jī)器的勝利,而是一群人戰(zhàn)勝了另一個(gè)人。而這群人正在制造“未來(lái)”。未來(lái),正在發(fā)生。