谷歌AlphaGo:人工智能五年之內(nèi)全面超越人類棋手
2月22日,“李世石-Alpha GO人機(jī)對(duì)戰(zhàn)”第二次新聞發(fā)布會(huì)在韓國(guó)棋院進(jìn)行,發(fā)布了3月“人機(jī)大戰(zhàn)”的詳細(xì)規(guī)則。23日,Deep Mind公司的CEO兼谷歌副總裁戴密斯-哈薩比斯(Demis Hassabis,40歲)在倫敦Deep Mind公司總部接受了韓《中央日?qǐng)?bào)》的專訪。專訪中戴密斯-哈薩比斯對(duì)3月的人機(jī)大戰(zhàn)自信滿滿,說“騙招對(duì)付不了Alpha GO”,“人工智能五年之內(nèi)全面超越人類棋手”,“棋的內(nèi)容也不會(huì)輸于李世石”。3月8日,戴密斯-哈薩比斯將前往首爾親臨比賽現(xiàn)場(chǎng)。
谷歌副總裁戴密斯—哈薩比斯與李世石
-Alpha GO開發(fā)多久了?
“我們啟動(dòng)研發(fā)是兩年前,從一年前起我們上軌道加快了速度。”
-為什么選擇圍棋為目標(biāo)?
“國(guó)際象棋項(xiàng)目,計(jì)算機(jī)可以靠計(jì)算速度戰(zhàn)勝人類。但是,圍棋有著國(guó)際象棋無可比擬的變化量,尤其人的直觀、洞察力起著決定性的作用,所以圍棋一直被認(rèn)為是AI無法戰(zhàn)勝人類的領(lǐng)域,而我們要挑戰(zhàn)這個(gè)‘不可能’。和李世石九段的比賽我們命名為‘大挑戰(zhàn)賽’(Grand Challenge )的原因也在于此。”
-你會(huì)下圍棋嗎?
“我大約是業(yè)余1段的棋力,我還作為國(guó)際象棋少年棋手活動(dòng)過。我畢業(yè)于劍橋大學(xué)計(jì)算機(jī)系,獲得了倫敦大學(xué)腦科學(xué)相關(guān)的博士學(xué)位。此后,我在麻省理工大學(xué)、哈佛大學(xué)修了‘機(jī)器學(xué)習(xí)’(Machine learning)、‘深度學(xué)習(xí)’(Deep Learning)博士后課程。我這些背景對(duì)研發(fā)Alpha GO起到了作用。”
-和樊麾二段是去年10月對(duì)局,這期間Alpha GO的實(shí)力提高了嗎?
“Alpha GO以無數(shù)的棋譜數(shù)據(jù)為基礎(chǔ)‘深度學(xué)習(xí)’,不斷完善,又通過自我模擬對(duì)局提高實(shí)力。此外,我們公司針對(duì)性地進(jìn)行了很多測(cè)試。所以這幾個(gè)月棋力得到了顯著的提高。”
-Alpha GO能感知“氣勢(shì)”、“外勢(shì)”、“厚味”等圍棋特有的要素嗎?
“這是無法用數(shù)理分析的部分,所以很難用算法體現(xiàn)。是屬于計(jì)算機(jī)無法感知的人類獨(dú)有的領(lǐng)域。”
-如果棋力相差很大,可以贏幾十目。Alpha GO也能做到嗎?
“Alpha GO處理信息,只是為了贏。目前沒有設(shè)置‘贏幾目’的這種具體的目標(biāo)。”
-有種說法認(rèn)為,Alpha GO能對(duì)付職業(yè)棋手的正招,但是對(duì)業(yè)余棋迷的“騙招”辦法不多。
“我們正式公布的是與樊麾二段的對(duì)局,但是內(nèi)部和很多的業(yè)余棋手較量過。那種誘導(dǎo)失誤的騙招、荒唐手段,Alpha GO始終以正手應(yīng)對(duì)。”
-專家們普遍判斷李世石九段會(huì)輕松取勝。
“這些判斷應(yīng)該是基于和樊麾二段的棋譜。不要認(rèn)為這些對(duì)局體現(xiàn)了Alpha GO的全部實(shí)力。”
-那么,你是認(rèn)為人機(jī)大戰(zhàn)哪一方會(huì)勝出?
“這個(gè)很難斷定,應(yīng)該是50對(duì)50吧。這里有兩層意思,一是勝率不會(huì)落后,二是棋的內(nèi)容也不會(huì)輸于李世石九段。”
-就像國(guó)際象棋,人工智能會(huì)在圍棋項(xiàng)目超越人類嗎?
“約過5年時(shí)間,AI全面超越最頂尖人類棋手之日肯定會(huì)來臨。下個(gè)月將證明此言不虛。”
-圍棋有接近無窮的變化,所以算法很不好研發(fā)。
“所以我們另辟蹊徑。讓Alpha GO掌握數(shù)千萬個(gè)變化,又通過‘深度學(xué)習(xí)’自我發(fā)現(xiàn)新的戰(zhàn)略。通過這種系統(tǒng)不斷縮減變化量,直至找到最佳的答案。”
-和其他圍棋計(jì)算機(jī)程序比較?
“和法國(guó)‘瘋石’、日本‘zen’等當(dāng)今最優(yōu)秀的計(jì)算機(jī)圍棋程序較量了500盤,結(jié)果Alpha GO因失誤只輸了一盤。當(dāng)然,這個(gè)失誤通過反復(fù)的學(xué)習(xí)已經(jīng)完善了。以后不會(huì)有輸給計(jì)算機(jī)圍棋程序的情況發(fā)生。”
-不乏擔(dān)憂人工智能副作用的聲音。
“AI是強(qiáng)有力的工具,但是價(jià)值判斷屬于中立。就看怎樣設(shè)計(jì)了,AI既可以成為人類的助手,也可以成為人類的挑戰(zhàn)者。”