當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀] 圍棋已經(jīng)流傳近3000年,但人類(lèi)一直低估了一點(diǎn):以第五條線為代表的棋局中部區(qū)域。 這是AlphaGo之父、DeepMind創(chuàng)始人DemisHassabis向外界分享A

圍棋已經(jīng)流傳近3000年,但人類(lèi)一直低估了一點(diǎn):以第五條線為代表的棋局中部區(qū)域。

這是AlphaGo之父、DeepMind創(chuàng)始人DemisHassabis向外界分享AlphaGo背后故事時(shí)透露的重要信息。

自去年3月首爾那場(chǎng)載入史冊(cè)的比賽以來(lái),AlphaGo超越人類(lèi)棋手固有思維和套路的招法,對(duì)圍棋界的沖擊史無(wú)前例。用DemisHassabis的話說(shuō),“就像人們利用哈勃望遠(yuǎn)鏡發(fā)現(xiàn)新的宇宙空間一樣。AlphaGo就是圍棋界的‘哈勃天文望遠(yuǎn)鏡’。”

5月24日,DeepMind創(chuàng)始人DemisHassabis以及AlphaGo團(tuán)隊(duì)負(fù)責(zé)人DavidSilver一起對(duì)外詳解了AlphaGo背后的研發(fā)故事,以及AlphaGo究竟意味著什么?

“AlphaGo已經(jīng)展示出了創(chuàng)造力,在某一個(gè)領(lǐng)域它甚至已經(jīng)可以模仿人類(lèi)直覺(jué)了。”DemisHassabis對(duì)第一財(cái)經(jīng)記者表示,在未來(lái)能看到人機(jī)合作的巨大力量,人類(lèi)智慧將通過(guò)人工智能進(jìn)一步放大。“強(qiáng)人工智能是人類(lèi)研究和探尋宇宙的終極工具。”

圍棋難在哪兒

歷史上,電腦最早掌握的第一款經(jīng)典游戲是井字游戲,這是1952年一位博士在讀生的研究項(xiàng)目;隨后是1994年電腦程序Chinook成功挑戰(zhàn)西洋跳棋游戲;3年后,IBM深藍(lán)超級(jí)計(jì)算機(jī)在國(guó)際象棋比賽中戰(zhàn)勝世界冠軍加里·卡斯帕羅夫。

相比之下,圍棋看似規(guī)則簡(jiǎn)單,復(fù)雜性卻難以想象。它一共有10的170次方種可能性,這個(gè)數(shù)字比整個(gè)宇宙中的原子數(shù)10的80次方都多,沒(méi)有辦法窮舉出圍棋所有可能的結(jié)果。

在DemisHassabis看來(lái),更困難的是圍棋不像象棋等游戲靠計(jì)算,而是靠直覺(jué)。“圍棋中沒(méi)有等級(jí)概念,所有棋子都一樣,圍棋是筑防游戲,因此需要盤(pán)算未來(lái)。你在下棋的過(guò)程中,是棋盤(pán)在心中,必須要預(yù)測(cè)未來(lái)。小小一個(gè)棋子可撼動(dòng)全局,牽一發(fā)而動(dòng)全身。圍棋‘妙手’如受天啟。”Hassabis如此解釋道。

第一位與AlphaGo對(duì)陣的人類(lèi)職業(yè)棋手樊麾對(duì)記者感慨,“曾經(jīng)以為計(jì)算機(jī)打敗職業(yè)棋手,一輩子都不會(huì)看到,沒(méi)想到這么快就實(shí)現(xiàn)了。”

對(duì)AlphaGo團(tuán)隊(duì)來(lái)說(shuō),是時(shí)候?qū)ふ乙环N更聰明的方法來(lái)解開(kāi)圍棋謎題了。

AlphaGo系統(tǒng)的關(guān)鍵是,將圍棋巨大無(wú)比的搜索空間壓縮到可控的范圍之內(nèi)。

為了應(yīng)對(duì)圍棋的巨大復(fù)雜性,AlphaGo采用了一種新穎的機(jī)器學(xué)習(xí)技術(shù),結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)。

具體而言,首先是通過(guò)訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò)(policynetwork),將棋盤(pán)上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成一個(gè)概率分布。然后,訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)(valuenetwork)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè),以-1(對(duì)手的絕對(duì)勝利)到1(AlphaGo的絕對(duì)勝利)的標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。

這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大,而AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索(MCTS)中,實(shí)現(xiàn)了它真正的優(yōu)勢(shì)。最后,新版的AlphaGo產(chǎn)生大量自我對(duì)弈棋局,為下一代版本提供了訓(xùn)練數(shù)據(jù),此過(guò)程循環(huán)往復(fù)。

AlphaGo如何決定落子

在獲取棋局信息后,AlphaGo會(huì)根據(jù)策略網(wǎng)絡(luò)探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。

在分配的搜索時(shí)間結(jié)束時(shí),模擬過(guò)程中被系統(tǒng)最頻繁考察的位置將成為AlphaGo的最終選擇。在經(jīng)過(guò)先期的全盤(pán)探索和過(guò)程中對(duì)最佳落子的不斷揣摩后,AlphaGo的搜索算法就能在其計(jì)算能力之上加入近似人類(lèi)的直覺(jué)判斷。

DemisHassabis表示,AlphaGo不只是模仿其他人類(lèi)選手的下法,而且在不斷創(chuàng)新。

例如,在與李世石第二局里對(duì)弈第37步,這一步是Demis在整個(gè)比賽中感到最震驚的一步。

Demis解釋道:在圍棋中有兩條至關(guān)重要的分界線,從右數(shù)第三根線。如果在第三根線上移動(dòng)棋子,意味著你將占領(lǐng)該線右邊的領(lǐng)域。而如果是在第四根線上落子,意味著你計(jì)劃向棋盤(pán)中部進(jìn)軍,潛在的,未來(lái)你會(huì)占棋盤(pán)上其他部分的領(lǐng)域,可能和你在第三根線上得到的領(lǐng)域相當(dāng)。

因此,在過(guò)去的3000多年里,人們普遍認(rèn)為在第三根線上落子和第四根線上落子有著相同的重要性。但在第37步中,阿爾法狗卻把棋子落在了第五條線,進(jìn)軍棋局的中部區(qū)域。“這可能意味著,在過(guò)去幾千年里,人們低估了棋局中部區(qū)域的重要性。”

值得一提的是,和去年戰(zhàn)勝李世石的AlphaGo相比,DeepMind科學(xué)家DavidSilver稱現(xiàn)在AlphaGo要更強(qiáng)三子,他介紹道:“與李世石對(duì)戰(zhàn)的AlphaGo在云上有50個(gè)TPUs在運(yùn)作,搜索50個(gè)棋步為10000個(gè)位置/秒,而5月23日打敗柯潔的AlphaGoMaster則在單個(gè)TPU上進(jìn)行游戲,AlphaGo成為自己的老師,它從自己的搜索里學(xué)習(xí),有著更強(qiáng)大的策略和價(jià)值網(wǎng)絡(luò)。”

柯潔也在5月24日的微博中,對(duì)于AlphaGo團(tuán)隊(duì)給出的檢測(cè)報(bào)告感嘆:自己是在跟怎樣可怕的對(duì)手下棋。

“這個(gè)差距有多大呢?簡(jiǎn)單地解釋一下就是一人一手輪流下的圍棋,對(duì)手連續(xù)讓你下三步……又像武林高手對(duì)決讓你先捅三刀一樣……”柯潔說(shuō)。

除了下圍棋,AlphaGo還能做什么?

圍棋之外,DemisHassabis告訴記者,AlphaGo的高效算法是一種通用型的算法,也可以推廣到其他算法,把人工智能運(yùn)用到各種各樣的領(lǐng)域,如將AI用到材料設(shè)計(jì)、新藥研制上,還有現(xiàn)實(shí)生活中的應(yīng)用,如醫(yī)療、智能手機(jī)、教育等。

不過(guò)他也對(duì)第一財(cái)經(jīng)坦言,圍繞AlphaGo,背后的技術(shù)包括圖像處理、大數(shù)據(jù)分析等,這些技術(shù)目前在其他領(lǐng)域的使用還在早期探索階段,只在AlphaGo研究的中間環(huán)節(jié)某些領(lǐng)域應(yīng)用,但是在未來(lái)肯定會(huì)在多個(gè)領(lǐng)域推廣相關(guān)的技術(shù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉