阿里云李津:計(jì)算在為人類爭(zhēng)取時(shí)間
在 2016 年的云棲大會(huì)上,阿里云向外界傳遞了一種洶涌的氣勢(shì)。
除了用戶井噴,技術(shù)更新以外,阿里云已經(jīng)開(kāi)始奠基很多普通人可以理解和感受的工程。阿里巴巴技術(shù)委員會(huì)主席王堅(jiān)反復(fù)提到兩個(gè)讓他感到驕傲的案例:
Maxcompute,以杭州為試點(diǎn)建設(shè)城市大腦,作為試點(diǎn)的一條直路,通過(guò)云計(jì)算就可以提高交通效率11%。
批量計(jì)算,幫助中國(guó)地震局計(jì)算地層成像,獲得的寶貴數(shù)據(jù)可以勘探資源和預(yù)測(cè)地震。
當(dāng)阿里云產(chǎn)品總監(jiān)李津在現(xiàn)場(chǎng)“目露兇光”地宣布阿里云降價(jià)一半的時(shí)候,已經(jīng)向外界足夠清晰地傳遞了一個(gè)信息:阿里云認(rèn)為自己有足夠的技術(shù)力量大幅降低云計(jì)算的成本,并且以此在云計(jì)算市場(chǎng)“大開(kāi)殺戒”了。
在李津眼里,阿里云的攻城略地,歸功于技術(shù)實(shí)力。而技術(shù)實(shí)力的核心只有一個(gè),那就是阿里云超乎想象的計(jì)算能力。用他的話說(shuō)就是:“計(jì)算能力,是所有的能力匯集在一起的能力。”
但是阿里云在商業(yè)上的成功,遠(yuǎn)不是李津的終極目標(biāo)。他認(rèn)為,計(jì)算能力對(duì)于人類的意義,也許超過(guò)我們的想象。他告訴雷鋒網(wǎng):
計(jì)算說(shuō)到底是在為人類爭(zhēng)取時(shí)間。
【阿里云產(chǎn)品總監(jiān) 李津】
摩爾定律的“涅槃”
摩爾定律并沒(méi)有失效,只不過(guò)是放慢了腳步。硬件的制程和效能的提升并沒(méi)有停止,只是可能做不到18個(gè)月翻一倍的速度了。但是這并不妨礙我們的計(jì)算效率翻倍。
李津看到的計(jì)算能力提升,不僅僅是硬件自己的責(zé)任,而是硬件和軟件效率的綜合結(jié)果。
去年一年,中國(guó)新購(gòu)的 X86 架構(gòu)服務(wù)器為 200 萬(wàn)臺(tái)左右。但是這些計(jì)算機(jī)的使用效率卻只有3%-5%。
至于個(gè)人的設(shè)備,包括你買(mǎi)回家的PC、筆記本,每天只有不到 1% 的時(shí)間處于工作狀態(tài)。就算是你使用最頻繁的手機(jī),里面的核心每天都有大量的時(shí)間處于閑置狀態(tài)。也就是說(shuō),在世界上有大量的計(jì)算能力是處在閑置的狀態(tài),被浪費(fèi)了。
“壓榨計(jì)算性能”,是硬件摩爾定律疲軟之后,李津用來(lái)提升阿里云算力的“殺手锏”。簡(jiǎn)單來(lái)說(shuō),代碼要成為一條條皮鞭,不停抽打閑置的 CPU 和 GPU,從這個(gè)角度來(lái)看,摩爾定律沒(méi)有死,只是用另一種形式“涅槃”了。
【英特爾公司創(chuàng)始人之一 摩爾定律的提出者 戈登·摩爾】
雖說(shuō)根據(jù)數(shù)據(jù)來(lái)看,在軟件效率的提升方面還有很多空間。但是要提升數(shù)萬(wàn)個(gè)核心協(xié)調(diào)工作時(shí)的調(diào)度效率,是一項(xiàng)巨大而繁復(fù)的工作。
虛擬化的技術(shù)是在美國(guó)誕生的。所以大多數(shù)云計(jì)算企業(yè)采用的無(wú)論是底層的隔離技術(shù),還是數(shù)字保障的能力,都掌握在美國(guó)巨頭手里。但是在阿里云的底層,我們自己寫(xiě)了所有的代碼,這就讓我們從最底層做出改變成為了可能。根據(jù)現(xiàn)有的數(shù)據(jù),我們已經(jīng)可以預(yù)見(jiàn)未來(lái)底層計(jì)算資源會(huì)大量地釋放出來(lái)。這也是我們敢于降價(jià)的原因。
在李津看來(lái),阿里云在技術(shù)上的“狂奔”,正是對(duì)人類寶貴計(jì)算資源最大的尊重。
永無(wú)止境的進(jìn)化
調(diào)配芯片資源來(lái)提高“軟件摩爾效率”,正是阿里云的核心系統(tǒng)“飛天”的職責(zé)。那么,飛天打算如何“壓榨“芯片的計(jì)算性能呢?李津舉了一個(gè)例子:
“CPU 所進(jìn)行的大規(guī)模通用計(jì)算和 GPU 所進(jìn)行的高密度計(jì)算,就像是公共汽車(chē)和跑車(chē)的區(qū)別,一個(gè)可以裝進(jìn)很多人,一個(gè)可以跑出很快的速度。但這兩種計(jì)算方式目前很相互代替,以現(xiàn)有的技術(shù)來(lái)看在可預(yù)見(jiàn)的未來(lái)也很難融合。
至于未來(lái)會(huì)出現(xiàn)一個(gè)兼顧 CPU 和 GPU 優(yōu)點(diǎn)的芯片,還是出現(xiàn)很多專用的 XPU,很難做出判斷。
李津告訴雷鋒網(wǎng),讓公交車(chē)跑出跑車(chē)的速度,目前看來(lái)不現(xiàn)實(shí)。阿里云能做的是“增強(qiáng)對(duì)公共汽車(chē)和跑車(chē)的管理”,讓這個(gè)系統(tǒng)變得“總體有效”。
例如特斯拉車(chē)上裝的是 GPU,因?yàn)樗淖詣?dòng)駕駛系統(tǒng),要處理很多音頻和視頻的信息。阿里云的飛天操作系統(tǒng)主要負(fù)責(zé)計(jì)算資源調(diào)度,遇到實(shí)時(shí)性要求高的計(jì)算,就使用GPU,對(duì)于實(shí)時(shí)性要求不高的計(jì)算,就使用通用計(jì)算的 CPU。
就是通過(guò)一行行代碼的調(diào)度改進(jìn),可以提高阿里云整體的計(jì)算效率。
很多行業(yè)人士,包括李津都認(rèn)可一個(gè)云計(jì)算的清晰進(jìn)化路徑:從云存儲(chǔ),到分布式計(jì)算,到大規(guī)模分布式計(jì)算,到人工智能。
在他眼里,所謂明天的技術(shù),“自動(dòng)駕駛汽車(chē)”“AI”,本質(zhì)上都是計(jì)算能力提升到了一定階段的進(jìn)化形態(tài)。
至于在AI之后,計(jì)算能力再進(jìn)化,會(huì)發(fā)生什么呢?他說(shuō):
計(jì)算能力超越一個(gè)高點(diǎn)之后,就會(huì)表現(xiàn)出“直覺(jué)”。就像我們?nèi)祟惖闹庇X(jué)一樣,你難以感受到自己大腦復(fù)雜的計(jì)算過(guò)程,但是卻能在很短的時(shí)間內(nèi)得到正確的答案。
我覺(jué)得,世界上所有的事情,都是可以計(jì)算的。如果世界上存在一個(gè)無(wú)所不能的神的話,他對(duì)于你所有的問(wèn)題,都可以給出清晰而簡(jiǎn)單的回答。
李津認(rèn)為,阿里云從創(chuàng)建的第一天起,就是為了獲得這種解答一切的能力。掙錢(qián)只是夢(mèng)想的副產(chǎn)品。
所以,從根本上講判斷云計(jì)算能力的指標(biāo)其實(shí)很簡(jiǎn)單,就是計(jì)算力。你的推進(jìn)能力如果比別人弱了,就是輸了。
阿里云做了很多樣板工作,普通人也能感受到云計(jì)算的強(qiáng)大,但真正的核心計(jì)算能力的推進(jìn),人們很難看到。但這確實(shí)云計(jì)算最核心的能力,在這個(gè)世界上沒(méi)有任何人能幫你,只能靠我們自己的科學(xué)家。
計(jì)算在為人類爭(zhēng)取時(shí)間
先知的奔走呼號(hào),經(jīng)常被人們恥笑為“癡人說(shuō)夢(mèng)”。從某種程度上講,被“眼前的茍且”籠罩的普通人難以感受到人類對(duì)于計(jì)算力的迫切渴求。
李津給雷鋒網(wǎng)講了如下的故事。
我們無(wú)法準(zhǔn)確預(yù)測(cè)地震,因?yàn)槲覀儗?duì)于地殼內(nèi)部的信息,知之甚少。甚至,我們對(duì)自己腳下的大地究竟是怎樣的結(jié)構(gòu),都沒(méi)有一個(gè)完整的成像。
為了獲得大地之下清晰的圖景,中國(guó)國(guó)家地震局準(zhǔn)備通過(guò)遍布全國(guó)的上千個(gè)地震臺(tái)進(jìn)行測(cè)量。
之所以把對(duì)大地的成像工作交給地震局,是由于我們的技術(shù)無(wú)法做到通過(guò)打井的方式直接對(duì)大地深處進(jìn)行探測(cè),所以地震波成為了“感受”大地的最好方法。
【利用地震波實(shí)現(xiàn)地底成像的原理示意圖/圖片由王偉濤博士提供】
國(guó)家地震局的王偉濤博士告訴雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號(hào)關(guān)注),繪制出大地影像的第一步,是對(duì)不同地震臺(tái)每天獲得的數(shù)據(jù)進(jìn)行計(jì)算。這樣的計(jì)算,需要對(duì)任意兩個(gè)地震臺(tái)之間的所有數(shù)據(jù)分量做互相關(guān)計(jì)算。
也就是說(shuō),每一個(gè)地震臺(tái)之間的每一天的每一個(gè)向度的數(shù)據(jù),都要一次次地進(jìn)行相互疊加計(jì)算。這個(gè)計(jì)算量是天文級(jí)的。
王偉濤博士在阿里云上進(jìn)行了一個(gè)并不是全量數(shù)據(jù)的計(jì)算。但僅僅是這個(gè)計(jì)算,就需要對(duì)50萬(wàn)條路徑進(jìn)行計(jì)算,疊加處理的函數(shù)達(dá)到10億個(gè)。如果使用傳統(tǒng)的單機(jī)運(yùn)算,需要的時(shí)間是10個(gè)月。
阿里云的計(jì)算力,把整個(gè)計(jì)算的時(shí)間壓縮到了48個(gè)小時(shí)。
【云計(jì)算加速的流程和模式/圖片由王偉濤博士提供】
李津感慨地說(shuō):
當(dāng)計(jì)算結(jié)果輸出的時(shí)候,我們所有的技術(shù)人員都沉默了。我們多么渴望這樣的數(shù)據(jù)早幾十年被計(jì)算出來(lái),這樣我們就能為人類預(yù)測(cè)地震爭(zhēng)取寶貴的時(shí)間。如果重新來(lái)過(guò),當(dāng)我們面對(duì)曾經(jīng)那些可怕的地震時(shí),歷史絕不會(huì)是我們經(jīng)歷的那樣。但技術(shù)不會(huì)憑空降臨,有時(shí)我們必須等待。
計(jì)算為人類爭(zhēng)取時(shí)間的故事,還有很多。
中國(guó)剛剛落成的大型射電望遠(yuǎn)鏡 FAST,就在用阿里云的計(jì)算力對(duì)遙遠(yuǎn)的太空進(jìn)行分析。在 FAST 之前,世界上最好的天文望遠(yuǎn)鏡只發(fā)現(xiàn)了 1000 顆脈沖星。而預(yù)計(jì) FAST 每年就可以發(fā)現(xiàn) 7000 顆脈沖星。
這,讓人類第一次獲得如此強(qiáng)大的能力,來(lái)探索宜居星球。我們的征途是星辰大海,而星辰大海,拷問(wèn)的是人類最頂級(jí)的計(jì)算能力。
【中國(guó) 500 米口徑球面射電望遠(yuǎn)鏡 FAST】
根據(jù)國(guó)家天文臺(tái)給出的數(shù)據(jù),郭守敬望遠(yuǎn)鏡(LAMOST)每年產(chǎn)生 10TB 的數(shù)據(jù),而國(guó)家天文臺(tái)(LSST),每天就會(huì)產(chǎn)生 10TB 的數(shù)據(jù),而探測(cè) 137 億光年之外宇宙的 FAST,每天晚上產(chǎn)生的數(shù)據(jù)就達(dá)到 50TB。預(yù)計(jì)到 2025 年,天文觀測(cè)相關(guān)的數(shù)據(jù)為每年 250 億 TB。
對(duì)如此大量數(shù)據(jù)的分析,只有云計(jì)算可能做到。
我們生活的地球沒(méi)有備份,早一天得到宇宙的真理,早一天發(fā)現(xiàn)宜居的星球,都有可能改變我們的命運(yùn)。這不是杞人憂天,因?yàn)樯系蹚膩?lái)不會(huì)對(duì)我們施以一絲憐憫,我們生活在宇宙中的權(quán)力,來(lái)自手中鋼鐵般的計(jì)算力。
這些,是無(wú)法被計(jì)算的價(jià)值。