最強(qiáng)AI訓(xùn)練集群 華為Atlas 900首次在AI超算領(lǐng)域應(yīng)用
掃描二維碼
隨時(shí)隨地手機(jī)看文章
兩個(gè)月前的全聯(lián)接大會(huì)上,華為發(fā)布了目前全球最快的訓(xùn)練集群Atlas 900。不過(guò),設(shè)計(jì)和制造出強(qiáng)大的硬件對(duì)于硬件提供商而言并非最困難的事情,能否將其應(yīng)用于不同領(lǐng)域體現(xiàn)出其價(jià)值才是成功的標(biāo)志。
本周五,鵬程實(shí)驗(yàn)室聯(lián)合華為在深圳發(fā)布鵬城云腦Ⅱ基本型系統(tǒng)發(fā)布會(huì),這是Atlas 900第一個(gè)外部應(yīng)用案例。這不僅代表著華為鯤鵬和昇騰雙引擎計(jì)算戰(zhàn)略的向前邁進(jìn),也是華為在5G+AI時(shí)代能否保持領(lǐng)先的關(guān)鍵。
Atlas 900落地鵬城云腦Ⅱ
Atlas 900由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,每顆昇騰910 AI處理器內(nèi)置32個(gè)達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16),總算力可達(dá)到256P~1024P FLOPS @FP16。Atlas 900發(fā)布時(shí),華為給出的數(shù)據(jù)是在Fastest cluster ResNst-50@ImageNet測(cè)試中,華為成績(jī)?yōu)?9.8秒,比第二名70.2秒的成績(jī)高出了10秒多。
峰值算力和測(cè)試成績(jī)是判斷硬件性能很好地指標(biāo),但實(shí)際中的應(yīng)用效果更為關(guān)鍵。在Atlas 900發(fā)布之時(shí),華為就介紹其聯(lián)合上海天文臺(tái)與SKA共同打造的,一張南半球的星空?qǐng)D有20萬(wàn)顆星星,當(dāng)前條件下,天文學(xué)家要從這20萬(wàn)顆星星中,找出某種特征的星體,相當(dāng)困難,需要169天的工作量。用上Atlas 900,只用10秒,就從20萬(wàn)顆星星中檢索出了相應(yīng)特征的星體。時(shí)間從169天縮減到10秒就是Atlas 900實(shí)際應(yīng)用效果最直觀地說(shuō)明。
另外,全聯(lián)接大會(huì)上,中國(guó)工程院院士、鵬城實(shí)驗(yàn)室主任高文院士也分享了鵬城實(shí)驗(yàn)室基于華為Atlas 900集群打造鵬城云腦Ⅱ的平臺(tái)規(guī)劃。兩個(gè)月之后的2019年11月29日,鵬城云腦Ⅱ基本型系統(tǒng)正式發(fā)布。高文院士介紹,鵬城云腦Ⅱ原型系統(tǒng)實(shí)現(xiàn)了100 PFLOPS的算力,并計(jì)劃到明年底擴(kuò)展至1000 PFLOPS級(jí)AI算力。
據(jù)悉,雙方目前正在聯(lián)合攻堅(jiān)AI集群的規(guī)模進(jìn)化以及AI功能的進(jìn)化,解決散熱、組網(wǎng)等影響集群擴(kuò)展的關(guān)鍵問(wèn)題,為實(shí)現(xiàn)明年1000 PFLOPS級(jí)AI算力。
1000PFLOPS是個(gè)什么概念?2019 年6月開(kāi)始,超算 TOP500 的入門門檻超過(guò) 1PFLOPS(每秒一千萬(wàn)億次浮點(diǎn)運(yùn)算),這是全球超算 TOP500 榜單 26 年以來(lái)的又一歷史性突破。根據(jù)TOP500本月發(fā)布的最新一期超算排行,排名第一的美國(guó)超算Summit(頂點(diǎn))的性能為148.6 PFLOPS。接下來(lái),超算的競(jìng)賽將進(jìn)入Exascale計(jì)算(百萬(wàn)兆級(jí)的計(jì)算,也可稱E級(jí)超算)時(shí)代,也就是1000PFLOPS級(jí)。
不過(guò),以Atlas 900為基礎(chǔ)的鵬城云腦Ⅱ是AI計(jì)算集群,雖然性能將達(dá)到E級(jí),但主要是面向AI計(jì)算,與TOP500的超算系統(tǒng)還有所區(qū)別。
需要補(bǔ)充的是,鵬城云腦是鵬程實(shí)驗(yàn)室的人工智能開(kāi)放開(kāi)源平臺(tái),鵬城云腦面向全國(guó),為人工智能基礎(chǔ)研究和應(yīng)用基礎(chǔ)研究提供多層次、多樣化的資源環(huán)境支撐,服務(wù)我國(guó)人工智能領(lǐng)域創(chuàng)新發(fā)展。此前的2018年一期工程中,鵬城云腦初步建成上線運(yùn)行了以“鵬城云腦-1”為核心的P級(jí)計(jì)算系統(tǒng)。
在鵬城云腦Ⅱ原型系統(tǒng)發(fā)布的當(dāng)天,鵬城實(shí)驗(yàn)室與深圳市政府就一系列重大項(xiàng)目簽約,向衛(wèi)生健康、公安交警、巴士交通、政務(wù)等場(chǎng)景提供鵬城云腦強(qiáng)大的AI算力,支撐市政重大項(xiàng)目智慧升級(jí)。
另?yè)?jù)雷鋒網(wǎng)了解,不斷進(jìn)化、動(dòng)態(tài)升級(jí)的鵬城云腦還將持續(xù)向國(guó)內(nèi)外的科研機(jī)構(gòu)、高等院校等組織提供云端AI算力,充分發(fā)揮華為Atlas 900集群的優(yōu)勢(shì),搭好科學(xué)研究和探索的地基。
華為高級(jí)副總裁、Cloud & AI產(chǎn)品與服務(wù)總裁侯金龍(左)與鵬城實(shí)驗(yàn)室主任高文(右)出席鵬城云腦Ⅱ發(fā)布會(huì)
Atlas 900與華為5G+AI的未來(lái)
至此,Atlas 900已經(jīng)在內(nèi)部和外部都已經(jīng)落地,但其可以更多地應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,如天文探索、氣象預(yù)測(cè)、自動(dòng)駕駛、石油勘探等領(lǐng)域。并且在實(shí)際應(yīng)用中享受到高算力帶來(lái)的優(yōu)勢(shì)。
做一個(gè)簡(jiǎn)單的對(duì)比,要實(shí)現(xiàn)256 PFLOPS的算力,經(jīng)測(cè)算如果使用通用CPU需要6195個(gè)機(jī)柜,使用GPU需要208個(gè)機(jī)柜。而基于昇騰架構(gòu)對(duì)深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化,以及芯片優(yōu)化之外增加的如板級(jí)液冷、柜級(jí)密閉絕熱等系統(tǒng)級(jí)優(yōu)化, Atlas 900集群使用16個(gè)機(jī)柜就能實(shí)現(xiàn)256 PFLOPS的算力,并且將功耗從40000千瓦降低至736千瓦,實(shí)現(xiàn)更高性價(jià)比。
當(dāng)然,將Atlas 900中既有昇騰系列AI處理器,也有鯤鵬系列CPU。華為在全聯(lián)接大會(huì)上推出了鯤鵬和昇騰雙引擎的計(jì)算戰(zhàn)略。華為技術(shù)有限公司Cloud&AI產(chǎn)品與服務(wù)總裁侯金龍近日接受雷鋒網(wǎng)等媒體采訪時(shí)表示:“這兩個(gè)計(jì)算引擎將會(huì)應(yīng)用于向各個(gè)行業(yè),我們認(rèn)為AI+5G+云會(huì)使能各個(gè)行業(yè),使各個(gè)行業(yè)進(jìn)入智能時(shí)代。目前除了鵬城實(shí)驗(yàn)室的鵬城云腦外,金融、智慧城市、電力、交通、互聯(lián)網(wǎng)等行業(yè)都采用了鯤鵬和昇騰這兩個(gè)計(jì)算引擎?!?/p>
還需指出的是,硬件生態(tài)的強(qiáng)大還需要軟件生態(tài)的協(xié)同,英特爾和英偉達(dá)在高性能計(jì)算領(lǐng)域的成功就是很好地例子。因此,在近一年的時(shí)間里,華為相繼推出訓(xùn)練和推理框架MindSpore、芯片算子庫(kù)和高度自動(dòng)化算子開(kāi)發(fā)工具CANN、一站式AI開(kāi)發(fā)管理平臺(tái)ModelArts。并且這些軟件和硬件覆蓋了云、邊、端。
不僅如此,華為還計(jì)劃打造強(qiáng)大的生態(tài)。侯金龍介紹,計(jì)算產(chǎn)業(yè)的核心就是開(kāi)發(fā)者生態(tài),華為計(jì)劃在未來(lái)三年會(huì)投資15億美元發(fā)展開(kāi)發(fā)生態(tài)。希望和各個(gè)高校一起,基于鯤鵬和昇騰的計(jì)算架構(gòu)體系聯(lián)合各個(gè)高校開(kāi)發(fā)教材,讓學(xué)生至少可以學(xué)習(xí)我們這個(gè)體系。
他還透露,明年2月份鵬城云腦和華為會(huì)舉辦一個(gè)開(kāi)發(fā)者大會(huì),規(guī)模將超過(guò)兩萬(wàn)人。
雷鋒網(wǎng)小結(jié)
對(duì)于任何一家芯片提供商而言,設(shè)計(jì)出性能和功耗都具有優(yōu)勢(shì)的芯片只是邁向成功的第一步,只有獲得用戶的認(rèn)可并且持續(xù)迭代芯片才能視為芯片的成功。對(duì)于華為而且,基于其技術(shù)和客戶的積累,推出新的硬件更容易獲得應(yīng)用,所以我們看到Atlas 900發(fā)布兩個(gè)月后就已經(jīng)有兩個(gè)應(yīng)用案例。但正如Atlas 900是一個(gè)復(fù)雜的系統(tǒng)一樣,華為要在5G和AI的時(shí)代勝出,除了硬件,強(qiáng)大的軟件和開(kāi)發(fā)者生態(tài)都至關(guān)重要,我們也看到了華為在這些方面的投入。至于結(jié)果會(huì)如何,我們將保持關(guān)注。