淺談數(shù)據(jù)中心界的Linux
開(kāi)放或封閉,它曾經(jīng)是IT行業(yè)的焦點(diǎn),Linus Torvalds出版的Linux以發(fā)展的力量改變了世界!
一、開(kāi)放是IT行業(yè)不可阻擋的浪潮
1991年,芬蘭大學(xué)生LinusTorvalds發(fā)布了Linux的第一版0.02,至今已有近30年的歷史。在這快30年的時(shí)間里,Linux所搭建的開(kāi)放生態(tài)迅猛生長(zhǎng)。
根據(jù)2019年的相關(guān)統(tǒng)計(jì):
全球TOP500超級(jí)計(jì)算機(jī)100%運(yùn)行的是Linux。全球排名前25位的網(wǎng)站中有23個(gè)使用Linux。全球排名前100萬(wàn)的Web服務(wù)器中有96.3%在Linux上運(yùn)行。全球90%的云基礎(chǔ)架構(gòu)都在Linux上運(yùn)行。有54.1%的專(zhuān)業(yè)開(kāi)發(fā)人員使用Linux作為平臺(tái)。
另外,根據(jù)2018年的統(tǒng)計(jì),安卓占據(jù)了移動(dòng)操作系統(tǒng)市場(chǎng)的75.16%,所有智能手機(jī)中有85%基于Linux。
Linux的強(qiáng)大在于一直堅(jiān)持開(kāi)源開(kāi)放,在這種思想的號(hào)召下,OpenStack、Kubernetes等軟件的流行,無(wú)不顯示出開(kāi)源開(kāi)放賦予IT產(chǎn)業(yè)的強(qiáng)大動(dòng)力。軟件領(lǐng)域的“車(chē)同軌、書(shū)同文、統(tǒng)一度量衡”也在影響著底層基礎(chǔ)架構(gòu)。在數(shù)據(jù)中心界,開(kāi)放也成為加速產(chǎn)業(yè)發(fā)展的重要基石。
二、開(kāi)放計(jì)算,數(shù)據(jù)中心界的Linux
一直以來(lái),數(shù)據(jù)中心能耗,密度,綠色環(huán)保,基于業(yè)務(wù)的創(chuàng)新技術(shù)如AI、邊緣的快速落地是困擾數(shù)據(jù)中心建設(shè)者的重要因素。其中,數(shù)據(jù)中心最不缺乏的就是創(chuàng)新。比如在能耗方面,F(xiàn)acebook的數(shù)據(jù)中心PUE最低降到了1.07,也就是說(shuō)每消耗1.07度電,有1度完全是由服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)等IT設(shè)備消耗的。但技術(shù)從創(chuàng)新到大規(guī)模應(yīng)用是很慢的,1.07只體現(xiàn)了Facebook的領(lǐng)先水平,同期中國(guó)數(shù)據(jù)中心PUE的平均值遠(yuǎn)超2.5。而隨著數(shù)字化轉(zhuǎn)型的加快,未來(lái)數(shù)據(jù)中心面對(duì)的挑戰(zhàn)不止是能耗,還會(huì)更多。
因此,2011年,F(xiàn)acebook聯(lián)合Intel、高盛等發(fā)起首個(gè)開(kāi)放硬件組織,Open Compute Project(開(kāi)放計(jì)算項(xiàng)目),旨在促進(jìn)為行業(yè)制定開(kāi)放的標(biāo)準(zhǔn),讓新穎技術(shù)、最佳實(shí)踐能夠在產(chǎn)業(yè)中共享,隨后微軟、谷歌、IBM、浪潮等也紛紛加入其中,共同應(yīng)對(duì)未來(lái)數(shù)據(jù)中心的挑戰(zhàn)。
2012年,阿里巴巴、騰訊、百度、中國(guó)移動(dòng)、聯(lián)通、電信、浪潮等發(fā)起成立ODCC(開(kāi)放數(shù)據(jù)中心委員會(huì))的前身天蝎組織,推動(dòng)了中國(guó)基礎(chǔ)設(shè)施標(biāo)準(zhǔn)化。
2016年底,LinkedIn又發(fā)起了OPEN19,只是OPEN19定義的是基于傳統(tǒng)技術(shù)標(biāo)準(zhǔn)19英寸寬的整機(jī)柜服務(wù)器,與OCP和ODCC面向大型CSP數(shù)據(jù)中心不同,OPEN19適合于任何規(guī)模的數(shù)據(jù)中心。
之后,開(kāi)放計(jì)算進(jìn)展順利,所有頂級(jí)互聯(lián)網(wǎng)數(shù)據(jù)中心都已經(jīng)大規(guī)模落地了開(kāi)放計(jì)算服務(wù)器,通信、金融、能源等關(guān)鍵領(lǐng)域的TOP企業(yè)也紛紛加入這些開(kāi)源組織并在數(shù)據(jù)中心建設(shè)中加以實(shí)踐,開(kāi)放計(jì)算似乎正在成為數(shù)據(jù)中心界的Linux。
三、機(jī)會(huì)總是留給有準(zhǔn)備的人
機(jī)會(huì)總是留給有準(zhǔn)備的人,我們不難發(fā)現(xiàn)開(kāi)放計(jì)算組織中,那些積極推動(dòng)建立數(shù)據(jù)中心標(biāo)準(zhǔn),加快技術(shù)創(chuàng)新到產(chǎn)業(yè)生態(tài)的落地的早期成員,像谷歌,F(xiàn)acebook,微軟,阿里,騰訊,百度,浪潮,也正是在云計(jì)算十年中脫穎而出的企業(yè)。在這些掌握產(chǎn)業(yè)核心技術(shù)、主導(dǎo)數(shù)據(jù)中心及基礎(chǔ)架構(gòu)及技術(shù)創(chuàng)新的企業(yè)中,浪潮是唯一同時(shí)加入OCP、ODCC、OPEN19全球三大開(kāi)放組織的核心成員。
不久前,在2020年浪潮云數(shù)據(jù)中心合作伙伴大會(huì)(IPF2020)上,浪潮集團(tuán)執(zhí)行總裁、浪潮首席科學(xué)家王恩東首次提出“智算中心”,指出智算中心是智慧時(shí)代社會(huì)經(jīng)濟(jì)運(yùn)行必不可少的基礎(chǔ)設(shè)施,開(kāi)放計(jì)算和AI是智算中心重要發(fā)展方向,其中開(kāi)放計(jì)算更是構(gòu)建智算中心的基石。
在隨后浪潮集團(tuán)高級(jí)副總裁彭震的演講中,這樣描繪智算中心:它就像一個(gè)大型電廠,基于開(kāi)放計(jì)算的融合架構(gòu)、AI等創(chuàng)新技術(shù)是構(gòu)建電廠的關(guān)鍵技術(shù);數(shù)據(jù)是電廠最重要的原材料,經(jīng)過(guò)智算中心計(jì)算力加工后,就可以生成對(duì)外的智慧計(jì)算服務(wù)。浪潮智算中心的提出不僅為建設(shè)新一代算力基礎(chǔ)設(shè)施指明了方向,也為開(kāi)放的產(chǎn)業(yè)生態(tài)構(gòu)建了一幅藍(lán)圖。
從Linux到開(kāi)放計(jì)算,ICT產(chǎn)業(yè)開(kāi)放的邊界正變得越來(lái)越廣闊。彭震表示:未來(lái)產(chǎn)業(yè)會(huì)面臨越來(lái)越多的挑戰(zhàn),這些挑戰(zhàn)依靠一個(gè)廠商解決不了,所以,全球的開(kāi)發(fā)者會(huì)聚集在一起開(kāi)發(fā)解決方案,然后把成果以開(kāi)源方式分享給所有人,迅速上規(guī)模,形成生態(tài)。
浪潮將持續(xù)引領(lǐng)開(kāi)放計(jì)算體系,打造智算中心基石,構(gòu)建從模式開(kāi)放到技術(shù)開(kāi)放、從產(chǎn)品開(kāi)放到服務(wù)開(kāi)放的開(kāi)放計(jì)算體系。
首先,模式開(kāi)放,就是以客戶(hù)場(chǎng)景為核心,與合作伙伴一起聯(lián)合規(guī)劃、協(xié)同設(shè)計(jì)、敏捷研發(fā)、快速交付。
其次,技術(shù)開(kāi)放,無(wú)論是以液冷、循環(huán)利用為代表的冷卻技術(shù),還是以RISC-V、FPGA、CXL、智能網(wǎng)卡為代表的基礎(chǔ)技術(shù),堅(jiān)持技術(shù)領(lǐng)先。
再次,產(chǎn)品開(kāi)放,即以開(kāi)放架構(gòu)和開(kāi)源為指導(dǎo),基于先進(jìn)的開(kāi)放硬件架構(gòu),模塊化、標(biāo)準(zhǔn)化構(gòu)建MDC,并引領(lǐng)其發(fā)展方向。最后,基于先進(jìn)的開(kāi)源軟件,打造標(biāo)準(zhǔn)、高效、敏捷的智算中心基礎(chǔ)軟件平臺(tái)和統(tǒng)一管理平臺(tái),并最終形成開(kāi)放的云數(shù)智一體化服務(wù)。
四、創(chuàng)新不斷,征途不止
隨著人工智能計(jì)算的指數(shù)級(jí)增長(zhǎng),目前全球已有上百家公司投入新型AI芯片的研發(fā)與設(shè)計(jì),AI計(jì)算芯片多元化趨勢(shì)愈發(fā)明顯。但因?yàn)楦鲝S商在AI開(kāi)發(fā)中采用了不同的技術(shù)路線,導(dǎo)致芯片的接口、互聯(lián)、協(xié)議上互不兼容,導(dǎo)致數(shù)據(jù)中心用戶(hù)在AI計(jì)算基礎(chǔ)設(shè)施建設(shè)中不得不面臨硬件分裂化和生態(tài)割裂化的重大挑戰(zhàn)。
IPF2020上,浪潮發(fā)布了全球首款A(yù)I開(kāi)放加速系統(tǒng)MX1,符合OCP社區(qū)的OAI規(guī)范,可支持各類(lèi)符合OAM規(guī)范的加速器,極大降低開(kāi)發(fā)AI加速器技術(shù)門(mén)檻。
彭震表示:“浪潮致力于與業(yè)界領(lǐng)導(dǎo)者共同推進(jìn)AI行業(yè)規(guī)范的建立,希望通過(guò)推動(dòng)智算中心建設(shè),形成開(kāi)放共識(shí)的AI基礎(chǔ)設(shè)施規(guī)范,促進(jìn)AI芯片乃至AI產(chǎn)業(yè)的良性發(fā)展,這一愿景也與全球開(kāi)放計(jì)算OCP社區(qū)形成高度共識(shí)。MX1作為智算中心在AI算力生產(chǎn)領(lǐng)域的首個(gè)開(kāi)放標(biāo)準(zhǔn)產(chǎn)品,將有力的推動(dòng)開(kāi)放計(jì)算與人工智能的融合,加快多種AI芯片在智算中心落地,促進(jìn)產(chǎn)業(yè)AI的生態(tài)繁榮。”
MX1可在同一AI服務(wù)器上支持多種符合OAM(OCP Accelerator Module)規(guī)范的AI芯片,并支持構(gòu)建數(shù)量達(dá)32顆芯片的大型計(jì)算系統(tǒng),實(shí)現(xiàn)超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型并行計(jì)算。
具體來(lái)看,MX1支持高速互聯(lián)技術(shù),搭載高速互聯(lián)AI芯片,當(dāng)前支持互聯(lián)帶寬可達(dá)224Gbps,理論支持互聯(lián)帶寬最高可達(dá)896Gbps,可擴(kuò)展構(gòu)建高達(dá)32顆芯片的大型計(jì)算系統(tǒng),實(shí)現(xiàn)超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型并行計(jì)算,充分釋放算力。
除了MX1,浪潮還參與貢獻(xiàn)和開(kāi)發(fā)了一系列開(kāi)放計(jì)算產(chǎn)品和規(guī)范,貢獻(xiàn)第一款通過(guò)ODCC認(rèn)證的天蝎多節(jié)點(diǎn)服務(wù)器,首款面向云基礎(chǔ)架構(gòu)優(yōu)化的2U四路服務(wù)器全球參考設(shè)計(jì)NF8260M5,第一款符合OTII標(biāo)準(zhǔn)的邊緣計(jì)算服務(wù)器、開(kāi)發(fā)OpenRMC標(biāo)準(zhǔn)等等。
參與開(kāi)源組織,不斷為基本技術(shù)和行業(yè)標(biāo)準(zhǔn)做出貢獻(xiàn)以及與合作伙伴一起加速新技術(shù)的實(shí)施一直是浪潮推動(dòng)數(shù)據(jù)中心發(fā)展的旗幟,如今已成為現(xiàn)實(shí)。許多傳統(tǒng)企業(yè)已逐漸成為加快數(shù)字化轉(zhuǎn)型的重要戰(zhàn)略,隨著開(kāi)源組織團(tuán)隊(duì)的不斷壯大,我們有理由相信,數(shù)據(jù)中心世界中的開(kāi)放計(jì)算將成為L(zhǎng)inux,并激發(fā)整個(gè)工業(yè)生態(tài)系統(tǒng)的增長(zhǎng)。