云計算和邊緣計算這兩個詞是近幾年被電子行業(yè)提及頻次最高的詞,伴隨相關(guān)應用逐步融入社會各個領(lǐng)域,數(shù)據(jù)處理便成為了行業(yè)首當其沖的領(lǐng)域。
此前,騰訊宣布TARS微服務開發(fā)框架已成功移植至Arm CPU架構(gòu);百度在其數(shù)據(jù)中心采用了基于Arm架構(gòu)的智能計算;亞馬遜AWS云在自己的云服務器上做了一個基于Arm架構(gòu)的自研項目……
事實上,Arm架構(gòu)服務器由于其高性能以及自身具備的低功耗素質(zhì),已成為數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)的焦點。
9月23日,Arm宣布Neoverse新增Arm Neoverse V1平臺以及第二代的N系列平臺Neoverse N2,兩款新品使得Neoverse再度進階,而新產(chǎn)品直指的目標則是超級計算機和數(shù)據(jù)中心。21ic中國電子網(wǎng)記者受邀參加此次新品發(fā)布的在線研討會,揭秘Neoverse處理器IP背后的發(fā)展。
01
翻倍,性能沖刺之路
首先,Arm新發(fā)布的這兩款Neoverse平臺究竟有多強?直接上數(shù)據(jù)。通過Arm給出的數(shù)據(jù),相比去年推出的Neoverse N1,代號為“Zeus”的Neoverse V1比N1單線程性能提升50%,代號為“Perseus”的Neoverse N2在相同水平的功率和面積之下比N1單線程性能提升40%。
另外,會議上,Neoverse平臺的最新路線圖也一并被披露,圖示顯示Neoverse目前處于制程節(jié)點7/5nm上,支持PCle Gen5、DDR5、HBM2e和CCIX 1.1;至2021年將全面進入5nm制程節(jié)點,支持HBM3、CCIX 2.0、CXL 2.0;至2022年將進入5/3nm制程節(jié)點,支持CCIX next和CXL next。
值得一提的是,會議上,Arm承諾后續(xù)的Neoverse產(chǎn)品在2022年以后,每年也都會有30%的性能提升。Arm基礎(chǔ)設(shè)施事業(yè)部高級副總裁兼總經(jīng)理Chris Bergey表示,這與Arm工程團隊的努力和投入是分不開的,另一方面,能夠保持穩(wěn)定的性能提升與Arm自身軟件生態(tài)的逐漸成熟有很大關(guān)系,例如很多云原生的軟件現(xiàn)在可以比較無縫運行在Arm架構(gòu)上面。
圖1:Arm Neoverse最新技術(shù)發(fā)展路線圖
在核心和線程上,以云工作負載為例,可以看出Neoverse V1在96核96線程下?lián)碛袠O佳的處理能力,可以在核心數(shù)更少的情況下發(fā)揮更好的性能;Neoverse N2則可以多達128核128線程的設(shè)計,擁有極強的擴展性,并在同樣的擴展能力下?lián)碛斜萅1更強的性能。
圖2:云工作負載使用內(nèi)核數(shù)量
文行至此,可能大家并沒有感受到本次發(fā)布的Neoverse V1和N2的強大?那么從Neoverse從初版發(fā)布到現(xiàn)如今推出產(chǎn)品的歷史來看起。
Neoverse處理器IP首次亮相于2018年10月18日,同為Arm指令集的IP產(chǎn)品,不同于Cortex系列,Neoverse面向的是高性能計算市場。當時Neoverse平臺產(chǎn)品中代號“Cosmos”的產(chǎn)品是基于16nm工藝,A72、A75核心的產(chǎn)品。當時公布的路線圖中,Arm提出了每年每代產(chǎn)品的30%的單線程性能提升,每一代提升30%也是Arm的“老傳統(tǒng)”。
圖3:2018年Arm公布的Neoverse發(fā)展路線圖
但時間推移到下一代產(chǎn)品發(fā)布時間2019年2月21日,Neoverse N1和E1平臺被公布出來后,一切預測都被推翻了。屬于7nm工藝時代的Neoverse N1相比A72的“Cosmos”單線程性能提升了60%,超出預計整整一倍,關(guān)鍵云端負載性能則提升了高達2.5倍。Neoverse E1作為低功耗和低面積的代表,也擁有不俗的實力,與Arm前幾代方案相比,吞吐量性能提升超過2.7倍,吞吐效率提升超2.4倍,計算性能提升超2倍。
圖4:2019年Arm公布的Neoverse發(fā)展路線圖
上文有提到,V1比N1單線程性能提升50%,N2比N1單線程性能提升40%,而這一切的基礎(chǔ)都是在N1超出前一代60%的基礎(chǔ)上完成的。換言之,也就是說V1比“Cosmos”單線程性能出140%,N2比“Cosmos”單線程性能高出124%,超額兩倍完成了2018的初版路線規(guī)劃。
02
定位,面向不同市場
Neoverse平臺系列幾經(jīng)周折,現(xiàn)如今形成了三個定位,這種定位也與現(xiàn)今數(shù)據(jù)中心市場相符合。另一方面,也與Arm的Cortex的最新定位相呼應,即無視面積和功耗、純粹注重高性能的Cortex-X1、PPA(功率、性能、面積)最大化的Cortex-A78。
1、V系列:追求終極性能的系列產(chǎn)品,性能優(yōu)先于面積和功耗。擁有最高的帶寬和性能表現(xiàn),以及最大的Buffers(緩沖區(qū))、Caches(緩存)、Windows(窗口)和Queues(隊列),隨之而來的是最大的面積和功耗。
2、N系列:滿足橫向擴展性能需求的系列產(chǎn)品,最大化PPA,即在性能、功耗和面積上保持平衡。擁有更強的擴展性,更加平衡的性能,同樣面積或TDP下更多的核心數(shù)。因為支持更多的線程,因此在橫跨云、智能網(wǎng)卡(SmartNICs)、企業(yè)網(wǎng)絡(luò)、邊緣設(shè)備上都擁有非常廣闊的應用的場景。
3、E系列:低功耗小面積系列產(chǎn)品,面積和功耗優(yōu)先于性能。擁有更好的效率、吞吐量和線程數(shù),當然最重要的是在面積和功耗上擁有最好的優(yōu)化。另外,E1還支持同步多線程(SMT)技術(shù),能夠提供網(wǎng)絡(luò)效果優(yōu)化。
圖5:三個系列不同的定位
市場方面,Chris Bergey告訴記者,V系列、N系列、E系列會根據(jù)合作伙伴和客戶對于功耗、性能和面積上不同需求進行配置,假若客戶更看重線程,N系列便是首先,假若客戶需要高性能計算工作負載,V系列就能提供更大的價值。
值得一提的是,Neoverse V1和N2均支持可伸縮矢量擴展(Scalable Vector Extensions, SVE),而SVE則可基于未知寬度向量單元的軟件編程模型,執(zhí)行單指令流多數(shù)據(jù)流(SIMD)整數(shù)、bfloat16、浮點指令。另外,SVE還可確保軟件編碼的可移植性與使用壽命,同時兼顧高效的執(zhí)行。
利用SVE,半導體廠商可以對SVE電壓和頻率過渡實施控制,開發(fā)者可以在窄矢量和寬矢量之間隨意混合代碼。
SiPearl公司營銷副總裁Craig Prunty表示:“Neoverse路線圖上的SVE為HPC和ML帶來了巨大的潛力,我們非??春眠@項技術(shù)對未來Arm生態(tài)系統(tǒng)的發(fā)展?!?
03
生態(tài),軟硬件鑰匙
在硬件生態(tài)方面,支持重要的兩個技術(shù)便是CCIX(針對加速器的緩存一致性互聯(lián))和CXL(開放互聯(lián)技術(shù))。CCIX主要用于跨芯片間互連,用于打造異構(gòu)封裝系統(tǒng),支持完整緩存一致性;CXL則是基于PCle 5.0的規(guī)范,可讓CPU與GPU、FPGA等加速器更好地連接,帶來更好地帶寬和內(nèi)存一致性,簡化硬件設(shè)計難度,降低系統(tǒng)成本。
當然,異構(gòu)計算已逐漸成為現(xiàn)在數(shù)據(jù)發(fā)展的重要“根據(jù)地”,事實上,這也是生態(tài)中的一環(huán)。數(shù)據(jù)中心無論是存儲還是數(shù)據(jù)加速,整體趨勢是分布式的,這便對性能和功耗提出嚴苛的要求。Chris Bergey表示,Arm已看到很多異構(gòu)計算的產(chǎn)品與方案目前都開始基于Arm的架構(gòu),例如存儲控制器、智能網(wǎng)卡中用到的計算CPU。
在異構(gòu)計算方面,對于Arm來說,如何提供緊耦合或是定制化的能力,甚至是通過多核封裝或多芯片組裝技術(shù),將來自生態(tài)系統(tǒng)、IP技術(shù)與云廠商的需求與技術(shù)整合在一起,是很大的機遇。不論是基于FPGA、GPU、TPU單元的加速器,數(shù)據(jù)的移動是必不可少的,Arm架構(gòu)的可擴展性便是優(yōu)異的解決方案。
圖6:CCIX和CXL領(lǐng)導智能未來
在軟件生態(tài)方面,Chris Bergey為記者介紹,Arm將軟件分為兩種類型,一是云原生的軟件,二是傳統(tǒng)的企業(yè)級軟件。云原生軟件是Arm一直以來重視的領(lǐng)域,在這個領(lǐng)域Arm現(xiàn)在是擁有最大的持續(xù)集成/持續(xù)交付(CI / CD)平臺的一等公民,并在大多數(shù)編程語言的生態(tài)環(huán)境中,Arm都扮演著核心角色,同時Arm也看到云原生技術(shù)在邊緣計算領(lǐng)域變得越來越重要,在這一領(lǐng)域我們推出了Project Cassini項目。
此外,隨著V-RAN、O-RAN等項目的崛起,云原生軟件也將成為5G未來發(fā)展的一個重要組成部分。 另一方面,傳統(tǒng)企業(yè)軟件領(lǐng)域出現(xiàn)了“軟件即服務”(SaaS)的發(fā)展趨勢。面對這一趨勢,由于在Arm架構(gòu)之上能夠創(chuàng)造非常有利的軟件即服務產(chǎn)品,因此很多獨立軟件開發(fā)商(ISV)都對Arm表現(xiàn)出濃厚的興趣,紛紛投入Arm陣營,在中國市場這一趨勢尤其顯著。
圖7:Arm支持的軟件生態(tài)
“Arm認為軟件生態(tài)系統(tǒng),特別在基礎(chǔ)設(shè)施這個市場上,是非常重要的。” 根據(jù)Chris Bergey的介紹,現(xiàn)如今,Arm處理器核在性能方面的優(yōu)勢,不僅獲得了美國的大型互聯(lián)網(wǎng)公司的認可,在中國的大型互聯(lián)網(wǎng)公司以及廣大的軟件生態(tài)系統(tǒng)層面,也獲得了很多的進展。另外,Arm也很樂于與國內(nèi)外廠商攜手,利用Neoverse N1和V1來幫助客戶交付相關(guān)項目。