有DPU了,為什么英特爾還要出IPU?
數(shù)據(jù)量跨越式增長時代下,許多額外的工作涌入云數(shù)據(jù)中心服務(wù)器,而其中存在并非應(yīng)用級的處理,僅僅是將數(shù)據(jù)包進(jìn)行傳輸處理。這些工作會擠占CPU資源,將大量CPU處理能力耗費(fèi)在應(yīng)用之外。因此,SmartNIC(智能設(shè)備)就誕生了,為了卸載被擠占的網(wǎng)絡(luò)、存儲和計算資源。
一些廠商堅定站隊FPGA,將FPGA的SmartNIC做到了一體化,一張卡實現(xiàn)網(wǎng)絡(luò)、存儲和計算加速融合。一些廠商則重新定義DPU(數(shù)據(jù)處理芯片),解決服務(wù)器數(shù)據(jù)交換效率低、數(shù)據(jù)傳輸可靠性低、數(shù)據(jù)中心模型執(zhí)行效率低、I/O切換效率低、服務(wù)器架構(gòu)不靈活以及網(wǎng)絡(luò)不安全的問題。
英特爾則重新定義這種技術(shù)為IPU((InfrastructureProcessingUnit,基礎(chǔ)設(shè)施芯片),“在大多數(shù)情況下,IPU從財務(wù)角度來說對于云服務(wù)提供商極具吸引力”,Guido Appenzeller英特爾公司數(shù)據(jù)平臺事業(yè)部首席技術(shù)官如是說。
為什么偏偏是IPU
在介紹IPU之前仍需探求根源,既然業(yè)界已經(jīng)存在了SmartNIC,英特爾為什么要做IPU?Guido告訴記者,從術(shù)語上來看,IPU相比SmartNIC具有本地控制平面。這意味著,IPU在本質(zhì)上是可以控制CPU的,當(dāng)CPU想在網(wǎng)絡(luò)上發(fā)送數(shù)據(jù)包時,IPU將確保此數(shù)據(jù)包位于特定的虛擬覆蓋網(wǎng)絡(luò)上,由IPU控制PCI總線,將虛擬設(shè)備展示給CPU。SmartNIC更偏向卸載,一切都由CPU編程,CPU將會管理這一切的加速流程。
另外,一些企業(yè)命名DPU,為什么英特爾要叫IPU?根據(jù)Guido的分析,二者最終的目的是相同的,但I(xiàn)PU的作用是處理基礎(chǔ)設(shè)施功能,這是與眾不同之處,而DPU的命名將范圍縮小到“數(shù)據(jù)”這一范圍,反而并不是非常準(zhǔn)確的描述。
實際上,英特爾的IPU不僅在命名上更加清晰,在整體產(chǎn)品線上也非常清晰,非常貼合英特爾自身的IDM優(yōu)勢。
英特爾官方將IPU定義為一種可編程網(wǎng)絡(luò)設(shè)備,旨在使云和通信服務(wù)提供商減少在中央處理器(CPU)方面的開銷,并充分釋放性能價值,它能夠?qū)?shù)據(jù)中心內(nèi)的基礎(chǔ)設(shè)施功能進(jìn)行安全加速,從而使系統(tǒng)級資源的管理更加智能。利用IPU,客戶能夠部署安全穩(wěn)定且可編程的解決方案,從而更好地利用資源,平衡數(shù)據(jù)處理與存儲的工作負(fù)載。
換言之,過去軟件都在相同的芯片上運(yùn)行,現(xiàn)在把不同任務(wù)分開到IPU和CPU兩種芯片上運(yùn)行。Guido為記者舉了一個非常易懂的例子:“這有點(diǎn)像家和酒店的區(qū)別,在家中,客廳、廚房、餐桌都在一個大區(qū)域內(nèi),可以方便地從一個地方移步到另一個地方。但在酒店中,客房和餐廳是分開的,客房內(nèi)沒有廚房,而作為客人的也不會進(jìn)入廚房。我在餐廳吃飯,而廚師在廚房中工作。酒店客人和工作人員是分開的。數(shù)據(jù)中心也是這樣的發(fā)展趨勢,運(yùn)行租戶工作負(fù)載的芯片和運(yùn)行云服務(wù)提供商的軟件的芯片正在逐步分離。”
而具體從優(yōu)勢上來說,IPU擁有三大優(yōu)點(diǎn):
1、IPU充當(dāng)服務(wù)器的控制面。這意味著它運(yùn)行的是云服務(wù)提供商的軟件,可以保護(hù)、控制CPU或?qū)⑵溥M(jìn)行隔離。
2、IPU針對基礎(chǔ)設(shè)施功能進(jìn)行了優(yōu)化,效率極高。
3、可以過渡到無磁盤架構(gòu)?!癐PU非常聰明的地方在于,存儲服務(wù)器和服務(wù)器上的工作負(fù)載之間的實際存儲流量是在高速路徑上進(jìn)行的,這意味著不會涉及IPU或CPU上的任何CPU內(nèi)核”,Guido這樣為記者介紹。
IPU的兩種實現(xiàn)形式
英特爾是業(yè)界唯一擁有CPU、獨(dú)立GPU、ASIC、FPGA、各種加速器的企業(yè),因此從實現(xiàn)來說,英特爾也非常貼合自己的優(yōu)勢,分成了兩類。一類是ASIC IPU,另一類是基于FPGAIPU。在2021年的架構(gòu)日上,英特爾發(fā)布了全新的IPU架構(gòu)產(chǎn)品,也包含了一款非IPU的智能網(wǎng)卡。
1、ASIC IPU
據(jù)Guido介紹,MountEvans是英特爾的首個ASICIPU。MountEvans是與一家頂級云服務(wù)提供商共同設(shè)計和開發(fā)的,它融合了多代FPGASmartNIC的經(jīng)驗。
Guido為記者介紹了這款產(chǎn)品的強(qiáng)大之處,MoutnEvans支持200Gb/s的吞吐量,能夠最多四個至強(qiáng)主機(jī)連接起來。英特爾意識到云對性能的需求,將推動存儲、消息處理和高性能計算等很多應(yīng)用遷移到基于RDMA的協(xié)議上,通過實現(xiàn)ROCEv2以及我早前提到的全新可靠傳輸技術(shù),英特爾可以輕松完成這種遷移。另外,Mount.Evans提供InlineIPSec,以保護(hù)網(wǎng)絡(luò)上發(fā)送的每一個數(shù)據(jù)包。
尤為引起注意的是,其上的計算復(fù)合體是基于ARMNeoverse架構(gòu)的N1Ares內(nèi)核。這16個高頻率內(nèi)核附帶由三個LPDDR4控制器支持的大型系統(tǒng)級緩存。這個計算復(fù)合體與網(wǎng)絡(luò)子系統(tǒng)密切結(jié)合,使得網(wǎng)絡(luò)子系統(tǒng)加速器能夠把系統(tǒng)級緩存用作最后一級緩存,以及提供兩者之間高帶寬、低時延連接;并能夠靈活地整合硬件和軟件數(shù)據(jù)包處理。
當(dāng)然,這一IPU還吸收了至強(qiáng)處理器的優(yōu)勢,Lookaside加密與壓縮引擎源作為英特爾的QuickAssist技術(shù),IPU針對使用模式對其進(jìn)行了修改,其中包括對Zstandard壓縮算法的支持。
2、FPGA IPU
據(jù)Guido介紹,OakSpringsCanyon是一個IPU參考平臺,基于英特爾®至強(qiáng)D處理器(Intel®Xeon-D)和擁有業(yè)界領(lǐng)先的功率、效率、性能的英特爾®Agilex?FPGA構(gòu)建。Guido非常自豪地為記者說:“我們對這款產(chǎn)品非常有信心,它適用于超大規(guī)模云部署。”
具體來說,OaksSpringsCanyon是一個基于FPGA的IPU,其中采用了英特爾的AgilexFPGA和Xeon-D片上系統(tǒng)。值得一提的是,AgilexFPGA擁有業(yè)界領(lǐng)先的功率、效率和性能,搭配至強(qiáng)服務(wù)器,提供卸載2x100G工作負(fù)載所需的性能以及專為x86優(yōu)化的豐富軟件生態(tài)系統(tǒng)。
OakSpringsCanyon采用了英特爾®開放式FPGA開發(fā)堆棧(英特爾®OFS),這是一個可擴(kuò)展、開源軟硬件基礎(chǔ)設(shè)施堆棧。OakSpringsCanyon能夠滿足新興云服務(wù)提供商對于部署100GB工作負(fù)載的需求。
3、SmartNIC
除了IPU,英特爾還發(fā)布了一個非IPU的產(chǎn)品,稱之為智能網(wǎng)卡。即英特爾N6000加速開發(fā)平臺,代號為“ArrowCreek”,這款產(chǎn)品也是基于FPGA的。
Guido為記者介紹,ArrowCreek沒有CPU,是一個基于Agilex FPGA和e810 100GB以太網(wǎng)控制器的加速開發(fā)平臺,并不能用作IPU。這款產(chǎn)品更多地用于通信服務(wù)場景。
IPU未來將走向何方
從產(chǎn)品中,能夠看到英特爾將產(chǎn)品分為ASIC和FPGA兩類。根據(jù)Guido的解釋,F(xiàn)PGA對比ASIC有各自的優(yōu)劣勢。
“如果FPGA帶來最大的靈活性。如果你希望實施一個特別的算法,就可以用FPGA。這對于很多云來說很重要,因為目前排名前八的云全都使用不同的專有存儲協(xié)議。如果是只有您使用的專有協(xié)議,那么選擇FPGA是合理的,因為專用芯片很明顯不支持這種做法。而FPGA的一個劣勢是,它們很難編程。因此,您需要一個相當(dāng)強(qiáng)大的團(tuán)隊。吞吐量、功耗在一定程度上受到限制。我們認(rèn)為,隨著帶寬變高,趨勢是使用更專用的ASIC IPU”,他這樣為記者分析。
簡言之,想要最高的靈活性就使用FPGA IPU,想要更高的帶寬并且擁有專用的協(xié)議就使用ASIC IPU。不過Guido認(rèn)為,絕大多數(shù)云未來會更加偏向使用ASICIPU。
業(yè)界擁有一些廠商在整合IPU和GPU以及其他器件,Guido認(rèn)為,目前不確定英特爾會不會這么做。他表示,對于英特爾來說,特別是在云上,云服務(wù)提供商最感興趣的是同類最佳的單用途設(shè)備,所以可能選擇IPU來搭配圖形加速器,也可選擇IPU搭配AI加速器,或者選擇IPU搭配CPU,但基本上專用的系統(tǒng)。所以未來可能將是IPU和其他種類加速器結(jié)合的趨勢。
從整體市場來看,Guido表示,IPU或是DPU已成為一些創(chuàng)業(yè)公司的熱門方向,有幾家創(chuàng)業(yè)公司正在開發(fā)該領(lǐng)域的技術(shù),且擁有許多有趣的技術(shù)和有趣的產(chǎn)品,這對所有廠商來說都是非常有益的。同樣,英特爾也對自身所處的市場地位非常滿意,他認(rèn)為這將是一個大市場。從長遠(yuǎn)來看,云端的幾乎每個服務(wù)器都會有類似IPU的東西。
“這顯然是一個很大的市場。漸漸地,這不再是一個初創(chuàng)市場,而是一個由大公司主導(dǎo)的市場”,Guido如是說。