基礎(chǔ)設(shè)施處理器(IPU):云服務(wù)提供商的全新戰(zhàn)略資源
越來越多的現(xiàn)代云數(shù)據(jù)中心內(nèi)的工作負(fù)載正在按照微服務(wù)集合的結(jié)構(gòu)進行整合。雖然微服務(wù)導(dǎo)向的架構(gòu)有很多好處,但也因為聚合的特點而造成了大量的通信開銷,而用于這種基礎(chǔ)設(shè)施開銷的CPU循環(huán)不會為云服務(wù)提供商產(chǎn)生收入。Srirama、Dhanota等人近期發(fā)表的一篇論文發(fā)現(xiàn), 超大規(guī)模數(shù)據(jù)中心的微服務(wù)開銷高達31-83%1,如下圖所示。
在某些情況下,絕大多數(shù)CPU循環(huán)用于開銷
英特爾近期發(fā)布了基礎(chǔ)設(shè)施處理器(IPU)。通過基于IPU的架構(gòu),云服務(wù)提供商可以把基礎(chǔ)設(shè)施任務(wù)從CPU轉(zhuǎn)移到IPU,而釋放的服務(wù)器CPU循環(huán)可用于處理能夠產(chǎn)生收益的任務(wù),這樣就可以將從數(shù)據(jù)中心獲得的收入最大化。通過把基礎(chǔ)設(shè)施任務(wù)轉(zhuǎn)移到IPU,云服務(wù)提供商可以把服務(wù)器CPU全部租賃給客戶。
云數(shù)據(jù)中心就像酒店,而不是家
我們可以用酒店和家進行簡單的類比,這有助于解釋工作負(fù)載所有權(quán)的劃分,而正是這種劃分推動了IPU的發(fā)展。在我的家里,我希望能夠輕易地從客廳走到廚房或餐桌,因此我們設(shè)計了一個開放式的廚房,將所有功能都集中在一個大房間中,這樣我們就可以輕松地從一個區(qū)域轉(zhuǎn)移到另一個區(qū)域。
酒店則不同,客房、餐廳和廚房是不同的區(qū)域。酒店員工的工作區(qū)域與酒店客人的餐飲、休憩和會議區(qū)域嚴(yán)格分離。通常,酒店里會有很多道門將內(nèi)部不同的功能區(qū)分開,有時出于安保原因,你甚至需要佩戴胸牌才能穿過賓客區(qū)和員工區(qū)之間的門。
酒店和獨立住宅擁有不同的設(shè)計
類似于酒店劃分住客和員工活動的不同區(qū)域,包含IPU的數(shù)據(jù)中心架構(gòu)也對租戶和云服務(wù)提供商的工作負(fù)載進行區(qū)隔。通過把IPU引入數(shù)據(jù)中心來實施基礎(chǔ)設(shè)施功能,云服務(wù)提供商的基礎(chǔ)設(shè)施工作負(fù)載將在IPU上運行,這就解除了服務(wù)器CPU的負(fù)擔(dān),使其用于運行更多租戶的應(yīng)用。
基于IPU的數(shù)據(jù)中心架構(gòu)具備以下幾大優(yōu)勢:
? 可以嚴(yán)格分離基礎(chǔ)設(shè)施功能和租戶的工作負(fù)載,更好地隔離這些功能將大大加強系統(tǒng)安全。
? 租戶可以全面掌控服務(wù)器CPU,并獲得其全部的性能。
? 基礎(chǔ)設(shè)施工作負(fù)載的飆升不再會造成服務(wù)器CPU的性能問題。如上面的統(tǒng)計所示,這一問題在傳統(tǒng)數(shù)據(jù)中心的架構(gòu)模式下日趨嚴(yán)重。
? 通過把基礎(chǔ)設(shè)施任務(wù)從CPU轉(zhuǎn)移到IPU,可以讓服務(wù)器CPU處理可以產(chǎn)生收益的任務(wù),云服務(wù)提供商可以從數(shù)據(jù)中心獲取最大化的收入。通過把基礎(chǔ)設(shè)施任務(wù)轉(zhuǎn)移到IPU,云服務(wù)提供商可以把服務(wù)器CPU全部租賃給客戶。
? IPU專門處理基礎(chǔ)設(shè)施任務(wù)而不是通用任務(wù),它可以應(yīng)用硬件加速并更精細(xì)地優(yōu)化計算,從而大幅提高性能和能效。
? IPU能夠讓云數(shù)據(jù)中心實現(xiàn)全面的無磁盤服務(wù)器架構(gòu)。在傳統(tǒng)的企業(yè)數(shù)據(jù)中心架構(gòu)中,每臺服務(wù)器擁有自己的一套磁盤驅(qū)動器和固態(tài)盤。
由于難以預(yù)測每個租戶的存儲使用情況,在傳統(tǒng)數(shù)據(jù)中心架構(gòu)中,每臺服務(wù)器必須超額配置存儲資源,才能應(yīng)對高峰期存儲負(fù)載。在無磁盤服務(wù)器架構(gòu)下,中央服務(wù)為所有租戶提供存儲資源。下圖顯示了一種可能的無磁盤服務(wù)器架構(gòu)。
通過網(wǎng)絡(luò)利用虛擬存儲進行擴展
管理一項中央存儲服務(wù)比管理數(shù)據(jù)中心中數(shù)十萬臺服務(wù)器的存儲資源要容易得多,效率也高得多。
數(shù)據(jù)中心演進
幾年來,英特爾與包括微軟、百度、京東和 VMware 在內(nèi)的大型云服務(wù)提供商緊密合作,持續(xù)推動數(shù)據(jù)中心產(chǎn)品的創(chuàng)新與演進。通過基于英特爾® 至強® D處理器、英特爾® FPGA 和以太網(wǎng)組件的產(chǎn)品,我們成為IPU市場的量產(chǎn)領(lǐng)先者。英特爾與超大規(guī)模合作伙伴聯(lián)手,設(shè)計推出了第一代 基于FPGA的IPU 平臺,并且已經(jīng)部署在多個云服務(wù)提供商自有并負(fù)責(zé)運營的數(shù)據(jù)中心內(nèi)。
在FPGA產(chǎn)品進入IPU領(lǐng)域的五年間,我們觀察到超大規(guī)模云服務(wù)提供商正在分階段實現(xiàn)IPU的價值:
? 第一階段:加速網(wǎng)絡(luò)——把虛擬交換機和防火墻等常見網(wǎng)絡(luò)任務(wù)從服務(wù)器CPU轉(zhuǎn)移到IPU。把流量查找和封裝/解封等用戶面功能(UPF)從CPU轉(zhuǎn)移到IPU,從而釋放CPU循環(huán)。
? 第二階段:加速存儲——把存儲堆棧從服務(wù)器CPU轉(zhuǎn)移到IPU,提高了存儲吞吐量,并降低了存儲的復(fù)雜性、開銷和管理負(fù)擔(dān)。
? 第三階段:加速安全——轉(zhuǎn)移加密/解密、壓縮和其它消耗服務(wù)器CPU循環(huán)的安全功能。(這些安全功能經(jīng)常與第二階段轉(zhuǎn)移的存儲功能搭配)。此外,IPU可以開啟主機系統(tǒng)的啟動和配置,而通過隔離安全功能和提供與CPU分離的信任根,此舉可以進一步加強安全。
? 第四階段:基礎(chǔ)設(shè)施處理——或許是最精妙的用途,把虛擬機管理程序服務(wù)管理功能從CPU轉(zhuǎn)移到IPU。
目前的基于FPGA的英特爾IPU 將英特爾® Stratix® 10 FPGA 和英特爾至強 D 處理器進行整合。它們將優(yōu)化的加速器(基于可配置、基于 FPGA 的數(shù)據(jù)路徑)與軟件可編程 的CPU 相結(jié)合,可以安全地加速和管理數(shù)據(jù)中心的基礎(chǔ)設(shè)施功能。
這種混合 IPU 架構(gòu)可以以硬件的速度進行網(wǎng)絡(luò)管理,其超高的軟件靈活性可以使用戶更輕松地實施控制面功能。使用 FPGA 板載資源的基于硬件的數(shù)據(jù)路徑和基于軟件的控制平面與 IPU 的板載處理器上的基礎(chǔ)設(shè)施 OS 堆棧一起運行的可編程性使這些 IPU 變得強大?;谟布臄?shù)據(jù)路徑(使用FPGA的板載資源)和基于軟件的控制平面(與IPU的板載處理器上的基礎(chǔ)架構(gòu)操作系統(tǒng)堆棧一起運行)所提供的可編程性使得IPU具有強大的性能表現(xiàn)。 而IPU 與 SmartNIC 的不同之處在于,它是一個安全、獨立的控制點,租戶工作負(fù)載無法直接訪問。
英特爾未來的IPU和智能網(wǎng)卡
未來,我們將推出更多基于FPGA的IPU平臺和專用 ASIC,這些解決方案建立在強大的軟件基礎(chǔ)之上,使云運營商和生態(tài)系統(tǒng)廠商能夠構(gòu)建領(lǐng)先的云編排軟件。在近期舉行的英特爾架構(gòu)日上,我們?yōu)镮PU系列引入了兩個新的成員——Mount Evans 和 Oak Springs Canyon,以及此前代號為 Arrow Creek的英特爾 N6000 加速開發(fā)平臺。
作為成功的 Big Spring Canyon 平臺的后續(xù)產(chǎn)品,Oak Springs Canyon(OSC)是一個基于英特爾® Agilex? FPGA的平臺,其目前在性能、功耗和工作負(fù)載效率方面領(lǐng)先整個FPGA行業(yè)2。OSC 與基于英特爾至強CPU的服務(wù)器協(xié)同工作,提供卸載2x100G 工作負(fù)載所需的基礎(chǔ)設(shè)施加速。OSC 擁有豐富的軟件生態(tài)系統(tǒng),并針對英特爾® CPU進行了優(yōu)化,同時還采用了英特爾開放 FPGA 堆棧,這是一個可擴展、開源軟硬件基礎(chǔ)設(shè)施堆棧,使我們的合作伙伴和客戶能夠開發(fā)定制的解決方案。OSC的能力和特性能夠滿足新興云服務(wù)提供商對于部署100GB工作負(fù)載的需求。
英特爾的另一個新開發(fā)項目是此前的代號為 Arrow Creek的英特爾 N6000 加速開發(fā)平臺,它是一個基于 FPGA 的智能網(wǎng)卡100GbE網(wǎng)絡(luò)加速開發(fā)平臺(ADP)。它是在英特爾® FPGA 可編程加速卡(英特爾® FPGA PAC)N3000取得成功的基礎(chǔ)之上開發(fā)的,后者目前已經(jīng)被部署在一些世界頂級通信服務(wù)提供商運營的數(shù)據(jù)中心內(nèi)?;谟⑻貭朅gilex FPGA 和英特爾® 以太網(wǎng)控制器E810,這個全新的英特爾N6000加速開發(fā)平臺,將能夠與基于英特爾處理器的服務(wù)器搭配使用,并支持多種類型的基礎(chǔ)設(shè)施任務(wù),以幫助電信運營商提供靈活的加速工作負(fù)載,例如Juniper Contrail、OVS 和 SRv6。
英特爾宣布了第一款 ASIC IPU,代號為Mount Evans,是我們與大型云服務(wù)提供商聯(lián)合設(shè)計開發(fā)的。Mount Evans IPU基于同類最佳的數(shù)據(jù)包處理引擎,能夠在ASIC上進行實例化,它支持大量的現(xiàn)有使用場景,例如vSwitch卸載、防火墻和虛擬路由,并為未來使用場景留出顯著空間。通過擴展英特爾經(jīng)過驗證的高性能傲騰NVMe控制器而開發(fā)的另外一項技術(shù)讓Mt. Evans能夠模擬NVMe設(shè)備。 在FPGA IPU上運行的相同英特爾基礎(chǔ)設(shè)施操作系統(tǒng)也將能夠在Mount Evans上運行。
下一代可靠傳輸協(xié)議以及我們先進的加密和壓縮加速器也都是 Mount Evans IPU的其它技術(shù)創(chuàng)新。我們與云服務(wù)提供商合作伙伴在下一代可靠傳輸協(xié)議上進行了聯(lián)合創(chuàng)新,以解決有損網(wǎng)絡(luò)上的長尾時延問題。
IPU:云服務(wù)提供商新的戰(zhàn)略性資源
IPU是英特爾云計算戰(zhàn)略中的一個戰(zhàn)略性組成部分。我們領(lǐng)先的IPU產(chǎn)品組合為通用基礎(chǔ)設(shè)施奠定了基礎(chǔ),使我們的云客戶能夠在不久的將來,在異構(gòu)數(shù)據(jù)中心架構(gòu)中充分利用其通用計算、XPU和加速資源。這些功能的融合完美契合了持續(xù)的微服務(wù)發(fā)展趨勢,并提供機會來構(gòu)建與高速硬件網(wǎng)絡(luò)組件和通用軟件框架相匹配的優(yōu)化、基于功能的基礎(chǔ)設(shè)施。IPU 為云服務(wù)提供商提供了重新布局?jǐn)?shù)據(jù)中心架構(gòu)、加速云計算以及在數(shù)據(jù)中心的每個服務(wù)器 CPU上托管更多創(chuàng)收服務(wù),即在虛擬機上運行租戶應(yīng)用程序的機會。
憑借其提高性能、降低成本和提供更好的云數(shù)據(jù)中心架構(gòu)的能力,我們認(rèn)為 IPU 將成為未來數(shù)據(jù)中心設(shè)計的戰(zhàn)略元件。
作者:Patricia Kummrow,英特爾公司網(wǎng)絡(luò)與邊緣事業(yè)部副總裁兼以太網(wǎng)產(chǎn)品部總經(jīng)理