互聯(lián)網(wǎng)技術(shù)詳解 | 超融合可編程網(wǎng)關的應用場景初探
自2006年AWS開始以網(wǎng)絡服務的形式向企業(yè)用戶提供云服務以來,云計算已經(jīng)走過了蓬勃發(fā)展的16年。根據(jù)Gartner統(tǒng)計,2021年全球公有云市場(Iaas、Paas、SaaS)規(guī)模達到3307.69億美元。隨著市場的繁榮,云計算作為新興的技術(shù),也引領了計算、網(wǎng)絡、存儲等領域的技術(shù)發(fā)展。
云數(shù)據(jù)中心網(wǎng)關演進歷程
近年來,數(shù)據(jù)中心的網(wǎng)絡互聯(lián)的帶寬已經(jīng)從10G/40G,增長到了100G/400G,云數(shù)據(jù)中心的東西向流量達到數(shù)百T級別。各大云計算廠商為實現(xiàn)功能豐富的云計算產(chǎn)品,例如VPC、EIP、SLB、NAT等,開發(fā)了各類NFV網(wǎng)關,以實現(xiàn)云上網(wǎng)絡的互聯(lián)互通?;厥资畮啄暝凭W(wǎng)絡的發(fā)展,與傳統(tǒng)網(wǎng)絡類似,都經(jīng)歷了從“軟”到“硬”再到“軟”“硬”融合的歷程。
最初,云上網(wǎng)關采用X86服務器和DPDK技術(shù),實現(xiàn)overlay網(wǎng)絡的隧道封裝、路由、NAT、限速等功能;利用DPDK技術(shù),可以實現(xiàn)非常靈活的數(shù)據(jù)面編程,在用戶態(tài)轉(zhuǎn)發(fā)報文以加速網(wǎng)絡。后來業(yè)界開始采用專用硬件做網(wǎng)絡加速,例如使用各類DPU、智能網(wǎng)卡等,釋放出的寶貴的CPU算力。
圖1:H3C Server-Switch超融合可編程網(wǎng)關
隨著可編程交換芯片的出現(xiàn),業(yè)界逐漸開始采用可編程交換芯片擴展系統(tǒng)的數(shù)據(jù)處理能力,利用靈活的Pipeline編程,實現(xiàn)復雜的云上網(wǎng)絡功能。ASIC交換芯片擁有很大的交換容量,常見的有6.4T/12.8T等,對于一個同等級別的服務器集群來說,一般需要幾十臺到一百余臺的服務器能力,才能實現(xiàn)T級別的網(wǎng)絡處理能力,因此使用可編程交換機可以極大的節(jié)省服務器集群的成本。但是,僅使用可編程ASIC也存在一定的限制,由于交換芯片使用片內(nèi)有限的TCAM/SRAM硬件資源存儲轉(zhuǎn)發(fā)表項,因此表項容量限制了網(wǎng)絡的規(guī)模。
針對可編程交換機的限制,H3C推出了Server-Switch超融合可編程網(wǎng)關產(chǎn)品,Server-Switch擁有媲美服務器的計算能力,和性能堪比交換機的轉(zhuǎn)發(fā)能力,同時支持選配FPGA卡,用戶可以通過編程擴容轉(zhuǎn)發(fā)表項。
圖2:超融合可編程網(wǎng)關架構(gòu)圖
Server-Switch融合了高性能的CPU,高帶寬和Pipeline可靈活編程的交換機ASIC,以及功能豐富的FPGA器件??删幊探粨Q芯片負責網(wǎng)絡功能的卸載和數(shù)據(jù)面的報文轉(zhuǎn)發(fā),基于PISA架構(gòu)的交換芯片,Pipeline可以由用戶自行編程,很容易實現(xiàn)復雜的數(shù)據(jù)面轉(zhuǎn)發(fā)邏輯,對于想要開發(fā)新協(xié)議的用戶來說,可編程芯片可以方便的進行新協(xié)議的驗證。由于數(shù)據(jù)面可編程,用戶也可以在報文中加入自定義字段,用于攜帶某些網(wǎng)絡信息。例如,可以自定義加入時間戳、丟包、時延、Buffer等信息,用于報文隨流檢測。對于對網(wǎng)絡要求很高的應用,可以更好的反應業(yè)務的真實網(wǎng)絡情況,將逐流的信息收集后,可以從全局視角對網(wǎng)絡進行優(yōu)化。
對于首包或交換芯片Hit Miss的數(shù)據(jù)報文,通過內(nèi)部以太網(wǎng)互聯(lián)的網(wǎng)卡,復用成熟的DPDK轉(zhuǎn)發(fā)邏輯,通過用戶態(tài)編程,實現(xiàn)軟件轉(zhuǎn)發(fā)。軟轉(zhuǎn)完成后,CPU將對應表項通過PCIe下發(fā)到交換芯片硬件。另外對于ARP等一些協(xié)議報文,同樣復用原有DPDK代碼,避免重復造輪子。對于需要超大規(guī)格表項的場景,交換芯片上的TCAM和SRAM資源就會捉襟見肘,盡管可以通過Pipeline折疊等方法緩解,但對于云上某些需要超大表項的場景依舊不能滿足業(yè)務需求。通過模塊化的設計,Server-Switch超融合網(wǎng)關可以針對超大表項場景按需選配FPGA卡,用于擴展可編程交換芯片的硬件表項。對于一般場景,可以無需FPGA卡,節(jié)省用戶投資。
Server-Switch典型應用場景
Server-Switch的優(yōu)勢在于軟硬件融合的能力,在擁有海量接口帶寬的同時,還具備靈活的可編程能力與高性能的計算能力。因此Server-Switch非常適合用于對帶寬需求很高的云網(wǎng)關場景。例如,專線網(wǎng)關、云互聯(lián)網(wǎng)關、負載均衡網(wǎng)關等。云網(wǎng)關的北向?qū)釉破脚_,接受云平臺的統(tǒng)一業(yè)務編排。通過云平臺的SDN控制器向云網(wǎng)關下發(fā)流表,實現(xiàn)復雜的網(wǎng)絡轉(zhuǎn)發(fā)邏輯。高性能CPU作為網(wǎng)關的控制平面,實現(xiàn)業(yè)務邏輯??删幊绦酒鳛榫W(wǎng)關的數(shù)據(jù)平面,卸載網(wǎng)絡功能,實現(xiàn)T級的流量轉(zhuǎn)發(fā)。FPGA芯片可用于擴展流表、Session表項。對于T級別的流量,使用超融合可編程網(wǎng)關可以替代數(shù)十臺的服務器集群,極大降低成本。
圖3:Server-Switch組件示意圖
專線網(wǎng)關負責連接公有云VPC與租戶云下IDC,負責云上云下數(shù)據(jù)互通。專線網(wǎng)關需要海量帶寬資源用于用戶接入,同時也要具備區(qū)分租戶網(wǎng)絡的能力。專線網(wǎng)關負責overlay隧道的封裝與解封裝,用于與VPC網(wǎng)絡互通。對于大客戶而言,上云專線帶寬可以達到T級別,另外云上云下存在海量路由交互。使用超融合可編程網(wǎng)關,可以有效支撐云上的百萬VPC和路由表。
圖4:專線接入網(wǎng)關邏輯圖
云互聯(lián)網(wǎng)關負責租戶VPC與其他VPC、VPN網(wǎng)關、專線網(wǎng)關等其他組件互通,也提供跨Region的互聯(lián)互通能力。因此在公有云網(wǎng)絡中,云互聯(lián)網(wǎng)關集群也需要高帶寬資源用于網(wǎng)絡互通。同時云互聯(lián)網(wǎng)關需要承載海量路由,采用超融合可編程網(wǎng)關可以滿足業(yè)務苛刻的需求。
圖5:云聯(lián)網(wǎng)網(wǎng)關邏輯圖
負載均衡網(wǎng)關主要指4層負載均衡,用于IDC中underlay網(wǎng)絡或云上overlay網(wǎng)絡的服務器流量負載均衡。對于互聯(lián)網(wǎng)服務提供者而言,四層負載均衡網(wǎng)關承載了對外提供服務的所有流量,因此4層負載均衡網(wǎng)關對于互聯(lián)網(wǎng)企業(yè)的重要性不言而喻。一方面,海量的業(yè)務流量對負載均衡的網(wǎng)絡性能提出了很高的要求;另一方面,在精細化運營的潮流下,如何在保證業(yè)務穩(wěn)定的情況下減少CAPEX和OPEX,也成為了企業(yè)考慮的因素。使用Server-Switch超融合可編程網(wǎng)關,單臺設備即可提供數(shù)T級別的流量承載能力,可以有效節(jié)省企業(yè)開支。在功能實現(xiàn)上,通過可編程硬件的能力,實現(xiàn)數(shù)據(jù)面快慢路徑分離,將常用流量轉(zhuǎn)發(fā)表項下發(fā)至交換芯片硬件,實現(xiàn)業(yè)務網(wǎng)絡加速。由于交換芯片硬件資源有限,在交換芯片硬件上存儲的表項也存在一定限制。H3C Server-Switch提供擴展FPGA卡的能力,最大可支持4塊FPGA卡,用戶可以通過編程,在FPGA卡中存儲海量Session表項。
展望
本文總結(jié)了超融合網(wǎng)關的發(fā)展歷程和主要應用場景,在云原生時代,新華三集團將繼續(xù)秉承“云智原生”的戰(zhàn)略,發(fā)揮算網(wǎng)融合優(yōu)勢,服務百行百業(yè),鋪就算網(wǎng)基石,共創(chuàng)互聯(lián)網(wǎng)新時代。