互聯(lián)網(wǎng)技術(shù)詳解 | 超融合可編程網(wǎng)關(guān)的應(yīng)用場(chǎng)景初探
掃描二維碼
隨時(shí)隨地手機(jī)看文章
自2006年AWS開(kāi)始以網(wǎng)絡(luò)服務(wù)的形式向企業(yè)用戶提供云服務(wù)以來(lái),云計(jì)算已經(jīng)走過(guò)了蓬勃發(fā)展的16年。根據(jù)Gartner統(tǒng)計(jì),2021年全球公有云市場(chǎng)(Iaas、Paas、SaaS)規(guī)模達(dá)到3307.69億美元。隨著市場(chǎng)的繁榮,云計(jì)算作為新興的技術(shù),也引領(lǐng)了計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)等領(lǐng)域的技術(shù)發(fā)展。
云數(shù)據(jù)中心網(wǎng)關(guān)演進(jìn)歷程
近年來(lái),數(shù)據(jù)中心的網(wǎng)絡(luò)互聯(lián)的帶寬已經(jīng)從10G/40G,增長(zhǎng)到了100G/400G,云數(shù)據(jù)中心的東西向流量達(dá)到數(shù)百T級(jí)別。各大云計(jì)算廠商為實(shí)現(xiàn)功能豐富的云計(jì)算產(chǎn)品,例如VPC、EIP、SLB、NAT等,開(kāi)發(fā)了各類NFV網(wǎng)關(guān),以實(shí)現(xiàn)云上網(wǎng)絡(luò)的互聯(lián)互通?;厥资畮啄暝凭W(wǎng)絡(luò)的發(fā)展,與傳統(tǒng)網(wǎng)絡(luò)類似,都經(jīng)歷了從“軟”到“硬”再到“軟”“硬”融合的歷程。
最初,云上網(wǎng)關(guān)采用X86服務(wù)器和DPDK技術(shù),實(shí)現(xiàn)overlay網(wǎng)絡(luò)的隧道封裝、路由、NAT、限速等功能;利用DPDK技術(shù),可以實(shí)現(xiàn)非常靈活的數(shù)據(jù)面編程,在用戶態(tài)轉(zhuǎn)發(fā)報(bào)文以加速網(wǎng)絡(luò)。后來(lái)業(yè)界開(kāi)始采用專用硬件做網(wǎng)絡(luò)加速,例如使用各類DPU、智能網(wǎng)卡等,釋放出的寶貴的CPU算力。
圖1:H3C Server-Switch超融合可編程網(wǎng)關(guān)
隨著可編程交換芯片的出現(xiàn),業(yè)界逐漸開(kāi)始采用可編程交換芯片擴(kuò)展系統(tǒng)的數(shù)據(jù)處理能力,利用靈活的Pipeline編程,實(shí)現(xiàn)復(fù)雜的云上網(wǎng)絡(luò)功能。ASIC交換芯片擁有很大的交換容量,常見(jiàn)的有6.4T/12.8T等,對(duì)于一個(gè)同等級(jí)別的服務(wù)器集群來(lái)說(shuō),一般需要幾十臺(tái)到一百余臺(tái)的服務(wù)器能力,才能實(shí)現(xiàn)T級(jí)別的網(wǎng)絡(luò)處理能力,因此使用可編程交換機(jī)可以極大的節(jié)省服務(wù)器集群的成本。但是,僅使用可編程ASIC也存在一定的限制,由于交換芯片使用片內(nèi)有限的TCAM/SRAM硬件資源存儲(chǔ)轉(zhuǎn)發(fā)表項(xiàng),因此表項(xiàng)容量限制了網(wǎng)絡(luò)的規(guī)模。
針對(duì)可編程交換機(jī)的限制,H3C推出了Server-Switch超融合可編程網(wǎng)關(guān)產(chǎn)品,Server-Switch擁有媲美服務(wù)器的計(jì)算能力,和性能堪比交換機(jī)的轉(zhuǎn)發(fā)能力,同時(shí)支持選配FPGA卡,用戶可以通過(guò)編程擴(kuò)容轉(zhuǎn)發(fā)表項(xiàng)。
圖2:超融合可編程網(wǎng)關(guān)架構(gòu)圖
Server-Switch融合了高性能的CPU,高帶寬和Pipeline可靈活編程的交換機(jī)ASIC,以及功能豐富的FPGA器件??删幊探粨Q芯片負(fù)責(zé)網(wǎng)絡(luò)功能的卸載和數(shù)據(jù)面的報(bào)文轉(zhuǎn)發(fā),基于PISA架構(gòu)的交換芯片,Pipeline可以由用戶自行編程,很容易實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)面轉(zhuǎn)發(fā)邏輯,對(duì)于想要開(kāi)發(fā)新協(xié)議的用戶來(lái)說(shuō),可編程芯片可以方便的進(jìn)行新協(xié)議的驗(yàn)證。由于數(shù)據(jù)面可編程,用戶也可以在報(bào)文中加入自定義字段,用于攜帶某些網(wǎng)絡(luò)信息。例如,可以自定義加入時(shí)間戳、丟包、時(shí)延、Buffer等信息,用于報(bào)文隨流檢測(cè)。對(duì)于對(duì)網(wǎng)絡(luò)要求很高的應(yīng)用,可以更好的反應(yīng)業(yè)務(wù)的真實(shí)網(wǎng)絡(luò)情況,將逐流的信息收集后,可以從全局視角對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化。
對(duì)于首包或交換芯片Hit Miss的數(shù)據(jù)報(bào)文,通過(guò)內(nèi)部以太網(wǎng)互聯(lián)的網(wǎng)卡,復(fù)用成熟的DPDK轉(zhuǎn)發(fā)邏輯,通過(guò)用戶態(tài)編程,實(shí)現(xiàn)軟件轉(zhuǎn)發(fā)。軟轉(zhuǎn)完成后,CPU將對(duì)應(yīng)表項(xiàng)通過(guò)PCIe下發(fā)到交換芯片硬件。另外對(duì)于ARP等一些協(xié)議報(bào)文,同樣復(fù)用原有DPDK代碼,避免重復(fù)造輪子。對(duì)于需要超大規(guī)格表項(xiàng)的場(chǎng)景,交換芯片上的TCAM和SRAM資源就會(huì)捉襟見(jiàn)肘,盡管可以通過(guò)Pipeline折疊等方法緩解,但對(duì)于云上某些需要超大表項(xiàng)的場(chǎng)景依舊不能滿足業(yè)務(wù)需求。通過(guò)模塊化的設(shè)計(jì),Server-Switch超融合網(wǎng)關(guān)可以針對(duì)超大表項(xiàng)場(chǎng)景按需選配FPGA卡,用于擴(kuò)展可編程交換芯片的硬件表項(xiàng)。對(duì)于一般場(chǎng)景,可以無(wú)需FPGA卡,節(jié)省用戶投資。
Server-Switch典型應(yīng)用場(chǎng)景
Server-Switch的優(yōu)勢(shì)在于軟硬件融合的能力,在擁有海量接口帶寬的同時(shí),還具備靈活的可編程能力與高性能的計(jì)算能力。因此Server-Switch非常適合用于對(duì)帶寬需求很高的云網(wǎng)關(guān)場(chǎng)景。例如,專線網(wǎng)關(guān)、云互聯(lián)網(wǎng)關(guān)、負(fù)載均衡網(wǎng)關(guān)等。云網(wǎng)關(guān)的北向?qū)釉破脚_(tái),接受云平臺(tái)的統(tǒng)一業(yè)務(wù)編排。通過(guò)云平臺(tái)的SDN控制器向云網(wǎng)關(guān)下發(fā)流表,實(shí)現(xiàn)復(fù)雜的網(wǎng)絡(luò)轉(zhuǎn)發(fā)邏輯。高性能CPU作為網(wǎng)關(guān)的控制平面,實(shí)現(xiàn)業(yè)務(wù)邏輯??删幊绦酒鳛榫W(wǎng)關(guān)的數(shù)據(jù)平面,卸載網(wǎng)絡(luò)功能,實(shí)現(xiàn)T級(jí)的流量轉(zhuǎn)發(fā)。FPGA芯片可用于擴(kuò)展流表、Session表項(xiàng)。對(duì)于T級(jí)別的流量,使用超融合可編程網(wǎng)關(guān)可以替代數(shù)十臺(tái)的服務(wù)器集群,極大降低成本。
圖3:Server-Switch組件示意圖
專線網(wǎng)關(guān)負(fù)責(zé)連接公有云VPC與租戶云下IDC,負(fù)責(zé)云上云下數(shù)據(jù)互通。專線網(wǎng)關(guān)需要海量帶寬資源用于用戶接入,同時(shí)也要具備區(qū)分租戶網(wǎng)絡(luò)的能力。專線網(wǎng)關(guān)負(fù)責(zé)overlay隧道的封裝與解封裝,用于與VPC網(wǎng)絡(luò)互通。對(duì)于大客戶而言,上云專線帶寬可以達(dá)到T級(jí)別,另外云上云下存在海量路由交互。使用超融合可編程網(wǎng)關(guān),可以有效支撐云上的百萬(wàn)VPC和路由表。
圖4:專線接入網(wǎng)關(guān)邏輯圖
云互聯(lián)網(wǎng)關(guān)負(fù)責(zé)租戶VPC與其他VPC、VPN網(wǎng)關(guān)、專線網(wǎng)關(guān)等其他組件互通,也提供跨Region的互聯(lián)互通能力。因此在公有云網(wǎng)絡(luò)中,云互聯(lián)網(wǎng)關(guān)集群也需要高帶寬資源用于網(wǎng)絡(luò)互通。同時(shí)云互聯(lián)網(wǎng)關(guān)需要承載海量路由,采用超融合可編程網(wǎng)關(guān)可以滿足業(yè)務(wù)苛刻的需求。
圖5:云聯(lián)網(wǎng)網(wǎng)關(guān)邏輯圖
負(fù)載均衡網(wǎng)關(guān)主要指4層負(fù)載均衡,用于IDC中underlay網(wǎng)絡(luò)或云上overlay網(wǎng)絡(luò)的服務(wù)器流量負(fù)載均衡。對(duì)于互聯(lián)網(wǎng)服務(wù)提供者而言,四層負(fù)載均衡網(wǎng)關(guān)承載了對(duì)外提供服務(wù)的所有流量,因此4層負(fù)載均衡網(wǎng)關(guān)對(duì)于互聯(lián)網(wǎng)企業(yè)的重要性不言而喻。一方面,海量的業(yè)務(wù)流量對(duì)負(fù)載均衡的網(wǎng)絡(luò)性能提出了很高的要求;另一方面,在精細(xì)化運(yùn)營(yíng)的潮流下,如何在保證業(yè)務(wù)穩(wěn)定的情況下減少CAPEX和OPEX,也成為了企業(yè)考慮的因素。使用Server-Switch超融合可編程網(wǎng)關(guān),單臺(tái)設(shè)備即可提供數(shù)T級(jí)別的流量承載能力,可以有效節(jié)省企業(yè)開(kāi)支。在功能實(shí)現(xiàn)上,通過(guò)可編程硬件的能力,實(shí)現(xiàn)數(shù)據(jù)面快慢路徑分離,將常用流量轉(zhuǎn)發(fā)表項(xiàng)下發(fā)至交換芯片硬件,實(shí)現(xiàn)業(yè)務(wù)網(wǎng)絡(luò)加速。由于交換芯片硬件資源有限,在交換芯片硬件上存儲(chǔ)的表項(xiàng)也存在一定限制。H3C Server-Switch提供擴(kuò)展FPGA卡的能力,最大可支持4塊FPGA卡,用戶可以通過(guò)編程,在FPGA卡中存儲(chǔ)海量Session表項(xiàng)。
展望
本文總結(jié)了超融合網(wǎng)關(guān)的發(fā)展歷程和主要應(yīng)用場(chǎng)景,在云原生時(shí)代,新華三集團(tuán)將繼續(xù)秉承“云智原生”的戰(zhàn)略,發(fā)揮算網(wǎng)融合優(yōu)勢(shì),服務(wù)百行百業(yè),鋪就算網(wǎng)基石,共創(chuàng)互聯(lián)網(wǎng)新時(shí)代。