NVIDIA EGX超級計算平臺借助企業(yè)級Kubernetes簡化邊緣AI部署

時間：2020-05-19 21:09:01

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 新型GPU Operator、Helm chart與NGC-Ready系統(tǒng)幫助各企業(yè)遷移至邊緣與混合平臺。如今，AI已不再僅僅只停留在研究階段，而是已經(jīng)被應(yīng)用于各企業(yè)機構(gòu)中，

新型GPU Operator、Helm chart與NGC-Ready系統(tǒng)幫助各企業(yè)遷移至邊緣與混合平臺。

如今，AI已不再僅僅只停留在研究階段，而是已經(jīng)被應(yīng)用于各企業(yè)機構(gòu)中，幫助它們解決實際問題。而作為企業(yè)機構(gòu)，它們需要清楚地知道應(yīng)該將AI模型部署于何處，才能幫助其以更快的速度做出決策。

隨著AI、物聯(lián)網(wǎng)以及即將到來的5G基礎(chǔ)架構(gòu)三者之間正在走向互融。對于各企業(yè)而言，如今已然時機成熟——將其模型從數(shù)據(jù)中心推向邊緣。在邊緣，數(shù)十億傳感器正在源源不斷地傳輸數(shù)據(jù)，實時決策已成為現(xiàn)實。

大規(guī)模部署AI工作負(fù)載的各企業(yè)正在綜合運用本地數(shù)據(jù)中心和云端，將AI模型置于數(shù)據(jù)收集點。但是，如果企業(yè)缺乏相應(yīng)的IT專業(yè)知識，那么在諸如零售商店或室內(nèi)停車場這類邊緣地點部署工作負(fù)載，將變得非常困難。

盡管Kubernetes簡化了部署、管理與擴展應(yīng)用過程中許多手動流程，為跨越本地、邊緣與云端帶來了一致的云原生部署方法。

但是，遠(yuǎn)程設(shè)置Kubernetes集群以管理數(shù)百、甚至數(shù)千款應(yīng)用卻可能相當(dāng)麻煩，特別是在每個邊緣區(qū)域都不容易獲得人工專業(yè)支持的情況下。而如今，我們能夠通過NVIDIA EGX 邊緣超級計算平臺化解這些難題。

簡化AI部署

NVIDIA EGX是一個云原生的軟件定義平臺，旨在實現(xiàn)并高效運行大規(guī)模混合云與邊緣運維。

該平臺內(nèi)的EGX堆棧包含NVIDIA驅(qū)動程序、Kubernetes插件、NVIDIA容器運行時以及GPU監(jiān)測工具，均通過NVIDIA GPU Operator提供。Operator負(fù)責(zé)整理運行信息與工作流，利用Kubernetes自動完成容器化應(yīng)用的生命周期管理。

GPU Operator是一個由Helm chart所部署的云原生方法，針對GPU支持的Kubernetes系統(tǒng)配置，用于自動部署所有必要的組件，并完成組件標(biāo)準(zhǔn)化。NVIDIA、Red Hat及云原生社區(qū)內(nèi)的其他公司協(xié)作創(chuàng)建了GPU Operator。

GPU Operator還能夠讓IT團隊像管理CPU驅(qū)動系統(tǒng)那樣，管理GPU支持的遠(yuǎn)程服務(wù)器。這使得其可以利用單一鏡像輕松完成一組遠(yuǎn)程系統(tǒng)初啟，在無需現(xiàn)場額外技術(shù)專長的情況下運行邊緣AI應(yīng)用程序。

EGX堆棧架構(gòu)由諸如：Canonical、Cisco、微軟、Nutanix、Red Hat和Vmware等混合云管理合作伙伴提供支持，以進一步簡化部署，并提供從云端到數(shù)據(jù)中心一直到邊緣的一致體驗。

NGC-Ready for Edge系統(tǒng)

由全球領(lǐng)先的服務(wù)器制造商所提供的NGC-Ready系統(tǒng)已通過NVIDIA面向GPU優(yōu)化容器的軟件中心 NGC 的AI軟件功能與性能驗證。

在洛杉磯舉行的世界移動通信大會（MWC）上，NVIDIA宣布利用面向邊緣的NGC-Ready 系統(tǒng)進一步擴展NGC-Ready計劃，大力支持邊緣部署。這些系統(tǒng)經(jīng)過了邊緣部署要求的更多安全與遠(yuǎn)程系統(tǒng)管理測試。此類合格系統(tǒng)可完美運行EGX堆棧，為混合部署提供一個輕松入口。

已通過驗證的NGC-Ready for Edge系統(tǒng)由眾多全球領(lǐng)先的制造商提供，包括：Advantech、Altos Computing、ASRock RACK、Atos、Dell Technologies、富士通、GIGABYTE、HPE、聯(lián)想、MiTAC、QCT， Supermicro 和TYAN。

擴展NGC注冊

為部署與管理AI軟件，NGC現(xiàn)推出Helm chart注冊服務(wù)。Helm chart是強大的云原生工具，用于定制并自動完成在Kubernetes各集群內(nèi)的各種應(yīng)用部署。

NGC的Helm chart注冊包含AI框架、GPU Operator等NVIDIA軟件，以及面向醫(yī)療影像的NVIDIA Clara，和用于智慧零售以及工業(yè)檢查的NVIDIA Metropolis。NGC還托管針對第三方人工智能應(yīng)用的Helm chart，包括面向車輛分析的DeepVision、用于視頻搜索的IronYun，和執(zhí)行流分析的KineTIca。

借助NGC-Ready支持服務(wù)，開發(fā)者與運維團隊可以為其NGC-Ready for Edge系統(tǒng)獲得專用的Helm注冊，以推動與分享Helm chart。這能夠讓各團隊充分利用一致、安全且可靠的環(huán)境，加速集成與部署的持續(xù)循環(huán)。

采用NGC部署AI軟件

如需跨不同平臺輕松配置GPU驅(qū)動的Kubernetes集群，利用Helm chart與容器快速部署人工智能應(yīng)用.