當(dāng)前位置:首頁(yè) > 廠商動(dòng)態(tài) > NVIDIA
[導(dǎo)讀]基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù),可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)萬(wàn)個(gè),通過(guò) NVIDIA NVLink可將多達(dá) 576 塊 Blackwell GPU 連成一個(gè)整體,由NVIDIA 系統(tǒng)專家加速即時(shí) AI 基礎(chǔ)設(shè)施的部署

美國(guó)加利福尼亞州圣何塞 —— GTC —— 太平洋時(shí)間 2024 年 3 月 18 日 —— NVIDIA 于今日發(fā)布新一代 AI 超級(jí)計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級(jí)芯片的 NVIDIA DGX SuperPOD?。這臺(tái) AI 超級(jí)計(jì)算機(jī)可以用于處理萬(wàn)億參數(shù)模型,能夠保證超大規(guī)模生成式 AI 訓(xùn)練和推理工作負(fù)載的持續(xù)運(yùn)行。

全新 DGX SuperPOD 采用新型高效液冷機(jī)架級(jí)擴(kuò)展架構(gòu),基于 NVIDIA DGX? GB200 系統(tǒng)構(gòu)建而成,在 FP4 精度下可提供 11.5 exaflops 的 AI 超級(jí)計(jì)算性能和 240 TB 的快速顯存,且可通過(guò)增加機(jī)架來(lái)擴(kuò)展性能。

每個(gè) DGX GB200 系統(tǒng)搭載 36 個(gè) NVIDIA GB200 超級(jí)芯片,共包含 36 個(gè) NVIDIA Grace CPU 和 72 個(gè) NVIDIA Blackwell GPU。這些超級(jí)芯片通過(guò)第五代 NVIDIA NVLink® 連接成一臺(tái)超級(jí)計(jì)算機(jī)。與 NVIDIA H100 Tensor Core GPU 相比,GB200 超級(jí)芯片在大語(yǔ)言模型推理工作負(fù)載方面的性能提升了高達(dá) 30 倍。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “NVIDIA DGX AI 超級(jí)計(jì)算機(jī)是推進(jìn) AI 產(chǎn)業(yè)變革的工廠。新一代 DGX SuperPOD 集 NVIDIA 加速計(jì)算、網(wǎng)絡(luò)和軟件方面的最新進(jìn)展于一體,能夠幫助每一個(gè)企業(yè)、行業(yè)和國(guó)家完善并生成自己的 AI。”

Grace Blackwell 架構(gòu)的 DGX SuperPOD 由 8 個(gè)或以上的 DGX GB200 系統(tǒng)構(gòu)建而成,這些系統(tǒng)通過(guò) NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)連接,可擴(kuò)展到數(shù)萬(wàn)個(gè) GB200 超級(jí)芯片。用戶可通過(guò) NVLink 連接 8 個(gè) DGX GB200 系統(tǒng)中的 576 塊 Blackwell GPU,從而獲得海量共享顯存空間,來(lái)賦能下一代 AI 模型。

面向生成式 AI 時(shí)代的全新機(jī)架級(jí)擴(kuò)展的 DGX SuperPOD 架構(gòu)

采用 DGX GB200 系統(tǒng)構(gòu)建而成的全新 DGX SuperPOD 采用了統(tǒng)一的計(jì)算網(wǎng)絡(luò)。除第五代 NVIDIA NVLink 網(wǎng)絡(luò)外,還包括 NVIDIA BlueField®-3 DPU,并將支持同為今日發(fā)布的 NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)。這個(gè)架構(gòu)可為計(jì)算平臺(tái)中的每塊 GPU 提供高達(dá)每秒 1800 GB 的帶寬。

另外,第四代 NVIDIA 可擴(kuò)展分層聚合和規(guī)約協(xié)議(SHARP)?技術(shù)可提供 14.4 teraflops 的網(wǎng)絡(luò)計(jì)算能力,與上一代產(chǎn)品相比,新一代 DGX SuperPOD 架構(gòu)的網(wǎng)絡(luò)計(jì)算能力提高了 4 倍。

統(tǒng)包式架構(gòu)搭配先進(jìn)的軟件,實(shí)現(xiàn)前所未有的正常運(yùn)行時(shí)間

全新 DGX SuperPOD 是一臺(tái)完整的數(shù)據(jù)中心級(jí) AI 超級(jí)計(jì)算機(jī),在與 NVIDIA 認(rèn)證合作伙伴提供的高性能存儲(chǔ)集成后,能夠滿足生成式 AI 工作負(fù)載的需求。每臺(tái)超級(jí)計(jì)算機(jī)都在出廠前完成了搭建、布線和測(cè)試,從而大大加快了在用戶數(shù)據(jù)中心的部署速度。

Grace Blackwell 架構(gòu)的 DGX SuperPOD 具有智能預(yù)測(cè)管理功能,能夠持續(xù)監(jiān)控軟硬件中的數(shù)千個(gè)數(shù)據(jù)點(diǎn),通過(guò)預(yù)測(cè)并攔截導(dǎo)致停機(jī)和低效的根源以節(jié)省時(shí)間、能耗和計(jì)算成本。

即使沒(méi)有系統(tǒng)管理員在場(chǎng),該軟件也能識(shí)別需要重點(diǎn)關(guān)注的領(lǐng)域并制定維護(hù)計(jì)劃,靈活調(diào)整計(jì)算資源,通過(guò)自動(dòng)保存和恢復(fù)作業(yè)來(lái)防止停機(jī)。

如果軟件檢測(cè)到需要更換組件,該集群將激活備用容量以確保工作能夠及時(shí)完成。為任何必要的硬件更換做好安排,以免出現(xiàn)計(jì)劃之外的停機(jī)。

NVIDIA DGX B200 系統(tǒng)推動(dòng)各行各業(yè) AI 超級(jí)計(jì)算發(fā)展

NVIDIA 還發(fā)布了一款統(tǒng)一用于 AI 模型訓(xùn)練、微調(diào)和推理的通用 AI 超級(jí)計(jì)算平臺(tái) NVIDIA DGX B200 系統(tǒng)。

采用風(fēng)冷傳統(tǒng)機(jī)架式設(shè)計(jì)的 DGX 已被全球各行各業(yè)數(shù)千家企業(yè)廣泛采用,DGX B200 是 DGX 系列的第六代產(chǎn)品。采用 Blackwell 架構(gòu)的全新 DGX B200 系統(tǒng)包含 8 個(gè) NVIDIA B200 Tensor Core GPU 和 2 個(gè)第五代英特爾®至強(qiáng)®處理器。用戶還可以使用 DGX B200 系統(tǒng)構(gòu)建 DGX SuperPOD,打造能夠幫助大型開(kāi)發(fā)團(tuán)隊(duì)運(yùn)行多種不同作業(yè)的 AI 卓越中心。

DGX B200 系統(tǒng)憑借全新 Blackwell 架構(gòu)中的 FP4 精度特性,可提供高達(dá) 144 petaflops 的 AI 性能、1.4TB 海量的 GPU 顯存和 64TB/s 的顯存帶寬,從而使得該系統(tǒng)的萬(wàn)億參數(shù)模型實(shí)時(shí)推理速度比上一代產(chǎn)品提升了 15 倍。

DGX B200 系統(tǒng)包含帶有 8 個(gè) NVIDIA ConnectX?-7 網(wǎng)卡和 2 個(gè) BlueField-3 DPU 的高性能網(wǎng)絡(luò),每個(gè)連接的帶寬高達(dá) 400 Gb/s,可通過(guò) NVIDIA Quantum-2 InfiniBand 和 NVIDIA Spectrum?-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)支持更高的 AI 性能。

軟件和專家為擴(kuò)大生產(chǎn)級(jí) AI 的規(guī)模提供支持

所有 NVIDIA DGX 平臺(tái)均包含用于企業(yè)級(jí)開(kāi)發(fā)和部署的 NVIDIA AI Enterprise 軟件。DGX 用戶可以通過(guò)使用該軟件平臺(tái)中的預(yù)訓(xùn)練的 NVIDIA 基礎(chǔ)模型、框架、工具套件和全新 NVIDIA NIM 微服務(wù)來(lái)加速他們的工作。

NVIDIA DGX 專家與部分獲得 NVIDIA DGX 平臺(tái)支持認(rèn)證的合作伙伴將在每個(gè)部署環(huán)節(jié)為用戶提供幫助,以便其迅速實(shí)現(xiàn) AI 投產(chǎn)。在系統(tǒng)投入運(yùn)行后,DGX 專家還將繼續(xù)協(xié)助用戶優(yōu)化其 AI 管線和基礎(chǔ)設(shè)施。

供應(yīng)情況

NVIDIA 全球合作伙伴預(yù)計(jì)將在今年晚些時(shí)候提供基于 DGX GB200 和 DGX B200 系統(tǒng)構(gòu)建而成的 NVIDIA DGX SuperPOD。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉