當(dāng)前位置:首頁 > 廠商動態(tài) > NVIDIA
[導(dǎo)讀]● NVIDIA AI Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA NeMo Retriever 微服務(wù),以實現(xiàn)準(zhǔn)確響應(yīng)

● 借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構(gòu)建“超級模型”

● NVIDIA AI Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA NeMo Retriever 微服務(wù),以實現(xiàn)準(zhǔn)確響應(yīng)

● 埃森哲率先使用新服務(wù),為客戶創(chuàng)建自定義 Llama 3.1 模型;Aramco、AT&T、優(yōu)步和其他行業(yè)領(lǐng)導(dǎo)者率先使用全新 Llama NVIDIA NIM 微服務(wù)

美國加利福尼亞州圣克拉拉—2024 年 7 月 23 日—NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM? 推理微服務(wù),與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI 提供強力支持。

借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用 Llama 3.1 以及 NVIDIA 軟件、計算和專業(yè)知識,為其特定領(lǐng)域的行業(yè)用例創(chuàng)建自定義“超級模型”。企業(yè)可以使用自有數(shù)據(jù)以及由 Llama 3.1 405B 和 NVIDIA Nemotron? Reward 模型生成的合成數(shù)據(jù),來訓(xùn)練這些超級模型。

NVIDIA AI Foundry 是由 NVIDIA DGX? Cloud AI 平臺驅(qū)動。該平臺由 NVIDIA 與全球領(lǐng)先的公有云共同設(shè)計,旨在為企業(yè)提供大量計算資源,所提供的計算資源可隨著 AI 需求的變化輕松擴展。

企業(yè)以及制定主權(quán) AI 戰(zhàn)略的國家正希望創(chuàng)建具有特定領(lǐng)域知識的自定義大語言模型,以便生成式 AI 應(yīng)用能夠反映其獨特的業(yè)務(wù)或文化。因此,這些新服務(wù)的推出恰逢其時。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“Meta 的 Llama 3.1 開源模型標(biāo)志著全球企業(yè)采用生成式 AI 的關(guān)鍵時刻已經(jīng)到來。Llama 3.1 將掀起各個企業(yè)與行業(yè)創(chuàng)建先進生成式 AI 應(yīng)用的浪潮。NVIDIA AI Foundry 已經(jīng)在整個過程中集成了 Llama 3.1,并能夠幫助企業(yè)構(gòu)建和部署自定義 Llama 超級模型?!?

Meta 創(chuàng)始人兼首席執(zhí)行官馬克·扎克伯格表示:“全新的 Llama 3.1 模型是開源 AI 邁出極其重要的一步。借助 NVIDIA AI Foundry,企業(yè)可以輕松創(chuàng)建和定制大家想要的最先進的 AI 服務(wù),并通過 NVIDIA NIM 進行部署。我很高興能將它交付到大家手中?!?

企業(yè)現(xiàn)在可以從 ai.nvidia.com 了解適用于 Llama 3.1 模型的 NVIDIA NIM 推理微服務(wù),以加快將 Llama 3.1 模型部署到生產(chǎn)級 AI 的速度。NIM 微服務(wù)是將 Llama 3.1 模型部署到生產(chǎn)中的最快途徑,其吞吐量最多可比不使用 NIM 運行推理時高出 2.5 倍。

企業(yè)可以將 Llama 3.1 NIM 微服務(wù)與全新 NVIDIA NeMo Retriever NIM 微服務(wù)組合使用,為 AI copilot、助手和數(shù)字人虛擬形象搭建先進的檢索工作流。

埃森哲率先使用 AI Foundry 為企業(yè)創(chuàng)建自定義 Llama 超級模型

全球?qū)I(yè)服務(wù)公司埃森哲率先借助 NVIDIA AI Foundry,使用 Accenture AI Refinery? 框架為自己以及那些希望所部署的生成式 AI 應(yīng)用能夠反映其文化、語言和行業(yè)的客戶來創(chuàng)建自定義 Llama 3.1 模型。

埃森哲董事長兼首席執(zhí)行官 Julie Sweet 表示:“全球領(lǐng)軍企業(yè)看到了生成式 AI 正在如何深入改變各行各業(yè),并且希望部署由自定義模型驅(qū)動的應(yīng)用。埃森哲的內(nèi)部 AI 應(yīng)用一直在使用 NVIDIA NIM 推理微服務(wù)?,F(xiàn)在,借助 NVIDIA AI Foundry,我們能夠幫助客戶快速創(chuàng)建和部署自定義 Llama 3.1 模型,為他們的優(yōu)先業(yè)務(wù)事項提供變革性的 AI 應(yīng)用?!?

NVIDIA AI Foundry 提供一種可用于快速構(gòu)建自定義超級模型的端到端服務(wù)。其結(jié)合 NVIDIA 軟件、基礎(chǔ)設(shè)施和專業(yè)知識與開放社區(qū)模型、技術(shù)和來自 NVIDIA AI 生態(tài)系統(tǒng)的支持。

借助 NVIDIA AI Foundry,企業(yè)能夠使用 Llama 3.1 模型和 NVIDIA NeMo 平臺(包含在 Hugging Face RewardBench 上排名第一的 NVIDIA Nemotron-4 340B Reward 模型)創(chuàng)建自定義模型。

在創(chuàng)建了自定義模型后,企業(yè)就可以構(gòu)建 NVIDIA NIM 推理微服務(wù),以便在其首選的云平臺和全球服務(wù)器制造商提供的 NVIDIA 認證系統(tǒng)?上,使用自己選擇的最佳機器學(xué)習(xí)運維(MLOps)和人工智能運維(AIOps)平臺在生產(chǎn)中運行這些模型。

NVIDIA AI Enterprise 專家和全球系統(tǒng)集成商合作伙伴與 AI Foundry 客戶一同加快從開發(fā)到部署的全過程。

NVIDIA Nemotron 為高級模型自定義提供助力

如果企業(yè)需要更多訓(xùn)練數(shù)據(jù)來創(chuàng)建特定領(lǐng)域的模型,可以在創(chuàng)建自定義 Llama 超級模型同時使用 Llama 3.1 405B 和 Nemotron-4 340B 生成合成數(shù)據(jù),以提高模型的準(zhǔn)確性。

擁有自己的訓(xùn)練數(shù)據(jù)的客戶可以使用 NVIDIA NeMo 對 Llama 3.1 模型進行自定義,通過領(lǐng)域自適應(yīng)預(yù)訓(xùn)練(DAPT)進一步提高模型的準(zhǔn)確性。

NVIDIA 和 Meta 還一起為 Llama 3.1 提供了一種提煉方法,供開發(fā)者為生成式 AI 應(yīng)用創(chuàng)建更小的自定義 Llama 3.1 模型。這使企業(yè)能夠在更多加速基礎(chǔ)設(shè)施(如 AI 工作站和筆記本電腦)上運行由 Llama 驅(qū)動的 AI 應(yīng)用。

行業(yè)領(lǐng)軍企業(yè)紛紛使用 NVIDIA 和 Llama 為 AI 提供強力支持

醫(yī)療、能源、金融服務(wù)、零售、交通、電信等行業(yè)的企業(yè)已在使用適用于 Llama 的 NVIDIA NIM 微服務(wù)。首批使用面向 Llama 3.1 全新 NIM 微服務(wù)的公司包括 Aramco、AT&T 和優(yōu)步。

Llama 3.1 多語種大語言模型(LLM)集合是一個具有 8B、70B 和 405B 三種參數(shù)規(guī)模的生成式 AI 模型集合。該集合中的模型在超過 16,000 個 NVIDIA Tensor Core GPU 上訓(xùn)練而成,并針對 NVIDIA 加速計算和軟件(無論是在數(shù)據(jù)中心、云以及配備 NVIDIA RTX? GPU 的本地工作站或配備 GeForce RTX GPU 的 PC 上)進行了優(yōu)化。

全新 NeMo Retriever RAG 微服務(wù)大幅提高準(zhǔn)確性和性能

通過使用全新的 NVIDIA NeMo Retriever NIM 推理微服務(wù)來實現(xiàn)檢索增強生成(RAG),企業(yè)可以將自定義 Llama 超級模型和 Llama NIM 微服務(wù)部署到生產(chǎn)中,以提高響應(yīng)準(zhǔn)確性。

當(dāng)與適用于 Llama 3.1 405B 的 NVIDIA NIM 推理微服務(wù)結(jié)合使用時,NeMo Retriever NIM 微服務(wù)可以為 RAG 工作流中的開放和商業(yè)文本問答帶來極高的檢索準(zhǔn)確性。

企業(yè)生態(tài)系統(tǒng)為 Llama 3.1 和 NeMo Retriever NIM 部署提供助力

數(shù)百家提供企業(yè)、數(shù)據(jù)和基礎(chǔ)設(shè)施平臺的 NVIDIA NIM 合作伙伴現(xiàn)在能夠?qū)⑦@些新的微服務(wù)集成到其 AI 解決方案中,從而為 NVIDIA 社區(qū) 500 多萬開發(fā)者和 1.9 萬家初創(chuàng)公司的生成式 AI 提供超強助力。

現(xiàn)在可以通過 NVIDIA AI Enterprise 獲得 Llama 3.1 NIM 和 NeMo Retriever NIM 微服務(wù)的生產(chǎn)支持。NVIDIA 開發(fā)者計劃會員將很快能夠免費訪問 NIM 微服務(wù),以在他們首選的基礎(chǔ)設(shè)施上進行研究、開發(fā)和測試。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉