當前位置:首頁 > 廠商動態(tài) > Arm
[導讀]Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近期宣布通過將Arm? Kleidi技術集成到 PyTorch 和 ExecuTorch,賦能新一代應用在 Arm CPU 上運行大語言模型 (LLM)。Kleidi 匯集了最新的開發(fā)者賦能技術和關鍵資源,旨在推動機器學習 (ML) 技術棧中的技術協(xié)作和創(chuàng)新。通過這些重要進展,Arm 致力于為任一 ML 技術棧的開發(fā)者提供更為順暢的體驗。

新聞重點:

?Arm 通過把 Kleidi 技術集成到 PyTorch 和 ExecuTorch,將關鍵的 AI 性能優(yōu)勢從邊側(cè)拓展至云端,賦能新一代應用在 Arm CPU 上運行大語言模型。

?對普及 ML 工作負載的持續(xù)投入將使任一技術棧的開發(fā)者能夠在最新的生成式 AI 模型上即刻獲得顯著的推理性能提升。

?通過擴大與云服務提供商以及主要的 ML 獨立軟件開發(fā)商合作,進一步賦能全球的 AI 開發(fā)者。

Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近期宣布通過將Arm® Kleidi技術集成到 PyTorch 和 ExecuTorch,賦能新一代應用在 Arm CPU 上運行大語言模型 (LLM)。Kleidi 匯集了最新的開發(fā)者賦能技術和關鍵資源,旨在推動機器學習 (ML) 技術棧中的技術協(xié)作和創(chuàng)新。通過這些重要進展,Arm 致力于為任一 ML 技術棧的開發(fā)者提供更為順暢的體驗。

Arm 戰(zhàn)略與生態(tài)部開發(fā)者技術副總裁 Alex Spinelli 表示:“Arm 正與領先的云服務提供商和框架設計者緊密合作,以打造便捷的開發(fā)環(huán)境,讓軟件開發(fā)者能夠輕松地在基于 Arm 架構的硬件上加速人工智能 (AI) 和 ML 工作負載。自該技術推出的四個月以來,Kleidi 已在 Arm CPU 上加速開發(fā)并顯著提升主要的 AI 性能。Arm 與 PyTorch 社區(qū)的緊密合作印證了該技術可以大大減少開發(fā)者利用高效 AI 所需的工作量?!?

與領先框架集成,實現(xiàn)顯著云端優(yōu)勢

在云端,Kleidi 以利用 Arm Compute Libraries (ACL) 增強 PyTorch 帶來的成果為基礎,為世界各地在 Arm 平臺上優(yōu)化 AI 的開發(fā)者打造藍圖。通過為開發(fā)者免去不必要的工程工作,以便開發(fā)者能將 Arm 視為運行其關鍵 ML 工作負載的首選平臺。作為實現(xiàn)這一愿景的關鍵一步,Arm 直接與 PyTorch 和 TensorFlow 進行 Arm Kleidi Libraries 的集成合作,這包括將基本的 Arm 軟件庫直接集成到上述的領先框架中。

重要的是,這意味著當新的框架版本發(fā)布時,應用開發(fā)者能夠自動從其大幅的性能提升中受益,而無需額外在 Arm 平臺上重新編譯。這項投入已對合作伙伴關系產(chǎn)生了積極影響:

Arm 聊天機器人演示由 Meta Llama 3 LLM 驅(qū)動,并運行在亞馬遜云科技 (AWS) Graviton 處理器上,首次在主線 PyTorch 中實現(xiàn)了實時聊天響應。

根據(jù)在 AWS Graviton4 上所測得的數(shù)據(jù)顯示,通過將 Kleidi 技術集成到開源 PyTorch 代碼庫,詞元 (token) 首次響應時間可提高 2.5 倍。

通過優(yōu)化 torch.compile以充分利用通過 ACL 提供的 Kleidi 技術,在基于 AWS Graviton3 上所測得的數(shù)據(jù)顯示,各類 Hugging Face 模型推理工作負載上的性能可提升 1.35 至 2 倍。

這些僅是出色的云端示例之一,卻代表了在 Arm 平臺上普及 ML 工作負載時可實現(xiàn)的性能加速類型。Arm 將持續(xù)投入,以確保開發(fā)者的 AI 應用可以在其技術上從云到邊都能完美運行,其中包括實現(xiàn)新功能的向前兼容,進而使得開發(fā)者能夠即刻從中受益。

合作助力開發(fā)者緊跟生成式 AI 發(fā)展步伐

隨著新的語言模型版本快速地推陳出新,生成式 AI 掀起了一波 AI 創(chuàng)新熱潮。Arm 持續(xù)與 ML 技術棧的各個關鍵環(huán)節(jié)緊密合作,攜手 AWS 和 Google 等云服務提供商以及 Databricks 等迅速壯大的 ML 獨立軟件開發(fā)商 (ISV) 社區(qū),進而幫助開發(fā)者立于技術前沿。

Google Cloud Compute 產(chǎn)品管理高級總監(jiān) Nirav Mehta 表示:“Arm 和 Google Cloud 致力于為開發(fā)者提升 AI 的可訪問性和敏捷性,而 Kleidi 代表了通過軟硬件協(xié)同優(yōu)化滿足 AI 需求所取得的重要進展。隨著我們的客戶正積極采用基于 Arm 架構的定制 CPU —— Axion,我們期待在整個 ML 技術棧中為客戶帶來更加順暢的集成體驗?!?

Databricks 軟件工程師Lin Yuan 表示:“利用 Databricks Data Intelligence Platform 進行 AI 和 ML 工作流的企業(yè),將受益于跨 ML 軟件棧的 Arm Kleidi 集成所帶來的性能優(yōu)化。借助由 Databricks ML Runtime 集群提供支持的 Arm 架構 AWS Graviton 處理器,企業(yè)可以從各種 ML 軟件庫的加速中受益,同時降低云服務提供商的成本?!?

協(xié)助開發(fā)者將 Arm 提供的資源應用到實際用例中至關重要,為此 Arm 創(chuàng)建示例軟件棧和學習資源,向開發(fā)者展示如何在 Arm CPU 上構建 AI 工作負載,進而迅速推動了 Arm 系統(tǒng)的廣泛采用,并加快了開發(fā)者在 Arm 系統(tǒng)上的部署速度。第一個案例是通過Kleidi 技術加速聊天機器人的實現(xiàn),今年晚些時候 ML Ops 和檢索增強生成 (RAG) 也將添加至這些用例,并計劃在 2025 年實現(xiàn)更多成果。

持續(xù)提升端側(cè)性能

基于 Kleidi 在端側(cè)的發(fā)展勢頭,KleidiAI 還將被集成到ExecuTorch(PyTorch 新的端側(cè)推理運行時)。這項集成預計將于 2024 年 10 月完成,并有望為目前正在 ExecuTorch 中進行生產(chǎn)測試或?qū)崿F(xiàn)的端側(cè)應用帶來顯著的性能提升。目前已完成的多項 KleidiAI 集成包括與Google XNNPACK 和 MediaPipe,以及騰訊的混元大模型,為其實際工作負載帶來了顯著提升。

Kleidi 將繼續(xù)與 PyTorch 和 ExecuTorch 的各版本以及其他主要 AI 框架進行集成。從云數(shù)據(jù)中心到端側(cè)設備,開發(fā)者現(xiàn)在可以即刻在各類設備上基于 Arm 平臺高效運行高性能 AI 工作負載。Arm 將繼續(xù)積極地面向 PyTorch 社區(qū)推出增強功能,并專注于針對各種整數(shù)格式提供量化優(yōu)化,進一步提高性能,賦能 Arm CPU 大規(guī)模無縫運行新一代 AI 體驗。

實現(xiàn)更多成果以賦能開發(fā)者

PyTorch 正在推動 ML 開發(fā)領域的開拓創(chuàng)新。近日,Arm 加入 PyTorch 基金會成為 Premier 成員,這對于 Arm 的 AI 之旅來說,無疑是一個重要時刻。Arm 將持續(xù)致力于賦能全球各地的開發(fā)者在 Arm 平臺上充分發(fā)揮端到端 AI 的潛力,進而塑造前沿的 AI 和應用功能。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉