當前位置:首頁 > 公眾號精選 > 信息速遞
[導(dǎo)讀]21ic 獲悉,昨天 Meta 宣布將推出第一代自研的 AI 推理加速芯片(MTIA v1)以滿足 Meta 內(nèi)部 AI 開發(fā)與應(yīng)用的需要,MTIA v1 芯片在架構(gòu)方面由 PE 運算單元、片上緩存、片外緩存、傳輸接口、控制單元等組成。

21ic 獲悉,昨天 Meta 宣布將推出第一代自研的 AI 推理加速芯片(MTIA v1)以滿足 Meta 內(nèi)部 AI 開發(fā)與應(yīng)用的需要,MTIA v1 芯片在架構(gòu)方面由 PE 運算單元、片上緩存、片外緩存、傳輸接口、控制單元等組成。

據(jù)悉,該芯片是一款于 2020 年開始設(shè)計的 ASIC 芯片,通過編程可同時執(zhí)行一項或多項任務(wù),采用臺積電 7nm 制程工藝打造,運行頻率為 800MHz,TDP 為 25W,INT8 整數(shù)運算能力為 102.4 TOPS,F(xiàn)P16 浮點數(shù)運算能力為 51.2 TFLOPS,預(yù)計將于 2025 年推出。

該芯片在元訓(xùn)練和推理加速器上備了運行系統(tǒng)固件的專用控制子系統(tǒng),固件管理可用的計算和內(nèi)存資源,通過專用主機接口與主機通信,并協(xié)調(diào)加速器上的作業(yè)執(zhí)行。內(nèi)存子系統(tǒng)使用 LPDDR5 作為片外 DRAM 資源,可擴展至 128 GB。該芯片還有 128 MB 的片上 SRAM,由所有 PE 共享,為頻繁訪問的數(shù)據(jù)和指令提供更高的帶寬和更低的延遲。

此外,該網(wǎng)格包含以 8x8 配置組織的 64 個 PE。PE 相互連接,并通過網(wǎng)狀網(wǎng)絡(luò)連接到內(nèi)存塊。網(wǎng)格可以作為一個整體來運行一個作業(yè),也可以分成多個可以運行獨立作業(yè)的子網(wǎng)格。

每個 PE 配備兩個處理器內(nèi)核(其中一個配備矢量擴展)和一些固定功能單元,這些單元經(jīng)過優(yōu)化以執(zhí)行關(guān)鍵操作,例如矩陣乘法、累加、數(shù)據(jù)移動和非線性函數(shù)計算。處理器內(nèi)核基于 RISC-V 開放指令集架構(gòu) (ISA),并經(jīng)過大量定制以執(zhí)行必要的計算和控制任務(wù)。

每個 PE 還具有 128 KB 的本地 SRAM 內(nèi)存,用于快速存儲和操作數(shù)據(jù)。該架構(gòu)最大限度地提高了并行性和數(shù)據(jù)重用性,這是高效運行工作負載的基礎(chǔ)。該芯片提供線程和數(shù)據(jù)級并行性(TLP 和 DLP),利用指令級并行性 (ILP),并通過允許同時處理大量內(nèi)存請求來實現(xiàn)大量的內(nèi)存級并行性 (MLP)。

Meta 官網(wǎng)表示,AI 工作負載在 Meta 中無處不在,構(gòu)成了廣泛用例的基礎(chǔ),包括內(nèi)容理解、Feed、生成 AI 和廣告排名。這些工作負載在 PyTorch 上運行,具有一流的 Python 集成、急切模式開發(fā)和 API 的簡單性。

深度學(xué)習(xí)推薦模型 ( DLRM ) 對于改善跨 Meta 服務(wù)和應(yīng)用程序的體驗尤其重要。但隨著這些模型的規(guī)模和復(fù)雜性增加,底層硬件系統(tǒng)需要提供呈指數(shù)級增長的內(nèi)存和計算能力,同時保持高效。

對于以 Meta 規(guī)模所需的效率水平運行的特定推薦工作負載,GPU 并不總是最佳選擇。我們應(yīng)對這一挑戰(zhàn)的解決方案是設(shè)計一系列特定于推薦的元訓(xùn)練和推理加速器 (MTIA) ASIC。Meta 根據(jù)下一代推薦模型的要求共同設(shè)計了第一代 ASIC,并將其集成到 PyTorch 中以創(chuàng)建一個完全優(yōu)化的排名系統(tǒng)。

此外,Meta 聲稱保持了 PyTorch 急切模式開發(fā)提供的用戶體驗和開發(fā)人員效率。隨著繼續(xù)支持 PyTorch 2.0,開發(fā)人員效率是一段旅程,它增強了 PyTorch 在編譯器級別(引擎下)的運行方式。

Meta 推出自研 AI 運算芯片:MTIA v1

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉