Graphcore 發(fā)布 7nm 級(jí)第二代 IPU,性能提升 8 倍
7 月 15 日消息,Graphcore 今日正式發(fā)布第二代 IPU 以及用于大規(guī)模系統(tǒng)級(jí)產(chǎn)品 IPU-Machine: M2000(IPU-M2000)。新產(chǎn)品比第一代 Graphcore IPU 性能提升 8 倍。中國(guó)很可能成為 Graphcore 最新推出的第二代處理器技術(shù)最先實(shí)現(xiàn)商業(yè)化落地的區(qū)域之一。
據(jù)介紹,IPU-M2000 是一款即插即用的機(jī)器智能刀片式計(jì)算單元,由 Graphcore 全新的 7 納米 Colossus 第二代 GC200 IPU 提供動(dòng)力,并由 Poplar 軟件棧提供全面支持。其設(shè)計(jì)便于部署,并支持可擴(kuò)展至大規(guī)模的系統(tǒng)。這款纖薄的 1U 刀片機(jī)可提供 1 個(gè) PetaFlop 的機(jī)器智能計(jì)算,并集成了針對(duì) AI 擴(kuò)展優(yōu)化的網(wǎng)絡(luò)技術(shù)。
Graphcore 第二代 Colossus IPU 處理器:GC200
Graphcore IPU-M2000
IPU-M2000 可構(gòu)建成 IPU-POD64 這一 Graphcore 全新模塊化機(jī)架規(guī)模解決方案,可用于極大型機(jī)器智能橫向擴(kuò)展,提供前所未有的 AI 計(jì)算可能性,以及完全的靈活性和易于部署的特性。它可以從一個(gè)機(jī)架式本地系統(tǒng)擴(kuò)展到高度互連的超高性能 AI 計(jì)算設(shè)施中的 1000 多個(gè) IPU-POD64 系統(tǒng)。
“隨著 IPU-M2000 和 IPU-POD64 的推出,Graphcore 進(jìn)一步擴(kuò)大了我們?cè)跈C(jī)器智能領(lǐng)域的產(chǎn)品競(jìng)爭(zhēng)優(yōu)勢(shì)?!盙raphcore 首席執(zhí)行官 Nigel Toon 指出:“Graphcore 通過(guò)技術(shù)創(chuàng)新實(shí)現(xiàn)更強(qiáng)有力的產(chǎn)品線,這些創(chuàng)新能夠提供客戶所期望的行業(yè)領(lǐng)先性能。對(duì)于尋求將機(jī)器智能計(jì)算添加到數(shù)據(jù)中心的客戶而言,Graphcore 最新推出的 IPU-M2000 憑借其強(qiáng)大的算力、易于擴(kuò)展的靈活性和突出的易用性,將具有極強(qiáng)的可行性和價(jià)值提升潛力。”
Mk1 IPU 產(chǎn)品的用戶可以確信,他們現(xiàn)有的模型和系統(tǒng)可以在這些新的 Mk2 IPU 系統(tǒng)上無(wú)縫運(yùn)行。與第一代 Graphcore IPU 產(chǎn)品相比,第二代產(chǎn)品的性能還將提高 8 倍。
Mk1 IPU 產(chǎn)品與 Mk2 IPU 產(chǎn)品性能對(duì)比
IPU-M2000 的設(shè)計(jì)使客戶可以在 IPU-POD?配置中構(gòu)建多達(dá) 64,000 個(gè) IPU 的數(shù)據(jù)中心規(guī)模系統(tǒng),提供 16ExaFlops 的機(jī)器智能計(jì)算能力。新的 IPU-M2000 甚至能夠處理最艱巨的機(jī)器智能訓(xùn)練或大規(guī)模部署工作負(fù)載。
Graphcore 全新的 IPU-Fabric 技術(shù)使大規(guī)模連接 IPU-M2000 和 IPU-POD 成為可能,該技術(shù)是專為機(jī)器智能通信而從頭設(shè)計(jì)的,并提供了專用的低時(shí)延結(jié)構(gòu),可在整個(gè)數(shù)據(jù)中心內(nèi)連接 IPU。
Graphcore IPU-Fabric 技術(shù)
Graphcore 的 Virtual-IPU 軟件與工作量管理和編排軟件集成在一起,可以輕松地為許多不同的用戶提供訓(xùn)練和推理服務(wù),并允許根據(jù)工作情況調(diào)整和重新配置可用的資源。
Graphcore 的最新產(chǎn)品線是通過(guò)三大顛覆性技術(shù)創(chuàng)新實(shí)現(xiàn)的,這些創(chuàng)新可提供客戶期望的行業(yè)領(lǐng)先性能:
計(jì)算:每個(gè) IPU-M2000 的核心都是 Graphcore 新的 Graphcore ColossusMk2 GC200 IPU。該芯片采用臺(tái)積電最新的 7 納米工藝技術(shù)開發(fā),每個(gè)芯片在一個(gè) 823 平方毫米的裸片上包含超過(guò) 594 億個(gè)晶體管,使其成為有史以來(lái)最復(fù)雜的處理器。數(shù)據(jù):每個(gè) IPU 都有大量的 In-Processor Memory。Graphcore 新型 Mk2 GC200 在處理器內(nèi)部具有史無(wú)前例的 900MB 超高速 SRAM,在每個(gè)處理器內(nèi)核旁邊都設(shè)有大量 RAM,以實(shí)現(xiàn)每位最低能量的訪問(wèn)。Graphcore 的 Poplar 軟件還允許 IPU 通過(guò) Graphcore 獨(dú)特的 Exchange-Memory?通信訪問(wèn) Streaming Memory?。這甚至可以支持具有數(shù)千億個(gè)參數(shù)的最大模型。每個(gè) IPU-M2000 都可以支持密度高達(dá) 450GB 的 Exchange-Memory,以及前所未有的 180TB / 秒的帶寬。通信:IPU-M2000 具有內(nèi)置的專用 AI 聯(lián)網(wǎng) IPU-Fabric。Graphcore 創(chuàng)建了一個(gè)新的 Graphcore GC4000 IPU-Gateway 芯片,該芯片可提供令人難以置信的低時(shí)延和高帶寬,每個(gè) IPU-M2000 均可提供 2.8Tbps。在從數(shù)十個(gè) IPU 擴(kuò)展到數(shù)以萬(wàn)計(jì)個(gè) IPU 的過(guò)程中,IPU-Fabric 技術(shù)使通信時(shí)延幾乎保持恒定。
“將強(qiáng)勁算力與網(wǎng)絡(luò)能力相結(jié)合,我們能夠處理全球最先進(jìn)、最復(fù)雜的算法模型?!盙raphcore 高級(jí)副總裁兼中國(guó)區(qū)總經(jīng)理盧濤表示:“這樣的算法模型,對(duì)中國(guó)本地的 AI 算法落地場(chǎng)景,如云計(jì)算、互聯(lián)網(wǎng)和通信等場(chǎng)景都會(huì)產(chǎn)生推動(dòng)作用,并將為 AI 產(chǎn)業(yè)者提供巨大的價(jià)值?!?/p>
Graphcore 是一家英國(guó) AI 芯片硬件設(shè)計(jì)初創(chuàng)公司,成立于 2016 年,總部位于英國(guó)布里斯托,Graphcore 的主要業(yè)務(wù)是設(shè)計(jì)用于 AI 應(yīng)用程序的處理器,為云服務(wù)等應(yīng) 用提供產(chǎn)品支持。其 16 納米 IPU GC2 處理器已量產(chǎn)。