今天,總部位于英國的AI芯片公司Graphcore發(fā)布了第二代IPU GC200,采用臺積電7nm工藝,晶體管數(shù)量高達594億個,裸片面積達到823平方毫米。黃仁勛當(dāng)時說A100是全球最大的7nm芯片,裸片面積為826平方毫米。
這比兩個月前英偉達最新發(fā)布的安培架構(gòu)GPU A100的540億個晶體管增加了10%。
IPU是一種全新的大規(guī)模并行處理器,此前報道,已經(jīng)推出了基于臺積電16nm工藝集成236億個晶體管的GC2 IPU,120瓦的功耗下有125TFlops的混合精度、300M的SRAM能夠把完整的模型放在片內(nèi)。
第二代IPU GC2000(MK2)與第一代IPU(MK1)相比,實際性能提高了8倍。Graphcore聯(lián)合創(chuàng)始人兼CEO Nigel Toon表示,GC200是目前世界上最復(fù)雜的處理器,可使創(chuàng)新者實現(xiàn)AI的革命性突破。
Mk1 IPU產(chǎn)品與Mk2 IPU產(chǎn)品性能對比
據(jù)悉,GC2000芯片內(nèi)部有1,472個獨立的處理器內(nèi)核,能夠執(zhí)行8,832個獨立的并行線程,所有這些均由900MB的RAM支持。
Nigel說:“GC200在處理器內(nèi)部具有史無前例的900MB超高速SRAM,在每個處理器內(nèi)核旁邊都設(shè)有大量RAM,以實現(xiàn)每位最低能量的訪問。Graphcore的Poplar軟件還允許IPU通過Graphcore獨特的Exchange-Memory通信訪問Streaming Memory。這甚至可以支持具有數(shù)千億個參數(shù)的最大模型。每個IPU-M2000都可以支持密度高達450GB的Exchange-Memory,以及前所未有的180TB/秒的帶寬?!?
Graphcore IPU-Fabric技術(shù)
除此之外,基于最新GC200的一款即插即用的機器智能刀片式計算單元IPU-M2000還集成了Graphcore的專用AI聯(lián)網(wǎng)IPU-Fabric。新的Graphcore GC4000 IPU-Gateway芯片可以讓每個IPU-M2000提供2.8Tbps。Graphcore稱,在從數(shù)十個IPU擴展到數(shù)以萬計個IPU的過程中,IPU-Fabric技術(shù)使通信時延幾乎保持恒定。
據(jù)悉,1U大小的IPU-M2000可提供1個PetaFlop的機器智能計算。利用IPU-M2000可構(gòu)建成IPU-POD64的模塊化機架規(guī)模解決方案。IPU-M2000的設(shè)計使客戶可以在IPU-POD配置中構(gòu)建多達64,000個IPU的數(shù)據(jù)中心規(guī)模系統(tǒng),提供16ExaFlops的機器智能計算能力。
Graphcore也強調(diào),其Poplar SDK可以使開發(fā)者無論使用單個IPU還是要使用數(shù)千個IPU完成機器智能工作負(fù)載都可以讓過程變得簡單。
此外,最重要的是,Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤表示,中國很可能成為Graphcore最新推出的第二代處理器技術(shù)最先實現(xiàn)商業(yè)化落地的區(qū)域之一。