7nm的勝利?AMD全球首發(fā)7nm CPU/GPU
消息,繼全球首款7nm手機(jī)處理器之后,同樣基于臺(tái)積電7nm制程的CPU和GPU產(chǎn)品也正式發(fā)布。近日,AMD在美國(guó)舊金山的Next Horizon會(huì)議上發(fā)布了全球第一款7nm 代號(hào)“Rome”(羅馬)的第二代EPYC霄龍CPU處理器以及Radeon Instinct MI60/MI50的GPU計(jì)算卡。
7nm Rome(羅馬)第二代EPYC霄龍?zhí)幚砥?/p>
首發(fā)7nm CPU和GPU
AMD代號(hào)為Rome的第二代EPYC霄龍?zhí)幚砥骰赯en2架構(gòu),Rome EPYC采用特殊設(shè)計(jì)的架構(gòu),每顆處理器有8個(gè)CPU 裸片,每個(gè)裸片內(nèi)集成8個(gè)物理核心,共64個(gè)。同時(shí)為了更好地協(xié)調(diào)如此眾多CPU核心的協(xié)同工作,還專(zhuān)門(mén)設(shè)計(jì)了一個(gè)I/O裸片,放置在中央位置,專(zhuān)門(mén)負(fù)責(zé)輸入輸出控制,不過(guò)I/O裸片用14nm工藝制造。Rome處理器有8通道DDR4內(nèi)存控制器,每個(gè)插槽支持最高4TB DRAM。
Rome EPYC也是第一個(gè)支持PCIE 4.0技術(shù)的服務(wù)器級(jí)CPU,支持128個(gè)PCIe 4.0,帶寬通道數(shù)翻番,可提升加速器性能,搭配同樣支持PCIE 4.0技術(shù)的全新加速卡Radeon Instinct MI60,AMD表示可以帶來(lái)前所未有的加速性能。當(dāng)然,Rome EPYC也是全球第一款采用7nm工藝的數(shù)據(jù)中心處理器。目前Rome EPYC更詳細(xì)的參數(shù)暫未公布,AMD預(yù)測(cè)Rome EPYC性能將因核心數(shù)量的增加而翻倍,浮點(diǎn)性能也將因?yàn)镮PC架構(gòu)的改進(jìn)和核心數(shù)量的增加兩倍。
兼容性方面,Rome EPYC與現(xiàn)有的Naples,以及下一代的Milan都將保持兼容,這可以簡(jiǎn)化基于A(yíng)MD處理器的服務(wù)器開(kāi)發(fā),也能讓服務(wù)器公司把現(xiàn)有的設(shè)計(jì)用在未來(lái)的服務(wù)器當(dāng)中。進(jìn)度方面,AMD正在向服務(wù)器制造商提供Rome EPYC樣品,計(jì)劃在2019年推出產(chǎn)品,但具體時(shí)間尚未公布。亞馬遜AWS計(jì)算副總裁Matt Garman表示,基于A(yíng)MD霄龍芯片的R5和M5實(shí)例產(chǎn)品今天就可使用,T3實(shí)例將在未來(lái)幾周上線(xiàn),并重點(diǎn)強(qiáng)調(diào)了幫助客戶(hù)運(yùn)行最常見(jiàn)應(yīng)用程序時(shí)節(jié)省成本的特點(diǎn)。
GPU方面,AMD在今年Computex 2018上公布了7nm Radeon Vega GPU,《AMD搶先推全球首款7nm GPU,但能否按時(shí)出貨?》有詳細(xì)介紹,不過(guò)第一款正式發(fā)布的7nm GPU產(chǎn)品并不是Radeon RX游戲顯卡,而是Radeon Instinct計(jì)算卡。AMD同時(shí)發(fā)布了Radeon Instinct MI60/MI50,均基于7nm工藝的Vega架構(gòu),得益于7nm工藝,Radeon Instinct計(jì)算卡集成132億個(gè)晶體管,比目前14nm Vega 的125億個(gè)晶體管增加了6.4%,核心面積為331平方毫米,比現(xiàn)在的484平方毫米縮小了31.6%。據(jù)稱(chēng),在同等功耗下,新核心性能提升超過(guò)25%,同等頻率下新核心功耗降低50%。
Radeon Instinct顯存搭配最多32GB HBM2,帶寬達(dá)1TB/s,內(nèi)建ECC糾錯(cuò)。同樣,7nm Vega也是世界首個(gè)支持PCIE 4.0技術(shù)的GPU,雙向帶寬64GB/s,借助帶寬高達(dá)100GB/s的Infinity Fabric系統(tǒng)總線(xiàn),支持4路GPU并行,雙路性能提升99%,4路比單路提升298%,8路比單路提升664%。
AMD 7nm Radeon Instinct 計(jì)算卡
在加速功能上,7nm Vega計(jì)算卡在幾個(gè)關(guān)鍵領(lǐng)域與Vega10有所不同,7nm Vega支持半速率雙精度,同時(shí)支持新的低精度數(shù)據(jù)類(lèi)型。具體看,MI60 FP64雙精度浮點(diǎn)最高為7.4TFlops,F(xiàn)P32單精度最高為14.7TFlops,INT整數(shù)最高為118Tops,相比于同樣Vega 10核心的MI25專(zhuān)業(yè)性能提升8.8倍。
還有值得注意的是,新的GPU還包括一對(duì)片外Infinity Fabric鏈路,允許Radeon Instinct卡通過(guò)相干鏈路直接相互連接。由于每個(gè)GPU只有2個(gè)鏈接,因此AMD的拓?fù)溥x項(xiàng)僅限于環(huán)上的變化,這意味著4路配置的GPU不能全部直接相互通信。另外,AMD仍堅(jiān)持使用PCIe卡,沒(méi)有像NVIDIA一樣的定制夾層式卡,所以這些卡需要通過(guò)頂部的橋接器連接。
為彌補(bǔ)AMD在軟件方面的不足,AMD宣布了開(kāi)源計(jì)算平臺(tái)ROCm 2.0,并繼續(xù)承諾完全開(kāi)源。進(jìn)度上,Radeon Instinct MI50將于今年第四季度上市,MI60將在明年一季度上市。
7nm的勝利?
7nm無(wú)疑成為了業(yè)界關(guān)注的焦點(diǎn),不過(guò)AMD總裁兼首席執(zhí)行官蘇姿豐博士(Lisa Su)此前已經(jīng)多次談到AMD的7nm進(jìn)展。在此次Next Horizon會(huì)議上,AMD CTO Mark Papermaster表示,AMD在7nm上豪賭了一把,首先是相信能把7nm做出來(lái),其次是認(rèn)為7nm將成為產(chǎn)業(yè)關(guān)鍵節(jié)點(diǎn),并持續(xù)很長(zhǎng)一段時(shí)間。AMD最初的目標(biāo)是用自己的7nm和英特爾10nm競(jìng)爭(zhēng),至少打成平手,但沒(méi)想到AMD先做出了7nm,并將成為在新節(jié)點(diǎn)上最先推出產(chǎn)品的公司。
除了已經(jīng)公布7nm架構(gòu)和產(chǎn)品,AMD還表示明年銳龍、霄龍將全線(xiàn)轉(zhuǎn)向7nm工藝的Zen2架構(gòu),接下來(lái)將是7nm+升級(jí)版工藝的新架構(gòu)Zen3。不止于此,AMD還首次披露Zen4架構(gòu)正在設(shè)計(jì)中。Papermaster也強(qiáng)調(diào)了AMD路線(xiàn)圖的重要性以及實(shí)現(xiàn)路線(xiàn)圖的能力和決心,他表示Zen2架構(gòu)芯片正在流片,Zen3預(yù)計(jì)在2020年使用7nm+制程,Zen4開(kāi)發(fā)已接近尾聲。Zen4是否有機(jī)會(huì)用上5nm?
一舉超越英特爾和英偉達(dá)?
在Next Horizon會(huì)議上發(fā)布7nm EPYC的時(shí)候,AMD用一顆Rome EPYC(64核心)與兩顆Skylake Xeon 8180M(56核心)同時(shí)渲染1080p/QuadHD/4K圖像對(duì)比,結(jié)果成績(jī)分別是28.1秒和30.2秒,AMD更勝一籌。GPU方面,AMD擁有GPU最快配置的1TB/S全內(nèi)存帶寬,甚至超過(guò)NVIDIA旗艦產(chǎn)品GV100 GPU。這是否意味著AMD憑借著7nm一舉超越了英特爾和英偉達(dá)?
在《AMD的7nm處理器樣品出鍋了,不過(guò)似乎對(duì)Intel威脅不大》一文中已經(jīng)提到,國(guó)外論壇HardOCP上的一位壇友mockingbird爆料稱(chēng)RTG(Radeon Technology Group)已經(jīng)收到首款Zen 2架構(gòu)7nm處理器的樣品,但測(cè)試樣品的基礎(chǔ)/睿頻頻率是4.0/4.5GHz,要比目前Ryzen 7 2700X(3.7/4.1GHz)高一些,但與英特爾8700K 4.7GHz的睿頻頻率有差距,更不及未來(lái)9800K/9900K的5GHz。雖然AMD未來(lái)還有繼續(xù)打磨提高頻率的空間,但從初代Ryzen測(cè)試樣品與正式發(fā)售產(chǎn)品的頻率對(duì)比來(lái)看,提升空間應(yīng)該不大。
另外,硬件以及7nm并不就意味著處理器的成功,指令集也十分關(guān)鍵。據(jù)了解,AMD先有了SSE5指令集,然后英特爾推出了AVX指令集,接著AMD又效仿AVX,但保留SSE5中的FMA4、CVT16和XOP指令;然后英特爾效仿AMD加入CVT16,但改名為F16C,隨后又加入FMA4簡(jiǎn)化后的FMA3和AVX2.0指令;AMD只得跟風(fēng),加入FMA3,承認(rèn)F16C,將來(lái)還要加入AVX2.0??梢钥吹紸MD在指令集方面的競(jìng)爭(zhēng)非常激烈。
至于GPU領(lǐng)域,從AMD首發(fā)的7nm計(jì)算卡可以看出其非常重視服務(wù)器市場(chǎng),不過(guò)在這一市場(chǎng)英偉達(dá)GPU擁有絕對(duì)的優(yōu)勢(shì),與在CPU領(lǐng)域與英特爾的競(jìng)爭(zhēng)一樣,英偉達(dá)的領(lǐng)先使其有能力從架構(gòu)以及指令集等方面占據(jù)優(yōu)勢(shì),一旦使用了7nm工藝,AMD在部分性能方面的優(yōu)勢(shì)能保持多久就不得而知。我們也可以從架構(gòu)上看,英偉達(dá)在今年八月放出了號(hào)稱(chēng)12年來(lái)的最大招圖靈(Turing)架構(gòu),但圖靈架構(gòu)的RTX2080 GPU也繼承了很多Fermi架構(gòu)的東西,這意味著AMD也不太可能完全放棄GCN架構(gòu)設(shè)計(jì)新的架構(gòu),并且此前AMD的研發(fā)中心都放在Zen架構(gòu)上,GPU的改進(jìn)乏力,基于目前的情況看,AMD能夠憑借新的工藝就實(shí)現(xiàn)對(duì)英偉達(dá)的反超?
認(rèn)為,AMD作為在高性能計(jì)算領(lǐng)域同時(shí)具有CPU和GPU產(chǎn)品的公司十分難得,不過(guò)可惜的是在CPU領(lǐng)域難以超越英特爾,在GPU領(lǐng)域難以超越英偉達(dá),這其中有技術(shù)的因素,也有商業(yè)方面的原因。當(dāng)然對(duì)于消費(fèi)者和云廠(chǎng)商而言,只有競(jìng)爭(zhēng)才會(huì)帶來(lái)更好的產(chǎn)品,因此對(duì)于A(yíng)MD的7nm CPU和GPU我們依舊保持期待。