7nm的勝利？AMD全球首發(fā)7nm CPU/GPU

時(shí)間：2018-11-13 10:22:01

關(guān)鍵字： 7nm CPU GPU amd霄龍

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]消息，繼全球首款7nm手機(jī)處理器之后，同樣基于臺(tái)積電7nm制程的CPU和GPU產(chǎn)品也正式發(fā)布。近日，AMD在美國(guó)舊金山的Next Horizon會(huì)議上發(fā)布了全球第一款7nm 代號(hào)“Rome”(羅馬)的

消息，繼全球首款7nm手機(jī)處理器之后，同樣基于臺(tái)積電7nm制程的CPU和GPU產(chǎn)品也正式發(fā)布。近日，AMD在美國(guó)舊金山的Next Horizon會(huì)議上發(fā)布了全球第一款7nm 代號(hào)“Rome”(羅馬)的第二代EPYC霄龍CPU處理器以及Radeon Instinct MI60/MI50的GPU計(jì)算卡。

7nm Rome(羅馬)第二代EPYC霄龍?zhí)幚砥?/p>

首發(fā)7nm CPU和GPU

AMD代號(hào)為Rome的第二代EPYC霄龍?zhí)幚砥骰赯en2架構(gòu)，Rome EPYC采用特殊設(shè)計(jì)的架構(gòu)，每顆處理器有8個(gè)CPU 裸片，每個(gè)裸片內(nèi)集成8個(gè)物理核心，共64個(gè)。同時(shí)為了更好地協(xié)調(diào)如此眾多CPU核心的協(xié)同工作，還專(zhuān)門(mén)設(shè)計(jì)了一個(gè)I/O裸片，放置在中央位置，專(zhuān)門(mén)負(fù)責(zé)輸入輸出控制，不過(guò)I/O裸片用14nm工藝制造。Rome處理器有8通道DDR4內(nèi)存控制器，每個(gè)插槽支持最高4TB DRAM。

Rome EPYC也是第一個(gè)支持PCIE 4.0技術(shù)的服務(wù)器級(jí)CPU，支持128個(gè)PCIe 4.0，帶寬通道數(shù)翻番，可提升加速器性能，搭配同樣支持PCIE 4.0技術(shù)的全新加速卡Radeon Instinct MI60，AMD表示可以帶來(lái)前所未有的加速性能。當(dāng)然，Rome EPYC也是全球第一款采用7nm工藝的數(shù)據(jù)中心處理器。目前Rome EPYC更詳細(xì)的參數(shù)暫未公布，AMD預(yù)測(cè)Rome EPYC性能將因核心數(shù)量的增加而翻倍，浮點(diǎn)性能也將因?yàn)镮PC架構(gòu)的改進(jìn)和核心數(shù)量的增加兩倍。

兼容性方面，Rome EPYC與現(xiàn)有的Naples，以及下一代的Milan都將保持兼容，這可以簡(jiǎn)化基于A(yíng)MD處理器的服務(wù)器開(kāi)發(fā)，也能讓服務(wù)器公司把現(xiàn)有的設(shè)計(jì)用在未來(lái)的服務(wù)器當(dāng)中。進(jìn)度方面，AMD正在向服務(wù)器制造商提供Rome EPYC樣品，計(jì)劃在2019年推出產(chǎn)品，但具體時(shí)間尚未公布。亞馬遜AWS計(jì)算副總裁Matt Garman表示，基于A(yíng)MD霄龍芯片的R5和M5實(shí)例產(chǎn)品今天就可使用，T3實(shí)例將在未來(lái)幾周上線(xiàn)，并重點(diǎn)強(qiáng)調(diào)了幫助客戶(hù)運(yùn)行最常見(jiàn)應(yīng)用程序時(shí)節(jié)省成本的特點(diǎn)。

GPU方面，AMD在今年Computex 2018上公布了7nm Radeon Vega GPU，《AMD搶先推全球首款7nm GPU，但能否按時(shí)出貨？》有詳細(xì)介紹，不過(guò)第一款正式發(fā)布的7nm GPU產(chǎn)品并不是Radeon RX游戲顯卡，而是Radeon Instinct計(jì)算卡。AMD同時(shí)發(fā)布了Radeon Instinct MI60/MI50，均基于7nm工藝的Vega架構(gòu)，得益于7nm工藝，Radeon Instinct計(jì)算卡集成132億個(gè)晶體管，比目前14nm Vega 的125億個(gè)晶體管增加了6.4％，核心面積為331平方毫米，比現(xiàn)在的484平方毫米縮小了31.6％。據(jù)稱(chēng)，在同等功耗下，新核心性能提升超過(guò)25％，同等頻率下新核心功耗降低50％。

Radeon Instinct顯存搭配最多32GB HBM2，帶寬達(dá)1TB/s，內(nèi)建ECC糾錯(cuò)。同樣，7nm Vega也是世界首個(gè)支持PCIE 4.0技術(shù)的GPU，雙向帶寬64GB/s，借助帶寬高達(dá)100GB/s的Infinity Fabric系統(tǒng)總線(xiàn)，支持4路GPU并行，雙路性能提升99％，4路比單路提升298％，8路比單路提升664％。

AMD 7nm Radeon Instinct 計(jì)算卡

在加速功能上，7nm Vega計(jì)算卡在幾個(gè)關(guān)鍵領(lǐng)域與Vega10有所不同，7nm Vega支持半速率雙精度，同時(shí)支持新的低精度數(shù)據(jù)類(lèi)型。具體看，MI60 FP64雙精度浮點(diǎn)最高為7.4TFlops，F(xiàn)P32單精度最高為14.7TFlops，INT整數(shù)最高為118Tops，相比于同樣Vega 10核心的MI25專(zhuān)業(yè)性能提升8.8倍。

還有值得注意的是，新的GPU還包括一對(duì)片外Infinity Fabric鏈路，允許Radeon Instinct卡通過(guò)相干鏈路直接相互連接。由于每個(gè)GPU只有2個(gè)鏈接，因此AMD的拓?fù)溥x項(xiàng)僅限于環(huán)上的變化，這意味著4路配置的GPU不能全部直接相互通信。另外，AMD仍堅(jiān)持使用PCIe卡，沒(méi)有像NVIDIA一樣的定制夾層式卡，所以這些卡需要通過(guò)頂部的橋接器連接。

為彌補(bǔ)AMD在軟件方面的不足，AMD宣布了開(kāi)源計(jì)算平臺(tái)ROCm 2.0，并繼續(xù)承諾完全開(kāi)源。進(jìn)度上，Radeon Instinct MI50將于今年第四季度上市，MI60將在明年一季度上市。

7nm的勝利？

7nm無(wú)疑成為了業(yè)界關(guān)注的焦點(diǎn)，不過(guò)AMD總裁兼首席執(zhí)行官蘇姿豐博士（Lisa Su）此前已經(jīng)多次談到AMD的7nm進(jìn)展。在此次Next Horizon會(huì)議上，AMD CTO Mark Papermaster表示，AMD在7nm上豪賭了一把，首先是相信能把7nm做出來(lái)，其次是認(rèn)為7nm將成為產(chǎn)業(yè)關(guān)鍵節(jié)點(diǎn)，并持續(xù)很長(zhǎng)一段時(shí)間。AMD最初的目標(biāo)是用自己的7nm和英特爾10nm競(jìng)爭(zhēng)，至少打成平手，但沒(méi)想到AMD先做出了7nm，并將成為在新節(jié)點(diǎn)上最先推出產(chǎn)品的公司。

除了已經(jīng)公布7nm架構(gòu)和產(chǎn)品，AMD還表示明年銳龍、霄龍將全線(xiàn)轉(zhuǎn)向7nm工藝的Zen2架構(gòu)，接下來(lái)將是7nm+升級(jí)版工藝的新架構(gòu)Zen3。不止于此，AMD還首次披露Zen4架構(gòu)正在設(shè)計(jì)中。Papermaster也強(qiáng)調(diào)了AMD路線(xiàn)圖的重要性以及實(shí)現(xiàn)路線(xiàn)圖的能力和決心，他表示Zen2架構(gòu)芯片正在流片，Zen3預(yù)計(jì)在2020年使用7nm+制程，Zen4開(kāi)發(fā)已接近尾聲。Zen4是否有機(jī)會(huì)用上5nm？

一舉超越英特爾和英偉達(dá)？

在Next Horizon會(huì)議上發(fā)布7nm EPYC的時(shí)候，AMD用一顆Rome EPYC（64核心）與兩顆Skylake Xeon 8180M（56核心）同時(shí)渲染1080p/QuadHD/4K圖像對(duì)比，結(jié)果成績(jī)分別是28.1秒和30.2秒，AMD更勝一籌。GPU方面，AMD擁有GPU最快配置的1TB/S全內(nèi)存帶寬，甚至超過(guò)NVIDIA旗艦產(chǎn)品GV100 GPU。這是否意味著AMD憑借著7nm一舉超越了英特爾和英偉達(dá)？

在《AMD的7nm處理器樣品出鍋了，不過(guò)似乎對(duì)Intel威脅不大》一文中已經(jīng)提到，國(guó)外論壇HardOCP上的一位壇友mockingbird爆料稱(chēng)RTG（Radeon Technology Group）已經(jīng)收到首款Zen 2架構(gòu)7nm處理器的樣品，但測(cè)試樣品的基礎(chǔ)/睿頻頻率是4.0/4.5GHz，要比目前Ryzen 7 2700X（3.7/4.1GHz）高一些，但與英特爾8700K 4.7GHz的睿頻頻率有差距，更不及未來(lái)9800K/9900K的5GHz。雖然AMD未來(lái)還有繼續(xù)打磨提高頻率的空間，但從初代Ryzen測(cè)試樣品與正式發(fā)售產(chǎn)品的頻率對(duì)比來(lái)看，提升空間應(yīng)該不大。

另外，硬件以及7nm并不就意味著處理器的成功，指令集也十分關(guān)鍵。據(jù)了解，AMD先有了SSE5指令集，然后英特爾推出了AVX指令集，接著AMD又效仿AVX，但保留SSE5中的FMA4、CVT16和XOP指令；然后英特爾效仿AMD加入CVT16，但改名為F16C，隨后又加入FMA4簡(jiǎn)化后的FMA3和AVX2.0指令；AMD只得跟風(fēng)，加入FMA3，承認(rèn)F16C，將來(lái)還要加入AVX2.0?？梢钥吹紸MD在指令集方面的競(jìng)爭(zhēng)非常激烈。

至于GPU領(lǐng)域，從AMD首發(fā)的7nm計(jì)算卡可以看出其非常重視服務(wù)器市場(chǎng)，不過(guò)在這一市場(chǎng)英偉達(dá)GPU擁有絕對(duì)的優(yōu)勢(shì)，與在CPU領(lǐng)域與英特爾的競(jìng)爭(zhēng)一樣，英偉達(dá)的領(lǐng)先使其有能力從架構(gòu)以及指令集等方面占據(jù)優(yōu)勢(shì)，一旦使用了7nm工藝，AMD在部分性能方面的優(yōu)勢(shì)能保持多久就不得而知。我們也可以從架構(gòu)上看，英偉達(dá)在今年八月放出了號(hào)稱(chēng)12年來(lái)的最大招圖靈（Turing）架構(gòu)，但圖靈架構(gòu)的RTX2080 GPU也繼承了很多Fermi架構(gòu)的東西，這意味著AMD也不太可能完全放棄GCN架構(gòu)設(shè)計(jì)新的架構(gòu)，并且此前AMD的研發(fā)中心都放在Zen架構(gòu)上，GPU的改進(jìn)乏力，基于目前的情況看，AMD能夠憑借新的工藝就實(shí)現(xiàn)對(duì)英偉達(dá)的反超？

認(rèn)為，AMD作為在高性能計(jì)算領(lǐng)域同時(shí)具有CPU和GPU產(chǎn)品的公司十分難得，不過(guò)可惜的是在CPU領(lǐng)域難以超越英特爾，在GPU領(lǐng)域難以超越英偉達(dá)，這其中有技術(shù)的因素，也有商業(yè)方面的原因。當(dāng)然對(duì)于消費(fèi)者和云廠(chǎng)商而言，只有競(jìng)爭(zhēng)才會(huì)帶來(lái)更好的產(chǎn)品，因此對(duì)于A(yíng)MD的7nm CPU和GPU我們依舊保持期待。