當前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]消息,作為今天凌晨Next Horizon活動的一部分,AMD正式公布了基于7nm Vega20 GPU的兩款加速卡,分別為Radeon Instinct MI60和Radeon Instinct M

消息,作為今天凌晨Next Horizon活動的一部分,AMD正式公布了基于7nm Vega20 GPU的兩款加速卡,分別為Radeon Instinct MI60和Radeon Instinct MI50,主要針對企業(yè)加速器市場,AMD希望在從HPC到機器學習的各個方面顯著提高其性能競爭力。

這兩款加速卡都是基于AMD的7nm Vega20 GPU,盡管我們此前已經(jīng)得知了如Vega20基于第5代GCN架構(gòu)、是AMD現(xiàn)有Vega10架構(gòu)的改進版本等部分消息,但此次Next Horizon活動上AMD再次公布了其他一些細節(jié)。

從芯片的功能模塊而言,7nm Vega20實際上與現(xiàn)有的14nm Vega 10 GPU非常接近,它們都具有64個CU(4096流處理器),都使用HBM2顯存。Vega20的核心頻率為1800MHz,單精度浮點(FP32)性能為14.7TFlops,半精度浮點(FP16)性能為29.5TFlpos。

二者的差異主要在于額外的加速器功能,AMD為Vega20增加了加速器市場所必需的以計算為中心的功能。在加速器功能方面,Vega20 GPU以及MI60/MI50加速卡在幾個關(guān)鍵領(lǐng)域上與Vega 10及MI25不同, Vega20的雙精度浮點運算性能是單精度浮點的一半,為7.4TFlops,而Vega 10只有1/16。

此外Vega20也支持INT8和INT4等對于機器學習推理特別有用的低精度數(shù)據(jù)類型,其INT8性能是FP16性能的2倍,為58.9Tops,INT4性能是FP16性能的4倍,達到118Tops。不過從AMD的演示中尚無法弄清這些新數(shù)據(jù)類型的靈活性以及它們可以使用的指令,這對于理解新GPU的全部功能非常重要。

AMD還增強了Vega20的顯存系統(tǒng),為GPU增加了另外一對HBM2顯存控制器,顯存位寬恢復(fù)至Fiji時代的4096bit,同時顯存頻率也提升到2Gbps,使GPU的顯存帶寬達到1TB/s,這甚至超過了NVIDIA旗艦產(chǎn)品GV100 GPU,為AMD帶來了優(yōu)勢。

同時由于這是一款專注于企業(yè)的GPU,它提供了端到端的ECC校驗?zāi)芰σ约翱煽啃?、可訪問性和可維護性(RAS)技術(shù),這對于大規(guī)模HPC計算結(jié)果的準確性至關(guān)重要,也標志著AMD GPU幾年來首次提供完整的ECC支持。

另外了解到,Vega20還支持AMD MxGPU技術(shù),這是業(yè)界唯一基于硬件的GPU虛擬化解決方案,基于行業(yè)標準的SR-IOV(單根I/O虛擬化)技術(shù),使黑客難以進行硬件級別的攻擊,有助于為虛擬化云部署提供安全性。

在PCI-E通道方面,AMD已經(jīng)透露Vega20支持最新的PCI-E 4.0標準,在同為x16配置下帶寬可比PCI-E 3.0提升一倍,達到32GB/s。除此之外,AMD還為Vega20設(shè)計了一對片外Infinity Fabric鏈路,允許Radeon Instinct卡通過相干鏈路直接相互連接,每條鏈路均為100GB/s的全雙工帶寬。

值得注意的是,由于每個GPU只有2條鏈路,因此AMD的拓撲選項僅限于環(huán)上的變化,4路配置的GPU不能全部直接相互通信。另外,AMD仍堅持使用PCI-E顯卡的形式,沒有像NVIDIA一樣的定制夾層式卡,所以這些卡需要通過頂部的橋接器連接。

得益于7nm工藝,雖然Vega20集成了132.2億晶體管,比目前Vega10的125億個晶體管增加了6.4%,但面積僅為331 mm2,反而要比Vega10的484 mm2要小很多。MI60和MI50的TDP均為300瓦,在同等功耗下的性能提升超過25%,同等頻率下功耗降低50%,不過AMD表示新計算卡的真正威力在于它們的新功能,而不是與現(xiàn)有MI25計算卡競逐傳統(tǒng)FP16/FP32算力。

“傳統(tǒng)的GPU架構(gòu)限制了人們處理和分析現(xiàn)代云數(shù)據(jù)中心不斷變化的巨大數(shù)據(jù)集的需求。”AMD Radeon技術(shù)集團工程高級副總裁David Wang說,“AMD全新Radeon Instinct加速卡結(jié)合了世界頂尖的性能和靈活性,配合業(yè)界領(lǐng)先的開放式軟件生態(tài)系統(tǒng)ROCm,將助力于解決當今和未來最困難的云計算挑戰(zhàn)?!?/p>

AMD一并公布了用于加速計算的全新ROCm 2.0開放軟件平臺,專為大規(guī)模集群而設(shè)計,允許用戶在開放環(huán)境中部署高性能、高能效的異構(gòu)計算系統(tǒng)。除了支持新的Radeon Instinct 加速器和AMD Infinity Fabric Link GPU互連技術(shù)外,還為新的DLOPS提供了更新的數(shù)學庫;支持CentOS、RHEL和Ubuntu等64位Linux操作系統(tǒng);支持TensorFlow 1.11和PyTorch(Caffe2)等最流行的深度學習框架的最新版本。

谷歌TensorFlow的工程總監(jiān)Rajat Monga說:“谷歌相信開源對每個人都有好處, 我們已經(jīng)看到它對開源機器學習技術(shù)有多大幫助,很高興看到AMD接受它。通過ROCm開放軟件平臺,TensorFlow用戶將受益于GPU加速和更強大的開源機器學習生態(tài)系統(tǒng)?!?/p>

回想此前的Vega10,在與上代Fiji架構(gòu)同為4096流處理器的情況下,顯存從4096bit反砍一刀降至2048bit,晶體管數(shù)量從89億暴增至125億,但其對應(yīng)的游戲顯卡Vega 64居然打不過僅有72億晶體管的GP104核心(GTX1080),同頻效能相比Fiji核心的Fury X甚至毫無提升,使得許多人戲稱AMD“在Vega10里塞了36億電爐絲”。

認為,AMD此次公布的Vega20雖然依然保持4096流處理器的規(guī)模,但補完了半速雙精度、INT8、INT4和ECC等HPC加速卡所需的關(guān)鍵元素,讓Vega20方才算是Vega架構(gòu)初次顯露出其真正形態(tài)。

不過,AMD依然需要清晰的認識到,與在CPU領(lǐng)域同Intel的競爭一樣,NVIDIA的領(lǐng)先使其有能力從架構(gòu)以及指令集等方面占據(jù)優(yōu)勢。近兩年來AMD在性能、功耗、面積三方面上一直無法兼顧,長期處于舍去其一再田忌賽馬的狀況中,Vega20所取得的進步成績完全吃的是7nm制程的紅利。

從目前展示的數(shù)據(jù)來看,Vega20的性能相比Vega10大約提升了20%,很可能依然不及NVIDIA上代16nm、120億晶體管的GP102核心(1080Ti),300瓦的TDP也不算低,唯一有明顯優(yōu)勢的也就只有新制程帶來的面積縮減了。

反觀NVIDIA,在2014年半導(dǎo)體制程受困于28nm節(jié)點時,AMD的GPU止步不前,NVIDIA則拿出了堪稱黑科技的全新Maxwell架構(gòu)。在晶體管數(shù)量從71億縮減至52億、流處理器從2880個減少至2048個、TDP從250瓦降低至165瓦的情況下,GM204核心的GTX980性能依然勝過了上代Kelper架構(gòu)GK110核心的GTX780Ti,再次強調(diào):二者同為28nm。

在NVIDIA如此恐怖的架構(gòu)設(shè)計面前,AMD這樣依賴制程紅利不但不是長久之計,更不如說是無異于飲鴆止渴。如果AMD再繼續(xù)固守老舊的GCN架構(gòu)修修補補,而不研發(fā)高能效的全新架構(gòu),一旦NVIDIA也使用了7nm工藝,完全可以如Intel一樣將AMD再次一招打回解放前。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉