當(dāng)前位置:首頁 > 芯聞號(hào) > 產(chǎn)業(yè)動(dòng)態(tài)
[導(dǎo)讀]北京2022年4月7日 /美通社/ -- 2022年4月7日,全球權(quán)威AI基準(zhǔn)評(píng)測MLPerf?公布最新AI推理(Inference)V2.0榜單,浪潮AI服務(wù)器以最高性能獲得了數(shù)據(jù)中心(固定任務(wù))的全部16項(xiàng)冠軍。 MLPerf?由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(Dav...

北京2022年4月7日 /美通社/ -- 2022年4月7日,全球權(quán)威AI基準(zhǔn)評(píng)測MLPerf?公布最新AI推理(Inference)V2.0榜單,浪潮AI服務(wù)器以最高性能獲得了數(shù)據(jù)中心(固定任務(wù))的全部16項(xiàng)冠軍。

MLPerf?由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(David Patterson)聯(lián)合頂尖學(xué)術(shù)機(jī)構(gòu)發(fā)起成立,是國際最權(quán)威的AI性能基準(zhǔn)評(píng)測,每年組織AI推理和AI訓(xùn)練測試各兩次,以對(duì)迅速增長的AI計(jì)算需求與性能進(jìn)行及時(shí)的跟蹤測評(píng)。MLPerf?比賽通常分為固定任務(wù)(Closed)和開放優(yōu)化(Open)兩類任務(wù),開放優(yōu)化能力著重考察參測廠商的AI技術(shù)創(chuàng)新力,固定任務(wù)則因更公平地考察參測廠商的硬件系統(tǒng)和軟件優(yōu)化的能力,成為更具參考價(jià)值的AI性能基準(zhǔn)測試。

本次是2022年MLPerf?的首次AI推理性能評(píng)測,旨在考察在各類AI任務(wù)中,不同廠商計(jì)算系統(tǒng)的推理速度和能力。本次評(píng)測中,在競爭最激烈的數(shù)據(jù)中心(固定任務(wù))賽道,共有926項(xiàng)成績提交,數(shù)量較上次比試翻倍,競爭非常激烈。

浪潮AI服務(wù)器創(chuàng)推理性能新紀(jì)錄

本次MLPerf?AI推理性能評(píng)測涵蓋使用廣泛的六大AI場景,包括圖像分類、自然語言理解、語音識(shí)別、目標(biāo)物體檢測、醫(yī)學(xué)影像分割、智能推薦,每個(gè)場景采用最主流的AI模型作為測試任務(wù),分別為ResNet50、BERT、RNNT、SSD-ResNet34、3D-Unet、DLRM。MLPerf?測試要求模型推理精度達(dá)到99%以上,對(duì)于自然語言理解、醫(yī)學(xué)影像分割和智能推薦3個(gè)任務(wù)則設(shè)置99%與99.9%兩種精度要求,以考察當(dāng)提升AI推理精度要求時(shí)對(duì)計(jì)算性能的影響。

為更加貼近實(shí)際應(yīng)用情況,MLPerf?推理測試在數(shù)據(jù)中心賽道下設(shè)置了離線(Offline)與在線(Server)兩種模式。離線模式代表任務(wù)所需所有數(shù)據(jù)都在本地可用,典型場景如大批量醫(yī)療影像樣本存于本地等待統(tǒng)一識(shí)別。在線模式則反映了大部分的即時(shí)AI應(yīng)用,其數(shù)據(jù)和請(qǐng)求以突發(fā)和間歇的方式在線送達(dá),例如用戶在瀏覽購物網(wǎng)站時(shí)智能推薦的推理請(qǐng)求。

浪潮AI服務(wù)器此次表現(xiàn)出色,以最高性能包攬了此次MLPerf?數(shù)據(jù)中心(固定任務(wù))賽道的全部16項(xiàng)冠軍。

MLPerf最新發(fā)榜,浪潮AI服務(wù)器囊括數(shù)據(jù)中心推理全部冠軍


本次MLPerf?測試中,浪潮AI服務(wù)器在ResNet50模型任務(wù)中創(chuàng)造了每秒處理449,856張圖片的性能紀(jì)錄,相當(dāng)于僅用2.8秒即完成ImageNet數(shù)據(jù)集128萬張圖片的分類;在3D-UNet模型任務(wù)中,創(chuàng)造了每秒處理36.25張醫(yī)療影像的新紀(jì)錄,相當(dāng)于在6秒內(nèi)完成對(duì)KiTS19數(shù)據(jù)集207張3D醫(yī)療影像的分割;在SSD-ResNet34模型任務(wù)中,創(chuàng)造了每秒對(duì)11,081.9張圖片完成目標(biāo)物體識(shí)別及定位的新紀(jì)錄;在BERT模型任務(wù)中,創(chuàng)造了平均每秒完成38,776.7個(gè)問答的性能紀(jì)錄,在RNNT模型任務(wù)中,創(chuàng)造了每秒將155,811段語音轉(zhuǎn)為文字的性能紀(jì)錄,在DLRM模型任務(wù)中,則創(chuàng)造每秒實(shí)現(xiàn)2,645,980次點(diǎn)擊預(yù)測的最佳性能紀(jì)錄。

此外,本次MLPerf?評(píng)測還設(shè)有邊緣推理賽道,浪潮面向邊緣場景設(shè)計(jì)的AI服務(wù)器同樣表現(xiàn)出色,在邊緣固定任務(wù)賽道的全部17項(xiàng)任務(wù)中斬獲了11項(xiàng)冠軍。

隨著AI應(yīng)用在各個(gè)行業(yè)中的持續(xù)深化,更快的推理速度,將帶來更高的AI應(yīng)用效率與能力,加速產(chǎn)業(yè)智能化轉(zhuǎn)型。相比半年前的MLPerf?AI推理榜單V1.1,浪潮AI服務(wù)器將圖像分類、語音識(shí)別和自然語言理解任務(wù)的推理性能分別提升31.5%、28.5%及21.3%,意味著浪潮AI服務(wù)器在自動(dòng)駕駛、語音會(huì)議、智能問答和智慧醫(yī)療等等場景中,能夠更高效快速地完成各類智能任務(wù)。

全棧優(yōu)化能力助推AI性能持續(xù)提升

浪潮AI服務(wù)器在MLPerf?基準(zhǔn)評(píng)測中的出色表現(xiàn),得益于浪潮信息卓越的AI系統(tǒng)設(shè)計(jì)能力和全棧優(yōu)化能力。

本次參與測評(píng)的浪潮AI服務(wù)器NF5468M6J擁有出色的系統(tǒng)設(shè)計(jì),以分層可擴(kuò)展計(jì)算架構(gòu)在業(yè)界率先實(shí)現(xiàn)對(duì)12顆NVIDIA A100 Tensor Core GPU的支持,并以極佳的性能成績一舉攬獲12項(xiàng)冠軍。浪潮信息也是本次MLPerf?競賽中可以唯一提供服務(wù)器支持8顆500W NVIDIA A100 GPU的廠商,并實(shí)現(xiàn)了風(fēng)冷及液冷兩種散熱方式。在此次參賽的8顆GPU NVLink高端主流機(jī)型中,浪潮AI服務(wù)器在數(shù)據(jù)中心16個(gè)任務(wù)中斬獲14項(xiàng)最佳成績,展現(xiàn)出在高端機(jī)型中的領(lǐng)先優(yōu)勢。其中,NF5488A5是全球首批上市的A100服務(wù)器,在4U空間支持8顆第三代NVlink互聯(lián)的NVIDIA A100 GPU和2顆AMD Milan CPU。NF5688M6是面向大規(guī)模數(shù)據(jù)中心優(yōu)化設(shè)計(jì)的具備極致擴(kuò)展能力的AI服務(wù)器,支持8顆A100 GPU和2顆Intel Icelake CPU,支持多達(dá)13張PCIe Gen4的IO擴(kuò)展卡。

在硬件層面,浪潮AI服務(wù)器通過對(duì)CPU、GPU硬件性能的精細(xì)校準(zhǔn)和全面優(yōu)化,使CPU性能、GPU性能、CPU與GPU之間的數(shù)據(jù)通路均處于對(duì)AI推理最優(yōu)狀態(tài);在軟件層面,結(jié)合GPU硬件拓?fù)鋵?duì)多GPU的輪詢調(diào)度優(yōu)化使單卡至多卡性能達(dá)到了近似線性擴(kuò)展;在深度學(xué)習(xí)算法層面,結(jié)合GPU Tensor Core 單元的計(jì)算特征,通過自研通道壓縮算法成功實(shí)現(xiàn)了模型的極致性能優(yōu)化。

浪潮信息是全球領(lǐng)先的AI計(jì)算廠商,AI服務(wù)器市場份額全球第一,連續(xù)五年以超50%的市場份額穩(wěn)居中國AI服務(wù)器市場第一。浪潮信息致力于AI計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)的研發(fā)創(chuàng)新,并通過元腦生態(tài)攜手領(lǐng)先伙伴加速數(shù)實(shí)相融。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉