12月15日至19日,NVIDA GTC中國以線上形式舉辦。寧暢信息產(chǎn)業(yè)(北京)有限公司(以下簡稱“寧暢”)受邀,以黃金贊助商身份首次攜X640 G30等多款AI服務器產(chǎn)品亮相GTC。
圖說:GTC中國線上大會寧暢展區(qū)
與會期間,寧暢方面表示伴隨人工智能、云計算的高速發(fā)展,異構(gòu)計算模式的AI服務器已成為IT行業(yè)重要算力支撐,為使GPU等核心部件性能得到充分發(fā)揮,寧暢憑借多年行業(yè)積累,通過定制模式滿足用戶對極致性能、穩(wěn)定性等諸多需求。
多維保障GPU潛能全發(fā)揮
回顧2020年GPU領域,最重要莫過7nm 制程的NVIDIA A100 Tensor Core GPU發(fā)布,其強大的第三代Tensor Core、第三代NVLink技術(shù),讓大數(shù)據(jù)模型“推理”與“訓練”效率顯著提升。但要完全釋放這顆業(yè)內(nèi)頂級GPU潛力,則考驗服務器廠商技術(shù)與設計硬實力。
寧暢工程師介紹,充分釋放GPU性能第一步需要保證AI服務器有豐富擴展性。以寧暢AI服務器X640系列為例,在滿配8個NVIDIA A100 /V100 Tensor Core GPU或16個NVIDIA T4 Tensor Core GPU后,X640仍有豐富PCI-E接口用于網(wǎng)絡、存儲和其他IO擴展。
豐富擴展設計,保障了定制化方案的靈活。此外,X640可通過硬件鏈路重新布局以實現(xiàn)靈活GPU 拓撲結(jié)構(gòu),并針對不同應用場景和模型進行GPU互聯(lián)優(yōu)化。這將極大便利用戶“訓練”大數(shù)據(jù)模型。
AI服務器散熱也是用戶關(guān)注重點。為保障全年24小時運行的AI服務器穩(wěn)定,寧暢散熱團隊先后開發(fā)出“一體閉式循環(huán)液冷散熱器”以及“分體式開環(huán)冷板液冷散熱器”方案,讓用戶不懼長時間GPU滿功率運行。
圖說:寧暢閉式/開式液冷散熱方案設計圖示
通過定制化,寧暢液冷散熱方案可滿足GPU產(chǎn)品400-800W范圍的散熱需求,并可根據(jù)客戶機房設備條件,選擇不同模塊化配套制冷機柜進行部署,從而解決客戶由于液冷適配而進行外圍改造的困擾。能效比方面,定制液冷方案,節(jié)省風扇能耗超60%,噪音降幅達50%以上,而成本也可控制在15-20%的提升。
除架構(gòu)、硬件、散熱等定制優(yōu)化外,在運維、軟件層面,寧暢可提供BIOS、BMC等諸多監(jiān)管、運維接口定制。用戶只需接上電源、網(wǎng)線,便可將批量的寧暢AI服務器納入到現(xiàn)有的智能管理平臺,第一時間讓GPU發(fā)揮效能。
滿足企業(yè)未來算力需求
除保障已上市GPU產(chǎn)品的性能全面發(fā)揮外,寧暢作為NVIDIA重要合作伙伴,可第一時間了解NVIDA前沿GPU技術(shù)與產(chǎn)品,依托多年來行業(yè)經(jīng)驗與技術(shù)積累,寧暢可預研采用新GPU架構(gòu)并符合用戶標準的定制服務器產(chǎn)品。
寧暢介紹,考慮成熟服務器產(chǎn)品的研發(fā)周期,通過定制預研模式用戶不僅可在新品GPU產(chǎn)發(fā)售第一時間,批量獲得基于此定制的AI服務器,還可提前與寧暢一起規(guī)劃AI服務器技術(shù)路線,滿足企業(yè)未來對特定AI場景的算力需求。
如今通過提供定制化服務,寧暢AI服務器已廣泛應用于知名互聯(lián)網(wǎng)、云計算公司,支撐語義識別、圖像分析、機器翻譯、訓練推理等AI場景。在2020年10月,AI基準性能評測平臺MLPerf官網(wǎng)顯示,搭載NVIDIA T4 /A100 GPU的寧暢X640 G30 AI服務器,在ResNet、BERT、DLRM等基準測試中更是取得30項性能第一。