9月6日消息,近日,中國移動智算中心(哈爾濱)正式宣布上線投產,成為全球運營商最大單集群智算中心。
該智算中心單集群內配備了超過18000張AI加速卡,智能算力規(guī)模高達6.9EFLOPS。憑借其單集群算力規(guī)模之最、國產化網絡設備組網規(guī)模之最,傲視群雄。
此項集群規(guī)模不僅采用了高性能無損網絡、全調度以太網GSE1.0、融合分級存儲等一系列創(chuàng)新技術,還搭載了移動云智算平臺和智管平臺,支持萬卡并行訓練、斷點續(xù)訓、AI任務全生命周期管理及分鐘級故障定界定位等功能。這些功能使得集群算效與能效均達到了行業(yè)領先水平。
該集群也是繼中國移動智算中心(呼和浩特)(全球運營商最大單體智算中心)上線運行后,中國移動打造的業(yè)內首個端到端使用全國產設備的超大規(guī)模智算集群,標志著我國國產芯片商用部署達到了新的高度。
該智算中心通過把所有AI加速卡整合為一個集群,并運用先進的智算網絡技術,將上萬塊GPU芯片高效拼接,數(shù)據訓練完成時間縮短了20%,滿足萬億參數(shù)大模型的訓練需求。