DeepSeek V3和R1模型完成海光DCU適配并正式上線
近日,海光信息技術(shù)團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的適配,并正式上線!
用戶現(xiàn)可通過“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關(guān)模型,或直接登錄[www.sourcefind.cn]搜索“DeepSeek”,即可基于DCU平臺快速部署和使用相關(guān)模型。
DeepSeek V3和R1模型采用了Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌預測、FP8混合精度訓練等創(chuàng)新技術(shù),顯著提升了模型的訓練效率和推理性能。
DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計算解決方案。憑借卓越的算力性能和完備的軟件生態(tài),DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。
海光DCU技術(shù)團隊表示,將持續(xù)推動大模型迭代適配與優(yōu)化更新,攜手更多優(yōu)秀大模型企業(yè)為行業(yè)客戶提供更高效、更經(jīng)濟、更安全的AI解決方案。同時,團隊也將積極探索更多應(yīng)用場景,推動AI技術(shù)在更多行業(yè)的落地與普及。