DeepSeek V3和R1模型完成海光DCU適配并正式上線

時間：2025-02-05 17:18:37

關(guān)鍵字： AI 深度計算單元 GPGPU架構(gòu)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]近日，海光信息技術(shù)團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的適配，并正式上線!

近日，海光信息技術(shù)團隊成功完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的適配，并正式上線!

用戶現(xiàn)可通過“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關(guān)模型，或直接登錄[www.sourcefind.cn]搜索“DeepSeek”，即可基于DCU平臺快速部署和使用相關(guān)模型。

DeepSeek V3和R1模型采用了Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌預測、FP8混合精度訓練等創(chuàng)新技術(shù)，顯著提升了模型的訓練效率和推理性能。

DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡，致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計算解決方案。憑借卓越的算力性能和完備的軟件生態(tài)，DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個領(lǐng)域?qū)崿F(xiàn)規(guī)?；瘧?yīng)用。

海光DCU技術(shù)團隊表示，將持續(xù)推動大模型迭代適配與優(yōu)化更新，攜手更多優(yōu)秀大模型企業(yè)為行業(yè)客戶提供更高效、更經(jīng)濟、更安全的AI解決方案。同時，團隊也將積極探索更多應(yīng)用場景，推動AI技術(shù)在更多行業(yè)的落地與普及。