燧原科技:以中國速度為人工智能應(yīng)用提供強(qiáng)勁算力
在2021世界人工智能大會(huì)同期,燧原科技舉辦新品發(fā)布會(huì),推出其第二代人工智能訓(xùn)練產(chǎn)品組合,即“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓(xùn)練加速卡和“云燧T21”訓(xùn)練OAM模組,更新了軟件平臺“馭算TopsRider”,還推出了全新服務(wù)器產(chǎn)品云燧智算集群CloudBlazer Matrix 2.0。
隨著內(nèi)容視頻化與萬物互聯(lián)進(jìn)一步發(fā)展,全球產(chǎn)生的數(shù)字化數(shù)據(jù)量增長勢頭兇猛,而且越來越多種類終端產(chǎn)品接入,數(shù)據(jù)形態(tài)日趨多元化,非結(jié)構(gòu)化難處理的數(shù)據(jù)占比增加,在數(shù)據(jù)處理中,人工智能算法作用越來越大,互聯(lián)網(wǎng)廠商對人工智能加速芯片的需求也越來越多,人工智能對算力的要求越來越高。在發(fā)布會(huì)上,清華大學(xué)教授尹首一就表示,人工智能算力需求每3.4月翻一番,遠(yuǎn)超摩爾定律。
要滿足人工智能應(yīng)用對算力需求,就離不開芯片。根據(jù)賽迪顧問的推算,2019至2021年間我國人工智能芯片平均年增速可超過50%,市場規(guī)模在2021年約為300億元左右,其中云端訓(xùn)練芯片市場規(guī)模約為139億元,云端推理芯片市場規(guī)模約為82億元,而終端推理芯片約為84億元,各細(xì)分市場均需求旺盛,而在云端訓(xùn)練芯片市場上,當(dāng)前仍由英特爾、英偉達(dá)和賽靈思等外資廠商占絕對主導(dǎo)地位,國產(chǎn)替代空間廣闊。
尹首一認(rèn)為,想做好人工智能芯片,要解決三個(gè)問題。首先是芯片本身的延展性,因?yàn)樗惴ㄔ诓粩嘌葸M(jìn),人工智能系統(tǒng)在不斷變化,所以人工智能芯片要有一定可編程性;其次是算法包容性,神經(jīng)網(wǎng)絡(luò)只是人工智能應(yīng)用的一個(gè)分支,還有眾多傳統(tǒng)算法在人工智能應(yīng)用中發(fā)揮著重要作用,所以人工智能芯片要具備覆蓋不同類型計(jì)算任務(wù)的能力;第三是能效比,從數(shù)據(jù)中心、云計(jì)算到邊緣物聯(lián)網(wǎng)設(shè)備,能效問題始終是芯片面臨的最大挑戰(zhàn)。
針對這些挑戰(zhàn),燧原科技此次宣布的“燧原產(chǎn)品定理”在一定程度上給出了解決路徑:在“平均業(yè)務(wù)”中,燧原每一代產(chǎn)品必須比前一代能效比提升三倍,性價(jià)比提升兩倍,并且軟件向后兼容可靠。燧原科技COO張亞林公布了云端訓(xùn)練產(chǎn)品路線圖,計(jì)劃2023年推出的第三代加速卡和計(jì)算集群產(chǎn)品,其能效比將是初代產(chǎn)品的14倍。
具體來看,燧原科技本次發(fā)布的邃思2.0與上代產(chǎn)品同樣采用格芯12納米工藝,利用立體封裝技術(shù)整合9顆裸芯片,單精度32位浮點(diǎn)數(shù)算力達(dá)40 TFLOPS,比邃思1.0單精度算力提升一倍。邃思2.0對張量計(jì)算進(jìn)行了大幅優(yōu)化,單精度張量TF32峰值算力達(dá)到160 TFLOPS。此外,邃思2.0也支持半精度16位浮點(diǎn)運(yùn)算(峰值算力160TFLOPS)以及8位整數(shù)精度(峰值算力320TOPS)等多種數(shù)據(jù)格式運(yùn)算。性能已經(jīng)優(yōu)于國際領(lǐng)先廠商的次旗艦產(chǎn)品,與旗艦產(chǎn)品相比也是互有勝負(fù)。
左:燧原科技CEO趙立東
右:燧原科技COO張亞林
對于云端訓(xùn)練等應(yīng)用,芯片做出來只是第一步,如何用起來才更重要,為幫助客戶用得好,燧原科技為用戶提供了計(jì)算加速卡、服務(wù)器和完整的軟件開發(fā)環(huán)境與支持包等產(chǎn)品。
云燧T20和云燧T21是基于邃思2.0打造的兩款A(yù)I訓(xùn)練加速板卡,邃思2.0的參數(shù)即由云燧T21板卡測試得出。在本次推出的服務(wù)器產(chǎn)品云燧智算集群CloudBlazer Matrix 2.0中,最高支持8192張?jiān)旗萦?xùn)練卡級聯(lián),從而實(shí)現(xiàn)最高1.3E(130000T)單精度浮點(diǎn)運(yùn)算的算力。
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計(jì)算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計(jì),充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運(yùn)行提供解決方案。開放升級的編程模型和可擴(kuò)展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
在發(fā)布會(huì)上,燧原科技CEO趙立東宣布建設(shè)異構(gòu)計(jì)算生態(tài)的“燎原”計(jì)劃,目標(biāo)是以人功能為起點(diǎn)構(gòu)建通用異構(gòu)計(jì)算生態(tài),構(gòu)建標(biāo)準(zhǔn)化技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。
在當(dāng)日的產(chǎn)品發(fā)布會(huì)上,多位專家學(xué)者和投資人都提到了生態(tài)建設(shè)的重要性。以個(gè)人電腦市場為例,我國前后幾十年的投入,信創(chuàng)市場仍然不能說達(dá)到了自主可控好用的預(yù)期目標(biāo),只有芯片沒有建設(shè)好應(yīng)用生態(tài)就是一個(gè)教訓(xùn)——當(dāng)然也有芯片性能難以滿足市場化推廣要求的原因。
投資方代表武岳峰資本創(chuàng)始合伙人武平就表示,把生態(tài)搭建好,芯片才能用得好。中國有全世界領(lǐng)先的互聯(lián)網(wǎng)生態(tài),但在芯片產(chǎn)業(yè)上還比較幼稚,最近不少國內(nèi)廠商宣布進(jìn)入高難度大芯片領(lǐng)域,但像燧原科技這樣能說到做到的企業(yè)還不多。如果全產(chǎn)業(yè)上下游通力合作,給予中國芯片更多試錯(cuò)空間,將來數(shù)據(jù)中心終將用上以燧原科技為代表的中國芯主芯片。