在效率、功耗和算力成本上實現(xiàn)對于X86和Arm的全面超越|進迭時空于上海滴水湖論壇展示全球首款8核RISC-V AI CPU——SpacemiT Key Stone K1
作為一種開源的指令集架構,RISC-V憑借其靈活性、可擴展性以及低功耗特性,正在逐漸成為AI領域的重要競爭者。其獨特的模塊化設計允許開發(fā)者根據(jù)特定需求進行指令集的擴展,這使得RISC-V在AI計算中能夠實現(xiàn)更高效的處理能力,并且能夠更好地適應不同的AI應用場景。
目前,RISC-V在高性能AI CPU開發(fā)方面已經(jīng)取得了顯著進展,多個基于RISC-V的處理器已經(jīng)問世,并在性能上與傳統(tǒng)的ARM和x86架構處理器展開了競爭。進迭時空一直以RISC-V開源指令集為基礎,致力打造更高能效、更通用的AI處理器平臺,推動全球開源、開放的算力生態(tài)建設。
在第四屆滴水湖論壇上,進迭時空展示了其于今年4月份最新發(fā)布的全球首款8核RISC-V AI CPU——SpacemiT Key Stone K1,以及其中的AI智算核心——X60。
全球首款8核RISC-V AI CPU——SpacemiT Key Stone K1
據(jù)進迭時空品牌營銷及公關總監(jiān)段佳惠介紹,SpacemiT Key Stone? K1芯片采用自主研發(fā)的RISC-V智算核X60?,并支持RVA22 Profile。該芯片配備了8核同構X60?,頻率最高可達2.0GHz,CPU算力超過50 KDMIPS,AI算力則可達到2TOPS@INT8。其單核算力領先ARM Cortex-A55 30%以上,并且接入了全球主流CPU推理生態(tài),支持所有AI模型部署。該芯片最大支持16GB LPDDR4X內(nèi)存,典型功耗為3.5W。
下圖是CPU核融合AI算力的兩種架構模式的對比。左側是傳統(tǒng)的ARM架構中心控制模式,在這種模式下,ARM核與NPU核通過互連通信,負責協(xié)調GPU核以及其他外設(如DDR、PCIE、I/O等)的工作。右側展示了RISC-V架構的創(chuàng)新模式,在這種模式下,AI RISC-V CPU核直接提供AI算力,并與GPU核、DDR、PCIE、I/O等模塊相連。進迭時空沒有采用ARM的CPU+NPU的組合方式,而是通過拓展CPU指令集來實現(xiàn)的。該模式下,CPU核以一種統(tǒng)一的形式提供AI算力,且更好地融入了主流的CPU推理生態(tài)。這種創(chuàng)新模式相比傳統(tǒng)模式,能夠更有效地整合AI計算能力,提高整體系統(tǒng)的性能與效率。而SpacemiT Key Stone K1正是通過這種方式,實現(xiàn)了在應用效率、算力功耗和算力成本三個方向上、相比X86和Arm同類芯片的大幅領先。
下圖展示了K1芯片與ARM芯片和x86芯片在應用效率、算力功耗和算力成本三個維度上的對比。K1芯片在這三個維度上都表現(xiàn)出明顯的優(yōu)勢。在應用效率方面,K1芯片的效率最高,超過了6 Slam/MHz,相比之下,ARM芯片的效率略低,在5到6之間,而x86芯片的效率則在4到5之間。在算力功耗方面,K1芯片的功耗最低,典型功耗為3.5W,最低可降至2.8W/100KDMIPS,而ARM芯片的功耗稍高,介于5到6之間,x86芯片的功耗最高,超過了7 W/100KDMIPS。在算力成本上,K1芯片的成本最低,約為20到30/100KDMIPS??傮w來看,K1芯片在應用效率、功耗和成本上都優(yōu)于ARM芯片和x86芯片。
全球首款支持256bit RVV1.0的RISC-V處理器——X60 AI智算核
作為K1的智算核心,X60采用22nm工藝,最高主頻可達2.0GHz,算力能夠達到2TOPS,具備純粹的CPU算力。單核性能較ARM Cortex-A55高出約1.3倍。進迭時空基于IT核打造了全棧資源,能夠接入全球主流的CPU推理生態(tài),支持所有AI模型的本地化部署,這一點尤為難得。
進迭時空的X60是全球首款支持256bit的RISC-V處理器,具備雙發(fā)射的向量加載/存儲功能。在相同的微架構下,X60的整體性能顯著優(yōu)于ARM Cortex-A55。芯片的核心性能指標主要集中在三個方面:存儲性能、運算性能和浮點性能。就存儲性能而言,通過選取一些典型場景和應用,X60的整體表現(xiàn)優(yōu)于ARM Cortex-A55。在運算性能方面,進迭時空同樣表現(xiàn)出色,例如在圖片壓縮及圖像處理方面,表現(xiàn)優(yōu)異。在向量計算方向,進迭時空基于OpenCV和SLAM進行了優(yōu)化,性能大幅領先于ARM Cortex-A55芯片。在浮點性能方面,X60的性能高出A55約60%。在功耗對比上,X60相比同款八核ARM主流芯片功耗降低了28%。進迭時空在RISC-V標準指令下獲得了這些優(yōu)異指標,并未進行額外的修改,這得益于編譯器軟件的極致優(yōu)化。此外,進迭時空還拓展了16條AI指令,并已在4月份的發(fā)布會上開源。進迭時空期待未來有更多的RISC-V相關CPU企業(yè)能夠攜手,共同推進從CPU層面解決AI問題。
基于上述指令集優(yōu)化,X60可以快速接入全球主流的AI推理生態(tài)。在硬件層面,無論是NPU還是x86平臺,都能很好地解決AI部署問題。在本次滴水湖論壇上,進迭時空展示了推出的生態(tài)產(chǎn)品,能夠在本地以兩套算力快速部署許多基于大模型生成的應用,實現(xiàn)高效的本地化部署。幾乎所有的大型AI模型,如LLaMA2和圖像處理軟件,都可以實現(xiàn)本地化部署,并且不需要與NPU進行特定的調試或配置。
--
據(jù)了解,進迭時空的通用算力和向量計算性能較ARM同系列產(chǎn)品有顯著優(yōu)勢。目前,K1芯片主要應用于SBC、NAS、筆記本電腦、智能機器人、工業(yè)控制和邊緣計算等領域。而為了幫助開發(fā)者加快在K1系列上快速完成產(chǎn)品研發(fā),進迭時空也配套推出了完備的開發(fā)套件、包含軟硬件的開發(fā)平臺等資源。段佳惠表示,進迭時空推出的MUSE系列產(chǎn)品旨在面向所有開發(fā)者,共建完整生態(tài),讓開發(fā)者更便捷地使用AI算力。因此,進迭時空推出了從SOM到服務器的完整生態(tài)產(chǎn)品系列,這些產(chǎn)品已在進迭時空官方淘寶店批量發(fā)貨。