為AI而生的指令集架構(gòu)RISC-V,正在帶來半導體產(chǎn)業(yè)生產(chǎn)關(guān)系變革和全應用的可拓展計算加速
在半導體的發(fā)展歷史上,每次大繁榮的契機往往都來自生產(chǎn)關(guān)系的重大變革。1987年Morris Chang創(chuàng)立了臺積電,這不僅開創(chuàng)了全球首家純代工半導體公司,還催生了一個全新的產(chǎn)業(yè)模式,使得許多沒有生產(chǎn)能力的創(chuàng)新型半導體公司得以誕生和發(fā)展。設計和制造這得以分離和互補,并實現(xiàn)了風險互擔,這成就了半導體產(chǎn)業(yè)的繁榮。1990年,Acorn RISC Machine成立,隨后推動IP授權(quán)模式在移動和嵌入式計算領(lǐng)域取得了巨大成功,驅(qū)動幾千億終端設備實現(xiàn)了加速計算?;乜床徽撌桥_積電還是Arm,他們推動業(yè)界發(fā)展的重點首先不在于是新的技術(shù),而是將生產(chǎn)關(guān)系推向了一個更高的緯度。而現(xiàn)在,我們看到RISC-V將會開啟一個新的半導體生產(chǎn)關(guān)系的重大變革。
在由達摩院舉辦的2024玄鐵RISC-V生態(tài)大會上,達摩院院長張建鋒表示,“隨著新型算力需求激增,RISC-V發(fā)展迎來蝶變,即將進入應用爆發(fā)期。達摩院將持續(xù)加大RISC-V的研發(fā)投入和生態(tài)共建,推動行業(yè)上下游協(xié)同創(chuàng)新發(fā)展?!倍谶@應用爆發(fā)的前夕,我們看到了即將到來的一系列變化:包括RISC-V在AI上的高效拓展,和在端-云邊-云等應用場景中的無限可能。
RISC-V的未來方向:探索AI賦能和高性能計算的邊界
為什么RISC-V能夠走出來?達摩院玄鐵的永久摯友、知合計算CEO孟建熠總結(jié)了三大原因。首先在體系結(jié)構(gòu)發(fā)展的歷程中積累了大量的非優(yōu)化的“遺存”,而軟硬件協(xié)同設計能帶來10倍以上的性能收益?;叵氘斈辏布蛙浖姆珠_是為了更高效的系統(tǒng)開發(fā),而現(xiàn)在計算效率走到了一個瓶頸,軟硬件協(xié)同重新走在一起才能突破這一瓶頸。第二,計算架構(gòu)演進需要共性技術(shù)底座。在計算方面,RISC-V可拓展性能夠帶來Vector、Matrix的計算加速,兩者組合實現(xiàn)對于Tensor的加速。而在存儲方面,可以為各種計算芯片帶來一致相同的存儲架構(gòu)。第三,整個業(yè)界對于軟件生態(tài)統(tǒng)一有著迫切的要求。生態(tài)的本質(zhì)應該是降低全行業(yè)的使用成本,當下不論是X86、Arm還是CUDA,生態(tài)主導者在基礎軟件上投入都是巨大的;而對自研架構(gòu)而言,生態(tài)主導者對于基礎軟件投入無法做到那么大,所以客戶的應用開發(fā)投入的成本就極高。而RISC-V作為開源架構(gòu),任何人都可以參與到基礎軟件的開發(fā)中來,這就讓頂層應用開發(fā)者有著更少的投入成本。通過開源生態(tài)的“聚沙成塔”,RISC-V是當前唯一可以支撐起全鏈路的生態(tài)。
業(yè)界有一種聲音,說RISC-V是為AI而生的指令集架構(gòu)。快速演進的AI技術(shù)讓RISC-V社區(qū)看到了新的發(fā)展機會。當前無論是英特爾X86或者是其他的架構(gòu),都無法做到為了端側(cè)達模型能力而實現(xiàn)快速迭代,因為有很多兼容性的問題。而RISC-V有著很好的拓展性,能夠在較低的功耗下實現(xiàn)比較好的計算表現(xiàn),是其在AI方面的架構(gòu)優(yōu)勢。我們正處在計算架構(gòu)的黃金十年,基于RISC-V的創(chuàng)新架構(gòu)不斷涌現(xiàn)。
達摩院玄鐵RISC-V團隊資深技術(shù)專家李春強表示,達摩院玄鐵團隊在RISC-V方向上做了很多AI相關(guān)的工作。包括前期從C910的Vector 0.7到920的Vector 1.0擴展指令設計實現(xiàn),以及現(xiàn)在一起共同探索Matrix指令集的拓展。而除了在指令集拓展以及標準的制定之外,另一個達摩院在AI上的重要工作是生態(tài)推廣,讓下游的客戶的芯片產(chǎn)品在端側(cè)推理的場景實現(xiàn)更好的表現(xiàn)?!斑_摩院本身就有很多像算能、嘉楠科技等做端側(cè)推理芯片的客戶,而大模型端側(cè)推理也是最近大家剛剛開始做的事情,所以對于RISC-V而言這是一個非常好的機會?!崩畲簭娊忉尩?,“大模型的瓶頸包括計算和存儲,而未來我們將會看到越來越多的類似多核并行計算、多核通信和存儲帶寬提升的一些布局。”
孟建熠表示,RISC-V作為一個計算的架構(gòu),首先肯定要在計算上走出來,從通用計算的角度,達摩院要牽引整個行業(yè)看到RISC-V的潛力在哪里。而知合計算也同樣一直在探索RISC-V的高性能計算的邊界。“我們希望未來高性能產(chǎn)品不僅是一個產(chǎn)品,通過RISC-V架構(gòu)的創(chuàng)新,能夠讓我們需要高性能、高能效算力、AI算力都能夠普及到。”
知合計算是要將高性能通用計算、AI增強計算和統(tǒng)一的軟件架構(gòu)整合在一起,實現(xiàn)一個“AI增強的高性能可拓展處理器”?!皬闹系慕嵌葋碇v,只是其中的一個小的點,有更大的點在達摩院今天,是面向全生態(tài)的輻射做的。剛才講到很多在AI方面有幾招發(fā)出來了,還有很多在研發(fā)的路上,我們今天非??春迷谟嬎闵系膬?yōu)勢?!?
從10~100:生態(tài)加速裂變,應用遍地開花
如果將整個RISC-V的產(chǎn)業(yè)發(fā)展,看作一個從1~100的過程,那么毫無疑問1~10的這部分是最難的,而從10~100將會快的多。據(jù)孟建熠分享,從1~10的過程中,必須要有著堅定的信念和理想,堅信RISC-V這個事情能成。在這個前期的1~10的過程中,達摩院三四年來一直不停地去推動,做出了非常大的貢獻,到現(xiàn)在取得了一些實際的成果,讓RISC-V上成功運行了安卓系統(tǒng)。這讓谷歌開始真正的相信安卓與RISC-V結(jié)合的可能性,相信了RISC-V架構(gòu)處理器的可拓展的計算能力。有了這個“連接”之后,接下來就是從10~100的過程。在這個過程中,或許達摩院就不太需要更多去做那么多推進的工作,而谷歌會更積極主動地進行更多軟硬件生態(tài)融合推進的工作。
從10~100的過程中,生態(tài)開始加速裂變,將會有更多的伙伴參與進來,一同跟進。而在這一過程中,將會誕生出很多新的公司、新的創(chuàng)新和新的架構(gòu)。此次大會上我們見到了非常多豐富的應用場景、在各個細分賽道里的公司,開始選擇RISC-V的CPU來作為計算內(nèi)核。例如比科奇微電子,致力于為5G/4G小基站設備商提供Open RAN標準的基帶SoC和解決方案,就選擇了RISC-V。
在此次大會的專訪環(huán)節(jié)中,據(jù)比科奇微電子(杭州)有限公司芯片研發(fā)副總裁沈鉦介紹,比科奇提供5G小基站RU SoC和5G小基站PHY SoC兩種解決方案,而在這兩個SoC中均采用了玄鐵的RISC-V內(nèi)核。因為是用于物理層基帶處理,所以其中的運算包含了大量的天線數(shù)據(jù)的處理。對于此類應用而言,CPU用于的是高層次通量的協(xié)議解析,而這些大量的計算任務形式上非常一致,需要的更多是并行消息處理的能力。因此在做好合理調(diào)度的前提下,采用多個RISC-V小核的處理效率,要比單一的一個大核的效率更高。比科奇在SoC中放了兩個cluster,每個cluster中分別是16個玄鐵的RISC-V小核,用于進行大量消息的解析任務。
作為一個整體解決方案的提供商,比科奇不僅提供SoC芯片,也提供了包括了軟件。而要將整個方案的效能提升,比科奇希望的是將CPU的執(zhí)行效率發(fā)揮到最高?!拔覀?nèi)サ袅撕芏嗟闹虚g件,將上下應用和底部打通。對于客戶而言,可以把比科奇的芯片和協(xié)議棧芯片做成一個完整的板子,應用于包括智能工業(yè)互聯(lián)網(wǎng)、智能采礦等場景在內(nèi)的各種行業(yè)場景?!?沈鉦解釋到,“RISC-V給我們帶來了很大的好處,首先就是很高的能效比,在基帶處理峰值的情況下功耗小于10W,對于競爭對手有著很大的優(yōu)勢。第二在協(xié)議棧處理等方面,得益于RISC-V生態(tài)的發(fā)展,各種頂層業(yè)務平臺都有了很好的軟件生態(tài),包括支持DPDK等成熟的產(chǎn)品也已經(jīng)出來了,因此底層CPU是什么架構(gòu)其實對應用商以及下游客戶影響不會那么大。”正是基于這兩點優(yōu)勢,所以比科奇能夠放心地選擇RISC-V。
億芯科技也受邀參加此次玄鐵生態(tài)大會的專訪,介紹了億芯科技選擇玄鐵RISC-V內(nèi)核的原因。
北京憶芯科技有限公司合伙人朱旭濤表示,隨著SSD接口技術(shù)的不斷發(fā)展,SSD主控的性能也開始卷出新高度,業(yè)界也開始追求更小工藝節(jié)點和堆更多計算內(nèi)核等。但如果過度追求性能,在一個SSD主控中集成了更多的內(nèi)核進行一致性的關(guān)聯(lián)操作,那么功耗這一指標就會失控。對于SSD主控中的CPU core的選擇而言,億芯更關(guān)注的最終是實時性的提升,在使用效率上能夠跟業(yè)務有著實際的貼合度。
而玄鐵團隊為億芯提供了非常多的支持:首先在RISC-V的開發(fā)階段而言,雙方一起合作開發(fā),實現(xiàn)了非常好的軟件開發(fā)層面的體驗,包括編譯系統(tǒng)的友好性、指令執(zhí)行的效率和密度等。第二在CPU層面,從芯片的角度雙方在最終應用過程中指令編譯的組合、仿真或者其他任何可能性上,竭力去做好。
從左至右:達摩院蕭良善、知合計算孟建熠、達摩院李春強、億芯科技朱旭濤、比科奇沈鉦
CPU計算能力并未達到上限,達摩院將持續(xù)推動生態(tài)邁進
在此次玄鐵生態(tài)大會的主題演講中,硅谷芯片傳奇人物、現(xiàn)任Tenstorrent CEO的Jim Keller講到,“那些認為‘CPU性能不會再提高’的話,我從未相信過。因為我們還有那么多可做的事?!?
開源架構(gòu)允許所有人參與到的指令集的創(chuàng)新中來,為RISC-V提供更高的上限。而與此同時,生態(tài)的繁榮將會賦予RISC-V更旺盛的生命力。李春強表示,達摩院的核心任務還是持續(xù)推動從開源開放的指令集到產(chǎn)業(yè)的落地上?!昂罄m(xù)還會往產(chǎn)業(yè)化做更多的事情,最終要讓我們的合作伙伴怎么在RISC-V的生態(tài)圈真正賺到錢,這是最關(guān)鍵的。包括后期怎么在RISC-V做更多的原生,包括操作系統(tǒng)上做原生去推進。”李春強總結(jié)到。“生態(tài)的裂變、生態(tài)的力量將會推動RISC-V往前走。”