這些AI芯片創(chuàng)企想挑戰(zhàn)英偉達(dá),它們能成功嗎?
分析師們喋喋不休,將追逐AI夢(mèng)想的企業(yè)分成兩類(lèi),也就是“GPU-rich”和“GPU-poor”,前者擁有大量GPU,后者沒(méi)有多少。為了證明自己的實(shí)力,科技企業(yè)的老板們紛紛炫耀,說(shuō)自己囤了多少GPU。
受到AI浪潮的刺激,英偉達(dá)市值沖至2萬(wàn)億美元。5月22日英偉達(dá)公布一季度財(cái)報(bào),財(cái)報(bào)顯示期內(nèi)英偉達(dá)營(yíng)收260.4億美元,同比增長(zhǎng)262%;凈利148.8億美元,同比增長(zhǎng)628%。
那么,能不能拋開(kāi)GPU設(shè)計(jì)AI專(zhuān)用芯片?當(dāng)然可以,這也是許多大小企業(yè)正在做的,它們想挑戰(zhàn)英偉達(dá)。
英偉達(dá)主導(dǎo)的GPU也有缺陷
從本質(zhì)上講,CPU是一件事一件事接著處理,GPU不一樣,它擁有幾千個(gè)處理引擎(或者叫Core),可以在同一時(shí)間處理幾千個(gè)簡(jiǎn)單的任務(wù)。當(dāng)GPU運(yùn)行AI大模型時(shí),相當(dāng)于同時(shí)運(yùn)行幾千個(gè)相同任務(wù)的副本。搞清楚如何重寫(xiě)在GPU上運(yùn)行的AI代碼是核心問(wèn)題,正是因?yàn)榇蠹覍?duì)這一問(wèn)題的研究導(dǎo)致AI突飛猛進(jìn)。
但GPU也有缺陷,當(dāng)數(shù)據(jù)來(lái)回移動(dòng)時(shí)GPU的處理速度不夠快?,F(xiàn)代AI大模型運(yùn)行時(shí)往往需要大量GPU和大量存儲(chǔ)芯片,它們相互連接在一起。數(shù)據(jù)在GPU和存儲(chǔ)芯片間移動(dòng)越快,性能越好。當(dāng)研究人員訓(xùn)練大型AI模型時(shí),一些GPU內(nèi)核會(huì)閑置,幾乎一半的時(shí)間都在等待數(shù)據(jù)。
加州創(chuàng)業(yè)公司Cerebras創(chuàng)始人Andrew Feldman解釋說(shuō),等待數(shù)據(jù)如同購(gòu)物節(jié)來(lái)臨時(shí)購(gòu)物者在生鮮店門(mén)前排隊(duì)。他說(shuō):“每個(gè)人都在排隊(duì),停車(chē)場(chǎng)堵了,通道堵了,收銀臺(tái)也堵了,GPU與此類(lèi)似?!?br />
怎么辦?Cerebras將90萬(wàn)個(gè)內(nèi)核和海量?jī)?nèi)存組合在一起,變成一個(gè)龐大的整體。如此一來(lái),多塊芯片的連接復(fù)雜性降低,中間的數(shù)據(jù)移動(dòng)速度加快。內(nèi)核在芯片上連接在一起,運(yùn)行速度比獨(dú)立GPU組合快幾百倍,因?yàn)檫B接更緊密,能耗比英偉達(dá)產(chǎn)品降低一半。
Groq來(lái)自加州山景城,它選擇的路徑有些不同。它也在開(kāi)發(fā)AI芯片,名叫語(yǔ)言處理單元(LPU),可以訓(xùn)練、運(yùn)行大語(yǔ)言模型(LLM)。芯片內(nèi)有存儲(chǔ)元件,同時(shí)芯片又有路由功能,在相互連接的LPU間傳輸數(shù)據(jù)。搭配智能路由軟件,它可以消除延遲,降低數(shù)據(jù)等待時(shí)間。獨(dú)特的設(shè)計(jì)大大提升了效率和速度,Groq稱(chēng)它們的LPU運(yùn)行LLM時(shí)速度比現(xiàn)有系統(tǒng)快10倍。
來(lái)自加州的MatX公司反向操作,它認(rèn)為,GPU內(nèi)包括各種功能和電路,這些組件適合圖形處理,但在LLM領(lǐng)域沒(méi)有用。MatX將不必要組件剔除,當(dāng)芯片執(zhí)行一些任務(wù)時(shí)性能反而會(huì)更好。
還有很多企業(yè)也在默默努力,比如以色列Hailo,它于今年4月融資1.2億美元;多倫多Taalas,美國(guó)Tenstorrent,它們用開(kāi)源RISC V架構(gòu)開(kāi)發(fā)AI芯片;英國(guó)企業(yè)Graphcore,它早早就進(jìn)了場(chǎng),但失敗了,現(xiàn)在考慮賣(mài)身給軟銀。
科技巨頭也在開(kāi)發(fā)自己的AI芯片,比如谷歌、亞馬遜、Meta和微軟,它們也開(kāi)發(fā)了面向云端AI的定制芯片。AMD、英特爾直接與英偉達(dá)競(jìng)爭(zhēng),已經(jīng)擁有GPU AI芯片。
挑戰(zhàn)英偉達(dá)壟斷地位不容易
新手們挑戰(zhàn)霸主勇氣可嘉,但它們可能太激進(jìn),走得太遠(yuǎn)了。
斯坦福大學(xué)計(jì)算機(jī)科學(xué)家Christos Kozyrakis表示,設(shè)計(jì)一款芯片需要2-3年,考慮到AI大模型正在快速進(jìn)化,2-3年是很漫長(zhǎng)的時(shí)間。
創(chuàng)業(yè)公司如果想成功,最好是抓住機(jī)會(huì),提前為未來(lái)模型設(shè)計(jì)芯片,芯片的性能比英偉達(dá)的一些GPU更好,那樣就能找到突破口。但選擇這條路風(fēng)險(xiǎn)也很大,企業(yè)為未來(lái)模型設(shè)計(jì)專(zhuān)用芯片,最終可能發(fā)現(xiàn)下錯(cuò)的注。
MatX公司聯(lián)合創(chuàng)始人Reiner Pope認(rèn)為他們看到了未來(lái),最新的狀態(tài)空間模型漸漸流行,MatX完全可以適配。Cerebras創(chuàng)始人Andrew Feldman認(rèn)為,現(xiàn)代AI本質(zhì)上還是“稀疏線性代數(shù)(sparse linear algebra),他們開(kāi)發(fā)的芯片可以快速適應(yīng)。
挑戰(zhàn)英偉達(dá)還有一個(gè)障礙,那就是軟件層。CUDA實(shí)際上已經(jīng)成為行業(yè)標(biāo)準(zhǔn),雖然用起來(lái)繁瑣,但它的標(biāo)準(zhǔn)地位難以撼動(dòng)。
Christos Kozyrakis認(rèn)為,軟件為王,在這方面英偉達(dá)優(yōu)勢(shì)明顯,畢竟它已經(jīng)花了多年時(shí)間打磨軟件生態(tài)系統(tǒng)。AI芯片創(chuàng)業(yè)公司如果想成功,必須說(shuō)服程序員為新芯片優(yōu)化程序。企業(yè)要提供軟件工具,還要提供兼容的主流機(jī)器學(xué)習(xí)框架。問(wèn)題在于,優(yōu)化軟件,讓它適配新架構(gòu),這項(xiàng)工作既困難又復(fù)雜。
AI芯片的客戶(hù)比較簡(jiǎn)單,一類(lèi)是大模型開(kāi)發(fā)者,比如OpenAI、Anthropic、Mistral,還有就是科技巨頭,比如亞馬遜、微軟、Meta、谷歌。它們有興趣收購(gòu)優(yōu)秀的AI芯片創(chuàng)業(yè)公司,奪取技術(shù),增強(qiáng)自身競(jìng)爭(zhēng)力。芯片創(chuàng)業(yè)公司可以放棄與英偉達(dá)競(jìng)爭(zhēng),努力賣(mài)身給上述兩類(lèi)企業(yè)。
MatX的目標(biāo)很遠(yuǎn)大,它想將芯片賣(mài)給OpenAI、谷歌之類(lèi)的企業(yè),當(dāng)然賣(mài)身也可以考慮。MatX稱(chēng):“對(duì)于多種退出方式我們都是歡迎的,但我們還是認(rèn)為,作為一家獨(dú)立公司,業(yè)務(wù)是可以持續(xù)的。”Cerebras則說(shuō)它準(zhǔn)備上市。
總體來(lái)看,雖然有許多創(chuàng)業(yè)公司試圖挑戰(zhàn)英偉達(dá),但至今還沒(méi)有哪家能造成威脅,一切還有待時(shí)間驗(yàn)證。(小刀)