突破封鎖把握時(shí)代機(jī)遇,解讀中國(guó)AI芯片廠商的破局之道
自ChatGPT發(fā)布之后,AI開始出圈,我們都切實(shí)感受到了AI的能力。近年來(lái),AI一方面在模型能力上不斷加速演進(jìn),在處理更復(fù)雜的語(yǔ)言任務(wù)方面變得更加有效;另一方面在應(yīng)用領(lǐng)域逐步拓展,幫助專業(yè)人員在各自的垂直領(lǐng)域內(nèi)提高生產(chǎn)效率。不僅于此,最近更是出現(xiàn)了“主權(quán)AI”的概念,這進(jìn)一步上升到了國(guó)家安全的層次,各國(guó)也開始更加關(guān)注自己的AI基礎(chǔ)設(shè)施能力。
而對(duì)于我國(guó)而言,挑戰(zhàn)和機(jī)遇并存。我們有著豐富的應(yīng)用場(chǎng)景和用戶數(shù)據(jù),能夠?qū)崿F(xiàn)AI率先落地實(shí)踐;但同時(shí)由于地域政治摩擦、芯片禁令的限制,迫使我們更需要構(gòu)建自己的AI端到端生態(tài),擁有底層AI芯片的能力。
近日,Gartner針對(duì)“中國(guó)企業(yè)突破人工智能芯片限制”這一話題召開了記者分享活動(dòng)。 Gartner研究副總裁盛陵海(Roger Sheng)進(jìn)行了精彩的分享。
AI時(shí)代到來(lái),美國(guó)對(duì)中國(guó)的高性能AI芯片限制不斷加碼
為了在即將到來(lái)的AI時(shí)代保持技術(shù)主導(dǎo)權(quán),近年來(lái)美國(guó)對(duì)中國(guó)AI領(lǐng)域的限制措施逐步升級(jí),從最初的黑名單、禁令到現(xiàn)在的全面禁運(yùn)和技術(shù)封鎖,涉及到多個(gè)層面,尤其是高性能計(jì)算和芯片制造領(lǐng)域。
【芯片禁運(yùn)和限制】
美國(guó)政府早在幾年前就開始對(duì)中國(guó)的高科技企業(yè)實(shí)施限制,特別是針對(duì)芯片領(lǐng)域的出口禁令。2020年,美國(guó)出臺(tái)了針對(duì)人工智能芯片的禁令,直接影響了中國(guó)企業(yè)對(duì)高性能計(jì)算資源的獲取。為了應(yīng)對(duì)這些限制,英偉達(dá)推出了專門為中國(guó)市場(chǎng)設(shè)計(jì)的 A800 和 H800 GPU,這些產(chǎn)品在原有 A100 和 H100 基礎(chǔ)上進(jìn)行了性能削減以符合出口規(guī)定。例如,A800 和 H800 的通信帶寬被限制在 400 GB/s 以下,但它們?nèi)员A袅藦?qiáng)大的計(jì)算能力,能夠滿足大多數(shù) AI 和高性能計(jì)算需求。
然而,這些措施顯然不足以滿足美國(guó)的限制意圖。2022年,美國(guó)進(jìn)一步降低了對(duì)高性能計(jì)算芯片的限制閾值,將禁令適用的性能上限設(shè)定為每秒 300 萬(wàn)億次浮點(diǎn)運(yùn)算(300 TFLOPS),幾乎等同于 A100 的水平。去年下半年,禁令范圍再次收緊,不僅限制總體計(jì)算性能,還開始關(guān)注單位芯片面積的性能密度,超過每平方毫米 370 GFLOPS 的芯片也被列入受限范圍。這些嚴(yán)格的限制措施,顯著打擊了中國(guó)在超級(jí)計(jì)算和 AI 訓(xùn)練領(lǐng)域的進(jìn)步能力。
【制造工藝和供應(yīng)鏈的封鎖】
除了芯片本身的禁運(yùn),美國(guó)還在芯片制造工藝和供應(yīng)鏈上進(jìn)行嚴(yán)厲封鎖。高端芯片的制造依賴于先進(jìn)的工藝和設(shè)備,例如 TSMC 等公司提供的 14nm 及以下的技術(shù),這些技術(shù)對(duì)提升芯片的性能和降低能耗至關(guān)重要。美國(guó)的禁令禁止國(guó)際先進(jìn)制造工藝向中國(guó)出口,這使得中國(guó)在追趕全球芯片制造技術(shù)水平上面臨巨大的挑戰(zhàn)。
同時(shí),美國(guó)還禁止其公民參與中國(guó)的先進(jìn)制造業(yè)設(shè)備相關(guān)領(lǐng)域,這直接打擊了中國(guó)吸引頂尖人才和技術(shù)的能力。例如,最近的一個(gè)案例顯示,中微公司的一位高管為了專注于中國(guó)的半導(dǎo)體設(shè)備制造,選擇了出售一部分股票,以支付美國(guó)的離境稅。這表明,即使在巨大的經(jīng)濟(jì)和個(gè)人壓力下,中國(guó)的企業(yè)和個(gè)人仍在努力推進(jìn)本土半導(dǎo)體制造技術(shù)的發(fā)展。
“從整體上來(lái)看,美國(guó)不斷地是在‘補(bǔ)漏洞’,中國(guó)這邊也是不斷地在看有沒有機(jī)會(huì)利用現(xiàn)有的資源打一些‘游擊戰(zhàn)’,當(dāng)前是不斷地‘補(bǔ)漏洞’和‘打游擊戰(zhàn)’的狀況?!笔⒖偡窒淼?。
為了突破封鎖,中國(guó)企業(yè)和研究機(jī)構(gòu)正在積極尋找應(yīng)對(duì)之策,一方面努力發(fā)展自主創(chuàng)新技術(shù),另一方面積極尋求國(guó)際合作和替代方案。對(duì)于中國(guó)的芯片廠商而言,即使當(dāng)下提供的替代方案并不盡如人意,但唯有政府和企業(yè)堅(jiān)定地選擇和支持,才能有機(jī)會(huì)獲得市場(chǎng)實(shí)踐,通過不斷地技術(shù)迭代來(lái)實(shí)現(xiàn)追趕。
當(dāng)下國(guó)內(nèi)產(chǎn)業(yè)變局和未來(lái)端側(cè)推理發(fā)展,給中國(guó)AI芯片廠商帶來(lái)新機(jī)遇
國(guó)內(nèi)企業(yè)要在被封鎖的局面中構(gòu)建AI基礎(chǔ)設(shè)施,可能有三種不同的選擇。第一是選擇本土供應(yīng)商的替代方案。尤其是對(duì)于國(guó)內(nèi)大型云服務(wù)商、政府機(jī)構(gòu)和國(guó)有企業(yè)而言,長(zhǎng)期受制的局面無(wú)法改變,必須尋找國(guó)產(chǎn)替代方案來(lái)保證國(guó)內(nèi)的基礎(chǔ)關(guān)鍵民生、政務(wù)業(yè)務(wù)不會(huì)受到影響。而選擇本土供應(yīng)商的替代方案,存在著訓(xùn)練效率、性能受限和生態(tài)不完備的難題,要讓當(dāng)前業(yè)務(wù)盡量平滑地遷移到新的國(guó)產(chǎn)替代平臺(tái)上,也有很多的額外工作量。
第二種選擇是選擇NVIDIA的降級(jí)方案,這對(duì)于互聯(lián)網(wǎng)公司、跨國(guó)公司和中小型企業(yè)可能是一個(gè)合適的選擇。優(yōu)點(diǎn)在于平臺(tái)成熟,缺點(diǎn)在于性能受限、價(jià)格較高。
第三種選擇是通過非官方渠道來(lái)使用NVIDIA的芯片。例如直接購(gòu)買市場(chǎng)上的整機(jī)或直接進(jìn)行算力租賃等。這種方式只適用于中小型公司,缺點(diǎn)也很明顯,就是沒有官方保障和技術(shù)支持。
從長(zhǎng)期來(lái)看,掌握AI底層芯片能力,構(gòu)建本土GenAI生態(tài)系統(tǒng),是我們不得不走的道路。長(zhǎng)期的局勢(shì)倒逼著我們的應(yīng)用者必須要選擇國(guó)產(chǎn)的替代方案,來(lái)構(gòu)建本地化的場(chǎng)景和應(yīng)用;而對(duì)于本土芯片供應(yīng)商而言,就一定要抓住這一機(jī)遇,從芯片底層做好主流大模型的適配,為開發(fā)者提供高效的開發(fā)體驗(yàn)。
“不管如何的原因、怎么樣的原因,現(xiàn)在已經(jīng)走到這一步上、大勢(shì)所趨吧?!笔⒖偪偨Y(jié)道。
在這種大變局的背景下,還有一個(gè)來(lái)自應(yīng)用推動(dòng)的重大機(jī)遇,中國(guó)芯片廠商必須要抓住。那就是根據(jù)Gartner推測(cè),從2025年開始,云端的推理芯片需求將超越訓(xùn)練芯片需求;而從2026年開始,隨著端側(cè)的AI能力也持續(xù)推動(dòng)GenAI應(yīng)用增長(zhǎng),所以端側(cè)的推理芯片需求也會(huì)越來(lái)越大。
從2024年OpenAI的幾次服務(wù)崩潰我們可以感知到,人們對(duì)于生成式AI的使用量和頻率越來(lái)越高,而隨著越來(lái)越多的人會(huì)去用這個(gè)生成式AI,必然在云端上的推理訴求、對(duì)算力的需求會(huì)不斷地、極速級(jí)地增加。而為了提高能效,降低云端的負(fù)載,有一部分的推理算力會(huì)遷移到端側(cè)來(lái)運(yùn)行,那么端側(cè)AI能力將會(huì)被持續(xù)推高。
“就是設(shè)備端可以支持十億到一百億規(guī)模的模型,然后邊緣端它支持一百億到一千億的這個(gè)參數(shù)規(guī)模的大模型,它都可以實(shí)際來(lái)支持一定的企業(yè)或者個(gè)人的應(yīng)用。所以這個(gè)從技術(shù)上,它其實(shí)也是可行的。”盛總總結(jié)道,“邊緣側(cè)和端側(cè)的生成式人工智能應(yīng)用會(huì)從智能手機(jī)、電腦,不斷地?cái)U(kuò)散、到消費(fèi)物聯(lián)網(wǎng)、智能家居,然后進(jìn)一步到汽車上?!?
當(dāng)前市場(chǎng)上主要的芯片制造商如高通、聯(lián)發(fā)科和英特爾等都在積極開發(fā)端側(cè)AI芯片,而我國(guó)的AI芯片廠商要如何抓住設(shè)備端和邊緣側(cè)的GenAI機(jī)遇?盛總強(qiáng)調(diào)了硬件標(biāo)準(zhǔn)化的重要性,為了更好地利用生成式AI的潛力,中國(guó)的芯片制造商應(yīng)該考慮合作建立一個(gè)統(tǒng)一的標(biāo)準(zhǔn),從而促進(jìn)AI芯片的兼容性和軟件生態(tài)的發(fā)展。這樣的標(biāo)準(zhǔn)化不僅有助于技術(shù)的推進(jìn),還能簡(jiǎn)化后續(xù)的軟件開發(fā)和生態(tài)系統(tǒng)建設(shè)。
“其實(shí)對(duì)照過去的歷史來(lái)看,我們現(xiàn)在的情況其實(shí)并不是非常糟?!笔⒖偺寡缘?,“中國(guó)的大模型,其實(shí)現(xiàn)在也不會(huì)差到哪里去。我們還是要根據(jù)過去的這樣一個(gè)歷史借鑒,從‘一無(wú)所有’再到‘自主研發(fā)’,一定要有這個(gè)堅(jiān)定的信心,我們才能把AI芯片這個(gè)事情、AI產(chǎn)業(yè)能夠搞起來(lái)?!?