上周,百度在其開發(fā)者大會上宣布了其最新的 AI 芯片與自動駕駛進展,然而在光鮮華麗的發(fā)表會下面,百度是否真的做出了獨有創(chuàng)意?還是只為近來 AI 浪潮中再多增加一個泡沫?
而根據(jù)百度在發(fā)布會上公開的信息,昆侖芯片最高算力可達到260 TOPS,已經(jīng)是 NVIDIA 的最新算卡 V100的兩倍以上,但是這個算力指標靠不靠譜?對百度云計算的規(guī)劃是否真能發(fā)揮作用?其實 DT 君抱以存疑的態(tài)度。
首先,算力的計算有很多層次,就以 TOPS 這種每秒整數(shù)操作次數(shù),還可分為不同精度,以及稀疏計算模式的啟用與否,以寒武紀為例,其在 5 月發(fā)布的專業(yè)算卡架構(gòu)在性能指標方面就可分為多種模式,且該架構(gòu)不用 TOPS 作為性能指標,而是采用基于浮點計算的 TFLOPS,性能從倍精度、單精度到半精度,算力跨度從 16 TFLOPS 到 166 TFLOPS,昆侖僅提供單一數(shù)據(jù),且只有公開最大整數(shù)計算能力,其實背后隱含著該架構(gòu)可能在均衡性有所欠缺,只能少數(shù)狀況下?lián)碛休^高性能表現(xiàn)的可能。
另外,若以昆侖芯片的 TOPS 參數(shù)和 NVIDIA 的 V100 比較,表面數(shù)字上的確贏了不少,但是昆侖芯片并沒有公布芯片的規(guī)模,只有宣布其整合了數(shù)萬個小核心,那么從這些簡短信息來判讀,昆侖芯片采用的是一般乘加法器的大量疊加來增加其算力,但 NVIDIA 的 CUDA 單元或寒武紀等計算架構(gòu)都具備可編程的彈性應(yīng)用能力,NVIDIA 更是擁有業(yè)界最成熟的 CUDA 工具套件,可以讓硬件架構(gòu)更好的發(fā)揮,而昆侖芯片在開發(fā)環(huán)境上能否讓昆侖芯片百分之百地發(fā)揮亦是令人存疑。
近幾年 AI 議題火熱,似乎只要各種行業(yè)沾上了 AI,無窮的“錢景”就會隨之而來。一向反應(yīng)最快的中國市場,更帶領(lǐng)了一波芯片與產(chǎn)業(yè)服務(wù)的 AI 創(chuàng)新。
在產(chǎn)業(yè)、官方以及學(xué)術(shù)界的通力合作之下,中國 AI 技術(shù)的發(fā)展似乎已經(jīng)領(lǐng)銜全球,我們可以看到各種先進的方案、算法,以及應(yīng)用不斷冒出頭,與之搭配的各種芯片方案也紛紛被創(chuàng)造出來,不論從視覺識別,自然語言、終端、邊緣、云計算的 AI 方案也一應(yīng)俱全,但其中的一個大問題是,各家廠商并沒有形成共通生態(tài),而是走向各自為政。
雖然,從理論上講,光是現(xiàn)有產(chǎn)業(yè)的 AI 化就已經(jīng)具備可以支撐整個產(chǎn)業(yè)的需求規(guī)模,即便芯片生態(tài)分散,仍應(yīng)能找到自己的生存空間。但自有芯片對應(yīng)用或者是云計算廠商是一種必要投資,還是“”自有“”這兩個字已經(jīng)被過度強調(diào)之下的產(chǎn)物?或許值得我們再三思考。
就好比為了喝牛奶而養(yǎng)牛,我們要有專門環(huán)境,專人照顧,食料、疾病防治,加上擠牛奶的設(shè)備、牛奶的保存,這些不只要資金維持,也要很多的時間成本。AI 芯片亦不外如是。芯片設(shè)計出來除了芯片架構(gòu)本身,開發(fā)環(huán)境、各種框架的整合,以及與現(xiàn)有架構(gòu)的互換性,若沒有互換性,那又需要重頭設(shè)計整套生態(tài),因此,看芯片不只是看芯片本身,更要看周邊生態(tài)的搭配,這些都是人和錢堆出來的產(chǎn)物。
當然,政府為了推動半導(dǎo)體產(chǎn)業(yè)發(fā)展,其實通過很多種補貼方式來鼓勵芯片設(shè)計行業(yè)開發(fā)自己的方案,就好比為了喝牛奶想養(yǎng)牛,政府就會真的補助一條牛,但怎么養(yǎng),怎么生產(chǎn)牛奶就要自己想辦法。
很多企業(yè)因此在真正考慮營收獲利模式之前就先開個芯片再說,其出發(fā)點可能是為了配合政策,也可能是有了補貼不開白不開,但開了芯片之后能有什么作用?單純仿照其他人的作法做出架構(gòu)類似的 AI 計算架構(gòu),又是否真能幫助自己的計算事業(yè)更上層樓?這會不會甚至模糊了自己的固有優(yōu)勢?
除了開發(fā)芯片的成本低以外,還有另外一個原因,那就是要根據(jù)行業(yè)別不同而進行定制化的需求。
其實,不少企業(yè)開發(fā)芯片的理由,都是“找不到適合的芯片”,比如說語音芯片或者是視覺識別芯片可能需要不同前后端設(shè)計,通用方案可能無法完全滿足這些廠商的需求,這種設(shè)計可能就有其價值,但以昆侖這種通用 AI 芯片,似乎就沒有太大的必要。
前面也提到,由于現(xiàn)在推出“自有”AI 芯片的廠商已經(jīng)多如牛毛,且因為各行其是,難以形成足夠強大的聚落,當然,目前業(yè)界其實也有像寒武紀或 Arm 這種可提供授權(quán),具有一定生態(tài)基礎(chǔ)的架構(gòu)可使用,但自古“文人相輕”,況且 AI 芯片基礎(chǔ)架構(gòu)大同小異,差別只在算法軟件和平臺的配合,若能關(guān)起門來能自己賺那又何樂而不為?畢竟采用別人方案肯定會削薄利潤。
但事實真是如此嗎?
我們可以回頭看看過去 NVIDIA 在發(fā)展 AI 計算以及相關(guān)環(huán)境時,在芯片以外的東西投注了多少心力,光是 CUDA 這個開發(fā)環(huán)境,就已經(jīng)花費了十年以上的心力,不僅是完善本身的架構(gòu),也積極與業(yè)界、學(xué)界合作,從底層穩(wěn)扎穩(wěn)打做起。
雖然現(xiàn)在的 AI 計算環(huán)境早就已經(jīng)不是過去極度貧乏的狀況,各種開發(fā)環(huán)境都擺在那邊,框架也都幫你設(shè)計好,只要在程序中直接引用即可,但這種“自有”又是“真的自有“?
而廠商的各行其是,等于是各家廠商都花費了許多時間在做類似的工作,推出類似的方案,對全國研發(fā)資源而言,更可說是一種浪費,如果能夠集中這些資源,讓廠商不用重復(fù)發(fā)明輪子,而是集中精力,想辦法讓現(xiàn)有、已經(jīng)夠好的輪子有更好的應(yīng)用方向,那是否會對整個中國 AI 產(chǎn)業(yè)能有更正面影響和幫助?
DT 君認為是有這個可能的。只可惜國內(nèi)廠商們在“自有”這條路上走的太遠,像昆侖這樣的通用 AI 芯片方案此起彼落,是真正對個別廠商,或?qū)φw中國 AI 產(chǎn)業(yè)能產(chǎn)生幫助,還是造成研發(fā)資源的浪費,恐怕還需要時間證明。