百度昆侖暴露中國AI芯片野蠻生長的重大問題

時間：2018-07-11 07:54:54

關(guān)鍵字： ai芯片百度昆侖

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]近幾年 AI 議題火熱，似乎只要各種行業(yè)沾上了 AI，無窮的“錢景”就會隨之而來。一向反應(yīng)最快的中國市場，更帶領(lǐng)了一波芯片與產(chǎn)業(yè)服務(wù)的 AI 創(chuàng)新。

上周，百度在其開發(fā)者大會上宣布了其最新的 AI 芯片與自動駕駛進展，然而在光鮮華麗的發(fā)表會下面，百度是否真的做出了獨有創(chuàng)意?還是只為近來 AI 浪潮中再多增加一個泡沫?

而根據(jù)百度在發(fā)布會上公開的信息，昆侖芯片最高算力可達到260 TOPS，已經(jīng)是 NVIDIA 的最新算卡 V100的兩倍以上，但是這個算力指標靠不靠譜?對百度云計算的規(guī)劃是否真能發(fā)揮作用?其實 DT 君抱以存疑的態(tài)度。

首先，算力的計算有很多層次，就以 TOPS 這種每秒整數(shù)操作次數(shù)，還可分為不同精度，以及稀疏計算模式的啟用與否，以寒武紀為例，其在 5 月發(fā)布的專業(yè)算卡架構(gòu)在性能指標方面就可分為多種模式，且該架構(gòu)不用 TOPS 作為性能指標，而是采用基于浮點計算的 TFLOPS，性能從倍精度、單精度到半精度，算力跨度從 16 TFLOPS 到 166 TFLOPS，昆侖僅提供單一數(shù)據(jù)，且只有公開最大整數(shù)計算能力，其實背后隱含著該架構(gòu)可能在均衡性有所欠缺，只能少數(shù)狀況下?lián)碛休^高性能表現(xiàn)的可能。

另外，若以昆侖芯片的 TOPS 參數(shù)和 NVIDIA 的 V100 比較，表面數(shù)字上的確贏了不少，但是昆侖芯片并沒有公布芯片的規(guī)模，只有宣布其整合了數(shù)萬個小核心，那么從這些簡短信息來判讀，昆侖芯片采用的是一般乘加法器的大量疊加來增加其算力，但 NVIDIA 的 CUDA 單元或寒武紀等計算架構(gòu)都具備可編程的彈性應(yīng)用能力，NVIDIA 更是擁有業(yè)界最成熟的 CUDA 工具套件，可以讓硬件架構(gòu)更好的發(fā)揮，而昆侖芯片在開發(fā)環(huán)境上能否讓昆侖芯片百分之百地發(fā)揮亦是令人存疑。

近幾年 AI 議題火熱，似乎只要各種行業(yè)沾上了 AI，無窮的“錢景”就會隨之而來。一向反應(yīng)最快的中國市場，更帶領(lǐng)了一波芯片與產(chǎn)業(yè)服務(wù)的 AI 創(chuàng)新。

在產(chǎn)業(yè)、官方以及學(xué)術(shù)界的通力合作之下，中國 AI 技術(shù)的發(fā)展似乎已經(jīng)領(lǐng)銜全球，我們可以看到各種先進的方案、算法，以及應(yīng)用不斷冒出頭，與之搭配的各種芯片方案也紛紛被創(chuàng)造出來，不論從視覺識別，自然語言、終端、邊緣、云計算的 AI 方案也一應(yīng)俱全，但其中的一個大問題是，各家廠商并沒有形成共通生態(tài)，而是走向各自為政。

雖然，從理論上講，光是現(xiàn)有產(chǎn)業(yè)的 AI 化就已經(jīng)具備可以支撐整個產(chǎn)業(yè)的需求規(guī)模，即便芯片生態(tài)分散，仍應(yīng)能找到自己的生存空間。但自有芯片對應(yīng)用或者是云計算廠商是一種必要投資，還是“”自有“”這兩個字已經(jīng)被過度強調(diào)之下的產(chǎn)物?或許值得我們再三思考。

就好比為了喝牛奶而養(yǎng)牛，我們要有專門環(huán)境，專人照顧，食料、疾病防治，加上擠牛奶的設(shè)備、牛奶的保存，這些不只要資金維持，也要很多的時間成本。AI 芯片亦不外如是。芯片設(shè)計出來除了芯片架構(gòu)本身，開發(fā)環(huán)境、各種框架的整合，以及與現(xiàn)有架構(gòu)的互換性，若沒有互換性，那又需要重頭設(shè)計整套生態(tài)，因此，看芯片不只是看芯片本身，更要看周邊生態(tài)的搭配，這些都是人和錢堆出來的產(chǎn)物。

當然，政府為了推動半導(dǎo)體產(chǎn)業(yè)發(fā)展，其實通過很多種補貼方式來鼓勵芯片設(shè)計行業(yè)開發(fā)自己的方案，就好比為了喝牛奶想養(yǎng)牛，政府就會真的補助一條牛，但怎么養(yǎng)，怎么生產(chǎn)牛奶就要自己想辦法。

很多企業(yè)因此在真正考慮營收獲利模式之前就先開個芯片再說，其出發(fā)點可能是為了配合政策，也可能是有了補貼不開白不開，但開了芯片之后能有什么作用?單純仿照其他人的作法做出架構(gòu)類似的 AI 計算架構(gòu)，又是否真能幫助自己的計算事業(yè)更上層樓?這會不會甚至模糊了自己的固有優(yōu)勢?

除了開發(fā)芯片的成本低以外，還有另外一個原因，那就是要根據(jù)行業(yè)別不同而進行定制化的需求。

其實，不少企業(yè)開發(fā)芯片的理由，都是“找不到適合的芯片”，比如說語音芯片或者是視覺識別芯片可能需要不同前后端設(shè)計，通用方案可能無法完全滿足這些廠商的需求，這種設(shè)計可能就有其價值，但以昆侖這種通用 AI 芯片，似乎就沒有太大的必要。

前面也提到，由于現(xiàn)在推出“自有”AI 芯片的廠商已經(jīng)多如牛毛，且因為各行其是，難以形成足夠強大的聚落，當然，目前業(yè)界其實也有像寒武紀或 Arm 這種可提供授權(quán)，具有一定生態(tài)基礎(chǔ)的架構(gòu)可使用，但自古“文人相輕”，況且 AI 芯片基礎(chǔ)架構(gòu)大同小異，差別只在算法軟件和平臺的配合，若能關(guān)起門來能自己賺那又何樂而不為?畢竟采用別人方案肯定會削薄利潤。

但事實真是如此嗎?

我們可以回頭看看過去 NVIDIA 在發(fā)展 AI 計算以及相關(guān)環(huán)境時，在芯片以外的東西投注了多少心力，光是 CUDA 這個開發(fā)環(huán)境，就已經(jīng)花費了十年以上的心力，不僅是完善本身的架構(gòu)，也積極與業(yè)界、學(xué)界合作，從底層穩(wěn)扎穩(wěn)打做起。

雖然現(xiàn)在的 AI 計算環(huán)境早就已經(jīng)不是過去極度貧乏的狀況，各種開發(fā)環(huán)境都擺在那邊，框架也都幫你設(shè)計好，只要在程序中直接引用即可，但這種“自有”又是“真的自有“?

而廠商的各行其是，等于是各家廠商都花費了許多時間在做類似的工作，推出類似的方案，對全國研發(fā)資源而言，更可說是一種浪費，如果能夠集中這些資源，讓廠商不用重復(fù)發(fā)明輪子，而是集中精力，想辦法讓現(xiàn)有、已經(jīng)夠好的輪子有更好的應(yīng)用方向，那是否會對整個中國 AI 產(chǎn)業(yè)能有更正面影響和幫助?

DT 君認為是有這個可能的。只可惜國內(nèi)廠商們在“自有”這條路上走的太遠，像昆侖這樣的通用 AI 芯片方案此起彼落，是真正對個別廠商，或?qū)φw中國 AI 產(chǎn)業(yè)能產(chǎn)生幫助，還是造成研發(fā)資源的浪費，恐怕還需要時間證明。