智能終端AI芯片產(chǎn)業(yè)的發(fā)展會怎樣
智能終端AI芯片產(chǎn)業(yè)呈現(xiàn)快速擴張之勢,未來可期。
2017年,華為率先發(fā)布麒麟970芯片,集成寒武紀的深度學習內(nèi)核。同年,蘋果發(fā)布雙核架構(gòu)神經(jīng)網(wǎng)絡引擎(NeuralEngine)的A11Bionic芯片。2018年,華為和蘋果相繼發(fā)布7nm工藝的麒麟980和A12。2019年,華為和蘋果推出麒麟990和A13,AI處理性能進一步提升。目前AI處理能力已逐漸向中端產(chǎn)品滲透,除追求性能提升外,大部分終端AI芯片專注于基于推斷計算的應用場景進行優(yōu)化,少數(shù)的終端AI芯片具備訓練能力。根據(jù)ABIRe-search預測,2024年,終端AI芯片市場規(guī)模將增長至710億美元,2019年至2024年間的年復合增長率將達31%。
AI算力從云端向終端遷移
傳統(tǒng)意義上,大多數(shù)對神經(jīng)網(wǎng)絡的訓練和推理都是在云端或基于服務器完成的。隨著終端處理器性能的不斷提升,很多人工智能的推理工作,如模式匹配、建模檢測、分類和識別等逐漸從云端轉(zhuǎn)移到終端側(cè)。
這主要有三點原因。首先,AI能力的端側(cè)遷移是用戶使用場景所需的必然結(jié)果。數(shù)據(jù)由云走向邊緣。IDC數(shù)據(jù)統(tǒng)計,未來幾年內(nèi)邊緣側(cè)數(shù)據(jù)將達到總數(shù)據(jù)量的50%,這些數(shù)據(jù)由終端采集和產(chǎn)生,也需要端側(cè)AI芯片就近分析處理。其次,AI能力的端側(cè)遷移亦是提升人工智能用戶體驗的重要方式。在端側(cè),人工智能關(guān)鍵優(yōu)勢包括即時響應、隱私保護增強、可靠性提升,此外,還能確保在沒有網(wǎng)絡連接的情況下用戶的人工智能體驗得到保障。最后,AI處理能力的端側(cè)遷移是人工智能數(shù)據(jù)隱私保護的需要。
終端AI芯片不斷演化
AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應用中涉及的各類算法的AI加速計算模塊(其他非AI加速計算任務仍由CPU負責)。作為AI技術(shù)的三大核心要素之一,芯片承載著AI應用部署的堅實基礎——計算能力。AI芯片算力的高速發(fā)展,是工業(yè)場景和自動駕駛等高實時性AI終端應用的有力保障。同時,芯片的算力和功耗之間的兼顧和優(yōu)化,是AI芯片未來發(fā)展的主題。各種類型的智能終端AI芯片還將在多種多樣的人工智能應用場景中進行差異化競爭。
AI終端芯片技術(shù)現(xiàn)狀
從通用芯片、專用芯片和異構(gòu)結(jié)合三個維度,對基于人工智能場景的終端芯片的技術(shù)現(xiàn)狀進行分析。
通用芯片方面,智能終端常用的通用AI處理芯片主要是CPU、GPU、FPGA三種,在傳統(tǒng)CPU(CentralProcess-ingUnit)中,僅有單獨的ALU(邏輯運算單元)模塊是用來完成指令數(shù)據(jù)計算的,其他各種模塊的存在是為保證指令能串行有序執(zhí)行。這種通用結(jié)構(gòu)對于傳統(tǒng)的編程計算模式非常適合,但是對于需要海量數(shù)據(jù)運算的深度學習的計算需求,無法提供足夠的AI專用計算支撐。
GPU依靠通用靈活的強大并行運算能力,契合當前人工智能中廣泛采用的深度學習所需要的密集數(shù)據(jù)和多維并算處理需求。按照比例來說,在CPU上約有20%的晶體管是用作計算的,而在GPU上有80%的晶體管可用作計算。高效的算數(shù)運算單元和簡化的邏輯控制單元,把串行訪問拆分成多個簡單的并行訪問,同時進行運算。如向量相加,可讓CPU串行循環(huán)對每一個分量做加法,也可讓GPU采用大量并行線程對應各個分量同時相加。
FPGA(FieldProgram-mableGateArray)即現(xiàn)場可編程門陣列,依靠電路級別的通用性,加上可編程性,適用于開發(fā)周期較短的IoT產(chǎn)品、傳感器數(shù)據(jù)預處理工作以及小型開發(fā)試錯升級迭代工作等。FPGA可靈活支持各類深度學習的計算任務,適合在推斷環(huán)節(jié)支撐海量的用戶實時計算請求。FPGA的可編程性是關(guān)鍵,讓智能終端及其應用設計公司能提供與其競爭對手不同的解決方案。
專用芯片方面,ASIC(ApplicationSpecificIn-tegratedCircuit,專用集成電路)細分市場需求確定后,以TPU為代表的ASIC定制化芯片,將在確定性執(zhí)行模型的應用需求中發(fā)揮作用。ASIC的特點是需要大量的研發(fā)投入,如果不能保證出貨量,其芯片成本難以下降,而且芯片的功能一旦流水線生產(chǎn)后則無更改余地,若市場深度學習方向一旦改變,ASIC前期投入將無法回收,具有較大的市場風險。但ASIC性能高于FPGA,在高出貨量下,其芯片成本可遠低于FPGA。
異構(gòu)結(jié)合方面,AI處理芯片還可通過統(tǒng)籌多芯片任務處理,提高任務處理效率,幫助AI應用程序?qū)?shù)據(jù)進行分類及排序處理。這樣的處理模式并非完全依賴于專用AI芯片,芯片廠家可通過采用異構(gòu)的芯片構(gòu)架實現(xiàn)。由于AI場景眾多,神經(jīng)網(wǎng)絡自定義層繁復,單種處理器硬件已無法滿足所有需求,通過軟硬結(jié)合解決方案,如在已有芯片平臺加入神經(jīng)網(wǎng)絡處理引擎(NeuralPro-cessingEngine,NPE)來調(diào)動處理器中已有的CPU、GPU及其他計算模塊,可以實現(xiàn)面向人工智能任務的異構(gòu)計算。通過軟硬結(jié)合的開放型異構(gòu)計算可滿足AI的多場景需求、面向整個手機平臺所需的通用性和靈活性,也可更好地利用終端原有計算資源完成AI計算。
智能終端AI芯片展望
雖然我國智能終端芯片廠商在核心技術(shù)方面仍然依賴于國外廠商,但機遇與挑戰(zhàn)并存。依托國家政策并抓住發(fā)展機遇,我國相關(guān)AI芯片業(yè)的前景可期。同時,當前各廠商AI芯片不受制于傳統(tǒng)CPU芯片和軟件應用生態(tài)(如英特爾X86芯片),這對自主AI芯片的發(fā)展十分有利。
當前,國家政策持續(xù)利好。繼2017年國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》后,《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020年)》又吹響了前進的號角。同時從芯片資本市場來看,國家集成電路產(chǎn)業(yè)投資基金(二期)的募資工作已經(jīng)完成,規(guī)模在2000億元左右,撬動的社會資金規(guī)模可達6000億元左右。
面向未來,在技術(shù)發(fā)展策略層面,需要積極構(gòu)建生態(tài)圈,支持國內(nèi)AI芯片企業(yè)自有指令集的研發(fā)。在產(chǎn)業(yè)應用方面,政府、事業(yè)單位和國有企業(yè)應優(yōu)先使用國產(chǎn)AI芯片,為國產(chǎn)芯片操作系統(tǒng)生態(tài)提供支持。同時,鼓勵我國智能終端AI芯片、框架和自主操作系統(tǒng)深度耦合全生態(tài)發(fā)展,研發(fā)與深度學習框架結(jié)合的AI芯片,構(gòu)建芯片、操作系統(tǒng)和應用一體的軟硬結(jié)合技術(shù)體系。