地平線余凱:車規(guī)級AI芯片,引領汽車駛向超級計算機時代
9月3日,第二屆全球IC企業(yè)家大會暨第十七屆中國國際半導體博覽會(IC China 2019)在上海召開,本屆大會主題為“開放發(fā)展 合作共贏”,由工業(yè)和信息化部、上海市人民政府指導,中國半導體行業(yè)協(xié)會、中國電子信息產(chǎn)業(yè)發(fā)展研究院聯(lián)合主辦。地平線作為在AI芯片領域的先鋒創(chuàng)業(yè)企業(yè)受邀參加本屆大會,于上周宣布量產(chǎn)了中國首款車規(guī)級人工智能芯片——征程二代的消息也在整個半導體行業(yè)內(nèi)引起不小的震動,創(chuàng)始人兼CEO余凱也在會上向IC同行和產(chǎn)業(yè)相關(guān)人士們闡述了地平線就車規(guī)級AI芯片研發(fā)和落地的產(chǎn)業(yè)布局。
圖:地平線創(chuàng)始人兼CEO余凱
余凱在演講伊始提到,計算的變遷一直圍繞著終端的變化,計算終端變遷將助力計算機發(fā)展史,迎來AI新時代。5G時代將產(chǎn)生無處不在的AI節(jié)點,同時也會看到,時代主流的變化,智能機器的數(shù)量,將會數(shù)倍于全球總?cè)丝跀?shù),蘊含前所未有的商業(yè)機會。這對邊緣計算來說,會有一定的發(fā)展空間。
圖:地平線創(chuàng)始人兼CEO余凱
邊緣計算可靠性高、低延時、低傳輸存儲成本、脫敏合規(guī)等特點更符合無人駕駛的應用場景需求,是應對終端數(shù)量激增和海量數(shù)據(jù)計算挑戰(zhàn)的關(guān)鍵。目前大家的關(guān)注點都在4級、5級的無人駕駛,余凱認為3級自動駕駛是一個轉(zhuǎn)折點,是人機交互的切換點,目前真正在產(chǎn)業(yè)界規(guī)?;慨a(chǎn)的是2級、2.5級的輔助駕駛,人工智能計算在輔助駕駛方面,可以提高安全性。他說“無人駕駛毫無疑問是車載人工智能計算最有想象力的未來,但是今天無人駕駛始終還有一些關(guān)鍵問題需要解決,它是確定性的未來,但是當下來講,人工智能計算還在輔助駕駛的階段,我們不是說替代司機,而是讓司機駕駛更加安全、體驗更好,包括車載娛樂導航的人機交互,包括高精度地圖眾包的生產(chǎn),邊緣計算已然在自動駕駛到來之前,可以產(chǎn)生巨大的市場規(guī)模。”
智能駕駛的發(fā)展亟待更強大的邊緣處理器邊緣計算雖然不是數(shù)據(jù)中心,但它的計算負載同樣很大,一輛自動駕駛車輛平均每天產(chǎn)生600-1000 TB的數(shù)據(jù)計算,僅2000輛自動駕駛車輛產(chǎn)生的數(shù)據(jù)量超過2015年我們整個文明一天數(shù)據(jù)用量,大規(guī)模設備端部署需要成本效率。根據(jù)摩爾定律,在過去的發(fā)展過程中,推動的不僅僅是IP層,還有人工智能層,都受到推動。如果摩爾定律繼續(xù),未來1000美金,我們就能買到等同于大腦的算力。如果無人駕駛更加智能化,則亟需更強大的邊緣處理器。
地平線征程二代處理器在此背景下應運而生,其搭載自主創(chuàng)新研發(fā)的高性能計算架構(gòu)BPU2.0(Brain Processing Unit),可提供超過4 TOPS的等效算力,典型功耗僅2瓦,且具有極高的算力利用率,典型算法模型在該芯片上處理器的利用率可以高于90%,能夠高效靈活地實現(xiàn)多類AI任務處理,對多類目標進行實時檢測和精準識別,可全面滿足自動駕駛視覺感知、視覺建圖定位、視覺ADAS等智能駕駛場景的需求,以及語音識別,眼球跟蹤,手勢識別等智能人機交互的功能需求,充分體現(xiàn)BPU架構(gòu)強大的靈活性,全方位賦能汽車智能化。
圖:地平線征程二代芯片核心參數(shù)
在能效比和開放性方面,征程二代具備顯著優(yōu)勢。打造極致的AI能效是地平線芯片設計的核心理念?;谶@一理念,征程二代芯片具備極高的算力利用率,每TOPS AI能力輸出可達同等算力GPU的10倍以上。與此同時,征程二代還可提供高精度且低延遲的感知輸出,滿足典型場景對語義分割、目標檢測、目標識別的類別和數(shù)量的需求。征程二代全面開放,提供從參考解決方案,到開放的感知結(jié)果,再到芯片及工具鏈的基礎開發(fā)環(huán)境,并可依據(jù)客戶的不同需求提供不同層次的產(chǎn)品交付和服務。
為什么地平線能夠?qū)I處理器的算力利用率做得如此之高?原因在于地平線在AI處理器設計的初始就開始從整個芯片的系統(tǒng)級設計和芯片級別角度上思考SoC的設計思路,將經(jīng)典芯片設計思想和帶寬利用率優(yōu)化結(jié)合在一起,注重真實的AI能力輸出,既守住主效能又兼顧靈活效能的BPU思想。同時,地平線還從能源轉(zhuǎn)化為計算的效率、算力成本、算力利用率和算力轉(zhuǎn)化為AI輸出的效率四個指標率先重新定義了AI處理器的真實性能。并且前瞻性的對重要應用場景中的關(guān)鍵算法發(fā)展趨勢進行預判,提前將其計算特點融入到計算架構(gòu)的設計當中,使得AI處理器經(jīng)過一兩年的研發(fā),在推出的時候,仍然能夠很好地適應時下最新的主流算法。因此,和其他典型的AI處理器相比,地平線的AI處理器,隨著算法的演進趨勢,始終能夠保持相當高的有效利用率,從而真正意義上受益于算法創(chuàng)新帶來的優(yōu)勢。
光有這些還不夠,大家并不能夠很好把這種處理器和算法高效算法利用起來,怎么辦呢?地平線還推出了全棧式工具鏈Horizon OpenExplorer(“天工開物”開發(fā)工具鏈),包括核心轉(zhuǎn)化工具模型結(jié)構(gòu)檢查性能分析、編譯器、模擬器,輸入可以是各種開源主流的深度學習框架產(chǎn)生出來訓練模型,輸出可以部署到人工智能處理器高效運行的模型,使用起來非常方便。
車規(guī)級芯片產(chǎn)品開發(fā)周期長,難度大,是硬科技、長跑道的創(chuàng)新車載AI芯片被余凱看做是人工智能行業(yè)的珠穆朗瑪,也是自動駕駛實現(xiàn)大規(guī)模落地的前提。眾所周知,車規(guī)級芯片需要滿足“高安全性、高可靠性、高穩(wěn)定性”的技術(shù)標準要求,并需要經(jīng)過嚴苛的研發(fā)、制造、封裝、測試和認證流程,產(chǎn)品開發(fā)周期長,難度大,余凱說“需要有超強的耐力、耐得寂寞才能把這件事情做好”。地平線征程二代從設計之初就嚴格按照汽車電子可靠性標準AEC-Q100的要求進行。
地平線明年目標推出面向L4/L5 征程三代芯片,整個計算能力達到192TOPS,功耗僅48瓦,實際車載計算算力將是特斯拉自動駕駛平臺的三倍。
關(guān)于車規(guī)級芯片的研發(fā),地平線也給出了明確的發(fā)展路線圖:
明年,地平線將發(fā)布16nm的J2A。而地平線的第三代車規(guī)級AI處理器J3,性能將達到域控制級L3,符合功能安全車規(guī)級,除了滿足可靠性AEC-Q100,還符合功能安全,芯片達到ACILB,系統(tǒng)達到ACILD,并有保密價值加密機制,整體提供了安全可靠的芯片為自動駕駛護航。J3將基于BPU3.0架構(gòu),協(xié)同CPU、CV等形成異構(gòu)計算,在智能駕駛場景下達到最優(yōu)。其整個SoC支持多達8路以上的視頻輸入,并支持4K,地平線會將包括數(shù)據(jù)通路在內(nèi)的整個架構(gòu)做優(yōu)化,最后達到一個極好的效果。
之后,地平線還會推出J3 max,目前已在規(guī)劃中,預計會采用7nm等更先進工藝,針對L4、L4+高性能車規(guī)級處理器,可支持多達12路,算力達100TOPS,功耗目標是25瓦,芯片等級達C或D。
最后余凱指出,隨著地平線這樣的IC玩家不斷往前奔跑,整個行業(yè)不斷推進摩爾定律往前發(fā)展,車載的計算從分布式ECU架構(gòu),演進到現(xiàn)在的主流預控制器,到2025年會往中央計算單元去發(fā)展,汽車會展現(xiàn)出跟今天我們理解的PC還有移動產(chǎn)業(yè)發(fā)展格局本質(zhì)屬性,會變成四個輪子上面超級計算機。