“讓芯片通過(guò)學(xué)習(xí)的過(guò)程而使得算法和軟件自動(dòng)演進(jìn),如此一來(lái),所需功能的芯片自動(dòng)就有了?!边@到底屬于怎樣的智慧芯片?我有一個(gè)夢(mèng)想,“讓芯片通過(guò)學(xué)習(xí)的過(guò)程而使得算法和軟件自動(dòng)演進(jìn),如此一來(lái),所需功能的芯片自動(dòng)就有了。”
與此相反的一個(gè)狀況是,“當(dāng)芯片設(shè)計(jì)人員用6個(gè)月來(lái)思考定義,頭腦風(fēng)暴許久只為與別人做出不一樣的芯片。再到市場(chǎng)階段早已過(guò)去兩三年,突然發(fā)現(xiàn)做出的芯片沒(méi)有市場(chǎng)?!?
以上構(gòu)想和慘況不是我憑空想來(lái),是在前幾日在Cadence 2019年度CDNLive大會(huì)上,清華大學(xué)教授魏少軍博士在做主題為“軟件定義芯片”演講時(shí)所說(shuō)。后者更接近現(xiàn)狀,而前者卻成了芯片從業(yè)人員或者科研人員的夢(mèng)想。
遙不可及嗎?不見(jiàn)得。
今年的CDNLive將目光瞄上了智能二字,主題設(shè)為“智能系統(tǒng)設(shè)計(jì)” (Intelligent System Design),主論壇的演講嘉賓分別是Cadence公司總裁Anirudh Devgan、清華大學(xué)教授魏少軍,以及人工智能獨(dú)角獸依圖科技創(chuàng)始人、CEO朱瓏出席了大會(huì),陣容上囊括了產(chǎn)業(yè)與學(xué)術(shù)界。
三位大咖的演講橫穿智慧芯片的過(guò)去現(xiàn)在和未來(lái),讓筆者頓覺(jué),在芯片的最前方似乎有一座烏托邦,不用“揚(yáng)鞭”,便能“自?shī)^蹄”。這到底是怎樣的愿景?背后又藏著怎樣的生意?
為什么要智能芯片?
“機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、自動(dòng)化、更卓越的設(shè)計(jì)能力、5G和邊緣計(jì)算等概念的推動(dòng)下,使得汽車(chē)、工業(yè)、醫(yī)療等各行業(yè)都在經(jīng)歷空前的數(shù)字化轉(zhuǎn)型,并促進(jìn)了針對(duì)其特定應(yīng)用需求而優(yōu)化的定制系統(tǒng)和SoC的開(kāi)發(fā)?!?Anirudh Devgan這句話(huà)從當(dāng)下現(xiàn)狀來(lái)剖析智慧化勢(shì)不可擋:“我們已進(jìn)入智能系統(tǒng)設(shè)計(jì)時(shí)代?!?
Cadence公司總裁Anirudh Devgan
魏少軍教授和朱瓏同時(shí)認(rèn)為這是一場(chǎng)“算法、數(shù)據(jù)、算力(芯片)”大爆炸的結(jié)果,魏少軍表示,自上世紀(jì)80年代人工智能誕生的驚喜開(kāi)始,不僅成就了David hunter的諾貝爾獎(jiǎng)榮譽(yù),也為人們打開(kāi)了另一個(gè)智能世界。
清華大學(xué)教授魏少軍
“神經(jīng)元比作節(jié)點(diǎn)、突觸比作連接線(xiàn),組成一個(gè)人工神經(jīng)網(wǎng)絡(luò)。神經(jīng)元通過(guò)突觸進(jìn)行通信,而突觸的權(quán)重決定是否能夠通信。如此一來(lái),任何神經(jīng)元就是一堆數(shù)據(jù),加權(quán)重,再到下一級(jí)。這是一種全新的計(jì)算方式”,魏少軍如此形容如今大伙的神經(jīng)網(wǎng)絡(luò),也表達(dá)了背后關(guān)于數(shù)據(jù)量的變化:“處理人工神經(jīng)網(wǎng)絡(luò)需要的數(shù)據(jù)量是驚人的,VGG19模型就達(dá)到196億每秒浮點(diǎn)運(yùn)算次數(shù)。(如下圖右側(cè)柱狀圖)”
圖源現(xiàn)場(chǎng)拍攝(魏少軍演講PPT)
朱瓏表示:“信息時(shí)代在過(guò)去30年里,算法、算力、數(shù)據(jù)都提升百萬(wàn)倍。但在智能時(shí)代僅僅過(guò)去5年里,在算法上提升百萬(wàn)倍、算力提升十萬(wàn)倍、數(shù)據(jù)提升萬(wàn)倍。”這里的分界點(diǎn)是阿法狗出來(lái)那一刻,如今那個(gè)機(jī)器,在算法上又提升了一百萬(wàn)倍。
依圖科技創(chuàng)始人、CEO朱瓏
同時(shí)這也是一個(gè)算法不斷迭代演進(jìn)的年代。魏少軍認(rèn)為,“算法每6個(gè)月或者3個(gè)月就要變一次,一個(gè)算法對(duì)應(yīng)一個(gè)應(yīng)用,沒(méi)有通用的算法對(duì)我們硬件(芯片)來(lái)說(shuō)是災(zāi)難性的。”
要應(yīng)對(duì)這場(chǎng)“災(zāi)難”,顯然需要本文開(kāi)頭構(gòu)想的場(chǎng)景——“讓芯片通過(guò)學(xué)習(xí)的過(guò)程而使得算法和軟件自動(dòng)演進(jìn)”。
到底有多難和怎么做?
“計(jì)算量足夠大,能量效率還要足夠高,這之間很難平衡。從現(xiàn)在以T為單位的計(jì)算量來(lái)看,幾乎是要在單芯片上實(shí)現(xiàn)超算,本來(lái)我們想象在5nm/10nm才有所需求,人工神經(jīng)網(wǎng)讓芯片早就達(dá)到了超算能力?!蔽荷佘娙绱苏f(shuō)道,他眼中的智慧芯片需要具備至少以下8個(gè)特點(diǎn)。
1,可編程性,適應(yīng)算法不斷變化;
2,改變架構(gòu),來(lái)適應(yīng)算法 獲得最佳計(jì)算效率;
3,非常好的架構(gòu)變換能力;
4,很高的計(jì)算效率,用指令肯定不行;
5,很高的能量效率;
6,低成本;
7,體積??;
8,簡(jiǎn)單,開(kāi)發(fā)應(yīng)用要簡(jiǎn)單。只需軟件工程師會(huì)編程即可。
隨后魏少軍補(bǔ)充道:“如今的CPU、CPU+GPU、CPU+FPGA、CPU+ASIC統(tǒng)統(tǒng)不是理想的架構(gòu)?!?
至此,魏少軍認(rèn)為“軟件定義芯片”才是最佳做法。其概念是就是將分塊軟件/程序不斷送到數(shù)據(jù)通道,使芯片能實(shí)時(shí)地根據(jù)軟件或產(chǎn)品的需求改變功能,實(shí)現(xiàn)更加靈活的芯片設(shè)計(jì)。在去年美國(guó)國(guó)防部先進(jìn)計(jì)劃署(DARPA)推動(dòng)的電子產(chǎn)業(yè)振興計(jì)劃(ERI),其中一個(gè)課題就是軟件定義硬件的概念。
當(dāng)然,當(dāng)下軟件定義芯片架構(gòu)并沒(méi)有逃開(kāi)馮·諾依曼架構(gòu),可以看出該架構(gòu)在計(jì)算完備性上是有理論基礎(chǔ)的。
魏少軍提出了“AI芯片設(shè)計(jì)路線(xiàn)圖”,(如下)AI芯片0.5代表最早的如英特爾CPU、英偉達(dá)GPU一類(lèi)芯片,用傳統(tǒng)芯片實(shí)現(xiàn)人工智能。
圖源現(xiàn)場(chǎng)拍攝:圖橫軸表示算法,縱軸表示架構(gòu)
1.0時(shí)代則包括TPU等,追求性能同時(shí)追求低功耗。1.5時(shí)代則包括DPU Thinker等,不僅要可重構(gòu),還要追求能量效率和靈活性。2.0時(shí)代,則包括了前面所有有點(diǎn)。魏少軍認(rèn)為AI芯片2.0才是真正的智慧,但還沒(méi)有出現(xiàn)。
不同于魏少軍所表達(dá)的宏觀概念,Anirudh Devgan和朱瓏聚焦在了市場(chǎng)上,前者關(guān)注EDA智能系統(tǒng)設(shè)計(jì),后者關(guān)注視覺(jué)方面的AI芯片。
Cadence公司副總裁,中國(guó)及東南亞地區(qū)總經(jīng)理徐昀女士表示,2019年是公司特殊的一年,正式踏入了系統(tǒng)設(shè)計(jì)、系統(tǒng)分析領(lǐng)域,旨在幫助用戶(hù)在日常開(kāi)發(fā)中實(shí)現(xiàn)更多智能化。
這里的智能系統(tǒng)設(shè)計(jì)策略就是Anirudh Devgan所說(shuō)的:“以技術(shù)(計(jì)算)軟件為核心能力,包括引用AI和算法優(yōu)化設(shè)計(jì)工具、擴(kuò)展到新系統(tǒng)領(lǐng)域、以及執(zhí)行核心EDA和IP?!?
此外,為了優(yōu)化設(shè)計(jì)方案,Cadence 提出了 Machine Learning 與 EDA 相互融合的理念,并在中國(guó)IC設(shè)計(jì)市場(chǎng)帶來(lái)了全新的思路,如下:
(1)ML Inside:通過(guò)最新的機(jī)器學(xué)習(xí)引擎,改善數(shù)字設(shè)計(jì)工具,帶來(lái)更好的PPA。通過(guò)對(duì)過(guò)往的大數(shù)據(jù)分析和決策,來(lái)加速未來(lái)的智能版圖設(shè)計(jì)。
(2)ML Outside:自動(dòng)化的設(shè)計(jì)流程,提升整個(gè)設(shè)計(jì)的生產(chǎn)效率。
(3)ML Enablement:軟件和硬件的協(xié)同設(shè)計(jì),以及 Cadence 獨(dú)有的 Tensilica 處理器 IP,應(yīng)用機(jī)器學(xué)習(xí)為系統(tǒng)級(jí)的優(yōu)化帶來(lái)提升。
AI芯片公司的突破口
本來(lái)前面部分已經(jīng)可以結(jié)束“智慧芯片”這一話(huà)題,但依圖CEO朱瓏的演講像是一針雞血扎入我大動(dòng)脈。雞血之下其實(shí)也闡述了關(guān)于國(guó)內(nèi)AI芯片的活法。
朱瓏感嘆做AI芯片實(shí)在太難了,做AI的人不懂芯片,做芯片的人不懂AI。總結(jié)三句話(huà):“1,沒(méi)有典型場(chǎng)景應(yīng)用沒(méi)有意義;2,沒(méi)有超越NVIDIA的芯片沒(méi)有意義;3,沒(méi)有世界級(jí)的算法沒(méi)有意義?!?
本來(lái)AI芯片的企業(yè)活著就不容易,還要和世界頂尖芯片廠較勁?干不過(guò)就沒(méi)有意義。按照朱瓏的說(shuō)法,還有幾家芯片公司有意義?
超越的方法被朱瓏濃縮為兩個(gè)字——理念。
“如果能猜對(duì)重要的場(chǎng)景,并猜對(duì)重要的算法,來(lái)應(yīng)對(duì)架構(gòu)本身的不確定性。那就大有可為?!?依圖的思路放在了視頻視覺(jué)處理上,實(shí)現(xiàn)“用1個(gè)機(jī)柜支撐1萬(wàn)路攝像頭的全解析,讓能耗、成本和空間都獲得大幅度的減低和壓縮?!?在演講中可以看出,朱瓏所“猜”的場(chǎng)景是智慧城市。
如此一來(lái),讓筆者越發(fā)覺(jué)得芯片這行太難了,前方烏托邦式的“智慧芯片”,再加完美的應(yīng)用場(chǎng)景,設(shè)計(jì)工具本身就要兼具智能系統(tǒng)。外加人才、資本、政策協(xié)助,才是一個(gè)完整的芯片升級(jí)之道。