人工智能專用芯片戰(zhàn)開打
人工智能(AI)可說是2016年運(yùn)算領(lǐng)域最熱門的話題,廠商競(jìng)相開發(fā)專用芯片的戰(zhàn)爭(zhēng)已經(jīng)開打…
接續(xù)前文:《人工智能芯片戰(zhàn)開打 邊緣計(jì)算還面臨哪些障礙?》
CEA的雄心是開發(fā)神經(jīng)形態(tài)(neuromorphic)電路;該研究機(jī)構(gòu)認(rèn)為,這類芯片在深度學(xué)習(xí)應(yīng)用中,是從接近傳感器的數(shù)據(jù)(data)提取信息(informaTIon)的有效補(bǔ)充。
在實(shí)現(xiàn)以上目標(biāo)之前,CEA考慮了數(shù)個(gè)權(quán)宜之計(jì);例如D2N2這樣的開發(fā)工具,對(duì)于芯片設(shè)計(jì)業(yè)者開發(fā)高水平每瓦TOPS (tera operaTIons per second per Watt)性能的客制化DNN解決方案非常重要。
對(duì)于那些想在邊緣運(yùn)算利用DNN的人來說,也有實(shí)際的硬件可以進(jìn)行試驗(yàn)──也就是CEA提供的超低功耗可程序加速器P-Neuro;目前的P-Neuro神經(jīng)網(wǎng)絡(luò)處理單元是以FPGA為基礎(chǔ),不過Duranton表示,CEA正要把該FPGA轉(zhuǎn)為ASIC。
Duranton在CEA的實(shí)驗(yàn)室利用了以FPGA為基礎(chǔ)的P-Neuro展示了搭建了用于臉部是別的卷積神經(jīng)網(wǎng)絡(luò)(CNN),并將P-Neuro與嵌入式CPU (在Raspberry Pi上的四核心ARM處理器,以及采用Samsung Exynos處理器的Android平臺(tái))進(jìn)行比較,都執(zhí)行相同的嵌入式CNN應(yīng)用,任務(wù)是在內(nèi)含1萬8,000張影像的數(shù)據(jù)庫(kù)進(jìn)行“人臉特征提取”。
P-Neuro與嵌入式CPU/GPU執(zhí)行相同人臉識(shí)別任務(wù)的性能比較
如上表之比較結(jié)果,P-Neuro的速度是每秒6,942張圖片,能效則是每瓦2,776張圖片;與嵌入式GPU相較(Tegra K1),運(yùn)作頻率為1000MHz的P-Neuro速度更快、能效更高。P-Neuro是以叢集式SIMD架構(gòu)打造,該架構(gòu)支持優(yōu)化內(nèi)存分層和內(nèi)部鏈接。
P-Neuro功能區(qū)塊
不過對(duì)于CEA研究人員來說,P-Neuro只是一個(gè)短期方案;目前的P-Neuro是以全CMOS組件打造、采用二進(jìn)制編碼;該團(tuán)隊(duì)也正在打造采用棘波編碼(spike coding)的全CMOS組件。為充分利用先進(jìn)制程優(yōu)勢(shì),并且在密度和功率上有所突破,該團(tuán)隊(duì)設(shè)定了更高的目標(biāo)。
如CEA-LeTI的納米電子技術(shù)營(yíng)銷暨策略總監(jiān)Carlo Reita在接受采訪時(shí)表示,利用先進(jìn)芯片與內(nèi)存技術(shù)來進(jìn)行專用零組件的實(shí)體設(shè)計(jì)非常重要;其中一個(gè)方案是采用CEA-LeTI的CoolCube常規(guī)monolithic 3D整合技術(shù),另一種方案是采用電阻式內(nèi)存(Resistive RAM)做為突觸(synaptic)組件。此外,如FD-SOI與納米線等先進(jìn)技術(shù)也將發(fā)揮作用。
神經(jīng)形態(tài)處理器在此同時(shí),歐盟在「EU Horizon 2020」計(jì)劃之下,試圖打造神經(jīng)形態(tài)架構(gòu)芯片,能支持最先進(jìn)的機(jī)器學(xué)習(xí),以及基于棘波的學(xué)習(xí)機(jī)制;該研究項(xiàng)目名為NeuRAM3,目標(biāo)是以超低功耗、可擴(kuò)展與高度可配置的神經(jīng)架構(gòu),打造在特定應(yīng)用上功耗較傳統(tǒng)數(shù)字方案低50倍的組件。
神經(jīng)形態(tài)處理器架構(gòu)
神經(jīng)形態(tài)處理器基本規(guī)格
Reita表示,CEA也參與了NeuRAM3項(xiàng)目,該機(jī)構(gòu)的研究目標(biāo)與該項(xiàng)目的使命緊密相關(guān),包括開發(fā)采用FD-SOI制程的單體(monolithically)整合式3D技術(shù),以及整合電阻式內(nèi)存突觸組件的應(yīng)用;她并指出,NeuRAM3項(xiàng)目開發(fā)的新一代混合訊號(hào)多核心神經(jīng)形態(tài)組件,與IBM的TrueNorth腦啟發(fā)(brain-inspired)操作數(shù)件相較,能顯著降低功耗。
NeuRAM3神經(jīng)形態(tài)組件與IBM TrueNorth的比較
NeuRAM3項(xiàng)目的參與者包括IMEC、IBM Zurich研究中心、意法半導(dǎo)體(ST Microelectronics),意大利研究機(jī)構(gòu) CNR (The National Research Council in Italy)、西班牙研究機(jī)構(gòu)IMSE (El Instituto de Microelectronica de Sevilla in Spain)、瑞士蘇黎世大學(xué)(The University of Zurich)和德國(guó)的雅各布大學(xué)(Jacobs University)。
責(zé)編:Judith Cheng
(參考原文:Race for AI Chips Begins,by Junko Yoshida)