當(dāng)前位置:首頁 > 原創(chuàng) > 劉巖軒
[導(dǎo)讀]邊緣AI落地,需要滿足端側(cè)的功耗要求。因此內(nèi)置硬件CNN進(jìn)行專門的AI運(yùn)算,成為了AI MCU的最佳選擇。

要實(shí)現(xiàn)人工智能,必然要進(jìn)行大量的矩陣計算。而大量的矩陣計算依賴于大量的存儲空間、強(qiáng)大的計算能力和高速的數(shù)據(jù)交互,因此通常只能在云端的大型服務(wù)器集群中可以進(jìn)行部署。

但在很多垂直的邊緣端要實(shí)現(xiàn)AI賦能,調(diào)用云端的AI能力的成本較高,而且整個鏈條的響應(yīng)時間也較長,對于連接質(zhì)量的依賴程度也較高,因此并不能做到較為實(shí)時的計算和處理,這與端側(cè)的低功耗、低延時的系統(tǒng)設(shè)計目標(biāo)并不相符。但其實(shí)剖析大部分端側(cè)的AI應(yīng)用場景,并不需要非常復(fù)雜的模型運(yùn)算,例如識別車牌、物體,進(jìn)行語音指令識別等等,這些應(yīng)用已經(jīng)沉淀了成熟的AI模型,因此只需要在端側(cè)計算單元中部署一個資源夠用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)加速器,就可以承擔(dān)起端側(cè)的AI任務(wù),而且也釋放了更擅長做計算任務(wù)的CPU等資源,從而在增加AI運(yùn)算的同時,還保證了達(dá)到端側(cè)高能效目標(biāo)。

在百億IoT設(shè)備中,大部分的計算單元是MCU。而在MCU中集成CNN加速器,已經(jīng)成為了MCU的一個發(fā)展方向。目前諸多MCU廠商都已經(jīng)推出了AI集成的MCU產(chǎn)品,其中也包括ADI的邊緣AI微控制器產(chǎn)品MAX7800X系列,目前該系列產(chǎn)品型號包括MAX78000和MAX78002。


CNN加速器集成,實(shí)現(xiàn)高能效邊緣AI計算

據(jù)預(yù)測,2025年75%的數(shù)據(jù)產(chǎn)生在邊緣側(cè)進(jìn)行處理,端側(cè)AI MCU市場潛力巨大。MAX7800X系列也因此應(yīng)運(yùn)而生。據(jù)ADI中國技術(shù)支持中心高級工程師辛毅介紹,該系列產(chǎn)品由兩個微控制器內(nèi)核(ARM Cortex M4F和RISC-V)加上一個卷積神經(jīng)網(wǎng)絡(luò)(CNN)加速器構(gòu)成。這一架構(gòu)針對邊緣AI應(yīng)用進(jìn)行了高度優(yōu)化,數(shù)據(jù)的加載和啟動由微控制器內(nèi)核負(fù)責(zé),而AI推理由卷積神經(jīng)網(wǎng)絡(luò)加速器專門負(fù)責(zé)。

據(jù)ADI MCU產(chǎn)品線資深業(yè)務(wù)經(jīng)理李勇介紹,Cortex-M4F內(nèi)核主要是做一些應(yīng)用和通信,同時內(nèi)部還配有FLASH和SRAM。而RISC-V則是一顆小內(nèi)核,采用32位精簡指令集,主要是配合CNN來工作。比如圖片、聲音、波形等數(shù)據(jù)通過通信接口或者圖像Camera接口輸入進(jìn)來后,會由RISC-V內(nèi)核將這些數(shù)據(jù)搬運(yùn)至存儲空間,再讓CNN來使用。CNN經(jīng)過硬件計算,將原始的數(shù)據(jù)通過矩陣的乘法和加法得到一些特征值,再放到內(nèi)存里來進(jìn)行比對。

借助于CPU和CNN兩類硬件的分工合作,MAX7800X系列一不需要聯(lián)網(wǎng),二支持電池供電,完美地滿足了邊緣AI的要求,是AIoT應(yīng)用的理想產(chǎn)品。

目前MAX7800X提供了MAX78000和mAX78002兩種產(chǎn)品型號,MAX78000可支持多達(dá)3.5M的模型權(quán)重,MAX78002則支持多達(dá)16M的模型權(quán)重。如果把AI看成一個工作的大腦,那么模型權(quán)重就相當(dāng)于這個大腦里儲存的知識。因此,MAX78002和MAX78000相比,不僅可以做到圖像的識別,還可以進(jìn)行復(fù)雜的視頻分析?!翱偟膩碚f,ADI的邊緣AI解決方案具備速度快、無需外部存儲、時鐘控制靈活和超低功耗等四大特色,因此對于需要使用電池供電、需要及時決策的物聯(lián)網(wǎng)設(shè)備來說特別合適?!毙烈憬榻B到。


更完美平衡的邊緣AI方案

邊緣AI的計算平臺,可以選擇FPGA、GPU、DSP或其它專用ASIC,但ADI的MAX7800X憑借著針對性的架構(gòu)設(shè)計,提供了更高的能效和性能表現(xiàn)。

對比傳統(tǒng)的MCU+DSP的方案,ADI的MAX7800X的CNN加速器可以將功耗降低99%以上,而且算法在CNN上執(zhí)行的效率也比DSP上更高。對于單純采用微控制器的方案,MAX7800X的CNN加速器具備更高的數(shù)據(jù)吞吐量,可以將速度提高100倍以上;而且釋放了CPU的工作負(fù)載,使其專注于更擅長的計算任務(wù)。而對于FPGA等方案,雖然可以處理更復(fù)雜的細(xì)節(jié),但其成本、功耗和面積都并不適合更邊緣側(cè)的部署,MAX7800X也具備更大的優(yōu)勢。

如下圖所示,將最新的MAX78000,與ADI的通用MCUMAX32650,以及競爭對手的某個MCU放在一起進(jìn)行對比。當(dāng)執(zhí)行相同的人臉識別(也就是圖像識別、視覺識別)和關(guān)鍵字識別(也就是音頻識別、聽覺識別)的AI推理時,MAX78000中的CNN在50MHz的主頻下就可以達(dá)到280億次每秒的運(yùn)算速度,而另外兩顆MCU則在內(nèi)置的帶CMSIS-NN的DSP上運(yùn)行相同INT8網(wǎng)絡(luò),速度遠(yuǎn)不及MAX78000中的專用CNN。而在功耗表現(xiàn)方面,競品MCU還要增加外部3.3V SDRAM和控制器的功耗,遠(yuǎn)高于MAX78000和MAX32650??偟膩砜?,在執(zhí)行AI運(yùn)算時,不論是推理速度和推理功耗,MAX78000在都大幅領(lǐng)先于另外兩顆沒有內(nèi)置CNN的MCU。


硬件CNN集成,邊緣AI MCU的技術(shù)趨勢

當(dāng)前邊緣AI的實(shí)現(xiàn),有多種不同的方案,但考慮到更低的功耗表現(xiàn),MCU內(nèi)部集成專用的CNN硬件加速器是必然的選擇。因?yàn)锳I需要的大量矩陣計算,在Cortex-M7或RISC-V等內(nèi)核上運(yùn)算的效率并不高,勢必帶來大幅的功耗上升。而集成的CNN是專門針對矩陣計算設(shè)計的,因此執(zhí)行效率非常高。據(jù)李勇介紹,ADI的硬件CNN有64個8位處理器,里面有很多存放權(quán)重數(shù)據(jù)的Memory,這些Memory都分布在64個處理器周圍,并不需要那么多寄存器去進(jìn)行管理,CNN的處理器直接取值,運(yùn)算了再放出來,這一過程就會省很多時間,運(yùn)算也非???。因?yàn)槿怯布瓿傻?,比傳統(tǒng)微控制器的處理速度要快得多。CNN工作在50MHz的頻率上,可以非??焱瓿葾I工作,然后進(jìn)入到睡眠狀態(tài)。因此集成來硬件CNN的MCU做這類運(yùn)算,會比其他傳統(tǒng)MCU控制器更加省電。

為了實(shí)現(xiàn)可穿戴級別的低功耗,MAX7800X系列在設(shè)計上針對低功耗的進(jìn)行了全面的考量。首先,選擇的Cortex-M4F和RISC-V內(nèi)核本身就是低功耗的取向,每個芯片有不同的工作模式、功耗模式,可以針對不同工況來關(guān)斷不需要的資源和接口,確保芯片一直保持在更低的功耗水平。其次,ADI的設(shè)計中包含有多個時鐘源,不僅有100MHz,還有7MHz和4MHz的。采用低頻率時鐘源的時候,功耗可以實(shí)現(xiàn)顯著降低。第三是提高集成度,ADI將電源管理、通信接口、比較大的Memory、甚至是電頻轉(zhuǎn)換芯片都集成在芯片里面, 輸入一個2.0V到3.6V的單電源,可以實(shí)現(xiàn)多路電源輸出,內(nèi)部供給內(nèi)核、Memory或者GPIO使用,從而幫助客戶提升了系統(tǒng)的整體功耗表現(xiàn)。

目前MAX78000支持的模型已經(jīng)有一些客戶成功案例,比如用來做山火監(jiān)測的安全攝像頭,有些地方經(jīng)常突發(fā)山火,需要一些遠(yuǎn)程監(jiān)控設(shè)備,但又不需要傳輸大量的圖像。另外比如城市里的管道漏水、漏氣,是通過聲音和管道震動來檢測的。還有一些特殊產(chǎn)品,比如摩托車頭盔上的攝像頭,需要采用語音控制等等。其實(shí)ADI已經(jīng)無形中將AI應(yīng)用到方方面面。


結(jié)語

隨著AI在邊緣的落地,硬件CNN在端側(cè)MCU的集成已經(jīng)成為一種技術(shù)趨勢。這種AI MCU的發(fā)展,將會迎來巨大的市場機(jī)遇。

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉