當(dāng)前位置:首頁 > 芯聞號 > 廠商文章
[導(dǎo)讀]作者:LitchllResNet模型前言我們自己訓(xùn)練一個(gè)ResNet模型,并在以下三個(gè)環(huán)境中進(jìn)行性能的對比。AIStudio CPU: 2 Cores 8GB MemoryAIStudio GPU: V100 16GB VMemEdgeboard訓(xùn)練模型模型使用AIStudio 進(jìn)行訓(xùn)練,RESNET、M

作者:Litchll

ResNet模型

前言

我們自己訓(xùn)練一個(gè)ResNet模型,并在以下三個(gè)環(huán)境中進(jìn)行性能的對比。

AIStudio CPU: 2 Cores 8GB Memory

AIStudio GPU: V100 16GB VMem

Edgeboard

訓(xùn)練模型

模型使用AIStudio 進(jìn)行訓(xùn)練,RESNET、MOBILE訓(xùn)練和預(yù)測代碼有興趣的同學(xué)請手動(dòng)移步到百度AI社區(qū)相關(guān)帖子里查看詳細(xì)內(nèi)容。百度AI社區(qū)——EdgeBoard板塊。

測試結(jié)果

我們執(zhí)行預(yù)測,忽略掉預(yù)處理的速度,僅僅計(jì)算模型前向傳播的時(shí)間。

對于AIstudio平臺(tái),我們計(jì)算以下代碼的運(yùn)行時(shí)間

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

對于Edgeboard上面的PaddleMobile,我們計(jì)算以下代碼的運(yùn)行時(shí)間

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

以下為兩個(gè)模型的評測數(shù)據(jù)

ResNet

Edgeboard:

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

CPU:

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

GPU:

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

Mobile_Net

Edgeboard:

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

GPU:

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

CPU:

 

圖片1.png

總結(jié):

下表為兩個(gè)模型預(yù)測速度的對比,從中來看,其速度相對于V100的GPU甚至還有一定的優(yōu)勢,讓人難以相信。個(gè)人的分析是由于以下幾個(gè)原因

Paddle-mobile較為啟動(dòng)預(yù)測,與AIstudio的完整版Paddlepaddle相比有啟動(dòng)效率上的優(yōu)勢,AIstudio啟動(dòng)預(yù)測可能較慢。

整個(gè)預(yù)測模型batch size相當(dāng)于1,發(fā)揮不出GPU的優(yōu)勢。

部署預(yù)算按三年算的話,GPU V100價(jià)格大概是10萬,CPU 1萬, EdgeBoard 5千,性價(jià)比還是蠻高的。如果大家對Edgeboard感興趣的話,可自行到百度AI市場購買體驗(yàn),我在這里不做過多贅述。

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

我在進(jìn)行模型預(yù)測的時(shí)候,使用鉗表對功率進(jìn)行了大概的估計(jì)(條件有限),鉗表的讀數(shù)在0.6A-8A之間變化。結(jié)合使用的12V適配器,我大概估計(jì)Edgeboard的功耗為8W.

以8W的功耗,在單張圖片的預(yù)測速度上面領(lǐng)先了幾十倍功耗的GPU與CPU。Edgeboard的表現(xiàn)還是令我比較驚喜。本來想繼續(xù)移植一個(gè)前段時(shí)間的大尺度的分割網(wǎng)絡(luò)Unet進(jìn)行嘗試,想繼續(xù)試試他最大可以跑的模型大小,但似乎Edgeboard目前還不支持分割,存在了一定遺憾。

另外我在進(jìn)行調(diào)試的時(shí)候,發(fā)現(xiàn)過有幾個(gè)發(fā)布版本的固件不是很穩(wěn)定,有些op有些問題。還發(fā)現(xiàn)了Edgeboard在我的兩臺(tái)筆記本電腦上網(wǎng)絡(luò)不是很穩(wěn)定,經(jīng)常出現(xiàn)相互無法ping通的情況,更換PC后正常,暫時(shí)還沒發(fā)現(xiàn)為什么。

Edgeboard是我第一款接觸的嵌入式神經(jīng)網(wǎng)絡(luò)加速設(shè)備。Paddle-mobile也是我接觸的第一個(gè)移動(dòng)端神經(jīng)網(wǎng)絡(luò)框架,也是我接觸的第一個(gè)基于FPGA實(shí)現(xiàn)的加速框架。從我了解這個(gè)框架到現(xiàn)在僅僅不到半年的時(shí)間,已經(jīng)發(fā)布了多個(gè)模型轉(zhuǎn)換工具,降低了開發(fā)難度,并且支持EasyDL這種方式。雖然目前仍然有一些不成熟的坑需要填,不過相信在軟件的迭代下面,它能成為一個(gè)很好的嵌入式原型設(shè)計(jì)平臺(tái)。

Mobile-SSD模型

這次我們自己訓(xùn)練一個(gè)Mobilenet-SSD模型,增加了不同輸入維度的情況下,模型運(yùn)行效率的對比

AIStudio CPU: 2 Cores 8GB Memory

AIStudio GPU: V100 16GB VMem

Edgeboard

訓(xùn)練模型

模型使用AIStudio提供的官方工程進(jìn)行訓(xùn)練,Mobilenet-SSD訓(xùn)練和預(yù)測代碼有興趣的同學(xué)請手動(dòng)移步到百度AI社區(qū)相關(guān)帖子里查看詳細(xì)內(nèi)容。百度AI社區(qū)——EdgeBoard板塊。

運(yùn)行預(yù)測

我們執(zhí)行預(yù)測,忽略掉預(yù)處理的速度,僅僅計(jì)算模型前向傳播的時(shí)間。

對于AIstudio平臺(tái),我們計(jì)算以下代碼的運(yùn)行時(shí)間

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

對于Edgeboard上面的PaddleMobile,我們計(jì)算以下代碼的運(yùn)行時(shí)間

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

以下圖片為預(yù)測結(jié)果,由于時(shí)間有限,沒有很細(xì)致去訓(xùn)練模型,僅僅對比了模型運(yùn)行的速度。

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

下表為模型在不同維度下的預(yù)測速度的對比,從中來看,其速度相對于V100的GPU基本處于同一個(gè)數(shù)量級,遠(yuǎn)遠(yuǎn)領(lǐng)先與CPU

 

百度大腦EdgeBoard計(jì)算卡基于Resnet50/Mobile-SSD模型的性能評測

在之前的文章里我們提到,本來想繼續(xù)移植一個(gè)前段時(shí)間的大尺度的分割網(wǎng)絡(luò)Unet進(jìn)行嘗試,想繼續(xù)試試他最大可以跑的模型大小,但似乎Edgeboard目前還不支持分割,所以我們更換了目標(biāo)檢測網(wǎng)絡(luò)進(jìn)行嘗試。在mobilenet-SSD這個(gè)模型上,Edgeboard最大可以跑到700*700的輸入維度,并且能保持在16fps之上(不包含輸入圖像的語出過程),基本上具有實(shí)時(shí)性。

之前我提到的,在我的兩臺(tái)筆記本電腦上網(wǎng)絡(luò)不是很穩(wěn)定,經(jīng)常出現(xiàn)相互無法ping通的情況,目前經(jīng)過試驗(yàn)之后,發(fā)現(xiàn)問題為板子的網(wǎng)卡在與不支持千兆的網(wǎng)卡進(jìn)行通信時(shí)候,不能正確的協(xié)商,仍然使用千兆模式,使用以下命令固定為百兆即可正常連接

ethtool -s eth0 speed 100 duplex full

Edgeboard是我第一款接觸的嵌入式神經(jīng)網(wǎng)絡(luò)加速設(shè)備。Paddle-mobile也是我接觸的第一個(gè)移動(dòng)端神經(jīng)網(wǎng)絡(luò)框架,也是我接觸的第一個(gè)基于FPGA實(shí)現(xiàn)的加速框架。從我了解這個(gè)框架到現(xiàn)在僅僅不到半年的時(shí)間,已經(jīng)發(fā)布了多個(gè)模型轉(zhuǎn)換工具,降低了開發(fā)難度,并且支持EasyDL這種方式。雖然目前仍然有一些不成熟的坑需要填,不過相信在軟件的迭代下面,它能成為一個(gè)很好的嵌入式原型設(shè)計(jì)平臺(tái)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉