當(dāng)前位置:首頁 > 電源 > 數(shù)字電源
[導(dǎo)讀]項(xiàng)目實(shí)施背景及可行性分析:智能視頻監(jiān)控是計(jì)算機(jī)視覺的一個重要應(yīng)用領(lǐng)域,有著廣闊的應(yīng)用前景,尤其是那些對安全要求比較敏感的場合,如飛機(jī)場、地鐵站、銀行、超市等。因

項(xiàng)目實(shí)施背景及可行性分析:

智能視頻監(jiān)控是計(jì)算機(jī)視覺的一個重要應(yīng)用領(lǐng)域,有著廣闊的應(yīng)用前景,尤其是那些對安全要求比較敏感的場合,如飛機(jī)場、地鐵站、銀行、超市等。

因?yàn)樵谝曨l監(jiān)控場景中出現(xiàn)的行人是事件發(fā)生的主體,所以行人是智能視頻監(jiān)控系統(tǒng)研究的主要對象,系統(tǒng)對這些行人目標(biāo)進(jìn)行實(shí)時檢測、跟蹤與識別,進(jìn)而分析他們的運(yùn)動或行為。而我們的研究課題——行人檢測就屬于智能監(jiān)控系統(tǒng)中的目標(biāo)分類功能部分,它的作用是將視頻中的行人與其他物體區(qū)分開來,并準(zhǔn)確定位。檢測性能的好壞將直接影響后續(xù)工作以致整個智能監(jiān)控系統(tǒng)的性能。因而這將是一個有著現(xiàn)實(shí)應(yīng)用意義的課題項(xiàng)目

在視頻圖像中進(jìn)行行人檢測可轉(zhuǎn)化為一個目標(biāo)分類問題,設(shè)計(jì)行人檢測系統(tǒng)的前提就是分類器的訓(xùn)練。訓(xùn)練分類器的主要步驟包括目標(biāo)特征提取和機(jī)器學(xué)習(xí)算法的選擇。利用特征對目標(biāo)進(jìn)行建模比直接使用圖像的像素值在計(jì)算上更加方便快捷,另外特征提取有利于減小同類目標(biāo)對象的類內(nèi)距離,同時增大不同類對象之間的類間距離,使最終的分類結(jié)果更加準(zhǔn)確。目前矩形特征經(jīng)常被同來表述行人形狀的邊緣信息,此類特征在樣本圖像中的大小和位置都是可變的,在逐像素遍歷的情況下特征總數(shù)目還是非常龐大,因此需要一個特征選擇算法來選擇對分類最有的特征,而級聯(lián)Adaboost算法正具有此功能。級聯(lián)Adaboost算法成熟、快速,具有很強(qiáng)的實(shí)用性。綜上所述,成熟的行人檢測算法為本研究項(xiàng)目奠定了堅(jiān)實(shí)的理論基礎(chǔ)。

項(xiàng)目實(shí)施方案:

1 項(xiàng)目基本框圖及描述:

從實(shí)用角度出發(fā),本文涉及的行人檢測系統(tǒng),共有三個功能模塊,系統(tǒng)框圖如圖一所示。第一部分的作用是通過背景建模進(jìn)行前景目標(biāo)的提取;第二部分完成對行人目標(biāo)的多尺度檢測功能,其中的行人分類器是由級聯(lián)Adaboost算法使用矩形特征訓(xùn)練出來的;第三部分的作用是將同一目標(biāo)產(chǎn)生的多個檢測結(jié)果進(jìn)行合并,完成最終的檢測定位功能。

 

 

圖一:行人檢測系統(tǒng)框圖

2 背景建模

真實(shí)的視頻監(jiān)控場景中,存在著大量的背景區(qū)域。本系統(tǒng)引入背景建模用來提取前景目標(biāo),有利于減少目標(biāo)的搜索范圍,從而加快檢測速度。本系統(tǒng)采用單高斯背景建模法來獲取前景目標(biāo)。

單高斯分布背景模型為每一圖像像素的灰度值分布建立了用單個高斯分布表示的模型

,其中下標(biāo)t表示幀號, 和 分別表示高斯分布的矩陣和方差。設(shè)圖像當(dāng)前像素點(diǎn)的灰度值為 ,若

,其中T為概率閾值,則該像素點(diǎn)被判為前景點(diǎn),否則為背景點(diǎn)。在實(shí)際應(yīng)用中,記

,則取概率閾值為 。

 

對于單高斯分布模型的更新,即各圖像點(diǎn)高斯分布參數(shù)的更新,我們引入如下更新公式:

 

 

其中 為更新率, 的取值對前景目標(biāo)的提取起著關(guān)鍵的作用。如果 太小,則會使背景模型跟不上實(shí)際背景的更新速度;如果 取太大,則可能將速度較慢的運(yùn)動物體更新為背景模型的一部分。本系統(tǒng)將 取值為0.005。

 

通過高斯背景建模,可以生成當(dāng)前幀圖像的前景像素點(diǎn),將這些前景像素點(diǎn)標(biāo)記為1,背景像素點(diǎn)標(biāo)記為0,生成一張前景標(biāo)記圖像。在后續(xù)的多尺度檢測過程中,通過判斷子窗口中是否含有前景像素點(diǎn)以決定是否檢測。子窗口的遍歷不需要花費(fèi)很多時間,但級聯(lián)分類器的特征計(jì)算是非常耗時的,因此這樣做可以大大減少檢測時間。

3 多尺度檢測

本系統(tǒng)采用的檢測方法是利用檢測窗口逐像素多尺度遍歷圖像區(qū)域,用訓(xùn)練好的級聯(lián)Adaboost行人分類器檢測檢測窗口內(nèi)是否存在行人,其中檢測窗口的尺寸等于訓(xùn)練樣本的尺寸。在實(shí)際的視頻場景中,人的尺寸是隨著與攝像機(jī)之間的距離變化而變化的,因此需要考慮檢測目標(biāo)與樣本尺寸匹配的問題。針對這個問題,本系統(tǒng)采用逐層縮小原始圖像的方法,以保證檢測目標(biāo)與檢測窗口尺寸的一致性。

對于縮放系數(shù)的選擇,也是影響檢測效果的因素之一。若縮放系數(shù)太低,可能導(dǎo)致目標(biāo)形狀的畸變,從而影響檢測結(jié)果;但如果縮放系數(shù)太高,又會增加縮放次數(shù),降低檢測效率。折衷考慮,我們選擇0.85為逐層縮放圖像的系數(shù),圖像的逐層縮放需要在原始圖像和前景目標(biāo)圖像上同時進(jìn)行,直至圖片的尺寸小于檢測窗口的尺寸。

4 多檢測窗口的合并

由于本系統(tǒng)采用的檢測方法是逐像素多尺度遍歷檢測,可能導(dǎo)致對同一目標(biāo)產(chǎn)生多個檢測結(jié)果(如圖二(a)所示),因此需要將這些重疊的窗口合并成一個檢測結(jié)果(如圖二(b)所示)。在合并的過程中,首先判斷當(dāng)前窗口是否有足夠的臨近窗口。所謂臨近窗口就是兩個窗口R1和R2相交的面積S(如圖二(c)陰影部分所示)與兩個窗口面積的比值均大于0.6。如果有足夠多的臨近窗口,那么保留此窗口,并且將此窗口與其臨近窗口兩兩求平均合并為一個新的窗口(如圖二(c)虛框所示);如果沒有足夠多的臨近窗口,就將此窗口當(dāng)是錯誤檢測結(jié)果刪除。

 

 

項(xiàng)目設(shè)計(jì)目標(biāo):

對于視頻圖像,我們采用以下兩個性能指標(biāo)來統(tǒng)計(jì)檢測系統(tǒng)的性能:

1、虛警率:所有幀內(nèi)圖像發(fā)生錯檢的非行人窗口數(shù)目總和/所有幀內(nèi)檢測窗口數(shù)目總和;

2、檢測率:所有幀內(nèi)圖像檢測正確的行人窗口數(shù)目總和/所有幀內(nèi)檢測窗口數(shù)目總和

本系統(tǒng)的設(shè)計(jì)目標(biāo)是實(shí)現(xiàn)實(shí)時檢測,并且在復(fù)雜的圖像背景條件下,達(dá)到高檢測率和低虛警率。

三、實(shí)驗(yàn)資源:

(1)實(shí)驗(yàn)平臺

FPGA開發(fā)平臺以及相應(yīng)的JTAG調(diào)試和開發(fā)工具

目標(biāo)平臺為Xilinx Virtex –V5開發(fā)平臺,原因如下:本項(xiàng)目屬于數(shù)字通信和高速電路領(lǐng)域,可以用在航空和軍事領(lǐng)域,需要硬件處理平臺具有較高的處理速度和豐富的邏輯資源,Xilinx-V5平臺是目前Xilinx公司推出的最新FPGA開發(fā)平臺,核心FPGA芯片的數(shù)據(jù)處理能力可達(dá)到3.1G,可實(shí)現(xiàn)高速數(shù)字信號的串并變換、時鐘處理、延遲處理等邏輯功能。

(2)測試設(shè)備:

包括直流穩(wěn)壓電源、萬用表

(3)仿真、開發(fā)工具:

包括Opencv、ModelSim、Xilinx ISE等。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉