當前位置:首頁 > 智能硬件 > 智能硬件
[導讀]摘要:雙目計算機視覺是利用仿生學原理,通過標定后的雙攝像頭來得到同步曝光圖像,然后計算獲取的2維圖像像素點的第3維深度信息。為了對不同環(huán)境場景進行監(jiān)控提出了一種新的基于雙目計算機視覺的自適應識別算法。該算

摘要:雙目計算機視覺是利用仿生學原理,通過標定后的雙攝像頭來得到同步曝光圖像,然后計算獲取的2維圖像像素點的第3維深度信息。為了對不同環(huán)境場景進行監(jiān)控提出了一種新的基于雙目計算機視覺的自適應識別算法。該算法首先利用像素點的深度信息對場景進行識別判斷,然后采用統(tǒng)計的方法為場景建模,并通過時間濾波克服光照漸變,以及通過深度算法特性克服光照突變。與單攝像頭監(jiān)控系統(tǒng)相比,利用該算法實現(xiàn)的視頻監(jiān)控原型系統(tǒng),可應用于更多場合,并利用深度信息設置報警級別,來降低誤檢率。

關(guān)鍵詞:雙目計算機視覺 深度信息 自適應 光照變化 視頻監(jiān)控

1 引 言

面對日益復雜的社會和政治環(huán)境,國家安全、社會安全、個人人生安全和財產(chǎn)安全等都面臨著不同程度的威脅,都需要各種安全保護措施,在眾多場所建立切實有效的安保措施,成為一個迫切的課題。本文提出了一種基于雙目計算機視覺的自適應識別算法,將該算法應用于現(xiàn)有的監(jiān)控系統(tǒng),并賦予監(jiān)控終端智能性,不僅使其脫離人而具有獨立智能、自主判斷的能力,而且使得視頻監(jiān)控系統(tǒng)在安防方面的作用大大提高。

在現(xiàn)有的背景建模方法中,大多對于背景象素點的亮度值,例如最小亮度值、最大亮度值和最大亮度差值[ 1 ] ,或是對顏色信息進行建模[ 2 ] 。對于背景的更新,一般使用自適應濾波器對像素的統(tǒng)計特性進行遞歸更新,為了考慮到噪聲的影響,文獻[ 3 ]提出了Kalman濾波器的方法,該文認為系統(tǒng)的最優(yōu)信息可通過估計獲得??紤]到環(huán)境的動態(tài)緩慢改變,文獻[ 4 ]利用統(tǒng)計模型給背景建模,即由一個時域濾波器保留著一個序列均值和一個標準偏差,并通過濾波過程統(tǒng)計值隨時間改變來反映環(huán)境的動態(tài)特性。另外有一些方法解決了光照漸變等影響[ 5~7 ] ,但計算較復雜。

2雙目計算機視覺深度算法

基于實際應用考慮,攝像頭的數(shù)量關(guān)系著成本和計算量,所以選擇支持雙攝像頭(雙目視覺)的算法是最合適的。在支持雙目視覺的算法中,Princeton NEC research institute 基于最大流算法(maximum2flow)的計算機視覺算法( Stereo2MF)在深度效果平滑性上做得較好[ 8, 9 ] ,適用于監(jiān)控區(qū)域深度計算的應用背景。但原有算法所需的計算量和計算過程中的暫存數(shù)據(jù)量是較大的,雖然支持計算量的削減,但只是機械地在一塊區(qū)域中選擇中心點來進行計算,這樣計算的結(jié)果會因選擇的機械性,而出現(xiàn)大量的“偽點”,這些偽點錯誤地表現(xiàn)了該區(qū)域的平均深度信息。本文采用統(tǒng)計平均值選取計算點,通過距離因子的Gauss分布將塊內(nèi)其他點的值融合計算,從而使得計算出的值較準確的代表了這一塊內(nèi)的大致深度分布。

m, n分別是圖像的長和寬所包含的像素點個數(shù),M、N 表示像素點的橫縱坐標, .d 是塊內(nèi)深度統(tǒng)計平均值, dM, N為計算點的深度值, q為距離因子, dB是計算所得的塊深度代表值。圖1為改進后雙目視覺深度算法與原算法識別效果比較。由圖1可以明顯看出,修改后的算法效果在細節(jié)表現(xiàn)、平滑性、偽點減少上均有明顯改善,而且深度計算精確度能夠完全滿足視頻

圖1 改進后雙目視覺深度算法與原算法識別效果比較Fig. 1Effect comparison after algorithm modification

度計算精確度能夠完全滿足視頻監(jiān)控應用的需要。

3 自適應識別算法

對于一個固定的場景,場景各像素點的深度值是符合一個隨機概率分布。以某一均值為基線,在其附近做不超過某一偏差的隨機振蕩,這種情況下的場景稱之為背景。而場景環(huán)境往往是動態(tài)變化的,如環(huán)境自然光的緩變,燈光的突然熄滅或點亮,以及運動對象的出現(xiàn)、運動和消失等。如果能識別出場景中的動態(tài)變化,就能自適應的更新背景值,將光照的改變?nèi)诤系奖尘爸抵?。本文采取了用統(tǒng)計模型的方式給每個像素點建模,而以像素點變化的分布情況來確定光照突變引起的深度突變,并結(jié)合深度計算本身特性,解決光照緩變突變引起的誤判問題,以及判別場景中對象的主次性。

3. 1 背景象素點的深度值建模

由于雙目計算機視覺算法得到的深度值,已經(jīng)是塊融合的,可以根據(jù)精度要求,來加大塊面積, 減少數(shù)據(jù)量。本文獲得的數(shù)據(jù)量只有原像素點的( k, l分別是塊的長和寬所包含的像素點個數(shù)) 。以統(tǒng)計的方法給每個像素點的深度值建模, 設為第u幀圖像的某個像素點的深度值, 其中u代表第u幀圖像, i, j分別代表像素點的橫坐標和縱坐標。由一個時間濾波器來保持該像素點深度值的序列均值和時間偏差

其中,α是一個可調(diào)增益參數(shù), 其與采樣頻率有關(guān)。通過濾波過程,來得到每個像素點的深度值基于時間的統(tǒng)計特性,由于這些統(tǒng)計特性反映了環(huán)境的動態(tài)特性,據(jù)此可以了解到是環(huán)境的光照發(fā)生了突變,還是有運動對象的運動。

3. 2 背景更新與場景識別

通過上述濾波過程,就可以將光照緩變?nèi)谌氲奖尘爸腥?實現(xiàn)背景的自適應更新。而對于光照突變,此時幾乎所有的象素點的亮度值會同時增大或減小,但根據(jù)最大流算法的特性,同方向的變化對流量差不會引起太大變化, 而對深度計算結(jié)果只會引起較小的同方向變化。這種全局的等量變化, 可以認為是光照突變引起的。

其中, a、b和c是3個可調(diào)節(jié)系數(shù),他們的取值可依據(jù)場景的情況及檢測光照突變的速度與誤差來進行選取。s, t分別是深度圖像的長和寬所包含的像素點個數(shù)。Q是符合式( 9)的像素點個數(shù)。一旦檢測到環(huán)境光照發(fā)生了突變, 就把背景點像素的深度序列均值,全部以當前幀像素點的深度值的測量

值代替,而j以0取代,從而實現(xiàn)背景的及時更新。

如果式(10)式(12)中任意一個不成立的話,則認為像素塊深度值的變化并非由光照突變引起, 而是場景中有運動對象出現(xiàn)。

4 算法分析與實驗

4. 1 算法復雜度

對于光照突變檢測,若有突變的話,則會立即檢測出來,當有運動對象出現(xiàn)時, 并且式( 10)式( 12)都接近滿足時,處理會較慢,因為需要處理突變檢測和運動對象兩個過程。當b取25% s ×t時的處理速度與變化點比例關(guān)系如圖2所示。

相對于一般的光強、灰度的識別檢測算法,本算法的優(yōu)勢在于不僅可以利用深度特性更容易地檢測到光照的漸變與突變, 而且可以判斷出現(xiàn)的多個運動對象的主次性。

4. 2 算法誤檢率

由于光照直接對于像素點的光強、灰度等產(chǎn)生影響,所以深度算法的噪聲容限更大,這樣可降低了誤檢率,多組實驗后得到的誤檢率對比圖如圖3所示。但是由于深度算法本身對于反光或者陰暗面會產(chǎn)生偽點,所以,某些時候由于光照突變中光源的位置變化而會誤檢為運動對象,為此算法還需進一步改進能判別偽點的出現(xiàn), 除去它在光照突變檢測中的影響。另外,公式中可調(diào)系數(shù)a, b, c的選取也會對不同場景產(chǎn)生影響。

筆者在實驗室環(huán)境下做了不同光照角度、不同環(huán)境光強度、不同運動物體的多組實驗,發(fā)現(xiàn)在反光面或是陰暗面較多的情況下,光照突變檢測不是很靈敏,而且會出錯,但是在增加系數(shù)a, c的值后, 誤檢率有所降低(如圖3所示) 。

5 基于算法的監(jiān)控系統(tǒng)

我們利用該算法實現(xiàn)了視頻監(jiān)控原型系統(tǒng)。計算機視覺算法對于攝像頭的同步曝光要求很高,所以本系統(tǒng)終端用一塊單獨的MCU (micro control unit)控制同步曝光。核心算法用DSP處理。系統(tǒng)結(jié)構(gòu)如圖4所示。實際系統(tǒng)原型圖如圖5所示。

6 結(jié) 論

利用深度信息做智能場景識別,是一種新的嘗試,有其優(yōu)勢。將這種方法應用到智能視頻監(jiān)控中,能起到很好的效果,克服了其他方法較難處理的光照漸變和突變等問題。對比單攝像頭監(jiān)控系統(tǒng),該系統(tǒng)可應用于更多場合。后續(xù)研發(fā)準備在系統(tǒng)上加上更多功能,以適用于更多的環(huán)境,并與其他保安類監(jiān)控系統(tǒng)互聯(lián),以組成一整套功能強大、達到國內(nèi)外一流水平的安防系統(tǒng)。

參考文獻( References)

1Ude A, Riley M. Prediction of body configurations and appearance for model-based estimation of articulated human motions [A ]. In: IEEE SMC’99 Conference Proceeding [ C ] , Tokyo, Japan, 1999: 687~691.

2Ricquebourg Y, Bouthemy P. Real-time tracking of moving persons by exp loiting spatio2tempp ral image slices[ J ]. IEEE Transactions on Pattern Analysis andMachine Intelligence, 2000, 22 (8) : 797~808.

3Tsap L V, Goldof D B, Sarkar S. Nonrigid motion analysis based on dynamic refinement of finite elementmodelsp [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22 ( 5 ) : 526~543.

4Haritaoglu I, Harwood D, Davis L. A real time system for detecting and tracking peop le [ A ]. In: Third International Conference on Automatic Face and Gesture[ C ] , Nara, Japan, Ap ril 1998.

5Wren C, AzarbayejaniA, Darrell T. Real-time tracking of the human body [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19 (7) : 780~785.

6Ridder C, Munkelt O, Kirchner H. Adap tive background estimation and foreground detection using Kalman filtering[A ]. In: Proceedings International Conference. Recent Advances in Mechatronics, ICRAM’95, Istanbul, Turkey, 1995: 193~199.

7Fujiyoshi H, Lip ton A J. Real-time human motion analysis by image skeletonization[A ]. In: Proceedings of theWorkshop on App lication of ComputerVision, Freiburg, Germany, October 1998.

8Sebastien Roy, Ingemar J Cox. A maximum-flow formulation of the n-camera stereo correspondence p roblem [ A ]. In: International Conference on Computer Vision ( ICCV’98 ) [ C ] , Bombay, India, January 1998: 492~499.

9Cox I J, Hingorani S, Maggs B M. A maximum likelihood stereo algorithm[ J ]. Computer Vision and Image Understanding, 1996, 63 (3) : 542~567.

更多計算機與外設信息請關(guān)注21ic計算機與外設頻道

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉