當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術(shù)》雜志
[導(dǎo)讀]摘 要:視頻中的目標(biāo)檢測與跟蹤是視頻行為分析與行為識別的技術(shù)基礎(chǔ),該論文介紹了近10年來主流目標(biāo)檢測技術(shù)和目標(biāo)跟蹤技術(shù)的主要成果,對比了主流目標(biāo)跟蹤和目標(biāo)檢測技術(shù)的性能,并介紹了這兩項(xiàng)技術(shù)的未來發(fā)展方向。

引 言

在視頻中人或運(yùn)動物體行為理解的整個(gè)流程中,運(yùn)動目標(biāo)的檢測與跟蹤非常關(guān)鍵。通常一個(gè)視頻監(jiān)控系統(tǒng)大體可分解為四個(gè)不同的功能單元,即目標(biāo)檢測,搜索系統(tǒng)感興趣的目標(biāo)區(qū)域 ;目標(biāo)跟蹤,捕獲感興趣區(qū)域的運(yùn)動軌跡 ;目標(biāo)分類, 將被跟蹤目標(biāo)分為人,汽車或其他移動物體 ;目標(biāo)行為識別, 對跟蹤目標(biāo)進(jìn)行行為識別。目標(biāo)檢測作為視頻監(jiān)控的前提, 屬于低層次的視覺問題,目前己有多種較為成熟的算法。而目標(biāo)跟蹤作為視頻監(jiān)控最基本的功能屬于中等層次的視覺問題, 是當(dāng)前制約視頻監(jiān)控系統(tǒng)性能的主要瓶頸之一。

1 主流的目標(biāo)檢測方法介紹

1.1 背景分割法

背景分割法適用于運(yùn)動場景固定且比較簡單的場合,通過建立背景模型,用圖像序列的特征參數(shù)與背景模型比較, 分割出背景和前景,從而得到運(yùn)動對象。背景差分圖像的主要原理是通過現(xiàn)有圖像對比已知背景圖像,且背景圖像中不含任何感興趣的對象,是背景模型 [1]。該對比過程被稱為前景檢測。該過程將觀測圖像分為兩個(gè)互補(bǔ)的像素集合,可覆蓋全部圖像,包括感興趣的運(yùn)動對象及前景與前景的補(bǔ)集,即背景。

背景減除法最大的缺陷是,沒有成熟和高性能的規(guī)則來定義前景區(qū)域和對象,因此其使用范圍受限。有許多背景減除算法是針對特定需求提出來的,因此對模型和分割策略也提出了特殊要求。如文獻(xiàn) [2],它必須適用于平緩或快速的光照變化,場景運(yùn)動變化,復(fù)雜的背景或背景變化。由于部分場合要求由硬件承擔(dān)背景減除功能,因此算法負(fù)載成為最基本的要求。對于戶外視頻監(jiān)控系統(tǒng)而言,算法對噪聲的魯棒性以及算法對光照變化的適應(yīng)能力是最基本的要求。

1.2 相鄰幀間差分法

該方法選擇相鄰的兩幀進(jìn)行比對,選擇參數(shù)可以是直方圖,也可以是亮度或其他圖像的特征參數(shù),兩個(gè)相鄰的圖像幀 進(jìn)行減法運(yùn)算,結(jié)果的矩陣值與預(yù)設(shè)的閾值進(jìn)行比較,通過 差的絕對值與閾值大小來判斷是否有運(yùn)動。在這個(gè)原理的框 架下有更多的改進(jìn)算法被提出,比如基于亮度假設(shè)檢驗(yàn)和高 階統(tǒng)計(jì)量的相鄰幀差法等 [3]。

幀間差分法的優(yōu)點(diǎn)在于可以很好地適用于存在多個(gè)運(yùn)動 物體,或者當(dāng)攝像機(jī)移動的情況。但是該方法對噪音干擾的 魯棒性較差。

1.3 光流法

光流法(Optical Flow or Optic Flow)通過檢測圖像像素 點(diǎn)的強(qiáng)度隨時(shí)間的變化情況來推斷物體的移動速度及方向。 對于每個(gè)像素點(diǎn),每一個(gè)時(shí)刻均有一個(gè)二維或多維的向量集 合,如(x,y,t),表示指定坐標(biāo)在 t 點(diǎn)的瞬時(shí)速度。設(shè) I(x,y, t)為 t 時(shí)刻(x,y)點(diǎn)的強(qiáng)度,在很短的時(shí)間Δt 內(nèi),x,y 分別 增加Δx,Δy,則光流變化的情況如公式(1)所示:

視頻中目標(biāo)檢測與跟蹤算法綜述

1.4 統(tǒng)計(jì)法

統(tǒng)計(jì)法通過建立統(tǒng)計(jì)模型來區(qū)分前景和后景。在魏波 [4] 的文章中,場景的統(tǒng)計(jì),前景和后景的分布情況統(tǒng)計(jì)被作為基 礎(chǔ),建立了間斷點(diǎn)的分布模型,此模型被用來實(shí)現(xiàn)運(yùn)動目標(biāo) 的檢測。王長安,朱善安 [5] 在其論文中提出了改進(jìn)的 GVF- Snake 模型與統(tǒng)計(jì)模型融合的算法思想,實(shí)驗(yàn)表明,融合后的 方法結(jié)合了 GVF-Snake 與統(tǒng)計(jì)模型的各自優(yōu)點(diǎn),對靜態(tài)背景 的目標(biāo)檢測有很好的效果。各種文獻(xiàn)資料都表明,統(tǒng)計(jì)法適 合在復(fù)雜場景中檢測運(yùn)動對象,且算法的時(shí)間復(fù)雜度低,易 于硬件實(shí)現(xiàn),但由于檢測效果受先驗(yàn)知識的影響,統(tǒng)計(jì)法的 準(zhǔn)確度并不高。

1.5 小波法

數(shù)學(xué)界有一種公認(rèn)的提法,即小波分析是近代數(shù)學(xué)的一項(xiàng)重要成就,它已經(jīng)發(fā)展成為一個(gè)新的數(shù)學(xué)分支,是多學(xué)科結(jié)合的產(chǎn)物,包括泛函數(shù)值計(jì)算、Fourier變換等,是一種多尺度,多分辨的分析技術(shù),在信息融合、語音處理、信號處理、大氣模型、地震預(yù)測等諸多領(lǐng)域都有著廣泛的使用價(jià)值,在目標(biāo)檢測方面亦有廣闊的應(yīng)用。在李紅艷[6] 的文獻(xiàn)中, Haar 小波變換的低Signal-to-Noise微小目標(biāo)檢測方法被提出, 仿真實(shí)驗(yàn)結(jié)果表明,李紅艷提出的方法可以有效提高目標(biāo)的Signal-to-Noise。小波分析的優(yōu)勢在于檢測復(fù)雜場景下的微弱目標(biāo),但大規(guī)模成熟應(yīng)用的情況還比較少。

2 主流的目標(biāo)檢測方法性能比較

幾種典型目標(biāo)檢測方法的性能比較情況見表 1 所列 [7-10]。

視頻中目標(biāo)檢測與跟蹤算法綜述

3 主流的目標(biāo)跟蹤方法介紹

目標(biāo)跟蹤是機(jī)器視覺的關(guān)鍵功能步驟,在機(jī)器視覺的所有應(yīng)用領(lǐng)域,如視頻監(jiān)控,視頻壓縮,人機(jī)交互,醫(yī)學(xué)圖像處理等領(lǐng)域都是極具挑戰(zhàn)性的課題。目標(biāo)跟蹤除要在圖像序列中檢測出目標(biāo)外,還需要獲取目標(biāo)的位置、速度、運(yùn)動軌跡、加速度等運(yùn)動參數(shù),從而為下一步運(yùn)動目標(biāo)的行為識別與理解提供技術(shù)參數(shù)。經(jīng)過多年的發(fā)展,出現(xiàn)了許多目標(biāo)跟蹤的方法,這些方法都各自有其優(yōu)缺點(diǎn)。

3.1 基于特征匹配的跟蹤方法

運(yùn)動目標(biāo)總會有一些區(qū)別于其他事物的屬性,如幾何形狀, 外形輪廓,子空間特征等屬性,這些屬性具有可靠性,獨(dú)立性, 稀疏性和可區(qū)分性等特點(diǎn),可被用作目標(biāo)跟蹤的依據(jù)。特征點(diǎn)提取是該算法的關(guān)鍵,目前常用的特征點(diǎn)提取算法有SIFT算法,Kanade Lucas Tomasi(KLT)算法,Harris 算法及 SURF 算法等。

3.2 基于貝葉斯的跟蹤方法


在文獻(xiàn) [11] 中,二階 AR 模型被用來跟蹤目標(biāo)運(yùn)動,一 階 AR 模型被用來跟蹤目標(biāo)尺度變化,理論推導(dǎo)和仿真實(shí)驗(yàn)顯 示,一階、二階融合的方法取得了較好的跟蹤效果。在貝葉 斯跟蹤方法中,Kalman 濾波(KF)是最早被成熟應(yīng)用的方法, KF 具有準(zhǔn)確預(yù)測平穩(wěn)運(yùn)動目標(biāo)下一個(gè)時(shí)間點(diǎn)位置的特性,因 此在彈道目標(biāo)跟蹤中有成熟的產(chǎn)品應(yīng)用。但 KF 的缺陷是只能 處理線性高斯模型,雖然 KF 有各種改進(jìn)模型,但都不能處理 非高斯非線性模型。

3.3 基于動態(tài)輪廓的跟蹤方法

 動態(tài)輪廓跟蹤方法的主要原理是先勾勒出運(yùn)動目標(biāo)的輪 廓,由后續(xù)幀不斷更新輪廓進(jìn)而達(dá)到跟蹤的目的。文獻(xiàn) [12] 中, 視頻圖像中的汽車跟蹤就采用了動態(tài)輪廓跟蹤方法。該方法 其實(shí)是基于區(qū)域方法的一個(gè)變形,它比區(qū)域跟蹤更具體,更 高效,但對動態(tài)輪廓跟蹤方法初始值比較敏感,需要進(jìn)行人 機(jī)交互,很難實(shí)現(xiàn)自動跟蹤。

3.4 基于模型的跟蹤方法

模型跟蹤法的核心是建立的已知跟蹤目標(biāo)的精細(xì)三維模 型與待檢測圖像之間的匹配操作。其缺點(diǎn)是對模型過分依賴, 計(jì)算復(fù)雜,不利于實(shí)時(shí)處理。但基于模型的跟蹤方法便于實(shí) 現(xiàn)自動跟蹤,因此國內(nèi)外學(xué)者對 3D 模型的跟蹤方法和基于 深度估計(jì)的跟蹤方法做了大量研究工作。VIEWS 系統(tǒng)是英國 Reading 大學(xué)開發(fā)研制的一種基于 3D 模型的道路車輛識別與 跟蹤系統(tǒng)——VIE 系統(tǒng) [13],基于 VIEWS 的研究經(jīng)驗(yàn),中科 院自動化所模式識別實(shí)驗(yàn)室自行設(shè)計(jì)了擁有自主版權(quán)的交通監(jiān) 控原型 VStar,該系統(tǒng)在 PC 環(huán)境下運(yùn)行,用以對車輛進(jìn)行實(shí) 時(shí)跟蹤,并對各種干擾因素如光線變化,斑馬線干擾,邊界遮 擋等都顯示了較強(qiáng)的魯棒性。

4 主流的目標(biāo)跟蹤方法性能比較

幾種常見的目標(biāo)跟蹤方法的性能比較見表 2 所列 [14-16]。

視頻中目標(biāo)檢測與跟蹤算法綜述

5 結(jié) 語

就目標(biāo)檢測而言,其發(fā)展趨勢是尋找算法時(shí)間復(fù)雜度低、 算法魯棒性強(qiáng)、算法成熟度高和受先驗(yàn)知識影響小的算法。 就目標(biāo)跟蹤算法而言,尋找自動化程度高、先驗(yàn)知識依賴程度 低、計(jì)算復(fù)雜度低和應(yīng)用成熟度高的算法是今后的發(fā)展趨勢。






本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉