視頻中目標檢測與跟蹤算法綜述

時間：2021-10-06 13:04:19

關(guān)鍵字：視頻信息目標檢測目標跟蹤行為識別行為分析

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]摘要：視頻中的目標檢測與跟蹤是視頻行為分析與行為識別的技術(shù)基礎，該論文介紹了近10年來主流目標檢測技術(shù)和目標跟蹤技術(shù)的主要成果，對比了主流目標跟蹤和目標檢測技術(shù)的性能，并介紹了這兩項技術(shù)的未來發(fā)展方向。

引言

在視頻中人或運動物體行為理解的整個流程中，運動目標的檢測與跟蹤非常關(guān)鍵。通常一個視頻監(jiān)控系統(tǒng)大體可分解為四個不同的功能單元，即目標檢測，搜索系統(tǒng)感興趣的目標區(qū)域；目標跟蹤，捕獲感興趣區(qū)域的運動軌跡；目標分類，將被跟蹤目標分為人，汽車或其他移動物體；目標行為識別，對跟蹤目標進行行為識別。目標檢測作為視頻監(jiān)控的前提，屬于低層次的視覺問題，目前己有多種較為成熟的算法。而目標跟蹤作為視頻監(jiān)控最基本的功能屬于中等層次的視覺問題，是當前制約視頻監(jiān)控系統(tǒng)性能的主要瓶頸之一。

1 主流的目標檢測方法介紹

1.1 背景分割法

背景分割法適用于運動場景固定且比較簡單的場合，通過建立背景模型，用圖像序列的特征參數(shù)與背景模型比較，分割出背景和前景，從而得到運動對象。背景差分圖像的主要原理是通過現(xiàn)有圖像對比已知背景圖像，且背景圖像中不含任何感興趣的對象，是背景模型 [1]。該對比過程被稱為前景檢測。該過程將觀測圖像分為兩個互補的像素集合，可覆蓋全部圖像，包括感興趣的運動對象及前景與前景的補集，即背景。

背景減除法最大的缺陷是，沒有成熟和高性能的規(guī)則來定義前景區(qū)域和對象，因此其使用范圍受限。有許多背景減除算法是針對特定需求提出來的，因此對模型和分割策略也提出了特殊要求。如文獻 [2]，它必須適用于平緩或快速的光照變化，場景運動變化，復雜的背景或背景變化。由于部分場合要求由硬件承擔背景減除功能，因此算法負載成為最基本的要求。對于戶外視頻監(jiān)控系統(tǒng)而言，算法對噪聲的魯棒性以及算法對光照變化的適應能力是最基本的要求。

1.2 相鄰幀間差分法

該方法選擇相鄰的兩幀進行比對，選擇參數(shù)可以是直方圖，也可以是亮度或其他圖像的特征參數(shù)，兩個相鄰的圖像幀進行減法運算，結(jié)果的矩陣值與預設的閾值進行比較，通過差的絕對值與閾值大小來判斷是否有運動。在這個原理的框架下有更多的改進算法被提出，比如基于亮度假設檢驗和高階統(tǒng)計量的相鄰幀差法等 [3]。

幀間差分法的優(yōu)點在于可以很好地適用于存在多個運動物體，或者當攝像機移動的情況。但是該方法對噪音干擾的魯棒性較差。

1.3 光流法

光流法（Optical Flow or Optic Flow）通過檢測圖像像素點的強度隨時間的變化情況來推斷物體的移動速度及方向。對于每個像素點，每一個時刻均有一個二維或多維的向量集合，如（x，y，t），表示指定坐標在 t 點的瞬時速度。設 I（x，y， t）為 t 時刻（x，y）點的強度，在很短的時間Δt 內(nèi)，x，y 分別增加Δx，Δy，則光流變化的情況如公式（1）所示：

視頻中目標檢測與跟蹤算法綜述

1.4 統(tǒng)計法

統(tǒng)計法通過建立統(tǒng)計模型來區(qū)分前景和后景。在魏波 [4] 的文章中，場景的統(tǒng)計，前景和后景的分布情況統(tǒng)計被作為基礎，建立了間斷點的分布模型，此模型被用來實現(xiàn)運動目標的檢測。王長安，朱善安 [5] 在其論文中提出了改進的 GVF- Snake 模型與統(tǒng)計模型融合的算法思想，實驗表明，融合后的方法結(jié)合了 GVF-Snake 與統(tǒng)計模型的各自優(yōu)點，對靜態(tài)背景的目標檢測有很好的效果。各種文獻資料都表明，統(tǒng)計法適合在復雜場景中檢測運動對象，且算法的時間復雜度低，易于硬件實現(xiàn)，但由于檢測效果受先驗知識的影響，統(tǒng)計法的準確度并不高。

1.5 小波法

數(shù)學界有一種公認的提法，即小波分析是近代數(shù)學的一項重要成就，它已經(jīng)發(fā)展成為一個新的數(shù)學分支，是多學科結(jié)合的產(chǎn)物，包括泛函數(shù)值計算、Fourier變換等，是一種多尺度，多分辨的分析技術(shù)，在信息融合、語音處理、信號處理、大氣模型、地震預測等諸多領(lǐng)域都有著廣泛的使用價值，在目標檢測方面亦有廣闊的應用。在李紅艷[6] 的文獻中， Haar 小波變換的低Signal-to-Noise微小目標檢測方法被提出，仿真實驗結(jié)果表明，李紅艷提出的方法可以有效提高目標的Signal-to-Noise。小波分析的優(yōu)勢在于檢測復雜場景下的微弱目標，但大規(guī)模成熟應用的情況還比較少。

2 主流的目標檢測方法性能比較

幾種典型目標檢測方法的性能比較情況見表 1 所列 [7-10]。

視頻中目標檢測與跟蹤算法綜述

3 主流的目標跟蹤方法介紹

目標跟蹤是機器視覺的關(guān)鍵功能步驟，在機器視覺的所有應用領(lǐng)域，如視頻監(jiān)控，視頻壓縮，人機交互，醫(yī)學圖像處理等領(lǐng)域都是極具挑戰(zhàn)性的課題。目標跟蹤除要在圖像序列中檢測出目標外，還需要獲取目標的位置、速度、運動軌跡、加速度等運動參數(shù)，從而為下一步運動目標的行為識別與理解提供技術(shù)參數(shù)。經(jīng)過多年的發(fā)展，出現(xiàn)了許多目標跟蹤的方法，這些方法都各自有其優(yōu)缺點。

3.1 基于特征匹配的跟蹤方法

運動目標總會有一些區(qū)別于其他事物的屬性，如幾何形狀，外形輪廓，子空間特征等屬性，這些屬性具有可靠性，獨立性，稀疏性和可區(qū)分性等特點，可被用作目標跟蹤的依據(jù)。特征點提取是該算法的關(guān)鍵，目前常用的特征點提取算法有SIFT算法，Kanade Lucas Tomasi（KLT）算法，Harris 算法及 SURF 算法等。

3.2 基于貝葉斯的跟蹤方法

在文獻 [11] 中，二階 AR 模型被用來跟蹤目標運動，一階 AR 模型被用來跟蹤目標尺度變化，理論推導和仿真實驗顯示，一階、二階融合的方法取得了較好的跟蹤效果。在貝葉斯跟蹤方法中，Kalman 濾波（KF）是最早被成熟應用的方法， KF 具有準確預測平穩(wěn)運動目標下一個時間點位置的特性，因此在彈道目標跟蹤中有成熟的產(chǎn)品應用。但 KF 的缺陷是只能處理線性高斯模型，雖然 KF 有各種改進模型，但都不能處理非高斯非線性模型。

3.3 基于動態(tài)輪廓的跟蹤方法

動態(tài)輪廓跟蹤方法的主要原理是先勾勒出運動目標的輪廓，由后續(xù)幀不斷更新輪廓進而達到跟蹤的目的。文獻 [12] 中，視頻圖像中的汽車跟蹤就采用了動態(tài)輪廓跟蹤方法。該方法其實是基于區(qū)域方法的一個變形，它比區(qū)域跟蹤更具體，更高效，但對動態(tài)輪廓跟蹤方法初始值比較敏感，需要進行人機交互，很難實現(xiàn)自動跟蹤。

3.4 基于模型的跟蹤方法

模型跟蹤法的核心是建立的已知跟蹤目標的精細三維模型與待檢測圖像之間的匹配操作。其缺點是對模型過分依賴，計算復雜，不利于實時處理。但基于模型的跟蹤方法便于實現(xiàn)自動跟蹤，因此國內(nèi)外學者對 3D 模型的跟蹤方法和基于深度估計的跟蹤方法做了大量研究工作。VIEWS 系統(tǒng)是英國 Reading 大學開發(fā)研制的一種基于 3D 模型的道路車輛識別與跟蹤系統(tǒng)——VIE 系統(tǒng) [13]，基于 VIEWS 的研究經(jīng)驗，中科院自動化所模式識別實驗室自行設計了擁有自主版權(quán)的交通監(jiān) 控原型 VStar，該系統(tǒng)在 PC 環(huán)境下運行，用以對車輛進行實時跟蹤，并對各種干擾因素如光線變化，斑馬線干擾，邊界遮擋等都顯示了較強的魯棒性。

4 主流的目標跟蹤方法性能比較

幾種常見的目標跟蹤方法的性能比較見表 2 所列 [14-16]。

視頻中目標檢測與跟蹤算法綜述

5 結(jié) 語

就目標檢測而言，其發(fā)展趨勢是尋找算法時間復雜度低、算法魯棒性強、算法成熟度高和受先驗知識影響小的算法。就目標跟蹤算法而言，尋找自動化程度高、先驗知識依賴程度低、計算復雜度低和應用成熟度高的算法是今后的發(fā)展趨勢。