智能編解碼器技術是DMVAx處理器嵌入式分析功能的內在組成部分,在分析應用中可提高編解碼器效率。例如,智能編解碼器技術可以同面部檢測共同運用,分配更多的位元給影像外觀,從而可為需要檢測的區(qū)域實現(xiàn)更高的分辨率。嵌入式分析在監(jiān)控領域的應用十分廣泛。
監(jiān)控系統(tǒng)整合嵌入式分析技術也有一段時間了。最初,是將分析功能連同數(shù)據(jù)壓縮/解壓縮算法一起部署,用于優(yōu)化與安全系統(tǒng)有關的通信帶寬。這引起了更加深入的嵌入式分析應用,尤其是將視覺相關分析功能用于物業(yè)與基礎設施以及交通狀況等的自動實時監(jiān)控應用。此外,大量離線視頻分析的實施還一直用于取證目的。大量的應用說明嵌入式分析系統(tǒng)在安防監(jiān)控中占有劇組輕重的位置。
嵌入式分析在監(jiān)控領域的應用
除了視覺分析,聲音處理技術也正在將嵌入式音頻分析功能帶給安全應用。攻擊、爆炸、警報器、碰撞、闖入以及其它有麻煩的聲音都會觸發(fā)告警。此外,安全監(jiān)控系統(tǒng)還實施多個麥克風或聲音傳感器來分析和判斷具體聲源所在的位置或聲源方向。除了在安全應用中實施純視覺或純聲音分析以外,在某些系統(tǒng)中,嵌入式分析還在某些系統(tǒng)中將兩種傳感技術結合在一起。
在聲音輔助視頻分析(SAVA)中,音頻分析檢查待查環(huán)境的聲音場景并提供視頻不容易發(fā)現(xiàn)的更多相關活動信息。系統(tǒng)先檢測到玻璃破碎的聲音,經(jīng)嵌入式分析后,安全監(jiān)控攝像機可能重新指向聲音發(fā)出的區(qū)域?;蛘咔秩肼曇艨赡軙岣咛囟〝z像機的分辨率獲得更加清晰的影像。此外,聲音識別還可幫助判斷大量錄制安全監(jiān)控視頻的相關性。聲音識別甚至可在潛在安全風險部分遮擋或隱藏的情況下,或在其出現(xiàn)在攝像機視野前發(fā)出警告。發(fā)揮視頻與音頻的互補作用,能夠提供一種強大的框架,實現(xiàn)可增強告警檢測率的高系統(tǒng)可靠性。
需要嵌入式分析功能的安全系統(tǒng)可充分利用C6000TMDSP、達芬奇TM視頻處理器以及其它片上系統(tǒng)(SoC)器件提供的眾多功能。這些可編程器件除了低功耗與強大的處理功能外,還可針對高帶寬數(shù)據(jù)傳輸進行架構設計。專門用于嵌入式分析的綜合工具環(huán)境可縮短開發(fā)周期,加速產(chǎn)品上市進程。
達芬奇DMVAx視頻處理器可針對嵌入式分析安全應用提供各種功能。其中部分功能包括集成型視頻分析加速、業(yè)界首款視覺協(xié)處理器、影像協(xié)處理器,以及支持面部檢測、視頻穩(wěn)定、噪聲過濾以及其它功能的完整視頻處理子系統(tǒng)。TIDMVAx處理器建立在ARM9TM內核基礎之上,提供TISmartAnalytics支持,其中包含五種基本嵌入式分析功能:攝像機篡改檢測、智能動作檢測、觸發(fā)區(qū)(可檢測分析從一個區(qū)域運動到另一個區(qū)域的對象)、對象計數(shù),以及可逐幀跟蹤并標識對象的數(shù)據(jù)流元數(shù)據(jù)。
分辨率與畫質促進整體飛躍
如今,在電視信號、視頻會議、數(shù)字錄像機等各個跟視頻相關的產(chǎn)品均已經(jīng)進入百萬像素的高清時代,大家都希望看到視頻監(jiān)控的圖像質量也能與時俱進。科達推出的百萬像素的網(wǎng)絡攝像機,分辨率達到了720p(1280×720)和1080p(1920×1080),配合科達的高清NVR和監(jiān)控管理平臺,可實現(xiàn)高清晰度、高可靠性、高性價比的視頻監(jiān)控解決方案。
高清晰能否實現(xiàn)清晰度質的飛躍以及后續(xù)市場效用?
1、百萬像素的分辨率,視頻圖像清晰度質的飛躍
模擬攝像機輸出的是復合視頻信號,受到N/P制規(guī)范的約束,經(jīng)過視頻采樣后PAL制下最大分辨率為720×576,NTSC制下最大分辨率為720×480。也就是說模擬視頻圖像經(jīng)過編碼后的最高像素僅僅在40萬左右。
而網(wǎng)絡攝像機的分辨率可以達到720p或1080p甚至更高。與模擬攝像機相比,高清網(wǎng)絡攝像機的清晰度有大幅的提升,能夠覆蓋更廣的區(qū)域,提供更清晰的細節(jié)??七_720p的網(wǎng)絡攝像機視頻分辨率為1280×720,是標清攝像機(D1分辨率)的2.5倍,科達1080p網(wǎng)絡攝像機視頻分辨率為1920×1080,是標清攝像機(D1分辨率)的5倍。相對于模擬監(jiān)控圖像,高清視頻分辨率更高,攜帶的圖像信息更加細膩與真實,采用16:9的寬屏風格,監(jiān)控視野更加開闊。
2、高清晰度的畫面質量,為智能圖像分析提供廣闊市場
在視頻監(jiān)控系統(tǒng)中加入智能分析的手段,使人眼和人腦得到解放,一直是視頻監(jiān)控發(fā)展的趨勢之一。近幾年,幾乎所有的視頻監(jiān)控廠家都推出了智能監(jiān)控產(chǎn)品,但智能產(chǎn)品從未在視頻監(jiān)控領域大規(guī)模應用過。以“人臉識別”為例,眾所周知,通常監(jiān)控拍攝的角度是俯視的,人離攝像機比較近時,很難拍攝到人的正面,而人離攝像機較遠時,因為模擬攝像機的清晰度不高,往往拍到了人臉,卻無法辨認人臉的細節(jié)特征。追根究底,還是因為模擬攝像機的分辨率過低,很難達到智能分析的要求。
3、逐行掃描技術,在拍攝高速運動的物體時更有優(yōu)勢
由于模擬視頻圖像是由兩個隔行掃描的場信號構成,這意味著我們看到的圖像的每一幀都是由兩個采集時間不同的“半幅”圖像合并而成的。當物體的運動速度較快時,由于采集時間不同步,導致兩個半幅圖像不能準確合并,會出現(xiàn)重影或者鋸齒現(xiàn)象。而高清的網(wǎng)絡攝像機采用的是逐行掃描的技術,對一幅完整的畫面進行一次性的掃描,有效的解決了重影或鋸齒問題。
4、全數(shù)字化的視頻圖像處理,畫面細膩無雜色
模擬攝像機的基本工作原理為(以CCD模擬攝像機為例):被攝物體的光線從鏡頭進入攝像機后被投射到圖像傳感器上,通過傳感器進行光電轉換后送入A/D變換器,轉換成數(shù)字信號,送入圖像處理器進行各種放大、校正等處理,再經(jīng)D/A變換后,轉換成模擬電視信號進行傳輸,送入存儲設備后,再轉換為數(shù)字信號進行存儲。
多次模/數(shù)和數(shù)/模轉換,對原始圖像信息有較大損傷,部分真實的信息遺失,而雜訊增加,影響圖像的清晰度。科達高清網(wǎng)絡攝像機采用數(shù)字解決方案,最大程度保留了原始圖像信息。由于實時視頻與錄像均采用同樣的視頻處理方式,錄像與實時視頻同樣清晰。此外全數(shù)字化的視頻解決方案,也大大降低了視頻處理的復雜程度。
此外,模擬攝像機傳輸視頻圖像時亮度信號和色度信號是混合傳輸?shù)?,在模轉數(shù)之前還需要進行亮色分離,在亮色分離做得不夠完全時,我們看到的圖像就會有雜色出現(xiàn)。