一種基于頻域分析的圖像測(cè)距算法
引言
視覺是人類觀察世界、認(rèn)知世界的重要功能手段,人類感知外部世界主要通過視覺、觸覺、聽覺和嗅覺等感覺器官,其中80%的信息是由視覺獲取的。計(jì)算機(jī)視覺就是人類利用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能,從而對(duì)客觀世界三維場景進(jìn)行感知、識(shí)別和理解。計(jì)算機(jī)視覺是一個(gè)相當(dāng)新而且發(fā)展迅速的研究領(lǐng)域。
在對(duì)生物視覺系統(tǒng)的研究中,人們?cè)缇妥⒁獾?,幾乎所有具有視覺功能的生物都有兩只眼睛。用兩只眼睛同時(shí)觀察物體,會(huì)有深度或遠(yuǎn)近的感覺,我們稱之為視差。因此,在計(jì)算機(jī)視覺系統(tǒng)中,也常用兩臺(tái)或多臺(tái)攝像機(jī)從兩個(gè)或多個(gè)視點(diǎn)去觀察同一場景,從而獲得在不同視角下的一組圖像,然后通過同一場景點(diǎn)在不同圖像中的視差,推斷出場景中目標(biāo)物體的空間幾何形狀和位置,這種方法稱為立體視覺。它是計(jì)算機(jī)視覺的一個(gè)重要分支,也是計(jì)算機(jī)視覺的核心研究內(nèi)容之一。
視頻和圖像是對(duì)物質(zhì)世界客觀事物的形象而生動(dòng)的描述,是最直接且具體的信息表達(dá)形式之一,是人類最重要的信息載體。隨著科技的日益發(fā)展,人們需要一種更加先進(jìn)快捷的工作方式,另外,人們對(duì)工作環(huán)境和工作條件也提出了更新、更高的要求,視頻測(cè)距系統(tǒng)便在這種背景下應(yīng)運(yùn)而生。
視覺測(cè)距技術(shù)的發(fā)展對(duì)于距離測(cè)量有重要的意義。在基于數(shù)字圖像處理技術(shù)的視覺測(cè)距系統(tǒng)中,使用單個(gè)CCD(ChargeCoupleDevice)攝像機(jī)的系統(tǒng)稱為單目攝像系統(tǒng),而同時(shí)使用兩臺(tái)攝像機(jī)對(duì)同一景物進(jìn)行攝像,并運(yùn)用計(jì)算機(jī)分析兩幅圖像來確定物體的三維狀況的系統(tǒng)稱為雙目攝像系統(tǒng)。雙目攝像系統(tǒng)測(cè)量精度高,但計(jì)算速度較慢,成本較高。而單目攝像系統(tǒng)方法則比較簡潔、快速,因此,本文對(duì)采用單目攝像系統(tǒng)檢測(cè)目標(biāo)物的測(cè)距方法進(jìn)行研究。
1測(cè)距技術(shù)在國內(nèi)外的研究現(xiàn)狀
目前,國內(nèi)外對(duì)視覺測(cè)距技術(shù)的研究仍在不斷的進(jìn)行之中,還并沒有形成國際統(tǒng)一的標(biāo)準(zhǔn)模式,各種數(shù)字圖像處理技術(shù)和算法之間孰優(yōu)孰劣仍在不斷的探討和比較中。當(dāng)前,國內(nèi)外的研究機(jī)構(gòu)主要研究的測(cè)距技術(shù)包括超聲波測(cè)距技術(shù)、微波雷達(dá)測(cè)距技術(shù)、激光雷達(dá)測(cè)距技術(shù)和視覺測(cè)距技術(shù)。
1.1激光雷達(dá)測(cè)距
激光雷達(dá)測(cè)距具有測(cè)量時(shí)間短、量程長、精度高等特點(diǎn),但激光雷達(dá)在惡劣天氣環(huán)境下或逆光狀態(tài)下的測(cè)距準(zhǔn)確性降低,另外,其造價(jià)、耗能、對(duì)人眼安全等因素也對(duì)其進(jìn)一步應(yīng)用有一定影響。
1.2超聲波測(cè)距
超聲波是指振動(dòng)頻率在20kHz以上的機(jī)械波,具有聲波傳輸?shù)幕疚锢硖匦?。超聲波測(cè)距是根據(jù)超聲波反射時(shí)間來計(jì)算與前方車輛之間的距離。超聲波測(cè)距原理比較簡單,成本低,但超聲波的傳輸速度受天氣影響較大,不同天氣條件下的傳輸速度不同。
1.3微波雷達(dá)測(cè)距
微波雷達(dá)采用調(diào)頻連續(xù)波雷達(dá)體制,微波雷達(dá)探測(cè)的性能比較穩(wěn)定,不易受檢測(cè)物表面形狀和顏色的影響,也不易受天氣影響,可以在惡劣的天氣狀況下獲得距離信息。微波雷達(dá)測(cè)距主要是利用目標(biāo)對(duì)電磁波的反射來發(fā)現(xiàn)目標(biāo)并測(cè)定其位置。雷達(dá)系統(tǒng)的缺點(diǎn)是空間覆蓋面有限,彼此之間可能產(chǎn)生電磁干擾。
1.4視覺測(cè)距技術(shù)
視覺測(cè)距通常采用CCD攝像機(jī)來模擬人眼的光電探測(cè)原理,以實(shí)現(xiàn)對(duì)外界環(huán)境信號(hào)的采集。捕獲的圖像被視為一個(gè)二維陣列,像素是其中的元素,其值即為灰度值或稱亮度值,總體的灰度就形成視覺圖像。獲得數(shù)字圖像后,運(yùn)用數(shù)字圖像處理技術(shù)對(duì)圖像進(jìn)行處理,再從圖像數(shù)據(jù)出發(fā),結(jié)合利用系統(tǒng)模型進(jìn)行計(jì)算,即可完成對(duì)外界環(huán)境的檢測(cè)。
2攝像機(jī)的工作原理
數(shù)字圖像是計(jì)算機(jī)視覺的出發(fā)點(diǎn),而攝像機(jī)是最常用的圖像獲取裝置,它應(yīng)用對(duì)象廣泛,具有使用方便、靈敏度高、輸入速度快等特點(diǎn)。攝像機(jī)通常由攝像鏡頭、攝像器件、電源、放大電路、偏轉(zhuǎn)電路、同步信號(hào)發(fā)生電路等部分組成。
按照攝像器件的組成,可將攝像機(jī)分為很多種。目前計(jì)算機(jī)視覺系統(tǒng)中常用的是電荷耦合元件(ChargeCoupledDevice)攝像機(jī),簡稱CCD攝像機(jī)。其工作原理是在硅單晶片上生成一層很薄的二氧化硅,再于其上蒸發(fā)一層間距很小的鋁電極條。加電壓于電極上后,電場穿透二氧化硅薄層,并排斥硅中多數(shù)載流子,從而在電極下的硅單晶片上形成電荷耗盡層,又稱勢(shì)阱。當(dāng)硅改變電極電壓,使勢(shì)阱內(nèi)的電荷從一個(gè)電極傳送到另一個(gè)電極時(shí),取出移動(dòng)的電荷就會(huì)形成輸出信號(hào)。掃描系統(tǒng)順序掃描各像素,并在一個(gè)掃描周期內(nèi),用較長的時(shí)間感光、積累電荷,用極短的時(shí)間讀取圖像信號(hào)。由于圖像各處的光亮不同,耗盡層內(nèi)“捕捉”的電荷量存在差異,這就完成了圖像的光電轉(zhuǎn)換。
圖1所示是攝像機(jī)工作原理圖。事實(shí)上,景深原理在攝
像上有著極其重要的作用。正確理解和運(yùn)用景深,有助于拍出滿意的畫面。光圈、焦距和物距是決定景深的主要因素。
變焦距鏡頭具有在一定范圍內(nèi)連續(xù)改變焦距而成像面位置不變的性能,現(xiàn)在已成為家用攝像機(jī)上運(yùn)用最廣泛的鏡頭。
自動(dòng)聚集裝置有四種工作方式,即紅外線方式、超聲波方式、海耐烏艾方式和佳能SST方式。它們都有較高的測(cè)量精度,分別被應(yīng)用在不同類型的攝像機(jī)之中。
攝像機(jī)是一種把景物光像轉(zhuǎn)變?yōu)殡娦盘?hào)的裝置。其結(jié)構(gòu)大致可分為三部分:光學(xué)系統(tǒng)(主要指鏡頭)、光電轉(zhuǎn)換系統(tǒng)(主要指攝像管或固體攝像器件)以及電路系統(tǒng)(主要指視頻處理電路)。
攝像機(jī)光學(xué)系統(tǒng)的主要部件是光學(xué)鏡頭,它由透鏡系統(tǒng)組合而成。這個(gè)透鏡系統(tǒng)包含著許多片凸凹不同的透鏡,其中凸透鏡的中央比邊緣厚,因而經(jīng)透鏡邊緣部分的光線比中央部分的光線會(huì)發(fā)生更多的折射。當(dāng)被攝對(duì)象經(jīng)過光學(xué)系統(tǒng)透鏡折射后,就可在光電轉(zhuǎn)換系統(tǒng)的攝像管或固體攝像器件的成像面上形成焦點(diǎn)。光電轉(zhuǎn)換系統(tǒng)中的光敏元件會(huì)把焦點(diǎn)外的光學(xué)圖像轉(zhuǎn)變成攜帶電荷的電信號(hào)。這些電信號(hào)的作用是微弱的,必須經(jīng)過電路系統(tǒng)進(jìn)一步放大,以形成符合特定技術(shù)要求的信號(hào),并從攝像機(jī)中輸出。
3聚焦測(cè)距分析
3.1光學(xué)原理
基于前面介紹的測(cè)距方法很多,由于受單鏡頭和無參考的約束,這里選擇聚焦測(cè)量法。其原理如圖2所示。
圖中,P為目標(biāo)物,P。為物像,"0為物距,V。為像距,/為焦距。這樣,根據(jù)成像原理,則有:
丄=丄+丄fuVo
(1)
顯然,只要知道V。和f,距離u就可以計(jì)算出來。
3.2視頻原理
當(dāng)自動(dòng)調(diào)整焦距時(shí),就可以利用自動(dòng)測(cè)量所形成的視頻圖像的最佳清晰度瞬間來確定最佳焦距f,然后通過公式(1)計(jì)算出距離"。。設(shè)圖像空域函數(shù)為fx,y),當(dāng)鏡頭聚焦時(shí),圖像紋理最清晰的高頻成分越豐富;散焦時(shí)圖像模糊平坦,f(xy)的交流成分很少,尤其是高頻成分。所以,可采用離散余弦變換DCT(DescriteCosineTransform)算法將f(x,y)轉(zhuǎn)換成頻域FQ,j):
/[(2x+1)]ri[(2x+1)]rj
F(i,j)=//f(x,y)cos5-^—cos5!\AGj\
式中,x,y是圖像水平、垂直坐標(biāo);是圖像畫面正中nXn正方形圖塊參與的運(yùn)算,x的最大值是n-1,y的最大值是n-1;i,j是頻域矩陣數(shù)據(jù)編號(hào),其中i是行序,是列序,i=。,1,…,n-1,j=0,1,…,n-1。|AC,j|是nXn的矩陣函數(shù),是DCT運(yùn)算結(jié)果。當(dāng)i=0,j=0時(shí),ACj=ACoo是直流分量;當(dāng)i豐0,豐0時(shí),ACj是交流系數(shù)。于是,其交流部分的能譜關(guān)系函數(shù)為:
kk
P(f)=//ACiji+0,j+0,kGn/2(3)
i=0j=0
式中,f是焦距變量參數(shù),當(dāng)連續(xù)改變f時(shí),按公式⑶即可得到圖3所示的視頻能譜與焦距的關(guān)系曲線。
圖3視頻能譜與焦距關(guān)系曲線
從圖3可以看出,當(dāng)f=f最佳聚焦時(shí),能譜最高。當(dāng)f手f時(shí),其能譜向兩邊偏離f逐漸散焦,P(f)也逐漸變小。圖3曲線反映的是聚焦到散焦的變化規(guī)律,它的陡度取決于鏡頭的景深。景深越小,曲線變化越快,峰值越明顯;景深越大,曲線就越趨向平坦(如圖中紅線所示)。視場角越小,圖像紋理也越清晰,Pmf值越大,同時(shí)曲線也會(huì)更陡峭。曲線越陡峭,峰值f越易找準(zhǔn),測(cè)距越精確。
求出圖像最清晰時(shí)的焦距值f代入公式(1),即可求出目標(biāo)物的距離。
4結(jié)語
本文提出了一種新的視頻圖像測(cè)距方法,即在頻域?qū)π盘?hào)進(jìn)行分析,并完成目標(biāo)物距離的測(cè)量。該算法在單鏡頭下就能實(shí)現(xiàn)。通過聚焦原理的分析可見,該方法計(jì)算速度快,并可降低對(duì)硬件的要求,同時(shí)又能使產(chǎn)品小型化。
20210917_6144175705703__一種基于頻域分析的圖像測(cè)距算法