基于FPGA的相關(guān)測速系統(tǒng)
相關(guān)測速是以隨機(jī)過程的相關(guān)理論和信息理論為基礎(chǔ)發(fā)展起來的[1-2],它的應(yīng)用始于上世紀(jì)40年代,首先應(yīng)用于軍事上,然后逐漸轉(zhuǎn)移到科學(xué)研究和民用上,現(xiàn)在已經(jīng)在各個領(lǐng)域內(nèi)得到日益廣泛的應(yīng)用。
盡管相關(guān)測速的運(yùn)算量非常巨大,但是隨著EDA技術(shù)的高速發(fā)展,大規(guī)模可編程邏輯器件CPLD/FPGA的出現(xiàn),集成電路做得比以前更快、規(guī)模更大。設(shè)計(jì)人員有很大的自由度去設(shè)計(jì)實(shí)現(xiàn)用途專一的集成化數(shù)字電路:在實(shí)驗(yàn)室里,在電腦系統(tǒng)前,現(xiàn)場設(shè)計(jì)、現(xiàn)場編程、現(xiàn)場配置、現(xiàn)場修改和現(xiàn)場驗(yàn)證,從而在現(xiàn)場實(shí)現(xiàn)數(shù)字系統(tǒng)的單片化設(shè)計(jì)和應(yīng)用。這意味著無需更改電路,只要改寫FPGA內(nèi)部功能,整個系統(tǒng)即可實(shí)現(xiàn)新功能,即一個最小的芯片方案可以轉(zhuǎn)換來執(zhí)行多個功能,硬件的配置變得如同軟件一樣靈活方便,而其速度和集成度,也隨著VLS工藝的發(fā)展而迅速提高,這就為相關(guān)測速的實(shí)際應(yīng)用提供了硬件平臺。只要找到合適的算法并建立相應(yīng)的硬件處理系統(tǒng),運(yùn)算速度和精度就能達(dá)到預(yù)期的要求。
1 系統(tǒng)硬件及相關(guān)算法的確定
本文測速的原理是:以CCD攝像頭作為前端裝置,將CCD攝像頭所采集的圖像信息送到FPGA中,由FPGA對其進(jìn)行處理,并給出當(dāng)前運(yùn)行的速度。在滿足速度上限的條件下,連續(xù)兩次采集的圖像必然有重疊的部分。對連續(xù)兩次的圖像進(jìn)行相關(guān)處理,就可以得到它們之間的位置關(guān)系,再結(jié)合采樣間隔時間,從而可以得出速度。
由于圖像處理算法涉及的運(yùn)算量比較大,對系統(tǒng)的快速處理能力和大數(shù)據(jù)量的吞吐能力有嚴(yán)格的要求[3],因此系統(tǒng)中的核心器件FPGA的選擇必須遵循以下原則:(1)調(diào)試使用方便;(2)適當(dāng)?shù)捻憫?yīng)速度;(3)適當(dāng)夠用的邏輯資源;(4)足夠的輸入輸出(I/O)端口。
根據(jù)系統(tǒng)要求,本文采用Altera公司的超大規(guī)??删幊踢壿嬈骷﨏yclone II[4]。Cyclone II系列FPGA是繼Cyclone系列低成本FPGA在市場上取得成功之后,Altera公司推出的更低成本的FPGA。Altera采用相同的方法在盡可能小的裸片面積上構(gòu)建了Cyclone II系列,擴(kuò)展了低成本FPGA的密度,最多達(dá)68 416個邏輯單元(LE)和1.1 Mbit的嵌入式存儲器,從而可以在低成本的FPGA上實(shí)現(xiàn)復(fù)雜的數(shù)字系統(tǒng)。優(yōu)異的性價比使CycloneII系列FPGA可以廣泛地應(yīng)用于汽車電子、消費(fèi)電子、音/視頻處理、通信以及測試測量等終端產(chǎn)品市場。
在測速系統(tǒng)的設(shè)計(jì)中,假設(shè)攝像頭采集到的原始圖大小為1 280×1 024,為了保證采集的圖像背景區(qū)域能夠有明顯的目標(biāo),比較理想的情況是將模板區(qū)域取得越大越好,將目標(biāo)全部包括在內(nèi)[5-6]。當(dāng)搜索區(qū)域大小為m×m, 模板大小為n×n時,歸一化互相關(guān)算法所需的運(yùn)算次數(shù)約為(5n2+9)×(m-n+1)2次,計(jì)算量巨大。如果采用512×512大小的搜索區(qū)域,模板采用32×32大小,運(yùn)算乘加次數(shù)近12億次,硬件將無法提供足夠的乘加器。如果采用128×128的搜索區(qū)域和32×32的模板,圖像的檢索區(qū)域比較小,測速的范圍會比較低,精度也會下降。綜合考慮攝像頭采集圖像的范圍和精度,并且充分利用硬件所能提供的內(nèi)部存儲單元,本文將搜索區(qū)域設(shè)定為256×256,模板大小設(shè)定為32×32,如圖1所示。
2 測速系統(tǒng)的構(gòu)成及設(shè)計(jì)
根據(jù)所需的功能,將系統(tǒng)劃分為以下幾個模塊,分別加以實(shí)現(xiàn)。如圖2所示。
(1)CCD攝像頭數(shù)據(jù)采集模塊
攝像頭采集的數(shù)據(jù)需要有圖像幀和消隱幀。當(dāng)前幀是圖像幀時,讀入圖像的行數(shù)據(jù),讀入1 280×1 024個數(shù)據(jù)后,列計(jì)數(shù)X_Cont和行計(jì)數(shù)Y_Cont歸零。消隱幀時不輸出。
(2)Raw to RGB壓縮模塊
通過內(nèi)部設(shè)置一個1 280×10 bit的FIFO,同時輸出兩行數(shù)據(jù),通過輸入的行計(jì)數(shù)和列計(jì)數(shù)模塊的奇偶將原Byer格式的數(shù)據(jù)壓縮成RGB格式,4個點(diǎn)壓縮成一個點(diǎn),圖像大小變成640×512。同時,通過內(nèi)置的時鐘計(jì)數(shù)模塊將當(dāng)前輸出的RGB所在的行列值輸出,范圍為640×512。
(3)處理流程1
M4K寫入控制器:CCD時鐘。通過當(dāng)前輸入的行列坐標(biāo),確定觸發(fā)背景M4K內(nèi)存模塊和模板M4K內(nèi)存模塊的寫入使能。背景M4K大小設(shè)為256×256×4 bit,模板M4K大小設(shè)為32×32×4 bit。當(dāng)該模塊工作時,相關(guān)模塊不工作,以防止未寫完數(shù)據(jù)就做相關(guān)處理。
M4K模塊:存放處理過的4 bit灰度數(shù)據(jù),讀寫時鐘分開,有寫使能位。
(4)處理流程2
SdRam接口:提供兩個寫端口和兩個讀端口,可同時處理。內(nèi)部連接了PLL倍頻器,將SDRam的處理速度倍增到100 MB,然后通過內(nèi)部的讀寫和刷新狀態(tài)機(jī)控制讀寫。
VGA控制模塊:由I2C控制生成行同步信息,并將讀入的RGB數(shù)據(jù)通過系數(shù)處理送到解碼器輸出VGA圖像。
測速模塊:模板選擇的位置固定在圖像的正中,即第192行192列開始的32×32大小的數(shù)據(jù),通過輸入的(X,Y)坐標(biāo)和(192,192)的差值得到像素的偏移量。然后通過實(shí)際的圖像大小和距離的比例系數(shù),乘以當(dāng)前的處理頻率,得到當(dāng)前的物體移動速度。
為了計(jì)算偏移量和相對位移,必須引入除法運(yùn)算,而除法運(yùn)算是通過許多移位寄存器和加法器構(gòu)成的。運(yùn)算極其耗時,且需要大量邏輯單元和查找表,對處理速度有很大影響。所以選取MegaWizard生成的除法器來減少所需的運(yùn)算時間。
最后,由于實(shí)際的數(shù)據(jù)均為16進(jìn)制,為了滿足顯示的10進(jìn)制坐標(biāo)換算的需要,設(shè)計(jì)了16進(jìn)制到10進(jìn)制LED顯示的轉(zhuǎn)換模塊,實(shí)現(xiàn)了速度的直觀顯示,如圖3所示。
綜上所述,通過模塊化設(shè)計(jì)和綜合設(shè)計(jì),在FPGA上實(shí)現(xiàn)了測速需要的功能設(shè)計(jì)。
本文對攝像頭采集到的數(shù)據(jù)進(jìn)行處理。選取圖像正中的256×256個像素位置作為背景區(qū)域,其中的32×32個像素作為模板選取區(qū)域,通過前后兩幀的相關(guān)得到模板在后一幀中的位移像素值。測速示意圖如圖4所示。
如果按照理想的相似三角形判斷,攝像頭可以測量的速度可以達(dá)到無限大。設(shè)背景區(qū)域長寬均為X cm,最大速度可以達(dá)到(X×(256-32)/256)/0.529 4=1.9×0.875X cm/s,測量精度為(X/256)/0.529 4=1.9×X/256。但是由于攝像頭對光強(qiáng)的敏感程度和目標(biāo)的實(shí)際采樣灰度受噪聲的影響,以及受安裝位置和與被測物體距離的限制,實(shí)際測量速度范圍是有限的。在測試中采用的背景大小為20 cm×20 cm,離檢測面距離30 cm左右,100 MHz工作頻率,測速的最大值可達(dá)到(20×(256-32)/256)/0.529 4=33.056 cm/s。
整個測速系統(tǒng)可以根據(jù)實(shí)際應(yīng)用情況設(shè)定參數(shù)來調(diào)整搜索區(qū)域,具有很寬的測速范圍。相對于傳統(tǒng)的接觸式測速系統(tǒng),克服了物體運(yùn)動異常時測量出現(xiàn)的原理性誤差;相對于非接觸的一維測速系統(tǒng),克服了測速的單一性,可以測量物體在各種運(yùn)動方向上移動的速度。如果使用高性能FPGA進(jìn)行多路并行的相關(guān)運(yùn)算,搭配高速高分辨率的攝像頭,完全可以解決全圖互相關(guān)算法處理的計(jì)算量巨大的問題,使測速的精度和速度得到進(jìn)一步提高。這種測速方式具有的一系列優(yōu)點(diǎn),使其發(fā)展空間非常廣闊,可以廣泛應(yīng)用到各個領(lǐng)域。
總之,本文研究的基于FPGA的相關(guān)測速系統(tǒng),能夠?qū)崿F(xiàn)非接觸式和高精度的測量。其中,融合了信號采集與處理、邏輯器件FPGA和互相關(guān)技術(shù)等,具有學(xué)科交叉融合的特點(diǎn)。在各種傳送帶、紙板、熱軋鋼板、汽車和列車等運(yùn)動物體的非接觸測速上具有較大的實(shí)際應(yīng)用價值,為解決非接觸式運(yùn)動物體測速問題提供了技術(shù)手段。