IEEE1394視頻視覺(jué)系統(tǒng)中DSP軟硬件設(shè)計(jì)

時(shí)間：2012-12-11 05:36:21

關(guān)鍵字： DSP 視覺(jué)系統(tǒng) 軟硬件設(shè)計(jì) IEEE1394

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]IEEE1394視頻視覺(jué)系統(tǒng)中DSP軟硬件設(shè)計(jì)

介紹了用數(shù)字信號(hào)處理器實(shí)現(xiàn)視頻流控制處理功能的軟硬件設(shè)計(jì)方案。重點(diǎn)論述了如何設(shè)計(jì)DSP的軟件及外圍硬件，完成IEEE1394設(shè)備自標(biāo)識(shí)及數(shù)據(jù)傳輸?shù)脑敿?xì)過(guò)程。同時(shí)還提出了一種用于運(yùn)動(dòng)目標(biāo)檢測(cè)的變加權(quán)背景恢復(fù)算法及其DSP實(shí)現(xiàn)方案。這種用DSP實(shí)現(xiàn)數(shù)字視覺(jué)算法的成功嘗試，對(duì)于實(shí)現(xiàn)其他視覺(jué)功能具有一定的借鑒意義。

本文介紹了一種以DSP為核心、基于IEEE1394總線的圖像實(shí)時(shí)采集處理系統(tǒng)的軟硬件設(shè)計(jì)。此外還提出了一種易于用DSP實(shí)現(xiàn)且存儲(chǔ)器資源占用率小的運(yùn)動(dòng)目標(biāo)檢測(cè)算法。據(jù)了解，目前國(guó)內(nèi)外大多數(shù)的計(jì)算機(jī)視覺(jué)研究都是用計(jì)算機(jī)軟件處理實(shí)現(xiàn)的，因此在實(shí)時(shí)性和成本方面受計(jì)算機(jī)平臺(tái)的制約。本文討論了一種計(jì)算機(jī)視覺(jué)系統(tǒng)的硬件平臺(tái)設(shè)計(jì)方案，并在此平臺(tái)上實(shí)現(xiàn)了運(yùn)行目標(biāo)檢測(cè)?？梢哉f(shuō)，這是一次用DSP實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)算法的成功嘗試，對(duì)于其它算法的硬件實(shí)現(xiàn)有一定的借鑒意義。

圖1 硬件系統(tǒng)框圖

采用IEEE1394總線作為傳輸接口是實(shí)現(xiàn)實(shí)時(shí)圖像采集的根本保證。IEEE1394是由國(guó)際電氣和電子工程師協(xié)會(huì)(IEEE)制定的一種高速串行總線協(xié)議。1394總線具有以下優(yōu)點(diǎn)：

支持熱插拔和即插即用：

提供統(tǒng)一的通用接口，并且具有總線供電能力(每一端口的最大輸出電流為1.5A，輸出電壓8～33Vdc);

·傳輸速率高100～400Mbps;

·不依賴計(jì)算機(jī)，支持1394設(shè)備間的點(diǎn)對(duì)點(diǎn)傳輸。

其中第四點(diǎn)是目前常用的USB2.0總線無(wú)法實(shí)現(xiàn)的，也正是這一優(yōu)點(diǎn)使得1394不僅是一種計(jì)算機(jī)外設(shè)連接總線，更是多種消費(fèi)類電子產(chǎn)品的連接方案。

圖2 幀緩存訪問(wèn)次序

另外，為了實(shí)現(xiàn)數(shù)字視頻圖像的實(shí)時(shí)采集和處理，充分發(fā)揮1394總線的高速傳輸速率，筆者選用了TI公司的TMS320VC33數(shù)字信號(hào)處理器作為主控制器。這是一款高性能浮點(diǎn)DSP，它具有17ns的指令周期和60MIPS的處理能力。

下面將分別介紹這套DSP系統(tǒng)的工作原理，軟、硬件設(shè)計(jì)以及運(yùn)動(dòng)目標(biāo)檢測(cè)算法的改進(jìn)和實(shí)現(xiàn)。

系統(tǒng)組成及工作原理

本系統(tǒng)是為驗(yàn)證并實(shí)現(xiàn)各種計(jì)算機(jī)視覺(jué)算法而搭建的一個(gè)硬件平臺(tái)，用五片512K×8bit的SRAM分別作為幀緩沖和DSP的擴(kuò)展RAM。還有一片20萬(wàn)門的FPGA用作系統(tǒng)的邏輯控制及以后機(jī)器視覺(jué)算法的硬件實(shí)現(xiàn)。系統(tǒng)的結(jié)構(gòu)框圖如圖1所示。

系統(tǒng)的工作原理如下：系統(tǒng)上電或復(fù)位后，DSP首先從FlashROM中自動(dòng)裝入代碼并開始運(yùn)行，等待1394電纜插入。當(dāng)電纜插入后，DSP通過(guò)解析根節(jié)點(diǎn)發(fā)來(lái)的請(qǐng)求包發(fā)出對(duì)應(yīng)的內(nèi)容作為應(yīng)答，直至根節(jié)點(diǎn)發(fā)現(xiàn)該設(shè)備。之后，只要根節(jié)點(diǎn)發(fā)出讀數(shù)據(jù)請(qǐng)求，DSP就根據(jù)請(qǐng)求包的內(nèi)容從幀緩沖RAM中取出數(shù)據(jù)，通過(guò)1394鏈路層和物理層芯片將其送到1394總線上。

圖像數(shù)據(jù)的采集、處理和傳輸三個(gè)步驟以流水線的方式，在同一時(shí)刻各掌握一片幀緩存RAM的訪問(wèn)權(quán)，并行工作。當(dāng)各個(gè)步驟都完成后，在FPGA的控制下同時(shí)切換各片幀緩存的控制權(quán)，開始流水線的下一個(gè)周期。各個(gè)步驟對(duì)三片幀緩存RAM的控制次序如圖2所示。

這種流水線式的電路結(jié)構(gòu)實(shí)現(xiàn)了圖像采集、圖像處理、圖像傳輸三個(gè)步驟并行工作，極大地提高了處理的連續(xù)性和實(shí)時(shí)性。

圖3 DSP軟件流程圖

DSP硬件設(shè)計(jì)

DSP在本系統(tǒng)中的任務(wù)有三個(gè)：首先是通過(guò)鏈路層和物理層芯片與根節(jié)點(diǎn)通信，完成自標(biāo)識(shí)過(guò)程;其二是處理采集好的一幀圖像，并把它再存回幀緩存;其三是自標(biāo)識(shí)完成后，響應(yīng)根節(jié)點(diǎn)發(fā)來(lái)的數(shù)據(jù)讀請(qǐng)求，從幀緩沖RAM中讀出處理過(guò)重的圖像數(shù)據(jù)并送到總線上。整個(gè)系統(tǒng)由一片TMS320VC33、一片20萬(wàn)門的 FPGA(EP20k200EBC356)、五片512KB高速SRAM(IS61LV5128AL)、一片F(xiàn)lash(AM29LV400B)、一片 1394鏈路層芯片(TSB12LV32)、一片1394物理層芯片(TSB41LV04a)以及DSP電源看門狗芯片(PS767D301)組成。其中 TMS320VC33作為主控制器與TSB12LV32的主控制器接口相連。FPGA在DSP的控制下向1394鏈路層芯片的DataMover端口發(fā)送數(shù)據(jù)。此外FPGA還有地址譯碼、時(shí)序調(diào)整以及幀緩存切換等功能。三片SRAM作為幀緩沖存，另外兩片作為DSP的擴(kuò)展RAM，每片RAM內(nèi)存放一幀圖像(300K字節(jié))，其訪問(wèn)時(shí)間為12ns，因此完全適合TMS320VC33以零等待方式訪問(wèn)。物理層芯片TSB12LV04a只與鏈路層芯片通信，與 DSP無(wú)關(guān)，它負(fù)責(zé)進(jìn)行總線上的差分模擬信號(hào)與系統(tǒng)的數(shù)字信號(hào)之間的轉(zhuǎn)換。Flash用來(lái)存放DSP代碼，它經(jīng)過(guò)地址譯碼直接與DSP相連。DSP復(fù)位后由BootLoader將代碼從Flash加載到DSP片內(nèi)RAM中開始運(yùn)行?？梢酝ㄟ^(guò)DSP的JTAG接口方便地進(jìn)行Flash的在系統(tǒng)擦寫。由于AM12LV400B的訪問(wèn)時(shí)間為70ns，DSP訪問(wèn)Flash時(shí)至少應(yīng)加入5個(gè)等待周期。

DSP軟件設(shè)計(jì)

DSP的軟件開發(fā)是在TI公司提供的Code Composer(CC)環(huán)境一，結(jié)合DSP硬件仿真器完成。代碼的開發(fā)根據(jù)實(shí)際情況使用C語(yǔ)言和匯編語(yǔ)言的混合編程。在實(shí)際設(shè)備自標(biāo)識(shí)的過(guò)程中使用C語(yǔ)言，這是因?yàn)檫@個(gè)過(guò)程邏輯關(guān)系比較復(fù)雜，但只在總線復(fù)位初始化時(shí)執(zhí)行一次，用C語(yǔ)言可以提高可讀性，減小開發(fā)難度，同時(shí)也不會(huì)對(duì)系統(tǒng)的性能有太大影響。而在進(jìn)行圖像處理和響應(yīng)數(shù)據(jù)讀請(qǐng)求包時(shí)，則使用了匯編語(yǔ)言。原因是這些代碼使用頻繁，直接影響系統(tǒng)的速度。

響應(yīng)1394總線的自標(biāo)識(shí)過(guò)程是系統(tǒng)設(shè)計(jì)的難點(diǎn)，也是1394接口設(shè)計(jì)最重要的部分。DSP的響應(yīng)必須符合IEEE1394a協(xié)議中規(guī)定的自標(biāo)識(shí)步驟，圖3描述了DSP的動(dòng)作流程。

自標(biāo)識(shí)過(guò)程實(shí)際上是根節(jié)點(diǎn)(主機(jī))請(qǐng)求讀取葉節(jié)點(diǎn)(設(shè)備)配置ROM的過(guò)程?？梢詧?zhí)行事務(wù)的1394串行總線節(jié)點(diǎn)都應(yīng)該實(shí)現(xiàn)配置ROM，它為配置和參數(shù)與設(shè)備相關(guān)的問(wèn)題提供了一些必要的信息。例如，對(duì)于一個(gè)連接到計(jì)算機(jī)上的1394設(shè)備而言，設(shè)備中電后，計(jì)算機(jī)首先讀取配置ROM中的內(nèi)容，從而分辨出這是一個(gè)什么樣的設(shè)備。配置ROM中包含的信息有：[!--empirenews.page--]

·為識(shí)別本設(shè)備驅(qū)動(dòng)程序所需要的信息;

·為識(shí)別診斷軟件所必須的信息;

·為指定設(shè)備設(shè)計(jì)總線的各種性能所需要的信息;

·為指定可選的模塊、節(jié)點(diǎn)以及元件特征和參數(shù)所需要的信息。

正常格式的配置ROM形成了一個(gè)樹結(jié)構(gòu)，它包括很多分支和葉子，這些分支和葉子都是由指針聯(lián)系起來(lái)的，其中有限選項(xiàng)也有任務(wù)項(xiàng)。

DSP要做的就是把配置ROM的內(nèi)容以異步讀應(yīng)答包的形式發(fā)出計(jì)算機(jī)，而配置ROM的內(nèi)容是開發(fā)人員根據(jù)所開發(fā)的系統(tǒng)自已定義的。當(dāng)計(jì)算機(jī)正確讀完配置ROM的內(nèi)容后，就會(huì)顯示發(fā)現(xiàn)新硬件或自動(dòng)裝入相應(yīng)的1394設(shè)備驅(qū)動(dòng)程序。

所有的1394數(shù)據(jù)傳輸都是以包為單位。其中包頭含此次傳輸?shù)膫鬏斔俾?Spd)、事務(wù)標(biāo)簽(tLable)、事務(wù)代碼(tCode)、源節(jié)點(diǎn)ID、目的節(jié)點(diǎn)ID等信息。這些信息必須符合協(xié)議要求，例如一個(gè)讀請(qǐng)求數(shù)據(jù)塊應(yīng)答包，傳輸速率為400Mbps，那么Spd=10、tCode=7，源節(jié)點(diǎn)ID和目的節(jié)點(diǎn)ID分別是請(qǐng)求包的目的節(jié)點(diǎn)ID和源節(jié)點(diǎn)ID，tLable和請(qǐng)求包的相等。

自標(biāo)識(shí)完成后，DSP開始處理采集好的圖像數(shù)據(jù)，同時(shí)以中斷子程序的方式啟動(dòng)數(shù)據(jù)發(fā)送。由于本系統(tǒng)采用1394總線的異步傳輸方式，每次數(shù)據(jù)傳輸都由主機(jī)(PC)發(fā)起，所以DSP以中斷的方式響應(yīng)主機(jī)發(fā)來(lái)的讀請(qǐng)求，每次中斷服務(wù)中發(fā)送一個(gè)數(shù)據(jù)包。在采集、處理、傳輸三個(gè)步驟中，顯然處理是最耗費(fèi)時(shí)間的，為了確保這三個(gè)步驟都完成后再切換到流水線的下一個(gè)周期，中斷子程序中還要判斷是否一幀圖像已經(jīng)發(fā)完，如果已經(jīng)發(fā)完一幀，則關(guān)閉中斷，等到圖像處理步驟完成后，幀緩存切換完畢再打開中斷。

整個(gè)軟件部分完成后，燒寫Flash并實(shí)現(xiàn)程序的引導(dǎo)加載(Boot-Loader)也是重要的一步。TMS320VC33的引導(dǎo)加載功能是通過(guò)DSP復(fù)位后自動(dòng)運(yùn)行駐留在片內(nèi)ROM的地址0x45處的一段代碼實(shí)現(xiàn)的。這段代碼可以根據(jù)復(fù)位時(shí)INT0～I(xiàn)NT3引腳上的狀態(tài)決定裝載的源地址(只能是0x1000、 0x400000、0xFFF000或串口0)，并將源地址處的代碼轉(zhuǎn)移到指定的片內(nèi)RAM中，然后從指定的程序入口點(diǎn)開始運(yùn)行。

幀間平均運(yùn)行檢測(cè)算法的改進(jìn)與實(shí)現(xiàn)

運(yùn)動(dòng)目標(biāo)檢測(cè)跟蹤是計(jì)算機(jī)視覺(jué)中十分重要的一個(gè)熱門研究領(lǐng)域，近年來(lái)出現(xiàn)了許多新的算法。但可以歸結(jié)為以下四大類：基于光流場(chǎng)分析的算法、基于主動(dòng)輪廓的算法、基于編譯模型的算法以及基于圖像差分的方法。并三種算法與第四種方法相比，具有精度高、定位準(zhǔn)并且能夠得出運(yùn)動(dòng)參數(shù)的優(yōu)點(diǎn)。但是算法的復(fù)雜性較高，目前難以在普通的硬件平臺(tái)上實(shí)現(xiàn)實(shí)時(shí)處理。因此，圖像差分方波被廣泛用于實(shí)時(shí)運(yùn)動(dòng)檢測(cè)系統(tǒng)。

在實(shí)際應(yīng)用中差分圖像的獲得有兩種途徑：其一是利用相鄰兩幀之間的差來(lái)獲得差分圖像;其二是通過(guò)將當(dāng)前幀和固定的背景幀相減來(lái)獲得差分圖像。第一種方法在應(yīng)用中容易出現(xiàn)“空洞”現(xiàn)象，檢測(cè)結(jié)果的大小與目標(biāo)運(yùn)動(dòng)的速度有關(guān)，從而影響了動(dòng)目標(biāo)檢測(cè)的精度;第二種方法，由于背景是固定的，那么若外界條件有較明顯的變化，例如光照等條件發(fā)生變化時(shí)，當(dāng)前的實(shí)際背景圖像就會(huì)發(fā)生變化，從而獲得的差分圖像是不準(zhǔn)確的，噪聲比較大。故這種方法僅適用于背景條件不變或者是變化限制在一定范圍內(nèi)的情況。

本文針對(duì)背景和攝像機(jī)都靜止這一特定應(yīng)用場(chǎng)合，選用了基于背景消減的運(yùn)動(dòng)檢測(cè)和跟蹤算法。這種算法的關(guān)鍵在于背景重建，在此應(yīng)用了基于幀間平均的背景重建方法，并在此基礎(chǔ)上針對(duì)硬件可實(shí)現(xiàn)性和處理的實(shí)時(shí)性提出了改進(jìn)。最后，為了克服背景消減算法噪聲較大的先天不足，采用了形態(tài)學(xué)濾波的方法去處噪聲。

幀間平均算法使用當(dāng)前幀之間各幀的像素平均值作為當(dāng)前背景的估計(jì)值，如下式所示：

從公式中可以看出，這種算法只需要在圖像采集系統(tǒng)的基礎(chǔ)上多添加一片幀存儲(chǔ)器用來(lái)存儲(chǔ)估計(jì)背景即可，因此對(duì)硬件資源要求低。另外，背景是隨著n增加逐漸恢復(fù)的，所以背景過(guò)程并不影響圖像處理結(jié)果的實(shí)時(shí)傳輸和顯示。顯然，n越大，背景恢復(fù)越真實(shí)，可以控制n的大小調(diào)整處理時(shí)間和處理效果之間的平衡。

然而，由于上面的公式中有除法運(yùn)算，所以無(wú)論使用FPGA還是DSP來(lái)實(shí)現(xiàn)都有一定的困難。以DSP為例，對(duì)于本系統(tǒng)所用的TMS320C3x系列DSP來(lái)說(shuō)，一次整數(shù)除法運(yùn)算要用約100條指令，這顯然對(duì)處理的實(shí)時(shí)性有很大的影響。

為了克服這一算法缺陷，提出了如下的變加權(quán)均值算法：

上式中，各幀取平均值并沒(méi)有采用相同的加權(quán)，而是以2的整數(shù)冪2m作為步長(zhǎng)，在每個(gè)步長(zhǎng)內(nèi)，對(duì)已估計(jì)出的背景都給予該步長(zhǎng)內(nèi)最大的加權(quán)值(2m-1) /2m，這比原算法中背景的加權(quán)值(n-1)/n更大，也就是說(shuō)變加權(quán)算法在背景估計(jì)中列加依賴于已經(jīng)估計(jì)出的背景，這有利于消除當(dāng)前幀中噪聲對(duì)背景估計(jì)的影響。在整個(gè)背景估計(jì)過(guò)程中，m截止來(lái)，步長(zhǎng)也越大，同時(shí)已估計(jì)出的背景的權(quán)重也越大。同時(shí)可以看到，除數(shù)都變成了2的整數(shù)冪，可以用移位來(lái)實(shí)現(xiàn)，與原算法相比，運(yùn)算效率提高了近100倍。然而，處理效果并未因此而受到損失，這是因?yàn)檫@種加權(quán)值的改變遵循這樣一種事實(shí)：隨著幀數(shù)的增加，估計(jì)出的背景的可信度越來(lái)越高，當(dāng)前幀對(duì)背景的影響也越來(lái)越小，所以已估計(jì)出的背景在公式中所占的比重也應(yīng)該越來(lái)越大。實(shí)驗(yàn)證明：m=6時(shí)，已經(jīng)足可以估計(jì)出較為真實(shí)的背景了。

DSP的擴(kuò)展RAM用來(lái)了存放已經(jīng)估計(jì)出的背景，將當(dāng)前幀與背景相減取絕對(duì)值，再進(jìn)行二值化，就得到了運(yùn)動(dòng)目標(biāo)的二值化圖像。為了消除噪聲的影響，最后使用一個(gè)7×7的菱形結(jié)構(gòu)元素對(duì)圖像進(jìn)行形態(tài)學(xué)開運(yùn)算。最終的結(jié)果再存回幀緩存。

圖4是處理結(jié)構(gòu)傳回主機(jī)后，用VC實(shí)現(xiàn)的應(yīng)用程序界面，其中左上角是在原始圖像上添加的動(dòng)目標(biāo)檢測(cè)結(jié)果，右上角是二值化的動(dòng)目標(biāo)，左下角是背景恢復(fù)圖，右下角是是運(yùn)動(dòng)跳躍軌跡;圖5是n=64時(shí)，恢復(fù)出的背景;圖6是利用改進(jìn)的變加權(quán)幀間平均算法得到的目標(biāo)運(yùn)動(dòng)檢測(cè)結(jié)果，其中較大的方框是形態(tài)學(xué)濾波前的檢測(cè)結(jié)果，受到車燈倒影的影響 (如圖中白色圓圈標(biāo)示)，檢測(cè)結(jié)果精度很差，內(nèi)部較小的方框則通過(guò)形態(tài)學(xué)濾波解決了這個(gè)問(wèn)題。

經(jīng)測(cè)試表明：本系統(tǒng)工作穩(wěn)定，傳輸速率高(30fps@640×480)，處理效果好，可擴(kuò)展性強(qiáng)，是機(jī)器視覺(jué)算法硬件實(shí)現(xiàn)的一次成功嘗試。但是目前的算法還有待改進(jìn)，例如在保證實(shí)時(shí)性和硬件易實(shí)現(xiàn)性的前提下，大片的燈光倒影很難再用形態(tài)學(xué)濾波的方法消除。這是下一步要著重解決的問(wèn)題。[!--empirenews.page--]