一種基于服務(wù)機(jī)器人的視覺系統(tǒng)設(shè)計(jì)
劉京誠(chéng),廖智勇,朱木健 摘 要:通過采用圖像傳感器ov7635采集圖像,幀存儲(chǔ)器al422b進(jìn)行數(shù)據(jù)緩存,cpld控制時(shí)序,dsp進(jìn)行圖像處理,構(gòu)建了一個(gè)圖像采集的硬件系統(tǒng)。在圖像軟件處理中,采用閾值向量判斷法和改進(jìn)的種子填充法來完成彩色圖像的識(shí)別和分割,在分割中計(jì)算圖像的幾何矩,利用全局圖像的幾何矩特征量構(gòu)建圖像雅可比矩陣,并用推導(dǎo)的圖像雅可比矩陣完成一個(gè)圖像反饋與目標(biāo)運(yùn)動(dòng)自適應(yīng)補(bǔ)償?shù)囊曈X跟蹤系統(tǒng)。系統(tǒng)采用了tft液晶來直觀顯示視覺識(shí)別和跟蹤的效果。 關(guān)鍵詞:視覺系統(tǒng);閾值向量;種子填充;圖像矩;雅可比矩陣 隨著計(jì)算機(jī)科學(xué)和自動(dòng)控制技術(shù)的發(fā)展,越來越多的不同種類的智能機(jī)器人出現(xiàn)在工廠、生活當(dāng)中,機(jī)器人視覺系統(tǒng)作為智能機(jī)器人系統(tǒng)中一個(gè)重要的子系統(tǒng),也越來越受到人們的重視。它涉及了圖像處理、模式識(shí)別和視覺跟蹤等領(lǐng)域。不同種類的機(jī)器人由于工作的重點(diǎn)不一樣,它的視覺系統(tǒng)在軟件或硬件上都有著細(xì)微的差別。本文研究基于服務(wù)機(jī)器人的單目視覺系統(tǒng)。它處理的是二維圖像,是基于對(duì)無遮擋物體顏色和形狀的識(shí)別以及3d目標(biāo)物體的平動(dòng)跟蹤。 視覺系統(tǒng)是一個(gè)非常復(fù)雜的系統(tǒng),它既要做到圖像的準(zhǔn)確采集還要做到對(duì)外界變化反應(yīng)的實(shí)時(shí)性,同時(shí)還需要對(duì)外界運(yùn)動(dòng)的目標(biāo)實(shí)時(shí)跟蹤。因此,視覺系統(tǒng)對(duì)硬件和軟件系統(tǒng)都提出了較高的要求。目前比較流行的足球機(jī)器人技術(shù),它的視覺系統(tǒng)屬于比較典型的快速識(shí)別和反應(yīng)類型。一般情況下,它是通過彩色標(biāo)志定標(biāo)的方法來達(dá)到對(duì)隊(duì)員和目標(biāo)的識(shí)別,以及通過擴(kuò)展卡爾曼濾波器的預(yù)測(cè)功能來實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤功能。在硬件上,采用一個(gè)現(xiàn)成的攝像機(jī)來實(shí)現(xiàn)一個(gè)機(jī)器人的圖像采集系統(tǒng)?! ”鞠到y(tǒng)在設(shè)計(jì)上采用cmos圖像傳感器代替ccd類型傳感器進(jìn)行采集圖像,dsp處理芯片tms320vc5509a進(jìn)行圖像處理以及作為cpu控制,在設(shè)計(jì)過程中,為了直觀顯現(xiàn)機(jī)器人視覺系統(tǒng)識(shí)別和跟蹤的效果,專門采用了一個(gè)tft格式的液晶來直觀顯示。軟件上,采用了一部分足球機(jī)器人的視覺技術(shù)來達(dá)到對(duì)目標(biāo)的快速識(shí)別,通過全局的特征矩構(gòu)建的雅可比矩陣達(dá)到對(duì)目標(biāo)的自適應(yīng)跟蹤。1 硬件部分設(shè)計(jì) 圖1為系統(tǒng)硬件電路的功能模塊框圖。1.1 圖像采集 視覺鏡頭把外部的圖像信息成像在圖像傳感器的面陣單元上。目前流行的圖像傳感器有面陣ccd(charged coupled device,電荷耦合器件)型和面陣cmos兩種。相比較ccd型的圖像傳感器,cmos圖像傳感器的有源像素單元為每一個(gè)像素提供了放大器,只需一個(gè)單供電低邏輯電平電壓,功耗只相當(dāng)于ccd的十分之一。cmos圖像傳感器內(nèi)部集成了a/d轉(zhuǎn)換部分,直接輸出數(shù)字信號(hào)。基于這些因素,本系統(tǒng)采用了omnivision公司推出的cmos彩色圖像傳感器ov7635?! v7635的分辨力為640x480,能輸出3種格式的8位數(shù)據(jù):ycbcr4:2:2模式、rgb4:2:2模式和rgb原始數(shù)據(jù)模式。輸出vga格式最大可達(dá)到30fps(fps:每秒幀數(shù))。能工作在逐行掃描下和隔行掃描下。ov7635有主模式和從模式兩種工作模式。在主模式下,同步信號(hào)和時(shí)鐘不由外圍設(shè)備控制。在從模式下,ov7635的場(chǎng)同步信號(hào)vsync,行同步信號(hào)href以及系統(tǒng)的晶振頻率xclk均由外部設(shè)備控制。本系統(tǒng)采用的是主模式。ov7635通過i2c總線配置片內(nèi)寄存器,使其輸出原始數(shù)據(jù)。系統(tǒng)上電復(fù)位后,由dsp芯片的i2c總線信號(hào)對(duì)cmos寄存器初始化。然后ov7635就按要求輸出圖像信號(hào)。包括行同步信號(hào)href,場(chǎng)同步信號(hào)vsync,像素時(shí)鐘信號(hào)pclk,數(shù)字圖像信號(hào)。1.2 液晶顯示 為了很直觀的看到視覺系統(tǒng)對(duì)人的識(shí)別和跟蹤效果,采用了一片innolux公司的pt035tn01液晶顯示屏。為了不增加對(duì)dsp的負(fù)擔(dān),同時(shí)也為了實(shí)時(shí)看到對(duì)外界目標(biāo)物體的跟蹤效果,液晶顯示的數(shù)據(jù)不經(jīng)由dsp,直接通過傳感器ov7635輸出的圖像數(shù)據(jù)信號(hào)和cpld控制時(shí)序來進(jìn)行顯示。pt035tn01是3.5英寸tft格式的液晶,分辨力為320×3(rgb)×240,液晶if1、if2兩輸入控制腳對(duì)輸入的數(shù)據(jù)格式進(jìn)行選擇:串行rgb格式、ccir601格式、ccir656格式。液晶的掃描模式有4種。本視覺系統(tǒng)采用的輸入數(shù)據(jù)格式是ccir601格式,掃描模式為由上到下和左到右的掃描模式?! ≡赾cir601格式下,圖像傳感器輸出的像素時(shí)鐘pclk通過cpld二分頻作為液晶的工作時(shí)鐘,圖像傳感器輸出的行同步信號(hào)href經(jīng)過cp