當(dāng)前位置:首頁 > 消費電子 > 消費電子
[導(dǎo)讀]  由于傳統(tǒng)電視機(jī)遙控器的按鍵操作比較機(jī)械且缺乏娛樂性,設(shè)計了一種以DSP2812為核心的手勢識別算法。通過將用戶手勢運動的信息轉(zhuǎn)換成相應(yīng)的紅外信號,從而實現(xiàn)手勢遙控電

  由于傳統(tǒng)電視機(jī)遙控器的按鍵操作比較機(jī)械且缺乏娛樂性,設(shè)計了一種以DSP2812為核心的手勢識別算法。通過將用戶手勢運動的信息轉(zhuǎn)換成相應(yīng)的紅外信號,從而實現(xiàn)手勢遙控電視機(jī)更換頻道和調(diào)節(jié)音量的目的。該系統(tǒng)主要由雙端口RAM通信的雙DSP 并行處理器、CMOS 數(shù)字?jǐn)z像頭、紅外遙控模塊、上位機(jī)調(diào)試軟件和以太網(wǎng)通信模塊組成。實驗測試表明,該系統(tǒng)能夠?qū)崿F(xiàn)用戶手勢圖像的采集、手勢動作的識別、紅外遙控及以太網(wǎng)通信功能。

  傳統(tǒng)電視機(jī)遙控器是一種按鍵操控方式,其操作比較機(jī)械且缺乏娛樂性。本文提出一種采用直接判斷使用者手部動作的方法遙控電視機(jī),使用者在攝像頭拍攝范圍內(nèi)按照規(guī)定的擺放方式移動手部,就能夠遙控電視機(jī)進(jìn)行音量增減或頻道變換等操作。設(shè)計使人們對電視機(jī)的遙控操作更加便捷、人性化,豐富大眾的日常生活。

  1. 系統(tǒng)設(shè)計方案

  手勢識別電視機(jī)遙控器是集合圖像采集、手勢識別和紅外遙控三大主要功能的控制裝置。依據(jù)要實現(xiàn)的采集圖像能力和DSP 處理視頻流能力的功能要求,確定系統(tǒng)結(jié)構(gòu)如圖1 所示。

  

 

  圖1 手勢識別電視遙控器系統(tǒng)結(jié)構(gòu)

  本系統(tǒng)采用了雙DSP 共同工作的方式,主要由六個模塊組成。

  1) 攝像頭模塊: 由攝像頭OV7620 及驅(qū)動電路組成,負(fù)責(zé)手勢圖像采集。

  2) DSP1: 核心是TMS320F2812,負(fù)責(zé)對圖像采集及預(yù)處理,與上位機(jī)網(wǎng)絡(luò)通信和用戶按鍵信息的輸入。

  3) 上位機(jī): 顯示實時采集的圖像,圖像處理結(jié)果和調(diào)試參數(shù)等。

  4) 雙端口RAM 模塊: 實現(xiàn)兩個DSP 之間的高效數(shù)據(jù)通信。

  5) DSP2: 負(fù)責(zé)提取手勢圖像特征和向紅外遙控模塊發(fā)送指令。它從雙端口RAM 獲取圖像數(shù)據(jù),從圖像中提取有用的特征,并將判斷結(jié)果轉(zhuǎn)換成相應(yīng)的遙控指令。

  6) 紅外遙控模塊: 負(fù)責(zé)學(xué)習(xí)電視機(jī)配套遙控器的紅外遙控指令,將其放入指定的存儲空間中。在DSP2 給出發(fā)射指令時,查詢存儲空間,獲取對應(yīng)的紅外指令并發(fā)射。

  2. 系統(tǒng)硬件設(shè)計

  2. 1 雙DSP 處理器及內(nèi)存空間設(shè)計

  本設(shè)計使用雙TMS320F2812 的DSP 進(jìn)行圖像采集、圖像處理并且實現(xiàn)紅外遙控和網(wǎng)絡(luò)通信等功能。這樣可以滿足并行圖像處理能力和快速響應(yīng)的速度要求,同時兩個DSP 擴(kuò)展了512 K × 16 位的RAM 空間,以滿足圖像處理的空間要求。

  為了實現(xiàn)雙DSP 之間的通信,系統(tǒng)采用Cypress公司的一款64 K × 16 位的雙端口RAM 芯片CY7C028 搭建一個數(shù)據(jù)通道。DSP1 把采集到的圖像通過時間控制有規(guī)律寫入數(shù)據(jù)通道中,DSP2 從數(shù)據(jù)通道中提取圖像數(shù)據(jù)存放到自己的RAM 中,然后進(jìn)行相關(guān)的圖像處理。在設(shè)計工作狀態(tài)時,使用雙端口中斷判優(yōu)方式,數(shù)據(jù)傳遞采用握手的通信模式。當(dāng)DSP1 向雙端口RAM 中寫完數(shù)據(jù)之后,通過中斷握手的方式,通知DSP2 讀取數(shù)據(jù)。DSP2 要求數(shù)據(jù)時,也會以同樣的方式通知DSP1,從而實現(xiàn)雙DSP 高速有規(guī)律地數(shù)據(jù)傳遞。雙端口RAM 與兩個DSP 之間的硬件連接如圖2 所示。

  

 

  圖2 雙端口RAM 與雙DSP 的硬件連接圖

  2. 2 圖像采集電路設(shè)計

  本系統(tǒng)直接使用DSP1 通過外部中斷NMI 和INT2,分別同步攝像頭OV7620 的VSN 和HREF 信號,同時通過綁定DSP 的8 根I /O 線同步讀取圖像到DSP 內(nèi)存中,從而實現(xiàn)了系統(tǒng)的圖像采集工作。為了讓DSP 的時鐘頻率與OV7620 的時鐘頻率匹配,必須要降低攝像頭的輸出時鐘頻率。對攝像頭OV7620 內(nèi)部的寄存器進(jìn)行設(shè)置,達(dá)到減慢數(shù)據(jù)傳輸速度的目的。OV7620 模塊與DSP1 的硬件連接和OV7620 的同步讀取時序分別如圖3 和圖4 所示。

  

 

  圖3 藍(lán)牙發(fā)送模塊接口電路

  

 

  圖4 OV7620 同步讀取時序圖

  通過時序圖可知,DSP 先捕獲攝像頭的場中斷信號,準(zhǔn)備好存儲一幀圖像的數(shù)組。然后,DSP 等待HREF 行中斷信號。最后,在行中斷中判斷PCLK信號,當(dāng)PCLK 處于高電平時,DSP 讀取該像素值。為了在不丟失手勢特征信息的前提下采集盡量小的圖像,DSP 采集視野中間隔行的100 × 100 大小的圖像,存放在100 × 100 的數(shù)組中。通過修改讀取程序可以改變采集圖像的大小。

  2. 3 內(nèi)存及DSP 網(wǎng)絡(luò)通信設(shè)計

  本系統(tǒng)采用RTL8019AS 與DSP1 通過連接對應(yīng)的地址數(shù)據(jù)總線,設(shè)置片選信號,實現(xiàn)DSP 的以太網(wǎng)通信。RTL8019AS 與DSP1 的硬件連接如圖5 所示。

  RTL8019AS 內(nèi)部有兩塊RAM 區(qū),一塊16 K 字節(jié),地址為0 × 4000 ~ 0 × 7FFF; 一塊32 個字節(jié),地址為0 × 0000 ~ 0 × 001F。RAM 按每256 字節(jié)為一頁存儲。一般將RAM 前12 頁( 即0 × 4000 ~ 0 ×4BFF) 存儲區(qū)作為發(fā)送緩沖區(qū); 后52 頁( 即0 ×4C00 ~ 0 × 7FFF) 存儲區(qū)作為接收緩沖區(qū)。第0 頁只有32 字節(jié)( 地址為0 × 0000 ~ 0 × 001F),用于存儲以太網(wǎng)物理地址。要接收和發(fā)送數(shù)據(jù)包就必須通過DMA 讀寫RTL8019AS 內(nèi)部的16KB RAM。

  

 

  圖5 RTL8019AS 與DSP1 硬件連接圖

  2. 4 紅外遙控模塊電路設(shè)計

  紅外遙控模塊包括三個部分: 接收部分、發(fā)送部分和數(shù)據(jù)處理部分。接收部分包括光電轉(zhuǎn)換、解調(diào)、高速采樣以及數(shù)據(jù)分析等模塊,發(fā)送部分包括遙控發(fā)送和電光轉(zhuǎn)換模塊,數(shù)據(jù)處理部分包括中央處理以及存儲模塊。

  3 系統(tǒng)軟件設(shè)計

  3. 1 手勢圖像預(yù)處理算法

  手勢圖像提取算法選擇幀間差分的方法實現(xiàn)手部圖像分割。利用間隔短暫時間的兩幀圖像比較,獲取兩張圖像運動方向的手部圍成的一小段白色區(qū)域,然后采用閾值分割的方法對獲取的圖像二值化,消除噪聲,最后根據(jù)此圖像序列含有的白色像素點的多少來確定圖像序列中有無物體存在。對手勢圖像預(yù)處理的算法描述如下:

  1) 從視頻圖像序列中選取相鄰n 幀的兩幀圖像,其中前一幀圖像為Pk-1( x,y ),如圖6( a) 所示,后一幀圖像為Pk( x,y),如圖6( b) 所示;

  

 

  圖6 從視頻圖像序列中選取的圖像

  2) 為了減少計算量,將480 × 640 的圖像隔4 行6 列提取像素點,左右各忽略20 列,上下各忽略40行,獲得兩幀100 × 100 的圖像

,如圖7( a) 和7( b) 所示;

 

  

 

  圖7 縮小后的圖像

  3) 計算后一幀與前一幀的差為Gk( x,y) ,得到目標(biāo)的變化量,如圖8 所示;

  

 

  圖8 兩幅圖像的目標(biāo)變化量

  4) 對幀間差分法得到的圖像按選定的閾值進(jìn)行二值化,得到目標(biāo)圖像序列的二值化圖像序列Fk( x,y) ,如圖9 所示。其中,

  

 

  式( 1) 中,T 為閾值。對于給定視頻序列的圖像,假設(shè)像素點k 處沒有運動,其幀差dk服從均值為0,方差為σ2 的Gauss 分布N( 0,σ2):

  

 

  式( 2) 中,H0表示無運動假設(shè),σ2 是幀差的統(tǒng)計方差,通常認(rèn)為它等于攝像頭噪聲方差的兩倍。根據(jù)概率統(tǒng)計假設(shè)檢驗“3σ”法則和“正確的閾值T 應(yīng)該能消除大部分噪聲”的原則。經(jīng)試驗測試得閾值T選擇在35 ~ 45 之間比較合適。二值化后的圖像如圖9 所示。觀察Fk( x,y) 的圖像序列,可以看到圖像中的噪聲很少,這是因為①幀間差分法達(dá)到了加大目標(biāo)信息的權(quán)重,同時抑制了靜態(tài)背景的效果;②攝像頭采集范圍背景比較單一,光線均勻。

  Fk( x,y) 中主要存在兩大類的噪聲。一種是由于光線變化產(chǎn)生的噪聲,這種噪聲往往以孤立的黑色像素點的形式出現(xiàn)。第二種噪聲是一些面積較小的背景塊。為了盡可能消除這兩種噪聲,可以求每個N × M 小塊的灰度平均值,根據(jù)灰度平均值可估計出白色區(qū)域的大小。當(dāng)灰度平均值小于某一閾值時,可以認(rèn)為是噪聲,把對應(yīng)的N × M 個點賦值為0.算法實現(xiàn)如下:

  ( 1) 建立一個大小是Fk( x,y) 的1 /25 倍的矩陣來存20 × 20 個5 × 5 像素塊的平均灰度值fk( x,y)。

  ( 2) fk( x,y) 和Hk( x,y) 滿足如下關(guān)系:

  

[!--empirenews.page--]

 

  

 

  圖10 噪聲消除后的圖像

  通過這種處理方法,原圖像中的小塊噪聲和椒鹽噪聲基本被消除,手部圖像邊緣的某些像素點也會被當(dāng)作噪聲消除,但是不影響后續(xù)處理。經(jīng)過噪聲消除后的圖像如圖10( a) 所示。使用同樣的處理算法,可以得到后一幀的圖像處理結(jié)果如圖10( b)所示。

  3. 2 特征提取及動作識別

  獲取只含手部運動區(qū)域的圖像Hk( x,y) 和Hk+1( x,y) 后,掃描出手部圖像邊界,通過比較與計算判斷手?jǐn)[放位置和區(qū)域中心位置Pk( xk,yk) 和Pk+1( xk+1,yk+1) .手部擺放位置可以判斷手的上下或是左右運動。圖像處理和特征提取流程圖如圖11 所示。

  ( 1) Hk+1( x,y ) 和Hk( x,y ) 是相同的縱向擺放位置,手部在左右運動。

  ( 2) 根據(jù)列坐標(biāo)的大小來判斷手左右方向的移動如下:

  

 

  判斷上下運動的算法與判斷左右類似。若出現(xiàn)無法判斷的情況,則重新采集圖像,進(jìn)行處理和判斷,直到能夠判斷方向為止。

  

 

  圖11 圖像處理算法流程圖

  3. 3 紅外遙控算法原理

  本系統(tǒng)選擇最常用的一種編碼方式uPD6121進(jìn)行學(xué)習(xí)、解碼和發(fā)射。紅外遙控器的紅外信號一般都是通過38 ~ 40kHz的載波調(diào)制而成。先對接收到的紅外信號進(jìn)行解調(diào),再記錄遙控編碼信號的脈沖寬度。學(xué)習(xí)子程序的流程圖如圖12 所示。采用計數(shù)器對信號高低電平計數(shù)的方法采集數(shù)據(jù)并保存。

  發(fā)射模塊根據(jù)DSP2 發(fā)送的指令找到對應(yīng)的編碼信號在外擴(kuò)RAM 的位置,將編碼調(diào)入內(nèi)存,然后通過編碼發(fā)送子程序,將編碼調(diào)制在38 kHz 載波上發(fā)送出去。用定時中斷0 產(chǎn)生38 kHz 的載波信號,用學(xué)習(xí)到的遙控編碼信號的低電平去控制載波輸出,此時定時器0 定時長度由相應(yīng)的遙控信號低電平寬度計數(shù)值確定。如果需發(fā)射的遙控信號為高電平,關(guān)定時中斷0; 如果為低電平,則開定時中斷0,從而實現(xiàn)遙控信號的脈寬調(diào)制發(fā)射。發(fā)射子程序流程如圖13 所示。

  

 

  圖12 學(xué)習(xí)子程序流程圖

  

 

  圖13 發(fā)射子程序流程圖

  3. 4 網(wǎng)卡驅(qū)動程序及上位機(jī)軟件設(shè)計

  3. 4. 1 網(wǎng)卡驅(qū)動程序及UDP 協(xié)議實現(xiàn)

  RTL8019AS 已經(jīng)實現(xiàn)以太網(wǎng)通信物理層功能,只需初始化芯片相應(yīng)的寄存器,編寫DSP 下驅(qū)動,便可啟動RTL8019AS.本系統(tǒng)采用TCP /IP 協(xié)議族中的UDP 協(xié)議( user datagram protocol) 進(jìn)行通信,實現(xiàn)通過網(wǎng)絡(luò)把DSP 采集到的圖像信息發(fā)送到上位機(jī)。

  3. 4. 2 上位機(jī)軟件編寫

  上位機(jī)軟件采用C#語言編寫,實現(xiàn)UDP通信協(xié)議。上位機(jī)軟件實現(xiàn)接收下位機(jī)的數(shù)據(jù),還原圖像數(shù)據(jù)并顯示等功能。同時,上位機(jī)還可以向下位機(jī)發(fā)送命令,方便系統(tǒng)調(diào)試。

  3. 4. 3 圖像數(shù)據(jù)發(fā)送及還原

  下位機(jī)采用UDP發(fā)送數(shù)據(jù),把數(shù)據(jù)的每一行作為一個UDP數(shù)據(jù)包,一幅圖像分成100個數(shù)據(jù)包進(jìn)行發(fā)送。為了讓上位機(jī)完整接收一幅圖像,在每幅圖像開始發(fā)送之前,先發(fā)送一個規(guī)定的幀開頭數(shù)據(jù)包,在每一幅圖像發(fā)送完畢之后,也發(fā)送一個規(guī)定幀結(jié)尾數(shù)據(jù)包。上位機(jī)根據(jù)這些標(biāo)定將100個數(shù)據(jù)包利用C#語言的相關(guān)函數(shù),轉(zhuǎn)換一定的圖片格式,在上位機(jī)進(jìn)行顯示。

  4. 系統(tǒng)測試

  4. 1 測試流程

  創(chuàng)建手勢樣本庫、手勢圖像預(yù)處理、特征提取、實時手勢圖像與庫模型預(yù)測、識別結(jié)果、執(zhí)行操作等。

  4. 2 測試結(jié)果

  本設(shè)計自定義手勢及編號如圖14所示,其中手勢1表示開機(jī),手勢2表示關(guān)機(jī)、手勢3表示換臺的遞增,手勢4表示換臺的遞減,手勢5表示音量增加,手勢6表示音量減小等功能。

  對組裝好硬件電路系統(tǒng)進(jìn)行整體測試。測試者在攝像頭的拍攝范圍內(nèi)進(jìn)行上述6種手勢各從左向右、從右向左、從上向下和從下向上10次緩慢運動,在每種手勢40次的識別中識別率如表1所示。

  表1 識別率

  

 

  測試結(jié)果表明,本算法識別手勢的準(zhǔn)確率在96%左右,遙控的有效范圍在4 m 左右,能夠?qū)崿F(xiàn)電視機(jī)的頻道更換和音量調(diào)節(jié)功能。

  5. 總結(jié)

  本文設(shè)計的手勢識別電視遙控器系統(tǒng),利用攝像頭使手勢動作與電視機(jī)進(jìn)行交互,采用紅外信號遙控電視機(jī),在紅外傳輸有效距離內(nèi),可以根據(jù)個人喜好,任意改變手勢識別樣本庫系統(tǒng),使得電視遙控更加人性化,并為實現(xiàn)家庭數(shù)字設(shè)備操控一體化提供可能。

  

 

  圖14 自定義手勢及編號

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉