當前位置:首頁 > 嵌入式 > 嵌入式硬件
[導讀]項目控制以眼球興趣移動作為控制判決依據,符合人眼觀察特點,對于基于視覺興趣的環(huán)境信息控制研究具有一定意義,運用前景廣泛。設計系統具備兩路眼動視頻監(jiān)測及眼球運動的實時檢測能力,同時可實現相應的遠端視頻圖像獲取及云臺移動、攝像頭對焦同步,具有完整的高速處理系統特點,整體數據吞吐能力超過100Mb/S,同步速率達到10次/S。

課題背景與現狀

人體的體感控制是智能控制設備的一個典型的研究方向,其典型的代表就是基于人體表現的運動控制,已被廣泛應用于游戲及體育訓練等很多方面。盡管業(yè)界廣泛認為基于腦波控制是體感控制的最有效措施,但由于腦波信息的復雜性使得相關技術仍舊停留在實驗室研究階段。視頻信息是人類獲取外界信息的主要渠道,相應的眼球運動也具有典型的行為模式特征,其運動范圍小,釋義明顯,因而基于眼球興趣移動信息的控制也被業(yè)界廣泛關注,相應的產品在國外也有一定表現。

眼動儀是用于記錄人在處理視覺信息時的眼動軌跡特征的一種設備,根據角膜和瞳孔的反光原理設計的眼動儀有:美國應用科學實驗室(ASL)生產的504型和501型眼動儀、加拿大SR公司生產的eyelinkII型頭盔式眼動儀、法國的Metrovision公司生產的Mon VOGl型和Mon VOG2型眼動儀、美國Fourward Optical Technology公司生產的第六代雙普金野眼動儀以及德國SMI公司生產的MEye Track型眼動儀等等。美國LC技術公司生產的eye gaze communication system也是用這個原理生產的眼動儀,它可以幫助那些不能用手進行計算機鍵盤操作的病人用眼睛代替手來操作鍵盤。

根據電流記錄法原理生產的眼動儀有法國Metrovision公司生產研制的Model Mon EOG眼動儀,這種眼動儀可以記錄水平和垂直方向的眼動情況。

根據電磁感應原理生產的眼動儀有荷蘭SKALAR公司生產的磁感應眼動記錄系統。該系統被廣泛應用于神經生理學、閱讀、神經病學和視覺研究中。

另外,瑞典托比公司和中國聯想集團3月1日在德國漢諾威2011年信息和通信技術博覽會上共同推出世界上第一款用眼睛控制的筆記本電腦。該電腦的焦點總能聚集在用戶正在注視的屏幕位置上,其眼控功能可以與鍵盤和鼠標聯動以提高使用電腦的速度。

目前結合視頻場景觀測,腦波及眼動監(jiān)測的人體研究設備發(fā)展迅速,相關研究具有較強的科研價值。

研究的目的與意義

項目以人眼的興趣移動為研究對象,設計相應的硬件系統同步遠端攝像頭的移動、對焦,經過視頻眼鏡顯示遠端攝像頭采集的圖像。

項目控制以眼球興趣移動作為控制判決依據,符合人眼觀察特點,對于基于視覺興趣的環(huán)境信息控制研究具有一定意義,運用前景廣泛。設計系統具備兩路眼動視頻監(jiān)測及眼球運動的實時檢測能力,同時可實現相應的遠端視頻圖像獲取及云臺移動、攝像頭對焦同步,具有完整的高速處理系統特點,整體數據吞吐能力超過100Mb/S,同步速率達到10次/S。

方案設計和實施計劃系統設計

本作品的系統設計示意圖如圖1所示:

圖1 系統設計圖

系統按照功能分為4個模塊:

云臺模塊,由云臺、攝像頭和步進電機組成,主要功能是控制云臺攝像頭的水平轉動、俯仰運動和自動對焦,并采集圖像;視頻眼鏡模塊,由視頻眼鏡及其控制板,內置兩個微型攝像頭組成,主要功能是用于顯示云臺攝像頭采集的圖像并通過內部放置的兩個微型攝像頭采集人眼圖像;圖像處理及顯示平臺,采用Intel低功耗ATOM系列處理器平臺,安裝Windows XP操作系統,由液晶顯示屏顯示界面,主要功能是顯示工作界面,實現人眼運動識別并返回計算結果;主控制板,采用FPGA為主處理芯片,帶有高速存儲器和串口、視頻接口、云臺接口等,它是整個系統的核心控制模塊,主要功能是負責與云臺、圖像處理平臺和視頻眼鏡之間的數據交互,管理整個系統的數據流和控制流;

工作流程

整個工作流程如下圖所示:

圖2 工作流程

通過視頻眼鏡內部的兩個微型攝像頭采集人眼圖像,圖像處理平臺實現人眼的運動識別,主控制板根據圖像處理結果控制云臺攝像頭的移動和自動對焦,并將攝像頭采集的圖像在視頻眼鏡中顯示;繼續(xù)對人眼進行監(jiān)控判斷,形成不斷循環(huán)的閉環(huán)運行流程。

研究的主要內容模塊組成云臺模塊

云臺模塊由云臺、電機模塊、攝像頭和外接口組成,它的功能是控制電機的轉動從而實現攝像頭的水平和垂直方向的運動,同時把攝像頭采集的圖像輸出。

云臺采用PTS-3030CQ型號的吊裝云臺(圖4-1-1-1),內置兩個24V交流電機,水平旋轉角度最大為355度,俯仰角度范圍為-5度到50度。由于該云臺需要交流供電,不滿足本項目要求,所以將原有的交流電機更換成直流步進電機。

圖 4-1-1-1

電機模塊由兩個12V直流兩相步進電機(圖4-1-1-2)和配套的電機驅動器組成。步進電機的步距角為1.8度,最大靜力矩約為3600 g*cm,如圖1-2所示。驅動器的驅動電壓小于40V,驅動電流0.8—5V可調,細分數可由撥碼開關設定1/2,1/4,1/8,1/16。

圖4-1-1-2

攝像頭采用彩色一體化攝像機(圖4-1-1-3),成像元件是SONY CCD image sensor,PAL制信號輸出,22倍光學變焦,同時有自動聚焦和手動聚焦兩種模式,可以通過RS485協議對攝像頭進行相關控制,攝像頭所需電源為12V直流電壓,200mA電流。

圖4-1-1-3

外接口采用25針接插件,主要功能是整合云臺內部所有控制線,方便與外部連接和使用。外接口定義如圖4-1-1-4所示。

圖4-1-1-4

云臺模塊通過更換電機,安裝攝像頭,整合所有控制線到外接口從而實現對原有的云臺改裝,滿足本項目實際需要。

視頻眼鏡模塊

視頻眼鏡模塊由headplay視頻眼鏡,兩個微型攝像頭和USB視頻采集卡改裝而成,兩個微型攝像頭放置在視頻眼鏡內,同時其視頻線連接到USB視頻采集卡上,主要功能是一方面使用者戴上視頻眼鏡能觀看視頻,另一方面兩個內置的微型攝像頭采集使用者左右眼圖像,通過USB視頻采集卡發(fā)送到上位機用于瞳孔定位和識別。

視頻眼鏡采用headplay視頻眼鏡(如圖4-1-2-1、4-1-2-2、4-1-2-3所示),它的顯示器類似PC的顯示設備,采用先進的LCOS硅基液晶,解析度高且省電,同時可提供640*480、800*600、1024*768三種規(guī)格分辨率,帶來52英寸的視覺感受;在顯示器的下方設置有2組可調滑塊,用戶可根據實際佩戴需求調節(jié)焦距和左右屏幕的距離。另外這款視頻眼鏡具有豐富的外圍接口,提供AV、S-video、VGA三種接口,并支持PAL、NTSC和SECAM格式;同時支持CF、USB設備,能讀取圖像、音頻和視頻,并具備視頻解碼能力,支持MP3、MPEG3、MPEG4、AVI、JPEG等。

圖4-1-2-1

圖4-1-2-2

圖4-1-2-3

微型攝像頭采用XL-3010CP4超微型攝像頭(圖4-1-2-3),尺寸僅為12mm*12mm,1/4 SONY CCD,PAL制(582*500)視頻輸出,12V直流電壓和100mA電流供電,

圖4-1-2-3

USB視頻采集卡采用一路easycap視頻采集卡(圖4-1-2-4),輸入接口有AV、S端子和音頻輸入,可將采集的視頻和音頻通過USB口傳輸到電腦上播放或存儲。

圖4-1-2-4

圖像處理及顯示平臺

圖像處理平臺采用IEI Technology Corp的WAFER-945GSE母板(圖4-1-3-1,4-1-3-2),主要功能是處理USB視頻采集卡采集的左右眼圖像,識別人眼的運動方向,并把計算結果通過串口發(fā)送到信號處理板。

WAFER-945GSE母板基于Intel Atom系列低功耗處理平臺,1.6GHZ的時鐘頻率,533MHz前端總線和512KB L2 cache,同時外圍接口豐富,如網口,串口,USB口,VGA,LVDS等。本項目中在該板上安裝XP精簡版操作系統,運行VC程序實現圖像接收、處理和結果發(fā)送功能。

圖4-1-3-1

圖4-1-3-2

主控制板

主控制板采用FPGA為主處理芯片,帶有高速存儲器和串口、視頻接口、云臺接口,通過各個接口與圖像處理平臺、視頻眼鏡和云臺之間實現數據交互,管理整個系統的數據流和控制流。

下圖是主控制板設計圖:

實物圖(第一版)如下圖所示,第二版已經投出。

主要芯片介紹:

XC3S1200:可編程邏輯器件(FPGA)

FPGA 的優(yōu)點:易于實現并行處理;易于實現流水線操作;通過開發(fā)工具在計算機上完成設計,電路設計周期短;對硬件系統可靠性高,程序跑飛可能性不大;規(guī)模越來越大,實現功能越來越強,同時可以實現系統集成;可反復修改邏輯。FPGA在系統中起橋接作用,又是系統的主控者,由它來完成外圍芯片的控制,及數據的傳輸。

XILINX公司的FPGA目前分為2大類:Spartan類和Virtex類,前者主要面向低成本的中低端應用,是目前業(yè)界成本最低的一類FPGA;后者主要面向高端應用,屬于業(yè)界的頂級產品。這兩個系列的差異僅限于芯片的規(guī)模和專用模塊上,都采用了先進的0.13、90甚至65制造工藝,具有相同的卓越品質。

目前,比較流行的FPGA類型是Spartan3E系列,其家族列表如下:

綜合考慮各系列FPGA的塊RAM容量和最大可用I/O數以及處理速度等指標,選用中Spartan3E系列的XC3S1200E,其封裝為FG676。

SAA7113:8位視頻解碼芯片

SAA7113是飛利浦公司視頻解碼系列芯片的一種,非常具有代表性,在很多視頻產品如電視卡、MPEG2、MPEG4中都有應用,熟悉了7113的原理后,對其它系列芯片SAA7114、7115、7118就會很容易理解。SAA7113的主要作用是把輸入的模擬視頻信號解碼成標準的“VPO”數字信號,相當于一種“A/D”器件。7113兼容全球各種視頻標準。

ADV7179:8位視頻編碼芯片

ADV7179適合各種優(yōu)先考慮封裝空間的視頻應用,如第三代移動電話或數碼相機等,提供視頻輸出功能。該器件采用緊湊的芯片級封裝,尺寸僅為6 mm x 6mm,并提供適用于CCIR656標準視頻輸入的選項,內含或不含嵌入式時序信息。視頻性能不受影響。它具有高級濾波功能(SSAF濾波器)和最高達-80 dB的專業(yè)級視頻信噪比(SNR),可在小屏幕上實現出色的顯示質量。

(4)SP3220:串口通信芯片

SP3220E包含一個高效電荷泵,工作于3.3V電壓時,只需0.1μF電容即可操作。該電荷泵允許SP3220E在+3.3V到+5.0V的電壓范圍內發(fā)送符合RS-232協議的信號。SP3220E的ESD保護使得收發(fā)器的管腳可承受±15kV的人體放電模式和IEC1000-4-2氣隙放電模式。
SP3220E包含低功耗關斷模式,該模式下驅動器輸出和電荷泵將被禁止。關斷狀態(tài)下,電源電流低于1μA。

程序設計1 上位機程序設計

上位機程序采用VC6.0開發(fā)環(huán)境和OpenCV圖像處理庫編寫,主要功能是通過處理人眼圖像,識別人眼的運動,從而判別人眼注視方向。并將計算結果通過串口返回給主控制板。

界面效果圖

程序流程圖

瞳孔定位算法

本算法主要基于圖像的灰度分布來定位人眼瞳孔和輪廓,根據左右眼瞳孔和輪廓的位置來判斷人眼的注視方向,具體步驟如下所示:

第一步,將左右眼圖像轉換成320*240的圖像;

第二步,選擇合適的閾值將灰度圖像二值化,使眼部輪廓清晰地呈現出來,然后從圖像的四周開始向內尋找眼部輪廓找,并用矩形畫出眼部輪廓;

第三步,將圖像轉換成灰度圖像,選擇合適大小的區(qū)域,在眼部輪廓中尋找灰度最小的那塊區(qū)域,取該區(qū)域的中心設為檢測到的瞳孔位置;

第四步,根據左右眼瞳孔與眼睛的輪廓的位置關系和移動情況,設定合適的閾值來判斷人眼的注視方向(上、下、左、右、平視);

第五步,將計算結果發(fā)送給主控制板,由主控制板控制云臺電機的轉動帶動云臺攝像頭的轉動。

FPGA程序設計

程序分為串口接收與云臺控制部分和視頻處理部分。兩部分程序并行運行,相互保持獨立。

2.2.1

串口接收與云臺控制部分

通用板處理后結果用串口發(fā)送到串口接收與云臺控制模塊,此處對命令進行譯碼,分別進行云臺電機的運動控制和攝像頭的拉遠拉近以及聚焦的控制。

2.2.2

視頻處理部分

先配置編碼芯片和解碼芯片,對視頻輸入信號進行行,列,場的分辨。視頻處理主要包括字符疊加,顏色的改變,二值處理等等,處理完的視頻信號疊加上行場信號進行輸出。

2.3硬件電路設計

主芯片采用BGA封裝,其他芯片為SMA表貼封裝,電路板為八層,信號線寬為5mil,電源線寬30mil,板厚2mm, 為了保證信號完整性,其中4層為信號走線層,兩層地層,兩層電源層,信號層之間用地層或電源層隔開,相鄰信號層走線盡量保持垂直。

設計性能指標雙路人眼圖像的分辨率為320x240,平均處理速度為10幀/秒;視頻眼鏡雙路VGA視頻顯示,分辨率為640x480,幀頻為25幀/秒;水平方向視場范圍為0到355度,豎直方向視場范圍為-5到50度,水平轉動和俯仰運動的最小角度是0.9度;水平方向視場最大轉速約為20度/s,垂直方向視場最大轉速約為10度/s;;

創(chuàng)新點和結論將遠端攝像頭與人眼的觀察動作同步,實現觀察范圍和對象的自動調整,整個控制過程符合人體用眼習慣,方便快捷;將專用系統平臺(硬件和軟件自行設計)和通用系統平臺(軟件設計)高效聯合使用;模塊化設計,方便二次開發(fā),可作為高校學習和實驗的平臺。

成果的應用前景醫(yī)療電子領域

在現場手術和遠程醫(yī)療中,利用高性能攝像頭可以輔助醫(yī)生準確精細進行手術,同時操作更加方便、人性化;

車輛駕駛

駕駛者可利用該系統通過人眼的移動控制車輛的行駛方向,為殘疾人群駕駛車輛提供可能;

探測和監(jiān)控

將該系統組裝在機器人上,用于在極端環(huán)境或者對人體有害的環(huán)境等條件下遠程控制機器人探測目標;

消費電子領域

基于視覺信息的人機交互可應用于3D游戲和家庭影院;

軍事領域

可應用于頭盔顯示器,在車輛、飛機駕駛員以及單兵作戰(zhàn)時的命令傳達、戰(zhàn)場觀察、地形查看、夜視系統顯示、車輛和飛機的炮瞄系統等;

心理學科學研究

通過設置特定視頻場景并實時獲得眼球動作,一定程度上可獲得測試者心理表現的信息,相應的技術結合腦電及心電的監(jiān)測可以促進對人體系統信息反映及心里活動的研究;

實驗平臺

模塊化設計,可作為高校課程實驗和課外創(chuàng)新活動的平臺,學生可以編寫自己的算法實現不同的功能。

雖然我國在此領域的研究和開發(fā)工作已經開展,但是目前國內市場上尚無具有完全自主知識產權的同類產品。由于其在民用和軍用方面的廣泛和重要的應用,其經濟效益十分可觀。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉