當(dāng)前位置:首頁 > 消費電子 > 觸控感測
[導(dǎo)讀] 1研究背景 生物識別技術(shù)是目前最為方便與安全的識別系統(tǒng)。生物識別是依靠人體的身體特征來進行身份驗證的一種解決方案。由于與傳統(tǒng)的生物識別技術(shù)相比,人臉識別因具有更為簡便、準(zhǔn)確、經(jīng)濟及可擴展

1研究背景

生物識別技術(shù)是目前最為方便與安全的識別系統(tǒng)。生物識別是依靠人體的身體特征來進行身份驗證的一種解決方案。由于與傳統(tǒng)的生物識別技術(shù)相比,人臉識別因具有更為簡便、準(zhǔn)確、經(jīng)濟及可擴展性良好等眾多優(yōu)勢而普遍為人們所看好,被廣泛應(yīng)用于安全驗證、監(jiān)控、控制等各個方面。但到目前為止,能夠滿足人們需求的理想系統(tǒng)尚未出現(xiàn)。

根據(jù)FERET‘97 測試報告,目前的人臉識別算法對于不同的攝像機、不同的光照條件和年齡變化的適應(yīng)能力非常差。FRVT’2000評測結(jié)果表明,人臉識別系統(tǒng)的性能與FERET‘97的測試相比有了一定的進步,但其識別性能對各種條件,如光照、老化、距離、姿態(tài)等,仍然離人們的期望值較遠。

2問題的提出

本文僅考慮單人正面靜態(tài)灰度圖像,著重考慮人臉圖像的檢測和定位,不考慮頭部的俯仰、旋轉(zhuǎn)以及穿戴、遮蔽的情況,而且頭部的傾斜不超過15°。

本文的研究工作主要是提出了結(jié)合人臉模板和人臉特征進行人臉檢測的方法,對現(xiàn)有的人臉檢測與定位的方法提出了改進,進而提取臉部特征,并在此基礎(chǔ)上實現(xiàn)了一個智能識別系統(tǒng)演示軟件。本文所采用的方法,主要是基于參數(shù)化的橢圓型人臉模板與基于眼睛及嘴巴幾何特征相結(jié)合的人臉定位方法,以及根據(jù)其眼睛、鼻部及嘴部的幾何特征參數(shù),對實驗人臉庫進行監(jiān)督下的分類和統(tǒng)計的人臉識別方法。所采用的人臉數(shù)據(jù)庫是BioID人臉庫。

3基于人臉識別技術(shù)的智能系統(tǒng)設(shè)計方案

人臉自動識別系統(tǒng)包括下列主要技術(shù)環(huán)節(jié),首先是人臉檢測和定位,即從輸入圖像中找到人臉及人臉存在的位置,并將人臉從背景中分割出來,然后才是對歸一化的人臉圖像進行特征提取與識別。這兩個環(huán)節(jié)的研究獨立性很強。由于在很多特定情況下,人臉檢測與定位的工作比較簡單,因此“特征提取與識別”環(huán)節(jié)得到了更為廣泛和深入的研究;而近幾年來隨著人們越來越關(guān)心各種復(fù)雜情形下的人臉自動識別系統(tǒng),人臉檢測與定位才得到了較多的重視。

評價一個人臉自動識別系統(tǒng)的標(biāo)準(zhǔn),一個是誤識率即將某人錯識別為其他人,另一個是虛警率即將其他人識別為這個人。這二者之間是存在矛盾的,所以在實際問題中往往需要進行某種折衷。這一點同樣適用于特征提取與識別環(huán)節(jié),但是對于人臉檢測與定位,我們一般則要求誤識率要盡可能低,因為這樣才可以保證所要識別的人不會在這一步就丟失。

常用的人臉識別實驗庫以美國軍方的FERET 庫最為權(quán)威。另外如MIT、ORL 等庫也可以用來驗證算法在某些方面的能力。目前尚沒有專門測試人臉檢測和定位算法的圖像庫。

4基于人臉形狀特征的精確定位方法

4.1 人臉特征的檢測

特征檢測是人臉識別智能系統(tǒng)中的關(guān)鍵環(huán)節(jié),因為眼睛、鼻子和嘴巴等特征集中了人臉的人部分信息。對于人臉建模來說,不僅要檢測出這些特征,而且要準(zhǔn)確地加以定位。

假設(shè)人臉的姿態(tài)比較正,那么人臉上的特征是水平邊緣集中的區(qū)域。我們可以在低分辨率下提取水平邊緣,然后找到人臉區(qū)域內(nèi)富含這些邊緣的連通區(qū),作為人臉特征的候選區(qū)域。這些區(qū)域的位置和大小并不準(zhǔn)確,因為邊緣檢測本身容易出現(xiàn)位置偏移,連通區(qū)的大小也隨閾值而變化。所以還需要進一步修正上面的結(jié)果。對正面的人臉來說,眼睛、嘴巴等特征和整個人臉的尺寸之間存在先驗的約束關(guān)系,這就是人臉結(jié)構(gòu)的恒常性,因此我們利用這些約束關(guān)系確定特征區(qū)域的大小。

4.2 雙眼和嘴巴的定位

可以充分利用先驗知識,把眼睛和嘴巴表示為分段多項式曲線,然后用變形模板得到準(zhǔn)確的輪廓。眼睛輪廓的模型如圖1所示,由四段二次曲線組成,曲線的參數(shù)有8個:上半眼的中心(x0,y0)、連接內(nèi)外眼角的直線的傾角θ、上下半眼的高度h1和h2、內(nèi)眼角到上半眼中心的距離wl,外眼角到上半眼中心的距離w2,內(nèi)眼角到下半眼中心的距離w3。

圖1 眼睛輪廓模型

評價函數(shù)的選擇是關(guān)鍵。眼睛本身不具有—致的顏色信息,而邊緣信息比較豐富。因此,先對圖像進行邊緣提取,然后作適當(dāng)尺度的閉運算,就可以使眼睛內(nèi)部形成單一的高亮度區(qū)。在處理過的圖像中,眼睛內(nèi)部是高亮度區(qū),外部是低亮度區(qū)。因此可以定義評價函數(shù)如式(1)所示。其中D表示眼睛區(qū)域, 表示眼睛輪廓之外的帶狀區(qū)域, 表示輪廓之內(nèi)的帶狀區(qū)域。根據(jù)4段曲線表達式得到的眼睛區(qū)域可以初始化眼睛的輪廓,然后用最陡下降法迭代直至該輪廓收斂。

(1)

嘴巴輪廓的模型如圖2所示。由兩段四次曲線組成,曲線的參數(shù)有7個:嘴巴的中心(x0,y0)、連接兩嘴角的直線傾角θ、上下半嘴的高度h1和h2、嘴角到嘴巴中心的距離w,以及上下半嘴的四次項系數(shù)q1和q2。

圖2 嘴巴輪廓的模型

嘴巴的評價函數(shù)比較容易確定,可以通過唇色和膚色的分割將嘴巴區(qū)分出來。評價函數(shù)的表達式如式(2)所示。各符號的含義與眼睛模型相似。

(2)

5人臉檢測與定位軟件系統(tǒng)的實現(xiàn)

5.1 系統(tǒng)工作流程

本系統(tǒng)的工作流程如下:在圖片輸入后,首先進行圖象預(yù)處理,再利用橢圓模板匹配初步定位人臉。在對人臉方向進行校正后,再基于外形特征尋找眼睛和嘴巴,并基于相關(guān)性進行人臉區(qū)域驗證,最后輸出檢測與定位結(jié)果。

在人臉識別階段,先對檢測定位輸出的圖片進行特征提取,再在人工監(jiān)督下進行特征值統(tǒng)計。然后根據(jù)模板參數(shù)與特征統(tǒng)計值構(gòu)造判據(jù)。對輸入的待識別圖象,經(jīng)檢測、定位并計算模板參數(shù)和特征值,再由判據(jù)進行判別分類后輸出識別結(jié)果。

5.2 臉部檢測與定位結(jié)果

經(jīng)邊界檢測,臉部檢測與定位的結(jié)果如圖3所示。

圖3 同時考慮臉型、眼睛和嘴特征時的臉部定位結(jié)果

5.3 檢測與識別結(jié)果

本文利用BioID 人臉庫中的100幅靜止灰度圖片(BioID_0000.pgm- BioID_0099.pgm)作為素材進行了實驗。實驗結(jié)果如表1所示。

表1 檢測與識別結(jié)果

5.4 結(jié)果分析

在上述3種方法中,參數(shù)橢圓模板結(jié)合眼睛、眉毛和嘴巴特征的定位方法顯示出較好的性能。

在采用基于膚色進行圖像分割,進而定位人臉的方法時,由于膚色受環(huán)境光照、背景中近似膚色物體的存在的影響,導(dǎo)致定位結(jié)果較差。在改變閾值大小時, 對判斷的結(jié)果影響不大,這表明:第一,膚色與背景色混雜,以及強烈的光照的影響,是造成誤判的主要因素;第二,在一種上述問題不太嚴(yán)重的比較“理想”的狀態(tài)下,膚色模型也的確能有效地發(fā)揮作用,以抵消來自于外形姿態(tài)等方面的影響。對膚色模型的改進應(yīng)該集中在對于光照的處理和與背景的分離上,利用模板進行檢測與定位即是有效分離背景干擾的一種方法。

在單純采用橢圓模板進行檢測與定位時,檢測的正確率得到了一定的提高,但總的來說還是很難令人滿意的。在通過改變橢圓的參數(shù)試驗其性能時,其對參數(shù)變化的適應(yīng)性把高。經(jīng)分析,可以認(rèn)為是復(fù)雜的背景直接影響了橢圓模板的有效性。而對參數(shù)變化的適應(yīng)性差,主要是因為圖像庫中的人臉外形多為長橢圓形,表現(xiàn)在參數(shù)上差別不大。因而,僅僅通過橢圓模板進行人臉的檢測與定位,其效果是難以令人滿意的。

在參數(shù)橢圓模板的基礎(chǔ)上,加入對眼睛、眉毛和嘴巴特征的參數(shù)描述,進而利用改進的模板進行檢測與定位,取得了較好的結(jié)果。并且,在通過調(diào)節(jié)參數(shù)區(qū)分目標(biāo)人物時,也有較好的表現(xiàn)。經(jīng)分析,檢測與定位成功率的提高得益于對臉部器官外形參數(shù)的有效地描述,使其過濾了大多數(shù)的背景中的干擾,取得了較好的效果。在調(diào)節(jié)面部器官的外形參數(shù)時,模型取得了較好的區(qū)分效果,這可以認(rèn)為是各目標(biāo)人物的個人特征的真實反應(yīng)。其中仍然存在的問題是,在人臉傾斜,或有眼鏡、大片頭發(fā)遮蓋等情況發(fā)生時,將對檢測與定位的效果產(chǎn)生嚴(yán)重的影響。

6 結(jié)論

人臉檢測與識別研究的趨勢是利用多種線索(頭發(fā)、膚色、器官、輪廓、模板等),綜合多種分類方法(混合高斯模型、概率模型、神經(jīng)網(wǎng)與支持向量機等),啟發(fā)式信息與統(tǒng)計學(xué)習(xí)方法相結(jié)合??傊捎谌四槍ο蟮姆莿傮w性,以及姿態(tài)、光照、遮擋等各種變化因素的影響和實時性要求,高性能的人臉檢測仍是一個困難的問題。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉