基于數(shù)學(xué)形態(tài)學(xué)的人臉檢測研究
掃描二維碼
隨時隨地手機(jī)看文章
O 引言
計(jì)算機(jī)人臉識別是模式識別和人工智能領(lǐng)域的一個前沿課題,有著十分廣泛的應(yīng)用前景。人臉自動識別系統(tǒng)主要包括人臉檢測和定位,人臉特征的提取和識別兩個主要部分。
數(shù)學(xué)形態(tài)學(xué)是一種基于集合論的非線性理論,是格理論在空間結(jié)構(gòu)上的應(yīng)用,其基本思想是基于像素間的邏輯關(guān)系而非代數(shù)關(guān)系。這種處理方式有利于對圖像的幾何描述,不同于其它基于代數(shù)的線性圖像處理理論,具有不模糊圖像邊界及細(xì)節(jié)的特點(diǎn),是一種用于圖像處理的新理論和新方法。
1 膚色區(qū)域檢測
一般情況下圖像是以RGB形式存放的,但是RGB表示方法不適合于皮膚模型。在RGB空問,三基色(r,g,b)不僅代表了顏色,還表示了亮度。由于周圍環(huán)境光照的改變,亮度可能使人臉的檢測變的更加復(fù)雜,在皮膚的分割過程中是不可靠的。為了利用膚色在色度空間的聚類性,需要把顏色表達(dá)式中的色度信息與亮度信息分開。將RGB轉(zhuǎn)換為色度與亮度分開的色彩表達(dá)空間就可以達(dá)到這個目的。在實(shí)驗(yàn)中選用YCbCr空間經(jīng)行膚色區(qū)域檢測。Cb和Cr分量分別表示藍(lán)色和紅色的色度,這兩種色度在光照改變時是穩(wěn)定的,Y代表容易被改變的亮度信息。該顏色空間可以從RGB格式線性變換得到,轉(zhuǎn)換公式為
亞洲人和歐美人的人臉膚色的色調(diào)一般介于紅和黃之間。為了確定人臉膚色在各個顏色分量上具有較強(qiáng)代表性的取值范圍,Douglas Chai在實(shí)驗(yàn)中選取臉上除去眼睛、嘴唇、等區(qū)域,并且選取分別在不同光照、環(huán)境、分辨率下得到的人臉,最終得到的膚色分布范圍如圖(1)所示在左邊的Cb圖中,可以看出膚色信息集中分布在橫坐標(biāo)[112,133]內(nèi);右邊的Cr圖中,膚色信息集中分布在[140,175]內(nèi),所以可以得到人臉膚色的判斷公式:
在我們的研究中使用這個門限進(jìn)行膚色分割,從而得到人臉區(qū)域的二值化圖像。
2 膚色區(qū)域處理
2.1 數(shù)學(xué)形態(tài)學(xué)基本定義
數(shù)學(xué)形態(tài)學(xué)中二值圖像的形態(tài)變換是針對集合的處理,其形態(tài)學(xué)算子的實(shí)質(zhì)是表達(dá)物體或形態(tài)的集合與結(jié)構(gòu)元素間的相互作用,因此結(jié)構(gòu)元素的形態(tài)就決定了這種運(yùn)算所提前的信號的形狀信息,形態(tài)學(xué)圖像處理是在圖像中移動一個結(jié)構(gòu)元素,然后將結(jié)構(gòu)元素與二值圖像進(jìn)行交、并等集合運(yùn)算,其基本的形態(tài)運(yùn)算是腐蝕(erodeoperator)和膨脹(flilate)。令B(x)代表結(jié)構(gòu)元素,對工作空間E中的每一點(diǎn),腐蝕和膨脹的定義分別為:
腐蝕具有使目標(biāo)縮小、目標(biāo)內(nèi)孔增大,以及外部孤立噪聲消除的效果;膨脹是將圖像中與目標(biāo)物體接觸的所有背景點(diǎn)合并到物體中的過程,結(jié)果是使目標(biāo)增大、空洞縮小,可填補(bǔ)目標(biāo)中的空洞,使其形成連通域。
在數(shù)學(xué)形態(tài)學(xué)圖像處理中,除了腐蝕和膨脹這兩種基本運(yùn)算外,還有兩種非常重要的運(yùn)算方法,即開運(yùn)算和閉運(yùn)算,其定義如下:[!--empirenews.page--]
2.4 眼睛和嘴唇的檢測
由以上工作,我們確定了人臉的位置,這為我們下一步人眼和嘴唇的檢測縮小了范圍。
本文從形態(tài)學(xué)的角度進(jìn)行眼睛和嘴唇的檢測。設(shè)人臉區(qū)域?yàn)锳,構(gòu)造一個半徑為r的圓盤形結(jié)構(gòu)元素B。用結(jié)構(gòu)元素B對人臉區(qū)域A做閉運(yùn)算
[!--empirenews.page--]
經(jīng)實(shí)驗(yàn)證明,圓盤結(jié)構(gòu)元素的半徑r取值為8或9達(dá)到最佳效果。檢測出的眼睛和嘴唇的效果如圖(4)和圖(5)由上圖我們可以看出,結(jié)構(gòu)元素B對人臉區(qū)域A做閉運(yùn)算后,人臉區(qū)域保持完整,而且人眼和嘴唇也被保存了下來,接下來我們可以通過找白色小區(qū)域中心的方法來定位眼睛和嘴唇。
3 分析與結(jié)論
本方法實(shí)驗(yàn)照片來自互聯(lián)網(wǎng)和數(shù)碼相機(jī)所拍攝照片,部分實(shí)驗(yàn)檢測結(jié)果如圖(6)所示。
本文算法利用YCbCr顏色空間進(jìn)行膚色區(qū)域分割,分割的膚色區(qū)域簡潔、獨(dú)立性好,減少了背景的干擾,又利用數(shù)學(xué)形態(tài)學(xué)平滑了邊界以利于人臉區(qū)域的提取;在對人眼和嘴的檢測中,充分利于了數(shù)學(xué)形態(tài)學(xué)模板大小和形狀的靈活定義和計(jì)算快速的特點(diǎn),加快了檢測速度,提高了檢測的準(zhǔn)確性,節(jié)約了時間。結(jié)果表明,本文的算法對正面人臉、具有一定旋轉(zhuǎn)角度的人臉和復(fù)雜背景下的人臉都可以進(jìn)行精確的識別和檢測。