當(dāng)前位置:首頁 > EDA > 電子設(shè)計(jì)自動(dòng)化
[導(dǎo)讀]摘要:2D人臉識(shí)別技術(shù)雖已成熟,但由于單一的2D圖像不能提供識(shí)別所需的完整信息,故其識(shí)別精度很難進(jìn)一步提高。在人臉識(shí)別過程中,特征提取是影響識(shí)別效果的一個(gè)重要環(huán)節(jié),在分析了傳統(tǒng)的主成分分析法和由此改進(jìn)的2D

摘要:2D人臉識(shí)別技術(shù)雖已成熟,但由于單一的2D圖像不能提供識(shí)別所需的完整信息,故其識(shí)別精度很難進(jìn)一步提高。在人臉識(shí)別過程中,特征提取是影響識(shí)別效果的一個(gè)重要環(huán)節(jié),在分析了傳統(tǒng)的主成分分析法和由此改進(jìn)的2D PCA方法的基礎(chǔ)上,提出了3D人臉識(shí)別方法。該方法將人臉圖像分為幾個(gè)部分分別進(jìn)行特征提取,同時(shí)充分考慮每個(gè)部分所包含的特征信息量的多少,并在分類時(shí)賦予它們不同的權(quán)值。因此,將人臉用立體圖像來表示并進(jìn)行識(shí)別是目前提高人臉識(shí)別精度的前沿課題。
關(guān)鍵詞:3D人臉識(shí)別;人臉建模;3D人臉形變模型;視頻圖像

    人臉識(shí)別是基于生物特征識(shí)別技術(shù)的身份認(rèn)證中最主要的方法之一,涉及計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、模式識(shí)別、機(jī)器學(xué)習(xí)、感知科學(xué)、人工智能、計(jì)算智能等技術(shù),3D人臉識(shí)別主要分為人臉檢測、人臉特征和人臉識(shí)別三個(gè)過程。為了提高人臉的識(shí)別精度,本文對(duì)3D人臉的自動(dòng)識(shí)別系統(tǒng)及識(shí)別算法進(jìn)行了研究,給出了3D人臉識(shí)別存在的問題。

1 3D人臉自動(dòng)識(shí)別系統(tǒng)
    普通的人臉識(shí)別一般分為圖1所示的三個(gè)過程。圖2所示是一個(gè)典型的3D人臉識(shí)別系統(tǒng)的組成框圖。其中,圖像獲取部分負(fù)責(zé)獲取來自于攝像機(jī)或是掃描儀等設(shè)備的圖像,通過程序?qū)⑵滢D(zhuǎn)換為可處理的數(shù)字圖像格式;檢測定位是通過對(duì)輸入的圖像進(jìn)行處理分析,判斷圖像中是否有人臉,如果有人臉,則作出準(zhǔn)確的定位;特征提取是在預(yù)處理后的人臉圖像中按照某種策略抽取出識(shí)別的特征。


    人臉模型主要分為剛性模型和塑性模式,剛性模型可以滿足對(duì)人頭部跟蹤檢測的要求,主要用于表示人的頭部位置、姿態(tài)、方向等;塑性實(shí)體主要處理人臉識(shí)別、表情識(shí)別、唇語識(shí)別等問題,它涉及面部器官、肌肉和表皮的運(yùn)動(dòng)。
    目前主要的三維建模工具有3DSMAX,MAYA,AUTOCAD等。
1.1 結(jié)合一般人臉模型的建模
    由于人臉的復(fù)雜性和相似性,直接采用視覺重建算法進(jìn)行3D人臉的重建,在精度和實(shí)用性上,相對(duì)于昂貴的硬件采集方法,都不能達(dá)到很好的效果。為了重建精度較高的人臉模型,下面引入了一般人臉3D模型。
    一般人臉模型的主要思想是定義一個(gè)平均的人臉3D模型,其空間坐標(biāo)點(diǎn)集為Sg={xgi,ygi,zgi},i=1,2,…,n,該空間坐標(biāo)集表達(dá)了常見的人臉表面形狀的共同特性。該思想認(rèn)為,不同人臉的3D結(jié)構(gòu)S。都可 以通過一般人臉模型Sg中每個(gè)空間點(diǎn)的位置變化來表達(dá),即特定的人臉模型Sp=Sg+△S,(xpi,ypi,zpi}={xgi+△xi,yg+△yi,zgi+△zi}。形變量△S如何求取具有不同的方法,但核心思想是利用人臉模型提取表達(dá)五官特征(眼睛、鼻子、嘴、臉頰、眉毛)的輪廓點(diǎn)集Sf={xfj,yfj,zfj},j=1,2,…,m(其中m<<n),然后利用相應(yīng)的輪廓信息或特征點(diǎn)隊(duì)形的深度信息在一般人臉模型和特定人臉模型之間建立一個(gè)光滑的3D位移插值函數(shù)f(Sg),并使f(Sg)對(duì)于輪廓或特征點(diǎn)集合均滿足f(Sj)=△Sf,進(jìn)而從f(Sg)得到一般人臉模型上每一點(diǎn)的位移△S。
1.2 結(jié)合3D人臉形變模型的建模
    3D人臉形變模型的核心思想是利用有限數(shù)量的3D人臉模型的線性組合來表達(dá)任何一個(gè)3D人臉。在用3D人臉形變模型建模時(shí),可將模型的形狀坐標(biāo)集合記為s=[x1,y1,z1,…,xN,yN,zN]T,即包括N個(gè)頂點(diǎn)的x,y,z坐標(biāo);再將對(duì)應(yīng)一個(gè)人臉的紋理表示為一個(gè)紋理向量t=[R1,G1,B1,…,RN,GN,BN]T,即包括N個(gè)對(duì)應(yīng)頂點(diǎn)的RGB值(假設(shè)有效紋理的數(shù)據(jù)等于頂點(diǎn)數(shù))。

     形變模型由M個(gè)人臉樣本數(shù)據(jù)構(gòu)成,這些數(shù)據(jù)分別表示為它的3D形狀和紋理兩部分,也可寫成M個(gè)樣本圖像的質(zhì)心坐標(biāo)表達(dá)式,即:
   
    使用PCA對(duì)3D人臉數(shù)據(jù)進(jìn)行壓縮,再把基底變換到一個(gè)由對(duì)應(yīng)協(xié)方差距陣的特征值按降序排列對(duì)應(yīng)的特征向量si和ti形成的正交坐標(biāo)系下,則有(α,β∈RM-1):
   
    式中:是形狀協(xié)方差矩陣Cs的特征值。p(β)的計(jì)算與p(α)的計(jì)算類似。
    最終定義的3DMM為[smodel(α),tmodel(β)],由兩個(gè)變量參數(shù)確定a=[a1,a2,…,aM]T,b=[b1,b2,…,bM]T。這樣,任意新的人臉都可以通過變化a,b來控制其形狀和紋理。

2 基于視頻圖像的識(shí)別算法
    特征臉方法通常利用主分量分析進(jìn)行降維和提取特征。該方法選擇與原數(shù)據(jù)協(xié)方差矩陣前幾個(gè)最大特征值對(duì)應(yīng)的特征向量構(gòu)成一個(gè)組基,以達(dá)到最佳表征原數(shù)據(jù)的目的。在人臉識(shí)別中,由一組特征臉基圖像張成一個(gè)特征臉子空間,任何一幅人臉圖像(減去平均人臉后)都可投影到該子空間,從而得到一個(gè)權(quán)值向量。圖3所示是一個(gè)主分量分析的應(yīng)用舉例。圖中最左邊的圖像為平均臉,其他為對(duì)應(yīng)7個(gè)最大特征值的特征向量。


    但是,3D人臉識(shí)別是通過自動(dòng)檢測人臉區(qū),從視頻中提取特征后才識(shí)別出人臉的身份。雖然視頻人臉識(shí)別是基于靜態(tài)圖像的人臉識(shí)別的直接擴(kuò)展,但一般認(rèn)為,視頻人臉識(shí)別算法需要同時(shí)用到空間和時(shí)間信息,它的時(shí)間連續(xù)性是視頻圖像的一個(gè)非常重要的特性,包括由此產(chǎn)生的人臉信息的不確定性。視頻人臉識(shí)別算法和基于靜態(tài)圖像的人臉識(shí)別算法的最大區(qū)別就是在人臉跟蹤和識(shí)別中利用時(shí)間信息。目前這類算法大致可分為兩類:
    (1)跟蹤-然后-識(shí)別,這類方法首先檢測出人臉,然后跟蹤人臉特征隨時(shí)間的變化。只在跟蹤階段用到時(shí)間信息。識(shí)別還是采用基于靜態(tài)圖像的方法,而沒有用到時(shí)間信息。
    (2)跟蹤-且-識(shí)別,這類方法中,人臉跟蹤和識(shí)別是同時(shí)進(jìn)行的,在跟蹤階段和識(shí)別階段都要用到時(shí)間信息。

3 3D人臉識(shí)別存在的問題
    近幾年才開始研究將三維方法用于人臉機(jī)器識(shí)別,目的是為了彌補(bǔ)二維方法的不足,或者是解決二維方法所無法根本解決的問題。
    目前,三維人臉識(shí)別的處理方法和手段還是處于發(fā)現(xiàn)時(shí)期,其本身還不成熟,主要存在以下困難:
    (1)海量存儲(chǔ)和計(jì)算的困難。由于三維識(shí)別過程中處理的數(shù)據(jù)容量和計(jì)算量十分巨大,對(duì)于一般計(jì)算機(jī)來說,它們的存儲(chǔ)和運(yùn)算還比較困難;
    (2)信息來源方面的困難。由于三維識(shí)別的完整信息難于獲取或者識(shí)別的信息往往不完整,同時(shí),再加上圖像采集設(shè)備的差異和成像原理的不同,都可能造成識(shí)別算法本身不可糾正的錯(cuò)誤;
    (3)對(duì)人的生理認(rèn)識(shí)的不足。由于計(jì)算機(jī)沒有人的經(jīng)驗(yàn)和知識(shí)功能,而只有計(jì)算功能,同時(shí)由于對(duì)肌肉的運(yùn)動(dòng)理論和表情形成等問題,現(xiàn)在還不能提供給計(jì)算機(jī)足夠的專家支持;
    (4)受環(huán)境和條件的約束。影響二維識(shí)別的不利因素在三維識(shí)別上同樣存在,如光線的強(qiáng)弱、方向、遮蓋、陰影、背景等;
    (5)實(shí)現(xiàn)方式和手段的不足。傳統(tǒng)的識(shí)別方法不能滿足三維識(shí)別的要求,必須改進(jìn)或采用新的方法。例如由于動(dòng)態(tài)圖像的計(jì)算量太大,因此,適用于靜態(tài)圖像處理的神經(jīng)網(wǎng)絡(luò)就變得不適合了。

4 結(jié)語
    3D人臉的研究始于計(jì)算機(jī)動(dòng)畫和生物醫(yī)學(xué)成像。計(jì)算機(jī)動(dòng)畫方面的方法是在計(jì)算機(jī)上生成三維的人臉來表達(dá)人的運(yùn)動(dòng)、姿態(tài)和表情。這種動(dòng)畫的人臉可以在不同的環(huán)境下應(yīng)用和發(fā)展為虛擬現(xiàn)實(shí),這在生物醫(yī)學(xué)方面可從生物圖層或切片來重構(gòu)人體器官組織,并將其用于病理分析。而三維人臉識(shí)別是極具挑戰(zhàn)性的課題,如在技術(shù)上有所突破,將具有很強(qiáng)的創(chuàng)新性和應(yīng)用價(jià)值。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉