面部識別技術(shù)的起源,應(yīng)用領(lǐng)域及未來的發(fā)展介紹
在蘋果于2017年9月發(fā)布iPhone X手機時,使面部識別技術(shù)得到了更多關(guān)注。雖然iPhone X的OLED屏幕和無線充電功能(更不用說其999美元的價格)都非常具有新聞價值,但它引入了面部ID來解鎖設(shè)備(并可進行支付)最引人注目。面部識別技術(shù)并不是新技術(shù),但蘋果公司將該技術(shù)的具體實施顯然意義重大。
與最近另一個比較熱門的技術(shù)人工智能(AI)有些類似,面部識別技術(shù)最初開發(fā)活動始于半個多世紀(jì)前。計算機科學(xué)家Woody Bledsoe、Helen Chan Wolf和Charles Bisson在美國情報機構(gòu)資助下于20世紀(jì)60年代啟動了面部識別的自動化研究。在當(dāng)時,操作人員必須從攝影圖像中提取一組面部特征(例如眼睛的內(nèi)外角、瞳孔的中心或者寡婦尖的點)的位置。然后使用這些位置坐標(biāo)計算20個量值的列表(例如目標(biāo)對象嘴和眼睛的寬度以及瞳孔到瞳孔的距離),然后將其存儲在數(shù)據(jù)庫中。
Bledsoe和他的團隊意識到,由于頭部旋轉(zhuǎn)和傾斜度、與相機的距離、照明強度和角度、面部表情甚至衰老等因素的巨大變化,這種類型的模式匹配具有非常大的挑戰(zhàn)性。為了克服這個問題,可以將每組距離歸一化以表示正面方位的面部特征。該程序?qū)⑹紫葒L試確定目標(biāo)對象的傾斜度和旋轉(zhuǎn),然后使用這些角度來計算和消除變換對計算距離的影響。另一個需要了解的因素是頭部的三維幾何形狀,主要是為了克服目標(biāo)對象部分缺失的情況,研究團隊根據(jù)對七個目標(biāo)對象的測量結(jié)果,使用了一個“標(biāo)準(zhǔn)頭部”模型。之前的方法如果目標(biāo)對象變化時會導(dǎo)致識別成功率較低,該團隊的方法幫助實現(xiàn)了自動化面部識別技術(shù)在準(zhǔn)確性方面的突破。
面部識別技術(shù)從早期的創(chuàng)建以來,已經(jīng)過了長期的發(fā)展,特別是隨著計算速度加快和功能的增大,以及成像技術(shù)的提高,使識別的準(zhǔn)確度水平穩(wěn)步提高。鑒于面部識別系統(tǒng)的成功率已接近甚至超過人工操作者的正面識別率,一些備受矚目的項目正在使該技術(shù)實現(xiàn)向主流應(yīng)用的飛躍。當(dāng)然,安全和執(zhí)法部門一直對這項技術(shù)有著明顯的興趣,并不斷在多個不同地區(qū)和應(yīng)用中進行試驗(例如,在英國諾丁山嘉年華和在紀(jì)念碑舉辦的星期日紀(jì)念儀式) 。但是,除了Apple的Face ID之外,這項技術(shù)在另外兩個方面的部署已經(jīng)使其進入了大眾消費領(lǐng)域。
面部識別的應(yīng)用國際旅客現(xiàn)在已經(jīng)非常熟悉許多機場引入的自動口岸控制(或電子護照)閘道,這種方式有助于應(yīng)對不斷上升的旅客數(shù)量。對于持有具備生物特征識別“芯片”護照的抵達乘客,自動門使用攝像頭捕獲旅客的圖像,之后面部識別技術(shù)將其與護照中存儲在RFID芯片上的照片進行比較。標(biāo)準(zhǔn)化的參考圖像(其中照片必須符合關(guān)于尺寸、角度、面部表情以及不能配戴眼鏡或頭飾的規(guī)定)和受控圖像捕捉(關(guān)于在何處以及如何站立、面部朝向以及一致的照明等規(guī)則)將有助于保持較低的失效率和較高的吞吐量。目前,一些航空公司也在試驗在登機口用面部識別技術(shù)驗證乘客身份。
與此同時,F(xiàn)acebook也在提供面部識別技術(shù),盡管這項技術(shù)在歐洲受到監(jiān)管機構(gòu)和消費者的抵制,但它至少在美國被很廣泛地采用。該社交媒體網(wǎng)站有一個包含數(shù)十億個人和團隊的照片數(shù)據(jù)庫,由用戶上傳,都具有能夠幫助捕獲識別的面部特征。Facebook采用人工智能和機器學(xué)習(xí)技術(shù)(包括深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)),其DeepFace技術(shù)根據(jù)某人的面部特征使用算法計算出唯一的數(shù)字(或“模板”)。然后,它可以分析上傳的照片,將其中的面部與存儲的模板進行匹配,從而提示用戶用已識別的匹配特征對照片進行標(biāo)記,并通知已上傳照片的匹配度。然而,最能夠使面部識別技術(shù)歸一化,并使其應(yīng)用能夠為主流消費者接受的項目可能是面部 ID。一些觀察人士認(rèn)為,蘋果有一種習(xí)慣,即會比其他制造商更晚地為其iPhone添加面向未來的功能,但其他人則認(rèn)為,它經(jīng)常設(shè)法在某項技術(shù)能夠“正常工作”后再進行實施,以便大力推廣這些技術(shù)使其變成必須擁有的功能。盡管支持Apple 面部ID的并不是新技術(shù),但它的實施非常靈活、功能強大且引人注目,在早期采用者中已經(jīng)廣受歡迎(根據(jù)Strategy AnalyTIcs最近的一份報告)。
以前,一些制造商的面部識別項目很容易被照片欺騙,但Face ID使用了一系列傳感器、成像技術(shù)和AI在3D模式下來映射和匹配面部。該系統(tǒng)為“始終開啟”、幾乎是瞬間完成,其紅外泛光照明器意味著即使在暗景下、或通過太陽鏡也能工作。它的紅外攝像頭能夠捕捉面部圖像,而點投影儀則可以在面部投射30,000個紅外點陣列,以創(chuàng)建高精度的深度圖像模型。手機可以用該圖像來對比存儲在設(shè)備CPU“安全區(qū)域”(甚至Apple也無法訪問)的本地圖像以便驗證用戶。
Apple公司聲稱Face ID的安全性非常高,只有百萬分之一的機會用戶能夠欺騙過關(guān)(相比之下,Touch ID指紋生物識別技術(shù)有5萬分之一)。它不僅需要衡量用戶對解鎖手機的關(guān)注程度(用戶的眼睛必須睜開,而且必須注視顯示器才能掃描成功注冊),蘋果公司還表示,F(xiàn)ace ID通過逼真的3D外觀可以訓(xùn)練該識別功能,所以不容易為其他用戶欺騙。在構(gòu)建Face ID時,Apple分析了超過十億張圖像以獲取有關(guān)面部的數(shù)據(jù),并利用該數(shù)據(jù)來訓(xùn)練其神經(jīng)網(wǎng)絡(luò)。它使用機器學(xué)習(xí)算法和“神經(jīng)網(wǎng)絡(luò)引擎”來分析和識別用戶面部,每次使用時都會捕獲更多信息,這意味著用戶的面部“地圖”可以得到不斷改善,并隨著用戶的特征而變化,這樣可以應(yīng)對用戶改變的胡須、發(fā)型或化妝、甚至戴的帽子等等。
未來的發(fā)展受面部識別的興起和消費者接受程度不斷提高的驅(qū)動,企業(yè)將面部識別技術(shù)集成到具體產(chǎn)品和應(yīng)用的趨勢在快速加強。根據(jù)Allied Market Research的數(shù)據(jù),面部識別市場預(yù)計在未來四年內(nèi)將平均增長21.3%,到2022年達到96億美元。即插即用的硬件模塊和軟件能夠使設(shè)計工程師更輕松地將面部識別技術(shù)集成到其應(yīng)用和產(chǎn)品開發(fā)中。
歐姆龍電子的B5T HVC面部檢測傳感器模塊就是這種即插即用的一個例子。該產(chǎn)品采用緊湊型60mm x 40mm外形尺寸,是一款完全集成的插入式人體視覺組件(HVC)模塊,配備相機(具有長距離和廣角攝像頭選項)和協(xié)同處理器,以及UART和USB接口(用于控制模塊并將數(shù)據(jù)輸出發(fā)送到外部系統(tǒng))。B5T基于歐姆龍的OKAO技術(shù),并集成了獨特的圖像傳感算法,可以快速而準(zhǔn)確地識別面部。
圖1:歐姆龍的B5T HVC面部檢測傳感器模塊。
B5T可以在1.1秒內(nèi)從1.3米的距離捕捉、檢測和識別面部,具有相當(dāng)高的可信度和準(zhǔn)確率。眨眼和注視估算需要不到1秒鐘,模塊甚至可以根據(jù)5個預(yù)編程表情中的某一個來評估目標(biāo)對象的情緒。它可以檢測到距離遠(yuǎn)達2.8米的人體和1.5米的手,模塊的檢測角度指定為水平49°和垂直37°,輸入圖像分辨率為640x480像素。
該模塊也集成有十種不同的傳感功能用于識別非語言意圖、當(dāng)時狀況和行為,包括面部、手部和身體檢測以及年齡、性別和表情估算。這些同類最佳的圖像分析過程都是在模塊本身內(nèi)進行,使設(shè)計人員可以輕松地將智能和功能添加到各種感測和物聯(lián)網(wǎng)(IoT)應(yīng)用。