目前為止, Galaxy Z Fold 產(chǎn)品線上試驗了屏下攝像頭,但沒有更廣泛的搭載
人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術,通常也叫做人像識別、面部識別。
人臉識別系統(tǒng)以人臉識別技術為核心,是一項新興的生物識別技術,是當今國際科技領域攻關的高精尖技術。它廣泛采用區(qū)域特征分析算法,融合了計算機圖像處理技術與生物統(tǒng)計學原理于一體,利用計算機圖像處理技術從視頻中提取人像特征點,利用生物統(tǒng)計學的原理進行分析建立數(shù)學模型,具有廣闊的發(fā)展前景。2006年,美國已經(jīng)要求和它有出入免簽證協(xié)議的國家在10月26日之前必須使用結合了人臉識別的電子護照系統(tǒng),到 2006年底已經(jīng)有50多個國家實現(xiàn)了這樣的系統(tǒng)。2012年4月,鐵路部門宣布車站安檢區(qū)域?qū)惭b用于身份識別的高科技安檢系統(tǒng)人臉識別系統(tǒng);可以對人臉明暗偵測,自動調(diào)整動態(tài)曝光補償, 人臉追蹤偵測,自動調(diào)整影像放大。
三星可能正在開發(fā)一個屏下人臉識別系統(tǒng),其中包括兩個屏下攝像頭。
三星早在 2021 年 3 月就向 KIPRIS(韓國知識產(chǎn)權信息服務)提交了專利申請,該文件已于上周公開,并被一家荷蘭出版物收錄。
專利介紹稱,該方法從兩個角度獲取用戶的多張圖像,以更好地構建面部的 3D 模型并將其用于身份驗證。不過,三星特別提到了使用屏下攝像頭。
了解到,到目前為止,三星只是在其 Galaxy Z Fold 產(chǎn)品線上試驗了屏下攝像頭,而沒有更廣泛的搭載。
從專利來看,可能需要在手機底部附近放置一個攝像頭,靠近屏下指紋所在的位置,甚至可能將兩者組合成一個光學模塊。
此外,專利中提到了測量瞳孔大小,人類的瞳孔大小會根據(jù)照明條件而變化,預計可以用作額外的安全措施,以防止使用照片或面具等東西來欺騙人臉識別。
現(xiàn)在AI發(fā)展的如火如荼,我們已逐步進入智能時代。雖然人工智能偏技術類,學習和理解需要一定的技術背景和數(shù)學做支撐。但拆開看,其原理、方法、思路并不復雜,「不懂技術」的產(chǎn)品經(jīng)理也能理解。
人工智能牽扯很多學科,知識點盤根錯節(jié),需要具備多學科的知識儲備。從學習路徑上看,比較適合做成系列,從淺入深,從基礎到應用,逐漸深入。但無形中提高了學習門檻,降低了學習的興趣,導致很難堅持。
有感于此,我想以一種輕松、探索的視角,跟大家一起摸索,用簡單、直白的方式來學習AI。這樣,雖然會有錯誤、遺漏等,但學習難度會降低,那就在過程中完善吧,畢竟「模糊的正確大于精確的錯誤」。
一、人臉識別產(chǎn)品
我們從人臉識別開始,逐步了解其技術路徑的演變和原理等,今天先從最簡單的原理講起。
人臉識別其實很早就有了,多年前就以人臉考勤的方式出現(xiàn),但由于使用效果不好,用戶體驗不佳,逐步被市場淘汰。
而這一波人工智能的火熱,計算能力、模型等都是其重要推動力,但更重要的是產(chǎn)品能夠落地,能夠在實際業(yè)務場景中使用。
尤其是人臉識別,產(chǎn)品在識別精度、速度、用戶友好度等多個方面都有明顯提升,用戶和市場的接受度明顯上升。
二、圖像表示
了解人臉識別,先要從圖像表示講起。
大家都知道,計算機能夠識別和處理的是二進制,不管我們輸入的是文本、圖像、聲音,計算機都是用一定長度的二進制串進行存儲和處理。
我們先以黑白圖片為例,看看計算機是怎么表示的。
計算機程序可以將黑白圖片可以表示為灰度圖像。在灰度圖像中,一個像素使用8個比特位,從而可以表示256個灰度階,表示范圍是0-255。其中0代表純黑色,255代表純白色。
一個字節(jié)可以表示一個像素,那怎么表示一張圖片呢,用矩陣進行表示。
簡單來說,就是表格,比如可以使用8行8列來表示一張8*8的灰度圖片。
這樣我們就解決了圖像的表示問題,建立了圖像和矩陣的等價關系。圖片可以轉化為矩陣,通過矩陣也可以恢復原始圖片。
通過矩陣表示圖像后,圖像的各種處理就轉化為數(shù)學問題,可以使用數(shù)學的理論和方法進行解決,而這正是計算機所擅長的。
我們輸入圖片,希望計算機能夠?qū)?nèi)容識別出來,將結果輸出。
仍以數(shù)字為例,當輸入圖片并用矩陣表示后,通過將灰度值轉化為灰度,可以輕松辨識其所表示的內(nèi)容。
但在計算機的世界里,只有0和1。想要通過辨識矩陣內(nèi)容并將結果輸出,就必須建立矩陣到結果的映射。這樣,輸入一張圖片,經(jīng)過處理和計算后,才能輸出一個數(shù)字。
人臉識別的主要算法以及原理
主流的人臉識別技術基本上可以歸結為三類,即:基于幾何特征的方法、基于模板的方法和基于模型的方法。
1. 基于幾何特征的方法是最早、最傳統(tǒng)的方法,通常需要和其他算法結合才能有比較好的效果;
2. 基于模板的方法可以分為基于相關匹配的方法、特征臉方法、線性判別分析方法、奇異值分解方法、神經(jīng)網(wǎng)絡方法、動態(tài)連接匹配方法等。
3. 基于模型的方法則有基于隱馬爾柯夫模型,主動形狀模型和主動外觀模型的方法等。
人臉由眼睛、鼻子、嘴巴、下巴等部件構成,正因為這些部件的形狀、大小和結構上的各種差異才使得世界上每個人臉千差萬別,因此對這些部件的形狀和結構關系的幾何描述,可以做為人臉識別的重要特征。幾何特征最早是用于人臉側面輪廓的描述與識別,首先根據(jù)側面輪廓曲線確定若干顯著點,并由這些顯著點導出一組用于識別的特征度量如距離、角度等。Jia 等由正面灰度圖中線附近的積分投影模擬側面輪廓圖是一種很有新意的方法。
采用幾何特征進行正面人臉識別一般是通過提取人眼、口、鼻等重要特征點的位置和眼睛等重要器官的幾何形狀作為分類特征,但Roder對幾何特征提取的精確性進行了實驗性的研究,結果不容樂觀。
可變形模板法可以視為幾何特征方法的一種改進,其基本思想是 :設計一個參數(shù)可調(diào)的器官模型 (即可變形模板),定義一個能量函數(shù),通過調(diào)整模型參數(shù)使能量函數(shù)最小化,此時的模型參數(shù)即做為該器官的幾何特征。
這種方法思想很好,但是存在兩個問題,一是能量函數(shù)中各種代價的加權系數(shù)只能由經(jīng)驗確定,難以推廣,二是能量函數(shù)優(yōu)化過程十分耗時,難以實際應用。 基于參數(shù)的人臉表示可以實現(xiàn)對人臉顯著特征的一個高效描述,但它需要大量的前處理和精細的參數(shù)選擇。同時,采用一般幾何特征只描述了部件的基本形狀與結構關系,忽略了局部細微特征,造成部分信息的丟失,更適合于做粗分類,而且目前已有的特征點檢測技術在精確率上還遠不能滿足要求,計算量也較大。