期待,刷臉技術(shù)如何在科技的道路上突出重圍
人臉識別技術(shù)又火了,現(xiàn)在在北京的某一所中學(xué)模擬考試都要學(xué)生刷臉進(jìn)入了,自從iPhone X采用Face ID技術(shù)引起了關(guān)注,讓國人紛紛陷入“刷臉狂潮”。然而,刷臉技術(shù)才剛剛起步,在技術(shù)和經(jīng)驗上還不成熟,在科技的發(fā)展道路上依舊是困難重重,所以我們期待,刷臉技術(shù)如何在科技的道路上突出重圍。
“刷臉查公積金”、“刷臉考勤”、“刷臉安檢”……越來越多的日常行為被冠上“刷臉”二字,甚至在北京日壇公園的公共廁所里,取張廁紙也得刷一下臉。
隨著人臉識別技術(shù)和政務(wù)的結(jié)合,未來要證明你是你本人,也許再也不需前后蓋十幾個章,只需刷一下臉。
國人對人臉識別的濃厚興趣,也體現(xiàn)在相關(guān)領(lǐng)域公司的融資上:人臉識別云服務(wù)平臺Face++和專注于打造人工智能視覺引擎的商湯科技先后獲得1億美元的C輪融資和4.1億美元的B輪融資,躋身人工智能領(lǐng)域“獨(dú)角獸”之列。
人臉識別技術(shù)投入商業(yè)化應(yīng)用的臨界點(diǎn)似乎已經(jīng)到來。iPhone X或許未必能成就自己,但卻成就了人臉識別。
人臉識別的三種算法什么是人臉識別?如果要給人臉識別下個定義,它是利用人的生物特征實(shí)現(xiàn)個體區(qū)分的一種技術(shù),一般包括圖像采集、特征定位、身份的確認(rèn)和查找三個環(huán)節(jié)。簡單來說,人臉識別就是從圖像中提取面部特征關(guān)鍵點(diǎn),比如骨骼特征、眉毛高度等,通過比對輸出結(jié)果。
雖然iPhone X的Face ID讓計算機(jī)視覺領(lǐng)域的創(chuàng)業(yè)者興奮不已,但此人臉識別非彼人臉識別。蘋果的Face ID并沒有采用普通攝像頭的方式,而是采用紅外主動識別的技術(shù),這樣就可以做到三維立體識別,增強(qiáng)了安全系數(shù)。
在具體的應(yīng)用場景中,人臉識別大致可以分為1:1、1:N、N:N三種。
1:1等級的人臉識別,實(shí)現(xiàn)的是最初級的“證明你是你”。從字面上就可以看出,1:1是用戶提前上傳個人照片儲存于系統(tǒng)中,每次驗證時,線下拍照與系統(tǒng)中存儲的照片信息進(jìn)行對比,進(jìn)而確定“你是不是你”。
舉個例子,我們在車站過安檢時,檢票員拿著你的身份證跟你本人做對比,證明你是不是身份證上的本人,這種場景就是1:1的場景。手機(jī)解鎖、刷臉支付、網(wǎng)上買票、醫(yī)院掛號、政府惠民工程項目,以及各種證券開戶、電信開戶、互聯(lián)網(wǎng)金融開戶……這都是1:1人臉識別的應(yīng)用場景。同其他方式相比,1:1識別準(zhǔn)確率高,對算力的要求也相對較低。
而1:N的人臉識別算法則主要用于人臉檢索,“證明你是誰”。與1:1的一一對照不同,1:N需要一張照片同系統(tǒng)中的海量照片進(jìn)行對比,根據(jù)相似度排列出多個對比結(jié)果。而排在第一順位的結(jié)果,未必準(zhǔn)確。
1:N人臉識別算法主要應(yīng)用在安防領(lǐng)域,如用于排查犯罪嫌疑人、尋找走失兒童等。專注于動態(tài)人像識別的初創(chuàng)企業(yè)云天勵飛在2015年開始就與深圳龍崗區(qū)警方合作,在當(dāng)?shù)氐罔F口、火車站、城中村、商超等場所建設(shè)“深目”系統(tǒng)。上線幾個月后,便協(xié)助警方成功告破兩起命案。
應(yīng)用在安防領(lǐng)域的1:N人臉識別,其特點(diǎn)是動態(tài)和非配合。所謂動態(tài),即系統(tǒng)識別的不是圖片,而是攝像頭采集的視頻。非配合是指識別對象不用感知到攝像頭的位置并配合完成識別工作,識別對象處于被動狀態(tài)。這在提高采集便捷性的同時,也意味著你的行蹤已經(jīng)被完全暴露。
同1:1識別相比,使用地點(diǎn)、環(huán)境、光線、采集角度甚至是玻璃反射都會影響1:N識別的準(zhǔn)確度,所以1:N相對更具有挑戰(zhàn)性。
至于N:N人臉識別,實(shí)際上相當(dāng)于同時進(jìn)行多個1:N識別,用于“證明誰是誰”。
人臉識別技術(shù)尚不完善就人臉識別技術(shù)背后的基礎(chǔ)性研究來說,中國、歐洲和美國幾乎處在齊頭并進(jìn)的水平。但論及商業(yè)應(yīng)用方面,中國絕對走在了前面。
“人臉識別現(xiàn)在并不是很高端的技術(shù)。中國的大公司更注重眼前的利益,人臉識別對于他們來說是人工智能方向最快最好的變現(xiàn)渠道。”在北京航空航天大學(xué)人體識別技術(shù)領(lǐng)域的專家冷彪看來,例如谷歌(微博)這樣的大公司之所以沒有追捧人臉識別技術(shù),是因為他們有更長遠(yuǎn)的打算。
而中國人工智能領(lǐng)域的創(chuàng)業(yè)者似乎酷愛扎堆。
從阿里巴巴、百度、騰訊、京東等傳統(tǒng)互聯(lián)網(wǎng)巨頭,到諸如Face++、商湯科技等人工智能領(lǐng)域的獨(dú)角獸,再到剛剛?cè)刖值膭?chuàng)業(yè)團(tuán)隊,人臉識別不僅是大公司的專利,服務(wù)器端和移動端的人臉識別領(lǐng)域呈現(xiàn)出百家爭鳴的態(tài)勢。
“人臉識別的門檻已經(jīng)很低了,但是真實(shí)應(yīng)用的場景下要做好并不簡單。”紫?;饎?chuàng)始合伙人張泉靈的話,代表了業(yè)內(nèi)很多投資人的觀點(diǎn)。
在電視節(jié)目《最強(qiáng)大腦》中,百度基于深度學(xué)習(xí)的機(jī)器人小度基本展現(xiàn)了人臉識別技術(shù)現(xiàn)在的發(fā)展水平——它可以輕松提取人臉上千個特征點(diǎn),并通過海量的圖片進(jìn)行深度學(xué)習(xí)訓(xùn)練,鍛煉人臉圖像的預(yù)處理功能,在1到2秒的時間內(nèi)就能對人臉圖像進(jìn)行有效識別的匹配。
與此同時,小度也暴露了人臉識別急需突破的一些難題:光線條件差、角度不同、信息模糊或變形都有可能造成識別誤差,此外,人臉遮蓋物、帽子、胡須、發(fā)型、整容或者PS等也會干擾識別。
今年的3·15晚會曝光了人臉識別在技術(shù)上的漏洞。主持人僅憑現(xiàn)場觀眾的一張照片,經(jīng)過技術(shù)處理,快速生成了與觀眾本人一模一樣的3D人臉模型。主持人套上觀眾的3D臉模,對準(zhǔn)手機(jī)攝像頭,按照APP指示依次完成眨眼、轉(zhuǎn)頭、微笑等動作,成功騙過系統(tǒng),順利完成了活體檢測認(rèn)證。
360人工智能研究院視覺分析專家邱學(xué)侃在接受采訪時曾表示:現(xiàn)階段人臉認(rèn)證技術(shù)還不能在所有場景做到非常成熟,盡管人臉比對的精確度很高,但大部分的人臉識別系統(tǒng)對活體檢測的重視程度不足,使用的算法比較簡單,破解并不困難。
場景是創(chuàng)業(yè)團(tuán)隊突圍關(guān)鍵除了技術(shù)尚未完全成熟外,科技型創(chuàng)業(yè)公司經(jīng)常會陷入一個誤區(qū):僅以技術(shù)論英雄。“現(xiàn)在大部分剛起步的人臉識別公司還停留在‘我技術(shù)比別人好’這個層面上。”PreAngel投資總監(jiān)蔣鍇表示,關(guān)于商業(yè)化落地場景,這些公司仍未想清楚。
源碼資本投資合伙人張宏江(微博)也曾表示:“如果說這個公司只有算法,只有幾個牛人,沒有數(shù)據(jù)或很難拿到數(shù)據(jù),沒有應(yīng)用場景,這樣的公司做不大。”
當(dāng)然還有很多公司也強(qiáng)調(diào)數(shù)據(jù),但是這也不是絕對的門檻。“假設(shè)現(xiàn)有技術(shù)已經(jīng)達(dá)到92分,如果新技術(shù)能夠達(dá)到94分,給用戶的感受差別并不是那么強(qiáng)烈,意義也就不大。”在云天勵飛方案營銷總監(jiān)王軍看來,技術(shù)總是在迭代更新的,但當(dāng)技術(shù)不能呈現(xiàn)顛覆性的時候,技術(shù)帶來的價值就會大打折扣。
當(dāng)然,這并不是否認(rèn)技術(shù)的意義。只是當(dāng)賽道上已經(jīng)出現(xiàn)了獨(dú)角獸的時候,技術(shù)已經(jīng)很難成為新企業(yè)的底牌。
“我們現(xiàn)在關(guān)注剛起步的人臉識別公司,純技術(shù)層面的看得少了,更多是關(guān)注可以解決實(shí)際問題的公司。”蔣鍇表示,商業(yè)化能力,是新興企業(yè)的突圍點(diǎn)。技術(shù)和商務(wù)能力并重的AI創(chuàng)業(yè)團(tuán)隊更容易被資本看好。
無論是從場景資源、數(shù)據(jù)獲取還是資本實(shí)力而言,巨頭都有著創(chuàng)業(yè)團(tuán)隊無可比擬的優(yōu)勢,巨頭入局后,創(chuàng)業(yè)公司該怎么玩兒?
“創(chuàng)業(yè)公司生存的根基是對這個行業(yè)深度的服務(wù)和滲透。”一位不愿具名的投資人表示,創(chuàng)業(yè)公司不會被巨頭的革新輕易取代,相反,巨頭的大量投入和基礎(chǔ)性創(chuàng)新會推動新板塊的機(jī)會出現(xiàn)。比如,正是在蘋果公司大力推動了蘋果手機(jī)、谷歌大力推廣了安卓系統(tǒng)之后,移動互聯(lián)網(wǎng)的發(fā)展才真正爆發(fā),優(yōu)步、滴滴這樣的新機(jī)會才涌現(xiàn)出來。而Face ID的出現(xiàn),何嘗不是人臉識別創(chuàng)業(yè)團(tuán)隊的新機(jī)遇。
但人臉識別能否出現(xiàn)成熟應(yīng)用,仍然需要看場景。上述投資人表示:“我更看好一些對效果要求不那么高的場景,比如消費(fèi)、娛樂,而對于準(zhǔn)確率要求極高的金融支付等領(lǐng)域更加謹(jǐn)慎。”
這一觀點(diǎn)與云天勵飛方案營銷總監(jiān)王軍不謀而合。“前通用電氣董事長杰克·韋爾奇在《商業(yè)的本質(zhì)》一書中表示,產(chǎn)品本身的價值才是更重要的。這個世界上并不是最尖端的技術(shù)就最具有商業(yè)價值,反而我覺得是最容易大規(guī)模復(fù)制的技術(shù)最容易流行起來。所以我看好人臉識別在對安全性要求沒有那么高的領(lǐng)域的應(yīng)用。”