人工智能發(fā)展出了豐富的應用模式 從而衍生出繁多的“變臉應用”
隨著計算機視覺技術的成熟,圖像識別、圖像處理等技術任務發(fā)展出了大量應用。因“人臉”這一元素與個人身份的直接聯(lián)系,相關針對人臉的圖像處理技術因識別度高、代入感強等原因,在文化娛樂領域發(fā)展出了豐富的應用模式,從而衍生出繁多的“變臉應用”。
隨著計算機視覺技術的成熟,圖像識別、圖像處理等技術任務發(fā)展出了大量應用。其中,針對“人臉”的識別與處理任務尤為熱門,其在安防、支付、公共服務等領域均有相對成熟的應用,并形成產(chǎn)業(yè)鏈。 此外,因“人臉”這一元素與個人身份的直接聯(lián)系,相關針對人臉的圖像處理技術因識別度高、代入感強等原因,在文化娛樂領域同樣發(fā)展出了豐富的應用模式,從而衍生出繁多的“變臉應用”。
01 計算機視覺發(fā)展下的人臉識別與圖像處理
在當前的人工智能大潮下,計算機視覺的發(fā)展及其在人臉識別上的應用已發(fā)展出廣泛的應用場景。據(jù)統(tǒng)計,2013年中國人臉識別市場規(guī)模僅為8.61億元,2014年突破10億元,并長期保持逐年快速增長的趨勢。伴隨火車站、零售支付以及安防等領域的應用需求,中國人臉識別市場在2018年以高達27.6億元。然而,除卻管理與安全防衛(wèi)的需要,人臉識別技術在文化娛樂的場景同樣擁有極大的熱度,尤其針對“人臉”的圖像處理領域,計算機視覺與遷移學習等技術已發(fā)展出“AI換臉”、“真人照片卡通化”等應用模式,各類移動應用屢見不鮮。此外,諸如“妝容轉移”、“染發(fā)劑效果模擬”等圍繞人臉圖像處理的應用在零售營銷領域同樣存在不小的市場潛力。
02 圖像處理中常用人工智能技術
深度學習:機器學習的分支,因深度學習可以通過無監(jiān)督或半監(jiān)督特征學習算法和分層特征提取從海量數(shù)據(jù)中自動提取特征,使其在計算機視覺領域擁有極佳的應用效果。
計算機視覺:指機器感知環(huán)境的能力,是關于研究機器視覺能力的學科。這一技術類別中的經(jīng)典任務有圖像生成、圖像處理、圖像提取和圖像的三維推理,是當前人工智能技術發(fā)展的重點應用領域之一。
生成對抗網(wǎng)絡(GAN):一種無監(jiān)督學習方法,是一種通過用對抗網(wǎng)絡來訓練生成模型的架構。GAN在圖像生成上擁有極大優(yōu)勢,是當前最具發(fā)展?jié)摿Φ?u>神經(jīng)網(wǎng)絡之一。
遷移學習:遷移學習是一種機器學習方法,通過從已學習的相關任務中轉移知識來改進學習的新任務,可應用于圖像處理中的換臉、畫風遷移等任務。
元學習:機器學習的一個子領域,是將自動學習算法應用于機器學習實驗的元數(shù)據(jù)上,是通往可持續(xù)學習多項新任務的多面智能體的必經(jīng)之路,可被用于靜止圖像動態(tài)化等任務。
03 人工智能技術在人臉圖像處理領域的應用分布
04 人工智能技術在圖像生成與處理領域的應用案例
U-GAT-IT 模型實現(xiàn)真人照片到日式卡通頭像的自動轉化:韓國AI研究團隊基于生成對抗網(wǎng)絡(GAN)的架構基礎,添加了注意力模塊,并發(fā)明了一種名為”自適應層-實例歸一化“(AdaLIN)的歸一化機制,建立了一款針對圖片到圖片翻譯任務的全新神經(jīng)網(wǎng)絡模型,即“U-GAT-IT”。該模型可實現(xiàn)將真人頭像轉化為二次元卡通畫風的圖片,效果如同漫畫家的精心再創(chuàng)作。
美圖影像實驗室(MTlab)推出高效人像畫質修復算法:美圖實驗室團隊通過借鑒前沿的深度學習技術,結合大量生成對抗網(wǎng)絡應用打造了超清人像生成網(wǎng)絡結構BeautyGAN。在此基礎上,基于上億人像數(shù)據(jù)的訓練,使其具備人像畫質修復能力。通過部署該技術于于美圖秀秀APP,任何用戶可以在上傳低質量照片后數(shù)秒內(nèi)收獲畫質提升版本。
三星研發(fā)神經(jīng)網(wǎng)絡模型實現(xiàn)一張圖像生成動圖:三星和Skolkovo研究團隊使用卷積神經(jīng)網(wǎng)絡構建頭像特性,通過元學習在頭像特寫語料庫上的大量預訓練(meta-learning),讓模型獲得基于少量圖像學習(few shotlearning)的能力。在元學習過程中,系統(tǒng)創(chuàng)建了三種神經(jīng)網(wǎng)絡:將幀映射到向量的嵌入器網(wǎng)絡、在合成視頻中映射面部特征點的生成器網(wǎng)絡以及評估生成圖像真實性和姿態(tài)的判別器網(wǎng)絡。聯(lián)合三種網(wǎng)絡并執(zhí)行長時間元學習的模型能夠利用已學習的高質量生成器與判別器實現(xiàn)基于數(shù)張甚至一張靜止人像生成表情豐富的動圖。
05 人工智能在圖像處理領域中的局限性
技術精度限制:當前圖像處理技術的應用仍存在瑕疵,其精度距離商用美術標準還有一定距離。
道德風險:在當下Deepfake和Zao等軟件被濫用的情況下,智能化的圖像處理技術將面臨極大的道德風險限制。
版權限制:針對藝術創(chuàng)作的版權條例與規(guī)范正在愈發(fā)嚴格,其變化或將同樣影響到此類技術的應用范圍和未來發(fā)展。
社會安全因素:當變臉軟件的應用對象涉及公眾人物乃至政府官員,其結果或將導致社會安全乃至政府形象的影響。
06 人工智能在圖像處理領域的發(fā)展趨勢
創(chuàng)作高效化:游戲角色設計、服裝設計等內(nèi)容創(chuàng)作工作將會因智能技術所帶來的便捷性而更加便捷,使創(chuàng)作者能將更多精力使用在創(chuàng)意和思路的整理,從而讓創(chuàng)作更加高效。
營銷體驗直觀化:化妝品、服裝首飾等商品的營銷效果可以通過在用戶身上投影或模擬,從而為客戶帶來更直觀的體驗,加強營銷和體驗的效果。
文化保護智能化:伴隨數(shù)據(jù)的增加和算法的升級,文物的修補、視覺復原等工作將更加精準與便捷。