Facebook正式將3D照片技術(shù)帶到了iPhone上！酷斃了！

時(shí)間：2018-10-18 16:10:02

關(guān)鍵字： facebook 深度圖像

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]想象一下，你用手機(jī)拍攝一張照片，然后你不僅可以得到你拍攝時(shí)的一個(gè)角度，你還可以拖動(dòng)照片來(lái)看到不同角度的視野變化。這聽(tīng)起來(lái)是在描述高大上的光場(chǎng)視頻，而不是通常的2D拍照技術(shù)，是吧？今年5月，F(xiàn)acebo

想象一下，你用手機(jī)拍攝一張照片，然后你不僅可以得到你拍攝時(shí)的一個(gè)角度，你還可以拖動(dòng)照片來(lái)看到不同角度的視野變化。

這聽(tīng)起來(lái)是在描述高大上的光場(chǎng)視頻，而不是通常的2D拍照技術(shù)，是吧？

今年5月，F(xiàn)acebook介紹了3D照片技術(shù)，今天Facebook正式將其3D照片功能帶到了iPhone手機(jī)上。

當(dāng)你用iPhone拍攝一張照片時(shí)，點(diǎn)擊狀態(tài)更新編輯器中的新3D照片選項(xiàng)，選擇肖像模式照片，然后Facebook會(huì)用AI計(jì)算出場(chǎng)景深度，使得2D照片也可以動(dòng)起來(lái)，呈現(xiàn)出多個(gè)角度的景象。

這些3D照片可以在在桌面或者手機(jī)App中的Facebook實(shí)時(shí)信息流中體驗(yàn)到。當(dāng)你滑動(dòng)信息流時(shí)，這些照片和普通照片看起來(lái)沒(méi)有區(qū)別，而當(dāng)你點(diǎn)擊進(jìn)入照片時(shí)，他們立刻突破平面2D的束縛，就像一個(gè)小窗口一樣，一下子把你拉進(jìn)3D照片的世界。就像上圖gif一樣，拖動(dòng)照片你可以你看到狗的側(cè)面和背后的巖石。

了解到，這個(gè)以AI創(chuàng)造出深度圖像的技術(shù)來(lái)自于Facebook計(jì)算攝影部門(mén)，講述這項(xiàng)技術(shù)的論文由倫敦大學(xué)學(xué)院的Peter Hedman和Facebook西雅圖辦公室的研究科學(xué)家Johannes Kopf合著完成，論文曾在今年8月于溫哥華舉辦的Siggraph上展出。

其實(shí)，不少巨頭都在研發(fā)計(jì)算圖像深度的技術(shù)，不過(guò)目前他們都只是應(yīng)用在人像模式中，用以虛化背景。

然而，F(xiàn)acebook的技術(shù)路徑卻是從VR開(kāi)始的。Facebook以30億美元收購(gòu)Oculus后就大力傾注VR，致力于創(chuàng)造一個(gè)連接虛擬與現(xiàn)實(shí)的全新社交帝國(guó)，把現(xiàn)實(shí)世界放進(jìn)VR是一項(xiàng)關(guān)鍵任務(wù)，此前的實(shí)現(xiàn)方式主要是360度全景視頻或者是加上3D效果的360度全景視頻，然而，這些全景圖片拼接成的內(nèi)容只是2D圖片的大型化，并不具備現(xiàn)實(shí)世界的深度感和真實(shí)感。

6Dof視頻以及更完善的光場(chǎng)視頻是大家期望的解決方案，F(xiàn)acebook也一直在這些領(lǐng)域探索。在2017年5月的F8大會(huì)上，F(xiàn)acebook發(fā)布了兩款能記錄深度信息的 3D VR全景相機(jī)，F(xiàn)acebook 360 Surround x24和x6。今年9月，F(xiàn)acebook發(fā)布專(zhuān)業(yè)級(jí)全景相機(jī) Manifold。

然而，6Dof視頻和光場(chǎng)視頻的制作成本極高，目前VR的發(fā)展也難以吸引大量的內(nèi)容制作者，F(xiàn)acebook選擇了更便捷更民主化的路線——3D照片。

雖然Facebook推出的這項(xiàng)深度圖像技術(shù)被稱(chēng)為3D視頻，但是卻和大家熟悉的3D電影的3D效果不是一碼事。普通的3D只是通過(guò)雙目時(shí)差實(shí)現(xiàn)的偽3D效果，在電影院里，不管你怎么轉(zhuǎn)頭，你看到的立體影像都只有一個(gè)角度，而Facebook的3D照片的特點(diǎn)是可以拖動(dòng)查看不同的角度信息。

說(shuō)了這么多，回到重點(diǎn)，F(xiàn)acebook是如何實(shí)現(xiàn)這項(xiàng)技術(shù)的呢？

據(jù)了解，一開(kāi)始，F(xiàn)acebook采用的方式是讓用戶(hù)以單攝像頭的相機(jī)拍攝，通過(guò)移動(dòng)來(lái)捕捉整個(gè)場(chǎng)景，然后通過(guò)分析視差和手機(jī)運(yùn)動(dòng)，即不同距離的物體在相機(jī)移動(dòng)時(shí)移動(dòng)的數(shù)據(jù)，可以精確地在重建出3D場(chǎng)景。

但是，從單個(gè)攝像機(jī)的快速圖像中推斷出深度數(shù)據(jù)是對(duì)CPU的計(jì)算要求很高，這種方法在大多數(shù)手機(jī)都有雙攝像頭時(shí)顯得有些過(guò)時(shí)。通過(guò)同時(shí)使用兩個(gè)相機(jī)捕獲圖像，即使對(duì)于運(yùn)動(dòng)中的物體也可以觀察到視差差異。并且因?yàn)閮蓚€(gè)鏡頭的設(shè)備處于完全相同的位置，所以深度數(shù)據(jù)的噪音要小得多，對(duì)運(yùn)算的要求也低很多。

Facebook目前就是采用iPhone的雙攝像頭，手機(jī)的兩個(gè)攝像頭拍攝了一對(duì)圖像，設(shè)備立即自行完成計(jì)算“深度圖”，圖像編碼幀中所有內(nèi)容的計(jì)算距離。結(jié)果看起來(lái)像這樣：

蘋(píng)果、三星、華為、谷歌都在研究深度圖像技術(shù)，但是目前主要用在照片的背景模糊上面。深度圖的技術(shù)難點(diǎn)在于，創(chuàng)建的深度圖沒(méi)有某種絕對(duì)比例。例如，當(dāng)深紅色意味著100英尺時(shí)，淺黃色并不意味著10英尺。每張照片的比例都不相同，這意味著你需要拍攝多張照片來(lái)獲得物體實(shí)際距離，但是要將這些照片拼接在一起是一種痛苦。

這就是Kopf和Hedman及其同事所面臨的問(wèn)題。在他們的系統(tǒng)中，用戶(hù)通過(guò)移動(dòng)他們的手機(jī)拍攝他們周?chē)h(huán)境的多個(gè)圖像;它每秒捕獲一個(gè)圖像（技術(shù)上是兩個(gè)圖像和一個(gè)結(jié)果深度圖）并開(kāi)始將其添加到其集合中。在后臺(tái)，算法會(huì)查看手機(jī)運(yùn)動(dòng)檢測(cè)系統(tǒng)捕獲的相機(jī)的深度圖和微小運(yùn)動(dòng)。然后，深度圖基本上被按摩成正確的形狀以與其他照片對(duì)齊。

創(chuàng)建出深度圖之后，深度圖會(huì)被轉(zhuǎn)換為3D網(wǎng)格（這個(gè)比較抽象，可以將其想象為一個(gè)紙質(zhì)版本的景觀圖）。然后，檢查網(wǎng)格的明顯邊緣，將這些邊緣撕裂開(kāi)，例如前景中欄桿遮擋背景中的景觀，就將兩者分離開(kāi)。這會(huì)將各種物體隔開(kāi)，使它們看起來(lái)處于不同的深度，并隨著透視的變化移動(dòng)。雖然這些方法創(chuàng)造了3D效果，但是你可能已經(jīng)猜到前景看起來(lái)只不過(guò)是一個(gè)紙質(zhì)鏤空，因?yàn)?，如果是直接拍攝的人臉，就沒(méi)有關(guān)于他們的頭部或背部。

那么，最后一步就很重要。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)去猜測(cè)和填充圖像的其余部分。例如，如果圖像區(qū)域有頭發(fā)，那么頭發(fā)可能會(huì)繼續(xù)存在。因此，它可以令人信服地重新構(gòu)建這些紋理，并估計(jì)對(duì)象的形狀，縮小間隙。這樣當(dāng)你稍微改變視角時(shí)，你似乎真的“圍繞”對(duì)象看了一圈。

Facebook目前能在一秒鐘的時(shí)間內(nèi)完成深度圖的創(chuàng)建，因此他們將此稱(chēng)為“即時(shí)3D攝影”。當(dāng)然，3D照片功能目前只能在有兩個(gè)攝像機(jī)上使用，首發(fā)這項(xiàng)功能的是iPhone 7+, 8+, X or XS，此后會(huì)有更多手機(jī)加入。

在論文中，F(xiàn)acebook也討論了如何用通過(guò)另一個(gè)卷積神經(jīng)網(wǎng)絡(luò)來(lái)使得單攝像頭的相機(jī)也擁有同樣功能。但是，單攝像頭不如雙攝像頭系統(tǒng)好。這還需要算法和軟件公司的繼續(xù)努力，正如前些天，曾報(bào)道，Google就用單攝像頭實(shí)現(xiàn)了超越蘋(píng)果雙攝像頭的多項(xiàng)計(jì)算攝影效果。