當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀]想象一下,你用手機(jī)拍攝一張照片,然后你不僅可以得到你拍攝時(shí)的一個(gè)角度,你還可以拖動(dòng)照片來(lái)看到不同角度的視野變化。這聽(tīng)起來(lái)是在描述高大上的光場(chǎng)視頻,而不是通常的2D拍照技術(shù),是吧?今年5月,F(xiàn)acebo

想象一下,你用手機(jī)拍攝一張照片,然后你不僅可以得到你拍攝時(shí)的一個(gè)角度,你還可以拖動(dòng)照片來(lái)看到不同角度的視野變化。

這聽(tīng)起來(lái)是在描述高大上的光場(chǎng)視頻,而不是通常的2D拍照技術(shù),是吧?

今年5月,F(xiàn)acebook介紹了3D照片技術(shù),今天Facebook正式將其3D照片功能帶到了iPhone手機(jī)上。

當(dāng)你用iPhone拍攝一張照片時(shí),點(diǎn)擊狀態(tài)更新編輯器中的新3D照片選項(xiàng),選擇肖像模式照片,然后Facebook會(huì)用AI計(jì)算出場(chǎng)景深度,使得2D照片也可以動(dòng)起來(lái),呈現(xiàn)出多個(gè)角度的景象。

這些3D照片可以在在桌面或者手機(jī)App中的Facebook實(shí)時(shí)信息流中體驗(yàn)到。當(dāng)你滑動(dòng)信息流時(shí),這些照片和普通照片看起來(lái)沒(méi)有區(qū)別,而當(dāng)你點(diǎn)擊進(jìn)入照片時(shí),他們立刻突破平面2D的束縛,就像一個(gè)小窗口一樣,一下子把你拉進(jìn)3D照片的世界。就像上圖gif一樣,拖動(dòng)照片你可以你看到狗的側(cè)面和背后的巖石。

了解到,這個(gè)以AI創(chuàng)造出深度圖像的技術(shù)來(lái)自于Facebook計(jì)算攝影部門(mén),講述這項(xiàng)技術(shù)的論文由倫敦大學(xué)學(xué)院的Peter Hedman和Facebook西雅圖辦公室的研究科學(xué)家Johannes Kopf合著完成,論文曾在今年8月于溫哥華舉辦的Siggraph上展出。

其實(shí),不少巨頭都在研發(fā)計(jì)算圖像深度的技術(shù),不過(guò)目前他們都只是應(yīng)用在人像模式中,用以虛化背景。

然而,F(xiàn)acebook的技術(shù)路徑卻是從VR開(kāi)始的。Facebook以30億美元收購(gòu)Oculus后就大力傾注VR,致力于創(chuàng)造一個(gè)連接虛擬與現(xiàn)實(shí)的全新社交帝國(guó),把現(xiàn)實(shí)世界放進(jìn)VR是一項(xiàng)關(guān)鍵任務(wù),此前的實(shí)現(xiàn)方式主要是360度全景視頻或者是加上3D效果的360度全景視頻,然而,這些全景圖片拼接成的內(nèi)容只是2D圖片的大型化,并不具備現(xiàn)實(shí)世界的深度感和真實(shí)感。

6Dof視頻以及更完善的光場(chǎng)視頻是大家期望的解決方案,F(xiàn)acebook也一直在這些領(lǐng)域探索。在2017年5月的F8大會(huì)上,F(xiàn)acebook發(fā)布了兩款能記錄深度信息的 3D VR全景相機(jī),F(xiàn)acebook 360 Surround x24和x6。今年9月,F(xiàn)acebook發(fā)布專(zhuān)業(yè)級(jí)全景相機(jī) Manifold。

然而,6Dof視頻和光場(chǎng)視頻的制作成本極高,目前VR的發(fā)展也難以吸引大量的內(nèi)容制作者,F(xiàn)acebook選擇了更便捷更民主化的路線——3D照片。

雖然Facebook推出的這項(xiàng)深度圖像技術(shù)被稱(chēng)為3D視頻,但是卻和大家熟悉的3D電影的3D效果不是一碼事。普通的3D只是通過(guò)雙目時(shí)差實(shí)現(xiàn)的偽3D效果,在電影院里,不管你怎么轉(zhuǎn)頭,你看到的立體影像都只有一個(gè)角度,而Facebook的3D照片的特點(diǎn)是可以拖動(dòng)查看不同的角度信息。

說(shuō)了這么多,回到重點(diǎn),F(xiàn)acebook是如何實(shí)現(xiàn)這項(xiàng)技術(shù)的呢?

據(jù)了解,一開(kāi)始,F(xiàn)acebook采用的方式是讓用戶(hù)以單攝像頭的相機(jī)拍攝,通過(guò)移動(dòng)來(lái)捕捉整個(gè)場(chǎng)景,然后通過(guò)分析視差和手機(jī)運(yùn)動(dòng),即不同距離的物體在相機(jī)移動(dòng)時(shí)移動(dòng)的數(shù)據(jù),可以精確地在重建出3D場(chǎng)景。

但是,從單個(gè)攝像機(jī)的快速圖像中推斷出深度數(shù)據(jù)是對(duì)CPU的計(jì)算要求很高,這種方法在大多數(shù)手機(jī)都有雙攝像頭時(shí)顯得有些過(guò)時(shí)。通過(guò)同時(shí)使用兩個(gè)相機(jī)捕獲圖像,即使對(duì)于運(yùn)動(dòng)中的物體也可以觀察到視差差異。并且因?yàn)閮蓚€(gè)鏡頭的設(shè)備處于完全相同的位置,所以深度數(shù)據(jù)的噪音要小得多,對(duì)運(yùn)算的要求也低很多。

Facebook目前就是采用iPhone的雙攝像頭,手機(jī)的兩個(gè)攝像頭拍攝了一對(duì)圖像,設(shè)備立即自行完成計(jì)算“深度圖”,圖像編碼幀中所有內(nèi)容的計(jì)算距離。結(jié)果看起來(lái)像這樣:

蘋(píng)果、三星、華為、谷歌都在研究深度圖像技術(shù),但是目前主要用在照片的背景模糊上面。深度圖的技術(shù)難點(diǎn)在于,創(chuàng)建的深度圖沒(méi)有某種絕對(duì)比例。例如,當(dāng)深紅色意味著100英尺時(shí),淺黃色并不意味著10英尺。每張照片的比例都不相同,這意味著你需要拍攝多張照片來(lái)獲得物體實(shí)際距離,但是要將這些照片拼接在一起是一種痛苦。

這就是Kopf和Hedman及其同事所面臨的問(wèn)題。在他們的系統(tǒng)中,用戶(hù)通過(guò)移動(dòng)他們的手機(jī)拍攝他們周?chē)h(huán)境的多個(gè)圖像;它每秒捕獲一個(gè)圖像(技術(shù)上是兩個(gè)圖像和一個(gè)結(jié)果深度圖)并開(kāi)始將其添加到其集合中。 在后臺(tái),算法會(huì)查看手機(jī)運(yùn)動(dòng)檢測(cè)系統(tǒng)捕獲的相機(jī)的深度圖和微小運(yùn)動(dòng)。然后,深度圖基本上被按摩成正確的形狀以與其他照片對(duì)齊。

創(chuàng)建出深度圖之后,深度圖會(huì)被轉(zhuǎn)換為3D網(wǎng)格(這個(gè)比較抽象,可以將其想象為一個(gè)紙質(zhì)版本的景觀圖)。然后,檢查網(wǎng)格的明顯邊緣,將這些邊緣撕裂開(kāi),例如前景中欄桿遮擋背景中的景觀,就將兩者分離開(kāi)。這會(huì)將各種物體隔開(kāi),使它們看起來(lái)處于不同的深度,并隨著透視的變化移動(dòng)。雖然這些方法創(chuàng)造了3D效果,但是你可能已經(jīng)猜到前景看起來(lái)只不過(guò)是一個(gè)紙質(zhì)鏤空,因?yàn)?,如果是直接拍攝的人臉,就沒(méi)有關(guān)于他們的頭部或背部。

那么,最后一步就很重要。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)去猜測(cè)和填充圖像的其余部分。例如,如果圖像區(qū)域有頭發(fā),那么頭發(fā)可能會(huì)繼續(xù)存在。因此,它可以令人信服地重新構(gòu)建這些紋理,并估計(jì)對(duì)象的形狀,縮小間隙。這樣當(dāng)你稍微改變視角時(shí),你似乎真的“圍繞”對(duì)象看了一圈。

Facebook目前能在一秒鐘的時(shí)間內(nèi)完成深度圖的創(chuàng)建,因此他們將此稱(chēng)為“即時(shí)3D攝影”。當(dāng)然,3D照片功能目前只能在有兩個(gè)攝像機(jī)上使用,首發(fā)這項(xiàng)功能的是iPhone 7+, 8+, X or XS,此后會(huì)有更多手機(jī)加入。

在論文中,F(xiàn)acebook也討論了如何用通過(guò)另一個(gè)卷積神經(jīng)網(wǎng)絡(luò)來(lái)使得單攝像頭的相機(jī)也擁有同樣功能。但是,單攝像頭不如雙攝像頭系統(tǒng)好。這還需要算法和軟件公司的繼續(xù)努力,正如前些天,曾報(bào)道,Google就用單攝像頭實(shí)現(xiàn)了超越蘋(píng)果雙攝像頭的多項(xiàng)計(jì)算攝影效果。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉