DeepMind人工智能學(xué)會將平面圖像轉(zhuǎn)換為3D場景
據(jù)外媒報(bào)道,谷歌母公司Alphabet旗下DeepMind最近開發(fā)了一種人工智能技術(shù),它可以在觀察2D平面圖像之后以3D渲染整個場景。目前一些人工智能研究人員正在試圖教機(jī)器學(xué)習(xí)像人類一樣。我們不是以像素為單位看世界,而是環(huán)顧我們的環(huán)境并對其中的一切進(jìn)行假設(shè)。
DeepMind團(tuán)隊(duì)則訓(xùn)練了一個人工智能如何從其未見的角度猜測事物的樣子。 DeepMind的科學(xué)家提出了一個生成查詢網(wǎng)絡(luò)(Generative Query Network,GQN),這是一個神經(jīng)網(wǎng)絡(luò),旨在教人工智能如何從不同的角度想象物體的場景會是什么樣子?;旧希斯ぶ悄苡^察場景的2D平面圖像,然后嘗試重新創(chuàng)建它。在這種情況下,重要的是DeepMind的人工智能不使用任何人為標(biāo)記的輸入等。它只觀察三幅圖像,并開始預(yù)測場景的3D版本是什么樣子。
研究人員正在努力實(shí)現(xiàn)“完全無監(jiān)督的場景理解”。目前人工智能尚未接受真實(shí)世界的圖像訓(xùn)練,因此下一步將從照片中渲染逼真的場景。未來,DeepMind基于GQN的人工智能可能只使用照片就可以生成與現(xiàn)實(shí)世界幾乎完全相同的按需3D場景。