人工智能現(xiàn)在可以作畫了
Facebook和Google正在創(chuàng)建巨大的神經(jīng)網(wǎng)絡(luò)——人造大腦,它能識別數(shù)碼相片里面的人臉、汽車、建筑物和其他對象,但它并不是只能做這些事。它還能識別口語,將一種語言翻譯成另一種語言,識別廣告以及教機(jī)器人擰螺絲。如果你把這些大腦顛倒過來,你不僅可以教它們識別圖像,你還可以用有趣的方式教它們創(chuàng)建圖像。
Facebook在本周五透露,他們正在教這些神經(jīng)網(wǎng)絡(luò)自動創(chuàng)建一些小圖像,例如飛機(jī)、汽車和動物,這些圖像極具迷惑性,人們看了之后,會覺得這是真實(shí)的。“模型可以識別一些不自然的圖像,比如電視上的白色噪點(diǎn),或一些抽象的藝術(shù)圖像,或是你相機(jī)上的圖像”,F(xiàn)acebook人工智能研究員Rob Fergus說道,“它可以理解圖像是如何構(gòu)成的。”
同時,Google的科學(xué)家則走向另外一個極端,他們利用神經(jīng)網(wǎng)絡(luò)將真實(shí)的相片轉(zhuǎn)變成有趣的虛幻相片。“這將會形成一個反饋循環(huán):如果一朵云看起來就像一只小鳥,那么這個網(wǎng)絡(luò)就會讓它看起來更像一只鳥”,Google在一個博客中闡述了這個項(xiàng)目。
從某種程度上,這些其實(shí)都是一些小把戲,特別是Google的反饋循環(huán),它只是引起人們的幻覺。還有Facebook的假圖片,其實(shí)只有64x64像素。但從另一個層面上,這些項(xiàng)目也是一種改善神經(jīng)網(wǎng)絡(luò)的方法。計(jì)算機(jī)視覺公司Dextro的CEO David Luan說,“這個項(xiàng)目能讓我們更好地了解我們的網(wǎng)絡(luò)實(shí)際上是怎么學(xué)習(xí)的。”
Fergus和另外兩位Facebook研究員透露了他們的“圖像生成模式”,這個系統(tǒng)用了兩個神經(jīng)網(wǎng)絡(luò),一個用來識別自然圖像,而另一個用來“愚弄”對方,前者得不斷地檢測是否被后者愚弄,它們互相反饋,最終能產(chǎn)生一個相當(dāng)現(xiàn)實(shí)的圖像。
根據(jù)Fergus介紹,這個項(xiàng)目可以用來修復(fù)一些老化的真實(shí)照片,另外,該項(xiàng)目讓所謂的“無監(jiān)督機(jī)器學(xué)習(xí)”向前邁進(jìn)了一步,換句話說,即使沒有研究人員提供明確的指導(dǎo),它也可以幫助機(jī)器學(xué)習(xí)。
“不過當(dāng)前系統(tǒng)依然需要一些監(jiān)督”,Luan說道,但他相信Facebook的論文“neat work”以及Google研究人員正在做的工作,可以幫助我們了解神經(jīng)網(wǎng)絡(luò)的行為。
神經(jīng)網(wǎng)絡(luò)由很多層人工神經(jīng)元組成,它們互相協(xié)作,雖然這些神經(jīng)元能非常順利地執(zhí)行某些任務(wù),但是我們不明白其中的工作原理。“神經(jīng)網(wǎng)絡(luò)的挑戰(zhàn)之一,是精確地了解每一層是如何運(yùn)作的”,Google在其博客中說道,但該公司沒有進(jìn)一步討論其圖像生成工作的原理。
Google解釋道,把神經(jīng)網(wǎng)絡(luò)顛倒過來,然后使它們生成圖像,這樣就可以更好地理解它們的運(yùn)作方式了。Google要求其網(wǎng)絡(luò)放大它在圖像中的一些發(fā)現(xiàn),有時只是放大一個圖形的邊緣,有時候放大一些更復(fù)雜的東西,例如一座塔在地平面的輪廓,一棵樹的枝干。在每種情況下,研究人員都能很好地了解這個網(wǎng)絡(luò)所看到的東西。這項(xiàng)技術(shù)能幫助研究人員了解神經(jīng)網(wǎng)絡(luò)如何執(zhí)行不同難度的任務(wù),有助于提高網(wǎng)絡(luò)體系結(jié)構(gòu),并檢查網(wǎng)絡(luò)在訓(xùn)練中所學(xué)到的東西。
另外,像Facebook的工作,這有點(diǎn)酷,有點(diǎn)奇怪,甚至有點(diǎn)可怕。
總的來說,想讓計(jì)算機(jī)能更好地識別什么是真實(shí)的,我們還得付出更多的努力。