深度學(xué)習(xí)正在顛覆互聯(lián)網(wǎng)控制權(quán)
據(jù)連線雜志網(wǎng)站報(bào)道,在澳大利亞的西海岸,生物學(xué)家阿曼達(dá)·霍奇森(Amanda Hodgson)控制無(wú)人機(jī)飛向印度洋上的高空。這位儒艮專家使用無(wú)人機(jī)幫助他們觀察瀕臨滅絕的研究對(duì)象。不過(guò)霍奇森和她的團(tuán)隊(duì)并沒(méi)有能力來(lái)篩查所有拍得的照片。在45000張照片中尋找儒艮的身影,對(duì)于未經(jīng)過(guò)訓(xùn)練的眼睛來(lái)說(shuō)太難了。她的解決之道是把這工作交給深度神經(jīng)網(wǎng)絡(luò)來(lái)完成。
神經(jīng)網(wǎng)絡(luò)是種機(jī)器學(xué)習(xí)模型,大眾所熟知的“人臉識(shí)別”便是其應(yīng)用之一。此外,手機(jī)的智能語(yǔ)音助理之所以能理解你說(shuō)的話,谷歌搜索引擎之所以能呈現(xiàn)準(zhǔn)確的搜索結(jié)果,也都有它在背后的功勞。通過(guò)對(duì)人類大腦神經(jīng)網(wǎng)絡(luò)進(jìn)行模仿,這些掃描數(shù)學(xué)模型通過(guò)對(duì)大量數(shù)據(jù)的分析來(lái)習(xí)得專項(xiàng)功能。前文所述霍奇森博士便使用這種技術(shù)在數(shù)千張航拍照片中尋找儒艮的蹤跡?;羝嫔纳窠?jīng)網(wǎng)絡(luò)基于TensorFlow打造,這是谷歌研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng)。
由于儒艮習(xí)慣在水面以下捕食,所以檢測(cè)這些動(dòng)物的任務(wù)需要格外的精確度。“它們的身跡很容易跟水面眩光相混淆。”她說(shuō)。現(xiàn)在她的神經(jīng)網(wǎng)絡(luò)可以識(shí)別散布海面80%的儒艮。
該項(xiàng)目尚處在早期階段,但它卻展示了深度學(xué)習(xí)在剛過(guò)去的一年里廣泛的影響。深度學(xué)習(xí)在2016年風(fēng)光無(wú)限。這個(gè)古老的技術(shù)被賦予新的活力,幫助谷歌在世界矚目的圍棋大戰(zhàn)中擊敗人類。這在幾個(gè)月前還是幾乎不可能的事。AlphaGo(“圍棋”的英文名字即叫“Go”)僅僅是最突出的例子。一年過(guò)去,深度學(xué)習(xí)不再只是科技極客的小眾玩寵,轉(zhuǎn)而走向了風(fēng)光臺(tái)面。谷歌、Facebook、微軟和亞馬遜籍著它從里到外煥然一新。反過(guò)來(lái)這些互聯(lián)網(wǎng)巨頭的推波助瀾——通過(guò)開(kāi)放源代碼和提供云服務(wù)——也加速了深度學(xué)習(xí)的流行。
新翻譯去年,神經(jīng)網(wǎng)絡(luò)在Google Photo等應(yīng)用上將圖像識(shí)別技術(shù)提升到新臺(tái)階,Google Now和微軟小娜也因它的加持實(shí)現(xiàn)了更優(yōu)異的語(yǔ)音識(shí)別效果。今年,輪到了翻譯界被改造。機(jī)器翻譯實(shí)現(xiàn)了大躍進(jìn)。九月份,谷歌推出“神經(jīng)機(jī)器翻譯”服務(wù)。這種翻譯完全通過(guò)神經(jīng)網(wǎng)絡(luò)運(yùn)行,將翻譯誤差率降低了55%~85%。
谷歌通過(guò)大量現(xiàn)有翻譯的集合數(shù)據(jù)來(lái)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。培訓(xùn)材料既包括舊版翻譯軟件差強(qiáng)人意的翻譯,也包括由人類語(yǔ)言專家提供的信雅達(dá)式翻譯,后者無(wú)疑對(duì)提高素材質(zhì)量有加分。深度學(xué)習(xí)擁有克服缺陷的神奇魔法:盡管培訓(xùn)材料質(zhì)量參差不齊,但神經(jīng)網(wǎng)絡(luò)最終能夠?qū)崿F(xiàn)遠(yuǎn)超低水平的翻譯水準(zhǔn)。
雖然谷歌的首席工程師麥克·舒斯特(Mike Schuster)坦誠(chéng)他們的造物還遠(yuǎn)非完美,但它仍然不失是一個(gè)突破性成就。由于該服務(wù)完全基于深度學(xué)習(xí)運(yùn)行,未來(lái)改進(jìn)工作也將輕松許多。開(kāi)發(fā)人員可以集中精力從整體上對(duì)系統(tǒng)做出改進(jìn),而不是像過(guò)去那樣再為小部件糾結(jié)。
谷歌之外,微軟也在朝同一方向努力。本月,微軟也發(fā)布了自己翻譯應(yīng)用的新版本。號(hào)稱能夠在九種語(yǔ)言之間實(shí)現(xiàn)即時(shí)翻譯。微軟副總裁沈向洋(Harry Shum)表示微軟翻譯的系統(tǒng)同樣完全運(yùn)行在神經(jīng)網(wǎng)絡(luò)上。這意味著微軟翻譯的水平也有迅速提升的可能。
新聊天2016年,深度學(xué)習(xí)也在聊天機(jī)器人領(lǐng)域大顯身手。其中最引人注目的當(dāng)數(shù)Google Allo。Allo于今年秋天推出,通過(guò)對(duì)用戶文本和照片的分析,能夠提供即時(shí)的智能回復(fù)。其功能的實(shí)現(xiàn)基于谷歌此前一項(xiàng)名為“智能回復(fù)”(Smart Reply)的技術(shù),該技術(shù)與電子郵件技術(shù)在很大程度上有相似之處。
Allo不僅僅是一個(gè)聊天app,它還能在你毫無(wú)察覺(jué)中提升你的谷歌搜索體驗(yàn)。程序幫助搜索引擎理解你的需求,從而使搜索返回的結(jié)果更合乎你的需求。根據(jù)谷歌搜索產(chǎn)品經(jīng)理大衛(wèi)·奧爾(David Orr)的說(shuō)法,如果沒(méi)有深度學(xué)習(xí),程序就無(wú)法實(shí)現(xiàn)回答。“使用神經(jīng)網(wǎng)絡(luò)是我們找到的唯一方法。”他說(shuō)。“我們必須使用我們所掌握的最先進(jìn)科技。”
盡管有其強(qiáng)項(xiàng),但進(jìn)行真正的對(duì)話仍然讓神經(jīng)網(wǎng)絡(luò)力不能及。造出這種完全以假亂真的“聊天機(jī)器人”還有很長(zhǎng)的路要走。當(dāng)下,谷歌、Facebook和其他地方的研究員正在積極探索深度學(xué)習(xí)技術(shù),以期有朝一日能實(shí)現(xiàn)宏偉目標(biāo)??梢源_定的是這些技術(shù)探索將會(huì)帶來(lái)和“語(yǔ)音識(shí)別”、“圖像識(shí)別”和“機(jī)器翻譯”一樣偉大的進(jìn)步。“聊天機(jī)器人”就是下一個(gè)技術(shù)前沿。
新數(shù)據(jù)中心谷歌在深度學(xué)習(xí)的路上停都停不下來(lái)。今年夏天,在打造了名聲大噪的AlphaGo之后,Google DeepMind實(shí)驗(yàn)室領(lǐng)導(dǎo)人杰米斯·哈薩比斯(Demis Hassabis)表示他們還開(kāi)發(fā)了一個(gè)AI來(lái)管理谷歌全球計(jì)算機(jī)數(shù)據(jù)中心網(wǎng)絡(luò)。使用一種被稱為“深度強(qiáng)化學(xué)習(xí)”(Deep Reinforcement Learning)的技術(shù),AI能夠智能管理服務(wù)器中冷卻風(fēng)扇的開(kāi)關(guān)和溫度控制。總之一個(gè)數(shù)據(jù)中心超過(guò)120項(xiàng)功能全由它掌控。
彭博社報(bào)道,這個(gè)AI的部署幫助谷歌節(jié)省了數(shù)億美元。2014年谷歌花6.5億美元收購(gòu)DeepMind,現(xiàn)在已經(jīng)完全撈回了成本。目前DeepMind正計(jì)劃在這些計(jì)算設(shè)施外安裝更多傳感器,收集更多數(shù)據(jù)來(lái)訓(xùn)練AI到更高的水平。
新的云計(jì)算當(dāng)互聯(lián)網(wǎng)巨頭紛紛用新技術(shù)武裝自己時(shí),他們也通過(guò)自家服務(wù)將之獻(xiàn)給大眾。2015年底,谷歌宣布將TensorFlow開(kāi)源。僅僅一年內(nèi),這個(gè)一度專有的軟件造福了像阿曼達(dá)·霍奇森這樣的千萬(wàn)大眾。與此同時(shí),谷歌還與微軟、亞馬遜一道在云計(jì)算服務(wù)中提供自己的深度學(xué)習(xí)技術(shù),讓任何個(gè)人或組織開(kāi)發(fā)者使用它們來(lái)構(gòu)建自己的程序。“人工智能服務(wù)”可能成為這三個(gè)網(wǎng)絡(luò)巨頭的最大業(yè)務(wù)。
在過(guò)去的十二個(gè)月中,技術(shù)的火熱讓領(lǐng)域內(nèi)的人才變得炙手可熱。李飛飛(Fei-Fei Li)是AI研究領(lǐng)域技術(shù)領(lǐng)袖級(jí)人物,谷歌聘請(qǐng)她來(lái)管理其AI云計(jì)算組織。亞馬遜則聘請(qǐng)卡內(nèi)基梅隆大學(xué)教授亞歷克斯·斯摩納(Alex Smolna)坐鎮(zhèn)其云計(jì)算帝國(guó)??萍季揞^竭盡全力招攬人才,彼此毫不相讓。所幸他們競(jìng)爭(zhēng)產(chǎn)生的研究成果都會(huì)為公眾所用,這倒不是壞事。
隨著AI的演變,計(jì)算機(jī)科學(xué)家的角色也正在發(fā)生改變。傳統(tǒng)意義上能夠編寫代碼的人變的不那么重要,新趨勢(shì)需要的是更多能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò)的人。后者所需的技能非同以往,與自己開(kāi)發(fā)東西相比,它更像是誘導(dǎo)數(shù)據(jù)產(chǎn)生結(jié)果。谷歌這些大企業(yè)不僅積極招徠新式人才,并且也在將已有員工往這方向引導(dǎo)。未來(lái)AI將會(huì)使每個(gè)人生活中的技術(shù)變革一新。