百度首席科學(xué)家吳恩達(dá)：深度學(xué)習(xí)能給公司帶來什么價(jià)值？

時(shí)間：2020-08-25 16:51:01

關(guān)鍵字： AI 深度學(xué)習(xí) 百度自動(dòng)駕駛

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 　　在人工智能領(lǐng)域，“深度學(xué)習(xí)”這個(gè)詞意味著這個(gè)軟件可以通過實(shí)踐經(jīng)驗(yàn)改善算法模型的表現(xiàn)。比如谷歌在2012年發(fā)起的一個(gè)項(xiàng)目，讓一個(gè)運(yùn)行在16000個(gè)處理器上的神經(jīng)網(wǎng)絡(luò)瀏覽

　　在人工智能領(lǐng)域，“深度學(xué)習(xí)”這個(gè)詞意味著這個(gè)軟件可以通過實(shí)踐經(jīng)驗(yàn)改善算法模型的表現(xiàn)。比如谷歌在2012年發(fā)起的一個(gè)項(xiàng)目，讓一個(gè)運(yùn)行在16000個(gè)處理器上的神經(jīng)網(wǎng)絡(luò)瀏覽了1000萬個(gè)Youtube上的視頻后，算法自己學(xué)會(huì)了識(shí)別貓臉。

　　這個(gè)項(xiàng)目的領(lǐng)導(dǎo)者：吳恩達(dá)，現(xiàn)在已經(jīng)加入了百度的百度研究院并成為了其首席科學(xué)家，百度和谷歌、微軟等搜索服務(wù)商一樣對(duì)機(jī)器學(xué)習(xí)有著天然的興趣。所以百度2014年在加州森尼維爾市成立了百度研究院，負(fù)責(zé)AI領(lǐng)域的研究。其包含三個(gè)部分：大數(shù)據(jù)實(shí)驗(yàn)室、深度學(xué)習(xí)實(shí)驗(yàn)室和硅谷AI實(shí)驗(yàn)室。

　　促進(jìn)人類和機(jī)器智能的合作是吳恩達(dá)研究的一個(gè)主線，在2008年的時(shí)候他作為斯坦福大學(xué)的計(jì)算機(jī)科學(xué)教授，在網(wǎng)上開設(shè)了一門在線機(jī)器學(xué)習(xí)課程。這門課程最終發(fā)展成為了該校廣受贊譽(yù)的MOOC在線教育平臺(tái)的旗艦課程。這門課的學(xué)生數(shù)在幾年內(nèi)迅速發(fā)展到了10萬人以上。2012年，吳恩達(dá)和斯坦福大學(xué)的同事Daphne Koller建立了Coursea，一個(gè)給學(xué)生免費(fèi)提供一流大學(xué)教育水平的在線課程的技術(shù)教育公司。吳恩達(dá)在成為它的董事長(zhǎng)的同時(shí)，也保留了他在斯坦福的職位。

　　吳恩達(dá)是技術(shù)發(fā)展的領(lǐng)軍人物之一，經(jīng)常公開敘述在日常生活中智能設(shè)備會(huì)給我們帶來的便利。在三月的舊金山數(shù)據(jù)大會(huì)的演講后，吳恩達(dá)接受了商業(yè)戰(zhàn)略（Strategy+business）的采訪。在采訪中，他再次強(qiáng)調(diào)了他在大會(huì)上表達(dá)的觀點(diǎn)。在這個(gè)為更高的回報(bào)價(jià)值而優(yōu)化的端對(duì)端戰(zhàn)略中，公司的受益會(huì)是最大的，對(duì)無論是對(duì)個(gè)體還是對(duì)企業(yè)，而最終全世界都會(huì)受益。

　　S+B：深度學(xué)習(xí)是什么，它能給一個(gè)公司帶來什么價(jià)值？

　　吳恩達(dá)：深度學(xué)習(xí)是一個(gè)已經(jīng)發(fā)展了數(shù)十年的想法的新呈現(xiàn)方式。在最開始的時(shí)候，人們先是開始用從大腦的結(jié)構(gòu)中獲得了某些靈感的智能神經(jīng)網(wǎng)絡(luò)進(jìn)行試驗(yàn)。但直到最近我們的電腦發(fā)展出了這樣的計(jì)算能力，也擁有了如此龐大的數(shù)據(jù)，以及擁有了能幫我們構(gòu)建能夠在沒有人類的程序員的設(shè)計(jì)和指引下自主學(xué)習(xí)到一些有層次的概念的神經(jīng)網(wǎng)絡(luò)的專業(yè)知識(shí)之后。（這些神經(jīng)網(wǎng)絡(luò)）才開始能夠幫助提取、組織和處理現(xiàn)代公司中這些復(fù)雜的數(shù)據(jù)。

　　在幾年前，我們發(fā)現(xiàn)深度學(xué)習(xí)終于開始表現(xiàn)得比傳統(tǒng)的AI實(shí)現(xiàn)方法要好了。以前的那些AI是完全不會(huì)知道如何處理我們現(xiàn)在處理的這種規(guī)模的數(shù)據(jù)的。

　　在過去的五年里，我們終于擁有了足以建立龐大到能處理我們從互聯(lián)網(wǎng)和移動(dòng)設(shè)備中收集到的這么大規(guī)模數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)的計(jì)算能力。通過建立這種大規(guī)模神經(jīng)網(wǎng)絡(luò)，我們可以檢驗(yàn)我們深度學(xué)習(xí)算法的表現(xiàn)情況。而隨著我們給算法輸入越來越多的數(shù)據(jù)，它們的表現(xiàn)也會(huì)越來越好。這意味著我們能做出遠(yuǎn)比現(xiàn)在更精確的模型和預(yù)測(cè)，并且用我們收集到的這些數(shù)據(jù)來發(fā)現(xiàn)公司中的問題。

　　對(duì)于少數(shù)企業(yè)來說，深度學(xué)習(xí)可以為其帶來驚人的收入增長(zhǎng)。搜索引擎和在線廣告可能是短期來看AI最重要的應(yīng)用了。搜索結(jié)果能更貼近用戶的需要的話，無論是對(duì)廣告商、對(duì)用戶還是對(duì)我們來說都是件好事。

　　S+B：你覺得接下來的十年內(nèi)深度學(xué)習(xí)會(huì)如何演化？

　　吳恩達(dá)：我發(fā)現(xiàn)深度學(xué)習(xí)的前沿在同高性能計(jì)算產(chǎn)生越來越密切的關(guān)系。我和我們的團(tuán)隊(duì)建起了非常強(qiáng)大的超級(jí)計(jì)算機(jī)來充分發(fā)揮我們所擁有的海量數(shù)據(jù)帶來的優(yōu)勢(shì)。

　　短期內(nèi)深度學(xué)習(xí)帶來的大部分商業(yè)價(jià)值都是來自于我們稱之為監(jiān)督式學(xué)習(xí)的算法。比如：我們給算法看一個(gè)Email，算法就能判斷它是不是垃圾郵件?；蛘呶覀兘o出一個(gè)廣告，它就能預(yù)測(cè)用戶什么時(shí)候會(huì)點(diǎn)擊這個(gè)廣告。我們已經(jīng)從監(jiān)督式學(xué)習(xí)中創(chuàng)造了巨大的商業(yè)價(jià)值。而且我們認(rèn)為在將來的幾年中我們還能在這其中順利的創(chuàng)造出更大更驚人的附加價(jià)值。

　　但是往更長(zhǎng)遠(yuǎn)一點(diǎn)的方向看的話，我覺得很多項(xiàng)目，比如像圖像識(shí)別和語音識(shí)別這樣深度學(xué)習(xí)已經(jīng)在其上取得了巨大進(jìn)展的項(xiàng)目。它們不僅會(huì)為公司創(chuàng)造巨大的經(jīng)濟(jì)價(jià)值，也會(huì)讓我們的世界變成一個(gè)更好的地方。

　　就單看自動(dòng)駕駛汽車這一項(xiàng)上的發(fā)展，深度學(xué)習(xí)就能為我們帶來比現(xiàn)在安全和方便得多的出行體驗(yàn)，不管是從增加人們的預(yù)期壽命還是幫人們節(jié)省很多時(shí)間來看，它實(shí)際上都給我們每個(gè)人的人生憑空增加了幾年的可用時(shí)間。有數(shù)據(jù)表示，汽車事故可能平均減少了孩子們?nèi)甑念A(yù)期壽命，美國(guó)人一生中平均也差不多有三年是在車上度過的。所以，在某種程度上我們可以說我們讓每個(gè)人的人生中都多了六年有意義的時(shí)間。這聽起來真的很不錯(cuò)。

　　S+B：你提到了自動(dòng)駕駛汽車，這東西真的那么快就能實(shí)現(xiàn)了嗎？

　　吳恩達(dá)：是的，我們希望在三年內(nèi)做出能商業(yè)化應(yīng)用的自動(dòng)駕駛汽車，并在五年內(nèi)實(shí)現(xiàn)大規(guī)模量產(chǎn)。最終過程的時(shí)間段其實(shí)很難預(yù)測(cè)，但這個(gè)時(shí)間是我們覺得最有可能實(shí)現(xiàn)的時(shí)間了。

　　對(duì)目前自動(dòng)駕駛汽車的狀態(tài)來說，似乎有一個(gè)與手動(dòng)駕駛的類比是合適的。當(dāng)你的車開入一片工地的時(shí)候，它表現(xiàn)得必須和在普通的街道上行駛的時(shí)候不一樣。它必須要開得慢一些，還要注意建筑工人。

　　我現(xiàn)在還不覺得近期計(jì)算機(jī)視覺能可靠的分辨出建筑工人打的手勢(shì)（比如停，走和減速）的含義。但是我們可以通過適當(dāng)改變基礎(chǔ)設(shè)施的設(shè)計(jì)來解決這個(gè)問題。比如給建筑工人一個(gè)無線信標(biāo)。同時(shí)適當(dāng)調(diào)整一下道路的設(shè)計(jì)和建造方式以及社會(huì)期望。我們可以使無人駕駛汽車成為現(xiàn)實(shí)，并且讓它比人類駕駛的汽車安全得多。

　　我想用AI，通過嵌入環(huán)境中的那些智能設(shè)備來創(chuàng)造一個(gè)更好的社會(huì)?，F(xiàn)在的語音控制就像2000年初的觸屏設(shè)備那樣。太初級(jí)了以至于很難具備什么實(shí)用價(jià)值。但隨著iPhone的發(fā)明，喬布斯和蘋果發(fā)現(xiàn)了讓觸摸屏變得有效率的方法。語音控制也會(huì)經(jīng)歷類似的變革的。他們會(huì)影響社會(huì)的方方面面。想象會(huì)遵守我們語音指令的機(jī)器人和機(jī)器人警衛(wèi)。我希望將來我的子孫們會(huì)奇怪，為什么我們這個(gè)時(shí)代想要調(diào)空調(diào)的溫度的時(shí)候還需要去轉(zhuǎn)刻度盤，而不是直接告訴房子“我們覺得有點(diǎn)冷”。

　　S+B：你曾經(jīng)在四個(gè)大型組織中工作：斯坦福，Coursera，谷歌和現(xiàn)在的百度。作為一個(gè)一直想要促進(jìn)深度學(xué)習(xí)發(fā)展的人，你覺得我們應(yīng)該怎樣合作來創(chuàng)造一個(gè)更好的算法？

　　吳恩達(dá)：我花了很多時(shí)間來試圖建立一個(gè)目的就在于確保我們研究的所有成果都確實(shí)能幫助到足夠多的人的組織。因此我們參考了百度研究所這樣端對(duì)端研究組織的架構(gòu)。比如說，如果有人發(fā)明了深度神經(jīng)網(wǎng)絡(luò)，那我們就負(fù)責(zé)搞清楚他需要的數(shù)據(jù)來自哪里以及他怎樣把這個(gè)成果應(yīng)用到他的產(chǎn)品中去，以及，這個(gè)東西在最后怎么提高我們的生活質(zhì)量。

　　在Coursera，我最驕傲的那些時(shí)候是當(dāng)高層面臨一些艱難的抉擇的時(shí)候，會(huì)有除我以外的其它人站出來，說，“讓我們回歸本質(zhì)去思考，搞清楚到底什么是對(duì)學(xué)習(xí)者最好的選擇然后先做那個(gè)。”

　　我真的很欣賞這種回歸本源的思考方式。有太多人陷入一件事不能自拔，只是因?yàn)樗恢痹谧瞿羌禄蛘咂渌艘恢痹谧瞿羌隆Ｋ麄冏鍪碌慕Y(jié)果可能看起來比較有效，但很可能算不上什么真正的成就。

　　S+B：如果想讓AI和科技為人們更好的服務(wù)，人們需要信任體制。但人們對(duì)龐大的體制的信任正在削弱。你怎么解決這個(gè)問題？

　　吳恩達(dá)：我覺得我們需要與政府和社會(huì)更緊密的合作來解決一些與AI相關(guān)的問題。比如，一個(gè)非常大的可能的問題是裁員。作為技術(shù)人員我們應(yīng)該對(duì)這個(gè)問題坦誠(chéng)一些。美國(guó)有350萬卡車司機(jī)。當(dāng)自動(dòng)駕駛系統(tǒng)發(fā)展成熟了，他們?cè)趺崔k？類似的是，AI會(huì)對(duì)醫(yī)學(xué)影像科的那些專家造成怎樣的影響？有些人可能需要開始規(guī)劃將來的出路了。

　　一般來說，新的技術(shù)都會(huì)給人創(chuàng)造新的，更有意義的角色，這次可能也會(huì)。不過在這個(gè)過程中可能會(huì)出現(xiàn)一些問題。這就是我支持為那些找不到工作的人確保一個(gè)最低（福利）收入的原因。但是我們應(yīng)該要求那些獲得這些福利的人保持學(xué)習(xí)。如果我們能給那些無業(yè)人員獲得技能的報(bào)酬，對(duì)他們和社會(huì)都是件好事。世界正在以前所未有的速度變化，為了跟上它的步伐，我們必須保持不斷的學(xué)習(xí)。