Michael I. Jordan:AI時代未到大爆炸的時代,需正確認知
現(xiàn)今的我們,并非處于一個人工智能的神奇大爆炸時代。
在人工智能成為炙手可熱的話題之后,前百度首席科學(xué)家吳恩達的導(dǎo)師、被譽為人工智能領(lǐng)域的“根目錄”之一的Michael I. Jordan教授希望能通過自己的課程讓人們更準確地認知AI領(lǐng)域。
授課老師|Michael I. Jordan
加州大學(xué)伯克利分校教授、美國三院院士
Michael I. Jordan,前百度首席科學(xué)家吳恩達的導(dǎo)師、被譽為人工智能領(lǐng)域的“根目錄”之一。近兩年,人工智能技術(shù)發(fā)展的如火如荼,混沌大學(xué)課堂上,Michael I. Jordan提出,我們并非處于人工智能的大爆炸時代,在這一領(lǐng)域,我們?nèi)蕴幱诜浅3跫壍碾A段,很多事情我們還不了解。他還從三方面告訴了我們怎樣準確認知人工智能的現(xiàn)在與未來。
目前,人們講到人工智能和機器學(xué)習(xí),可能還是覺得它很復(fù)雜。
事實上,當你聽過我的課程,就會發(fā)現(xiàn),關(guān)于這個話題,有很多還停留在概念性、戰(zhàn)略性的階段。當然,也有一些投入實際應(yīng)用的技術(shù),但這背后的理論,還是非?;A(chǔ)和簡單的。
人工智能與機器學(xué)習(xí),其實還遠遠不是一門基礎(chǔ)扎實的工程學(xué)科,它并不能為現(xiàn)在用數(shù)據(jù)分析問題提供強大且可拓展的解決方案。
因此,我們并不能將人工智能與機器學(xué)習(xí)的發(fā)展簡單理解為一個神跡,如同高樓非一夜而起,它是必須要經(jīng)歷長時間的發(fā)展的。
大家首先要意識到,在這一領(lǐng)域,我們?nèi)蕴幱诜浅3跫壍碾A段。很多事情我們還不了解,現(xiàn)今的我們并非處于一個人工智能的神奇大爆炸時代。
可以說,我們有可能要花上百年的時間,這個高樓大廈才能真正地建立起來。
準確認知人工智能的現(xiàn)在與未來
本節(jié)要點
目前的智能系統(tǒng)還無法做到對場景的常識理解;
我們不太可能看到所謂的“超級人類AI”。
拋棄那些外界的宣傳,我們需要實際且準確地理解人工智能。我們來講,目前的人工智能有哪些可能性,以及,哪些技術(shù)還沒有實現(xiàn)的可能。
計算機視覺
可能:在可視場景中標記對象
目前尚無可能:對視覺場景的常識理解
比如,一個會議室的攝像機,把它連接到電腦上后,讓它區(qū)分哪些是人臉。在目前,人工智能也許可以標記對象,但卻不能理解這個場景。
作為人類,我知道這個會議室有很多人,出口在哪里,我要小心臺階不能掉下去。這是我的常識性理解,但計算機是做不到的。
語音識別
可能:多語種語音到文本和文本到語音的轉(zhuǎn)換
目前尚無可能:對聽覺場景的常識理解
我的聲音可以通過話筒接到電腦中并轉(zhuǎn)化為文本,轉(zhuǎn)化為語音。但如上所述,電腦并不能對文本背后的常識進行理解。
人們可以馬上理解一個很復(fù)雜的句子來預(yù)測下一步行動,但計算機做不到。
自然語言處理
可能:最低限度的翻譯和問答
目前尚無可能:語義理解、對話
自然語言中有很多東西,機器是做不到的。機器只能死記硬背,卻沒有辦法真正地回答問題。
當你和電腦交流的時候,它可以回答你“中國最大的城市是哪一個”,那是它通過“中國”、“城市”、“最大”這三個關(guān)鍵詞,在百度搜索的答案。
但如果你的問題是“中國不在河邊的第二大城市是哪一個”,電腦給你的答案一定是對你一點用都沒有的。因為在此之前可能從來沒有人做過這個問題的相關(guān)數(shù)據(jù),沒有這個問題答案的數(shù)據(jù)列表。
但在未來的十年,上述被列為“尚無可能”的部分,將至少可實現(xiàn)基本形式。
十年,就技術(shù)而言,是一個很長的時間窗口了。事實上有一些技術(shù)已經(jīng)開始出現(xiàn),只是目前在比較原始初級的階段而已。
比如自駕車以及自駕式空中出租車,它們還是會出現(xiàn)的。盡管不會是超級智能,但肯定會越來越好。
但請注意,人工智能系統(tǒng)仍然是非常有限的智能系統(tǒng)。我相信,我的AI同事們也會贊同我的觀點:我們不太可能看到和人有同等智力的靈活性與創(chuàng)造性的AI系統(tǒng)。
首先,人類每時每刻都在以新的方式思考怎樣用新的語言來表述,就像我現(xiàn)在講的每一句話都是有創(chuàng)造性的,我在講話中可以不斷講新的內(nèi)容以及新的理念,使用隱喻、反諷等修辭。
在現(xiàn)實中,AI系統(tǒng)還做不到。AI可以幫你做一些基礎(chǔ)工作,比如幫你在網(wǎng)上訂一張票,但是它無法和你談人生。
此外,人類還非常善于做新的抽象推理。
比如,“Blank從上海走到杭州只花了3個小時”。作為人類,你會做很多推理:Blank會移動,而且從上海走到杭州只花了三個小時,它的運動速度一定很快。那么,你會針對Blank問很多問題。
但AI系統(tǒng)就做不到,它需要反復(fù)、重復(fù)用海量的數(shù)據(jù)才能得出一個答案。
最后,人非常擅長計劃和規(guī)劃。而AI系統(tǒng)只是擅于捕捉目前的數(shù)據(jù),而不可能對未來做出一個長期的、有條不紊的規(guī)劃。
很多人在講“超級人類AI”,這類人一定沒有在AI領(lǐng)域工作過,他們根本就不知道AI領(lǐng)域中存在的技術(shù)問題有多難。
AI系統(tǒng)可以知道世界所有的城市、餐廳、電影院,然而它也只知道這些事實而已。
所以,我不相信所謂的“超級人類AI”,也不相信AI會比人更聰明。
人們覺得AlphaGo很厲害,是因為覺得一般玩圍棋的人就很聰明了,那能打敗玩圍棋的人肯定更聰明。
這是有誤解的。人知道怎么還貸款,上什么學(xué)校,怎么和同伴做智慧交流,這些事都是AlphaGo做不到的。
其實,AlphaGo只是通過無數(shù)對棋盤的模擬,非常機械地、不斷重復(fù)地復(fù)盤,十幾億、幾百億次地進行學(xué)習(xí)。這背后沒有什么創(chuàng)造力,只是無數(shù)次的重復(fù)工作。
所謂的“智能”,是我們根據(jù)參數(shù)匯集起來的數(shù)據(jù)算法,它們只能復(fù)制、模仿、模擬人類的行動,而不是真正的智能。說到底,相比我們真實的世界,圍棋的復(fù)雜程度要低很多,因為真實的世界充滿不確定性。
我覺得,有生之年不會出現(xiàn)這個奇點了。
傳統(tǒng)的機器人算法不能適應(yīng)未來
本節(jié)要點
傳統(tǒng)單一機器人的算法并不能應(yīng)用于未來的智能城市構(gòu)建;
甚至在今天,傳統(tǒng)的機器人問題也沒有得到很好的解決;
相比過去的工業(yè)革命,人工智能帶來的事業(yè)浪潮將會比過去進程快三倍;
那么,什么是值得大家擔心的呢?
我前面講到,所謂的超人類智能系統(tǒng),我們是不應(yīng)該擔心的。而正好相反的是,看似智能,實則不夠智能的這些系統(tǒng),卻是值得我們警惕的。
很多媒體提到AI的時候,講到的是視覺、語音的方面。但我們未來涉及到城市規(guī)劃、推薦系統(tǒng)、醫(yī)學(xué)診斷等,都不再是傳統(tǒng)單一機器人的問題。
這是完全不同類型的問題。
一個機器人的某一錯誤我們是可以控制的。比如,機器人走到舞臺邊緣,探測到下面將有一個高度落差,它會知道停下來。
但如果是一系列問題呢?又或者,是很多機器人一起呢?
如果大樓發(fā)生火災(zāi),這個機器人就不會知道該怎樣逃出去。因為,這是一系列的決策,涉及到你從哪里轉(zhuǎn)移到哪里,還需要和其他人的合作。
比如,大家都從同一個逃生通道出逃,就會出現(xiàn)堵塞,那么,就要選擇換其他的道路。在這種情況下,機器人是做不到的,這樣的算法是非常難的。
如果你用過去傳統(tǒng)的機器人研發(fā)算法去應(yīng)用到城市規(guī)劃建設(shè)等領(lǐng)域,就會出現(xiàn)很多無法解決的重大問題:
NO.1:大規(guī)模多重相關(guān)決策的錯誤控制
搜索引擎給你一個錯誤的推薦建議,如果沒有人因此死亡,就不會出現(xiàn)什么大錯漏。頂多你會覺得這個搜索引擎不好用,再換一個就完了。
但假設(shè)這個推薦是醫(yī)療診斷意見呢?如果這個意見出現(xiàn)錯誤,那真的是會出人命的。而且,我們已經(jīng)看到這件事情的發(fā)生了。
即便是在金融服務(wù)領(lǐng)域,一旦出現(xiàn)錯誤,也可能會引發(fā)市場的大動蕩。交通也是如此,如果連公交走向都出現(xiàn)問題,就極有可能發(fā)生車輛碰撞,整個城市的交通陷入癱瘓。
因此,一旦擴大到這些領(lǐng)域,我們就不能再以傳統(tǒng)應(yīng)用到單一機器人的算法去做這種大規(guī)模的事情,必須要有新算法。
但事實上,在這一點上,我們遠未達到。目前,我們所沿用的思路都是比較傳統(tǒng)或通用的,并沒有意識到在這個層級上還需要做很多事情。
NO.2:如何在競爭環(huán)境中共享數(shù)據(jù)
很多公司手握數(shù)據(jù),卻不愿與人分享。
假如,有一個黑客找出了新的辦法來騙錢,他針對了某一家公司A。那么,A公司就會從這次欺詐當中學(xué)到新東西,可以未來避免同樣的情況。
但因為當初的攻擊只針對了A公司,其他的公司并不知道,因此也就不知道如何改進自己的系統(tǒng)了。
表面上看,A公司只把這個技術(shù)掌握在自己手里,讓其他人學(xué)不到,這好像有點自私。因為,他沒有從整個行業(yè)的角度去考慮問題。如果這家公司把這個數(shù)據(jù)分享給所有人,整個行業(yè)就可以一起改善這個算法。
但現(xiàn)在大家都不愿分享,其實一方面是技術(shù)原因,一方面也是法律的原因。
NO.3:大規(guī)模的云端互動
大家都在談云計算,所有的東西都在云上,讓人們感覺到非常便利。
但這些智能設(shè)備,并不是云設(shè)備,而是端設(shè)備。
事實上,我們未來將要接觸的設(shè)備,都會是所謂的端設(shè)備,它們沒有時間將數(shù)據(jù)上傳到云中。如果你和機器人的每一次對話都要上傳到云,就會導(dǎo)致速度跟不上。
比如,汽車做智能,“我在這里到底要不要轉(zhuǎn)彎”這樣的問題,是不可能每一次都實時和云進行交互的。
因此,要把端設(shè)備和云連接起來,還要實時交互,這兩者之間是存在極大挑戰(zhàn)的,我們現(xiàn)在也不知道該怎么做。
NO.4:如何實現(xiàn)公平,保證品質(zhì)、保持多元化
收集大量的數(shù)據(jù)并沒有問題,但這些數(shù)據(jù)是可能產(chǎn)生偏差的。
比如,你出于某種原因不喜歡某類人而沒有把他們納入你的樣本,但以這樣的樣本去做預(yù)測其結(jié)果本身就是存在偏差和偏見的。
NO.5:穩(wěn)健性和安全性問題
我們在報紙上經(jīng)常講到所謂的超級AI,發(fā)生了某種革命。
但請記住我今天講的話:很多技術(shù)還遠遠不能實現(xiàn),很多問題還有待解決。
比如,無人駕駛車怎樣確保在所有氣候條件下,在所有的路況前提上,每一臺車都可以保證安全駕駛呢?這其實也是一個極大的挑戰(zhàn)。
甚至在今天,傳統(tǒng)的單一機器人,也仍有很多問題沒有解決。
還有失業(yè)浪潮。每一次工業(yè)革命,都有很多人會因此失去工作。但值得注意的是,過去的失業(yè)浪潮是花費三五十年完成的。但接下來,很多工作可能在5-10年內(nèi)就會被完全取代,這是一個新的趨勢,貧富差距也會隨之進一步拉大。
并且,人工智能可能會被居心叵測的人濫用。AI本身不存在邪惡與正義,主要還是看它被誰利用。比如,我們現(xiàn)在的網(wǎng)絡(luò)安全就是一個很嚴重的問題。
現(xiàn)階段人工智能的商機
本節(jié)要點
United Masters:用數(shù)據(jù)分析打造新市場,換取新的商業(yè)模式;
Jibo:開放機器人學(xué)習(xí)的應(yīng)用平臺,聚焦家庭;
螞蟻金服:應(yīng)用大數(shù)據(jù),連接客戶與商戶兩端。
我想向大家介紹三家公司,我也是這三家公司的科學(xué)顧問委員會的委員,因此有更多的信息分享。
United Masters
這家公司是專門做音樂作品的。
事實上,音樂市場在幾十年前是為幾十家大公司所控的,它們會簽幾個音樂歌手,然后在市場上大規(guī)模推廣。而作為消費者,你沒什么選擇,也就那么幾個作曲家和歌手。
但你看現(xiàn)在的音樂市場,已經(jīng)并非僅限于幾位少數(shù)的歌手了。在網(wǎng)上,有很多音樂人才,他們會在網(wǎng)上播放自己制作的音樂視頻,也會有越來越多的人聽他們的音樂。這和以前聽音樂的人數(shù)相比,達到了一個全新的數(shù)量級。
問題是,這些歌手沒有一個很大的商業(yè)市場,在市場上最受歡迎的音樂,一般還是大公司做出來的。
United Masters的目標,就是希望有更多的人從事自己所喜歡的音樂創(chuàng)作,并可以以此為生。
這家公司怎么實現(xiàn)這一目標呢?就是連接數(shù)據(jù),用數(shù)據(jù)分析。
比如一個年輕的音樂人,他寫了很好的歌,有幾萬名死忠粉。但其實他本人并不知道自己有這么多追隨者。
誰知道這個數(shù)據(jù)呢?網(wǎng)站,比如微信。
United Masters就會把這個數(shù)據(jù)拿過來,告訴這個歌手,你的粉絲有多少,分布在哪里,接下去可以做什么。比如,你可以去粉絲多的地方開演唱會。
而且,這家公司還會告訴你如何針對自己的粉絲去打造一些產(chǎn)品。
比如,有個粉絲要來這個歌手北京的現(xiàn)場演唱會,那么,歌手可以給這個粉絲一個VIP后臺通行證,讓他可以到后臺見面。很多粉絲是很看重這種和偶像親密接觸的機會的。
所以,通過這些數(shù)據(jù)的匯總,就可以創(chuàng)造出盈利模式。只要有人對這些數(shù)據(jù)感興趣,就可以獲取這些數(shù)據(jù)。因此,慢慢地,這家公司的口碑就建立起來了。
這就是非常好的商業(yè)模式——通過一個小的數(shù)據(jù)交換。傳統(tǒng)的唱片公司對歌手的抽成要到85%以上,但對于UnitedMasters來說,它只抽10~15%,就打造了這樣一個全新的市場。
Jibo
這家公司做家庭機器人很多年了。未來10~20年,我們每個人家里可能都會出現(xiàn)一個家庭機器人。
目前,很多人還是把家庭機器人當作玩具,它們在家里走來走去會發(fā)出很有意思的聲音,但真正時候幫助到人們的生活,現(xiàn)在還是很少。但是,所謂的家庭助手或者家庭秘書,卻是不一樣的。
Jibo三年前推出了一個機器人,長得很像手機。但是它會跟隨你,像眼睛一樣看著你,給你拍照片。你可以對它說:Jibo,今天晚上我要在家里開派對,你幫家里的人們拍照片好嗎?
Jibo就會給你拍照。它還會跟你說看這兒、看那兒,可以把整個派對的影像資料保留下來。
這聽上去是一個很有意思的應(yīng)用,但要把它打造成一個規(guī)模性的應(yīng)用還是很難。三年后,這家公司終于感覺找到了方向,推出了一款新的家用社交機器人。
這個機器人擁有電子眼睛、耳朵和聲音,可以捕捉照片、視頻通話,也可以做提醒、訂餐、發(fā)送郵件等這些輔助工作。它是一個開放式的平臺,可以讓人們不斷開發(fā)新的應(yīng)用。
這和手機上的應(yīng)用是不同的。手機的應(yīng)用并非機器學(xué)習(xí)的應(yīng)用。但這中機器人的平臺應(yīng)用,會進行適應(yīng)性的調(diào)整,進行自我學(xué)習(xí)。
而Jibo肯定不是唯一一個往這個的方向努力的公司。
我相信可能在中國、日本也是會對這種機器人非常感興趣。
螞蟻金服
螞蟻金服在中國發(fā)展非常迅速,我現(xiàn)在是螞蟻金服科學(xué)智囊團的主席。他們也是中國首家有這么一個科學(xué)智囊團的組織,他們希望智囊團可以幫助這家企業(yè)把握未來的方向。
這家公司比我所知道的任何一家西方公司成長都要快。
美國還是一個信用卡加現(xiàn)金的社會。盡管美國有一個Paypal,與支付寶有點類似,但是它的規(guī)模也不過是支付寶的十分之一,并且也不是所有人都在用。
也許是受益于中國沒有信用卡這個產(chǎn)業(yè)的束縛,使得支付寶一下子實現(xiàn)了移動支付的巨量增長。螞蟻金服手握大量的數(shù)據(jù),它知道你買了什么,了解很多關(guān)于你的個人信息。
它使貸款變得前所未有的容易。這不是表面上你在手機上按一個鍵說“給我錢”這么簡單,其背后蘊含著大量的機器學(xué)習(xí)。這涉及到機器學(xué)習(xí)中的“欺詐監(jiān)測”:如果你很簡單地讓人們貸到款,很多人是會來騙你的。
總結(jié):人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法
傳統(tǒng)的推薦,都是針對個人。
但這里的問題是,如果有一家很好的餐廳,它被推薦給很多人,那么大家都跑到這家餐廳去,就需要排長隊,人們的體驗就會很糟糕,反過來給差評和抱怨。
如此,整個系統(tǒng)就開始崩潰,形成惡性循環(huán)。
你必須要去創(chuàng)造一個市場,而非一個簡單的算法。
比如,在APP上面,不僅僅是向客戶推薦某一家餐廳。除了讓客戶看到自己附近有什么餐廳之外,你還要讓餐廳看到自己今晚可以供應(yīng)多少食材,我今天接了一場婚宴之后,還剩下多少個散客的位置。
甚至,你可以了解一下旁邊的競爭對手餐廳,他們有沒有滿座。如果旁邊滿座了,那么對我而言就是一個機會,我可以打折吸引更多的人流到的餐廳。
你要結(jié)合客戶和商戶兩端的需求。
這不僅是一個應(yīng)用的事情?,F(xiàn)在很多公司已經(jīng)著手在研究這方面的工作。當然,這個過程要充分考慮人們不同的喜好和需求,要掌握大量的數(shù)據(jù)。