未來,我們像訓(xùn)狗一樣訓(xùn)練計算機
電腦發(fā)明之前,大多數(shù)實驗心理學(xué)家都認(rèn)為大腦是一個未知的黑箱。你可以通過“搖鈴-流口水”來分析動物的行為——但是思想、記憶和情感該怎么觀察?這些東西深不可測又難以捉摸,科學(xué)也無能為力。所以,這些自稱行為主義者的科學(xué)家把自己的工作定義為:刺激與回應(yīng),反饋與強化,搖鈴與唾液。他們放棄對理解大腦運作原理的嘗試。這種思想統(tǒng)治了學(xué)界40多年。
1950年代中期,一群有反叛精神的心理學(xué)家、語言學(xué)家和信息科學(xué)家以及早期的人工智能研究者探索出一種完全不同的思維概念。他們認(rèn)為,人不僅僅是一系列應(yīng)變反應(yīng)的集合。他們吸收信息、處理信息、依此行動。他們有讀寫系統(tǒng)、敘事系統(tǒng)和回憶機制。這一切都通過一種有邏輯、有條理的句法來實現(xiàn)。大腦完全不是一個黑箱,而更像一臺電腦。
這場“認(rèn)知革命”雖然起于青萍之末,但是隨著計算機成為美國心理學(xué)實驗室的標(biāo)準(zhǔn)配置,漸漸地為更多的人所知。1970年代末,認(rèn)知心理學(xué)已經(jīng)壓倒了行為心理學(xué),當(dāng)談及意識時,人們開始使用一種全新的語言。心理學(xué)家們開始把思維比作程序,普通人也習(xí)慣了說向大腦“存儲”信息,而商界精英為智力“帶寬”和處理能力跟不上工作需要而苦惱。
同樣的故事一再上演。當(dāng)數(shù)字革命已經(jīng)在日常生活中無孔不入,它也在滲透進我們的語言,滲透進我們對于事物基本運行規(guī)律的理解。技術(shù)一向如此。在文藝復(fù)興運動中,牛頓和笛卡爾啟發(fā)人們將宇宙想象成一座精密的鐘表。工業(yè)革命中,宇宙變成了一臺活塞機。現(xiàn)在,它成了一臺電腦。這種理論將給人類賦予更多的自主權(quán),如果世界是一臺電腦,那么它就可以被編程。
軟件“吞噬”世界
代碼是符合邏輯的。代碼是可破解的。代碼命中注定。這是數(shù)字時代生活的核心信條,也是自我實現(xiàn)的預(yù)言。
按照風(fēng)險投資家Marc Andreessen的說法:軟件正在“吞噬”世界,周圍無處不在的機器正在把我們的行為、思想、情感轉(zhuǎn)化為數(shù)據(jù)——供揮舞著代碼的程序員大軍操縱的原材料。似乎,我們的生活遵循一連串基本的準(zhǔn)則,可以被發(fā)現(xiàn)、探索、優(yōu)化,甚至可以被重新編寫。互聯(lián)網(wǎng)公司通過代碼去了解我們最私密的聯(lián)系;Facebook的扎克伯格走得更遠(yuǎn),他認(rèn)為”在人類關(guān)系中或許有一種基本的數(shù)學(xué)定律,決定著我們是誰,我們關(guān)心什么。“
2013年,在進行了10年人類基因破譯工作之后,生物學(xué)家克Craig Venter宣布:他已經(jīng)著手編為自己編寫代碼以生成人造器官。“再清楚不過了,地球上我們已知的所有生物細(xì)胞都不過是DNA軟件驅(qū)動的生物機器。”克雷格·文特爾說。甚至,自助類書籍也在聲稱你可以破解(hack)自己的“源代碼”,重新編程(reprogram)自己的情感生活、睡眠周期和消費習(xí)慣。
如今,編程技能已經(jīng)不僅僅是一項技能,更是一種語言,掌握了這門語言,你就成了掌握世界機密的“內(nèi)部人士”。 “控制了代碼,就控制了世界。”未來學(xué)家Marc Goodman這樣寫道。(在《商業(yè)周刊》上,Paul Ford說的更謹(jǐn)慎一些:“就算程序員不掌控世界,他們也在掌控那些掌控世界的東西。”)
但是,無論你喜歡與否——不管你是編程階層的一員還是連手機鬧鐘設(shè)置都搞不定的普通人——不要對此習(xí)以為常。世界這臺“機器”正在開始說另一種語言,即使是最頂尖的程序員也不一定能全弄明白。
機器正在開始自己“學(xué)習(xí)”
在過去數(shù)年間,硅谷最大的科技公司都在拼命追求一種被稱之為機器學(xué)習(xí)的計算方式。傳統(tǒng)的編程模式下,工程師寫好明確的、分步運行的指示,計算機只需執(zhí)行。在機器學(xué)習(xí)模式下,工程師不會給計算器編寫運行指示,他們會訓(xùn)練計算機。比如,如果你想教神經(jīng)網(wǎng)絡(luò)去識別一只貓,不用告訴它要去找胡須、耳朵、毛和眼睛,只需要給它看成千上萬幅貓的照片,它最終自己會找到辦法。如果它一再把狐貍錯認(rèn)為貓,你不需要重寫代碼,只需要繼續(xù)調(diào)教。
這種方法并不新鮮——已經(jīng)存在了幾十年——但直到最近才變得極其強大,一部分歸因于深度神經(jīng)網(wǎng)絡(luò)的異軍突起,大規(guī)模的分布計算系統(tǒng)模擬大腦神經(jīng)元的多層連接。無論你是否意識到,我們很多的網(wǎng)絡(luò)活動背后都有機器學(xué)習(xí)的影子。Facebook利用它來決定哪條新聞出現(xiàn)在你的時間線上,Google圖片用它來做面部識別。微軟的Skype Translator利用機器學(xué)習(xí)把演講實時轉(zhuǎn)換成不同的語言。
自動駕駛汽車依靠機器學(xué)習(xí)來避免事故。甚至,Google搜索引擎這座由人工規(guī)則建立起來的“大廈”也開始仰仗這些深度神經(jīng)網(wǎng)絡(luò)。2月份,Google用機器學(xué)習(xí)專家John Giannandrea替換掉了多年以來的搜索部門負(fù)責(zé)人,還開始啟動一個針對工程師的“新技能”再培訓(xùn)項目。“通過培養(yǎng)學(xué)習(xí)機制,我們不一定非要去編寫規(guī)則了。”Giannandrea告訴記者。
和大腦一樣,神經(jīng)網(wǎng)絡(luò)也是一個黑箱
但是,這就是問題所在:工程師們永遠(yuǎn)也無法確切搞清楚計算機是如何通過機器學(xué)習(xí)完成任務(wù)的。神經(jīng)網(wǎng)絡(luò)的運行很大程度上是不透明的,難以捉摸。換句話說,這是個黑箱。這些黑箱正在日益接管我們的數(shù)字生活。不僅在改變我們與科技的關(guān)系——還在改變我們對于自我、世界以及人類在世界中的位置的認(rèn)識。
過去,程序員就像是上帝,制定計算機系統(tǒng)運行的律法;現(xiàn)在,他們變成了計算機的父母或訓(xùn)狗師。無論是父母還是訓(xùn)狗師都會告訴你,這是一種更為神秘的關(guān)系。Android的聯(lián)合發(fā)明人Andy Rubin是個積習(xí)成癖的發(fā)明家和程序員,硅谷人盡皆知他的辦公室和家中到處都是機器人,他親自給它們編程。“我很小的時候就對電腦科學(xué)著了迷,因為在計算機的世界我可以忘記自己。它是一塊干凈的石板,一塊空白的畫布,我可以從無到有地創(chuàng)造。“他說,”多年以來,我對這個自己樂在其中的世界全權(quán)掌控。”
如今,這個世界已經(jīng)走到了盡頭。Rubin為機器學(xué)習(xí)的崛起而激動歡呼——他的新公司Playground Global專門投資機器學(xué)習(xí)領(lǐng)域的創(chuàng)業(yè)公司,在智能設(shè)備的普及浪潮中保持領(lǐng)先,但這也會讓他感到些許難過。因為機器學(xué)習(xí)改變了工程師存在的意義。
用于語音識別的聽覺模擬神經(jīng)網(wǎng)絡(luò)
“人們不會再逐行寫代碼了,當(dāng)一個神經(jīng)網(wǎng)絡(luò)學(xué)會了語音識別,程序員并不能深入內(nèi)部去看看這是怎么發(fā)生的,就像你無法切開大腦看看自己在想什么。”Rubin說。當(dāng)程序員窺視深度神經(jīng)網(wǎng)絡(luò)的內(nèi)部,他們看到的只是一團迷霧:海量多層次的微積分問題——由數(shù)十億個數(shù)據(jù)點持續(xù)不斷產(chǎn)生的連接——產(chǎn)生著對世界的猜想。
這并不是人們想象中的人工智能的運行方式。直到數(shù)年之前,主流的人工智能研究者還以為只要為一臺機器灌輸正確的邏輯,就能創(chuàng)造智能。只要編寫足夠多的規(guī)則,我們最終就能創(chuàng)造一套精密到可以理解世界的系統(tǒng)。早期的機器學(xué)習(xí)擁護者被忽視甚至遭到詆毀,他們更傾向于給電腦提供足夠多的數(shù)據(jù),讓它們自己得出結(jié)論。多年之間,計算機的運算能力都不足以證明這種方法的價值,所以爭論變成了一場哲學(xué)思辨。
“大部分爭論都建立在關(guān)于世界運行與大腦運轉(zhuǎn)的頑固信仰上,”Google無人駕駛汽車之父、斯坦福人工智能教授Sebastian Thru說。“神經(jīng)網(wǎng)絡(luò)沒有符號,也沒有規(guī)則,只有數(shù)字,這讓很多人望之卻步。”
一種無法解析的機器語言帶來的不僅是哲學(xué)觀念上的沖擊。過去20年間,學(xué)習(xí)編程已經(jīng)成為一條無比堅實可靠的職業(yè)道路。但是一個由彼此神經(jīng)連接的深度學(xué)習(xí)機器主宰的世界需要另一種勞動者。關(guān)于人工智能令各種技能過時的擔(dān)憂已經(jīng)甚囂塵上,程序員很快就能嘗到自己釀下的“苦果”的滋味。
“我今天早上剛剛和別人談過這個話題。”當(dāng)我問到這種轉(zhuǎn)變時,科技名流Tim O’Reilly說。“當(dāng)這一代的孩子成長起來,編程工作將會和今天的大為不同。”
當(dāng)然,傳統(tǒng)的編程并不會徹底消失——O’Reilly預(yù)計很長一段時間內(nèi)我們還是需要程序員——但是數(shù)量將大為減少,而且編程將會變成一種“元技能(meta skill)”,一種為機器學(xué)習(xí)創(chuàng)造“腳手架”的手段。就像量子力學(xué)的發(fā)現(xiàn)并未讓牛頓力學(xué)失效,編程依舊是探索世界的一種有力工具。但是要快速推進特定的功能,機器學(xué)習(xí)將接管大部分工作。
當(dāng)然,還是要有人來訓(xùn)練這些系統(tǒng)。但是,至少在今天,這還是一種稀缺的技能。這種工作需要對數(shù)學(xué)有高層次的領(lǐng)悟,同時對于“有來有往”的教學(xué)技巧有一種直覺。“使這些系統(tǒng)達到最優(yōu)效果的方法差不多是一門藝術(shù)”,Google Deepmind團隊負(fù)責(zé)人Demis Hassabis說。“世界上只有寥寥數(shù)百人能出色地完成這件事。”
但即使是這一小撮人也足夠在數(shù)年之間改變整個科技行業(yè)。
不管這樣的轉(zhuǎn)變對于人類職業(yè)有何影響,它對文化造成的沖擊將會更大。人工編程軟件的興起引發(fā)了對于程序員的宗教式崇拜,一種觀念大行其道:人類的經(jīng)驗最終可以濃縮成一系列可以理解的指令。而如今,機器學(xué)習(xí)把鐘擺撥向了相反的方向。宇宙運行的“代碼”可能在人們的理解之外。比如,Google在歐洲正面臨反托拉斯調(diào)查,被指控對搜索結(jié)果施加過度影響。這項指控很難被證明,因為就連Google自己的工程師都沒法說清楚搜索算法是如何工作的。
這早已不是新鮮事,即使是簡單的算法也會產(chǎn)生意想不到的新行為——這種觀念可以追溯到噪音理論和隨機數(shù)生成器。在過去幾年間,隨著計算網(wǎng)絡(luò)日益交織,功能日趨復(fù)雜,程序變得越來越像一股外星力量,機器中的幽靈變得越發(fā)難以捉摸、不受控制。飛機無故著陸,股市出現(xiàn)看似不可避免的極速暴跌,還有輪流停電事故。
這些“看不見的力量”讓科學(xué)家Danny Hillis公開宣稱文明時代——我們數(shù)百年來對于邏輯、決定論、人定勝天的信仰——的終結(jié)。“隨著我們創(chuàng)造的技術(shù)和機構(gòu)日益復(fù)雜,我們和它們之間的關(guān)系已經(jīng)改變,不再是它們的主人,而要學(xué)著跟它們討價還價,勸誘、指引它們達成我們的目標(biāo)。機器學(xué)習(xí)的崛起是這段旅程的最新一章,也可能是最后一章。”
Google圖片將兩名黑人的照片識別為“大猩猩”
后果可能會相當(dāng)恐怖。畢竟,編程技能還是普通人可以學(xué)習(xí)和掌握的。程序員畢竟還是人類。如今,技術(shù)精英群體的規(guī)模正在縮小,他們下達的指令正在不斷減少,越來越間接。那些制造出這些東西的公司發(fā)現(xiàn)它們的行為很難控制。去年,Google的圖片識別引擎開始把黑人打上大猩猩的標(biāo)簽,它不得不緊急道歉,補救措施的第一步是阻止系統(tǒng)為任何東西貼上大猩猩的標(biāo)簽。
“這一切都預(yù)示著一個我們失去對機器控制權(quán)的時代的到來。人們可以想象科技在金融市場上智勝人類,逃離人類領(lǐng)袖的操縱,甚至發(fā)明人類無法理解的武器。”史蒂芬霍金的這些話得到了埃隆·馬斯克和比爾蓋茨等人的響應(yīng)。“人工智能的短期影響取決于它操控在誰的手中,長期后果取決于能否被掌控。”
但是不必驚慌失措,這不代表天網(wǎng)的降臨。我們只是要學(xué)習(xí)如何與新一代技術(shù)合作共事。工程師們正在想法設(shè)法讓深度學(xué)習(xí)系統(tǒng)“引擎蓋”下的運作變得可視化。即使我們終究沒法完全弄懂它們是如何”思考“的,并不意味著我們在它們面前無能為力。未來,我們將不再關(guān)注行為背后的底層代碼,而是專注于行為本身。我們用于訓(xùn)練機器的數(shù)據(jù)將比代碼更重要。
巴甫洛夫的條件反射實驗
如果這一切似曾相識,那是因為這很像20世紀(jì)的行為主義。實際上,訓(xùn)練機器學(xué)習(xí)算法的過程經(jīng)常會被與20世紀(jì)初那些偉大的行為主義實驗相提并論。巴甫洛夫并不需要深入理解饑餓的原理,只需要一再重復(fù)一系列動作就可以激發(fā)狗分泌唾液。他一次又一次地提供數(shù)據(jù),直到代碼自己重新編程。
長期來看,機器學(xué)習(xí)將會使技術(shù)更加民主化。你今天不需要知道html就可以搭建一個網(wǎng)站,同樣的,你最終也不需要取得博士學(xué)位才能讓機器學(xué)習(xí)的超強能力為己所用。編程不再是程序員們一系列晦澀語言的專屬地盤,以后,任何人都可以編程。
在計算機發(fā)展史的大部分時間里,我們對機器的原理無所不知。我們編寫代碼,機器負(fù)責(zé)表達,這種世界觀雖然蘊含著“可塑性”,但也代表著一種基于規(guī)則的決定論,即認(rèn)為事物是它們背后的規(guī)則的產(chǎn)物。機器學(xué)習(xí)的哲學(xué)則相反,不只是代碼決定行為,行為也決定了代碼。機器是世界的產(chǎn)物。
最終,我們既會欣賞逐行寫代碼的力量,也要通過機器學(xué)習(xí)算法來調(diào)整它。很可能生物學(xué)家已經(jīng)開始動手了。Crispr這樣的基因編程專家將會賦予基因和軟件程序員一樣的代碼操縱能力。但后生學(xué)理論表明基因并非一系列不可更改的程序設(shè)定,而是根據(jù)周圍環(huán)境和宿主經(jīng)歷而改變的一組動態(tài)開關(guān)。我們體內(nèi)的代碼并不是獨立于物理世界,而是深受它的影響,也會被深深改變。Venter可能會深信細(xì)胞是DNA軟件驅(qū)動的機器,但是后生學(xué)家Steve Cole有一種不同的表達:細(xì)胞是一種把將生活經(jīng)歷轉(zhuǎn)化為生物現(xiàn)象的機器。
如今,在艾倫圖靈設(shè)計出“圖靈機”80年后,計算機成了將體驗轉(zhuǎn)化成技術(shù)的設(shè)備。幾十年來,我們都在尋找可以解釋、優(yōu)化我們生活體驗的代碼。但是我們手中的機器不會再遂我們的愿了。我們和機器之間將會有一種更為復(fù)雜、然而最終會讓我們獲益更多的關(guān)系。我們不再給它們下指令,而是成為它們的父母。