人工智能迎來怎樣的新曙光
從核彈到早產(chǎn)嬰兒,人工智能技術(shù)已經(jīng)最終成為足夠可靠的監(jiān)視一切的手段。
在一個有血有肉的醫(yī)生和一個人工智能系統(tǒng)之間,兩者選擇其一來作出疾病診斷,佩德羅·多明戈斯更樂意把自己的生命押注到人工智能系統(tǒng)上。佩德羅·多明戈斯是西雅圖華盛頓大學的一名計算機科學家,“我寧愿相信機器也不要相信醫(yī)生,”他說。考慮到人工智能(AI)通常獲得的差勁口碑——過度炒作,乏善可陳——如此強烈的支持聲音確實鮮見。
回到二十世紀六十年代,AI系統(tǒng)在復制人腦的某些關(guān)鍵方面似乎大有前途。通過使用數(shù)理邏輯,科學家開始重現(xiàn)和推理現(xiàn)實世界的知識,但是,很快這種方法淪為AI的枷鎖。盡管數(shù)理邏輯在模擬人腦(解決問題)方面富有成效,但是它在本質(zhì)上并不適合處理不確定性。
然而經(jīng)過因自我枷鎖造成的漫長封殺之后,AI這個廣受詬病的領(lǐng)域卻重新興盛起來。多明戈斯并非唯一對其抱有全新信心的科學家。研究者希望通過成熟的電腦系統(tǒng)來檢測嬰兒疾病,把口頭語言翻譯成文本,甚至是找出惡意核爆。這些由成熟的電腦系統(tǒng)展現(xiàn)出來的早期能力就是最初在AI界引起人們廣泛興趣的東西:即使在紛繁復雜的世界,電腦仍具有像人類一樣的推理能力。
處于AI復興核心的是一種叫概率性程序的技術(shù),它在舊有AI的邏輯基礎(chǔ)上加入統(tǒng)計概率的應用。“它是兩種最強大的理論的自然統(tǒng)一,這兩種理論已經(jīng)被發(fā)展來理解和推導這個世界?!笔范既A·羅素說,他是加州大學伯克利校區(qū)現(xiàn)代人工智能方面的先驅(qū)。這套強大的綜合體終于開始驅(qū)散籠罩在AI漫長嚴冬上的迷霧?!斑@肯定會是一個(AI的)春天?!甭槭±砉W院的認知科學家約什·田納邦說。
“人工智能(artificial intelligence)”一詞于1956年由MIT的約翰·麥卡錫創(chuàng)造。那時,他提倡使用邏輯語言開發(fā)能進行推理的電腦系統(tǒng)。該方法隨著所謂的一階邏輯的應用趨于成熟。在一階邏輯中,現(xiàn)實世界的知識通過使用正式的數(shù)學運算符號和標記進行模化。它為客觀體世界和客觀體間相互關(guān)系而設(shè),能夠用來解析他們之間的聯(lián)系并得出有用的結(jié)論。例如,如果X(某人)患有高傳染性的疾病Y,患者X與某人Z近距離接觸,那么用這種邏輯便可推導Z患有Y疾病。
然而,一階邏輯最大的功勞是它允許越來越復雜的模型由最小的結(jié)構(gòu)模塊構(gòu)建起來。例如,上述情況可以輕易地延伸到建立流行病學的致死傳染病模型,以及對其發(fā)展進行結(jié)論性推導。這種把微小概念不斷擴展成概念集合的邏輯功能意味著人類大腦中也存在類似的思維模式。
這個好消息并沒有存在得太久?!安恍业氖?,最終,邏輯沒能實現(xiàn)我們的期待?!奔又菟固垢4髮W的認知科學家諾阿·古德曼說。由于使用邏輯來表現(xiàn)知識并進行推理的過程要求我們對現(xiàn)實世界的實際知識有精確的掌握,容不得半點模糊。要么“真”要么“假”,不存在“也許”。而不幸的是,現(xiàn)實世界,幾乎每一條規(guī)則都充滿了不確定性、干擾和例外情況。簡單地用一階邏輯構(gòu)建的AI系統(tǒng)不能處理這些問題。舉例來說,你想分辨某人Z是否有疾病Y,這里的規(guī)則是清晰明白的:如果Z與X接觸,那么Z患病。但是一階邏輯不能處理Z在或者已經(jīng)感染或者沒有之下的情況。另一個嚴重的問題是,一階邏輯不能逆向推導。例如,如果你知道Z患有疾病Y,你不可能完全確定Z的疾病是從X那里感染的。這是有醫(yī)學診斷系統(tǒng)面臨的典型問題。邏輯規(guī)則能夠?qū)⒓膊『桶Y狀聯(lián)系起來,而一個醫(yī)生面對癥狀卻能逆推出其病因。 “這需要轉(zhuǎn)變邏輯公式,而且演繹邏輯并不適合處理這種問題,”田納邦說。
這些問題意味著到了二十世紀八十年代中葉,AI的冬天到來了。當時流行的看法是:AI毫無發(fā)展可言。然而,古德曼私下相信,人們不會放棄AI,“AI轉(zhuǎn)入地下發(fā)展了,”他說。
1980年代末神經(jīng)網(wǎng)絡的到來讓AI的解凍露出第一線曙光。神經(jīng)網(wǎng)絡的想法之簡單讓人驚嘆。神經(jīng)系統(tǒng)科學的發(fā)展帶來了神經(jīng)元的簡單模型,加上算法的改進,研究者構(gòu)建了人工神經(jīng)網(wǎng)絡(ANNs)。表面上,它能夠像真正的大腦一樣學習。受到鼓舞的計算機科學家開始夢想有上百萬或者上萬億神經(jīng)元的ANNs??墒呛芸斓兀聦嵶C明我們的神經(jīng)元模型顯然過于簡單,研究者都分不清神經(jīng)元的哪些方面的性質(zhì)是重要的,更不用說模仿它們了。
不過,神經(jīng)網(wǎng)絡為新的AI領(lǐng)域構(gòu)筑了一部分基礎(chǔ)。一些繼續(xù)在ANNs上奮斗的研究者終于意識到這些網(wǎng)絡可以被認為是在統(tǒng)計和概率方面對外部世界的重現(xiàn)。與“突觸”和“動作電位”這些生理學上的稱呼不同,他們稱之為“參數(shù)化”和“隨機變量”。田納邦說,“現(xiàn)在,ANNs聽起來更像一個龐大的概率模型而不是一顆大腦?!?/p>
然后在1988年,加州大學洛杉磯校區(qū)的朱迪亞·珀兒寫了一本里程碑式的書《智能系統(tǒng)的或然性推理》,里面詳細地描述了AI的全新方案。支持這本書的理論是湯瑪斯·貝葉斯提出的一個原理。湯瑪斯·貝葉斯 是18世紀的一名英國數(shù)學家和牧師,他把以事件Q發(fā)生為前提下事件P發(fā)生的條件概率和以事件P發(fā)生為前提下事件Q發(fā)生的條件概率聯(lián)系起來。這個原理提供了一個在原因和結(jié)果間來回推導的方法?!叭绻隳軐Ω信d趣的不同事物用那樣的方式描述,那么貝葉斯推論的數(shù)學方法會教你如何通過觀察結(jié)果,然后逆推各種不同起因的可能性,”田納邦如是說。
新方案的關(guān)鍵就是貝葉斯網(wǎng)絡,一個由各種隨機變量組成的模型,在這個模型里每個變量的概率分布都取決于其他變量。給定一個或多個變量的值,通過貝葉斯網(wǎng)絡則可推導出其他變量的概率分布,換言之,得出他們的可能值 。假定這些變量表示癥狀、疾病和檢查結(jié)果,給出檢查結(jié)果(一種濾過性病毒感染)和癥狀(發(fā)熱和咳嗽),則可給可能潛在的病因賦予不同的幾率(流感,很可能;肺炎,不太可能)。
二十世紀九十年代中期,包括羅素在內(nèi)的研究員開始開發(fā)算法,使貝葉斯網(wǎng)絡能利用和學習現(xiàn)有的數(shù)據(jù)。這很大程度上跟人類基于早期理解的學習方式相同,新的算法卻能通過更少的數(shù)據(jù)來學習更復雜和更準確的模型。對ANNs來說,這是前進的一大步,因為無需考慮先驗知識,可以從頭學習解決新的問題。
搜獵核武器
人們開始逐漸理解各種努力和嘗試,去創(chuàng)造為現(xiàn)實世界而設(shè)的人工智能。一個貝葉斯網(wǎng)絡中,各種參數(shù)是概率的分布,如果我們對這個世界知道得越多,這些分布值越有用。與一階邏輯下構(gòu)建的網(wǎng)絡不同,不完整的知識并不會導致貝葉斯網(wǎng)絡迅速崩潰。
盡管這樣,邏輯也并非無用武之地。事實證明貝葉斯網(wǎng)絡本身并不充分,因為它不允許以簡單片段任意構(gòu)建復雜結(jié)構(gòu),取而代之的是一個由綜合的邏輯程序和貝葉斯網(wǎng)絡組成的,進入熱門話題領(lǐng)域的概率性程序。
這種新AI的最前端是少數(shù)合并基礎(chǔ)元素和所有靜止研究工具的計算機語言,其中有Church語言,由古德曼、田納邦和同事開發(fā),以某計算機程序邏輯的開創(chuàng)者阿隆索·丘奇命名。多明戈斯的團隊開發(fā)了馬爾科夫邏輯網(wǎng)絡,融合了邏輯型網(wǎng)絡和與貝葉斯網(wǎng)絡相似的馬爾科夫網(wǎng)絡。羅素則和他的同事使用了一個直接明了的名字,叫“貝葉斯邏輯”(BLOG)。
最近在奧地利維也納召開的聯(lián)合國全面禁止核試條約組織(CTBTO)大會上,羅素展示了Church語言的表達能力。CTBTO邀請了羅素,因為他們預感到新的AI技術(shù)可能有助于監(jiān)測核爆炸。聽過一上午的關(guān)于監(jiān)測地震背景下遠距離核爆引發(fā)的地震特征、穿過地球的信號傳播異常和世界地震站的噪音探測器的演示報告后,羅素開始著手用概率程序的設(shè)計(神經(jīng)信息處理系統(tǒng)前沿,卷23,麻省理工學院出版Advances in Neural Information Processing Systems, vol 23, MIT Press)。他說,“在午飯時間,我已能為整個問題編寫一個完整的模型?!保@個模型足足有半頁之長。
這類模型能整合先驗知識,例如,對印度尼西亞蘇門塔臘和英國伯明翰地區(qū)發(fā)生地震的幾率做比較。CTBTO同時要求任何一個系統(tǒng)首先假定發(fā)生在地球上任何地方的核爆幾率均等,然后才使用來自CTBTO監(jiān)測站接收的真實信號數(shù)據(jù)。AI系統(tǒng)要做的就是獲取所有數(shù)據(jù),對每組數(shù)據(jù)最可能的解釋作出推斷。
挑戰(zhàn)就在其中。像BLOG這樣的語言是由所謂的通用推理機組成的。已知某個現(xiàn)實問題的模型和眾多變量及概率分布,推理機只能計算某種情況的可能性,例如,在已知期望事件的事前幾率和新地震數(shù)據(jù)下,推斷一次在中東發(fā)生的核爆。但是如果變量改成代表癥狀和疾病,那么它就必定能做出醫(yī)學診斷。換言之,其中的算法必須是非常普遍的,這也意味著這些算法極其低效。
結(jié)果是,這些算法不得不根據(jù)每個新問題逐一定制。但正如羅素所說,你不能每遇到一個新問題就請一個博士學生來改進算法,“那并不是你大腦的工作方式,你的大腦會趕緊適應(新問題)?!?/p>
這一點讓羅素、田納邦和其他人緩下來仔細考慮AI的前途?!拔蚁M藗儠械脚d奮,但不是那種我們向他們推銷蛇油(萬靈藥)的感覺,”羅素說。田納邦也有同感,盡管已是一個年過40的科學家,他覺得只有一半的機會在他有生之年見證有效推理這一難題的解決。盡管計算機將運行得更快,算法會改進得更精妙,他覺得“這些是比登月或者登火星更艱深的問題”。
無論如何,AI團體的意志并沒有因此消沉。例如,斯坦福大學的達菲·柯勒正在用概率編程解決非常特殊的問題并且頗見成效。他與同在斯坦福的新生兒學專家安娜·潘和其他同事一起開發(fā)了名為PhysiScore的系統(tǒng),可以預測一個早產(chǎn)兒是否有任何健康問題。這是個眾所周知的難題,醫(yī)生不能作出任何確定程度的預測,“這種預測卻是對那個家庭唯一要緊事,”潘回應。
PhysiScore系統(tǒng)把多方面的因素考慮進去,諸如孕齡、出生體重,以及出生后數(shù)小時內(nèi)的實時數(shù)據(jù),包括心率、呼吸率和氧飽和度(Science TranslaTIon Medicine, DOI: 10.1126/scitranslmed.3001304)?!拔覀兡軌蛟陬^3個小時內(nèi)得出哪些嬰兒將來會健康,哪些可能患上嚴重的并發(fā)癥,甚至是兩周后會出現(xiàn)的并發(fā)癥,”柯勒解釋道。
“新生兒專家對PhysiScore這個系統(tǒng)感到興奮,”潘說。作為一名醫(yī)生,對于AI系統(tǒng)具有處理上百個變量并作出決定的能力,潘尤其滿意。這種能力甚至讓該系統(tǒng)超越了他們的人類同行。潘說:“這些工具能理解和運用一些我們醫(yī)生和護士看不到的信號?!?/p>
這正是多明戈斯一直對自動化醫(yī)學診斷抱有信心的原因。其中一個著名例子是“快速醫(yī)學參考,決策理論(QMR-DT)”,它是一個擁有600種重要疾病和4000種相關(guān)癥狀模型的貝葉斯網(wǎng)絡,其目標是根據(jù)一些癥狀推斷可能疾病的幾率。研究者已經(jīng)針對特殊疾病的推理算法對QMR-DT進行微調(diào),并且教會該系統(tǒng)使用病人的檔案。“人們對這些系統(tǒng)和真人醫(yī)生做過比較,這些系統(tǒng)似乎更勝一籌,”多明戈斯說,“人類對自己的判斷,包括診斷,不能保持一致的觀點(態(tài)度),而醫(yī)生們不愿意放棄他們工作中這一有意思的部分是唯一讓這些系統(tǒng)不能廣泛應用的原因?!?/p>
AI領(lǐng)域里的這些技術(shù)還有其他成就,其中一個矚目的例子是語音識別,它已經(jīng)由過去因經(jīng)常出錯備受嘲笑提升到今天令人驚訝的準確度(New ScienTIst, 27 April 2006, p26)。現(xiàn)在,醫(yī)生可以口述病人檔案,語音系統(tǒng)軟件會把口述檔案轉(zhuǎn)換成電子文檔,由此可以減少手寫處方。另外,語言翻譯也開始仿效語音識別系統(tǒng)的成功之處。
會學習的機器
但是仍然有重大的挑戰(zhàn)顯現(xiàn)在各個領(lǐng)域中。其中之一就是弄明白機器人的照相機看到什么,解決這個問題將為設(shè)計出自我導航的機器人縮短一大段距離。
開發(fā)靈活和快速的推理算法的同時,研究者必須提高AI系統(tǒng)的學習能力,無論是根據(jù)現(xiàn)存數(shù)據(jù)還是現(xiàn)實世界檢測到的新數(shù)據(jù)。今天,大部分的機器學習是由定制算法和小心地構(gòu)建的數(shù)據(jù)組完成的,為教會一個系統(tǒng)處理特定的任務而專門設(shè)計?!拔覀兿M切┫到y(tǒng)更加通用,這樣你可以把它們投入到現(xiàn)實世界,同時它們也能從各種輸入信息中學習。”柯勒說。
一如既往,AI的終極目標是建造出能用我們完全理解的方式復制人類智慧的機器。“那可能是和尋找外星生命一樣遙遠甚至同樣危險的事,”田納邦說?!啊當M人AI’是一個更廣義的詞,有謙虛的余地。如果我們能構(gòu)造一個視覺系統(tǒng),像人類能做到的一樣,看一眼就可告訴我們那里有什么,我們將無比高興?!?/p>