人工智能或許沒(méi)有你想的那樣智能!
梅勒妮·米切爾(Melanie Mitchell)寫(xiě)了她的新書(shū)《人工智能:思考人類(lèi)的指南》(Artificial Intelligence: A Guide for Thinking Humans),因?yàn)樗龑?duì)人工智能究竟取得了多大進(jìn)步感到困惑。她寫(xiě)道,她想“了解事情的真實(shí)狀態(tài)”。
得知她的矛盾心理是一種安慰,因?yàn)樗约壕褪且幻斯ぶ悄苎芯繂T。她是波特蘭州立大學(xué)的計(jì)算機(jī)科學(xué)教授,也是著名的多學(xué)科研究中心圣達(dá)菲研究所(Santa Fe Institute)科學(xué)委員會(huì)的聯(lián)合主席。如果米切爾對(duì)人工智能的立場(chǎng)都感到困惑,請(qǐng)?jiān)徫覀兤渌说睦Щ?,或者是謬誤百出的見(jiàn)解。
正如米切爾所指出的那樣,許多有關(guān)人工智能勝利的故事正在流傳。這些報(bào)告中,最近在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、游戲和機(jī)器學(xué)習(xí)的其他方面的突破表明,人工智能可能會(huì)在未來(lái)幾十年很大范圍的任務(wù)中超越人類(lèi)的能力。有些人覺(jué)得前景不可思議;另一些人擔(dān)心“超人類(lèi)”計(jì)算機(jī)可能會(huì)判定不需要我們?nèi)祟?lèi)在身邊,并有能力做些與此有關(guān)的事。
我們要么離‘真正的’人工智能只有咫尺之遙,要么離了數(shù)百年?!?/p>
但也如米切爾另外證明的那樣,即使是當(dāng)今最強(qiáng)大的人工智能系統(tǒng)也有關(guān)鍵性的局限。它們只擅長(zhǎng)于狹隘定義的任務(wù),對(duì)外面的世界一無(wú)所知;它們?cè)跀?shù)據(jù)中發(fā)現(xiàn)相關(guān)性,而不考慮數(shù)據(jù)的含義,因此他們的預(yù)測(cè)可能是非常不可靠的;它們沒(méi)有常識(shí)。
“要么取得了巨大的進(jìn)展,要么幾乎沒(méi)有進(jìn)展,”米切爾寫(xiě)道。“我們要么離‘真正的’人工智能只有咫尺之遙,要么離了數(shù)百年?!?/p>
米切爾解決問(wèn)題的方法使這本書(shū)具有紀(jì)念意義和啟發(fā)性。她對(duì)當(dāng)今人工智能技術(shù)的耐心解釋給人的印象是,真正的機(jī)器智能還很遙遠(yuǎn)。她表示,電腦不僅需要更好的大腦,還可能需要更好的身體。
米切爾提供了非常清晰易讀的人工神經(jīng)網(wǎng)絡(luò)入門(mén)知識(shí),該技術(shù)是圖像識(shí)別,語(yǔ)言翻譯和自動(dòng)駕駛方面最新進(jìn)展的核心。20世紀(jì)50年代和60年代,在最初的一些建立人工智能的嘗試中使用了神經(jīng)網(wǎng)絡(luò),但它們失寵了,因?yàn)榭雌饋?lái)像一條死胡同,價(jià)值有限。但大約10年前有所改變,計(jì)算能力的進(jìn)步使一種稱(chēng)為深度學(xué)習(xí)的數(shù)據(jù)密集型方法來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)成為可能。
跟隨米切爾對(duì)神經(jīng)網(wǎng)絡(luò)的描述,你不需要了解繁雜的的數(shù)學(xué)。她展示了數(shù)學(xué)主要是什么,這就同時(shí)解釋了它們的威力和缺陷。一種對(duì)識(shí)別圖像內(nèi)容特別有用的神經(jīng)網(wǎng)絡(luò)依賴(lài)于一種叫做“卷積”(convoluTIon)的數(shù)學(xué)計(jì)算。處理文本的版本依賴(lài)于計(jì)算機(jī)表示語(yǔ)言統(tǒng)計(jì)方面的能力,即在穿過(guò)數(shù)百個(gè)維度的復(fù)雜“向量”里,單詞在句子中出現(xiàn)的頻率有多高。
令人印象深刻的是,人們已經(jīng)將世界上如此多的方面進(jìn)行了量化,以供計(jì)算機(jī)繼續(xù)工作。同樣值得注意的是,這些方法有如此多樣的應(yīng)用,比如檢測(cè)腫瘤、自動(dòng)駕駛和過(guò)濾垃圾郵件。但是這種偉大計(jì)算器的巧妙新用途并不一定賦予它們與我們的智力相當(dāng)?shù)哪芰ΑU缑浊袪査赋龅?,讓卷積神經(jīng)網(wǎng)絡(luò)(ConvoluTIonal Neural Networks, CNN)正常工作“需要大量的人類(lèi)智慧”。
機(jī)器學(xué)習(xí)系統(tǒng)本質(zhì)上是統(tǒng)計(jì)工作,所以很清楚,為什么它們很容易受到所饋送數(shù)據(jù)中的不準(zhǔn)確、漏洞和其他缺點(diǎn)的影響。難怪如果神經(jīng)網(wǎng)絡(luò)在主要顯示白人的圖像上經(jīng)過(guò)訓(xùn)練,它就不能識(shí)別黑人的臉。當(dāng)一輛自動(dòng)駕駛汽車(chē)無(wú)法識(shí)別一個(gè)有貼紙的停車(chē)標(biāo)志,但(對(duì)人類(lèi)來(lái)說(shuō))它仍然是一個(gè)明顯的停車(chē)標(biāo)志時(shí),就并不奇怪。
幸運(yùn)的是,這類(lèi)問(wèn)題已經(jīng)引發(fā)了許多富有成果的討論,這些討論關(guān)于面部識(shí)別技術(shù)和自動(dòng)決策的社會(huì)影響。紐約大學(xué)數(shù)據(jù)新聞學(xué)副教授梅雷迪思·布魯薩德(Meredith Broussard)在2018年出版的《人工智能:計(jì)算機(jī)如何誤解世界》(ArTIficial Unintelligence: How Computers The World)一書(shū)中有說(shuō)服力地提出,無(wú)論你是否稱(chēng)它為“人工智能”,計(jì)算機(jī)仍然應(yīng)該被當(dāng)作是被我們這些好奇的人類(lèi)使用的工具,人類(lèi)應(yīng)該始終處于這個(gè)范圍內(nèi)。
不過(guò),盡管米歇爾并不是第一個(gè)指出機(jī)器學(xué)習(xí)系統(tǒng)弱點(diǎn)的人,她還是在評(píng)論中加了一層解釋說(shuō),即使在它們處于最佳狀態(tài)的時(shí)候,計(jì)算機(jī)可能也沒(méi)有你想的那么好。在過(guò)去幾年里,研究人員開(kāi)發(fā)出了神經(jīng)網(wǎng)絡(luò),他們聲稱(chēng),在識(shí)別照片或視頻中的物體時(shí),神經(jīng)網(wǎng)絡(luò)的表現(xiàn)達(dá)到甚至超過(guò)了人類(lèi)的表現(xiàn)。這在新聞中被作為另一個(gè)必然對(duì)機(jī)器優(yōu)勢(shì)“抵抗無(wú)果”的例子。
米切爾指出,討論的基準(zhǔn)是一個(gè)基于名為ImageNet的大型圖片數(shù)據(jù)庫(kù)的測(cè)試。2017年,最優(yōu)秀的計(jì)算機(jī)系統(tǒng)對(duì)來(lái)自ImageNet的圖片進(jìn)行了分類(lèi),正確率達(dá)98%的top-5正確率,據(jù)稱(chēng)超過(guò)了95%的人類(lèi)正確率。(注:top-5準(zhǔn)確率指排名前五的類(lèi)別包含實(shí)際結(jié)果的準(zhǔn)確率,即對(duì)一個(gè)圖片,如果概率前五中包含正確答案,即認(rèn)為正確。)
“top-5”的障礙是什么?這意味著正確的物體分類(lèi)是機(jī)器作出的前五種猜測(cè)之一。米切爾寫(xiě)道:“如果給定一個(gè)籃球的圖像,機(jī)器按這個(gè)順序輸出‘槌球’、‘比基尼’、‘疣豬’、‘籃球’和‘搬運(yùn)車(chē)’,就被認(rèn)為是正確的。top-5指標(biāo)存在的原因可以理解:如果一張圖片顯示了不止一個(gè)物體,那么了解機(jī)器是否能檢測(cè)出這些物體是很有用的。但它削弱了對(duì)極端技能的要求。米切爾表示,2017年,當(dāng)該機(jī)器將正確的類(lèi)別歸置在其列表首位時(shí),top-1的最高準(zhǔn)確率僅為82%。(注:top-1準(zhǔn)確率是指排名第一的類(lèi)別與實(shí)際結(jié)果相符的準(zhǔn)確率,即對(duì)一個(gè)圖片,如果概率最大的是正確答案,才認(rèn)為正確。)
至于說(shuō)人類(lèi)有95%的準(zhǔn)確率,米切爾認(rèn)為支持這一說(shuō)法的數(shù)據(jù)站不住腳。在2015年發(fā)表的一個(gè)研究項(xiàng)目中,兩個(gè)人嘗試了ImageNet挑戰(zhàn)的一部分。投入更多時(shí)間的人是安德烈·卡帕西(Andrej Karpathy),他現(xiàn)在是特斯拉的人工智能主管。以top-5準(zhǔn)確率作為衡量標(biāo)準(zhǔn),他錯(cuò)了5%。而現(xiàn)在,這個(gè)數(shù)字被用作人類(lèi)表現(xiàn)的標(biāo)準(zhǔn)。
如果不是因?yàn)檫@個(gè)特殊測(cè)試的古怪之處,他的錯(cuò)誤率可能會(huì)更低??ㄅ廖鲗?xiě)道,他和另一名測(cè)試對(duì)象所犯錯(cuò)誤的四分之一,不是因?yàn)樗麄儗?duì)所看到的圖片一無(wú)所知,而是因?yàn)樗麄儾恢阑虿挥浀肐mageNet中使用的一些確切的標(biāo)簽。
更糟糕的是,“據(jù)我所知,還沒(méi)有人報(bào)道過(guò)機(jī)器和人類(lèi)在top-1準(zhǔn)確率上的比較,”米切爾寫(xiě)道。
憑借其快速和無(wú)盡的耐心,計(jì)算機(jī)是許多應(yīng)用中圖像識(shí)別的理想選擇。在某些情況下,它們肯定比人類(lèi)更準(zhǔn)確。但說(shuō)得太過(guò)了?!拔矬w識(shí)別尚未接近被人工智能‘解決’的程度,”米切爾寫(xiě)道。
我很難想象我們需要什么樣的突破才能制造出這樣一臺(tái)機(jī)器?!?/p>
人工智能目前最熱門(mén)的話題之一是,如何讓機(jī)器不僅檢測(cè)數(shù)據(jù)中的統(tǒng)計(jì)相關(guān)性,而且在某種程度上理解它們正在處理的內(nèi)容的意義。和米切爾一樣,紐約大學(xué)的研究人員加里·馬庫(kù)斯(Gary Marcus)和歐內(nèi)斯特·戴維斯(Ernest Davis)表示,如果沒(méi)有這些改進(jìn),人工智能就不會(huì)“安全、智能或可靠”。在他們的新書(shū)《重啟AI:構(gòu)建我們可以信任的人工智能》(RebooTIng A.I.:Building Artificial Intelligence We Can Trust)中,馬庫(kù)斯和戴維斯說(shuō),人們由于“可信度差距”而誤以為計(jì)算機(jī)比它們更先進(jìn)。
他們寫(xiě)道:“我們不得不從認(rèn)知的角度來(lái)思考機(jī)器(‘它認(rèn)為我刪除了我的文件’),不管機(jī)器實(shí)際上可能遵循的規(guī)則多么簡(jiǎn)單?!?/p>
為了讓機(jī)器變得不那么簡(jiǎn)單,許多研究人員正在重新探索用邏輯和常識(shí)來(lái)編碼計(jì)算機(jī)的舊方法。以米切爾為例,她用類(lèi)比的方式描述了她讓計(jì)算機(jī)進(jìn)行推理所做的努力。如果你想要一個(gè)電腦識(shí)別圖像描繪“遛狗”,現(xiàn)在的基本方法是給它顯示成千上萬(wàn)的遛狗的圖片,然后使之相信那些照片中常見(jiàn)的事物——狗,皮帶,手等。當(dāng)機(jī)器看到之后遛狗的照片時(shí),將觸發(fā)一個(gè)積極的信號(hào)。然而,它可能會(huì)嗅出一些不尋常的遛狗行為。米切爾展示了一些例子,比如一張照片,一個(gè)人騎著自行車(chē)遛狗,另一只狗叼著另一只狗的皮帶。她的研究小組正試圖讓計(jì)算機(jī)理解后一種情況是典型情況的“延伸”版本。
那樣的工作是辛苦而緩慢的。即使它成功了——如果一臺(tái)電腦可以在某種程度上理解“遛狗”可以有多種形式——如果這臺(tái)機(jī)器自己從來(lái)沒(méi)有遇到過(guò)狗,這種理解能有多豐富呢?
當(dāng)我6歲左右的時(shí)候,我在我家附近的人行道上騎自行車(chē),停下來(lái)看(也許還扔了) 一串從甜膠樹(shù)上摘下來(lái)的帶刺的種子球。突然,有人打開(kāi)了街對(duì)面一所房子旁邊的一扇門(mén),出來(lái)一條棕色的狗,它猶豫了一兩秒鐘,然后徑直撲過(guò)來(lái),咬住我,撕破了我的燈芯絨褲子。這些記憶幫助我洞察到經(jīng)歷的無(wú)數(shù)方面——驚訝、恐懼和痛苦的感覺(jué);一些狗的不可預(yù)測(cè)性;甜膠種子球的奇異古怪。相比之下,如果計(jì)算機(jī)被告知當(dāng)人們說(shuō)“something bit them in the ass”時(shí)并不總是一個(gè)習(xí)語(yǔ),那就太膚淺了。(注:bite本意為“咬“,ass本意為“屁股”,bite (someone) in the ass指不當(dāng)行為導(dǎo)致了不良后果。)
哲學(xué)家和其他人工智能懷疑論者一直認(rèn)為,沒(méi)有真實(shí)身體的電子大腦只能學(xué)到盒子里這點(diǎn)東西。許多人工智能研究人員將這種懷疑歸咎于“某種殘留的神秘主義”——正如認(rèn)知科學(xué)家安迪·克拉克(Andy Clark)在1997年出版的《此在:重整大腦、身體和世界》(Being There: put Brain, Body, and World Together Again)一書(shū)中所寫(xiě)的那樣,這是一種“對(duì)類(lèi)似靈魂的精神實(shí)質(zhì)的非科學(xué)信仰”。但是,當(dāng)你考慮到爬行的嬰兒能快速掌握基本概念,而數(shù)據(jù)中心的計(jì)算機(jī)需要大量的電力來(lái)吸收一個(gè)東西時(shí),人工智能需要一個(gè)身體的這個(gè)想法就聽(tīng)起來(lái)相當(dāng)不錯(cuò)。
米切爾似乎不情愿地轉(zhuǎn)變?yōu)閼岩烧撜叩牧?chǎng)。“在與人工智能搏斗多年之后,我發(fā)現(xiàn)關(guān)于身體化的爭(zhēng)論越來(lái)越有說(shuō)服力,”她寫(xiě)道。
那么,怎樣才能制造出一個(gè)能在世界各地移動(dòng)的機(jī)器人呢?這個(gè)機(jī)器人不僅能洞察自己的行為,還能洞察人類(lèi)、動(dòng)物和其他機(jī)器的行為?!拔?guī)缀鯚o(wú)法想象,”她寫(xiě)道,“我們需要什么樣的突破才能制造出這樣一臺(tái)機(jī)器。”
來(lái)源:鉛筆道pencilnews