區(qū)塊鏈+機(jī)器學(xué)習(xí)將使人工智能成為主流
在過去五六年里,人工智能又復(fù)活了。我之所以用“復(fù)活”這個詞,是因為當(dāng)人工智能被視為迫在眉睫的時候,我們曾經(jīng)有過這樣的時代。1950年,Alan Turing在1950年設(shè)計了以自己名字命名的圖靈測試(Turing Test),并將主流的注意力吸引到機(jī)器可以思考的可能性上。1956年的Dartmouth研討會是一個里程碑式的事件,它標(biāo)志著人工智能的誕生,當(dāng)時John McCarthy提出了“人工智能”(AI)這個短語,代表了控制論、神經(jīng)網(wǎng)絡(luò)和符號推理研究的蓬勃發(fā)展。
在60年代和70年代,自然語言處理、機(jī)器推理和機(jī)器視覺等領(lǐng)域都有了顯著的進(jìn)步。隨著上世紀(jì)80年代日本所謂的第五代計算機(jī)計劃的出現(xiàn),在專家系統(tǒng)、基于案例的推理以及隨著反向傳播的發(fā)明而使連接主義神經(jīng)網(wǎng)絡(luò)恢復(fù)等領(lǐng)域取得了重大進(jìn)展。機(jī)器學(xué)習(xí)在90年代獲得了動力,從早期的符號方法轉(zhuǎn)向利用概率和統(tǒng)計。
最近,在對早期和成熟的初創(chuàng)企業(yè)的巨額投資之間;媒體預(yù)示著機(jī)器人殺手的未來;包括IBM、微軟和谷歌在內(nèi)的老派巨頭們的營銷攻勢;以及公眾對Siri和Alexa等人的著迷,看來人工智能終于來了。但是,它的腳步會就此停住嗎?
是機(jī)器學(xué)習(xí)還是人工智能?
我們今天所說的人工智能,很大程度上源于機(jī)器學(xué)習(xí)在海量數(shù)據(jù)中的應(yīng)用。準(zhǔn)確地說,正是所謂的“深度”學(xué)習(xí)技術(shù)的應(yīng)用使語音搜索和語音激活助手如Siri的興起,癌癥診斷和治療等領(lǐng)域的醫(yī)療創(chuàng)新,AWS Rekognition等臉部識別,以及更廣泛的圖像和視頻分析和識別領(lǐng)域,機(jī)器翻譯,包括必應(yīng)翻譯工具,語音識別工具,以及所謂的自動駕駛汽車的出現(xiàn)等等。
技術(shù)上來說,我們應(yīng)該稱之為深度學(xué)習(xí)的復(fù)蘇,而不是人工智能的復(fù)蘇。
深度學(xué)習(xí)的歷史可以追溯到1943年,當(dāng)時人們在理解人類大腦神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上創(chuàng)建了Pitts-McCulloch計算機(jī)模型。“深度學(xué)習(xí)”這個說法是在上世紀(jì)80年代末創(chuàng)造的;然而,深度學(xué)習(xí)的影響在本世紀(jì)頭十年才真正開始,2012年開始的所謂“深度學(xué)習(xí)革命”讓計算機(jī)行業(yè)徹底崩潰。2019年3月,Yoshua Bengio,Geoffrey Hinton和Yann LeCun)因他們的突破性研究而獲得圖靈獎,他們的研究使深度學(xué)習(xí)成為主流。
簡單地說,深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí)技術(shù),它教會計算機(jī)去做那些對人類來說很自然的事情,比如從例子中學(xué)習(xí)。。通過深度學(xué)習(xí),計算機(jī)模型可以直接從圖像、文本或聲音等中學(xué)習(xí)執(zhí)行分類任務(wù)。深度學(xué)習(xí)模型是通過使用一組大的標(biāo)記數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)架構(gòu)來訓(xùn)練的(包括有監(jiān)督和無監(jiān)督的),這些架構(gòu)包含了對人類神經(jīng)元行為建模的多層軟件。
今天機(jī)器學(xué)習(xí)的致命弱點
今天,為了訓(xùn)練一個深層(機(jī)器)學(xué)習(xí)模型,雖然今天有兩種技術(shù)有效,但這兩種技術(shù)最終會成為人工智能的禍害。
首先,傳統(tǒng)學(xué)習(xí)方法要求將訓(xùn)練數(shù)據(jù)集中在一個系統(tǒng)(或供應(yīng)商數(shù)據(jù)中心)上。谷歌、亞馬遜、微軟、蘋果和Facebook等公司收集了大量用戶數(shù)據(jù),并將其存儲在各自的系統(tǒng)中。隨后,以一次性或連續(xù)的方式,他們運行自己的算法來挖掘并構(gòu)建最終的深度學(xué)習(xí)模型。讀者很容易發(fā)現(xiàn),這種方法侵犯了隱私。在沒有用戶許可的情況下,這些系統(tǒng)常常利用敏感的私有數(shù)據(jù)來構(gòu)建它們的AI應(yīng)用程序。
其次,同樣成問題的是集中的方法通常取決于供應(yīng)商,即供應(yīng)商的選擇算法、其實現(xiàn)機(jī)制(語言、庫、工具)、首選的硬件(內(nèi)部的、外部的、對芯片制造商的依賴等)、其數(shù)據(jù)中心的架構(gòu)、人員(可能受到危害、賄賂等),以及選擇何種工具來顯示培訓(xùn)算法的結(jié)果。在計算機(jī)科學(xué)術(shù)語中,單供應(yīng)商的實現(xiàn)受制于所謂的拜占庭容錯問題。
這兩種技術(shù)中的任何一種都對當(dāng)今人工智能應(yīng)用的壽命構(gòu)成了致命的挑戰(zhàn)。然而,它們加在一起就是人工智能的致命弱點。如果該行業(yè)不解決這些問題,今天的人工智能復(fù)蘇注定會再次熄火。
區(qū)塊鏈+機(jī)器學(xué)習(xí)
區(qū)塊鏈平臺在去中心化應(yīng)用程序和系統(tǒng)的設(shè)計和開發(fā)方面取得了驚人的進(jìn)展,并已應(yīng)用于從加密貨幣到企業(yè)供應(yīng)鏈等領(lǐng)域。
更重要的是,由于區(qū)塊鏈固有的去中心化實現(xiàn),區(qū)塊鏈有兩種能力。
首先,區(qū)塊鏈為用戶提供了控制其數(shù)據(jù)的能力,并決定何時、何地、向誰提供數(shù)據(jù)的時間和多長時間,即區(qū)塊鏈?zhǔn)菍τ脩舻乃接袛?shù)據(jù)進(jìn)行本質(zhì)上和自動利用的系統(tǒng)的反論證。此外,隨著零知識證明的出現(xiàn),區(qū)塊鏈現(xiàn)在除了有效之外,沒有能力透露任何有關(guān)交易的信息。
第二,區(qū)塊鏈的設(shè)計沒有中央權(quán)力或系統(tǒng)。因此,為了在數(shù)據(jù)和交易上達(dá)成一致,區(qū)塊鏈?zhǔn)褂昧硕喾N容錯一致性算法。雖然有各種各樣的一致算法,但它們在跨分散的節(jié)點(或系統(tǒng))之間達(dá)成一致方面都有相似的特征。特別是,一個叫做拜占庭共識的變體解決了前面提到的拜占庭容錯問題。區(qū)塊鏈可以開發(fā)不依賴于單一供應(yīng)商實現(xiàn)的人工智能應(yīng)用程序,同時存在所有的風(fēng)險和錯誤。
總之,這兩個關(guān)鍵的能力有可能使今天的機(jī)器學(xué)習(xí)實現(xiàn)解決他們的致命弱點,并使人工智能應(yīng)用程序既不侵犯隱私,也不容易受到單一供應(yīng)商拜占庭故障的影響。
下一步是什么
區(qū)塊鏈+機(jī)器學(xué)習(xí)開辟了一個顛覆性的新方法使人工智能成為主流,同時保護(hù)用戶隱私和確保供應(yīng)商中立的應(yīng)用程序,減少風(fēng)險。
消費者及其設(shè)備在其生存期生成大量數(shù)據(jù)。這些數(shù)據(jù)包含了有關(guān)用戶及其行為的有價值的信息:他們經(jīng)常光顧的餐廳、訪問哪些網(wǎng)站、他們喜歡去哪些地方、他們使用的社交媒體應(yīng)用程序、看什么視頻等等。這些數(shù)據(jù)已經(jīng)成為構(gòu)建有效的深度學(xué)習(xí)模型以最大限度地增強(qiáng)用戶體驗的個性化服務(wù)的基石(例如ala Siri)。區(qū)塊鏈提供了一種獨特的選擇來構(gòu)建這樣的個性化模型,而不會侵犯用戶的隱私。
至關(guān)重要的是,廣大的行業(yè)應(yīng)將用戶隱私置于商業(yè)利益之上,并使用區(qū)塊鏈功能來建立機(jī)器學(xué)習(xí)模型,使他們的人工智能應(yīng)用程序成為可能。
人臉識別等應(yīng)用正在被廣泛使用(包括政府機(jī)構(gòu));由于機(jī)器學(xué)習(xí)模型與單個供應(yīng)商捆綁在一起的一系列問題而產(chǎn)生的假陽性和假陰性造成的風(fēng)險太嚴(yán)重,不能繼續(xù)忽視。例如,波音和空客飛機(jī)上的航空電子系統(tǒng)已經(jīng)設(shè)計了幾十年的拜占庭容錯技術(shù)。當(dāng)移民部門和邊境巡邏隊使用諸如AWS RekogniTIon等工具時,行業(yè)和監(jiān)管政策機(jī)構(gòu)必須重新考慮當(dāng)今人工智能應(yīng)用的原始性質(zhì)(例如在航空電子系統(tǒng)方面)。
我們必須擺脫單一供應(yīng)商的實現(xiàn)及其相關(guān)風(fēng)險,轉(zhuǎn)向去中心化的深度學(xué)習(xí)實現(xiàn),利用跨多個供應(yīng)商和供應(yīng)商的計算資源(算法、語言、硬件等)。
未來是去中心化的,人工智能也不例外。否則就會是另一個人工智能冬天。