AI的下一個戰(zhàn)場將會是在哪里
掃描二維碼
隨時(shí)隨地手機(jī)看文章
“深度學(xué)習(xí)的鑰匙丟在了黑暗角落?!睆堚撛菏坎恢挂淮翁岢鲞@個論點(diǎn)。深度學(xué)習(xí)方法易受欺騙、易受攻擊已經(jīng)是研究者們達(dá)成的共識,追其根本原因,張鈸歸結(jié)為:大家只是在燈亮的方向?qū)δP托?u>修補(bǔ)補(bǔ),沒有向人類深入學(xué)習(xí)。更為具體的是:沒有在數(shù)據(jù)驅(qū)動的基礎(chǔ)上引進(jìn)知識,沒有改變深度學(xué)習(xí)網(wǎng)絡(luò)的模型與結(jié)構(gòu)。
對人工智能發(fā)展的三個階段進(jìn)行剖析:1.計(jì)算智能;2.感知智能;3.認(rèn)知智能。顯然,2019年是在第二階段渡過的,在2019年,我們進(jìn)一步研究語音識別,計(jì)算機(jī)人臉的識別,以及想方設(shè)法讓計(jì)算機(jī)加強(qiáng)語言文字處理能力。但是,對于第三階段,讓人工智能真正的進(jìn)行理解,進(jìn)行思考,進(jìn)行推理還尚未觸及到門檻。
“當(dāng)前的人工智能很多的研究,并不在于理解,是一個非常表象的匹配?!鼻迦A大學(xué)黃民烈在AI Time 第十期學(xué)術(shù)論壇中提到,“當(dāng)前的感知智能實(shí)際上是涉及機(jī)器的視覺、聽覺和觸覺感知的能力,主要是對深數(shù)據(jù)的處理,能做一些分類、檢測,然后基于這些再做初步的決策,特點(diǎn)是數(shù)據(jù)驅(qū)動,是一種典型的弱人工智能的范疇?!?/p>
這也就是說深度學(xué)習(xí)技術(shù)的確是推動了感知智能技術(shù)的快速發(fā)展,但是僅僅依靠深度學(xué)習(xí)技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,深度學(xué)習(xí)是純粹基于數(shù)據(jù)的方法,屬于歸納的范疇,并不具有可解釋性。從感知智能走向認(rèn)知智能,僅僅依靠深度學(xué)習(xí)是遠(yuǎn)遠(yuǎn)不夠的,還需要有更多突破。
所以,從感知智能走向認(rèn)知智能必須把相關(guān)研究放在認(rèn)知層面,即將研究方向聚焦于人的語言、認(rèn)知和邏輯相關(guān)方面,打造具有歸納的能力,有推理的能力,有知識運(yùn)用的能力的強(qiáng)人工智能。
認(rèn)知智能的獲取,AI研究的瓶頸
感知智能和認(rèn)知智能是人類的兩個不同的性質(zhì),無法對這兩個行為進(jìn)行孰高孰低的評價(jià)。張鈸院士認(rèn)為人類的智能實(shí)際上是三個內(nèi)容,分別是感知智能、理性行為、人類的一些行為動作,這三個內(nèi)容加起來才是認(rèn)知智能。
在感知方面,最大的問題是無法從感性的認(rèn)識提高到理性,也就是說目前深度學(xué)習(xí)幾乎達(dá)不到從感性上升到理性。然而推理在攻克人工智能項(xiàng)目難題時(shí)非常重要,例如交互視覺的相關(guān)研究中,如果場景中有鏡子,呈現(xiàn)的場景是虛像,當(dāng)前的深度學(xué)習(xí)算法無法有效處理,這時(shí)候便需要推理。
在醫(yī)學(xué)影像中,如果如果兩根血管離的非常近,深度學(xué)習(xí)很容易把兩個并在一起,準(zhǔn)確區(qū)分則需要進(jìn)行推理。讓機(jī)器獲得推理能力,就要讓機(jī)器做一個“人類”,模仿人腦思考的方式,建立新的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),賦予其足夠的表達(dá)力。
正如阿里巴巴的楊紅霞在AI TIme第10期中談到:“小朋友觀看一次狗的圖片,就能認(rèn)識到狗這個物種,但是機(jī)器需要訓(xùn)練成千上萬張圖片才不會犯錯誤;對于一只狗眼睛,人可能下意識的感知到這是一只狗的眼睛,機(jī)器可能會因?yàn)樾畔⒉怀浞峙袛嗍 薄?/p>
所以,用少量的信息得到最好的效果,也是機(jī)器獲得認(rèn)識智能的一個表現(xiàn)。將數(shù)據(jù)和知識結(jié)合獲得認(rèn)知是學(xué)界達(dá)成共識的一個方法,但是知識獲很困難,將數(shù)據(jù)和知識結(jié)合更加困難。讓AI獲得知識的知識庫在業(yè)界稱為“知識圖譜”,它不僅要關(guān)注知識點(diǎn)還要關(guān)注知識點(diǎn)間的關(guān)聯(lián)。這些關(guān)聯(lián)將賦予AI聯(lián)想力。
提到水,它要反映到密度、透明等多個性質(zhì)聯(lián)系起來,更高級的是計(jì)算出用多大力道去取水。知識圖譜的建立非常困難,人類海量的知識如何翻譯成機(jī)器的語言,并與之建立聯(lián)系,很成問題。
尤其是之前這項(xiàng)工作一直是人工完成的,例如谷歌詞庫、百度百科、維基百科等都可以轉(zhuǎn)換為知識圖譜,但工作量大、內(nèi)容異常龐雜。
幸好,有一些思路為我們提供了參考,例如圖神經(jīng)網(wǎng)絡(luò)在對圖節(jié)點(diǎn)之間依賴關(guān)系進(jìn)行建模的強(qiáng)大功能,使得與圖分析相關(guān)的研究領(lǐng)域取得了突破;從人腦中借助的注意力機(jī)制、記憶、遺忘也很好的改變了現(xiàn)有的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),設(shè)計(jì)動態(tài)神經(jīng)網(wǎng)絡(luò),根據(jù)外界的輸入,改變自身的結(jié)構(gòu)和參數(shù)。
正如達(dá)摩院2020十大科技趨勢預(yù)測中的那樣,人工智能會從感知智能向認(rèn)知智能演進(jìn)。人工智能已經(jīng)在“聽、說、看”等感知智能領(lǐng)域已經(jīng)達(dá)到或超越了人類水準(zhǔn),但在需要外部知識、邏輯推理或者領(lǐng)域遷移的認(rèn)知智能領(lǐng)域還處于初級階段。
認(rèn)知智能將從認(rèn)知心理學(xué)、腦科學(xué)及人類社會歷史中汲取靈感,并結(jié)合跨領(lǐng)域知識圖譜、因果推理、持續(xù)學(xué)習(xí)等技術(shù),建立穩(wěn)定獲取和表達(dá)知識的有效機(jī)制,讓知識能夠被機(jī)器理解和運(yùn)用,實(shí)現(xiàn)從感知智能到認(rèn)知智能的關(guān)鍵突破。獲取和表達(dá)知識重要的是有高效的學(xué)習(xí)系統(tǒng),那么現(xiàn)在的學(xué)習(xí)系統(tǒng),應(yīng)該怎么樣去積累,去獲得知識?
模擬人類大腦,構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)
觀察人類的進(jìn)化角度、發(fā)展的角度,從而讓機(jī)器學(xué)習(xí)這種角度是一個非常好的路徑,但是具體實(shí)施確是非常個困難。關(guān)于學(xué)習(xí)系統(tǒng),張鈸院士在AI TIme 學(xué)術(shù)論壇中提到:“對于人腦來說,其實(shí)從神經(jīng)元的表述來講,差別并不大,一個非常重要的原因,人類的大腦連接的很少,提供了非常靈活的學(xué)習(xí)機(jī)會,人類最大的優(yōu)勢就在于腦容量越大,但是都是不確定的,全是靠出生10多年不斷的產(chǎn)生連接,所以這屬于非常靈活的結(jié)構(gòu)。
這也就是說,學(xué)習(xí)知識的能力,并不是取決于神經(jīng)網(wǎng)絡(luò)已有的固定連接。人工智能的最終解決要依靠我們對大腦的工作有深入的了解,對大腦理解越多,對如何構(gòu)建學(xué)習(xí)系統(tǒng)就會更加清晰。
正如張鈸院士提到的那樣,目前我們對大腦的了解,在細(xì)胞這個量級上面,所有的重大問題都清楚,人腦細(xì)胞的重大問題基本上都解決了,但是這些知識對人工智能幾乎沒有什么用處,因?yàn)橐呀鉀Q的問題太細(xì)節(jié)了,太底層了,無法直接運(yùn)用。
真正對人工智能有用就是網(wǎng)絡(luò),解決人腦的回路問題才是重點(diǎn),然而現(xiàn)在在腦回路方面的研究非常粗淺。現(xiàn)在的嘗試主要基于類腦計(jì)算,依靠神經(jīng)科學(xué)家和數(shù)學(xué)家。而早期的類腦計(jì)算(也可以狹義的稱為神經(jīng)計(jì)算),將神經(jīng)元和突觸模型作為基礎(chǔ),把這些模型用在許多現(xiàn)實(shí)中的識別任務(wù),從而發(fā)揮模擬人腦功能,例如字體識別,人臉識別等等。
腦建模則是在認(rèn)知腦的基礎(chǔ)上進(jìn)行的,目前的類腦計(jì)算算法還有很大的研究價(jià)值,目前發(fā)現(xiàn)的生物學(xué)機(jī)制只有少部分使用了計(jì)算神經(jīng)學(xué)的方式進(jìn)行模擬,被用在類腦計(jì)算中的機(jī)制則更加有限。另外,計(jì)算機(jī)仿真工具和數(shù)學(xué)的理論分析仍然不夠完善,類腦計(jì)算沒有形成統(tǒng)一的理論框架,面對大數(shù)據(jù)時(shí)代還沒辦法取代深度學(xué)習(xí)等成熟算法和工具的地位。
? ? ? ?