神經(jīng)擬態(tài)芯片對(duì)于AI的發(fā)展有什么影響
在這兩個(gè)重磅消息的背后釋放出許多重要的信號(hào),人類對(duì)于除視覺(jué)、聽(tīng)覺(jué)之外的味覺(jué)嗅覺(jué)等研究有新突破,帶來(lái)新想象空間和應(yīng)用空間,人類對(duì)大腦的認(rèn)知以及類腦芯片、AI芯片又跨上新臺(tái)階,未來(lái)的芯片發(fā)展之路又有可能另辟蹊徑。這一切、一切的背后有諸多信息需要解密,3月20日,《中國(guó)電子報(bào)》記者連線采訪英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)。
嗅覺(jué)和味覺(jué)AI為什么遠(yuǎn)比視覺(jué)和聽(tīng)覺(jué)AI要落后?
宋繼強(qiáng)表示,人類的味覺(jué)靠舌頭、嗅覺(jué)靠鼻子,目前為止,人工智能做得比較好的是視覺(jué)、聽(tīng)覺(jué),這兩個(gè)人類主要感官。之所以在兩個(gè)領(lǐng)域做的比較好,有幾個(gè)原因,其一是視覺(jué)、聽(tīng)覺(jué)兩類數(shù)據(jù)相對(duì)容易獲得而且數(shù)據(jù)量大。在此前的信息化時(shí)代,比如2000年開(kāi)始攝像頭普及,更早時(shí)候麥克風(fēng)普及,讓我們積累了大量圖片數(shù)據(jù)、語(yǔ)音數(shù)據(jù)。其二是這兩類數(shù)據(jù)的標(biāo)注相對(duì)容易。人類基于捕捉下來(lái)的照片或是錄制的音頻進(jìn)行標(biāo)注,基于人類的基本認(rèn)知知識(shí)容易實(shí)現(xiàn),容易確定它的正確與否。
“而深度學(xué)習(xí)之所以能夠獲得現(xiàn)在的效果是因?yàn)閹讉€(gè)關(guān)鍵: 第一數(shù)據(jù)量足夠, 第二有標(biāo)注好的數(shù)據(jù), 第三是要保證訓(xùn)練的數(shù)據(jù)集和未來(lái)要處理的問(wèn)題的測(cè)試數(shù)據(jù)集的分布是一致的,這樣訓(xùn)練出來(lái)的模型,才能夠很好地處理真實(shí)的場(chǎng)景。”宋繼強(qiáng)表示,這也是為什么我們看到深度神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)處理視覺(jué)數(shù)據(jù)、語(yǔ)音數(shù)據(jù)的原因。
而嗅覺(jué)和味覺(jué),目前的數(shù)據(jù)非常少,而且沒(méi)有很好地標(biāo)注。究竟誰(shuí)可以將這些數(shù)據(jù)進(jìn)行標(biāo)注非得是專家在實(shí)驗(yàn)室才可以進(jìn)行。比如葡萄酒的品酒,同一個(gè)葡萄酒十個(gè)專家來(lái)品嘗可能會(huì)有不同的結(jié)果,同一個(gè)葡萄酒讓同一個(gè)專家在不同的時(shí)間段品,也可能打出不同的分。所以它有難度。
“數(shù)據(jù)量不夠多,而且主觀評(píng)測(cè)標(biāo)準(zhǔn)也不夠,味覺(jué)的差異性太大。嗅覺(jué)相對(duì)客觀一些,因?yàn)樾嵊X(jué)本身是依據(jù)不同的氣味,主要源于空氣中包含的一些化學(xué)分子成份不同、密度不同。人的鼻子、動(dòng)物的鼻子、電子鼻對(duì)于氣味的區(qū)分能力不一樣。普通人能夠區(qū)分三四百種不同氣味,稍加訓(xùn)練可以達(dá)到上千種、數(shù)千種,但現(xiàn)實(shí)中真正可以區(qū)分的氣味其實(shí)是在萬(wàn)種以上,這些數(shù)據(jù)我們?nèi)粘:茈y拿到大量數(shù)據(jù),所以它絕對(duì)是小數(shù)據(jù)量的場(chǎng)景?!彼卫^強(qiáng)說(shuō)。
但嗅覺(jué)數(shù)據(jù)的使用場(chǎng)合非常多,比如爆炸品的檢測(cè),比如生活中危害、有害氣體的提早檢測(cè),比如對(duì)水果或農(nóng)作物的成熟度檢測(cè),比如對(duì)檢修污染的檢測(cè)等,靠氣味能夠檢測(cè)的非常多。目前因受限于數(shù)據(jù)量不夠充分,檢測(cè)手段不夠高明,嗅覺(jué)AI的發(fā)展比視覺(jué)和聽(tīng)覺(jué)落后非常多。
為什么用神經(jīng)擬態(tài)計(jì)算而不是其他計(jì)算?
我們知道人工智能發(fā)展有三個(gè)關(guān)鍵: 數(shù)據(jù)、算法、算力,為什么解決嗅覺(jué)、味覺(jué)等問(wèn)題上要采用類腦計(jì)算,而不是其他的計(jì)算來(lái)解決這些問(wèn)題?神經(jīng)擬態(tài)計(jì)算比其他計(jì)算解決此類問(wèn)題有什么優(yōu)點(diǎn)?用量子計(jì)算是不是也可以很好地解決此類問(wèn)題?
Pohoiki Springs難在哪里?有什么突破意義?
英特爾這次公布的新系統(tǒng)Pohoiki Springs研發(fā)難度有多大?與上一代的系統(tǒng)相比有哪些突破?這些突破有什么意義?
宋繼強(qiáng)表示,Pohoiki Springs是在上一代Pohoiki Beach的基礎(chǔ)上繼續(xù)進(jìn)行大規(guī)模的互聯(lián)。首先把互聯(lián)的規(guī)模加大,加大后面臨幾個(gè)問(wèn)題: 第一互聯(lián)之后怎么保證這些信息的傳遞,我們知道在一個(gè)64芯片的Pohoiki Beach板級(jí)方案上,所有的芯片之間的連接是在一塊電路板上,所以它們之間的速度是比較一致,很有保障的。當(dāng)我們把12倍的板子連起來(lái)時(shí),那就要增加更多的I/O連接組建和信息傳遞協(xié)議的處理,如何保證信息傳遞的有效和時(shí)效性。
第二是在上面支持軟件開(kāi)發(fā)的時(shí)候,要更好地把硬件連接差異掩蓋掉,讓大家非常容易使用,就像使用一個(gè)大腦組織一樣,不同的分區(qū)可能不同有功能的組合,實(shí)現(xiàn)靈活分區(qū)使用,這需要一個(gè)分布計(jì)算的軟件層支持,所以這一層也比較關(guān)鍵。
第三是這上面要開(kāi)發(fā)一些新模型也會(huì)涉及到更大規(guī)模的模型的設(shè)計(jì)和處理,這也比在小芯片上要困難。
它的難度分為三層, 一是底層如何把這么多塊芯片互連起來(lái),把它全部連接起來(lái)同時(shí)要保證連接的有效性和時(shí)效性,這在業(yè)界沒(méi)有做過(guò)。 二是軟件層,要支持互連計(jì)算、分布式計(jì)算和靈活分區(qū),這也是沒(méi)有人做過(guò)的。 三是支持更大規(guī)模的做動(dòng)態(tài)規(guī)劃和優(yōu)化的實(shí)驗(yàn),這也是英特爾首先做。
為什么要做這樣一個(gè)大規(guī)模的系統(tǒng)?宋繼強(qiáng)表示,因?yàn)樵诤芏囝I(lǐng)域的應(yīng)用里要做優(yōu)化、約束滿足、動(dòng)態(tài)規(guī)劃時(shí),需要耗費(fèi)很多時(shí)間需要消耗很多電力,而切換算法在神經(jīng)擬態(tài)芯片Loihi上做可以更快、功耗更低。
類腦計(jì)算何時(shí)真正接近于人腦?
計(jì)算機(jī)在不斷接人腦的維度上,目前走到了哪一步?如果我們用小溪、小河到大海來(lái)形容現(xiàn)在走到了哪一個(gè)程度?還要突破哪些屏障才能真正走到大海?
“這比較難給出確切答案。”宋繼強(qiáng)說(shuō),一方面因?yàn)槿祟悓?duì)于大腦的了解和認(rèn)知進(jìn)展并不像摩爾定律的那樣高速,它的進(jìn)展非常緩慢?,F(xiàn)在對(duì)于神經(jīng)元結(jié)構(gòu)基本了解,對(duì)于某些人的感知機(jī)理也有了解,特別像視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)這些比較重要的感知機(jī)理有所了解,但其他更深層次的感知、認(rèn)知是怎么形成依然不了解。不過(guò)現(xiàn)在Loihi設(shè)計(jì)用的比較復(fù)雜的腦神經(jīng)元的工作模型,這是我們首先可以借鑒的。另一方面在器件上,人腦的工作方式和傳統(tǒng)的半導(dǎo)體的工作機(jī)理也并不完全一樣,所以我們也在做新的底層器件研發(fā),比如憶阻器,既可以存儲(chǔ)也可以計(jì)算的一種器件。
不過(guò),宋繼強(qiáng)進(jìn)一步表示,除了我們對(duì)人腦的認(rèn)知機(jī)制與工作機(jī)制的了解需要繼續(xù)推進(jìn),我們還需要換一個(gè)維度,從超出人腦來(lái)看IT能夠帶來(lái)什么?!拔覀冋f(shuō)人腦很神秘、很厲害,但是畢竟是一個(gè)生物組織,有它的極限。我現(xiàn)在手里有一個(gè)更強(qiáng)的武器比如IT、半導(dǎo)體、量子計(jì)算等工具,它會(huì)有比人腦更強(qiáng)的能力?!比绾卫眠@些東西、利用這些芯片與人腦的研究相結(jié)合、跨學(xué)科結(jié)合就能夠更好地往前推進(jìn)。
“最重要的是需要找到很好的應(yīng)用導(dǎo)向。”宋繼強(qiáng)表示,比如英特爾對(duì)于Loihi研究, Loihi的主要貢獻(xiàn)一方面它是新的架構(gòu)設(shè)計(jì),實(shí)現(xiàn)了大規(guī)模集連,而且把工具鏈做起來(lái)了。另一方面是Loihi構(gòu)建了一個(gè)社區(qū)(英特爾神經(jīng)擬態(tài)社區(qū)INRC),社區(qū)中不僅有所類腦神經(jīng)擬態(tài)計(jì)算研究的學(xué)術(shù)機(jī)構(gòu),也吸納進(jìn)來(lái)非常多不同種類的創(chuàng)業(yè)公司、五百?gòu)?qiáng)企業(yè),希望通過(guò)探索看看這樣的神經(jīng)擬態(tài)計(jì)算能夠很好地解決哪些應(yīng)用領(lǐng)域問(wèn)題,由此來(lái)驅(qū)動(dòng)神經(jīng)擬態(tài)計(jì)算的發(fā)展。就像2012年深度學(xué)習(xí)在學(xué)術(shù)界嶄露頭角之后,于2016、2017年在產(chǎn)業(yè)界大規(guī)模使用于安防領(lǐng)域、生物認(rèn)證領(lǐng)域、金融領(lǐng)域等,以這樣的發(fā)展路徑能夠形成從技術(shù)到規(guī)模化應(yīng)用的生態(tài)?!斑@是一個(gè)并行發(fā)展而不是線性發(fā)展的事情,所以很難給你一個(gè)預(yù)測(cè)時(shí)間?!?宋繼強(qiáng)同時(shí)表示神經(jīng)擬態(tài)芯片在英特爾的芯片布局中屬于研究測(cè)試芯片,不是一個(gè)產(chǎn)品芯片,主要是在服務(wù)研究社區(qū)。未來(lái)如果有更大規(guī)模的商業(yè)應(yīng)用場(chǎng)景,不排除將其通用化。