如何讓機(jī)器學(xué)習(xí)賦予人工智能更快的發(fā)展
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來源:中國機(jī)器人網(wǎng))
激進(jìn)的變革、革命、大趨勢,甚至可能是一種風(fēng)險(xiǎn):人工智能已經(jīng)滲透到所有的工業(yè)領(lǐng)域,讓媒體忙個(gè)不停。rub神經(jīng)計(jì)算研究所的研究人員已經(jīng)研究了25年,他們的指導(dǎo)原則是:為了使機(jī)器真正智能化,新的方法必須首先使機(jī)器學(xué)習(xí)更加高效和靈活。
神經(jīng)系統(tǒng)理論的主席勞倫斯·維斯科特教授解釋說:“今天有兩種類型的機(jī)器學(xué)習(xí)是成功的:深神經(jīng)網(wǎng)絡(luò),也稱為深學(xué)習(xí),以及強(qiáng)化學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)能夠做出復(fù)雜的決策。它們經(jīng)常用于圖像識(shí)別應(yīng)用?!崩?,他們可以從照片中分辨出拍攝對(duì)象是男性還是女性。這種網(wǎng)絡(luò)的結(jié)構(gòu)是受到大腦中神經(jīng)細(xì)胞或神經(jīng)元網(wǎng)絡(luò)的啟發(fā),神經(jīng)元通過幾個(gè)輸入通道接收信號(hào),然后決定是否以電脈沖的形式將信號(hào)傳遞給下一個(gè)神經(jīng)元。
神經(jīng)網(wǎng)絡(luò)同樣接收幾個(gè)輸入信號(hào),例如像素。在第一步中,許多人工神經(jīng)元通過簡單地將輸入乘以不同但不變的權(quán)重,然后將它們相加,計(jì)算出來自多個(gè)輸入信號(hào)的輸出信號(hào)。每一個(gè)算術(shù)運(yùn)算都會(huì)產(chǎn)生一個(gè)值,這個(gè)值——以男性/女性為例——對(duì)女性或男性的決策有一點(diǎn)幫助?!钡?,如果將負(fù)結(jié)果設(shè)置為零,則結(jié)果會(huì)略有改變。這也是從神經(jīng)細(xì)胞中復(fù)制出來的,對(duì)神經(jīng)網(wǎng)絡(luò)的性能至關(guān)重要。
另一方面,強(qiáng)化學(xué)習(xí)受到心理學(xué)的啟發(fā)。在這里,算法所做的每一個(gè)決定——專家稱之為代理——要么得到獎(jiǎng)勵(lì),要么受到懲罰?!毕胂笠粋€(gè)中間有代理的網(wǎng)格。它的目標(biāo)是以最短的路線到達(dá)左上角的位置,但它并不知道這一點(diǎn),“經(jīng)紀(jì)人唯一想要的就是盡可能多地獲得獎(jiǎng)勵(lì),否則就毫無頭緒了。一開始,它會(huì)橫沖直撞,每一步達(dá)不到目標(biāo)都會(huì)受到懲罰。只有朝著目標(biāo)邁出的一步才會(huì)有回報(bào)。
為了學(xué)習(xí),代理為每個(gè)字段分配一個(gè)值,指示從該位置到其目標(biāo)還有多少步。最初,這些值是隨機(jī)的。經(jīng)紀(jì)人在董事會(huì)獲得的經(jīng)驗(yàn)越多,就越能使這些價(jià)值觀適應(yīng)現(xiàn)實(shí)生活條件。經(jīng)過無數(shù)次的跑步,它能夠找到最快的方式達(dá)到目標(biāo),并因此獲得獎(jiǎng)勵(lì)。
“這些機(jī)器學(xué)習(xí)過程的問題在于它們相當(dāng)愚蠢,”勞倫斯·維斯科特說。基礎(chǔ)技術(shù)可以追溯到20世紀(jì)80年代,目前之所以取得成功,唯一的原因是我們擁有了更多的計(jì)算能力和更多的可用數(shù)據(jù)。為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),有可能快速運(yùn)行幾乎效率低下的學(xué)習(xí)過程無數(shù)次,并將大量的圖像和圖像描述反饋給神經(jīng)網(wǎng)絡(luò)。
這就是為什么神經(jīng)計(jì)算研究所的研究人員將重點(diǎn)放在幫助機(jī)器自主發(fā)現(xiàn)結(jié)構(gòu)的新策略上。”為此,我們采用了無監(jiān)督學(xué)習(xí)的原則。雖然深層神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)是基于提出期望的結(jié)果或獎(jiǎng)勵(lì)或懲罰每一步,研究人員離開學(xué)習(xí)算法很大程度上與他們的輸入。
“回到人們的照片的例子,人們可以在分組后查看結(jié)果,可能會(huì)發(fā)現(xiàn)計(jì)算機(jī)已經(jīng)把一組男人的照片和一組女人的照片組合在一起,”勞倫斯·維斯科特解釋說。一個(gè)主要的優(yōu)勢是,一開始所需要的只是照片,而不是像以前那樣,一個(gè)包含謎語解決方案的圖片說明,用于訓(xùn)練目的?!?/p>
此外,慢性原則這種方法提供了更多的靈活性,因?yàn)檫@樣的群集形成不僅適用于人的照片,而且適用于汽車、植物、房屋或其他物體。
wiskott所追求的另一種方法是緩慢原則。這里,不是照片構(gòu)成輸入信號(hào),而是運(yùn)動(dòng)圖像:如果從變化非常緩慢的視頻中提取所有特征,就會(huì)出現(xiàn)有助于建立環(huán)境抽象表示的結(jié)構(gòu)?!痹谶@里,重點(diǎn)是預(yù)結(jié)構(gòu)輸入數(shù)據(jù),”勞倫斯指出。最終,研究者將這些方法以模塊化的方式與監(jiān)督學(xué)習(xí)的方法相結(jié)合,以便創(chuàng)建更靈活的應(yīng)用程序,然而這些應(yīng)用程序非常精確。
研究人員承認(rèn):“增加的靈活性自然會(huì)導(dǎo)致性能損失?!钡珡拈L遠(yuǎn)來看,如果我們想開發(fā)出能夠應(yīng)對(duì)新形勢的機(jī)器人,靈活性是必不可少的。