當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀]  深度學(xué)習(xí)主要強(qiáng)調(diào)的是特征,強(qiáng)化學(xué)習(xí)主要強(qiáng)調(diào)的是反饋,而遷移學(xué)習(xí)主要強(qiáng)調(diào)的是適應(yīng)。 之前介紹過(guò)人工智能之機(jī)器學(xué)習(xí)算法有前5大類內(nèi)容,具體請(qǐng)參見(jiàn)相關(guān)文章。今天我們重點(diǎn)探討一下第6

 深度學(xué)習(xí)主要強(qiáng)調(diào)的是特征,強(qiáng)化學(xué)習(xí)主要強(qiáng)調(diào)的是反饋,而遷移學(xué)習(xí)主要強(qiáng)調(diào)的是適應(yīng)。

之前介紹過(guò)人工智能之機(jī)器學(xué)習(xí)算法有前5大類內(nèi)容,具體請(qǐng)參見(jiàn)相關(guān)文章。今天我們重點(diǎn)探討一下第6類--遷移學(xué)習(xí)(Transfer Learning)。^_^

傳統(tǒng)的機(jī)器學(xué)習(xí)是種瓜得瓜,種豆得豆,而遷移學(xué)習(xí)可以舉一反三,投桃報(bào)李。

人工智能競(jìng)爭(zhēng),從算法模型的研發(fā)競(jìng)爭(zhēng),轉(zhuǎn)向數(shù)據(jù)和數(shù)據(jù)質(zhì)量的競(jìng)爭(zhēng),這些成功的模型和算法主要是由監(jiān)督學(xué)習(xí)推動(dòng)的,而監(jiān)督學(xué)習(xí)對(duì)數(shù)據(jù)極度饑渴,需要海量數(shù)據(jù)(大數(shù)據(jù))支撐來(lái)達(dá)到應(yīng)用的精準(zhǔn)要求。而人工智能發(fā)展更趨向于不要求海量數(shù)據(jù)也能達(dá)到應(yīng)用的精準(zhǔn)要求,因此“小數(shù)據(jù)學(xué)習(xí)”正在成為新的熱點(diǎn),以遷移學(xué)習(xí),強(qiáng)化學(xué)習(xí)為代表的小數(shù)據(jù)學(xué)習(xí)技術(shù),更能體現(xiàn)人工智能的未來(lái)之路。有專家稱,在監(jiān)督學(xué)習(xí)之后,遷移學(xué)習(xí)將引領(lǐng)下一波機(jī)器學(xué)習(xí)技術(shù)商業(yè)化浪潮。

遷移學(xué)習(xí)(TL)的概念自從1995年在NIPS5專題討論會(huì)上被提出來(lái)后,受到學(xué)術(shù)界的廣泛關(guān)注。遷移學(xué)習(xí)定義過(guò)于寬泛,相關(guān)研究中曾出現(xiàn)多種專用術(shù)語(yǔ),比如learning to learn, life-long learn,mulTI-task learning, meta-learning, inducTIve transfer, knowledge transfer, context sensiTIve learning等。其中,遷移學(xué)習(xí)與多任務(wù)學(xué)習(xí)(mulTI-task learning)關(guān)系最為緊密。多任務(wù)學(xué)習(xí)同時(shí)學(xué)習(xí)多個(gè)不同的任務(wù),從中發(fā)現(xiàn)隱含的共同特征,以幫助單個(gè)任務(wù)的學(xué)習(xí)。

什么是遷移學(xué)習(xí)?

遷移學(xué)習(xí)TL(Transfer Learning)是把已學(xué)訓(xùn)練好的模型參數(shù)遷移到新的模型來(lái)幫助新模型訓(xùn)練??紤]到大部分?jǐn)?shù)據(jù)或任務(wù)是存在相關(guān)性的,所以通過(guò)遷移學(xué)習(xí),可以將已經(jīng)學(xué)到的模型參數(shù)通過(guò)某種方式來(lái)分享給新模型從而加快并優(yōu)化模型的學(xué)習(xí)效率。

遷移學(xué)習(xí)的基本動(dòng)機(jī):

遷移學(xué)習(xí)的基本動(dòng)機(jī)是試圖從一個(gè)問(wèn)題中獲取的知識(shí)應(yīng)用到另外一個(gè)不同但是相關(guān)的問(wèn)題中去。比如,一個(gè)熟練應(yīng)用C++語(yǔ)言編程的程序員能很快地學(xué)習(xí)和掌握JAVA語(yǔ)言。在某種程度上,機(jī)器學(xué)習(xí)中的遷移學(xué)習(xí)跟心理學(xué)上的“學(xué)習(xí)能力遷移”有一定的關(guān)聯(lián)。在人類進(jìn)化中,遷移學(xué)習(xí)這種能力是非常重要。比如說(shuō),人類在學(xué)會(huì)騎自行車后,再騎摩托車就很容易了,人類在學(xué)會(huì)打羽毛球后再學(xué)習(xí)打網(wǎng)球也會(huì)容易很多。人類能把過(guò)去的知識(shí)和經(jīng)驗(yàn)應(yīng)用到不同的新場(chǎng)景中,這樣就有了一種適應(yīng)的能力。

遷移學(xué)習(xí)主要類別方法:

1)實(shí)例加權(quán)方法:通過(guò)某種方式對(duì)來(lái)自源領(lǐng)域的訓(xùn)練樣本進(jìn)行權(quán)重計(jì)算,以決定每個(gè)樣本在訓(xùn)練過(guò)程中的重要性大小。

2)共同特征學(xué)習(xí)方法:通過(guò)若干個(gè)共同特征在源領(lǐng)域和目標(biāo)領(lǐng)域之間傳遞有用的知識(shí)。

遷移學(xué)習(xí)的重要性:

1)從數(shù)據(jù)角度:數(shù)據(jù)為王,計(jì)算是核心,但沒(méi)有足夠數(shù)據(jù)或收集數(shù)據(jù)很耗時(shí),對(duì)數(shù)據(jù)打標(biāo)簽很難,用數(shù)據(jù)訓(xùn)練模型很繁瑣。如何進(jìn)行機(jī)器學(xué)習(xí)?遷移學(xué)習(xí)適用于小數(shù)據(jù)量場(chǎng)景;

2)從模型角度:云-端融合的模型被普遍使用,通過(guò)需要對(duì)設(shè)備、環(huán)境、用戶做具體適配。個(gè)性化模型適配很復(fù)雜,需要有不同的用戶隱私處理方式。遷移學(xué)習(xí)適合個(gè)性化方面。

3)從應(yīng)用角度:機(jī)器學(xué)習(xí)應(yīng)用中的冷啟動(dòng)問(wèn)題,推薦系統(tǒng)沒(méi)有初始用戶數(shù)據(jù),無(wú)法精準(zhǔn)推薦。遷移學(xué)習(xí)可以解決冷啟動(dòng)問(wèn)題。

遷移學(xué)習(xí)可減少對(duì)標(biāo)定數(shù)據(jù)的依賴,通過(guò)和已有數(shù)據(jù)模型之間的遷移,更好地完成機(jī)器學(xué)習(xí)任務(wù)。

遷移學(xué)習(xí)實(shí)現(xiàn)方法:

1)樣本遷移(Instance-based Transfer Learning):在數(shù)據(jù)集(源領(lǐng)域)中找到與目標(biāo)領(lǐng)域相似的數(shù)據(jù),把這個(gè)數(shù)據(jù)放大多倍,與目標(biāo)領(lǐng)域的數(shù)據(jù)進(jìn)行匹配。其特點(diǎn)是:需要對(duì)不同例子加權(quán);需要用數(shù)據(jù)進(jìn)行訓(xùn)練。一般就是對(duì)樣本進(jìn)行加權(quán),給比較重要的樣本較大的權(quán)重。

2)特征遷移(Feature-based Transfer Learning):通過(guò)觀察源領(lǐng)域圖像與目標(biāo)域圖像之間的共同特征,然后利用觀察所得的共同特征在不同層級(jí)的特征間進(jìn)行自動(dòng)遷移。在特征空間進(jìn)行遷移,一般需要把源領(lǐng)域和目標(biāo)領(lǐng)域的特征投影到同一個(gè)特征空間里進(jìn)行。

3)模型遷移(Model-based Transfer Learning):利用上千萬(wàn)的圖象訓(xùn)練一個(gè)圖象識(shí)別的系統(tǒng),當(dāng)遇到一個(gè)新的圖象領(lǐng)域,就不用再去找?guī)浊f(wàn)個(gè)圖象來(lái)訓(xùn)練了,可以原來(lái)的圖像識(shí)別系統(tǒng)遷移到新的領(lǐng)域,所以在新的領(lǐng)域只用幾萬(wàn)張圖片同樣能夠獲取相同的效果。模型遷移的一個(gè)好處是可以區(qū)分,就是可以和深度學(xué)習(xí)結(jié)合起來(lái),可以區(qū)分不同層次可遷移的度,相似度比較高的那些層次被遷移的可能性就大一些。

4)關(guān)系遷移(Relational Transfer Learning):利用源域?qū)W習(xí)邏輯關(guān)系網(wǎng)絡(luò),再應(yīng)用于目標(biāo)域上。如社會(huì)網(wǎng)絡(luò),社交網(wǎng)絡(luò)之間的遷移。

遷移學(xué)習(xí)工具:

NanoNets(納米網(wǎng)絡(luò))是一個(gè)簡(jiǎn)單方便的基于云端實(shí)現(xiàn)的遷移學(xué)習(xí)工具,內(nèi)部包含了一組已經(jīng)實(shí)現(xiàn)好的預(yù)訓(xùn)練模型,每個(gè)模型有數(shù)百萬(wàn)個(gè)訓(xùn)練好的參數(shù)。用戶可以自己上傳或通過(guò)網(wǎng)絡(luò)搜索得到數(shù)據(jù),NanoNets將自動(dòng)根據(jù)待解問(wèn)題選擇最佳的預(yù)訓(xùn)練模型,并根據(jù)該模型建立一個(gè)NanoNets,并將之適配到用戶的數(shù)據(jù)。NanoNets和預(yù)訓(xùn)練模型之間的關(guān)系結(jié)構(gòu)如下圖所示。

遷移學(xué)習(xí)發(fā)展:

1)結(jié)構(gòu)與內(nèi)容分離:當(dāng)面臨一個(gè)機(jī)器學(xué)習(xí)問(wèn)題,想要發(fā)現(xiàn)不同問(wèn)題之間的共性,那么可以把問(wèn)題的結(jié)構(gòu)和內(nèi)容剝離開(kāi)。雖然這樣的分離并不容易,但是一旦完成,那么系統(tǒng)舉一反三的能力就非常強(qiáng)。

2)多層次特征學(xué)習(xí):把問(wèn)題分到不同層次,有些層次就更容易幫助進(jìn)行機(jī)器學(xué)習(xí)的遷移。用了這種層次型的遷移學(xué)習(xí),不同的層次具有不同的遷移能力,對(duì)于不同層次的遷移能力就有了一個(gè)定量的估計(jì)。當(dāng)需要處理新任務(wù)時(shí),就可以把某些區(qū)域或某些層次給固定住,把其他的區(qū)域用小數(shù)據(jù)來(lái)做訓(xùn)練,這樣就能夠達(dá)到遷移學(xué)習(xí)的效果。

3)多步、傳遞式學(xué)習(xí):從舊領(lǐng)域遷移到新領(lǐng)域,從一個(gè)多數(shù)據(jù)的領(lǐng)域遷移到少數(shù)據(jù)的領(lǐng)域,這種稱之為單步遷移。很多場(chǎng)景是需要分階段進(jìn)行多步傳導(dǎo)式的遷移,可以構(gòu)建一個(gè)深度網(wǎng)絡(luò),而這個(gè)網(wǎng)絡(luò)中間層既能照顧目標(biāo)這個(gè)問(wèn)題領(lǐng)域,又能照顧原來(lái)的領(lǐng)域。如果有一些中間領(lǐng)域,那么其可以把原領(lǐng)域和目標(biāo)領(lǐng)域一步步的銜接起來(lái)。可以定義兩個(gè)目標(biāo)函數(shù),兩個(gè)目標(biāo)函數(shù)一同工作時(shí),一個(gè)優(yōu)化了最后的目標(biāo),另一個(gè)則選擇了樣本。如此迭代,原領(lǐng)域的數(shù)據(jù)就從多步遷移到目標(biāo)領(lǐng)域。

4)學(xué)習(xí)如何遷移:在給定任何一個(gè)遷移學(xué)習(xí)問(wèn)題,系統(tǒng)可以自動(dòng)在過(guò)去所有嘗試過(guò)的算法里面,利用經(jīng)驗(yàn)找到最合適的算法,可以是基于特征的、基于多層網(wǎng)絡(luò)的、基于樣本的或者是基于某種混合。或者把經(jīng)驗(yàn)總結(jié)起來(lái)訓(xùn)練一個(gè)新的算法,這個(gè)算法的老師就是所有這些機(jī)器學(xué)習(xí)算法、文章、經(jīng)歷和數(shù)據(jù)。所以,學(xué)習(xí)如何遷移,就好像常說(shuō)的學(xué)習(xí)如何學(xué)習(xí),這個(gè)才是學(xué)習(xí)的最高境界,也就是學(xué)習(xí)方法的獲取。

5)遷移學(xué)習(xí)作為元學(xué)習(xí):把遷移學(xué)習(xí)本身作為一個(gè)元學(xué)習(xí)(Meta Learning)的方法,賦予到不同學(xué)習(xí)的方式上。假設(shè)以前有一個(gè)機(jī)器學(xué)習(xí)的問(wèn)題或者是模型,現(xiàn)在只要在上面套一個(gè)遷移學(xué)習(xí)的罩子,它就可以變成一個(gè)遷移學(xué)習(xí)的模型了。

6)數(shù)據(jù)生成式遷移學(xué)習(xí):對(duì)于生成式對(duì)抗網(wǎng)絡(luò)來(lái)說(shuō),圖靈測(cè)試外面的裁判是學(xué)生,里面的那個(gè)機(jī)器也是學(xué)生,兩個(gè)人的目的是在對(duì)抗中共同成長(zhǎng),兩方不斷互相刺激,形成一種對(duì)抗(共同學(xué)習(xí)特點(diǎn))。通過(guò)小數(shù)據(jù)可以生成很多模擬數(shù)據(jù),通過(guò)模擬數(shù)據(jù)又來(lái)判定它是真的還是假的,用以刺激生成式模型的成長(zhǎng)??梢酝ㄟ^(guò)小數(shù)據(jù)產(chǎn)生更多的數(shù)據(jù),在新的領(lǐng)域就可以實(shí)現(xiàn)遷移學(xué)習(xí)的目的。

最近,遷移學(xué)習(xí)技術(shù)在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域得到了深入的研究。

結(jié)語(yǔ):

伴隨著最近幾年的機(jī)器學(xué)習(xí)熱潮,遷移學(xué)習(xí)也成為目前最炙手可熱的研究方向。機(jī)器學(xué)習(xí)的未來(lái)發(fā)展在小數(shù)據(jù)、個(gè)性化、可靠性上面,那就是遷移學(xué)習(xí)。遷移學(xué)習(xí)體現(xiàn)了人類特有的類比能力,是“舉一反三”式的發(fā)散思維。遷移學(xué)習(xí)已經(jīng)廣泛被使用在各種人工智能機(jī)器學(xué)習(xí)應(yīng)用場(chǎng)景中。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉