一文帶你讀懂人工智能中的機(jī)器學(xué)習(xí)ML
我們經(jīng)??吹竭@幾個(gè)熱詞:人工智能(ArTIficialIntelligence)、機(jī)器學(xué)習(xí)(MachineLearning)和深度學(xué)習(xí)(DeepLearning),但是它們之間究竟有什么區(qū)別和聯(lián)系呢?
人工智能(AI)的根本在于智能,即如何為機(jī)器賦予人的智能,這是一個(gè)非常大的范圍。
機(jī)器學(xué)習(xí)(ML)是指通過(guò)數(shù)據(jù)訓(xùn)練出能完成一定功能的模型,是實(shí)現(xiàn)人工智能的手段之一,也是目前最主流的人工智能實(shí)現(xiàn)方法。人工智能是科學(xué),機(jī)器學(xué)習(xí)是讓機(jī)器變得更加智能的方法或算法。
深度學(xué)習(xí)(DL)是機(jī)器學(xué)習(xí)的一個(gè)分支。深度即層數(shù),超過(guò) 8 層的神經(jīng)網(wǎng)絡(luò)模型就叫深度學(xué)習(xí)。深度學(xué)習(xí)也是當(dāng)下最流行的機(jī)器學(xué)習(xí)的一種。目前在語(yǔ)音、圖像等領(lǐng)域取得了很好的效果。
三者之間是從大到小的包含關(guān)系。
今天重點(diǎn)介紹一下機(jī)器學(xué)習(xí)ML。
機(jī)器學(xué)習(xí)直接來(lái)源于早期的人工智能領(lǐng)域。
機(jī)器學(xué)習(xí)為什么如此重要?機(jī)器學(xué)習(xí)之所以成為人工智能背后的強(qiáng)勁動(dòng)力是在于一個(gè)重大突破--互聯(lián)網(wǎng)的發(fā)明。互聯(lián)網(wǎng)有大量的數(shù)字信息被生成存儲(chǔ)和分析。機(jī)器學(xué)習(xí)算法在這些大數(shù)據(jù)方面是最有效的。
機(jī)器學(xué)習(xí)最基本的做法,是使用算法來(lái)解析數(shù)據(jù)、從中學(xué)習(xí),然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測(cè)。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來(lái)“訓(xùn)練”,通過(guò)各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。機(jī)器學(xué)習(xí)則是機(jī)器通過(guò)大數(shù)據(jù)的輸入,從中主動(dòng)尋求規(guī)律,驗(yàn)證規(guī)律,最后得出結(jié)論,機(jī)器據(jù)此結(jié)論來(lái)自主解決問(wèn)題,如果出現(xiàn)了偏差,會(huì)自主糾錯(cuò)。
那么什么是機(jī)器學(xué)習(xí)呢?
機(jī)器學(xué)習(xí)ML(Machine Learning)是一門(mén)人工智能的學(xué)科,一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科。專(zhuān)門(mén)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。
機(jī)器學(xué)習(xí)ML是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。
ML defined byLangley(1996) - Machine learning is a science of the arTIficial. Thefield‘s main objects of study are arTIfacts, specifically algorithms that improvetheir performance with experience.
ML defined byTom Mitchell (1997)- Machine Learning is the study of computeralgorithms that improve automaTIcally through experience.
ML defined byAlpaydin(2004) - Machine learning is programming computers to optimize aperformance criterion using example data or past experience.
機(jī)器學(xué)習(xí)的本質(zhì)是空間搜索和函數(shù)的泛化。無(wú)論使用哪種機(jī)器學(xué)習(xí)模型,都要經(jīng)歷要經(jīng)歷“建立模型”,“訓(xùn)練模型”,“反饋”,“應(yīng)用”的過(guò)程。而這個(gè)過(guò)程,跟一個(gè)嬰兒認(rèn)識(shí)世界,獲取知識(shí)的過(guò)程是一樣的。培養(yǎng)機(jī)器建立人的認(rèn)識(shí)的過(guò)程,就是“機(jī)器學(xué)習(xí)”。
機(jī)器學(xué)習(xí)常見(jiàn)分類(lèi):
1)有監(jiān)督學(xué)習(xí)(supervised learning):從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)出一個(gè)函數(shù),當(dāng)新的數(shù)據(jù)到來(lái)時(shí),可以根據(jù)這個(gè)函數(shù)預(yù)測(cè)結(jié)果。主要應(yīng)用于分類(lèi)和預(yù)測(cè)。監(jiān)督學(xué)習(xí)的訓(xùn)練集要求是包括輸入和輸出,也可以說(shuō)是特征和目標(biāo)。訓(xùn)練集中的目標(biāo)是由人標(biāo)注的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network)、貝葉斯(Bayesian) 、決策樹(shù)(Decision Tree)和線性分類(lèi)(Linear classifier)等 。