淺談人工智能,機(jī)器學(xué)習(xí),深度學(xué)習(xí)三者關(guān)系
大數(shù)據(jù)人工智能技術(shù),在應(yīng)用層面包括機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等,它們都是現(xiàn)代人工智能的核心技術(shù)。在大數(shù)據(jù)背景下,這些技術(shù)均得到了質(zhì)的提升,人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的包含關(guān)系如下圖。
基本概念理解
1.機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)(Machine Learning)也被稱為統(tǒng)計學(xué)習(xí)理論,是人工智能的重要分支。它通過數(shù)據(jù)分析獲得數(shù)據(jù)規(guī)律,并將這些規(guī)律應(yīng)用于預(yù)測或判定其他未知數(shù)據(jù)。機(jī)器學(xué)習(xí)目前已經(jīng)廣泛應(yīng)用于數(shù)據(jù)挖掘、自然語言處理、語音識別等,尤其是在搜索引擎領(lǐng)域。
搜索引擎是人工智能技術(shù)發(fā)展的先鋒隊,目前百度已經(jīng)定位為一家人工智能公司,同時搜狗王小川也將人工智能視為未來。在海量數(shù)據(jù)面前,機(jī)器學(xué)習(xí)的方法成效顯著,具體算法包括決策樹、感知器、支持向量機(jī)、馬爾科夫鏈、最近鄰居法等。擁有大規(guī)模用戶的搜索引擎業(yè)務(wù)的公司是最先接觸到大數(shù)據(jù)的企業(yè),它們對于機(jī)器學(xué)習(xí)的需求遠(yuǎn)遠(yuǎn)超過其他公司。這類公司利用人工智能技術(shù)的原因是希望其搜索結(jié)果更加精準(zhǔn),甚至能直接命中用戶答案。
人工智能的發(fā)展經(jīng)歷了從“推理”到“知識”、從“知識”到“學(xué)習(xí)”的重要過程,機(jī)器學(xué)習(xí)一直在人工智能的道路上解決問題。機(jī)器學(xué)習(xí)不是一個單一的學(xué)科,而是與數(shù)學(xué)、計算機(jī)、生物學(xué)等多領(lǐng)域有交叉的學(xué)科。機(jī)器學(xué)習(xí)目前不僅應(yīng)用在搜索引擎中,在生物特征識別、生物醫(yī)學(xué)研究、證券分析等里領(lǐng)域都有深入應(yīng)用,并取得了不錯的成績。
從另外一個角度看待機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)的“學(xué)習(xí)”意味著機(jī)器學(xué)習(xí)的算法嘗試沿著某個維度進(jìn)行優(yōu)化,可以理解為它們通常嘗試以最小的錯誤率來最大限度地發(fā)揮其預(yù)測的可能性。因此產(chǎn)生了三個名稱:錯誤函數(shù)、損失函數(shù)以及目標(biāo)函數(shù),因為每一個機(jī)器學(xué)習(xí)算法都有一個學(xué)習(xí)目標(biāo)。
項目或工程中使用機(jī)器學(xué)習(xí)算法時,可以通過確定輸入、輸出以及目標(biāo)函數(shù)和最小錯誤率來評估其算法的作用與效果。
對于機(jī)器學(xué)習(xí)算法中的輸入和輸出,通常情況下,初步測試的輸入與輸出的對應(yīng)結(jié)果都是錯誤的,如果擁有與輸入有關(guān)的輸出結(jié)果對應(yīng)關(guān)系,那么可以通過與期望的輸出結(jié)果對比來衡量猜測的準(zhǔn)確度,然后使用該錯誤來修改算法,這是有監(jiān)督學(xué)習(xí)的常見方式。它們不斷估算輸出結(jié)果并修改估算過程的參數(shù),直到錯誤率達(dá)到極值。
2.神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)(ArTIficial Neural Network)是機(jī)器學(xué)習(xí)的一個重要算法,也是奠定深度學(xué)習(xí)發(fā)展的基礎(chǔ)算法,它的思想影響了深度學(xué)習(xí),使得深度學(xué)習(xí)成為人工智能中極為重要的技術(shù)之一。
神經(jīng)網(wǎng)絡(luò)作為一種常用的方法,是一種通過模仿生物的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的數(shù)學(xué)模型,也是一種自適應(yīng)的計算模型。它通過感知外部信息的變化來改變系統(tǒng)的內(nèi)部結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)由許多的神經(jīng)元組成,神經(jīng)元之間相互聯(lián)系構(gòu)成信息處理的龐大網(wǎng)絡(luò)。假設(shè)做一件事情有多種途徑,那么神經(jīng)網(wǎng)絡(luò)會告知設(shè)計者哪一種途徑是最佳方式。
神經(jīng)網(wǎng)絡(luò)的優(yōu)勢在于它是一個能夠通過現(xiàn)有數(shù)據(jù)進(jìn)行自我學(xué)習(xí)、總結(jié)、歸納的系統(tǒng),能夠推理產(chǎn)生一個智能識別系統(tǒng),從而成為人工智能技術(shù)中的重要基石。
3.深度學(xué)習(xí)
深度學(xué)習(xí)(Deep Learning)是機(jī)器學(xué)習(xí)的重要分支,也是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的重要延伸。深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)已有很多,例如深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)等。作為多層非線性神經(jīng)網(wǎng)絡(luò)模型,它擁有強(qiáng)大的學(xué)習(xí)能力,通過與大數(shù)據(jù)、云計算和GPU 并行計算相結(jié)合,它在圖形圖像、視覺、語音等方面均獲得較好成就,遠(yuǎn)遠(yuǎn)超越了傳統(tǒng)機(jī)器學(xué)習(xí)的效果,因此深度學(xué)習(xí)被大眾視為人工智能前進(jìn)的重要一步。2016 年3 月,以深度學(xué)習(xí)為基礎(chǔ)的人工智能圍棋應(yīng)用AlphaGo 在圍棋比賽中戰(zhàn)勝人類圍棋高手,成為熱議話題。
深度學(xué)習(xí)目前在圖像處理、語音識別、生物特征識別等領(lǐng)域中已經(jīng)獲得了廣泛的應(yīng)用,并得到行業(yè)較高評價,這使得深度學(xué)習(xí)持續(xù)發(fā)展,加速推進(jìn)人工智能的發(fā)展。
深度學(xué)習(xí)與機(jī)器學(xué)習(xí)的關(guān)系
在以往,絕大多數(shù)的機(jī)器學(xué)習(xí)方式都是淺層結(jié)構(gòu),即使采用非線性處理的方式,這些淺層結(jié)構(gòu)的深度往往也不會太深,這種狀況在近十年左右才得以改變;隨著計算能力的增強(qiáng),計算的深度也在不斷增加。
機(jī)器學(xué)習(xí)中常見的淺層結(jié)構(gòu)包括高斯混合模型、支持向量機(jī)、最大熵模型、邏輯回歸、多層感知器,等等。實踐不斷告訴我們,淺層結(jié)構(gòu)在解決一些簡單問題時效果比較明顯,但是對于處理復(fù)雜多變的問題,例如語音、視頻等則效果較差。
深度學(xué)習(xí)的基礎(chǔ)研究源自神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)中最為常見的是前饋型神經(jīng)網(wǎng)絡(luò),倘若具備多隱藏層則可以被稱作深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network)。深度神經(jīng)網(wǎng)絡(luò)能夠顯著提升問題的處理效果,雖然目前訓(xùn)練過程中需要強(qiáng)大的計算能力,但是借助GPU 以及分布式計算,可以在保障效果的前提下有效提升計算效率。
深度學(xué)習(xí)可以處理任何類型的數(shù)據(jù),例如:
(1)聲音。主要針對語音識別、語音合成、語音模擬等。
(2)文本。包含自然語言處理、自然語言生成等。
(3)圖像。針對計算機(jī)視覺領(lǐng)域,包括圖像分類、圖像目標(biāo)檢測、圖像語義分割等。
(4)時間序列。主要在數(shù)據(jù)傳感、關(guān)聯(lián)事件分析等細(xì)分領(lǐng)域。
(5)視頻。主要在視頻內(nèi)容理解,智能視頻廣告等領(lǐng)域。
深度學(xué)習(xí)可以解決幾乎任何機(jī)器感知的問題,包括對數(shù)據(jù)進(jìn)行分類、聚類或?qū)ζ溥M(jìn)行預(yù)測分析。
(1)分類:例如對垃圾郵件和非垃圾郵件的歸檔處理。
(2)聚類:例如對相似性較高的文檔進(jìn)行歸檔處理。
(3)預(yù)測:例如根據(jù)歷年的氣象數(shù)據(jù)和最近的天氣變化預(yù)測未來一周的天氣情況。
深度學(xué)習(xí)非常適用于非結(jié)構(gòu)化數(shù)據(jù),例如上面提到的圖像、視頻、聲音以及文本等。一個圖像是像素的組合,一個消息是文字的組合。這些數(shù)據(jù)沒有按行和列組織在典型的關(guān)系數(shù)據(jù)庫中,這使得淺層結(jié)構(gòu)的機(jī)器學(xué)習(xí)方式對其進(jìn)行特征分析相對較為困難。深度學(xué)習(xí)的常用用例包括情感分析、圖像分類、預(yù)測分析、推薦系統(tǒng)、異常檢測等。
深度學(xué)習(xí)與人工智能的關(guān)系從開篇的包含圖中,已知深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個子集,而機(jī)器學(xué)習(xí)又是人工智能的一個子集,因此深度學(xué)習(xí)是人工智能的一個子技術(shù)分支。
智能程序是一種廣泛應(yīng)用的計算機(jī)智能程序,它可以通過一系列的條件判斷形成,但是這樣的智能程序往往很容易理解,因此智能程序不能視作當(dāng)前的人工智能。人工智能是面向數(shù)據(jù)深入地分析結(jié)果,結(jié)果的推測過程不是人為可快速推測的,而是需要計算機(jī)輔助完成。深度學(xué)習(xí)則是借助計算機(jī)完成的、較好的人工智能技術(shù)。
既然機(jī)器學(xué)習(xí)是人工智能的技術(shù)分支,那么總有部分算法或模型屬于人工智能領(lǐng)域但是不屬于機(jī)器學(xué)習(xí)領(lǐng)域,例如規(guī)則引擎、專家系統(tǒng)、進(jìn)化算法等,它們都屬于人工智能的技術(shù)體系,但并不是機(jī)器學(xué)習(xí)。
深度學(xué)習(xí)是人工智能一個技術(shù)子集。深度神經(jīng)網(wǎng)絡(luò)在一系列重要領(lǐng)域,例如圖像識別、聲音識別、推薦系統(tǒng)等不斷刷新各項指標(biāo),甚至超越了人類的認(rèn)知范圍。由DeepMind 研發(fā)的著名人工智能程序AlphaGo,在2016 年擊敗了前世界圍棋冠軍李世乭,這也是深度學(xué)習(xí)技術(shù)對各領(lǐng)域影響的場景之一。
深度學(xué)習(xí)中的“深”是一個技術(shù)術(shù)語,一般而言,它指的是神經(jīng)網(wǎng)絡(luò)中的層數(shù)。一個淺層網(wǎng)絡(luò)有一個所謂的隱藏層,而一個深層網(wǎng)絡(luò)則有一個以上。對于一般簡單的數(shù)據(jù)特征,它會從網(wǎng)絡(luò)層的一層傳遞到下一層用映射關(guān)系表示,而深度神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu)可以表達(dá)更為復(fù)雜的數(shù)據(jù)映射關(guān)系,以表示更復(fù)雜的特征。人工智能面向的問題也具備多層次數(shù)據(jù)的復(fù)雜特征,因此深度學(xué)習(xí)有效地解決了目前各行各業(yè)中的部分復(fù)雜問題。