當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀]   看著人工智能技術(shù)如此火爆,在這方面的船業(yè)者也是層出不窮。然而,在學習的過程中就遇到了一對雙胞胎機器學習和深度學習,是不是還在傻傻的分不清啊,其實他們區(qū)別大著呢。   為了展示他們的火

  看著人工智能技術(shù)如此火爆,在這方面的船業(yè)者也是層出不窮。然而,在學習的過程中就遇到了一對雙胞胎機器學習和深度學習,是不是還在傻傻的分不清啊,其實他們區(qū)別大著呢。

  為了展示他們的火熱程度,我在 Google trend 上搜索了這些關(guān)鍵字:

  

  如果你想讓自己弄清楚機器學習和深度學習的區(qū)別,請閱讀本篇文章,我將用通俗易懂的語言為你介紹他們之間的差別。下文詳細解釋了機器學習和深度學習中的術(shù)語。并且,我比較了他們兩者的不同,別說明了他們各自的使用場景。

  什么是機器學習和深度學習?

  讓我們從基礎知識開始:什么是機器學習?和什么是深度學習?如果你對此已有所了解,隨時可以跳過本部分。

  什么是機器學習?

  一言以蔽之,由 Tom Mitchell 給出的被廣泛引用的機器學習的定義給出了最佳解釋。下面是其中的內(nèi)容:

  “計算機程序可以在給定某種類別的任務 T 和性能度量 P 下學習經(jīng)驗 E ,如果其在任務 T 中的性能恰好可以用 P 度量,則隨著經(jīng)驗 E 而提高。”

  是不是讀起來很繞口呢?讓我們用簡單的例子來分解下這個描述。

  示例 1:機器學習和根據(jù)人的身高估算體重

  假設你想創(chuàng)建一個能夠根據(jù)人的身高估算體重的系統(tǒng)(也許你出自某些理由對這件事情感興趣)。那么你可以使用機器學習去找出任何可能的錯誤和數(shù)據(jù)捕獲中的錯誤,首先你需要收集一些數(shù)據(jù),讓我們來看看你的數(shù)據(jù)是什么樣子的:

  

  圖中的每一個點對應一個數(shù)據(jù),我們可以畫出一條簡單的斜線來預測基于身高的體重

  例如這條斜線:

  Weight (in kg) = Height (in cm) - 100

  。。。這些斜線能幫助我們作出預測,盡管這些斜線表現(xiàn)得很棒,但是我們需要理解它是怎么表現(xiàn)的,我們希望去減少預測和實際之間的誤差,這也是衡量其性能的方法。

  深遠一點地說,我們收集更多的數(shù)據(jù) (experience),模型就會變得更好。我們也可以通過添加更多變量(例如性別)和添加不同的預測斜線來完善我們的模型。

  示例2:颶風預測系統(tǒng)

  我們找一個復雜一點的例子。假如你要構(gòu)建一個 颶風預測系統(tǒng) 。假設你手里有所有以前發(fā)生過的颶風的數(shù)據(jù)和這次颶風產(chǎn)生前三個月的天氣信息。

  如果要手動構(gòu)建一個颶風預測系統(tǒng),我們應該怎么做?

  

  首先我們的任務是清洗所有的數(shù)據(jù)找到數(shù)據(jù)里面的模式進而查找產(chǎn)生颶風的條件。

  我們既可以將模型條件數(shù)據(jù)(例如氣溫高于40度,濕度在80-100等)輸入到我們的系統(tǒng)里面生成輸出;也可以讓我們的系統(tǒng)自己通過這些條件數(shù)據(jù)產(chǎn)生合適的輸出。

  我們可以把所有以前的數(shù)據(jù)輸入到系統(tǒng)里面來預測未來是否會有颶風?;谖覀兿到y(tǒng)條件的取值,評估系統(tǒng)的性能(系統(tǒng)正確預測颶風的次數(shù))。我們可以將系統(tǒng)預測結(jié)果作為反饋繼續(xù)多次迭代以上步驟。

  讓我們根據(jù)前邊的解釋來定義我們的預測系統(tǒng):我們的任務是確定可能產(chǎn)生颶風的氣象條件。性能P是在系統(tǒng)所有給定的條件下有多少次正確預測颶風。經(jīng)驗E是我們的系統(tǒng)的迭代次數(shù)。

  什么是深度學習?

  深度學習的概念并不新穎。它已經(jīng)存在好幾年了。但伴隨著現(xiàn)有的所有的炒作,深度的學習越來越受到重視。正如我們在機器學習中所做的那樣,先來看看深度學習的 官方定義 ,然后用一個例子來解釋。

  “深度學習是一種特殊的機器學習,通過學習將世界使用嵌套的概念層次來表示并實現(xiàn)巨大的功能和靈活性,其中每個概念都定義為與簡單概念相關(guān)聯(lián),而更為抽象的表示則以較不抽象的方式來計算。”

  這也有點讓人混亂。下面使用一個簡單示例來分解下此概念。

  示例1: 形狀檢測

  先從一個簡單的例子開始,從概念層面上解釋究竟發(fā)生了什么的事情。我們來試試看如何從其他形狀中識別的正方形。

  

  我們眼中的第一件事是檢查圖中是否有四條的線(簡單的概念)。如果我們找到這樣的四條線,我們進一步檢查它們是相連的、閉合的和相互垂直的,并且它們是否是相等的(嵌套的概念層次結(jié)構(gòu))。

  所以,我們完成了一個復雜的任務(識別一個正方形),并以簡單、不太抽象的任務來完成它。深度學習本質(zhì)上在大規(guī)模執(zhí)行類似邏輯。

  示例2: 貓 vs. 狗

  我們舉一個動物辨識的例子,其中我們的系統(tǒng)必須識別給定的圖像中的動物是貓還是狗。

  機器學習和深度學習的對比

  現(xiàn)在的你應該已經(jīng)對機器學習和深度學習有所了解,接下來我們將會學習其中一些重點,并比較兩種技術(shù)。

  數(shù)據(jù)依賴性

  深度學習與傳統(tǒng)的機器學習最主要的區(qū)別在于隨著數(shù)據(jù)規(guī)模的增加其性能也不斷增長。當數(shù)據(jù)很少時,深度學習算法的性能并不好。這是因為深度學習算法需要大量的數(shù)據(jù)來完美地理解它。另一方面,在這種情況下,傳統(tǒng)的機器學習算法使用制定的規(guī)則,性能會比較好。下圖總結(jié)了這一事實。

  

  硬件依賴

  深度學習算法需要進行大量的矩陣運算,GPU 主要用來高效優(yōu)化矩陣運算,所以 GPU 是深度學習正常工作的必須硬件。與傳統(tǒng)機器學習算法相比,深度學習更依賴安裝 GPU 的高端機器。

  特征處理

  特征處理 是將領(lǐng)域知識放入特征提取器里面來減少數(shù)據(jù)的復雜度并生成使學習算法工作的更好的模式的過程。特征處理過程很耗時而且需要專業(yè)知識。

  在機器學習中,大多數(shù)應用的特征都需要專家確定然后編碼為一種數(shù)據(jù)類型。

  特征可以使像素值、形狀、紋理、位置和方向。大多數(shù)機器學習算法的性能依賴于所提取的特征的準確度。

  深度學習嘗試從數(shù)據(jù)中直接獲取高等級的特征,這是深度學習與傳統(tǒng)機器學習算法的主要的不同。基于此,深度學習削減了對每一個問題設計特征提取器的工作。例如, 卷積神經(jīng)網(wǎng)絡 嘗試在前邊的層學習低等級的特征(邊界,線條),然后學習部分人臉,然后是高級的人臉的描述。更多信息可以閱讀 神經(jīng)網(wǎng)絡機器在深度學習里面的有趣應用 。

  

  問題解決方式

  當應用傳統(tǒng)機器學習算法解決問題的時候,傳統(tǒng)機器學習通常會將問題分解為多個子問題并逐個子問題解決最后結(jié)合所有子問題的結(jié)果獲得最終結(jié)果。相反,深度學習提倡直接的端到端的解決問題。

  舉例說明:

  假設有一個 多物體檢測 的任務需要圖像中的物體的類型和各物體在圖像中的位置。

  

  傳統(tǒng)機器學會將問題分解為兩步:物體檢測和物體識別。首先,使用一個邊界框檢測算法掃描整張圖片找到可能的是物體的區(qū)域;然后使用物體識別算法(例如 SVM 結(jié)合 HOG )對上一步檢測出來的物體進行識別。

  相反,深度學習會直接將輸入數(shù)據(jù)進行運算得到輸出結(jié)果。例如可以直接將圖片傳給 YOLO 網(wǎng)絡 (一種深度學習算法),YOLO 網(wǎng)絡會給出圖片中的物體和名稱。

  執(zhí)行時間

  通常情況下,訓練一個深度學習算法需要很長的時間。這是因為深度學習算法中參數(shù)很多,因此訓練算法需要消耗更長的時間。最先進的 深度學習算法 ResNet 完整地訓練一次需要消耗兩周的時間,而機器學習的訓練會消耗 的時間 相對較少,只需要幾秒鐘到幾小時的時間。

  但兩者測試的時間上是完全相反。深度學習算法在測試時只需要很少的時間去運行。如果跟 k-nearest neighbors (一種機器學習算法)相比較,測試時間會隨著數(shù)據(jù)量的提升而增加。不過這不適用于所有的機器學習算法,因為有些機器學習算法的測試時間也很短。

  可解釋性

  至關(guān)重要的一點,我們把可解釋性作為比較機器學習和深度學習的一個因素。

  我們看個例子。假設我們適用深度學習去自動為文章評分。深度學習可以達到接近人的標準,這是相當驚人的性能表現(xiàn)。但是這仍然有個問題。深度學習算法不會告訴你為什么它會給出這個分數(shù)。當然,在數(shù)學的角度上,你可以找出來哪一個深度神經(jīng)網(wǎng)絡節(jié)點被激活了。但是我們不知道神經(jīng)元應該是什么模型,我們也不知道這些神經(jīng)單元層要共同做什么。所以無法解釋結(jié)果是如何產(chǎn)生的。

  另一方面,為了解釋為什么算法這樣選擇,像決策樹( decision trees )這樣機器學習算法給出了明確的規(guī)則,所以解釋決策背后的推理是很容易的。因此,決策樹和線性/ 邏輯回歸 這樣的算法主要用于工業(yè)上的可解釋性。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉