人工智能和機(jī)器學(xué)習(xí)與深度學(xué)習(xí)之間是怎樣的關(guān)系
掃描二維碼
隨時(shí)隨地手機(jī)看文章
人工智能?機(jī)器學(xué)習(xí)?深度學(xué)習(xí)?安全界用辭令人困惑,了解主要用語真正的意義,方可在信息安全的世界中游走自如。
在熱情的市場營銷人員口中,“人工智能”、“機(jī)器學(xué)習(xí)” 和 “深度學(xué)習(xí)” 的定義變得模糊,明確性讓位于增加銷量的需要??蛻敉耆锌赡苡龅劫N著多個(gè)此類標(biāo)簽,卻幾乎不具備這些特性的產(chǎn)品或服務(wù)。
機(jī)器智能的話題常會(huì)落入其獨(dú)特的術(shù)語和專業(yè)概念無底洞。這些術(shù)語將構(gòu)成未來安全基礎(chǔ)設(shè)施中的重要部分,其間區(qū)別真的重要嗎?
三個(gè)分支
總的說來,機(jī)器 “智能” 就是一套系統(tǒng),攝入數(shù)據(jù),產(chǎn)出結(jié)果,并且隨著數(shù)據(jù)攝入量的增加而不斷變得更好、更快。整個(gè)機(jī)器 “智能” 大類下有三個(gè)標(biāo)簽常被貼到系統(tǒng)上:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人工智能。每一種都有其獨(dú)有的數(shù)據(jù)處理方式和結(jié)果呈現(xiàn)方式。
這三種方式在運(yùn)行機(jī)制上的差異使得它們分別適用于不同的任務(wù)。而其間最為突出的差別存在于人工智能 (AI) 和其他兩種之間。簡單講,AI 的結(jié)果能令你震驚,而其他兩種則“只”能讓你驚異于其速度和準(zhǔn)確性。
機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)采用靜態(tài)模型(營銷人員口中的 “啟發(fā)式方法”)而非僵化的算法編程來獲得結(jié)果。從稍微不同的角度觀察,機(jī)器學(xué)習(xí)可以運(yùn)用大量輸入來獲得特定的結(jié)果集。
市面上很多技術(shù)都可以歸到機(jī)器學(xué)習(xí)上來。比如監(jiān)督和非監(jiān)督式學(xué)習(xí)、異常檢測,以及關(guān)聯(lián)規(guī)則。以上幾種技術(shù)中,機(jī)器學(xué)習(xí)都可以從中輸入新的學(xué)習(xí)樣本,讓其作為動(dòng)作依據(jù)的算法模型更加豐富、全面、準(zhǔn)確。
所以,關(guān)鍵就在于 “特定結(jié)果集”。比如說,如果你想讓機(jī)器學(xué)習(xí)系統(tǒng)分辨貓和狗,你可以教它各種用于定義貓和狗的參數(shù)。越多數(shù)據(jù)用于構(gòu)建模型,該系統(tǒng)就越能準(zhǔn)確區(qū)分貓和狗,最終能夠基于耳朵或尾巴分辨目標(biāo)對象是貓還是狗。但即使你拿出的是一只鵝,該系統(tǒng)也會(huì)告訴你是一條狗還是一只貓,因?yàn)榕袛嘟Y(jié)果就只有這兩種選擇。
如果目標(biāo)是分類多種輸入,或者指示要采取的特定動(dòng)作以完成自動(dòng)化過程,那么機(jī)器學(xué)習(xí)就是非常合適的一種技術(shù)。
深度學(xué)習(xí)
深度學(xué)習(xí)歸屬機(jī)器學(xué)習(xí)范疇,但是其中尤為特別的一類。“深度學(xué)習(xí)” 表明神經(jīng)網(wǎng)絡(luò)屬于處理技術(shù)大家族。盡管神經(jīng)網(wǎng)絡(luò)面世已久,但最近十年的發(fā)展才令該技術(shù)更貼近應(yīng)用開發(fā)人員。
如今的神經(jīng)網(wǎng)絡(luò)基本上采用層次化技術(shù)在多個(gè)處理層間傳遞輸入。這是神經(jīng)網(wǎng)絡(luò)模擬動(dòng)物智能的一種方式。這種擬態(tài)使深度學(xué)習(xí)適用于為數(shù)不少的一系列應(yīng)用。
安全之外的語音識(shí)別和圖像識(shí)別應(yīng)用就常建立在深度學(xué)習(xí)技術(shù)之上。而在安全領(lǐng)域,深度學(xué)習(xí)常見于惡意軟件檢測和威脅檢測系統(tǒng)。因?yàn)樯窠?jīng)網(wǎng)絡(luò)節(jié)點(diǎn)間的連接數(shù)量(從幾百個(gè)到數(shù)百萬個(gè)不等),學(xué)習(xí)和處理主要發(fā)生在中央云系統(tǒng),而學(xué)習(xí)結(jié)果應(yīng)用在網(wǎng)絡(luò)邊界的那類應(yīng)用,常會(huì)用到深度學(xué)習(xí)技術(shù)。
沿用前文中舉的貓狗分辨例子,深度學(xué)習(xí)也能夠?qū)W習(xí)如何分辨貓和狗,經(jīng)訓(xùn)練后能判斷狗和貓的品系,甚至能達(dá)到根據(jù)外貌特征給雜種狗指派可能品系的程度。但,深度學(xué)習(xí)仍然只局限在分辨貓狗上,可憐的大鵝依然不存在于深度學(xué)習(xí)的結(jié)果集中。
人工智能
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)系統(tǒng)都是不斷攝入大量數(shù)據(jù),返回特定參數(shù)集范圍內(nèi)的結(jié)果。所以,這兩種技術(shù)便于集成到自動(dòng)化系統(tǒng)中。人工智能則不然,其得出的結(jié)論可能超出定義的參數(shù)。人工智能拿出的結(jié)果會(huì)令你驚訝。
若咨詢學(xué)術(shù)界 AI 研究員,他們會(huì)說市面上的 AI 都不“真” AI。他們的意思其實(shí)是當(dāng)前不存在通用 AI ——《太空漫游 2001》里 HAL 9000 那種人工智能電腦。
但是,可針對特定問題應(yīng)用先進(jìn)智能的 AI 系統(tǒng)是存在的。IBM 的 Watson 就是其中最為知名的,但還有其他很多特定于應(yīng)用的 AI 引擎為各供應(yīng)商所用。“深度偽造” (deep fake) 音視頻引發(fā)的廣泛擔(dān)憂,也是不同應(yīng)用和服務(wù)中所用 AI 功能催生的。機(jī)器人,包括自動(dòng)駕駛汽車,則是另一個(gè)例子。
AI 系統(tǒng)應(yīng)能納入深度學(xué)習(xí)中建立的所有模型信息并加以延伸。再給多一點(diǎn)信息,AI 系統(tǒng)還可能分辨新圖像是哺乳動(dòng)物還是其他種類的動(dòng)物,即便呈現(xiàn)在眼前的是消防栓的圖片,AI 系統(tǒng)也能告訴人類操作員這是從未見過的新 “動(dòng)物”,需要更多學(xué)習(xí)。AI 的結(jié)果可能跳出給定的結(jié)果集。
網(wǎng)絡(luò)安全領(lǐng)域里,分析師用 AI 幫助篩選和分類每天涌入安全運(yùn)營中心 (SOC) 的大量輸入數(shù)據(jù)。需要指出的是,現(xiàn)今非預(yù)期結(jié)果出現(xiàn)的可能性意味著,AI 是用來輔助或增強(qiáng)人類分析師的,不僅僅用于驅(qū)動(dòng)安全自動(dòng)化。
天網(wǎng)預(yù)備役
面對以上幾種機(jī)器智能,操作人員必須警惕兩大問題,其中一個(gè)問題由內(nèi)部力量驅(qū)動(dòng),另一個(gè)問題則受外因推動(dòng)。內(nèi)部問題是所謂的 “模型偏好”——系統(tǒng)模型中用于學(xué)習(xí)的數(shù)據(jù)會(huì)使模型偏向特定分析方向,而不是由系統(tǒng)自然得出數(shù)理上正確的答案。
外部問題則源自 “模型中毒”,也就是有外部因素確保模型得出不正確的結(jié)果。取決于應(yīng)用,中毒可導(dǎo)致令人尷尬或?yàn)?zāi)難性的結(jié)果,IT 或安全人員必須警惕這種可能性。
來源:安全牛