機(jī)器學(xué)習(xí):你應(yīng)該知道多少
直到目前為止,要在電腦上完成一個(gè)最簡單的任務(wù)仍然需要極其復(fù)雜且精確的指令說明。
我們身邊還有誰記得如何用穿孔卡片編程嗎?又有誰還會使用DOS呢?
計(jì)算機(jī)編程語言已經(jīng)經(jīng)過了多年的發(fā)展,但現(xiàn)在需要跨越的最大一步就是消除復(fù)雜編程。換句話說,教會計(jì)算機(jī)自學(xué)就被稱為機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)是一種非常有前景的技術(shù),它的能力是飛躍性的提升,在不久的將來會實(shí)實(shí)在在、潛移默化地影響我們每個(gè)人和每個(gè)領(lǐng)域。正因如此,有幾件事我認(rèn)為每個(gè)人都應(yīng)該了解。
| 是什么
不同于以往準(zhǔn)確地指示計(jì)算機(jī)應(yīng)該如何執(zhí)行才能解決問題,在使用機(jī)器學(xué)習(xí)時(shí),程序員無需告訴它應(yīng)該如何學(xué)習(xí)才能解決問題。
機(jī)器學(xué)習(xí)在本質(zhì)上是非常高級的統(tǒng)計(jì)應(yīng)用,可以學(xué)習(xí)如何識別數(shù)據(jù)模式,并根據(jù)這些模式做出預(yù)測。如果感動興趣的話可以打開此處網(wǎng)站鏈接,有一個(gè)關(guān)于機(jī)器學(xué)習(xí)工作原理的可視化介紹。
機(jī)器學(xué)習(xí)的研究早在1950年代就開始了,當(dāng)時(shí)的計(jì)算機(jī)科學(xué)家想出了如何教計(jì)算機(jī)下棋。在那之后,隨著計(jì)算能力的提高,計(jì)算機(jī)能夠識別復(fù)雜的模式,也因此可以做出預(yù)測和解決問題。
機(jī)器學(xué)習(xí)算法通常會給出一套“教學(xué)”的數(shù)據(jù),然后要求通過這些數(shù)據(jù)來回答問題。例如,你可能提供了一組用于計(jì)算機(jī)教學(xué)的照片,其中某些會說“這是一只貓”,另一些會說“這不是一只貓”。然后你可以向計(jì)算機(jī)展示一系列的新照片,它就會開始自己判斷哪些是貓的照片。
機(jī)器學(xué)習(xí)就是在不斷地加大其“教學(xué)”數(shù)據(jù)集,無論判斷對錯(cuò),每張被辨識過的照片都會被添加到數(shù)據(jù)集中,這樣程序就會變得越來越“聰明”,也能更好地完成其任務(wù)。
實(shí)際上,這就是學(xué)習(xí)過程。
| 有何魅力
計(jì)算機(jī)現(xiàn)在可以大膽地進(jìn)入任何一個(gè)與我們息息相關(guān)的領(lǐng)域。雖然技術(shù)在許多情況下還不完善,但因?yàn)闄C(jī)器學(xué)習(xí)特殊的概念,可以不知疲倦地不斷提高其性能,理論上沒有天花板上,只會變得越來越好。
如我們之前舉的貓的照片的例子,計(jì)算機(jī)現(xiàn)在可以“看見”圖片并對其分類,還可以“閱讀”圖中的文字和數(shù)字,甚至是識別某個(gè)人或某個(gè)地方。他們不僅是有閱讀文本的能力,也能通過理解上下文判斷代表的情緒是積極的還是消極的。
除此之外,計(jì)算機(jī)還會能傾聽、理解并回應(yīng)我們。你口袋里的虛擬助手也許是Siri、Cortana,又或者是谷歌助手。這代表了計(jì)算機(jī)在理解人類自然語言的能力方面實(shí)現(xiàn)了一個(gè)重大飛躍,而且還在不斷改善中。
計(jì)算機(jī)現(xiàn)在還學(xué)會了書寫,機(jī)器學(xué)習(xí)算法已被用于撰寫一些日常的新聞文章,主要是需要大量數(shù)據(jù)的領(lǐng)域,比如財(cái)務(wù)、運(yùn)動報(bào)告。這會廣泛影響包括數(shù)據(jù)錄入和分類等需要人工干預(yù)的任務(wù)。如果一臺計(jì)算機(jī)可以識別一些東西——比如一個(gè)圖像,一個(gè)文檔,一個(gè)文件等等,如果描述準(zhǔn)確,就可能有很多自動化方面的用途。
| 應(yīng)用現(xiàn)狀
人們已經(jīng)可以利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)很多令人興奮的事情了。
最近有一項(xiàng)關(guān)于使用計(jì)算機(jī)進(jìn)行輔助診斷(CAD)的研究,分析了乳腺癌女性患者的早期掃描結(jié)果,結(jié)果證明計(jì)算機(jī)將其中52% 的確診時(shí)間提早了一年左右。并且,基于龐大的人口數(shù),機(jī)器學(xué)習(xí)可以學(xué)習(xí)理解其中的致病因子。Medecision公司發(fā)明了一種算法可以讓它定位并識別 8種信號,能讓糖尿病患者避免不必要的住院治療。
另外,想必你有過這樣的經(jīng)驗(yàn),某次在線上商店逛完后卻沒有剁手,不過往后的幾天,網(wǎng)頁四周到處掛著你曾經(jīng)搜過的關(guān)鍵字推薦廣告,這些都只是機(jī)器學(xué)習(xí)應(yīng)用的冰山一角。其它情況,諸如商業(yè)公司給顧客寄優(yōu)惠券、提供產(chǎn)品介紹、推薦新品的時(shí)候,都可以發(fā)揮“個(gè)性化定制”的超級算法,這一切都只有一個(gè)小目的,那就是推薦消費(fèi)者更加容易青睞的商品。
自然語言處理(NLP)正在被用到各種跨學(xué)科的新奇應(yīng)用中。使用自然語言的機(jī)器學(xué)習(xí)算法可以替代客服專員,并且能夠更快地告知客戶們所需要的信息。它也被用來將合同中晦澀難懂的措辭轉(zhuǎn)化為平實(shí)的語言文字,幫助律師們在準(zhǔn)備案子時(shí)整理大量的資料信息。
IBM 最近在頂級汽車廠商的高管們中進(jìn)行了調(diào)查,他們中有 74% 的人預(yù)計(jì)在 2025 年之前我們就能看到智能汽車行駛在路面上。
智能汽車不但能融入整個(gè)物聯(lián)網(wǎng)系統(tǒng)中,還能對它的主人和周圍環(huán)境進(jìn)行學(xué)習(xí)。它能根據(jù)駕駛員信息資料調(diào)整自身內(nèi)部設(shè)置(溫度、音樂、座椅位置等),甚至可以自動修復(fù)問題,還能自動駕駛,也能根據(jù)交通和道路情況提供實(shí)時(shí)建議。
| 未來發(fā)展
機(jī)器學(xué)習(xí)帶給我們的想象空間是巨大的,其中一些令人興奮的可能性包括:
個(gè)性化醫(yī)療,根據(jù)基因組成和生活方式為用戶創(chuàng)建獨(dú)一無二的醫(yī)療護(hù)理和治療計(jì)劃。
數(shù)據(jù)安全,程序可以高度準(zhǔn)確地自動檢測惡意軟件、病毒和攻擊。
計(jì)算機(jī)輔助安全,在機(jī)場和體育場館等公共場所可以預(yù)測威脅人員,并檢查安檢人員錯(cuò)過事物。
自動駕駛汽車,可以自己導(dǎo)航,避免交通事故。
先進(jìn)的欺詐檢測,保護(hù)金融和保險(xiǎn)領(lǐng)域的資金安全。
甚至是一個(gè)“通用翻譯助手”,可以實(shí)時(shí)、準(zhǔn)確、迅速地翻譯你對手機(jī)或其他設(shè)備說的話。
| 和我有什么關(guān)系
對許多人來說,每當(dāng)技術(shù)進(jìn)步時(shí),他們僅僅是對新技術(shù)表示歡迎,不會太關(guān)心其工作原理和背后的使用場景。但我要提醒的是,我們都應(yīng)該關(guān)心機(jī)器學(xué)習(xí),因?yàn)樗鼘⒔o我們的生活帶來很多助益,還可能改變我們的勞動力結(jié)構(gòu)。
地球上的每個(gè)人幾乎都在產(chǎn)生越來越多的數(shù)據(jù),當(dāng)人們在工作中運(yùn)用機(jī)器學(xué)習(xí)來處理時(shí),一切都將被顛覆。是的,對許多人來說,這些新技術(shù)會使工作變得更加容易,但也可能淘汰掉許多工作。算法現(xiàn)在可以幫我們回復(fù)郵件、解釋醫(yī)學(xué)影像、找到勝訴的法律案例、分析我們的數(shù)據(jù)等等。
機(jī)器學(xué)習(xí)算法依賴于從過去的例子中“學(xué)習(xí)”經(jīng)驗(yàn),從而使程序員從無窮無盡的代碼中拯救出來,無需考慮各種意外情況。這種學(xué)習(xí)能力,再加上機(jī)器人技術(shù)和移動技術(shù)的優(yōu)越性,意味著計(jì)算機(jī)現(xiàn)在可以比以往任何時(shí)候都更快更好地幫助人類完成更加復(fù)雜的任務(wù)。
世界經(jīng)濟(jì)論壇提估算,在未來五年內(nèi)我們將有 500 萬個(gè)工作崗位被計(jì)算機(jī)和機(jī)器人所取代。
這意味著,不管你的工作是什么——從律師到診斷專家,從客戶服務(wù)代表到卡車司機(jī),都必須注意機(jī)器學(xué)習(xí)將會如何影響你所在的領(lǐng)域、你所接觸的業(yè)務(wù)和你所從事的工作。為了避免被計(jì)算機(jī)帶來的顛覆性震驚到,最好方法就是從現(xiàn)在開始積極地了解,做好準(zhǔn)備。