當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 摘要:當(dāng)技術(shù)像機(jī)器學(xué)習(xí)一樣被炒得沸沸揚(yáng)揚(yáng)時(shí),就會(huì)有許多誤解產(chǎn)生。以下是關(guān)于機(jī)器學(xué)習(xí)可以提供,或不能提供的清晰視角。       &nbs

摘要:當(dāng)技術(shù)像機(jī)器學(xué)習(xí)一樣被炒得沸沸揚(yáng)揚(yáng)時(shí),就會(huì)有許多誤解產(chǎn)生。以下是關(guān)于機(jī)器學(xué)習(xí)可以提供,或不能提供的清晰視角。
 


       當(dāng)技術(shù)像機(jī)器學(xué)習(xí)一樣被炒得沸沸揚(yáng)揚(yáng)時(shí),就會(huì)有許多誤解產(chǎn)生。以下是關(guān)于機(jī)器學(xué)習(xí)可以提供,或不能提供的清晰視角。

       機(jī)器學(xué)習(xí)被證明是非常有用的,人們很容易假設(shè)它可以解決所有問題并適用于所有情況。和其它工具一樣,機(jī)器學(xué)習(xí)在特定領(lǐng)域也很有用,特別是對(duì)于一直困擾著你,但你永遠(yuǎn)不會(huì)雇用足夠的人來解決的問題,或者對(duì)于有明確目標(biāo),但沒有明顯的實(shí)現(xiàn)方法的問題。

       盡管如此,每個(gè)組織都有可能以這樣或那樣的方式利用機(jī)器學(xué)習(xí),因?yàn)?2%的高管最近告訴埃森哲,他們預(yù)計(jì)人工智能將在2021年之前成為他們的創(chuàng)新的后盾。但是,只要你的視野能繞過炒作,并避免下面這些常見的誤解你會(huì)得到更好的成果——通過了解機(jī)器學(xué)習(xí)可以實(shí)現(xiàn)和不能實(shí)現(xiàn)的機(jī)制。

迷思:機(jī)器學(xué)習(xí)就是人工智能

       機(jī)器學(xué)習(xí)和人工智能經(jīng)常被用作同義詞,但機(jī)器學(xué)習(xí)是最成功地從研究實(shí)驗(yàn)室走出來,邁向現(xiàn)實(shí)世界的技術(shù),而人工智能則是一個(gè)廣泛的領(lǐng)域,它涵蓋計(jì)算機(jī)視覺、機(jī)器人技術(shù)和自然語言處理等領(lǐng)域,以及不涉及機(jī)器學(xué)習(xí)的約束滿足等方法。不妨把它看成是使機(jī)器變得智能的一切東西。這些都不是那種一般人所害怕的通用“人工智能”——可以與人競(jìng)爭(zhēng)甚至攻擊人類的東西。

       留意這些流行語并做到準(zhǔn)確無誤。機(jī)器學(xué)習(xí)是關(guān)于學(xué)習(xí)模式和預(yù)測(cè)大數(shù)據(jù)集的結(jié)果;結(jié)果可能看起來很“智能”,但其本質(zhì)事關(guān)以前所未有的速度和規(guī)模應(yīng)用統(tǒng)計(jì)數(shù)據(jù)。

迷思:是數(shù)據(jù)就有用

       機(jī)器學(xué)習(xí)需要數(shù)據(jù),但并非所有的數(shù)據(jù)都可用于機(jī)器學(xué)習(xí)。為了訓(xùn)練你的系統(tǒng),你需要有代表性的數(shù)據(jù),以涵蓋機(jī)器學(xué)習(xí)系統(tǒng)需要處理的模式和結(jié)果。你需要不含與模式不相關(guān)的數(shù)據(jù)(例如顯示這些內(nèi)容的照片——所有站立的男士和所有坐著的女士,或者所有車輛都在車庫中,所有自行車都在泥濘的場(chǎng)地中),因?yàn)槟闼鶆?chuàng)建的機(jī)器學(xué)習(xí)模型將反映那些過于具體的模式,并在你使用的數(shù)據(jù)中查找它們。所有用于訓(xùn)練的數(shù)據(jù)都需要注上正確的標(biāo)記,并注上上與你要問機(jī)器學(xué)習(xí)系統(tǒng)的問題相匹配的功能,這需要做很多工作。

       不要以為你已經(jīng)擁有的數(shù)據(jù)是干凈,清晰,有代表性或易于標(biāo)注的。

迷思:你總是需要很多數(shù)據(jù)

       最近在圖像識(shí)別、機(jī)器閱讀理解、語言翻譯和其它領(lǐng)域取得的主要進(jìn)展已經(jīng)發(fā)生了,因?yàn)橛辛烁玫墓ぞ?,可以并行處理大量?shù)據(jù)的GPU等計(jì)算硬件,以及大量已標(biāo)記的數(shù)據(jù)集,包括ImageNet和斯坦福問題回答數(shù)據(jù)集(Stanford QuesTIon Answering Dataset)。但是,由于有一種稱為遷移學(xué)習(xí)(transfer learning)的技巧,你并不總是需要大量數(shù)據(jù)才能在特定區(qū)域獲得良好結(jié)果。相反,你可以教機(jī)器學(xué)習(xí)系統(tǒng)如何使用一個(gè)大型數(shù)據(jù)集進(jìn)行學(xué)習(xí),然后將其遷移到屬于你自己的,更小的培訓(xùn)數(shù)據(jù)集的學(xué)習(xí)能力。這就是Salesforce和Microsoft Azure的自定義視覺API的工作原理:你只需要30到50張圖像即可顯示想要分類的內(nèi)容,以獲得良好結(jié)果。

       遷移學(xué)習(xí)可讓你使用相對(duì)較少的數(shù)據(jù)為你自己的問題定制預(yù)先訓(xùn)練好的系統(tǒng)。

迷思:是人都能創(chuàng)建機(jī)器學(xué)習(xí)系統(tǒng)

       市面上有很多用于機(jī)器學(xué)習(xí)的開源工具和框架,以及無數(shù)課程向你展示如何使用它們。但機(jī)器學(xué)習(xí)仍然是一項(xiàng)專門技術(shù);你要知道如何準(zhǔn)備數(shù)據(jù)并對(duì)其進(jìn)行分區(qū)以進(jìn)行訓(xùn)練和測(cè)試,你要知道如何選擇最佳算法以及使用何種啟發(fā)式算法,以及如何將其轉(zhuǎn)化為可靠的生產(chǎn)系統(tǒng)。你還要監(jiān)視系統(tǒng),以確保結(jié)果始終保持相關(guān)性;無論你的市場(chǎng)變革還是你的機(jī)器學(xué)習(xí)系統(tǒng)是否好得使你最終會(huì)遇到不同的客戶群,你需要繼續(xù)檢驗(yàn)該模型是否符合你的問題。

       要徹底把機(jī)器學(xué)習(xí)弄明白是需要經(jīng)驗(yàn);如果你剛剛開始使用API,則可以使用API預(yù)先訓(xùn)練模型,在獲取或聘用數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)專業(yè)知識(shí)來構(gòu)建定制系統(tǒng)時(shí),你可以從代碼中調(diào)用該模型。

迷思:數(shù)據(jù)中的所有模式都是有用的

       哮喘患者,胸痛或心臟病患者以及任何期頤之年的人的肺炎的存活率遠(yuǎn)高于你的期望。實(shí)際上,好到只要有一個(gè)簡(jiǎn)單的用來將入院程序自動(dòng)化的機(jī)器學(xué)習(xí)系統(tǒng)就可以讓他們安然無恙地回家(一種基于規(guī)則的,和神經(jīng)網(wǎng)絡(luò)一樣受訓(xùn)于相同的數(shù)據(jù)的系統(tǒng)就能做到這個(gè))。不幸的是,他們有如此高的存活率的原因是,他們總是立即入院,因?yàn)榉窝讓?duì)他們來說非常危險(xiǎn)。

       系統(tǒng)見證了數(shù)據(jù)中的有效的模式;這對(duì)于選擇讓誰入院來說并不是一種有用的模式(盡管它可以幫助保險(xiǎn)公司預(yù)測(cè)治療費(fèi)用)。更危險(xiǎn)的是,除非你已經(jīng)了解它們,否則你不會(huì)知道這些無用的反模式出現(xiàn)在你的數(shù)據(jù)集中。

       在其它情況下,一個(gè)系統(tǒng)可以學(xué)習(xí)一種有效的模式(比如爭(zhēng)議頗多的面部識(shí)別系統(tǒng),它可以準(zhǔn)確地從自拍照中預(yù)測(cè)性取向),然而它沒有清晰明確的解釋,所以沒有用(在這種情況下,照片看起來似乎顯示了姿勢(shì)這樣的社交線索而不是天生的任何東西)。

       “黑匣子”模型是高效的,但它沒有澄清他們到底學(xué)到了什么模式。像廣義加性模型(Generalized AddiTIve Model)這樣的更透明,可理解的算法可以更清楚地了解模型的學(xué)習(xí)內(nèi)容,從而讓你決定它是否適用于部署。

迷思:強(qiáng)化學(xué)習(xí)隨時(shí)可以使用

       幾乎所有當(dāng)今使用的機(jī)器學(xué)習(xí)系統(tǒng)都使用監(jiān)督學(xué)習(xí);在大多數(shù)情況下,他們接受了人類參與準(zhǔn)備的明確標(biāo)記的數(shù)據(jù)集的培訓(xùn)。管護(hù)這些數(shù)據(jù)集需要時(shí)間和精力,所以人們對(duì)非監(jiān)督形式的學(xué)習(xí),特別是強(qiáng)化學(xué)習(xí)(RL)有很大的興趣——在這里,艾真體(agent)通過試錯(cuò)法學(xué)習(xí),通過與環(huán)境交互并因?yàn)檎_的行為而獲得獎(jiǎng)勵(lì)。DeepMind的AlphaGo系統(tǒng)使用強(qiáng)化學(xué)習(xí)與監(jiān)督式學(xué)習(xí)一同戰(zhàn)勝了最高段位的圍棋選手,而由卡內(nèi)基梅隆大學(xué)的團(tuán)隊(duì)建立的系統(tǒng)Libratus使用強(qiáng)化學(xué)習(xí)和另外兩種人工智能技術(shù)在無限德州撲克擊敗了一部分世界上最好的撲克玩家(具有漫長(zhǎng)而復(fù)雜的投注策略)。研究人員正在用機(jī)器學(xué)習(xí)對(duì)一切進(jìn)行強(qiáng)化試驗(yàn)——從機(jī)器人技術(shù)到安全軟件的測(cè)試。

       強(qiáng)化學(xué)習(xí)在研究領(lǐng)域之外并不常見。谷歌使用DeepMind學(xué)習(xí)更高效地降低數(shù)據(jù)中心的溫度,從而節(jié)省數(shù)據(jù)中心的電力;微軟使用強(qiáng)化學(xué)習(xí)的一個(gè)特別版本,稱為上下文賭博機(jī)(contextual bandit),它為MSN.com的訪客定制個(gè)性化的新聞?lì)^條。問題在于很少有現(xiàn)實(shí)環(huán)境有可輕易發(fā)現(xiàn)的獎(jiǎng)勵(lì)和即時(shí)反饋,當(dāng)艾真體在發(fā)生任何事情之前采取多項(xiàng)行動(dòng)時(shí),分配獎(jiǎng)勵(lì)就尤其棘手了。

迷思:機(jī)器學(xué)習(xí)沒有偏差

       由于機(jī)器學(xué)習(xí)從數(shù)據(jù)中學(xué)習(xí),它將復(fù)制數(shù)據(jù)集中的任何偏差。搜尋首席執(zhí)行官的圖像可能會(huì)顯示白人男性首席執(zhí)行官的照片,因?yàn)橛懈嗟氖紫瘓?zhí)行官通常是白人男性。但事實(shí)證明,機(jī)器學(xué)習(xí)也會(huì)放大偏差。

       經(jīng)常用于訓(xùn)練圖像識(shí)別系統(tǒng)的COCO數(shù)據(jù)集具有男性和女性的照片;但更多的女性是在廚房設(shè)備旁邊得到展示,更多的男性則和電腦鍵盤和鼠標(biāo)或網(wǎng)球拍和滑雪板一起得到展示。在COCO上訓(xùn)練系統(tǒng),它會(huì)比原始照片中的統(tǒng)計(jì)數(shù)據(jù)更強(qiáng)烈地把男性和計(jì)算機(jī)硬件聯(lián)系起來。

       一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)也可能給另一個(gè)機(jī)器增加偏差。訓(xùn)練這樣一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)——它具有將單詞表征為向量的流行框架——來表示詞之間關(guān)系的向量,它將學(xué)習(xí)像“男人之于女人正如計(jì)算機(jī)程序員之于家庭主婦”或醫(yī)生之于護(hù)士正如老板之于前臺(tái)那樣的刻板印象。如果你使用這樣的系統(tǒng),這個(gè)系統(tǒng)把那些具有他和她這樣的代詞的語言(如英語)翻譯成具有中性代詞的語言(如芬蘭語或土耳其語),那么“他們是醫(yī)生”就會(huì)變成“他是醫(yī)生”,“他們是護(hù)士”變成“她是護(hù)士”。(譯注,最后一句話有點(diǎn)費(fèi)解,但是結(jié)合中文網(wǎng)絡(luò)用語中誕生的新代詞TA就不難理解了,因?yàn)椴淮_定被指稱的人的性別,所以寫作TA,而不是他或她,相當(dāng)于英語的he or she,而有些語言中則用復(fù)數(shù)形式表示中性性別,如they表示he or she,這里可以理解為they=TA,把這個(gè)中文新詞套進(jìn)去就不難理解了)

       在購(gòu)物網(wǎng)站上獲得類似的建議是有用的,但在涉及敏感領(lǐng)域時(shí)會(huì)產(chǎn)生問題,并且會(huì)產(chǎn)生反饋回路;如果你加入反對(duì)疫苗接種的臉書群,臉書的推薦引擎將建議其它關(guān)注陰謀論或者認(rèn)為地球平的群。

       了解機(jī)器學(xué)習(xí)中的偏差問題是很重要的。如果你無法消除訓(xùn)練數(shù)據(jù)集中的偏差,請(qǐng)使用規(guī)則化詞對(duì)之間的性別關(guān)聯(lián)等技術(shù)來減少偏差或?qū)⒉幌嚓P(guān)的項(xiàng)目添加到建議中以避免“過濾氣泡(filter bubble)”。

迷思:機(jī)器學(xué)習(xí)只用于做好事

       機(jī)器學(xué)習(xí)為防病毒工具提供了強(qiáng)大的功能,并著眼于全新攻擊的行為,以便一出現(xiàn)就能發(fā)現(xiàn)它們。但同樣地,黑客也正在使用機(jī)器學(xué)習(xí)來研究防病毒工具的防御措施,并通過分析大量公共數(shù)據(jù)或分析以前的網(wǎng)絡(luò)釣魚嘗試的成功來大規(guī)模地制作有針對(duì)性的網(wǎng)絡(luò)釣魚攻擊。

迷思:機(jī)器學(xué)習(xí)會(huì)取代人

       人們常常擔(dān)心人工智能會(huì)搶走他們的飯碗,它肯定會(huì)改變我們所從事的工作以及我們的做事方式;機(jī)器學(xué)習(xí)系統(tǒng)可以改善了效率和合規(guī)性并降低了成本。從長(zhǎng)遠(yuǎn)來看,它將在業(yè)務(wù)中創(chuàng)造新的角色,并使一些當(dāng)前職位顯得過時(shí)。但是機(jī)器學(xué)習(xí)所自動(dòng)化的很多任務(wù)在以前根本就不可能做到,要么歸咎于復(fù)雜性,要么歸咎于為規(guī)模,例如,你無法聘請(qǐng)足夠多的人來查看發(fā)布到社交媒體上的每張照片,以查看它是否具有你的品牌特征。

       機(jī)器學(xué)習(xí)已經(jīng)開始做的事情是創(chuàng)造新的商機(jī),例如通過預(yù)測(cè)性維護(hù)改善客戶體驗(yàn),并向業(yè)務(wù)決策者提供建議和支持。和前幾代自動(dòng)化一樣,機(jī)器學(xué)習(xí)可以把員工解放出來,使他們可以盡情地應(yīng)用自己的專業(yè)知識(shí)和創(chuàng)造力。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉