自動化機器學(xué)習,2019人工智能最新的前沿技術(shù)
(文章來源:粵訊)
隨著概念的普及,科技公司對人工智能的要求越來越高,成本、準確度、效率都影響著人工智能能否落地融入日常的使用中。對人工智能應(yīng)用的快速增長也進而催生了對影響人工智能水平的關(guān)鍵要素——機器學(xué)習方法的需求。自動化機器學(xué)習方法AutoML應(yīng)運而生。
近年來,在深度學(xué)習領(lǐng)域里,出現(xiàn)了一種「新式學(xué)習法」,很多人視它改變了設(shè)計復(fù)雜的深度學(xué)習網(wǎng)絡(luò),把看似高不可攀的深度學(xué)習,「拉」到了人人觸手可及的程度。這個新方式,就是 AutoML。
2017 年 5 月,谷歌在 I/O 大會上發(fā)布了 AutoML,他們將 AutoML 應(yīng)用到了深度學(xué)習的圖像識別和語言建模的兩大數(shù)據(jù)集中,他們提供的 Cloud AutoML 和 Google NAS 算法結(jié)合,把完整的機器學(xué)習工作做成了云端產(chǎn)品,用戶只需要提供數(shù)據(jù),Cloud AutoML 將自動構(gòu)建深度學(xué)習模型。換言之,AutoML想要做到的,正如其名:自動化機器學(xué)習。
傳統(tǒng)的AI模型訓(xùn)練往往要經(jīng)歷特征分析、模型選擇、調(diào)參、評估等步驟,這些步驟需要經(jīng)歷數(shù)月的時間,如果完全沒經(jīng)驗,時間會更長。AutoML雖然也需要經(jīng)歷這些步驟,但是通過自動化的方式,可以減少這些步驟的時間。選擇怎樣的參數(shù),被選擇的參數(shù)是否有價值或者模型有沒有問題,如何優(yōu)化模型,這些步驟在從前是需要依靠個人的經(jīng)驗、知識或者數(shù)學(xué)方法來判斷的。
而AutoML可以完全不用依賴經(jīng)驗,而是靠數(shù)學(xué)方法,由完整的數(shù)學(xué)推理的方式來證明。通過數(shù)據(jù)的分布和模型的性能,AutoML會不斷評估最優(yōu)解的分布區(qū)間并對這個區(qū)間再次采樣。所以可以在整個模型訓(xùn)練的過程中縮短時間,提升模型訓(xùn)練過程的效率。
如何促進技術(shù)公平,降低技術(shù)應(yīng)用門檻,讓不懂技術(shù)的用戶也可以使用人工智能;如何優(yōu)化機器學(xué)習的流程和結(jié)果,輔佐數(shù)據(jù)科學(xué)家們投入更有價值的工作,正是 AutoML 以及人工智能領(lǐng)域未來希望攻克的難題之一。在2018年谷歌云全球NEXT大會上,李飛飛宣布,谷歌AutoML Vision進入公共測試版,并推出了兩款新的AutoML產(chǎn)品:AutoML Natural Language和AutoML Translation。
這個名為Cloud AutoML的宏大項目浮出水面之時,被業(yè)內(nèi)稱為“Google Cloud發(fā)展的戰(zhàn)略轉(zhuǎn)型”——一直以來面向機器學(xué)習人工智能開發(fā)者的Google Cloud,這次將服務(wù)對象轉(zhuǎn)向了普羅大眾。你只需在該系統(tǒng)中上傳自己的標簽數(shù)據(jù),就能得到一個訓(xùn)練好的機器學(xué)習模型。整個過程,從導(dǎo)入數(shù)據(jù)到標記到模型訓(xùn)練,都可以通過拖放界面完成。
其實在谷歌發(fā)布AutoML前后,機器學(xué)習自動化的產(chǎn)品風潮已經(jīng)吹起:2017年底,微軟發(fā)布CustomVision.AI,涵蓋圖像、視頻、文本和語音等各個領(lǐng)域。2018年 1 月,他們又推出了完全自動化的平臺 Microsoft Custom Vision Services(微軟定制視覺服務(wù))。同年,國內(nèi)也出現(xiàn)了不少相關(guān)產(chǎn)品,稱能夠解放算法工程師,讓AI自動化,其中的代表即是百度的EasyDL
EasyDL 在 2017 年 11 月初上線了定制化圖像識別服務(wù),并在業(yè)內(nèi)展開公開測試。在 2018 年 4 月、5 月和 7 月陸續(xù)發(fā)布了定制化物體檢測服務(wù)、定制化模型設(shè)備端計算和定制化聲音識別等多個定制化能力方向,并形成了從訓(xùn)練數(shù)據(jù)到最終定制化服務(wù)的一站式端云一體平臺。
目前 EasyDL 的各項定制能力在業(yè)內(nèi)廣泛應(yīng)用,累計過萬用戶,在包括零售、安防、互聯(lián)網(wǎng)內(nèi)容審核、工業(yè)質(zhì)檢等等數(shù)十個行業(yè)都有應(yīng)用落地,并提升了這些行業(yè)的智能化水平和生產(chǎn)效率。此外,曠視原創(chuàng)自研的人工智能算法平臺Brain++也集成了行業(yè)領(lǐng)先的AutoML技術(shù),對深度學(xué)習算法的各個關(guān)鍵環(huán)節(jié)進行自動化的設(shè)計、搜索和優(yōu)化。
? ? ? ?