深蘭科技斬獲IEEE ISI冠軍,其Auto ML 技術加速企業(yè)AI升級新進程
機器學習的下一波浪潮!
AI領域最炙手可熱的技術之一!
國外的谷歌、Facebook、微軟,國內(nèi)的深蘭科技、曠視科技、第四范式等領先的AI企業(yè)競相研發(fā)......
如果2019年你只關注人工智能領域的一項技術,可能最應該是AutoML技術。
近日,國內(nèi)AI企業(yè)在AutoML技術上傳來好消息。7月1日,IEEE ISI 2019國際大數(shù)據(jù)分析競賽結(jié)果出爐,深蘭科技DeepBlueAI團隊分別取得了一項冠軍和一項季軍的優(yōu)異成績。
到底何謂AutoML技術?為什么谷歌、Facebook、微軟都重金投入競相研發(fā)?為什么它被譽為“AI領域最炙手可熱的技術”?為什么說“中國企業(yè)AI轉(zhuǎn)型或迎來新進程?”
1、力克英美德等七國“勁敵”中國自研AutoML技術斬獲IEEE ISI冠軍
近日,來自中國上海的AI獨角獸——深蘭科技DeepBlueAI團隊,在IEEE ISI 2019國際大數(shù)據(jù)分析競賽上分別取得了一項冠軍和一項季軍。
擁有16年歷史的IEEE年度國際會議,是安全信息學領域的旗艦會議。目前已從傳統(tǒng)的智能和安全領域發(fā)展到多領域聯(lián)合研究與創(chuàng)新。今年7月1日,第17屆IEEE ISI會議由深圳人工智能與數(shù)據(jù)科學研究所主辦。
IEEE ISI會議發(fā)起了此次國際大數(shù)據(jù)分析競賽(IEEE ISI 2019年世界杯,IWC 2019),并面向全球高校、研究機構(gòu)、企業(yè)、政府開放。本次大賽總計參賽人數(shù)逾千人,三百多支參賽隊伍分別來自中國、美國、巴基斯坦、英國、德國等7個國家。來自華為、京東、滴滴等知名企業(yè),以及來自清華大學、北京大學、浙江大學等知名高校的三百余支隊伍參賽,參賽總?cè)藬?shù)逾千人。
今年IEEE ISI大賽分為:投資價值評估和法律訴訟類型預測兩個賽題。在企業(yè)投資價值評估賽題中,深蘭科技DeepBlueAI團隊憑借自研的AutoML系統(tǒng),以較大領先優(yōu)勢獲得冠軍。
所謂AutoML全稱Automated Machine Learning,即自動機器學習,該技術是2014年以來,機器學習和深度學習領域最炙手可熱的領域之一。
AutoML技術之所以被廣泛關注,是因為它讓機器學習從“教學”變成了“自學”,大幅提升了機器學習的效率。
具體而言,傳統(tǒng)的機器學習,從攝取數(shù)據(jù)到預處理、優(yōu)化,然后預測結(jié)果,每個步驟都需要由專業(yè)的AI人才來控制和執(zhí)行。而在AutoML技術的加持下,人主要只關注兩個主要方面:數(shù)據(jù)采集/收集和預測。中間發(fā)生的所有其他步驟都可以讓機器輕松實現(xiàn)自動化,同時提供經(jīng)過優(yōu)化并準備好進行預測的模型。
AutoML技術普遍具備兩個特征:
自動化:AutoML能高效通過自動執(zhí)行的重復性任務來提高工作效率。這使得數(shù)據(jù)科學家能夠更多地關注問題而不是模型。比如深蘭科技自研的AutoML技術,除了能夠節(jié)省大量人力物力財力,并且還能更加快速和安全地搭建出一個優(yōu)于大多數(shù)算法工程師搭建的機器學習系統(tǒng)。在本次比賽中,AutoML系統(tǒng)可挖掘各業(yè)務字段間的復雜關系,自動提取高階特征,給企業(yè)價值評估提供了新穎的更加精準的解決方案。
泛用性:由于AutoML自動化以及高效的特征,它一定程度上打破了AI技術與AI科學家的深度綁定關系,進而降低了AI技術的應用門檻——畢竟并非所有企業(yè)都有資源來聘請經(jīng)驗豐富的AI人才團隊。這意味著,AutoML技術可廣泛用于那些AI人才不足的企業(yè),這或許是傳統(tǒng)企業(yè)AI轉(zhuǎn)型的突破口!
值得注意的是,此次比賽的冠軍團隊深蘭科技擁有多年的機器學習經(jīng)驗。此前在 PAKDD2019、CVPR 2019 等國際知名比賽中多次取得冠軍的優(yōu)異成績。
2、美國的谷歌,中國的深蘭科技AutoML成為智能駕駛“彎道超車”的關鍵
為什么說AutoML技術是“傳統(tǒng)企業(yè)AI轉(zhuǎn)型的突破口”呢?
眾所周知,汽車行業(yè)被譽為傳統(tǒng)制造業(yè)皇冠上的明珠。我們具體以汽車產(chǎn)業(yè)為例,近距離地洞察AutoML技術的賦能。
深蘭科技是最先將AutoML技術應用在智能駕駛以及整車制造領域的國內(nèi)AI企業(yè)之一。今年6月,深蘭科技同其他5家企業(yè)正式收到路測牌照,成為首批獲得廣州市智能網(wǎng)聯(lián)汽車道路測試資格的企業(yè),其中深蘭科技是唯一獲得大型客車路測資格的AI企業(yè)。其旗下的熊貓智能公交車也將在黃埔區(qū)、南沙區(qū)、花都區(qū)、白云區(qū)等四個區(qū)域內(nèi)路測行駛。
深蘭科技自誕生就自帶AI基因,但是中國汽車行業(yè)中的主要玩家們——傳統(tǒng)車企,要想入局智能駕駛領域必定面臨著諸多挑戰(zhàn)。
比如,在智能駕駛狀況下,車與車之間必將形成的“車際網(wǎng)”,即汽車之間的“相互溝通”,以相互告知車距、車流、事故、路況等。而這種溝通必定是通過數(shù)據(jù)實現(xiàn)的。
那么,兩輛不同品牌、不同智能駕駛技術的車輛之間,甚至一輛有智能駕駛另一輛沒有,其間的數(shù)據(jù)傳輸就極有可能遭遇障礙,比如數(shù)據(jù)格式不一、維度不同、字段不同。
以我們比較熟悉的EXCEL中的數(shù)據(jù)作為類比,同樣是“7月1日”這個時間數(shù)據(jù),不同的統(tǒng)計表格顯示不同,可能是“7-1”可能是“07.01.2019”,也可能是“July 1st”。如果數(shù)據(jù)量巨大,那么根本無法通過人眼來一一識別、矯正。EXCEL尚且如此,別提AI了。
如何保證車與車之間的數(shù)據(jù)溝通能順利進行?AutoML技術就能很好解決這種問題。
前文提到的深蘭科技自研的AutoML系統(tǒng),不僅能挖掘各規(guī)格數(shù)據(jù)間的復雜關系,還有自動提取高階特征,進行自動化的數(shù)據(jù)清洗。這意味著不同車輛之間的不同數(shù)據(jù),可以被AutoML系統(tǒng)自動統(tǒng)一。
此外,深蘭科技自研的AutoML系統(tǒng)天生的自動化能力,也可以讓數(shù)據(jù)傳輸?shù)倪^程、面對復雜場景的數(shù)據(jù)更加高效;其匿名性則可以保證車主位置數(shù)據(jù)不被泄露;其泛用性,則可讓該技術低門檻、大規(guī)模地賦能傳統(tǒng)車企。
事實上,谷歌早已將AutoML系統(tǒng)用于智能駕駛。今年1月,Alphabet(谷歌母公司)旗下的子公司、全球自動駕駛領頭羊——Waymo,就在成立十周年之際于官方博客重點深度剖析了AutoML技術如何助力智能駕駛。
Waymo稱,AutoML技術使其智能駕駛技術針對不同的場景快速優(yōu)化,高效和連續(xù)地提供大量機器學習的解決方案,以將其智能駕駛技術應用到不同的城市和環(huán)境中。
可見,不論是國內(nèi)的深蘭科技還是國外的谷歌,AutoML技術已成為智能駕駛領域最為關鍵技術之一。國內(nèi)傳統(tǒng)車企甚至是造車新勢力若想“彎道超車”,必定離不開AutoML技術的賦能。
3、企業(yè)AI轉(zhuǎn)型遭遇人才瓶頸AutoML或是切入萬億蛋糕的利器
事實上,AutoML技術的賦能并不局限于汽車行業(yè),它也是國內(nèi)幾乎所有傳統(tǒng)行業(yè)和中小企業(yè)AI轉(zhuǎn)型的切入點之一。
傳統(tǒng)行業(yè)和中小企業(yè)的AI轉(zhuǎn)型,甚至AI整個行業(yè)的發(fā)展,主要受三個關鍵因素所桎梏:
第一,人才
第二,數(shù)據(jù)
第三,算力
而在企業(yè)紛紛擁抱數(shù)字化,云計算可低價租用的今天,人才正成為最后也是最難的瓶頸。畢竟AI人才培養(yǎng)不可能像企業(yè)數(shù)字化轉(zhuǎn)型和公有云普及那樣迅速,受到教育資源等種種原因的限制,AI人才的稀缺性必定將持續(xù)很長時間。
今年4月,加拿大人工智能孵化器公司Element AI發(fā)布的《2019年全球AI人才報告》顯示,在全球AI人才培養(yǎng)方面,有44%的AI人才的博士學位是在美國獲得的,在中國獲得的約11%;而在雇傭AI人才方面,46%的AI人才替美國的雇主工作,中國這個數(shù)據(jù)僅11%。
可見,國內(nèi)AI人才總量相對匱乏。
更嚴峻的一個問題是,國內(nèi)AI人才大多只在科技企業(yè)甚至BAT、TMD等大型科技企業(yè)間流動,對于傳統(tǒng)行業(yè)以及中小企業(yè)而言,AI人才成本是一個難以邁過的坎,而AI人才常需要團隊作戰(zhàn)才能發(fā)揮才能,更是讓這種情況雪上加霜。
這意味著,一方面,至少未來數(shù)十年在AI產(chǎn)業(yè)化的轉(zhuǎn)型途中,傳統(tǒng)行業(yè)以及中小企業(yè)內(nèi)部存在著一個巨大的市場。另一方面,通過AI創(chuàng)造全新產(chǎn)品和服務,推動傳統(tǒng)行業(yè)轉(zhuǎn)型升級,同時也已經(jīng)成為國家倡導的推動供給側(cè)結(jié)構(gòu)性改革、實現(xiàn)高質(zhì)量發(fā)展的重要著力點,相關的政策早已層出不窮。
所以,不論是市場競爭還是國家政策,AI賦能傳統(tǒng)行業(yè)以及中小企業(yè),都將是大勢所趨。
根據(jù)國務院發(fā)布的新一代人工智能發(fā)展規(guī)劃,到2030年,中國將實現(xiàn)人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元,帶動相關產(chǎn)業(yè)規(guī)模超過10萬億元。
而能降低企業(yè)用戶、開發(fā)者以及研究人員使用門檻的AutoML技術,正是切入這一巨大蛋糕的利器。換言之,深蘭科技、曠視科技、第四范式等領先的AI企業(yè),有機會利用AutoML技術為國內(nèi)傳統(tǒng)行業(yè)以及中小企業(yè)賦能。
目前AutoML技術已經(jīng)廣泛應用在精準營銷、金融風控、自動駕駛、疾病預測等業(yè)務場景中,做出了接近甚至超過數(shù)據(jù)科學家的模型效果,決策精準度超過人類專家數(shù)倍。
以深蘭科技為例,深蘭科技曾提出,將把AutoML技術作為開發(fā)工具,在公司搭建的世界級核心算法平臺上推出系統(tǒng)性的解決方案,賦能AI交通、AI醫(yī)療、AI工業(yè)、AI社區(qū)等領域。
據(jù)了解,深蘭科技的AI產(chǎn)品橫跨多個領域,使用場景復雜。AutoML技術可以在海量復雜數(shù)據(jù)基礎上,做到算法的自我更新和自我適應,從而達到AI真正的智能化和個性化。
再如第四范式,目前其已發(fā)布AutoML平臺可以幫助企業(yè)基于歷史的數(shù)據(jù)、業(yè)務的實時反饋做迭代,充分挖掘特征做出更精準的決策。今年4月,曠視科技也首次披露了AutoML相關成果...
可以預見在不久的將來,圍繞AutoML技術,中外AI企業(yè)將展開新一輪技術爭霸。