人工智能的滲透相對較淺 推出零基礎(chǔ)算法開發(fā)非常重要
人工智能作為當(dāng)代很具代表性的使能技術(shù),理應(yīng)受到各行各業(yè)的歡迎,但現(xiàn)階段,縱觀人工智能應(yīng)用成熟和廣泛的領(lǐng)域,仍然以公安、交通、金融、教育等專業(yè)性領(lǐng)域?yàn)橹?,而其他的行業(yè)對于人工智能的應(yīng)用需求雖然廣泛存在,但由于場景的多樣性、需求的高度分散使得人工智能的滲透相對較淺。
從技術(shù)實(shí)現(xiàn)的角度而言,現(xiàn)階段的人工智能技術(shù)發(fā)展水平已經(jīng)毫無疑問能夠滿足中小型行業(yè)輕量級、個(gè)性化的AI應(yīng)用需求,但在技術(shù)方案和各式各樣的場景之間依然存在著一系列的瓶頸和門檻問題,諸如數(shù)據(jù)瓶頸(數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注)、算法訓(xùn)練瓶頸、模型評估和發(fā)布的平臺等等。對于一些中小型行業(yè)用戶而言,盡管他們可能構(gòu)想了一套又一套理想的AI應(yīng)用方案,但如何獲取上述這些資源來實(shí)現(xiàn)方案的落地是個(gè)問題。
在過去幾年里,互聯(lián)網(wǎng)科技領(lǐng)域、人工智能以及智能安防產(chǎn)業(yè)圈的幾大頭部企業(yè)陸續(xù)推出了AI開放平臺,這些AI開放平臺的一個(gè)共同的特性就是均以“普惠AI”為核心理念,而推進(jìn)AI普惠的一個(gè)關(guān)鍵便是降低AI應(yīng)用的門檻,其中就包含幫助用戶實(shí)現(xiàn)零基礎(chǔ)訓(xùn)練出一套自定義的AI應(yīng)用模型。
在2019年深圳安博會上,華為、百度云、??低?/u>這幾家都有詳細(xì)展示自家的AI開放平臺在自定義AI應(yīng)用模型方面的服務(wù),也讓我們看到了AI開放平臺相比于傳說中的奇妙更接地氣的一面。
短、平、快,零基礎(chǔ)自定義一套AI應(yīng)用模型
??低旳I開放平臺在助力用戶自定義AI應(yīng)用模型方面,主要有5大服務(wù)流程:明確用戶需求-數(shù)據(jù)標(biāo)注-導(dǎo)入標(biāo)注后的數(shù)據(jù)做模型訓(xùn)練-模型部署-應(yīng)用上線,自定義一套AI算法應(yīng)用時(shí)間周期要多久呢?海康給出的答案是不超過一個(gè)小時(shí)。
在此前安防知識網(wǎng)對海康威視高級副總裁、研究院院長浦世亮的專訪中,浦世亮也特別提到了??低曉贏I開放平臺上的思考,他認(rèn)為,AI技術(shù)在一個(gè)場景中的落地往往需要漫長而專業(yè)的開發(fā)過程,從數(shù)據(jù)的收集標(biāo)注、算法設(shè)計(jì)、訓(xùn)練、集成到上線往往需要?dú)v經(jīng)數(shù)月。而現(xiàn)在通過AI開放平臺,可以利用各種自動化的工具,使得AI算法的開發(fā)過程,變得非常簡易。一個(gè)零算法基礎(chǔ)的用戶,可以在一個(gè)小時(shí)之內(nèi)完成整個(gè)算法的訓(xùn)練及部署。
舉一個(gè)例子,比如一家連鎖商店的老板需要通過AI技術(shù)檢測商鋪門口是否堆有垃圾,但商戶本身沒有技術(shù)能力。這種情況下,只需要商戶注冊成為??礎(chǔ)I開放平臺的合作伙伴,在線上傳幾十張自己拍攝的店門口的垃圾圖片,并通過平臺上的標(biāo)定工具標(biāo)定垃圾信息,同時(shí)選定攝像機(jī),將標(biāo)定后的垃圾數(shù)據(jù)進(jìn)行算法訓(xùn)練后關(guān)聯(lián)到選定攝像機(jī),商戶即可自行給普通的攝像機(jī)DIY出可實(shí)現(xiàn)垃圾堆疊檢測的AI能力,整個(gè)過程只需半小時(shí)左右。
安博會上百度云也重點(diǎn)展示了其VideoMind算法訓(xùn)練平臺。這套平臺同樣可提供從新建模型、創(chuàng)建標(biāo)簽、上傳數(shù)據(jù)、標(biāo)注數(shù)據(jù)、訓(xùn)練模型、評估校驗(yàn)、發(fā)布模型全流程服務(wù)。開發(fā)者幾乎可以零開發(fā)搭建一套業(yè)務(wù)demo,據(jù)介紹只需2~3天時(shí)間即可完成部署,省去業(yè)務(wù)系統(tǒng)基礎(chǔ)功能的重復(fù)開發(fā)、以及基于AI的業(yè)務(wù)功能的開發(fā)成本。
據(jù)了解,VideoMind已經(jīng)支持四類模型訓(xùn)練:場景分類模型,如識別出視頻中是工廠、農(nóng)田、還是建筑工地等;實(shí)體分類模型,如識別出視頻中出現(xiàn)的是貨車、跑車還是卡丁車等;自然攝像頭實(shí)體檢測模型,如識別出街邊的違章停車、無照游商、亂丟垃圾現(xiàn)象等;人體屬性檢測,如識別出工人是否戴安全帽,法官是否穿法袍等。
華為ModelArts2.0開放平臺可以以全流程的自動化升級已有的AI開發(fā)模式,助力用戶完成數(shù)據(jù)準(zhǔn)備、算法開發(fā)、模型訓(xùn)練、模型管理、模型推理全鏈條自定義AI應(yīng)用模型。
安博會上,華為展出的ModelArts2.0擁有十余項(xiàng)新特性及服務(wù),包含智能數(shù)據(jù)篩選、智能數(shù)據(jù)標(biāo)注、智能數(shù)據(jù)分析、多元模型自動搜索、ModelArts SDK、圖神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)、模型評估/診斷、模型壓縮/轉(zhuǎn)換、自動難例發(fā)現(xiàn)、在線學(xué)習(xí)等,覆蓋AI模型全生命周期。
據(jù)現(xiàn)場工作人員介紹,ModelArts可自動學(xué)習(xí),不斷提升識別的準(zhǔn)確度和運(yùn)行速度,還可以不斷擴(kuò)充模型類型,包括文本分類、行為識別等場景模型的定制化開發(fā)。
不同平臺在算法訓(xùn)練服務(wù)方面背后的核心技術(shù)
這三大算法訓(xùn)練平臺,幾大流程步驟雖然大同小異,不過不同的平臺在不同環(huán)節(jié)上都有針對性的核心技術(shù)來解決響應(yīng)的問題。
比如在處理數(shù)據(jù)瓶頸的問題上,針對數(shù)據(jù)樣本少的問題,??低旳I開放平臺提供了基于領(lǐng)域模型的遷移學(xué)習(xí)能力。AI開放平臺訓(xùn)練了大量不同應(yīng)用領(lǐng)域的領(lǐng)域模型,根據(jù)用戶的任務(wù),開放平臺會自動選擇的一個(gè)領(lǐng)域模型作為訓(xùn)練基礎(chǔ),然后在這個(gè)訓(xùn)練基礎(chǔ)上利用場景數(shù)據(jù)進(jìn)行遷移學(xué)習(xí),這樣可以讓用戶能夠用極少量的數(shù)據(jù)得到一個(gè)可用算法。
對于數(shù)據(jù)樣本單一的問題,海康威視AI開放平臺還開發(fā)了虛擬數(shù)據(jù)引擎,它可以利用三維建模、光線追蹤、對抗學(xué)習(xí)等技術(shù)生成虛擬數(shù)據(jù)來豐富訓(xùn)練樣本,虛擬數(shù)據(jù)引擎可以幫助用戶豐富訓(xùn)練樣本,大大降低了用戶的數(shù)據(jù)成本。
在數(shù)據(jù)標(biāo)注方面,華為ModelArts 2.0采用了混合智能標(biāo)注技術(shù),據(jù)了解,這樣可以讓標(biāo)注效率獲得至少5倍以上的提升。還有智能數(shù)據(jù)篩選,即通過AI的方式自動過濾和篩選出對訓(xùn)練模型無效的數(shù)據(jù)。比如視覺類場景中失焦、過曝的圖片以及不符合應(yīng)用需求的一些無關(guān)圖片等等。
而在模型訓(xùn)練環(huán)節(jié),華為ModelArts 2.0采用了多元搜索技術(shù),可以將自動數(shù)據(jù)增強(qiáng)、超參自動搜索、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索等技術(shù)進(jìn)行融合,以幫助用戶快速構(gòu)建AI模型。與此同時(shí),小樣本/半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、聯(lián)邦學(xué)習(xí)等前沿技術(shù)的融合應(yīng)用,不僅可以降低對訓(xùn)練數(shù)據(jù)的需求,同時(shí)還能夠讓模型隨著數(shù)據(jù)的增長和變化,實(shí)現(xiàn)在線持續(xù)學(xué)習(xí)和進(jìn)化,真正提供企業(yè)級的可進(jìn)化的AI。
在完成模型訓(xùn)練后,算法在產(chǎn)品端的移植工作也需要投入大量研發(fā)工作。為了提升從算法到產(chǎn)品的研發(fā)效率,??低曢_發(fā)了自動編譯工具(AI編譯器),利用神經(jīng)網(wǎng)絡(luò)圖優(yōu)化、匯編優(yōu)化、指令編譯優(yōu)化等技術(shù)手段實(shí)現(xiàn)了算法在各類芯片平臺上的自動優(yōu)化及部署。
AI開放平臺提供自定義AI應(yīng)用模型服務(wù)的意義
將算法訓(xùn)練以工具的形式開放給廣大的零散的用戶,這是企業(yè)對于AI賦能意義接地氣的詮釋,也是實(shí)現(xiàn)價(jià)值轉(zhuǎn)換的基礎(chǔ)途徑。
AI開放平臺提供了數(shù)據(jù)標(biāo)注、算法訓(xùn)練、模型評估、應(yīng)用發(fā)布和部署的一系列能力,而廣大的行業(yè)用戶他們對于細(xì)分的業(yè)務(wù)需求有著充分的了解,而通過這一類AI開放平臺,則可以很好的聚合平臺以及用戶雙方的優(yōu)勢,讓AI技術(shù)能夠深度融合到實(shí)際業(yè)務(wù)需求當(dāng)中,實(shí)現(xiàn)定制化的AI應(yīng)用。
與此同時(shí),通過AI開放平臺這一固定平臺,可以進(jìn)一步放大AI技術(shù)工具的通用性,讓這些能力成為可共享的資源,一定程度上也為海量的、零散的小型行業(yè)應(yīng)用需求提供了一個(gè)公共的入口,縮短了中小行業(yè)用戶在這方面需求響應(yīng)的距離和速度,讓傳統(tǒng)的可能需要以項(xiàng)目方式進(jìn)行的方案能夠短、平、快的快速完成方案設(shè)計(jì)和應(yīng)用部署。
并且,伴隨著平臺對各項(xiàng)個(gè)性化AI應(yīng)用模型訓(xùn)練經(jīng)驗(yàn)的積累,多元化數(shù)據(jù)的持續(xù)“投喂”以及業(yè)務(wù)應(yīng)用邏輯的聚合積累,也將不斷為平臺輸送“養(yǎng)分”,強(qiáng)化平臺在算法訓(xùn)練方面的普適性,從而讓模型訓(xùn)練的速度更快,也能夠完成越來越復(fù)雜的應(yīng)用類型的訓(xùn)練。