AI數(shù)據(jù)服務(wù)野蠻生長(zhǎng)后是怎樣的
掃描二維碼
隨時(shí)隨地手機(jī)看文章
人工智能早在上世紀(jì)50年代就被提出,但是卻在21世紀(jì)才被廣泛使用于各行各業(yè),這得益于大數(shù)據(jù)技術(shù)的誕生推動(dòng)了人工智能的深度學(xué)習(xí)。隨著大數(shù)據(jù)技術(shù)的應(yīng)用及發(fā)展,使各行業(yè)的數(shù)據(jù)如泉涌一般產(chǎn)生,為人工智能奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),進(jìn)而促進(jìn)了人工智能應(yīng)用興起。
眾所周知,人工智能是基于計(jì)算機(jī)對(duì)數(shù)據(jù)分析和深度學(xué)習(xí)的一種技術(shù),但是只有數(shù)據(jù)對(duì)計(jì)算機(jī)來(lái)說(shuō)是沒(méi)用的,因?yàn)闆](méi)有加上“標(biāo)簽”的數(shù)據(jù),計(jì)算機(jī)難以進(jìn)行深度學(xué)習(xí)和優(yōu)化。于是,AI數(shù)據(jù)服務(wù)應(yīng)運(yùn)而生,并隨著人工智能產(chǎn)業(yè)的迅速發(fā)展得以快速增長(zhǎng)。
據(jù)艾瑞咨詢最新報(bào)告顯示,2018年中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模為25.86億元,其中數(shù)據(jù)資源定制服務(wù)占比86.2%,行業(yè)年復(fù)合增長(zhǎng)率為23.5%,預(yù)計(jì)2025年市場(chǎng)規(guī)模將突破110億元。由此可以看出,該行業(yè)整體發(fā)展較為穩(wěn)健。但是,由于該行業(yè)處于成長(zhǎng)期,所以我們?nèi)孕柚泵鍭I數(shù)據(jù)服務(wù)的行業(yè)難點(diǎn)。
AI數(shù)據(jù)服務(wù)諸多痛點(diǎn)亟待解決
隨著科技技術(shù)不斷更新迭代,企業(yè)變革的方向已由信息化向智能化發(fā)展,而在此過(guò)程中,如何獲取數(shù)據(jù)成為最重要的痛點(diǎn)。
其實(shí)這個(gè)問(wèn)題在行業(yè)轉(zhuǎn)型中早已是一個(gè)普遍現(xiàn)象。時(shí)間追溯到智能化時(shí)代初期,企業(yè)爭(zhēng)相加入信息化變革隊(duì)伍中,此時(shí)互聯(lián)網(wǎng)中已經(jīng)積累了大量的數(shù)據(jù)信息,可供企業(yè)獲取用以人工智能訓(xùn)練,但隨后人們便意識(shí)到互聯(lián)網(wǎng)上這些數(shù)據(jù)因?yàn)檫^(guò)于簡(jiǎn)單難以滿足人工智能的發(fā)展速度,于是企業(yè)開(kāi)始主動(dòng)獲取采集數(shù)據(jù)。
2005年起,以亞馬遜的Mturk為代表的一種新的數(shù)據(jù)采集服務(wù)——眾包模式席卷而來(lái),這種眾包模式當(dāng)時(shí)在硅谷被大量的公司采用,最初被用于訓(xùn)練AI算法、發(fā)現(xiàn)假新聞、刪除社交媒體上的暴力內(nèi)容等,后來(lái)在定量研究、市場(chǎng)調(diào)查等領(lǐng)域也有所應(yīng)用。由于其低門檻、高效便捷的優(yōu)點(diǎn),一時(shí)間受到廣大AI從業(yè)者及科研人員的喜愛(ài),在國(guó)內(nèi)也掀起了一場(chǎng)效仿熱潮。
但是,人們對(duì)人工智能的依賴程度逐漸提升,對(duì)AI的要求也越來(lái)越高,自然對(duì)數(shù)據(jù)的質(zhì)量及精準(zhǔn)度也就更高,這給眾包模式的數(shù)據(jù)服務(wù)商帶來(lái)了巨大考驗(yàn),同時(shí)也為AI數(shù)據(jù)服務(wù)行業(yè)帶來(lái)了新的挑戰(zhàn)和機(jī)遇。
2017年,北京云測(cè)信息技術(shù)有限公司(以下簡(jiǎn)稱“云測(cè)”)成立了AI數(shù)據(jù)服務(wù)品牌——云聚數(shù)據(jù)(原云測(cè)數(shù)據(jù)),憑借云測(cè)多年來(lái)在互聯(lián)網(wǎng)行業(yè)積累的豐富經(jīng)驗(yàn),同時(shí)不斷扎實(shí)磨礪技術(shù)能力、打造品牌形象,云聚數(shù)據(jù)快速成長(zhǎng),躋身AI數(shù)據(jù)服務(wù)行業(yè)內(nèi)頭部隊(duì)列。
那這樣一家企業(yè)又是怎樣解決上面提到的難題,又是如何不斷創(chuàng)新,在行業(yè)發(fā)展之路上走在前列的呢?
AI數(shù)據(jù)服務(wù)如何實(shí)現(xiàn)“質(zhì)”的飛躍
云聚數(shù)據(jù)總經(jīng)理賈宇航認(rèn)為要想攻克數(shù)據(jù)服務(wù)行業(yè)過(guò)去的種種難點(diǎn),使數(shù)據(jù)服務(wù)呈場(chǎng)景化、精細(xì)化、質(zhì)量化是必然趨勢(shì),而云聚數(shù)據(jù)則是通過(guò)提供定制化的數(shù)據(jù)采集、高精度的數(shù)據(jù)標(biāo)注等服務(wù)模式來(lái)將問(wèn)題一一解決的。
怎樣實(shí)現(xiàn)數(shù)據(jù)采集定制化?精準(zhǔn)化?
賈宇航說(shuō)道,對(duì)于需要使用AI數(shù)據(jù)的公司來(lái)說(shuō),“成也數(shù)據(jù),敗也數(shù)據(jù)”已是一個(gè)既定的事實(shí),這里的數(shù)據(jù)不僅指數(shù)量,更多的在于精度,能否實(shí)現(xiàn)精細(xì)化的數(shù)據(jù)采集和多維度的數(shù)據(jù)標(biāo)注對(duì)AI數(shù)據(jù)使用者來(lái)說(shuō)至關(guān)重要。
隨著人們對(duì)交互式人工智能的青睞,人工智能的深度研發(fā)成為企業(yè)發(fā)展戰(zhàn)略中的重要一筆。通常情況下,提高算法精度是人工智能進(jìn)化的重要途徑,因此對(duì)數(shù)據(jù)的精準(zhǔn)度也提出了更高要求。
為提高數(shù)據(jù)的精準(zhǔn)度,云聚數(shù)據(jù)依照客戶需求定制化搭建了采集場(chǎng)景,為客戶提供多場(chǎng)景多形式的高精度數(shù)據(jù),滿足不同企業(yè)對(duì)不同數(shù)據(jù)的需求。例如疲勞駕駛監(jiān)測(cè)系統(tǒng)研發(fā)前期,駕駛員危險(xiǎn)動(dòng)作的數(shù)據(jù)收集較困難,針對(duì)這一問(wèn)題,云聚數(shù)據(jù)通過(guò)搭建與之相對(duì)應(yīng)的場(chǎng)景實(shí)驗(yàn)室,利用專業(yè)的人士到駕駛艙中模擬駕駛員疲勞駕駛的相關(guān)行為動(dòng)作,例如打瞌睡、玩手機(jī)等危險(xiǎn)行為,通過(guò)專業(yè)的設(shè)配獲取精準(zhǔn)的數(shù)據(jù)信息后,利用該組數(shù)據(jù)對(duì)人工智能進(jìn)行培訓(xùn),一個(gè)減少交通事故的預(yù)警系統(tǒng)便隨之產(chǎn)生。
然而,在數(shù)據(jù)服務(wù)這一過(guò)程中,最重要的莫過(guò)于數(shù)據(jù)采集之后高精準(zhǔn)的數(shù)據(jù)標(biāo)注。沒(méi)有精準(zhǔn)的數(shù)據(jù)標(biāo)注,那這些收集到的數(shù)據(jù)處于“死亡”狀態(tài),并沒(méi)有激活,其價(jià)值并未體現(xiàn)。此時(shí)我們不得不提到“數(shù)據(jù)標(biāo)注”這一職業(yè)。
過(guò)去,“數(shù)據(jù)標(biāo)注”常被冠以“勞動(dòng)力密集型”“無(wú)技術(shù)含量”的帽子,而在賈宇航看來(lái)并非如此,他認(rèn)為“數(shù)據(jù)標(biāo)注”現(xiàn)在已經(jīng)成為一種“技能密集型”的行業(yè),伴隨著人工智能的快速發(fā)展,數(shù)據(jù)標(biāo)注行業(yè)正在進(jìn)行快速轉(zhuǎn)型,“人工智能的老師”是他們的新名稱,他們以數(shù)據(jù)標(biāo)注為己任,為人工智能實(shí)現(xiàn)真正智能而努力,通過(guò)不斷掌握豐富的行業(yè)知識(shí)、專業(yè)的職業(yè)技能及專業(yè)的工具的使用,做好每一項(xiàng)復(fù)雜的數(shù)據(jù)標(biāo)注工作,使數(shù)據(jù)標(biāo)注精準(zhǔn)度從傳統(tǒng)的95%要上升到99%,甚至更高,確保人工智能更智能。
例如在對(duì)車輛信息進(jìn)行標(biāo)注時(shí),傳統(tǒng)的數(shù)據(jù)標(biāo)注只能確保人工智能準(zhǔn)確識(shí)別出車型、車身顏色等95%的信息;或者有的企業(yè)需要研究道路設(shè)置的問(wèn)題因此只需要道路上基礎(chǔ)設(shè)施的數(shù)據(jù),而有的企業(yè)做一個(gè)汽車行業(yè)的研究所以需要的是道路上所有經(jīng)過(guò)的交通工具的數(shù)據(jù),往往數(shù)據(jù)決定數(shù)據(jù)精準(zhǔn)度的就是那容易被忽視到的5%,這5%需要專業(yè)的數(shù)據(jù)標(biāo)注者才能完成。實(shí)現(xiàn)更高質(zhì)量的數(shù)據(jù)標(biāo)注,確保每一分?jǐn)?shù)據(jù)都能助力人工智能產(chǎn)品實(shí)現(xiàn)快速落地也正是云聚數(shù)據(jù)所關(guān)注的。
人工智能的發(fā)展離不開(kāi)數(shù)據(jù)的支撐,沒(méi)有數(shù)據(jù)作為“燃料”,人工智能“舉步維艱”。
過(guò)去的AI數(shù)據(jù)服務(wù)呈現(xiàn)的是并行模式,而現(xiàn)在逐漸形成了金字塔模式。云聚數(shù)據(jù)作為金字塔上方的數(shù)據(jù)服務(wù)商,有著自己的發(fā)展戰(zhàn)略。賈宇航表示,AI數(shù)據(jù)服務(wù)是一個(gè)資金、人員、軟硬件設(shè)施等投資均相對(duì)較高的行業(yè),但是它又是人工智能產(chǎn)品落地的重要因素。
云聚數(shù)據(jù)一直以來(lái)聚焦在高還原、高精度、高質(zhì)量的數(shù)據(jù),致力于幫助企業(yè)探索發(fā)展邊界。希望通過(guò)提供健康的數(shù)據(jù),真正助力人工智能產(chǎn)業(yè)的穩(wěn)健快速發(fā)展。
數(shù)據(jù)服務(wù)未來(lái)可期
人學(xué)習(xí)是舉一反三,而人工智能學(xué)習(xí)是舉三反一,這就意味著需要全面的、精準(zhǔn)的數(shù)據(jù)以供人工智能學(xué)習(xí)、進(jìn)步。2019年被稱作5G元年,由于5G技術(shù)高速度、低延遲、低功耗等特點(diǎn),將為數(shù)據(jù)服務(wù)帶來(lái)新的變革。
5G+IoT為數(shù)據(jù)獲取掃清了阻礙。物聯(lián)網(wǎng)設(shè)備中產(chǎn)生的數(shù)據(jù)依賴網(wǎng)絡(luò)傳輸,5G高速度、低延遲的特色可實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)傳輸,并以多元化的形式獲取數(shù)據(jù),量和速度跟上了,數(shù)據(jù)的“質(zhì)”也得到日益提升,助推數(shù)據(jù)服務(wù)行業(yè)實(shí)現(xiàn)巨大飛躍,從而進(jìn)一步提升了人工智能的智能化水平,催生出更多的AI產(chǎn)品,實(shí)現(xiàn)5G技術(shù)推動(dòng)整個(gè)AI數(shù)據(jù)服務(wù)行業(yè)發(fā)展,使整個(gè)行業(yè)更加繁榮。
然而,有人提出質(zhì)疑:“AI公司獲取數(shù)據(jù)的需求會(huì)不會(huì)隨著科技技術(shù)的逐漸完善而下降”,賈宇航給出的答案是“不會(huì)”,他認(rèn)為人們?cè)谙硎苋斯ぶ悄軒?lái)的紅利時(shí),對(duì)其的期望值也會(huì)日漸增長(zhǎng),并不會(huì)發(fā)生數(shù)據(jù)需求封頂?shù)那闆r。
例如智能手機(jī)在剛問(wèn)世時(shí)便給人們帶來(lái)了很大的便利,但當(dāng)時(shí)人們并沒(méi)有想到幾年后的今天,智能手機(jī)、AI應(yīng)用場(chǎng)景會(huì)給我們帶來(lái)如此巨大的便利,AI的強(qiáng)大遠(yuǎn)不能以我們當(dāng)前的視角去看待。AI會(huì)逐漸強(qiáng)大,其數(shù)據(jù)缺口會(huì)越來(lái)越大。
當(dāng)前,云聚數(shù)據(jù)在AI數(shù)據(jù)服務(wù)的發(fā)展里程上刻下了濃墨重彩的一筆。在未來(lái),隨著數(shù)據(jù)需求會(huì)持續(xù)上升,會(huì)有更多的“AI+”,數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模將不斷擴(kuò)大,AI數(shù)據(jù)服務(wù)行業(yè)將穩(wěn)步向前發(fā)展!