當前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 人工智能基礎(chǔ)數(shù)據(jù)服務(wù)指為AI算法訓練及優(yōu)化提供的數(shù)據(jù)采集、清洗、信息抽取、標注等服務(wù),以采集和標注為主。人工智能概念爆發(fā)伊始,算法、算力、數(shù)據(jù)就是重要的三要素;進入落地階段,智能交互、人臉識別、

人工智能基礎(chǔ)數(shù)據(jù)服務(wù)指為AI算法訓練及優(yōu)化提供的數(shù)據(jù)采集、清洗、信息抽取、標注等服務(wù),以采集和標注為主。人工智能概念爆發(fā)伊始,算法、算力、數(shù)據(jù)就是重要的三要素;進入落地階段,智能交互、人臉識別無人駕駛等應(yīng)用成為最大的熱門,AI公司開始比拼技術(shù)與產(chǎn)業(yè)的結(jié)合能力,而數(shù)據(jù)作為AI算法的“燃料”,是實現(xiàn)這一能力的必要條件,因此,為機器學習算法訓練、優(yōu)化提供數(shù)據(jù)采集、標注等服務(wù)的人工智能基礎(chǔ)數(shù)據(jù)服務(wù)成為這一人工智能熱潮中必不可少的一環(huán)。如果說計算機工程師是AI的老師,那基礎(chǔ)數(shù)據(jù)服務(wù)就是老師手中的教材。

近日,艾瑞咨詢發(fā)布了《2019年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)白皮書》(以下簡稱《白皮書》),對中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)進行了深度分析?!栋灼分赋?, 2018年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為25.86億元,預(yù)計2025年市場規(guī)模將突破110億元,人工智能基礎(chǔ)數(shù)據(jù)服務(wù)將持續(xù)釋放其對于人工智能的基礎(chǔ)支撐價值。

行業(yè)進入成長期

格局逐漸清晰

伴隨國內(nèi)人工智能熱潮爆發(fā),大量的AI公司融了資,為了不斷提高算法精度,數(shù)據(jù)采標需求也空前爆發(fā),一度催生了行業(yè)的繁榮。但早期的AI基礎(chǔ)數(shù)據(jù)服務(wù)門檻較低,玩家魚龍混雜,使行業(yè)標準模糊、服務(wù)質(zhì)量參差不齊。

隨著競爭加劇,AI公司對訓練數(shù)據(jù)的質(zhì)量要求也不斷提高,并且當產(chǎn)業(yè)落地成為主旋律,需求方對垂直場景的定制化數(shù)據(jù)采標需求成為主流時,眾多小型AI基礎(chǔ)數(shù)據(jù)服務(wù)公司從數(shù)據(jù)質(zhì)量和采標能力上達不到要求而被淘汰,或依附大平臺,行業(yè)格局逐漸清晰,頭部公司實力逐漸凸顯。隨著算法需求越來越旺盛,目前機器輔助標注、人工主要標注的手段需要改進提升,增強數(shù)據(jù)處理平臺持續(xù)學習和自學習能力,增加機器能夠標注維度、提升機器處理數(shù)據(jù)的精度,由機器承擔主要標注工作將成為下一階段的行業(yè)重心。未來,越來越多的長尾、小概率事件所產(chǎn)生的數(shù)據(jù)需求增加,人機協(xié)作標注的模式性價比不高,機器模擬或機器生成數(shù)據(jù)是解決這一問題的良好途徑,及早研發(fā)相應(yīng)技術(shù)也將成為AI基礎(chǔ)數(shù)據(jù)服務(wù)商未來的“護城河”。

從產(chǎn)品形式來看,目前,國內(nèi)AI基礎(chǔ)數(shù)據(jù)服務(wù)主要為數(shù)據(jù)集產(chǎn)品和數(shù)據(jù)資源定制服務(wù),數(shù)據(jù)集產(chǎn)品往往是AI基礎(chǔ)數(shù)據(jù)服務(wù)商根據(jù)自身積累產(chǎn)出的標準數(shù)據(jù)集,以語音數(shù)據(jù)集為主,主體偏普通話語音、英文語音、方言語音等;為保證算法優(yōu)勢,客戶更多采用定制化服務(wù),由客戶提出具體需求,數(shù)據(jù)服務(wù)商直接對客戶提供的數(shù)據(jù)進行標注,或?qū)?shù)據(jù)進行采集并標注。大型的需求方為保障數(shù)據(jù)的安全,往往提供Web形式的自有標注平臺給執(zhí)行方,以此對整體項目進行把控,也有一些AI基礎(chǔ)數(shù)據(jù)服務(wù)商向客戶提供私有化平臺建設(shè)服務(wù),或?qū)⒆陨砥脚_與甲方系統(tǒng)兼容;除以上兩種形式外,部分AI基礎(chǔ)數(shù)據(jù)服務(wù)商還向算法服務(wù)進行拓展,提供算法訓練、模型搭建等服務(wù)。

從商業(yè)模式來看,生產(chǎn)、獲客、部署合力驅(qū)動發(fā)展。人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)是典型的To B型業(yè)務(wù),商業(yè)模式較為穩(wěn)定。在生產(chǎn)方面,主要通過自建標注基地或標注團隊、搭建眾包平臺、采購供應(yīng)商外包服務(wù)(BPO)等模式實現(xiàn)生產(chǎn)運營,大多企業(yè)主要采取眾包與外包模式,百度數(shù)據(jù)眾包、倍賽等企業(yè)自建標注基地或全職標注團隊,對于培訓較高素質(zhì)工作人員、完善團隊管理有積極意義;在獲客方面,主要通過口碑傳播、學術(shù)會議與展會及代理渠道等模式進入市場,對銷售人員熟悉市場趨勢、客戶需求的要求較高;在實施交付方面,有私有化部署和公有部署兩類,能夠較為靈活地應(yīng)對客戶對數(shù)據(jù)安全、交付周期與成本的個性化需求。

市場規(guī)模不斷擴大

行業(yè)穩(wěn)健發(fā)展

2018年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為25.86億元,其中數(shù)據(jù)資源定制服務(wù)占比為86.2%,數(shù)據(jù)集產(chǎn)品占比為12.9%,其他數(shù)據(jù)資源應(yīng)用服務(wù)占比為0.9%;行業(yè)年復(fù)合增長率為23.5%,預(yù)計2025年市場規(guī)模將突破110億元。從整體增速來看,行業(yè)發(fā)展較為穩(wěn)健,下游人工智能行業(yè)持續(xù)發(fā)力將形成長期利好。

從細分結(jié)構(gòu)來看,2018年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場以語音、視覺、NLP領(lǐng)域的標注服務(wù)為主,同時提供采集與標注服務(wù)占比較少,這是由于生數(shù)據(jù)由需求方提供的情況較多,但這并不意味著市場中數(shù)據(jù)采集需求弱,相反,人工智能技術(shù)落地后產(chǎn)生了大量新興垂直領(lǐng)域的數(shù)據(jù)需求,然而這些數(shù)據(jù)采集難度大,能夠提供相關(guān)采集工具和服務(wù)的供應(yīng)商將獲取競爭優(yōu)勢。市場供給方主要由企業(yè)自建或直接獲取外包團隊的形式以及供應(yīng)商組成,又以供應(yīng)商為行業(yè)主要支撐力量,占比為79%。

從市場格局來看,目前人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)CR5占26%的市場份額,行業(yè)集中度較為適中,既非寡占型市場也非充分競爭市場,這一方面是由于百度數(shù)據(jù)眾包、海天瑞聲、數(shù)據(jù)堂等企業(yè)進入市場較早,積累了較多客戶資源;另一方面則是由于下游企業(yè)之前多采用公開數(shù)據(jù)集訓練模型,對數(shù)據(jù)的高精度要求時間尚短,受生態(tài)傳導(dǎo)效應(yīng)滯后影響,市場門檻還不顯著,資金與研發(fā)實力較為薄弱的中小企業(yè)還有較肥沃的發(fā)展土壤。然而未來,隨著下游企業(yè)發(fā)展壯大,直接使用外包團隊成本低廉、數(shù)據(jù)安全可控性強,一些基礎(chǔ)性需求將由下游企業(yè)自給自足,外部的數(shù)據(jù)服務(wù)商現(xiàn)有的存量市場面臨下降,因此必須承擔高難度、前沿獨特性任務(wù),這就要求其自身投入高精度、專業(yè)化數(shù)據(jù)處理工具的研發(fā)和人工智能算法基礎(chǔ)研究,以把握客戶需求,開拓增量市場,因此資金與研發(fā)實力成為較高行業(yè)門檻,同時受近年資本市場冷卻影響,一批中小型廠商面臨業(yè)務(wù)收縮,再者部分廠商如倍賽開始在業(yè)內(nèi)并購,參考海外數(shù)據(jù)服務(wù)市場發(fā)展情況(海外行業(yè)巨頭Appen多次并購其他企業(yè)),并購也將成為市場趨勢,在多種因素疊加的影響下,行業(yè)集中度將提升。

五大需求痛點

決定服務(wù)標準

目前需求方在選擇數(shù)據(jù)服務(wù)時往往會遇到數(shù)據(jù)安全、采標能力、數(shù)據(jù)質(zhì)量、管理能力、服務(wù)能力等痛點。對于數(shù)據(jù)安全,需求方希望基礎(chǔ)數(shù)據(jù)服務(wù)商有明確具體的安全管理流程,對數(shù)據(jù)傳輸、存儲,以及結(jié)項后的數(shù)據(jù)銷毀等環(huán)節(jié)比較重視。在采標能力方面,需求方算法越來越貼近業(yè)務(wù),希望數(shù)據(jù)服務(wù)商對于自動駕駛、工業(yè)等有一定門檻的領(lǐng)域有采集能力,并且能理解客戶意圖,配合標注,甚至可以提出標注建議;根據(jù)市場反應(yīng),大多數(shù)數(shù)據(jù)服務(wù)公司首次交付項目時,數(shù)據(jù)的準確率普遍偏低,都需要一到兩次的返工,故需求方對無效數(shù)據(jù)少、準確率高的公司更加青睞。

對于執(zhí)行效率,一般AI基礎(chǔ)數(shù)據(jù)服務(wù)商都能在項目周期內(nèi)完成,但管理能力較弱的公司很難在兼顧多個項目時做到精力集中、高質(zhì)量地服務(wù)客戶,同時執(zhí)行團隊的素養(yǎng)與信譽也是重要影響因素。服務(wù)意識是一項軟實力,需要AI基礎(chǔ)數(shù)據(jù)服務(wù)商能夠積極配合、快速響應(yīng)需求方要求。

單純依據(jù)客戶各個項目的訴求進行數(shù)據(jù)采集和標注屬于被動執(zhí)行,主觀能動性低、行業(yè)邊界有限,各家公司的產(chǎn)品和服務(wù)趨于同質(zhì)化、競爭呈膠著狀態(tài),制約著AI基礎(chǔ)數(shù)據(jù)服務(wù)的發(fā)展?!栋灼分赋?,通過對需求方的研究,發(fā)現(xiàn)除安全性、質(zhì)量、效率等核心關(guān)注點之外,越來越多的需求方對數(shù)據(jù)服務(wù)公司產(chǎn)生了主動服務(wù)的需求。希望數(shù)據(jù)公司能夠更懂算法技術(shù)、更懂需求場景,甚至能參與算法的研發(fā),給出數(shù)據(jù)采標方面的優(yōu)化建議,這也為數(shù)據(jù)服務(wù)商形成差異化競爭帶來了契機,尤其是在AI落地階段,在垂直場景中能夠形成一套集調(diào)研、咨詢、設(shè)計、采集、標注于一體的AI基礎(chǔ)數(shù)據(jù)整體解決辦法,將在收入和業(yè)務(wù)邊界上實現(xiàn)突破。

來源:人民郵電報

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉