數(shù)據(jù)格局大變 人工智能將助推下一波混合浪潮
如今的數(shù)據(jù)格局如果沒(méi)有人工智能就不再完整。商業(yè)智能領(lǐng)域出現(xiàn)了一個(gè)整合浪潮,這引發(fā)了一個(gè)問(wèn)題,是否會(huì)推出新一代人工智能?混合云現(xiàn)在不再成為大多數(shù)企業(yè)的抽象術(shù)語(yǔ)。
與五年前不同的是,Hadoop不再是分析大數(shù)據(jù)的唯一途徑。從完整平臺(tái)到專門(mén)的點(diǎn)服務(wù)(如Spark、流媒體、數(shù)據(jù)轉(zhuǎn)換、人工智能)都采用了云計(jì)算產(chǎn)品。此外,在云中,對(duì)象存儲(chǔ)正在成為事實(shí)上的數(shù)據(jù)湖。但是隨著Mapr的衰落以及HortonWorks和Cloudera的合并,仍然有著很好的客戶基礎(chǔ),至少有兩千個(gè)藍(lán)籌股客戶,并且絕大多數(shù)是內(nèi)部客戶,他們每年將支付上百萬(wàn)美元的支持費(fèi)用。而這些工作負(fù)載不會(huì)一夜之間轉(zhuǎn)移到云端。
盡管如此,企業(yè)將業(yè)務(wù)遷移到云端是顯而易見(jiàn)的。Firstmark公司的調(diào)查報(bào)告與Ovum公司所做的預(yù)測(cè)一致,2019年,大多數(shù)新的大數(shù)據(jù)工作負(fù)載將從云端開(kāi)始。FirstMark公司期待出現(xiàn)這一點(diǎn),但也有一些問(wèn)題。當(dāng)企業(yè)考慮云計(jì)算新的戰(zhàn)略工作負(fù)載時(shí),有人擔(dān)心云供應(yīng)商的鎖定?;旌显频玫搅诵袠I(yè)廠商的關(guān)注,而像IBM這樣的基礎(chǔ)設(shè)施廠商已經(jīng)在云計(jì)算第一輪發(fā)展浪潮中錯(cuò)過(guò),因此有些廠商希望獲得第二次機(jī)會(huì)。而Kubernetes并沒(méi)有迷失,谷歌開(kāi)源項(xiàng)目讓用戶更加關(guān)注混合云。當(dāng)然,這也推動(dòng)了IBM公司以340億美元收購(gòu)Red Hat,但其舉措遠(yuǎn)遠(yuǎn)落后于谷歌Anthos產(chǎn)品,該公司重新打包其Kubernetes服務(wù),企業(yè)可以在AWS云平臺(tái)中運(yùn)行谷歌云本地工作負(fù)載(無(wú)需采用谷歌硬件)。
但是人們?cè)诓捎肒ubernetes服務(wù)時(shí)需要花費(fèi)時(shí)間熟悉和適應(yīng),Kubernetes仍然是一塊未經(jīng)打磨的鉆石,其安全性、負(fù)載平衡、服務(wù)配置等方面的最佳實(shí)踐仍在進(jìn)行中。盡管如此,F(xiàn)irstMark推測(cè),由于數(shù)據(jù)科學(xué)家或數(shù)據(jù)工程師希望對(duì)他們的環(huán)境施加更多的控制,Kubernetes可能會(huì)促使他們遠(yuǎn)離基于云計(jì)算的機(jī)器學(xué)習(xí)服務(wù)。機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)的需求非常旺盛,因此,其關(guān)鍵的推動(dòng)因素或者說(shuō)障礙,取決于人們的觀點(diǎn),將是企業(yè)在內(nèi)部存儲(chǔ)或處理所有數(shù)據(jù)的能力、意愿、成本等等。而專家對(duì)Kubernetes的看法是,對(duì)于除了最復(fù)雜的企業(yè)IT組織之外的所有人來(lái)說(shuō),它將變得過(guò)于復(fù)雜,盡管像IBM公司或Pivotal公司這樣的第三方的使命是將所有的復(fù)雜性隱藏在一個(gè)黑盒里。
該報(bào)告還研究了復(fù)雜分析和機(jī)器學(xué)習(xí)工作負(fù)載的無(wú)服務(wù)器計(jì)算的狀態(tài),同樣認(rèn)為它處在黃金時(shí)期還為時(shí)尚早。無(wú)服務(wù)器隨著敏捷開(kāi)發(fā)具有短期流程的應(yīng)用程序或具有不穩(wěn)定流量峰值的數(shù)據(jù)庫(kù)而變得流行。無(wú)服務(wù)器的開(kāi)發(fā)簡(jiǎn)單性,讓系統(tǒng)自動(dòng)調(diào)整計(jì)算量,對(duì)于實(shí)現(xiàn)敏捷的開(kāi)發(fā)人員具有吸引力,但是長(zhǎng)時(shí)間運(yùn)行的機(jī)器學(xué)習(xí)過(guò)程將使無(wú)服務(wù)器遇到障礙,正如FirstMark公司調(diào)查報(bào)告所指出的那樣。
另一個(gè)痛苦的領(lǐng)域?qū)⑹菙?shù)據(jù)管理和治理,這個(gè)問(wèn)題與一系列新的和擬議的數(shù)據(jù)隱私法相結(jié)合。對(duì)于數(shù)據(jù)庫(kù)和商業(yè)智能的經(jīng)驗(yàn)豐富的公司和個(gè)人來(lái)說(shuō),這些問(wèn)題并不新鮮。當(dāng)企業(yè)擁有如此多的數(shù)據(jù)時(shí),如何找到要查找的內(nèi)容?數(shù)據(jù)目錄由Alation和Waterline Data等第三方提供,并內(nèi)置于像Cloudera這樣的數(shù)據(jù)平臺(tái)。例如,由Google Ventures提供部分支持的Colibra公司最近籌集到1億美元,但同時(shí),并沒(méi)有阻止谷歌云計(jì)算人員公布他們自己的數(shù)據(jù)目錄,這些數(shù)據(jù)目錄與Collibra的數(shù)據(jù)目錄重疊。但并非所有數(shù)據(jù)目錄都是平等的。有些是高度協(xié)作的工具,它們利用機(jī)器學(xué)習(xí)來(lái)抓取和構(gòu)建查詢以訪問(wèn)數(shù)據(jù),而其他工具則是一些數(shù)據(jù)字典。
FirstMark公司的調(diào)查報(bào)告認(rèn)為,數(shù)據(jù)沿襲是新興的另一項(xiàng)技術(shù)——它應(yīng)該告訴人們數(shù)據(jù)來(lái)自何處,并提供審計(jì)跟蹤,以了解數(shù)據(jù)是如何被使用的,最好是由誰(shuí)使用。雖然數(shù)據(jù)沿襲應(yīng)該提供單一的真相來(lái)源,但面臨的挑戰(zhàn)是,分析工具、數(shù)據(jù)目錄、數(shù)據(jù)平臺(tái)都在記錄各自對(duì)數(shù)據(jù)沿襲的看法,提供了擁有很多好處的最新示例。
如果不涉及商業(yè)領(lǐng)域的最新一輪整合,那么對(duì)2019年數(shù)據(jù)和分析領(lǐng)域的調(diào)查就不會(huì)完整,谷歌公司收購(gòu)Looker公司,Salesforce公司兼并Tableau公司, Alteryx公司收購(gòu)ClearStory Data公司,以及Logi AnalyTI公司收購(gòu)Zoomdata公司。與10年前的商業(yè)智能整合浪潮相似的是,Business Objects、Cognos和Hyperion分別被SAP、IBM和Oracle收購(gòu)。FirstMark公司推測(cè)市場(chǎng)的兼容并購(gòu)可能還沒(méi)有結(jié)束,亞馬遜公司可能考慮收購(gòu)QuickSight。商業(yè)智能的下一波創(chuàng)新將是將作為數(shù)字助理的機(jī)器學(xué)習(xí)嵌入到業(yè)務(wù)分析中,幫助選擇和清理數(shù)據(jù)。人們可能會(huì)在現(xiàn)有工具中看到很多這種創(chuàng)新,例如Tableau公司的Ask Data自然語(yǔ)言查詢,但這也可能是初創(chuàng)企業(yè)圍繞自然語(yǔ)言和數(shù)字輔助進(jìn)行設(shè)計(jì)的動(dòng)力,而不是對(duì)其進(jìn)行改造。
作為商業(yè)智能民主化分析,F(xiàn)irstMark公司將機(jī)器學(xué)習(xí)視為下一個(gè)適合市場(chǎng)發(fā)展的分析領(lǐng)域。它將市場(chǎng)空間分成幾個(gè)部分:第一個(gè)是AutoML,它可以自動(dòng)化開(kāi)發(fā)和生產(chǎn)機(jī)器學(xué)習(xí)模型的大部分工作,受到云計(jì)算用戶和第三方(如Data Robot)的關(guān)注。第二個(gè)是存儲(chǔ)桶,主要是第三方的領(lǐng)域,如Dataiku、RapidMiner和H2O,它添加了大量的協(xié)作組件。Firstmark公司的調(diào)查報(bào)告描繪出這些工具將如何解釋人工智能模型。
FirstMark公司還在水平服務(wù)中看到人工智能活動(dòng)的溫床,例如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音到文本,它們正在將數(shù)據(jù)池的深度學(xué)習(xí)端商業(yè)化。但也提出了一個(gè)警告,那就是水平服務(wù)敲開(kāi)了人工通用智能(人工智能越來(lái)越接近人類(lèi)能力)的大門(mén),現(xiàn)在其能力相對(duì)有限(他們執(zhí)行文本翻譯等任務(wù),但實(shí)際思考能力有限)。因此,市場(chǎng)處于更加早期的發(fā)展?fàn)顟B(tài)。還有一些常規(guī)服務(wù),如Amazon RekogniTIon,以及谷歌聯(lián)系中心人工智能等垂直服務(wù)的開(kāi)端。 FirstMark公司注意到自然語(yǔ)言處理(NLP)等基線功能的重大改進(jìn)。
最終,人工智能的最大收益將嵌入到業(yè)務(wù)應(yīng)用程序中。這是SAP Leonardo計(jì)劃背后的主要推動(dòng)力。Leonardo計(jì)劃本身不是一種產(chǎn)品或一組產(chǎn)品,但其作用之一是作為一個(gè)實(shí)驗(yàn)室,讓SAP從客戶參與中發(fā)現(xiàn)生產(chǎn)機(jī)會(huì)。但Firstmark公司認(rèn)為這意味著要經(jīng)歷3~4年的漫長(zhǎng)旅程。