什么是大數(shù)據(jù)?工業(yè)大數(shù)據(jù)主要解決什么問題?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
本文中,小編將對大數(shù)據(jù)予以介紹,主要內(nèi)容在于闡述工業(yè)大數(shù)據(jù)想要解決的問題。如果你想對大數(shù)據(jù)的詳細(xì)情況有所認(rèn)識,或者想要增進(jìn)對大數(shù)據(jù)的了解程度,不妨請看以下內(nèi)容哦。
一、什么是大數(shù)據(jù)
在了解工業(yè)大數(shù)據(jù)技術(shù)主要解決什么問題之前,我們先來看看什么是大數(shù)據(jù)。
大數(shù)據(jù)(big data)是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的5V特點(diǎn)(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)。
二、工業(yè)大數(shù)據(jù)主要解決的問題是什么?
在了解了什么是大數(shù)據(jù)后,我們再來看看工業(yè)大數(shù)據(jù)和互聯(lián)網(wǎng)大數(shù)據(jù)之間由什么區(qū)別,以及工業(yè)大數(shù)據(jù)主要是為了解決什么問題。
工業(yè)大數(shù)據(jù)與Internet大數(shù)據(jù)之間的最大區(qū)別在于,工業(yè)大數(shù)據(jù)具有很強(qiáng)的用途,而Internet大數(shù)據(jù)更多地是相關(guān)的挖掘和更發(fā)散的分析。 此外,兩者在數(shù)據(jù)特征和所面臨的問題上也有所不同。 與互聯(lián)網(wǎng)大數(shù)據(jù)不同,工業(yè)大數(shù)據(jù)的核心分析技術(shù)必須解決“ 3B”問題:
1、BelowSurface——隱匿性,即需要洞悉背后的意義
與互聯(lián)網(wǎng)上的大數(shù)據(jù)相比,工業(yè)環(huán)境中大數(shù)據(jù)之間最重要的區(qū)別是數(shù)據(jù)特征的提取。工業(yè)大數(shù)據(jù)關(guān)注特征背后的物理意義以及特征之間相關(guān)性的機(jī)制邏輯,而互聯(lián)網(wǎng)大數(shù)據(jù)趨向于僅依靠統(tǒng)計(jì)工具來挖掘?qū)傩灾g的相關(guān)性。
2、Broken——碎片化,即需要避免斷續(xù)、注重時(shí)效性
與互聯(lián)網(wǎng)大數(shù)據(jù)量相比,工業(yè)大數(shù)據(jù)更加注重?cái)?shù)據(jù)的完整性,即面向應(yīng)用的需求具有盡可能全面的使用樣本,以涵蓋工業(yè)過程中各種變化的情況,并確??梢蕴崛?shù)據(jù)以反映對象的真實(shí)狀態(tài)信息的全面性。因此,一方面,工業(yè)大數(shù)據(jù)需要克服后端分析方法中數(shù)據(jù)碎片化所帶來的困難,并使用特征提取和其他手段將這些數(shù)據(jù)轉(zhuǎn)換為有用的信息。 另一方面,它需要從數(shù)據(jù)采集的前端進(jìn)行設(shè)計(jì)。在基于價(jià)值需求的數(shù)據(jù)標(biāo)準(zhǔn)開發(fā)中,在數(shù)據(jù)和信息流通的平臺上構(gòu)建了統(tǒng)一的數(shù)據(jù)環(huán)境。
3、BadQuality——低質(zhì)性,即需要提高數(shù)據(jù)質(zhì)量、滿足低容錯(cuò)性
數(shù)據(jù)碎片缺陷來源的另一個(gè)方面也顯示了對數(shù)據(jù)質(zhì)量的擔(dān)憂。也就是說,數(shù)據(jù)量不能保證數(shù)據(jù)的質(zhì)量,這可能會(huì)導(dǎo)致數(shù)據(jù)可用性較低,因?yàn)榈唾|(zhì)量的數(shù)據(jù)可能會(huì)直接影響分析過程并使結(jié)果無法使用。
但是互聯(lián)網(wǎng)大數(shù)據(jù)卻不同,它只能挖掘和關(guān)聯(lián)數(shù)據(jù)本身,而沒有考慮數(shù)據(jù)本身的含義,也就是說,挖掘的結(jié)果就是結(jié)果。最典型的是,在對超市購物習(xí)慣進(jìn)行數(shù)據(jù)挖掘之后,可以將啤酒架子放在尿布架子的另一側(cè),而不管它們之間的機(jī)制和邏輯關(guān)系如何。 換句話說,與互聯(lián)網(wǎng)大數(shù)據(jù)相比,通常不需要具有精確的結(jié)果推送,工業(yè)大數(shù)據(jù)對預(yù)測和分析結(jié)果的容錯(cuò)率遠(yuǎn)低于互聯(lián)網(wǎng)大數(shù)據(jù)。
在進(jìn)行預(yù)測和決策時(shí),互聯(lián)網(wǎng)大數(shù)據(jù)僅考慮兩個(gè)屬性之間的相關(guān)性是否具有統(tǒng)計(jì)顯著性。當(dāng)樣本量足夠大時(shí),可以忽略個(gè)體之間的噪音和差異。 預(yù)測結(jié)果的準(zhǔn)確性將大大降低。
例如,當(dāng)我覺得應(yīng)該向用戶A電影推薦70%的重要性時(shí),即使用戶不太喜歡這種電影,也不會(huì)造成太嚴(yán)重的后果。但是在工業(yè)環(huán)境中,如果僅通過統(tǒng)計(jì)意義給出分析結(jié)果,則即使是單個(gè)錯(cuò)誤也可能導(dǎo)致嚴(yán)重的后果。
經(jīng)由小編的介紹,不知道你對大數(shù)據(jù)是否充滿了興趣?如果你想對大數(shù)據(jù)有更多的了解,不妨嘗試度娘更多信息或者在我們的網(wǎng)站里進(jìn)行搜索哦。