工業(yè)大數(shù)據(jù)的價(jià)值是怎樣體現(xiàn)出來(lái)的
掃描二維碼
隨時(shí)隨地手機(jī)看文章
由大數(shù)據(jù)驅(qū)動(dòng)的制造業(yè)轉(zhuǎn)型升級(jí),是未來(lái)制造業(yè)提升生產(chǎn)效率、改進(jìn)產(chǎn)品質(zhì)量、節(jié)約資源消耗、保障生產(chǎn)安全、優(yōu)化銷售服務(wù)的必經(jīng)之路,通過(guò)與工業(yè)互聯(lián)網(wǎng)、人工智能、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算等技術(shù)的協(xié)同發(fā)展,工業(yè)大數(shù)據(jù)驅(qū)動(dòng)的的工業(yè)互聯(lián)網(wǎng)必將深度融入實(shí)體經(jīng)濟(jì),成為數(shù)字經(jīng)濟(jì)時(shí)代的新引擎。
工業(yè)互聯(lián)網(wǎng)是以數(shù)字化為基礎(chǔ),網(wǎng)絡(luò)化為支撐,智能化為目標(biāo)。通過(guò)物聯(lián)網(wǎng)技術(shù)對(duì)工業(yè)制造過(guò)程中的人、物、環(huán)境和過(guò)程實(shí)施對(duì)象數(shù)字化,將數(shù)據(jù)通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)的價(jià)值流動(dòng),以數(shù)據(jù)為生產(chǎn)要素,以數(shù)據(jù)的智能分析為基礎(chǔ),實(shí)現(xiàn)智能決策和智能控制,實(shí)現(xiàn)智能優(yōu)化和智慧化運(yùn)營(yíng),創(chuàng)造經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值。
數(shù)據(jù)是工業(yè)互聯(lián)網(wǎng)的一種最重要的生產(chǎn)要素。一個(gè)工廠每天的數(shù)據(jù)以TB計(jì)算,但本質(zhì)上,這些數(shù)據(jù)具有“多”、“雜”等特點(diǎn),良莠不齊。不求隨機(jī)樣本,而是全體數(shù)據(jù);不求精確性,而是混雜性;不求因果,但求相關(guān)。新工業(yè)革命,本質(zhì)上是智能革命,而智能革命的基礎(chǔ)是信息化,大數(shù)據(jù)是根本。沒(méi)有大數(shù)據(jù)對(duì)客觀事物全面、快速、真實(shí)、準(zhǔn)確的信息反饋,任何智能設(shè)備都不可能實(shí)現(xiàn)真正的智能。
那么,如何讓這些“多”、“雜”的工業(yè)大數(shù)據(jù)發(fā)揮其價(jià)值?
一、工業(yè)大數(shù)據(jù)的數(shù)據(jù)挖掘
?。ㄒ唬┮恍┗靖拍?/p>
數(shù)據(jù)挖掘是利用業(yè)務(wù)知識(shí)從數(shù)據(jù)中發(fā)現(xiàn)和解釋知識(shí)(或稱為模式)的過(guò)程,這種知識(shí)是以自然或者人工形式創(chuàng)造的新知識(shí)。這其中有幾個(gè)概念需要了解下:
1、OLTP和OLAP
OLTP(On-line Transaction Processing)聯(lián)機(jī)事務(wù)處理,使事務(wù)應(yīng)用程序僅寫(xiě)入所需的數(shù)據(jù),以便盡快處理單個(gè)事務(wù)。其基本特征是前臺(tái)接收的用戶數(shù)據(jù)可以立即傳送到計(jì)算中心進(jìn)行處理,并在很短的時(shí)間內(nèi)給出處理結(jié)果。
OLAP(On-line AnalyTIcal Processing)聯(lián)機(jī)分析處理,專門設(shè)計(jì)用于支持復(fù)雜的分析操作,側(cè)重對(duì)決策人員和高層管理人員的決策支持,可以根據(jù)分析人員的要求快速、靈活地進(jìn)行大數(shù)據(jù)量的復(fù)雜查詢處理,并且以一種直觀而易懂的形式將查詢結(jié)果提供給決策人員。OLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報(bào)表需求,它的技術(shù)核心是“維”這個(gè)概念,因此OLAP也可以說(shuō)是多維數(shù)據(jù)分析工具的集合。
2、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市
數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,簡(jiǎn)寫(xiě)DW),是為企業(yè)所有級(jí)別的決策制定過(guò)程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個(gè)數(shù)據(jù)存儲(chǔ),出于分析性報(bào)告和決策支持目的而創(chuàng)建。數(shù)據(jù)倉(cāng)庫(kù)在軟硬件領(lǐng)域、Internet 和企業(yè)內(nèi)部網(wǎng)解決方案以及數(shù)據(jù)庫(kù)方面提供了許多經(jīng)濟(jì)高效的計(jì)算資源,可以保存極大量的數(shù)據(jù)供分析使用,且允許使用多種數(shù)據(jù)訪問(wèn)技術(shù)。
數(shù)據(jù)集市(Data Mart) ,也叫數(shù)據(jù)市場(chǎng),從范圍上來(lái)說(shuō),數(shù)據(jù)是從企業(yè)范圍的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù),或者是更加專業(yè)的數(shù)據(jù)倉(cāng)庫(kù)中抽取出來(lái)的。
數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市區(qū)別在于范圍上,前者相當(dāng)于是所有的企業(yè)數(shù)據(jù)的集合,后者重點(diǎn)對(duì)整個(gè)數(shù)據(jù)倉(cāng)庫(kù)內(nèi)進(jìn)行了分類,迎合了專業(yè)用戶群體的特殊需求。
3、數(shù)據(jù)ETL處理
數(shù)據(jù)ETL處理,即數(shù)據(jù)的抽?。‥xtract)、數(shù)據(jù)的清洗(Cleaning)、數(shù)字的轉(zhuǎn)換(Transform)、數(shù)字的裝載(Load)。
(二)工業(yè)大數(shù)據(jù)的數(shù)據(jù)挖掘
1、工業(yè)大數(shù)據(jù)數(shù)據(jù)挖掘流程
數(shù)據(jù)挖掘過(guò)程一般分為數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘和結(jié)果表達(dá)和解釋三個(gè)部分。在數(shù)據(jù)準(zhǔn)備階段,需要對(duì)數(shù)據(jù)集進(jìn)行選取和預(yù)處理。其中數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)變換等。
2、工業(yè)大數(shù)據(jù)數(shù)據(jù)挖掘的基本算法
數(shù)據(jù)挖掘是一種獲得知識(shí)的技術(shù)。其基礎(chǔ)是數(shù)據(jù),其手段是各種算法,其目的是獲得數(shù)據(jù)中所蘊(yùn)含的知識(shí)。數(shù)據(jù)挖掘從一個(gè)新的視角將數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、信息檢索技術(shù)、數(shù)據(jù)可視化和模式識(shí)別與人工智能等領(lǐng)域有機(jī)結(jié)合起來(lái),它能組合各個(gè)領(lǐng)域的優(yōu)點(diǎn),從而能從數(shù)據(jù)中挖掘到其他傳統(tǒng)方法不能發(fā)現(xiàn)的有用知識(shí)。利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析等,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。數(shù)據(jù)挖掘的算法很多,隨著科學(xué)技術(shù)的不斷發(fā)展,新的算法會(huì)不斷地加入。
3、數(shù)據(jù)挖掘的目的
數(shù)據(jù)挖掘分為三層,一是提供數(shù)據(jù)源、數(shù)據(jù)準(zhǔn)備的數(shù)據(jù)層,一個(gè)是提供算法、引擎和界面的算法層,一個(gè)是把數(shù)據(jù)挖掘結(jié)果應(yīng)用于實(shí)踐的應(yīng)用層。
數(shù)據(jù)挖掘目的是可以應(yīng)用于應(yīng)用層實(shí)際應(yīng)用的描述類知識(shí)和預(yù)測(cè)類知識(shí)。
數(shù)據(jù)挖掘不是一個(gè)靜態(tài)的過(guò)程,需要不斷對(duì)模型重新評(píng)估,衡量,修正。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的產(chǎn)生和收集是基礎(chǔ),數(shù)據(jù)挖掘是關(guān)鍵。數(shù)據(jù)挖掘是大數(shù)據(jù)中最關(guān)鍵也最有價(jià)值的工作。通常,數(shù)據(jù)挖掘或知識(shí)發(fā)現(xiàn)泛指從大量數(shù)據(jù)中挖掘出隱含的、先前未知但潛在的有用信息和模式的一個(gè)工程化和系統(tǒng)化的過(guò)程。
?。ㄈ?shù)據(jù)挖掘的4個(gè)特性
1、應(yīng)用性
數(shù)據(jù)挖掘是理論算法和應(yīng)用實(shí)踐的完美結(jié)合。數(shù)據(jù)挖掘源于實(shí)際生產(chǎn)生活中應(yīng)用的需求,挖掘的數(shù)據(jù)來(lái)自于具體應(yīng)用,同時(shí)通過(guò)數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)又要運(yùn)用到實(shí)踐中去,輔助實(shí)際決策。所以,數(shù)據(jù)挖掘來(lái)自于應(yīng)用實(shí)踐,同時(shí)也服務(wù)于應(yīng)用實(shí)踐。
2、工程性
數(shù)據(jù)挖掘是一個(gè)由多個(gè)步驟組成的工程化過(guò)程。數(shù)據(jù)挖掘的應(yīng)用特性決定了數(shù)據(jù)挖掘不僅僅是算法分析和應(yīng)用,而是一個(gè)包含數(shù)據(jù)準(zhǔn)備和管理、數(shù)據(jù)預(yù)處理和轉(zhuǎn)換、挖掘算法開(kāi)發(fā)和應(yīng)用、結(jié)果展示和驗(yàn)證以及知識(shí)積累和使用的完整過(guò)程。而且在實(shí)際應(yīng)用中,典型的數(shù)據(jù)挖掘過(guò)程還是一個(gè)交互和循環(huán)的過(guò)程。
3、集合性
數(shù)據(jù)挖掘是多種功能的集合。常用的數(shù)據(jù)挖掘功能包括數(shù)據(jù)探索分析、關(guān)聯(lián)規(guī)則挖掘、時(shí)間序列模式挖掘、分類預(yù)測(cè)、聚類分析、異常檢測(cè)、數(shù)據(jù)可視化和鏈接分析等。一個(gè)具體的應(yīng)用案例往往涉及多個(gè)不同的功能。不同的功能通常有不同的理論和技術(shù)基礎(chǔ),而且每一個(gè)功能都有不同的算法支撐。
4、交叉性
數(shù)據(jù)挖掘是一個(gè)交叉學(xué)科,它利用了來(lái)自統(tǒng)計(jì)分析、模式識(shí)別、機(jī)器學(xué)習(xí)、人工智能、信息檢索、數(shù)據(jù)庫(kù)等諸多不同領(lǐng)域的研究成果和學(xué)術(shù)思想。同時(shí),一些其他領(lǐng)域如隨機(jī)算法、信息論、可視化、分布式計(jì)算和最優(yōu)化也對(duì)數(shù)據(jù)挖掘的發(fā)展起到重要的作用。數(shù)據(jù)挖掘與這些相關(guān)領(lǐng)域的區(qū)別可以由前面提到的數(shù)據(jù)挖掘的3個(gè)特性來(lái)總結(jié),最重要的是它更側(cè)重于應(yīng)用。
二、基于工業(yè)大數(shù)據(jù)建立數(shù)據(jù)模型
上圖是數(shù)字模型建立的流程圖,其中關(guān)鍵點(diǎn)有幾點(diǎn):
1、確定目標(biāo)
2、選擇變量和變量重構(gòu)
3、選擇算法
4、測(cè)試結(jié)果
三、數(shù)據(jù)+模型=服務(wù)
隨著新一代信息技術(shù)與制造業(yè)的深度融合,工業(yè)企業(yè)的運(yùn)營(yíng)管理,越來(lái)越依賴工業(yè)大數(shù)據(jù)。工業(yè)大數(shù)據(jù)的潛在價(jià)值也日益呈現(xiàn)。隨著越來(lái)越多的生產(chǎn)設(shè)備、零部件、產(chǎn)品以及人力物力不斷加入工業(yè)互聯(lián)網(wǎng),也致使工業(yè)大數(shù)據(jù)呈現(xiàn)出爆炸性增長(zhǎng)的趨勢(shì)。
大數(shù)據(jù)的核心和本質(zhì)是應(yīng)用、算法、數(shù)據(jù)和平臺(tái)4個(gè)要素的有機(jī)結(jié)合,如圖所示。大數(shù)據(jù)是應(yīng)用驅(qū)動(dòng)的,大數(shù)據(jù)來(lái)源于實(shí)踐,海量數(shù)據(jù)產(chǎn)生于實(shí)際應(yīng)用中。
數(shù)據(jù)挖掘源于實(shí)踐中的實(shí)際應(yīng)用需求,用具體的應(yīng)用數(shù)據(jù)作為驅(qū)動(dòng),以算法、工具和平臺(tái)作為支撐,最終將發(fā)現(xiàn)的知識(shí)和信息用到實(shí)踐中去,從而提供量化、合理、可行、能夠產(chǎn)生巨大價(jià)值的信息。另外,挖掘大數(shù)據(jù)所蘊(yùn)含的有用信息,需要設(shè)計(jì)和開(kāi)發(fā)相應(yīng)的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法。算法的設(shè)計(jì)和開(kāi)發(fā)要以具體的應(yīng)用數(shù)據(jù)為驅(qū)動(dòng),同時(shí)也要在實(shí)際問(wèn)題中得到應(yīng)用和驗(yàn)證,而算法的實(shí)現(xiàn)與應(yīng)用需要高效的處理平臺(tái)。高效的處理平臺(tái)需要有效地分析海量的數(shù)據(jù)及對(duì)多源數(shù)據(jù)進(jìn)行集成,同時(shí)有力支持?jǐn)?shù)據(jù)挖掘算法以及數(shù)據(jù)可視化的執(zhí)行,并對(duì)數(shù)據(jù)分析的流程進(jìn)行規(guī)范。總而言之,這個(gè)應(yīng)用、算法、數(shù)據(jù)和平臺(tái)相結(jié)合的思想是對(duì)大數(shù)據(jù)的理解和認(rèn)識(shí)的一個(gè)綜合與凝練,體現(xiàn)了大數(shù)據(jù)的本質(zhì)和核心。建立在此架構(gòu)上的大數(shù)據(jù)挖掘,能夠有效處理大數(shù)據(jù)的復(fù)雜特征,挖掘大數(shù)據(jù)的價(jià)值。
四、結(jié)語(yǔ)
由大數(shù)據(jù)驅(qū)動(dòng)的制造業(yè)轉(zhuǎn)型升級(jí),是未來(lái)制造業(yè)提升生產(chǎn)效率、改進(jìn)產(chǎn)品質(zhì)量、節(jié)約資源消耗、保障生產(chǎn)安全、優(yōu)化銷售服務(wù)的必經(jīng)之路,通過(guò)與工業(yè)互聯(lián)網(wǎng)、人工智能、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算等技術(shù)的協(xié)同發(fā)展,工業(yè)大數(shù)據(jù)驅(qū)動(dòng)的的工業(yè)互聯(lián)網(wǎng)必將深度融入實(shí)體經(jīng)濟(jì),成為數(shù)字經(jīng)濟(jì)時(shí)代的新引擎。
來(lái)源:工業(yè)互聯(lián)網(wǎng)前線