物聯(lián)網(wǎng)不僅收集分析數(shù)據(jù)還會(huì)自我提升
如今是信息時(shí)代,得數(shù)據(jù)者得天下。然而,只是“有”數(shù)據(jù)還不夠,數(shù)據(jù)的“準(zhǔn)確性”和數(shù)據(jù)的“分析”也是至關(guān)重要的。愛(ài)因斯坦也說(shuō)過(guò):“能用的不一定有用,有用的也不一定能用。”
“數(shù)據(jù)”和“信息”不是一碼事。“數(shù)據(jù)”說(shuō)的是一堆未經(jīng)處理的原始測(cè)量結(jié)果,我們要分析它,取其精華去其糟粕,以用于獲得有用的信息。所以咱們常說(shuō)的“信息過(guò)載”其實(shí)不對(duì),“數(shù)據(jù)”可能會(huì)過(guò)載,但“信息”越多越好。數(shù)據(jù)本身不一定有用,因?yàn)槿绻麤](méi)有經(jīng)過(guò)適當(dāng)?shù)暮Y選,數(shù)據(jù)可能像假新聞一樣,使我們誤入歧途。
過(guò)去十年間,我們的數(shù)據(jù)量實(shí)現(xiàn)了爆炸式增長(zhǎng)?!都~約時(shí)報(bào)》報(bào)道,2005年全球數(shù)據(jù)總量達(dá)到1300億GB?,F(xiàn)在的公司經(jīng)常要處理數(shù)以PB記的數(shù)據(jù)。隨著數(shù)據(jù)源的飛速增長(zhǎng),數(shù)據(jù)的獲取速度也越來(lái)越快??萍歼M(jìn)步如此迅速,轉(zhuǎn)眼已是滄海桑田。據(jù)@HistoricalPics推特所述,1956年一個(gè)5MB硬盤要超過(guò)2000磅重,IBM要用一架飛機(jī)才能運(yùn)輸!低頭看看巴掌大的手機(jī),不由得心生感慨。
隨著對(duì)人們活動(dòng)和傳感器的測(cè)量,數(shù)據(jù)類型也在不斷增加。而我們要記?。簲?shù)據(jù),只有經(jīng)過(guò)了分析,變成了信息才有用。
物聯(lián)網(wǎng)的優(yōu)勢(shì)在于它能實(shí)時(shí)獲取、組織數(shù)據(jù)。如果架構(gòu)正確,物聯(lián)網(wǎng)可以把數(shù)據(jù)變成有用的信息,用來(lái)決定下一步怎么辦。
KrisTIan J. Hammond在《哈佛商業(yè)評(píng)論》中曾擲地有聲地說(shuō):“大多數(shù)時(shí)候,我們都知道我們想從數(shù)據(jù)中得到什么:我們知道需要分析什么東西、需要尋找什么相關(guān)性、需要怎么比較。我們可以把數(shù)據(jù)交給一個(gè)可以勝任這些工作的機(jī)器,然后讓它用人類的方式、用自然語(yǔ)言告訴我們結(jié)果。這樣,我們就能穩(wěn)定、迅速地從數(shù)據(jù)中提取到大量有用信息——但如今還沒(méi)有實(shí)現(xiàn)。通過(guò)輔以機(jī)器的力量,我們可以全自動(dòng)地從數(shù)據(jù)中淘金,讓冰冷的數(shù)字變成感性的認(rèn)知。“
如何發(fā)現(xiàn)數(shù)據(jù)的內(nèi)涵?
物聯(lián)網(wǎng)之前,分析傳感器各式各樣的海量數(shù)據(jù)非常困難。通過(guò)物聯(lián)網(wǎng)技術(shù),我們可以把機(jī)器得到的數(shù)據(jù)放入數(shù)據(jù)池自動(dòng)分析,以決定下一步需要對(duì)數(shù)據(jù)和程序做些什么。物聯(lián)網(wǎng)不僅收集、分析數(shù)據(jù),它還會(huì)自我提升。
在介紹具體步驟前,我們先明確兩個(gè)在討論數(shù)據(jù)傳輸時(shí)常用的術(shù)語(yǔ):“北向(northbound)”和“南向(southbound)”。“北向數(shù)據(jù)”是指從設(shè)備發(fā)出,通過(guò)網(wǎng)關(guān),送至云端的數(shù)據(jù),一般是遙測(cè)數(shù)據(jù),也可能是命令和控制請(qǐng)求。“南向數(shù)據(jù)”則是從云發(fā)至網(wǎng)關(guān),或者從云通過(guò)網(wǎng)關(guān)發(fā)至設(shè)備,一般是命令和控制信息(如軟件的更新,請(qǐng)求、更改配置參數(shù)等)。
以下是利用南、北行信道,從探測(cè)數(shù)據(jù)中找到有用信息的方法:
第一步 :傳感器發(fā)出北向遙測(cè)數(shù)據(jù)。根據(jù)架構(gòu)的不同,這些數(shù)據(jù)會(huì)被預(yù)處理,然后發(fā)送到位于傳感器附近的數(shù)據(jù)存儲(chǔ)器(比如一個(gè)網(wǎng)關(guān))。
第二步 :在網(wǎng)關(guān)這個(gè)臨時(shí)節(jié)點(diǎn)上對(duì)數(shù)據(jù)進(jìn)行一定量的分析,你可以在這處理數(shù)據(jù)(例如匯總數(shù)據(jù),或者轉(zhuǎn)換數(shù)據(jù),為數(shù)據(jù)中心或云深入分析做好準(zhǔn)備)。然后,把在網(wǎng)關(guān)上處理的信息和之前的精確結(jié)果比對(duì),就是在歷史信息中進(jìn)行相關(guān)性匹配。發(fā)現(xiàn)的模式可以作為我們行動(dòng)的依據(jù)。但除了發(fā)現(xiàn)已知模式,你也想找到你不知道的東西,想發(fā)現(xiàn)新的相關(guān)性和結(jié)論。例如,你可能不知道當(dāng)氣溫降到10℃以下時(shí),醫(yī)生開(kāi)出的抗流感處方會(huì)增加30%,而同時(shí)雞湯、紙巾的銷售額也會(huì)10天內(nèi)上升。你以前可能沒(méi)注意到這些關(guān)聯(lián),但現(xiàn)在有了物聯(lián)網(wǎng),你就可以用這些做出新的商業(yè)決策。
第三步 :利用新的信息,您就可以建立一個(gè)規(guī)則。例如,當(dāng)傳感器發(fā)現(xiàn)溫度已經(jīng)降到10℃以下時(shí),就讓倉(cāng)庫(kù)把雞湯和紙巾運(yùn)到碼頭附近。這樣,你就把信息變成了可監(jiān)控、管理、執(zhí)行的行事規(guī)則。
第四步 :最后把制定好的規(guī)則付諸實(shí)踐。就是如圖所示的迭代過(guò)程。
開(kāi)源何益?
開(kāi)源軟件項(xiàng)目提供了標(biāo)準(zhǔn)化的工具包(例如Camel、Drools),你可以用它處理、操作數(shù)據(jù)。Apache Camel是一種基于Java規(guī)則的路由和中介引擎,具有可以處理數(shù)據(jù)的企業(yè)集成模式。它通過(guò)“開(kāi)箱即用”(out-of-the-box)的信息中介、路由、數(shù)據(jù)轉(zhuǎn)換,可以聯(lián)網(wǎng)解決方案的開(kāi)發(fā)。我認(rèn)為最好通過(guò)Eclipse IoT工作組項(xiàng)目(如Eclipse Kapua、Kura)在IoT中使用Apache Camel。
JBoss社區(qū)的Drools是一個(gè)內(nèi)置了規(guī)則模板的業(yè)務(wù)規(guī)則管理系統(tǒng),你可以用它規(guī)定在什么情況下應(yīng)該采取什么措施。Drools通過(guò)定義明確的DSL(域特定語(yǔ)言)來(lái)實(shí)現(xiàn)物聯(lián)網(wǎng)所需的規(guī)則和優(yōu)化規(guī)則引擎所需的可擴(kuò)展性。它還附帶一個(gè)名為Workbench的GUI,可以讓開(kāi)發(fā)者非常簡(jiǎn)單地創(chuàng)建、編輯規(guī)則。
把數(shù)據(jù)轉(zhuǎn)化為有用的信息是所有物聯(lián)網(wǎng)工作的核心,而通過(guò)開(kāi)源軟件可以實(shí)現(xiàn)這一目標(biāo),這有助于加速將物聯(lián)網(wǎng)付諸實(shí)踐。