無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合技術(shù)與展望
掃描二維碼
隨時(shí)隨地手機(jī)看文章
引 言
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)是計(jì)算、通信和傳感器技術(shù)相結(jié)合的產(chǎn)物。數(shù)量眾多的傳感器節(jié)點(diǎn)采集觀(guān)測(cè)區(qū)域的熱、光、聲音、速度以及圖像等信號(hào),在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中通過(guò)無(wú)線(xiàn)信道通信實(shí)現(xiàn)信息共享與合作處理,從而將監(jiān)控到的溫度、物種、氣候變化、壓力、方向、速度等傳遞給用戶(hù)[1]。
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)是信息感知和采集領(lǐng)域的一場(chǎng)深刻變革, 目前已在國(guó)防、交通、醫(yī)療、反恐、環(huán)境監(jiān)控以及自然災(zāi)害預(yù)防等領(lǐng)域投入應(yīng)用[2],今后憑借其得天獨(dú)厚的優(yōu)勢(shì)必將給人類(lèi)的生產(chǎn)和生活帶來(lái)深遠(yuǎn)影響。
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)與傳統(tǒng)的Ad-hoc 網(wǎng)絡(luò)差別明顯,主要表現(xiàn)在以數(shù)據(jù)為中心;節(jié)點(diǎn)數(shù)量眾多、密度大;節(jié)點(diǎn)能量、計(jì)算、存儲(chǔ)等能力受限 ;節(jié)點(diǎn)可靠性差 ;數(shù)據(jù)冗余度高;采用多對(duì)一通信模式等。
1 無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)特征
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)常含有大量冗余信息,即使采用專(zhuān)業(yè)的數(shù)據(jù)分析方法也難以解釋數(shù)據(jù)的含義。受所部署地理位置的影響,無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)常常還包含噪聲, 很難將其和 真正的 數(shù)據(jù)分開(kāi)。此外,除非將無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)與時(shí)間和位置信息關(guān)聯(lián),否則無(wú)意義。
相對(duì)于傳統(tǒng)數(shù)據(jù)而言,無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)具有其獨(dú)有的特征,主要表現(xiàn)在三個(gè)方面。
1.1 數(shù)據(jù)流特征
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)自動(dòng)生成,以多路、連續(xù)、時(shí)變的方式傳輸 [3],隨著時(shí)間的推移而增加,且數(shù)據(jù)總量可能非常龐大。這些數(shù)據(jù)具有顯式的時(shí)間戳或者隱式的到達(dá)時(shí)間,是形式按時(shí)間排序的數(shù)據(jù)流。
1.2 強(qiáng)時(shí)空相關(guān)性
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)通常按照一定密度進(jìn)行部署,以便使傳感器覆蓋整個(gè)監(jiān)測(cè)區(qū)域。因此,大部分無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中各節(jié)點(diǎn)間的讀數(shù)會(huì)表現(xiàn)出時(shí)間和空間上的相關(guān)性。這種強(qiáng)時(shí)空相關(guān)性使得某一時(shí)刻某個(gè)傳感器節(jié)點(diǎn)的讀數(shù)不僅對(duì)下一時(shí)刻觀(guān)測(cè)到的讀數(shù)具有高度預(yù)測(cè)指示性,還對(duì)附近節(jié)點(diǎn)的讀數(shù)具有指示性。利用強(qiáng)時(shí)空相關(guān)性可以估計(jì)丟失或損壞的數(shù)據(jù)、監(jiān)測(cè)偏值、提高傳感器數(shù)據(jù)的質(zhì)量、進(jìn)行數(shù)據(jù)抑制、減少網(wǎng)絡(luò)中的數(shù)據(jù)傳輸,從而降低能耗。但強(qiáng)時(shí)空相關(guān)性也會(huì)帶來(lái)大量的冗余數(shù)據(jù)。
1.3 噪聲
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中傳感器的設(shè)計(jì)目標(biāo)是低功耗和低成本。但會(huì)導(dǎo)致傳感器的精度受限,加之傳感器通常部署在嚴(yán)酷的環(huán)境中,會(huì)受到潛在的環(huán)境干擾。因此,傳感器數(shù)據(jù)通常含有錯(cuò)誤(由傳感器功能引起)和噪聲(由其他環(huán)境干擾引起),在把它們存儲(chǔ)到數(shù)據(jù)庫(kù)之前,應(yīng)先對(duì)其進(jìn)行清理。
2 無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中數(shù)據(jù)融合的意義
數(shù)據(jù)融合是一種多源數(shù)據(jù)處理技術(shù),在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中數(shù)據(jù)融合的核心理念就是收集數(shù)據(jù)時(shí),基于傳感器節(jié)點(diǎn)的軟硬件技術(shù)對(duì)所采集數(shù)據(jù)做進(jìn)一步處理,刪除冗余信息,為節(jié)點(diǎn)所需傳輸?shù)臄?shù)據(jù) 瘦身 ,同時(shí)處理多個(gè)不同節(jié)點(diǎn)的數(shù)據(jù), 使匯聚節(jié)點(diǎn)能夠收集到比單個(gè)節(jié)點(diǎn)更加有效、更能滿(mǎn)足用戶(hù)需求的數(shù)據(jù)信息,從而實(shí)現(xiàn)提高資源利用率、延長(zhǎng)網(wǎng)絡(luò)壽命的目的。數(shù)據(jù)融合對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)具有十分重要的意義,主要體現(xiàn)在三個(gè)方面。
2.1 節(jié)約通信帶寬和能量
通過(guò)數(shù)據(jù)融合可以在網(wǎng)內(nèi)對(duì)冗余數(shù)據(jù)進(jìn)行處理,即刪除冗余信息,使要傳輸?shù)臄?shù)據(jù)在可以滿(mǎn)足應(yīng)用所需的前提下盡可能的少。由于傳感器節(jié)點(diǎn)傳輸數(shù)據(jù)消耗的能量高于計(jì)算所消耗能量幾個(gè)數(shù)量級(jí),因此在網(wǎng)內(nèi)數(shù)據(jù)融合過(guò)程中消耗一定的計(jì)算資源來(lái)節(jié)約通信帶寬,不但可以提高傳輸效率,還可以通過(guò)降低節(jié)點(diǎn)的能量消耗延長(zhǎng)整個(gè)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的生命周期。
2.2 提高信息準(zhǔn)確度
通過(guò)數(shù)據(jù)融合技術(shù)對(duì)監(jiān)測(cè)同一對(duì)象的多個(gè)傳感器節(jié)點(diǎn)所采集的數(shù)據(jù)進(jìn)行綜合,可以使最終獲得的數(shù)據(jù)精度和可信度處于一個(gè)較高的水平。因?yàn)楸揉弬鞲衅鞴?jié)點(diǎn)幾乎監(jiān)測(cè)同一區(qū)域, 其所獲數(shù)據(jù)差異性較小。如果個(gè)別節(jié)點(diǎn)出現(xiàn)數(shù)據(jù)錯(cuò)誤或誤差較大,可以通過(guò)網(wǎng)內(nèi)數(shù)據(jù)融合將其過(guò)濾掉。
2.3 提高數(shù)據(jù)收集效率
通過(guò)數(shù)據(jù)融合可以減少需要傳輸?shù)臄?shù)據(jù)量,從而有效減輕網(wǎng)絡(luò)中的數(shù)據(jù)堵塞,減少傳輸過(guò)程中的數(shù)據(jù)沖突和碰撞, 也使數(shù)據(jù)傳輸延遲處于較低水平,從而提高整個(gè)網(wǎng)絡(luò)無(wú)線(xiàn)信道的利用率。
3 數(shù)據(jù)融合過(guò)程
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的數(shù)據(jù)融合過(guò)程包括預(yù)處理、數(shù)據(jù)挖掘和后處理。圖 1 所示為從原始數(shù)據(jù)提取信息的全過(guò)程。
3.1 數(shù)據(jù)預(yù)處理
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)據(jù)通常包含噪聲、偏值和丟 失值。如圖 2 所示,引起這些數(shù)據(jù)質(zhì)量問(wèn)題的原因包括傳感 器內(nèi)部誤差 ;傳感器部署所處的嚴(yán)酷環(huán)境 ;無(wú)線(xiàn)傳輸過(guò)程中 數(shù)據(jù)的損毀和丟失。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清理、丟失值恢復(fù)、 網(wǎng)內(nèi)整合以及偏值檢測(cè)、數(shù)據(jù)壓縮、維數(shù)壓縮和數(shù)據(jù)預(yù)測(cè)等。

3.1.1 數(shù)據(jù)清理
目前已有多種方法用于傳感器數(shù)據(jù)清理,包括貝葉斯理 論、神經(jīng)網(wǎng)絡(luò)、小波、卡爾曼濾波和加權(quán)移動(dòng)平均。由于計(jì)算 能力有限,無(wú)線(xiàn)傳感器網(wǎng)絡(luò)很難實(shí)現(xiàn)貝葉斯理論、神經(jīng)網(wǎng)絡(luò)和 小波方法??柭鼮V波和加權(quán)移動(dòng)平均兩種方法相對(duì)可行。
Zhuang 等人提出了一種基于傳感器數(shù)據(jù)清理的智能加權(quán)移動(dòng)平均方法[4]。該方法包括以下三個(gè)步驟:
(1) 通過(guò)預(yù)測(cè)范圍找出重要數(shù)值 ;
(2) 通過(guò)對(duì)單一傳感器節(jié)點(diǎn)進(jìn)行節(jié)點(diǎn)測(cè)試和鄰居測(cè)試來(lái)增加重要數(shù)值的置信度;
(3) 在匯聚節(jié)點(diǎn)執(zhí)行加權(quán)移動(dòng)平均算法。
這種方法采用卡爾曼濾波和線(xiàn)性回歸進(jìn)行范圍預(yù)測(cè)。在預(yù)測(cè)范圍內(nèi)的值被稱(chēng)為 重要值 ,并在第二步中計(jì)算其置信度。最后,在匯聚節(jié)點(diǎn)結(jié)合時(shí)間平均和空間平均進(jìn)行移動(dòng)加權(quán)平均。
3.1.2 丟失值恢復(fù)
對(duì)于解決網(wǎng)絡(luò)數(shù)據(jù)丟失的問(wèn)題,傳統(tǒng)的方法是在接收方向發(fā)送方發(fā)送一個(gè)重傳請(qǐng)求之前,等待一個(gè)預(yù)定義的時(shí)間周期,或者發(fā)送方?jīng)]有收到來(lái)自接收方的確認(rèn),則自動(dòng)重傳數(shù)據(jù)包。使用這種方法主要有兩個(gè)缺點(diǎn),即增加傳感器功耗,增加由查詢(xún)產(chǎn)生的結(jié)果延遲。因此,在處理傳感器數(shù)據(jù)丟失的現(xiàn)有研究中,重點(diǎn)是使用與丟失的傳感器數(shù)據(jù)有關(guān)的傳感器中的可用數(shù)據(jù)來(lái)估計(jì)或恢復(fù)丟失的數(shù)據(jù)。
目前已經(jīng)提出了多種估計(jì)方法,如最大期望算法、關(guān)聯(lián) 規(guī)則算法和信任傳播算法。最大期望算法是一種使完整數(shù)據(jù) 似然性收斂到局部極大值的通用方法,即觀(guān)測(cè)的數(shù)據(jù)和丟失 的數(shù)據(jù)似然性?!癊”步計(jì)算節(jié)點(diǎn)丟失值的期望或可能性 p(Y|X, θ),其中 X 表示觀(guān)測(cè)的數(shù)據(jù),Y 表示丟失值,θ 表示統(tǒng)計(jì)模型 參數(shù)。根據(jù)丟失值的期望,“M”步計(jì)算使完整數(shù)據(jù)似然性最 大的期望值為 θ。
3.1.3 網(wǎng)內(nèi)數(shù)據(jù)整合
大量冗余數(shù)據(jù)可能會(huì)放緩或混淆知識(shí)發(fā)現(xiàn)過(guò)程。冗余數(shù)據(jù)的網(wǎng)內(nèi)整合可以減少整個(gè)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的數(shù)據(jù)流,從而使用最少的資源提取最具代表性的數(shù)據(jù),這樣可以有效降低功耗。因此,傳感器數(shù)據(jù)預(yù)處理研究的一個(gè)分支是關(guān)注WSN 的傳感器數(shù)據(jù)壓縮。
最簡(jiǎn)單的情況是,當(dāng)原始數(shù)據(jù)大于預(yù)定義的閾值時(shí),求出原始數(shù)據(jù)的平均值并記錄該平均值。如下所列為結(jié)構(gòu)化查詢(xún)語(yǔ)言SQL 中的平均整合查詢(xún)語(yǔ)句,AVG 為傳感器采集的平均溫度值。如果該平均值大于閾值,則通過(guò) Having AVG , 發(fā)送平均值,采樣周期為 30 s。
SELECT AVG(temperature),F(xiàn)ROM Sensors
WHERE floor=6
HAVING AVG(tempreature)> threshold
SAMPLE PERIOD 30s
Akcan 和Br?nnimann 提出了一種加權(quán)網(wǎng)內(nèi)采樣算法來(lái)獲得確定性更小、更典型的樣本而非原始冗余數(shù)據(jù) [5]。與隨機(jī)采樣相比,加權(quán)采樣的優(yōu)勢(shì)在于它可以保證每個(gè)節(jié)點(diǎn)的數(shù)據(jù)都有相同的機(jī)會(huì)歸屬最終樣本,而獨(dú)立于其網(wǎng)絡(luò)來(lái)源。
Santini 和R?mer 提出的基于預(yù)測(cè)數(shù)據(jù)壓縮的策略不是有選擇的對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行采樣,而是將預(yù)測(cè)方法部署在傳感器和匯聚節(jié)點(diǎn)[6]。這樣,傳感器只需發(fā)送偏離預(yù)期值的數(shù)據(jù)。具體方法如下:
在匯聚節(jié)點(diǎn)和傳感器節(jié)點(diǎn)運(yùn)用預(yù)測(cè)模型 G來(lái)獲得下一時(shí)刻傳感器讀數(shù)的估計(jì)值 Xt+1=G(Xt)。
在傳感器節(jié)點(diǎn),如果|Xt+1- Xt+1|>ε,就向匯聚節(jié)點(diǎn)發(fā)送實(shí)際傳感器讀數(shù)。其中,Xt+1為下一時(shí)刻傳感器的實(shí)際讀數(shù),ε 為容忍誤差。
匯聚節(jié)點(diǎn)使用傳感器讀數(shù)的估計(jì)值。
3.2 傳感器數(shù)據(jù)挖掘
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的數(shù)據(jù)挖掘是將傳統(tǒng)的數(shù)據(jù)挖掘算法,如主分量分析(Principal Component Analysis,PCA)、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、回歸分析和聚類(lèi)方法等應(yīng)用到無(wú)線(xiàn)傳感器網(wǎng)絡(luò),避免原始數(shù)據(jù)的直接傳輸,減少傳輸中的數(shù)據(jù)量。Catterall等首次將SOM 神經(jīng)網(wǎng)絡(luò)引入無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的網(wǎng)內(nèi)數(shù)據(jù)處理中[7],Kulakov等對(duì)此做了進(jìn)一步研究[8],提出了兩種神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘結(jié)構(gòu):
1)簇頭收集各傳感器節(jié)點(diǎn)的數(shù)據(jù), 然后執(zhí)行 Fuzzy ART算法進(jìn)行分類(lèi);
2)各傳感器節(jié)點(diǎn)執(zhí)行 FuzzyART算法對(duì)自己收集的數(shù)據(jù)分類(lèi),將初步結(jié)果傳送到簇頭。
回歸分析是無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的一種網(wǎng)內(nèi)數(shù)據(jù)處理框架。通過(guò)將數(shù)據(jù)投影成低緯表示,可以精確表示原始數(shù)據(jù)的結(jié)構(gòu), 同時(shí)有效減少網(wǎng)內(nèi)的數(shù)據(jù)量。具體方法是使用線(xiàn)性回歸來(lái)完成投影,即數(shù)據(jù)用函數(shù)的帶權(quán)線(xiàn)性組合來(lái)近似。Wu 等將貝葉斯網(wǎng)絡(luò)引入無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的網(wǎng)內(nèi)數(shù)據(jù)處理 [9],在目標(biāo)追蹤和數(shù)據(jù)推斷等方面取得了比較好的結(jié)果。
無(wú)線(xiàn)傳感器數(shù)據(jù)挖掘主要致力于分布式網(wǎng)內(nèi)數(shù)據(jù)挖掘。大多數(shù)研究人員提出將層次化網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)用于傳感器數(shù)據(jù)挖掘。Bontempi 等提出了一種用于傳感器數(shù)據(jù)挖掘的二層結(jié)構(gòu)[10],而這是一種傳感器數(shù)據(jù)挖掘的自適應(yīng)模塊化結(jié)構(gòu),如圖 3所示。
底層由用虛線(xiàn)表示的匯聚節(jié)點(diǎn)構(gòu)成,完成用黑點(diǎn)表示的相鄰傳感器節(jié)點(diǎn)的聚合。匯聚后的信號(hào)被送到上一層進(jìn)行數(shù)據(jù)挖掘。在這里要完成的感知任務(wù)有分類(lèi)、回歸和預(yù)測(cè)等。該結(jié)構(gòu)在WSN 拓?fù)渲幸肓藚R聚節(jié)點(diǎn)層,每個(gè)匯聚節(jié)點(diǎn)都作為一些傳感器節(jié)點(diǎn)的簇頭。
3.3 傳感器數(shù)據(jù)后處理
數(shù)據(jù)后處理包括模式評(píng)估、模型評(píng)估、數(shù)據(jù)可視化和表示等。通過(guò)這一步可以把傳感器數(shù)據(jù)挖掘的結(jié)果和特定應(yīng)用進(jìn)行關(guān)聯(lián)。數(shù)據(jù)可視化可以基于計(jì)算機(jī)圖形、統(tǒng)計(jì)方法或基于用戶(hù)交互技術(shù)。
4結(jié) 語(yǔ)
隨著廉價(jià)且強(qiáng)大的傳感器、通信系統(tǒng)和信息技術(shù)實(shí)用性的不斷提升,在一些主流領(lǐng)域,無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合技術(shù)已日漸成熟,能夠提供已被苛刻應(yīng)用所驗(yàn)證一致、強(qiáng)大的方法和算法庫(kù),通過(guò)挖掘其內(nèi)在潛能,進(jìn)行新產(chǎn)品的研究和開(kāi)發(fā)就具備了良好的基礎(chǔ),開(kāi)發(fā)周期將會(huì)大大縮短,涉及的風(fēng)險(xiǎn)也會(huì)隨之降低。
未來(lái)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合技術(shù)必將大顯身手,特別是在要將物理或技術(shù)方面的傳感器數(shù)據(jù)與定量的上下文信息進(jìn)行融合的領(lǐng)域。如將通信與分布式數(shù)據(jù)融合體系緊密聯(lián)系在一起的融合驅(qū)動(dòng)通信,將可用的量化非傳感器信息與傳感器數(shù)據(jù)通過(guò)上下文數(shù)據(jù)集成進(jìn)行融合從而形成綜合數(shù)據(jù)庫(kù),將聯(lián)想推理、合理的協(xié)商妥協(xié)、專(zhuān)家知識(shí)和態(tài)勢(shì)評(píng)估等融入無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合的人工輔助系統(tǒng),為了應(yīng)付跨區(qū)域復(fù)雜地形以及 非對(duì)稱(chēng) 對(duì)手的網(wǎng)絡(luò)中心作戰(zhàn)以及利用無(wú)線(xiàn)電臺(tái)、電視或移動(dòng)電話(huà)基站等潛在發(fā)射站對(duì)目標(biāo)進(jìn)行照射,形成無(wú)處不在的被動(dòng)監(jiān)視網(wǎng)絡(luò)。