應(yīng)可珍,周賢年,毛科技,陳慶章
1(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,杭州 310014) 2(浙江財(cái)經(jīng)大學(xué) 東方學(xué)院,浙江 海寧 314408)
無線傳感器網(wǎng)絡(luò)的主要功能是數(shù)據(jù)采集,在大規(guī)模的多跳自組織傳感器網(wǎng)絡(luò)中,大量的數(shù)據(jù)被采集和轉(zhuǎn)發(fā),導(dǎo)致傳感器節(jié)點(diǎn)消耗大量能量而使得傳感器網(wǎng)絡(luò)過早死亡.目前的研究主要通過在WSN中進(jìn)行數(shù)據(jù)融合從而降低數(shù)據(jù)冗余量,減少WSN能量消耗.如參考文獻(xiàn)[1]提出了一種多稀疏基分簇壓縮感知的WSN數(shù)據(jù)融合方法,該方法首先基于多稀疏基對(duì)WSN網(wǎng)絡(luò)進(jìn)行分簇,然后選擇能力強(qiáng)的節(jié)點(diǎn)出任簇首,在簇首中進(jìn)行數(shù)據(jù)融合,最終將融合后的數(shù)據(jù)發(fā)送至Sink節(jié)點(diǎn).文獻(xiàn)[2]提出了一種誤差可控的WSN數(shù)據(jù)融合算法,該方法在基于WSN分簇的條件下,傳感器節(jié)點(diǎn)根據(jù)歷史數(shù)據(jù)動(dòng)態(tài)調(diào)整傳輸閾值,實(shí)現(xiàn)有效控制數(shù)據(jù)融合的誤差并減少了網(wǎng)絡(luò)中大量的冗余數(shù)據(jù).文獻(xiàn)[3]提出了一種基于異常數(shù)據(jù)驅(qū)動(dòng)的WSN簇內(nèi)數(shù)據(jù)融合方法,該方法首先對(duì)節(jié)點(diǎn)進(jìn)行分簇,簇首節(jié)點(diǎn)判斷是否出現(xiàn)異常數(shù)據(jù),當(dāng)出現(xiàn)異常數(shù)據(jù)時(shí),將該數(shù)據(jù)傳輸至Sink節(jié)點(diǎn).文獻(xiàn)[4]提出一種數(shù)據(jù)融合方法,該方法通過貝葉斯估計(jì)與聚類方法將誤差數(shù)據(jù)進(jìn)行排除提高融合后數(shù)據(jù)的準(zhǔn)確性,融合后網(wǎng)絡(luò)中減少了大量的冗余數(shù)據(jù).文獻(xiàn)[5-9]都研究了利用數(shù)據(jù)融合方法減少傳感器網(wǎng)絡(luò)中的數(shù)據(jù)量從而節(jié)約網(wǎng)絡(luò)的能耗.
目前在降低傳感器網(wǎng)絡(luò)冗余數(shù)據(jù)量方面的研究,大部分的做法是將傳感器網(wǎng)絡(luò)進(jìn)行分簇,然后簇首節(jié)點(diǎn)進(jìn)行簇內(nèi)數(shù)據(jù)融合,最終將融合后的數(shù)據(jù)發(fā)送至Sink節(jié)點(diǎn)[10,11],但是這些研究需要傳感器網(wǎng)絡(luò)中所有的節(jié)點(diǎn)都需要進(jìn)行數(shù)據(jù)采集且每次采集數(shù)據(jù)后簇首節(jié)點(diǎn)都需要進(jìn)行數(shù)據(jù)融合,導(dǎo)致簇首節(jié)點(diǎn)能量和傳感器網(wǎng)絡(luò)的平均能量消耗過快.經(jīng)過分析傳感器網(wǎng)絡(luò)采集的數(shù)據(jù)在小范圍內(nèi)冗余情況比較嚴(yán)重,即小范圍內(nèi)的采集數(shù)據(jù)是相關(guān)聯(lián)的,如果能夠?qū)⒈O(jiān)測(cè)區(qū)域劃分為若干個(gè)小范圍區(qū)域,而每個(gè)區(qū)域內(nèi)采集的數(shù)據(jù)都比較接近,則可在每個(gè)區(qū)域中選擇一個(gè)代表節(jié)點(diǎn)進(jìn)行數(shù)據(jù)采集,關(guān)閉小范圍區(qū)域內(nèi)其他傳感器節(jié)點(diǎn),從而能夠大幅降低傳感器網(wǎng)絡(luò)冗余數(shù)據(jù)的采集.在圖像分割中,區(qū)域生長算法能夠較好的完成相近像素區(qū)域的劃分,因此本文對(duì)區(qū)域生長算法進(jìn)行改進(jìn),并提出一種改進(jìn)區(qū)域生長法的WSN數(shù)據(jù)采集算法,該算法首先在網(wǎng)絡(luò)中隨機(jī)的選取種子節(jié)點(diǎn),然后利用區(qū)域生長法將傳感器網(wǎng)絡(luò)分割為若干子區(qū)域[12-15],每個(gè)子區(qū)域中傳感器節(jié)點(diǎn)采集的數(shù)據(jù)相似性極高,接著在子區(qū)域中選擇代表節(jié)點(diǎn),最后將代表節(jié)點(diǎn)采集的數(shù)據(jù)發(fā)送至Sink節(jié)點(diǎn),完成數(shù)據(jù)采集.
1)傳感器網(wǎng)絡(luò)中節(jié)點(diǎn)的位置已經(jīng)通過GPS、WSN定位等方法獲取,且在小范圍內(nèi),傳感器節(jié)點(diǎn)采集的數(shù)值大小接近.如無線傳感器網(wǎng)絡(luò)采集樹林中的溫度,在小范圍內(nèi)溫度值都是非常接近的.
2)傳感器網(wǎng)絡(luò)中所有節(jié)點(diǎn)同構(gòu),每個(gè)節(jié)點(diǎn)的初始能量相同且都為E0.
3)本文提出的數(shù)據(jù)采集算法需要變更路由,但這不是本文研究的重點(diǎn),假設(shè)無線傳感器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化時(shí),能夠自行重新組織路由.
4)本文將N個(gè)傳感器節(jié)點(diǎn)均勻部署在一個(gè)長為L,寬為H的矩形區(qū)域中.
1)傳感器節(jié)點(diǎn)的感知半徑為r,如圖1所示,傳感器節(jié)點(diǎn)i采集的數(shù)據(jù)能夠代表感知范圍內(nèi)任一數(shù)據(jù)采樣點(diǎn)的數(shù)據(jù)信息,因此本文對(duì)傳感器節(jié)點(diǎn)i的相鄰傳感器節(jié)點(diǎn)的定義N(i,j)如公式(1)所示.
圖1 感知范圍圖Fig.1 Range of sensing
(1)
公式(1)中N(i,j)為1則表示節(jié)點(diǎn)i與節(jié)點(diǎn)j相鄰,為0則表明節(jié)點(diǎn)i與節(jié)點(diǎn)j不相鄰,ed(i,j)為歐式距離.
2)冗余數(shù)據(jù):假設(shè)傳感器節(jié)點(diǎn)i與傳感器節(jié)點(diǎn)j之間的距離小于節(jié)點(diǎn)感知半徑r,且節(jié)點(diǎn)i與節(jié)點(diǎn)j采集的相對(duì)誤差小于10%,則認(rèn)為傳感器節(jié)點(diǎn)i和節(jié)點(diǎn)j采集的數(shù)據(jù)為冗余數(shù)據(jù).
根據(jù)假設(shè)1,小范圍內(nèi)傳感器網(wǎng)絡(luò)采集的數(shù)據(jù)趨向一致性,因此本文通過區(qū)域生長算法將數(shù)據(jù)接近的區(qū)域進(jìn)行劃分,然后在該區(qū)域內(nèi)選擇一個(gè)代表節(jié)點(diǎn),該代表節(jié)點(diǎn)采集的數(shù)據(jù)與該子區(qū)域的數(shù)值和數(shù)據(jù)變化趨勢(shì)最接近,然后將代表節(jié)點(diǎn)的數(shù)據(jù)傳輸至Sink節(jié)點(diǎn),利用代表節(jié)點(diǎn)采集的數(shù)據(jù)代表子區(qū)域的數(shù)據(jù).本章3.1小節(jié)介紹了區(qū)域生長法種子點(diǎn)的選取,3.2小節(jié)研究了根據(jù)種子節(jié)點(diǎn)進(jìn)行相似區(qū)域的生長過程.
種子節(jié)點(diǎn)的選取主要考慮分布均勻原則,種子節(jié)點(diǎn)在傳感器網(wǎng)絡(luò)部署區(qū)域中分布均勻,才能全面的采集部署區(qū)域的信息.本文采用隨機(jī)數(shù)方法選取種子節(jié)點(diǎn),傳感器網(wǎng)絡(luò)中每個(gè)傳感器節(jié)點(diǎn)k都能生成一個(gè)(0,1)之間均勻分布的隨機(jī)數(shù)rand(k),當(dāng)rand(k)大于閾值T時(shí),則該節(jié)點(diǎn)稱為種子節(jié)點(diǎn),閾值T如公式(2)所示.
T=1-P
(2)
公式(2)中P為傳感器網(wǎng)絡(luò)中需要選取種子節(jié)點(diǎn)的百分比.
由于本文的隨機(jī)數(shù)滿足均勻分布,因此選擇的種子節(jié)點(diǎn)能夠均勻分布在部署區(qū)域中,保證了監(jiān)測(cè)區(qū)域的完整性.在后期重新選擇節(jié)種子節(jié)點(diǎn)時(shí),由于每個(gè)節(jié)點(diǎn)生成均勻隨機(jī)數(shù),因此所有節(jié)點(diǎn)等概率的成為種子節(jié)點(diǎn),避免了某些節(jié)點(diǎn)重復(fù)成為種子節(jié)點(diǎn)的可能性.
區(qū)域生長算法能夠較好的進(jìn)行相似屬性區(qū)域的劃分,如圖像研究中可以利用區(qū)域生長法分割像素相似的區(qū)域,將像素值接近的部分劃分到同一塊區(qū)域中,而像素值差距較大的部分劃分為不同區(qū)域,且區(qū)域生長法劃分的區(qū)域在物理位置上是連續(xù)的,因此將區(qū)域生長法進(jìn)行相應(yīng)的改進(jìn)后能夠適用于WSN相似區(qū)域的劃分.
傳統(tǒng)的區(qū)域生長法一般用于圖像分割,如圖2所示,圖2(a)為像素點(diǎn)編號(hào),圖2(b)為像素點(diǎn)對(duì)應(yīng)的像素值,首先從種子點(diǎn)1開始生長,判斷種子點(diǎn)4鄰域(2、3、4、5號(hào)像素點(diǎn))的像素點(diǎn)與種子點(diǎn)像素值之差的絕對(duì)值是否小于一定閾值(這里閾值為1),如果小于閾值,則往該像素點(diǎn)方向生長,最終結(jié)果如圖2(c)所示,區(qū)域第一步向4號(hào)像素點(diǎn)生長,接著以4號(hào)節(jié)點(diǎn)為種子節(jié)點(diǎn),向6號(hào)像素點(diǎn)生長,直到達(dá)到區(qū)域生長結(jié)束條件,算法停止迭代,完成區(qū)域生長.區(qū)域生長后,同一片區(qū)域的像素值大小非常接近.
圖2 區(qū)域生長原理圖Fig.2 Principle of region growing method
上述介紹了區(qū)域生長法在圖像分割中的應(yīng)用,發(fā)現(xiàn)區(qū)域生長經(jīng)過改進(jìn)后同樣可以應(yīng)用于WSN相似區(qū)域生長問題.在WSN網(wǎng)絡(luò)中并不采用圖像中的四鄰域或八鄰域等,而是采用相鄰傳感器節(jié)點(diǎn)作為區(qū)域生長法的鄰域,可通過公式(1)判斷傳感器節(jié)點(diǎn)是否相鄰.
在初始時(shí)刻,傳感器網(wǎng)絡(luò)已經(jīng)采集了一部分?jǐn)?shù)據(jù),假設(shè)節(jié)點(diǎn)j采集的數(shù)據(jù)為datai={d1,d2,d3,…,dm},j∈「1,N?,且節(jié)點(diǎn)j是種子節(jié)點(diǎn)i的相鄰傳感器節(jié)點(diǎn),當(dāng)節(jié)點(diǎn)j滿足公式(3)時(shí),區(qū)域向節(jié)點(diǎn)j方向生長.
|avg(dataj)-avg(datai)|≤Td
(3)
公式(3)中Td為閾值,可根據(jù)實(shí)際情況取值,avg為求集合元素平均值的函數(shù),datai是種子節(jié)點(diǎn)采集的歷史數(shù)據(jù).
通過3.1小節(jié)方法選擇的種子節(jié)點(diǎn)編號(hào)集合為S={s1,s2,s3,…,sk,…,ssum},具體的WSN相似區(qū)域生長算法如表1所示,最終傳感器網(wǎng)絡(luò)被分割為sum個(gè)子區(qū)域,如圖3所示,每個(gè)子區(qū)域中的傳感器節(jié)點(diǎn)采集的數(shù)據(jù)信息相似性較高.
圖3 區(qū)域生長圖Fig.3 Region growing
表1 WSN相似區(qū)域生長算法表Table 1 Similar region growing algorithm
本章第2節(jié)研究了傳感器網(wǎng)絡(luò)節(jié)點(diǎn)相似區(qū)域劃分方法,本章主要研究在子區(qū)域中選擇一個(gè)代表節(jié)點(diǎn),該代表節(jié)點(diǎn)采集的數(shù)據(jù)能夠代表整個(gè)子區(qū)域的數(shù)據(jù)信息,因此代表節(jié)點(diǎn)采集的數(shù)據(jù)應(yīng)該與整個(gè)子區(qū)域的傳感器節(jié)點(diǎn)采集的數(shù)據(jù)大小最接近且數(shù)據(jù)變化趨勢(shì)也最符合.
代表節(jié)點(diǎn)的歷史數(shù)據(jù)曲線a與子區(qū)域中所有傳感器節(jié)點(diǎn)歷史數(shù)據(jù)均值曲線b應(yīng)該滿足以下兩種情況之一:
1)曲線a與曲線b的變化趨勢(shì)始終一致,且數(shù)值大小最接近.
2)曲線a與曲線b初始時(shí)刻趨勢(shì)不一致,且數(shù)值大小也不一定接近,但是到后來兩條曲線逐漸逼近,且數(shù)值大小也越來越接近.
上述兩種情況如圖4所示,因?yàn)殡S著環(huán)境信息的改變,傳感器節(jié)點(diǎn)采集的數(shù)據(jù)也會(huì)隨之改變,因此初始時(shí)刻曲線a與曲線b不吻合,但是隨著時(shí)間的推移,代表節(jié)點(diǎn)的歷史數(shù)據(jù)曲線a可能與曲線b吻合程度較好.
圖4 歷史數(shù)據(jù)曲線圖Fig.4 Historical data graph
針對(duì)上述兩種曲線相似情況,提出了一種適宜的曲線相似性描述方法,假設(shè)某個(gè)子區(qū)域的歷史數(shù)據(jù)均值曲線b可描述為點(diǎn)集合avg_data={Y1,Y2,Y3,…,Yt,…,Ym},m為歷史數(shù)據(jù)數(shù)量,子區(qū)域中一個(gè)傳感器節(jié)點(diǎn)的歷史數(shù)據(jù)曲線a可描述為點(diǎn)集合data={y1,y2,y3,…,yt,…,ym},則曲線a與b的相似度計(jì)算方法如公式(4)所示.
(4)
公式(4)中h為子區(qū)域中傳感器節(jié)點(diǎn)的數(shù)量,G是一個(gè)常數(shù),表示誤差范圍,S表示曲線相似度,S越接近1,表明兩條曲線的相似度越高,而且該相似度計(jì)算公式為較后面的歷史數(shù)據(jù)分配的權(quán)重值越大,因此能夠較好的適用于本文中曲線相似度的描述.
在子區(qū)域中選擇代表節(jié)點(diǎn)的具體步驟如下:
1)求子區(qū)域中所有傳感器節(jié)點(diǎn)(h個(gè)節(jié)點(diǎn))每個(gè)時(shí)刻采集數(shù)據(jù)的平均值,即計(jì)算avg_data;
2)遍歷子區(qū)域中所有傳感器節(jié)點(diǎn),并利用公式(4)計(jì)算每個(gè)傳感器節(jié)點(diǎn)的歷史數(shù)據(jù)曲線集合data與集合avg_data的相似度,選擇相似度最高的傳感器節(jié)點(diǎn)為代表節(jié)點(diǎn).
通過第2章節(jié)和第3章節(jié)已經(jīng)完成了相似區(qū)域的劃分和代表節(jié)點(diǎn)的選擇,最后傳感器網(wǎng)絡(luò)只需要將代表節(jié)點(diǎn)采集的數(shù)據(jù)傳輸至Sink節(jié)點(diǎn),然后Sink節(jié)點(diǎn)將數(shù)據(jù)傳輸至服務(wù)器端即可完成對(duì)整個(gè)區(qū)域的信息采集,該過程是一輪完整的數(shù)據(jù)采集過程.為了使代表節(jié)點(diǎn)采集的數(shù)據(jù)能夠更準(zhǔn)確的代表子區(qū)域的信息以及均衡傳感器節(jié)點(diǎn)能耗,本文的數(shù)據(jù)采集算法運(yùn)行一定時(shí)間后會(huì)重新進(jìn)行下一輪數(shù)據(jù)采集過程,即相似區(qū)域劃分以及代表節(jié)點(diǎn)選擇.具體的算法迭代如表2所示.
在一個(gè)長為2000m,寬為1500m的矩形區(qū)域中均勻部署了1000個(gè)傳感器節(jié)點(diǎn),傳感器節(jié)點(diǎn)的采集半徑r=40m,假設(shè)傳感器網(wǎng)絡(luò)采集矩形區(qū)域中的溫度數(shù)據(jù),由于實(shí)際環(huán)境中溫度分布是連續(xù)的,即在小范圍內(nèi)溫度值變化微小,比較適宜做本文數(shù)據(jù)采集方法的研究對(duì)象,因此仿真實(shí)驗(yàn)利用matlab的插值函數(shù)為每個(gè)節(jié)點(diǎn)仿真采集的溫度數(shù)據(jù),保證溫度分布連續(xù).在插值前,隨機(jī)的指定傳感器節(jié)點(diǎn)為插值樣本點(diǎn),且該樣本點(diǎn)的溫度數(shù)據(jù)通過隨機(jī)方法獲得,保證每次仿真溫度數(shù)據(jù)都不同,實(shí)驗(yàn)中選取種子節(jié)點(diǎn)的數(shù)量為所有部署節(jié)點(diǎn)的10%,將部署區(qū)域劃分為100個(gè)子區(qū)域.假設(shè)傳感器節(jié)點(diǎn)采集的數(shù)據(jù)直接發(fā)送至Sink節(jié)點(diǎn),如目前的LoRaWAN傳感器網(wǎng)絡(luò)、NB-iot傳感器網(wǎng)絡(luò)等都是終端節(jié)點(diǎn)與網(wǎng)關(guān)節(jié)點(diǎn)進(jìn)行直接通訊.
表2 DAA-RGM迭代過程表
Table 2 DAA-RGM iterative process table
DAA-RGM算法迭代Algorithm:1:運(yùn)行整個(gè)傳感器網(wǎng)絡(luò),采集一段時(shí)間的數(shù)據(jù)信息;2:根據(jù)步驟1采集的歷史數(shù)據(jù),按照第二章的區(qū)域生長法進(jìn)行相似區(qū)域劃分;3:按照第三章的代表節(jié)點(diǎn)選擇方法為每個(gè)子區(qū)域選擇代表節(jié)點(diǎn);4:被選擇的代表節(jié)點(diǎn)運(yùn)行一段時(shí)間,采集區(qū)域信息;5:返回步驟1.
實(shí)驗(yàn)驗(yàn)證利用區(qū)域生長法劃分傳感器網(wǎng)絡(luò)部署區(qū)域,劃分后每個(gè)子區(qū)域內(nèi)傳感器節(jié)點(diǎn)采集的數(shù)據(jù)具有較高的相似性,區(qū)域生長法中閾值Td設(shè)置為2.實(shí)驗(yàn)隨機(jī)的從100個(gè)子區(qū)域中選擇8個(gè)子區(qū)域,并統(tǒng)計(jì)這些子區(qū)域中所有傳感器節(jié)點(diǎn)采集的溫度信息,實(shí)驗(yàn)結(jié)果以箱線圖表示,如圖5所示,橫坐標(biāo)為子區(qū)域的序號(hào),縱坐標(biāo)為溫度,圖中每個(gè)箱形代表一個(gè)子區(qū)域內(nèi)所有傳感器節(jié)點(diǎn)采集一次的溫度.
圖5 子區(qū)域數(shù)據(jù)圖Fig.5 Subarea data graph
實(shí)驗(yàn)結(jié)果表明每個(gè)子區(qū)域中的傳感器節(jié)點(diǎn)采集的溫度數(shù)據(jù)最大值與最小值之間的差值小于或等于閾值Td,因此提出的區(qū)域生長法對(duì)WSN部署區(qū)域進(jìn)行數(shù)據(jù)相似性劃分是有效的.
根據(jù)子區(qū)域的歷史數(shù)據(jù)曲線選擇代表節(jié)點(diǎn),代表節(jié)點(diǎn)采集的數(shù)據(jù)與子區(qū)域歷史數(shù)據(jù)均值最接近.本實(shí)驗(yàn)驗(yàn)證代表節(jié)點(diǎn)在后續(xù)數(shù)據(jù)采集階段采集的溫度數(shù)據(jù)是否能夠代表子區(qū)域的溫度信息.實(shí)驗(yàn)結(jié)果如圖6所示,實(shí)驗(yàn)對(duì)比了代表節(jié)點(diǎn)采集的溫度數(shù)據(jù)與子區(qū)域所有傳感器節(jié)點(diǎn)采集的溫度數(shù)據(jù)均值,隨機(jī)選取4個(gè)子區(qū)域進(jìn)行驗(yàn)證,橫坐標(biāo)為數(shù)據(jù)采集次數(shù),縱坐標(biāo)為采集的溫度.
圖6 代表節(jié)點(diǎn)分析圖Fig.6 Analysis of representative nodes
實(shí)驗(yàn)結(jié)果表明代表節(jié)點(diǎn)采集的溫度數(shù)據(jù)與子區(qū)域采集的數(shù)據(jù)均值變化趨勢(shì)和數(shù)值大小基本相同,區(qū)域1的曲線相似度為95.86%,區(qū)域2的曲線相似度為98.38%,區(qū)域3的曲線相似度為96.01%,區(qū)域4的曲線相似度為96.02%,實(shí)驗(yàn)隨機(jī)選取的4個(gè)子區(qū)域都具有較高的相似度,因此通過第三章提出的代表節(jié)點(diǎn)選擇方法選擇的代表節(jié)點(diǎn)能夠有效的代表子區(qū)域,同時(shí)也表明本文提出的DAA-RGM數(shù)據(jù)采集算法能夠減少大量冗余數(shù)據(jù)且保證采集的數(shù)據(jù)誤差在5%以內(nèi).
當(dāng)種子節(jié)點(diǎn)選取的百分比不同時(shí),代表節(jié)點(diǎn)與子區(qū)域均值的相似度也會(huì)不同,理論上代表節(jié)點(diǎn)百分比越大,則劃分的子區(qū)域數(shù)量越多,每個(gè)子區(qū)域內(nèi)包含的傳感器節(jié)點(diǎn)數(shù)量越少,因此相似度越高,反之則反.種子節(jié)點(diǎn)占總節(jié)點(diǎn)數(shù)百分比與相似度之間的關(guān)系如圖7所示,圖中橫坐標(biāo)為種子節(jié)點(diǎn)百分比,縱坐標(biāo)為代表節(jié)點(diǎn)采集的數(shù)據(jù)與子區(qū)域的數(shù)據(jù)均值相似度.
圖7 相似度圖Fig.7 Similarity analysis
實(shí)驗(yàn)結(jié)果與分析一致,當(dāng)種子節(jié)點(diǎn)的比例越大,代表節(jié)點(diǎn)采集的數(shù)據(jù)與子區(qū)域數(shù)據(jù)均值的相似度越高,因?yàn)榉N子節(jié)點(diǎn)的比例越大,則劃分的子區(qū)域數(shù)量越多,每個(gè)子區(qū)域的面積越小,子區(qū)域范圍越小,則代表節(jié)點(diǎn)代表該區(qū)域的能力越強(qiáng).隨著種子節(jié)點(diǎn)比例的增加,相似度也會(huì)逐漸增加,但增加的幅度逐漸變小,且種子節(jié)點(diǎn)百分比大于12%時(shí),相似度基本不會(huì)繼續(xù)升高,因?yàn)楸疚牟杉瘏^(qū)域的溫度信息在一定范圍內(nèi)是接近的,因此種子節(jié)點(diǎn)數(shù)量到達(dá)一定比例時(shí),相似度并不會(huì)繼續(xù)提高.
本文提出的數(shù)據(jù)采集方法目的是減少傳感器網(wǎng)絡(luò)的冗余數(shù)據(jù),降低網(wǎng)絡(luò)的能量消耗,從而達(dá)到延長網(wǎng)絡(luò)生存時(shí)間的目的,同時(shí)大量的冗余數(shù)據(jù)會(huì)造成網(wǎng)絡(luò)的擁塞.冗余數(shù)據(jù)的定義如2.2小節(jié)定義2所示.本實(shí)驗(yàn)對(duì)比本文提出的DAA-RGM數(shù)據(jù)采集算法與傳統(tǒng)的數(shù)據(jù)采集方法(所有傳感器節(jié)點(diǎn)都進(jìn)行數(shù)據(jù)采集并直接發(fā)送至Sink節(jié)點(diǎn))、分簇-數(shù)據(jù)融合的數(shù)據(jù)采集方法(先對(duì)傳感器網(wǎng)絡(luò)進(jìn)行分簇,然后簇首收集簇成員節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,該方法每次簇成員節(jié)點(diǎn)都需要采集數(shù)據(jù),然后將采集的數(shù)據(jù)發(fā)送至簇首節(jié)點(diǎn)進(jìn)行數(shù)據(jù)融合,融合后簇首節(jié)點(diǎn)將數(shù)據(jù)直接發(fā)送至Sink節(jié)點(diǎn),根據(jù)目前WSN數(shù)據(jù)壓縮方面的研究,假設(shè)本文的數(shù)據(jù)融合后壓縮為原來的70%大小[16,17].),每次實(shí)驗(yàn)重復(fù)100次,實(shí)驗(yàn)結(jié)果如圖8所示,橫坐標(biāo)為種子節(jié)點(diǎn)百分比,縱坐標(biāo)為冗余數(shù)據(jù)百分比.
圖8 冗余數(shù)據(jù)圖Fig.8 Redundant data
實(shí)驗(yàn)中分簇-融合算法的種子節(jié)點(diǎn)比例代表簇首節(jié)點(diǎn)比例,傳統(tǒng)采集方法不選擇種子節(jié)點(diǎn),傳感器網(wǎng)絡(luò)中所有節(jié)點(diǎn)都采集數(shù)據(jù).實(shí)驗(yàn)結(jié)果表明隨著種子節(jié)點(diǎn)比例的增加,分簇-融合采集方法和DAA-RGM采集方法所采集數(shù)據(jù)的冗余比例會(huì)逐漸降低,當(dāng)達(dá)到一定低點(diǎn)后,采集數(shù)據(jù)冗余比例會(huì)逐漸增加,因?yàn)樵诔跏紩r(shí)刻種子節(jié)點(diǎn)比例較低,隨著種子節(jié)點(diǎn)比例的增加,檢測(cè)區(qū)域被劃分的越來越準(zhǔn)確,因此每個(gè)區(qū)域內(nèi)采集的冗余數(shù)據(jù)逐漸降低,而隨著種子節(jié)點(diǎn)比例的增加,區(qū)域被劃分的越來越小(或簇規(guī)模被細(xì)分的越來越小),從而導(dǎo)致相鄰的幾個(gè)子區(qū)域(或簇)采集的數(shù)據(jù)存在冗余情況,因此傳感器網(wǎng)絡(luò)采集的數(shù)據(jù)冗余比例逐漸增加.DAA-RGM采集方法的最佳種子節(jié)點(diǎn)比例為17%,分簇-融合數(shù)據(jù)采集方法的最佳種子節(jié)點(diǎn)比例為16%.
從實(shí)驗(yàn)結(jié)果可知,本文提出的DAA-RGM采集方法采集的數(shù)據(jù)冗余比例低于分簇-融合方法和傳統(tǒng)的采集方法,且傳統(tǒng)的采集方法采集的數(shù)據(jù)冗余比例最大.
為了方便實(shí)驗(yàn),假設(shè)傳感器網(wǎng)絡(luò)中每個(gè)傳感器節(jié)點(diǎn)都可以直接與網(wǎng)關(guān)節(jié)點(diǎn)進(jìn)行通訊,傳感器節(jié)點(diǎn)采集數(shù)據(jù)后可直接發(fā)送至Sink節(jié)點(diǎn).實(shí)驗(yàn)驗(yàn)證傳感器網(wǎng)絡(luò)的生存時(shí)間,實(shí)驗(yàn)對(duì)比了提出的DAA-RGM數(shù)據(jù)采集算法、傳統(tǒng)的數(shù)據(jù)采集算法和分簇-數(shù)據(jù)融合方法的網(wǎng)絡(luò)生存時(shí)間,實(shí)驗(yàn)中第一個(gè)節(jié)點(diǎn)死亡標(biāo)志著傳感器網(wǎng)絡(luò)死亡.假設(shè)傳感器節(jié)點(diǎn)的初始能量E0為0.05J,傳感器節(jié)點(diǎn)每次采集和發(fā)送數(shù)據(jù)需要消耗500nJ/bit能量,簇首節(jié)點(diǎn)融合1bit數(shù)據(jù)需要消耗的能量為30nJ,為了保證DAA-RGM算法采集的數(shù)據(jù)準(zhǔn)確性大于95%,種子節(jié)點(diǎn)的比例分別為10%、12%、14%、16%、18%,實(shí)驗(yàn)結(jié)果如圖9所示,橫坐標(biāo)為種子節(jié)點(diǎn)占總節(jié)點(diǎn)數(shù)量的百分比(對(duì)于分簇-數(shù)據(jù)融合方法,橫坐標(biāo)為簇首數(shù)量),縱坐標(biāo)為傳感器網(wǎng)絡(luò)死亡前總共進(jìn)行的數(shù)據(jù)采集次數(shù).
圖9 網(wǎng)絡(luò)采集次數(shù)圖Fig.9 Frequency of data acquisition
實(shí)驗(yàn)結(jié)果表明傳統(tǒng)的數(shù)據(jù)采集方法能夠采集數(shù)據(jù)的次數(shù)遠(yuǎn)遠(yuǎn)低于DAA-RGM采集方法和分簇-融合方法,且本文提出的DAA-RGM采集方法使得網(wǎng)絡(luò)的生存時(shí)間高于目前比較經(jīng)典的分簇-融合方法.DAA-RGM采集方法的種子節(jié)點(diǎn)所占比例為10%時(shí),代表節(jié)點(diǎn)采集的數(shù)據(jù)與子區(qū)域數(shù)據(jù)均值相似度大于95%,數(shù)據(jù)采集數(shù)量約為傳統(tǒng)采集方法的9倍,分簇融合方法的1.5倍.隨著種子節(jié)點(diǎn)所占比例的增加,DAA-RGM方法的網(wǎng)絡(luò)數(shù)據(jù)采集次數(shù)也會(huì)逐漸降低,因?yàn)榉N子節(jié)點(diǎn)數(shù)量增加,劃分的子區(qū)域數(shù)量也會(huì)增加,則某些節(jié)點(diǎn)被重復(fù)選擇為代表節(jié)點(diǎn)的概率增加,導(dǎo)致能量消耗過快,從而加快了傳感器網(wǎng)絡(luò)的死亡速度.
假設(shè)傳感器網(wǎng)絡(luò)中第一個(gè)節(jié)點(diǎn)能量耗盡之前,這段時(shí)間為傳感器網(wǎng)絡(luò)的生存時(shí)間,則DAA-RGM方法與其他方法的生存時(shí)間對(duì)比實(shí)驗(yàn)結(jié)果如圖10所示,實(shí)驗(yàn)中傳感器網(wǎng)絡(luò)每隔1分鐘采集一次數(shù)據(jù),種子節(jié)點(diǎn)的比例為14%、16%、18%.
圖10 生存時(shí)間圖Fig.10 Lifetime chart
實(shí)驗(yàn)結(jié)果表明提出的DAA-RGM在不同種子節(jié)點(diǎn)比例下生存時(shí)間都高于傳統(tǒng)的“分簇-融合”類型的數(shù)據(jù)采集算法,且隨著種子節(jié)點(diǎn)比例增加,網(wǎng)絡(luò)生存時(shí)間逐漸降低,因?yàn)榉N子節(jié)點(diǎn)比例增加,傳感器網(wǎng)絡(luò)被細(xì)分的數(shù)量越多,種子節(jié)點(diǎn)越多,導(dǎo)致消耗的能量越多,因此網(wǎng)絡(luò)生存時(shí)間會(huì)降低.
研究了一種WSN數(shù)據(jù)采集算法(DAA-RGM),該算法首先根據(jù)傳感器網(wǎng)絡(luò)采集的歷史數(shù)據(jù),利用區(qū)域生長法將相似區(qū)域進(jìn)行劃分,然后在每個(gè)子區(qū)域中選擇最佳的節(jié)點(diǎn)作為代表節(jié)點(diǎn),代表節(jié)點(diǎn)采集的數(shù)據(jù)與子區(qū)域采集的數(shù)據(jù)具有較高相似性,最后休眠其他傳感器節(jié)點(diǎn),只運(yùn)行代表節(jié)點(diǎn)采集數(shù)據(jù).實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的可行性和有效性,后續(xù)工作希望在此基礎(chǔ)上進(jìn)一步研究更加準(zhǔn)確且節(jié)能的WSN數(shù)據(jù)采集方法.