張瑞瑞,杜尚豐,陳立平,闞 杰,徐 剛
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京 100083;2.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097;3.國(guó)家農(nóng)業(yè)智能裝備工程技術(shù)研究中心,北京 100097;4.首都師范大學(xué)信息工程學(xué)院,北京 100048;)
基于分段線(xiàn)性回歸的傳感器網(wǎng)絡(luò)數(shù)據(jù)壓縮傳輸方法研究*
張瑞瑞1,2,3,杜尚豐1,陳立平2,3*,闞 杰4,徐 剛2,3
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京 100083;2.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097;3.國(guó)家農(nóng)業(yè)智能裝備工程技術(shù)研究中心,北京 100097;4.首都師范大學(xué)信息工程學(xué)院,北京 100048;)
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)通信帶寬等十分有限,難以實(shí)現(xiàn)較大量數(shù)據(jù)傳輸。針對(duì)多參數(shù)傳感器網(wǎng)絡(luò),通過(guò)提取基準(zhǔn)參數(shù)數(shù)據(jù)集,并分段構(gòu)建線(xiàn)性回歸方程的方法,設(shè)計(jì)了一種適合多參數(shù)、較大數(shù)據(jù)量傳感器網(wǎng)絡(luò)網(wǎng)內(nèi)數(shù)據(jù)的壓縮傳輸算法。以某基地實(shí)際采樣環(huán)境溫度、空氣相對(duì)濕度、土壤溫度數(shù)據(jù)為研究對(duì)象,對(duì)算法壓縮效率和數(shù)據(jù)恢復(fù)效果進(jìn)行了分析。結(jié)果表明:對(duì)于空氣相對(duì)濕度和土壤溫度,恢復(fù)數(shù)據(jù)與原始數(shù)據(jù)均方根誤差RMSE分別為3.87%、0.49℃時(shí),整體數(shù)據(jù)壓縮率可達(dá)51.9%,有效降低了數(shù)據(jù)傳送量。
傳感器網(wǎng)絡(luò);數(shù)據(jù)融合;線(xiàn)性回歸;相關(guān)分析
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)WSN(Wireless Sensor Network)是以感知、采集和處理網(wǎng)絡(luò)覆蓋區(qū)域中被感知對(duì)象的信息為目的,利用大量傳感器節(jié)點(diǎn)以無(wú)線(xiàn)、多跳、自組織方式構(gòu)成的數(shù)據(jù)協(xié)同處理網(wǎng)絡(luò)[1-2]。如何有效減少數(shù)據(jù)傳送量,延長(zhǎng)網(wǎng)絡(luò)生命周期,是當(dāng)前WSN能耗控制研究重點(diǎn)[3-4]。數(shù)據(jù)壓縮傳輸技術(shù)是解決上述問(wèn)題的有效方法之一[5-6]。
Deligiannakis A等[7]提出了一種基于分段線(xiàn)性回歸模型的WSN數(shù)據(jù)估計(jì)算法。算法通過(guò)對(duì)數(shù)據(jù)分段處理,從中選出基礎(chǔ)信號(hào)數(shù)據(jù),并傳送基于以段為單位的線(xiàn)性回歸運(yùn)算得出的回歸方程系數(shù),有效地減低了傳感器網(wǎng)絡(luò)的網(wǎng)內(nèi)數(shù)據(jù)傳送量。王玲等[8-10]從數(shù)據(jù)時(shí)間相關(guān)性分析層面考慮,基于線(xiàn)性回歸模型構(gòu)建了不同的數(shù)據(jù)壓縮算法。楊圣洪等[11]針對(duì)數(shù)據(jù)時(shí)間、空間相關(guān)性特征,提出了一種基于環(huán)模型的分布式時(shí)-空小波數(shù)據(jù)壓縮算法。李楊[12]等提出了一種基于小波分段常值壓縮的數(shù)據(jù)收集算法,利用壓縮采樣理論和分段化方法降低數(shù)據(jù)傳輸量。Deepak Ganesa等[13-14]提出了一種基于小波壓縮層次系統(tǒng),基于時(shí)空相關(guān)性,在節(jié)點(diǎn)層對(duì)數(shù)據(jù)時(shí)間序列上相關(guān)性進(jìn)行分析,在聚合節(jié)點(diǎn)上對(duì)不同節(jié)點(diǎn)進(jìn)行空間相關(guān)性分析,通過(guò)兩次處理降低數(shù)據(jù)冗余。侯鑫、楊永健等[15-17]基于神經(jīng)網(wǎng)絡(luò)、卡爾曼濾波等算法模型構(gòu)建了傳感器網(wǎng)絡(luò)數(shù)據(jù)融合算法。
考慮到非實(shí)時(shí)多參數(shù)WSN節(jié)點(diǎn)環(huán)境監(jiān)測(cè)應(yīng)用背景下,網(wǎng)內(nèi)參數(shù)間表現(xiàn)出強(qiáng)相關(guān)、大冗余特點(diǎn),以及傳感器網(wǎng)絡(luò)節(jié)點(diǎn)對(duì)數(shù)據(jù)融合算法的簡(jiǎn)單、易實(shí)現(xiàn)等特殊要求,本文提出了一種基于相關(guān)性分析的節(jié)點(diǎn)-基站分離式的分段線(xiàn)性回歸數(shù)據(jù)壓縮傳輸算法PWLR(Piece-Wise Linear Regression)。算法通過(guò)挖掘參數(shù)間相關(guān)性,減少網(wǎng)內(nèi)數(shù)據(jù)量,延長(zhǎng)WSN生命周期。
傳感器節(jié)點(diǎn)采集數(shù)據(jù)可以描述為矩陣結(jié)構(gòu),如式(1)所示。式中行向量表示單個(gè)參數(shù)在時(shí)間序列上采樣數(shù)據(jù)集。n×m矩陣表示當(dāng)前最新樣本數(shù)據(jù),n表示節(jié)點(diǎn)有n個(gè)監(jiān)測(cè)參數(shù),m表示節(jié)點(diǎn)已采樣周期數(shù)(假設(shè)各參數(shù)具有相同的采樣周期)。
對(duì)于強(qiáng)相關(guān)性參數(shù)(如空氣溫度和土壤溫度),利用標(biāo)準(zhǔn)線(xiàn)性回歸估計(jì)模型建立參數(shù)間數(shù)學(xué)關(guān)系方程,如(2)所示,并基于最小二乘法確定擬合方程擬合誤差RMSE最小時(shí)的回歸系數(shù)(a,b)。傳感器網(wǎng)絡(luò)節(jié)點(diǎn)將Yj作為基準(zhǔn)數(shù)據(jù)集BD(Base Data)發(fā)送至基站,對(duì)于Yi數(shù)據(jù)集的傳送則可以通過(guò)只發(fā)送擬合方程回歸系數(shù)(a,b)實(shí)現(xiàn)。
然而,對(duì)整個(gè)時(shí)間序列進(jìn)行線(xiàn)性回歸會(huì)產(chǎn)生較大誤差,主要原因在于:①參數(shù)在不同時(shí)間段表現(xiàn)的相關(guān)程度不同。例如環(huán)境溫度在一天的正午時(shí)段變化率較小,而傍晚時(shí)分變化率較大。②不同參數(shù)的相互影響在時(shí)間維度上具有滯后性。當(dāng)某個(gè)參數(shù)改變時(shí)其他相關(guān)參數(shù)的相應(yīng)變化會(huì)延遲發(fā)生。例如環(huán)境溫度與土壤溫度的相互影響。
本文提出一種分段線(xiàn)性回歸映射方法,將時(shí)間序列上的樣本數(shù)據(jù)劃分成段,以段為單位進(jìn)行線(xiàn)性回歸計(jì)算,并以自定義結(jié)構(gòu)化精簡(jiǎn)集S的形式進(jìn)行特征描述,如定義1。
定義1:結(jié)構(gòu)化精簡(jiǎn)集S由以下部分組成
·l:段長(zhǎng)度;
·start:段在行上的開(kāi)始坐標(biāo),例如該段在行i上的區(qū)間可表示為Yi[start,start+l]
·migration:該段做線(xiàn)性回歸運(yùn)算時(shí)在基準(zhǔn)數(shù)據(jù)集上的起始偏移量,例如可表示為BD[migration,migration+l]
·a,b,err:a,b為分段線(xiàn)性回歸方程的回歸系數(shù),err為均方根誤差(err用于分段搜索時(shí)可不用傳輸,見(jiàn)2.2節(jié))
當(dāng)n×m個(gè)樣本數(shù)據(jù)采集完畢后,傳感器網(wǎng)絡(luò)節(jié)點(diǎn)首先選取基準(zhǔn)數(shù)據(jù)集(設(shè)為Yj,見(jiàn)2.1節(jié)),并將行i分成「m/l]段(「m/l]表示對(duì)m/l的計(jì)算值做上取整運(yùn)算)。每段以長(zhǎng)度l搜索Yj上對(duì)應(yīng)的線(xiàn)性回歸運(yùn)算最優(yōu)數(shù)據(jù)區(qū)間,并將結(jié)果以結(jié)構(gòu)化形式發(fā)送給基站?;鶞?zhǔn)數(shù)據(jù)集整體直接發(fā)送給基站作為數(shù)據(jù)恢復(fù)依據(jù)。每行完成分段回歸運(yùn)算后,該行可用結(jié)構(gòu)化精簡(jiǎn)集Sk(Sk?m,k=「m/l])代替,精簡(jiǎn)集作為行i的特征描述,用以在基站進(jìn)行數(shù)據(jù)恢復(fù)。假設(shè)Yj是基準(zhǔn)數(shù)據(jù)集,則Yi中的某段數(shù)據(jù)Yi[start,start+l]可表示為:
a·Yj[migration,migration+l]+b
此時(shí)節(jié)點(diǎn)數(shù)據(jù)傳輸量為:
Data={基準(zhǔn)數(shù)據(jù)集,精簡(jiǎn)集S}
假設(shè)傳感器采集參數(shù)數(shù)據(jù)表示與結(jié)構(gòu)化精簡(jiǎn)集S成員參數(shù)的數(shù)據(jù)表示占用相同存儲(chǔ)空間,則數(shù)據(jù)壓縮率可簡(jiǎn)化表示為:
式中:li是第i個(gè)參數(shù)的分段長(zhǎng)度,n是傳感器網(wǎng)絡(luò)節(jié)點(diǎn)的監(jiān)測(cè)參數(shù)種類(lèi)數(shù),m是節(jié)點(diǎn)已采樣周期數(shù)。
算法包括建立和運(yùn)行維護(hù)兩個(gè)階段。在能量充足的基站端,算法通過(guò)分析歷史數(shù)據(jù),挖掘單節(jié)點(diǎn)多參數(shù)間相關(guān)性,定義參數(shù)相關(guān)性貢獻(xiàn)評(píng)價(jià)模型,選取基準(zhǔn)數(shù)據(jù)集,并建立最佳分段方式和動(dòng)態(tài)分段線(xiàn)性映射模型,并將模型參數(shù)發(fā)送給節(jié)點(diǎn)。節(jié)點(diǎn)根據(jù)基站的配置參數(shù)做融合計(jì)算,并將基準(zhǔn)數(shù)據(jù)集和精簡(jiǎn)集S發(fā)送基站,基站做恢復(fù)運(yùn)算,得到節(jié)點(diǎn)傳送數(shù)據(jù)?;靖鶕?jù)已接收到的數(shù)據(jù)動(dòng)態(tài)分析并適時(shí)更改模型參數(shù),并定時(shí)對(duì)節(jié)點(diǎn)相應(yīng)配置更新。由于算法復(fù)雜的參數(shù)選取過(guò)程在基站完成,節(jié)點(diǎn)只需進(jìn)行簡(jiǎn)單的數(shù)據(jù)映射操作,因此如果忽略基站的能耗,該算法對(duì)網(wǎng)絡(luò)的能量消耗較小。
2.1 算法的建立
2.1.1 基準(zhǔn)數(shù)據(jù)集選取
基站對(duì)收集到的感知數(shù)據(jù)樣本進(jìn)行相關(guān)性計(jì)算,從中選取一個(gè)相關(guān)性最高的樣本。如式(1)所示,單一節(jié)點(diǎn)具有n個(gè)感知參數(shù),t時(shí)刻第i個(gè)參數(shù)采集數(shù)據(jù)表示為yit,時(shí)間序列上的傳感器數(shù)據(jù)集描述為矩陣X。為了便于選取,對(duì)每行參數(shù)建立如下基準(zhǔn)數(shù)據(jù)集評(píng)價(jià)模型:
①計(jì)算樣本相關(guān)系數(shù)rij。rij表示第i個(gè)參數(shù)樣本與第j個(gè)參數(shù)樣本之間的相關(guān)系數(shù),采用簡(jiǎn)單樣本相關(guān)系數(shù)計(jì)算方法,rij定義為樣本間協(xié)方差與樣本各自方差的商,如式(5):
②計(jì)算所有行相關(guān)系數(shù)和benefit(i),對(duì)其進(jìn)行排序,選擇排序最高行作為回歸模型基準(zhǔn)數(shù)據(jù)集。
2.1.2 分段線(xiàn)性回歸計(jì)算。
表1 分段線(xiàn)性回歸搜索函數(shù)
算法以段為單位進(jìn)行數(shù)據(jù)集線(xiàn)性回歸映射操作,不同的分段數(shù)會(huì)給算法帶來(lái)不同的表現(xiàn)。理論上當(dāng)分段數(shù)較小時(shí),算法誤差下降速率較大,隨著分段數(shù)的增加誤差將緩慢下降,當(dāng)分段數(shù)無(wú)限增加時(shí),算法誤差將趨于0。然而,當(dāng)段數(shù)增加時(shí),每段進(jìn)行回歸估計(jì)的數(shù)據(jù)量減少,這可能導(dǎo)致線(xiàn)性回歸的估計(jì)誤差不減反增,即此時(shí)的分段數(shù)超過(guò)了算法局部最優(yōu)選擇,同時(shí)算法壓縮率也隨之增大。由于壓縮率隨著分段數(shù)的增加線(xiàn)性增長(zhǎng),繼續(xù)增加分段數(shù)反而會(huì)降低算法的性能。實(shí)際中應(yīng)該根據(jù)需求綜合考慮誤差和壓縮率兩方面因素??梢赃x擇算法的局部最優(yōu)分段,或當(dāng)誤差滿(mǎn)足需求閾值時(shí)的分段方式。由于不能給出理論上合理的分段方法,將從實(shí)驗(yàn)中得出最佳分段方式。
表2 標(biāo)準(zhǔn)線(xiàn)性回歸函數(shù)
2.2 算法執(zhí)行與維護(hù)流程
基站以一定的周期動(dòng)態(tài)更新基準(zhǔn)數(shù)據(jù)集,提高數(shù)據(jù)估計(jì)精度。同樣,基站將以一定周期進(jìn)行最佳分段的更新操作,提高數(shù)據(jù)估計(jì)精度。算法執(zhí)行與維護(hù)流程如圖1所示。
圖1 算法執(zhí)行與維護(hù)流程圖
以北京市小湯山國(guó)家精準(zhǔn)農(nóng)業(yè)示范基地2013 年5月2日~5月11日實(shí)際采樣數(shù)據(jù)為實(shí)驗(yàn)樣本,其中包含環(huán)境溫度、空氣濕度、土壤溫度3個(gè)參數(shù),參數(shù)采樣周期為10 min,其中5月2日~5月6日共5天數(shù)據(jù)進(jìn)行基站算法初始化參數(shù)計(jì)算,5月7日~5月11日數(shù)據(jù)進(jìn)行節(jié)點(diǎn)實(shí)驗(yàn),為了及時(shí)感知監(jiān)測(cè)參數(shù)變化,基站的算法參數(shù)更新周期設(shè)為5天。算法數(shù)據(jù)恢復(fù)精度以式(6)所示均方根誤差(RMSE)作為衡量標(biāo)準(zhǔn),并與ISDT算法進(jìn)行對(duì)比[9]。根據(jù)三參數(shù)的貢獻(xiàn)值如表3所示。選取環(huán)境溫度為基準(zhǔn)數(shù)據(jù)集。
表3 仿真參數(shù)貢獻(xiàn)值
為了進(jìn)行樣本最優(yōu)分段,實(shí)驗(yàn)以不同段數(shù)為變量,以算法RMSE誤差為輸出,分別對(duì)空氣濕度,土壤溫度進(jìn)行算法仿真,實(shí)驗(yàn)設(shè)置分段范圍為1~30,結(jié)果如圖2所示??梢钥闯?,當(dāng)節(jié)點(diǎn)對(duì)兩種數(shù)據(jù)不進(jìn)行分段,直接以數(shù)據(jù)樣本整體進(jìn)行線(xiàn)性回歸計(jì)算時(shí),雖然此時(shí)數(shù)據(jù)壓縮率最好為33.78%(每行參數(shù)只需用一個(gè)精簡(jiǎn)集描述),但其誤差達(dá)到最大值,分別達(dá)到1.8和12.2%。當(dāng)對(duì)數(shù)據(jù)進(jìn)行分段線(xiàn)性回歸后,開(kāi)始時(shí)算法RMSE降低速率較快,當(dāng)增加某個(gè)值時(shí)(實(shí)驗(yàn)中土壤溫度為16,空氣相對(duì)濕度為18),算法誤差達(dá)到局部最優(yōu)值,此時(shí)的分段數(shù)使得數(shù)據(jù)相關(guān)性達(dá)到局部最佳。當(dāng)分段數(shù)繼續(xù)增加時(shí),誤差開(kāi)始增加,這是由于樣本數(shù)據(jù)總數(shù)不變,隨著分段數(shù)的增加,每段進(jìn)行回歸估計(jì)計(jì)算的數(shù)據(jù)減少。此后算法RMSE變化趨于平緩,繼續(xù)增加分段數(shù)將不會(huì)帶來(lái)算法表現(xiàn)的明顯提升,反而導(dǎo)致壓縮率的增加。本文采用局部最優(yōu)解的方式選取分段數(shù)。
圖2 不同分段下算法均方根誤差
通過(guò)分析均方根誤差和壓縮率變化關(guān)系進(jìn)行算法比較,結(jié)果如圖3和圖4所示。圖3可以看出,當(dāng)壓縮率較小時(shí),壓縮的數(shù)據(jù)足夠描述參數(shù)的變化特征,基于時(shí)間序列分段線(xiàn)性化的ISDT算法能夠獲得較小的壓縮誤差,隨著壓縮誤差增加,壓縮率超過(guò)70%時(shí),ISDT算法壓縮誤差超過(guò)PWLR算法,此時(shí)壓縮數(shù)據(jù)量較少,PWLR算法能夠更加準(zhǔn)確的還原數(shù)據(jù)。圖4所示的空氣濕度數(shù)據(jù)具有類(lèi)似的特點(diǎn),當(dāng)數(shù)據(jù)壓縮率超過(guò)60%時(shí),PWLR算法壓縮誤差明顯小于ISDT算法。從中可以看出,PWLR算法能夠在高壓縮率的需求下獲得更加準(zhǔn)確的壓縮效果。相比于ISDT,PWLR算法更加適合于大數(shù)據(jù)、高壓縮比、高精度的應(yīng)用需求下。
圖3 土壤溫度數(shù)據(jù)均方誤差與壓縮率關(guān)系
圖4 空氣濕度數(shù)據(jù)均方誤差與壓縮率關(guān)系
當(dāng)土壤溫度數(shù)據(jù)集分為16段,空氣相對(duì)溫度分為18段,進(jìn)行回歸運(yùn)算時(shí),基站根據(jù)精簡(jiǎn)集對(duì)數(shù)據(jù)恢復(fù)效果如圖5和圖6所示。
圖5 土壤溫度恢復(fù)數(shù)據(jù)與原始數(shù)據(jù)對(duì)比
圖6 空氣相對(duì)濕度恢復(fù)數(shù)據(jù)與原始數(shù)據(jù)對(duì)比
可以看出算法能夠根據(jù)基準(zhǔn)數(shù)據(jù)集準(zhǔn)確給出融合數(shù)據(jù)的特征描述。對(duì)于土壤溫度和空氣相對(duì)濕度,恢復(fù)數(shù)據(jù)與原始數(shù)據(jù)均方根誤差RMSE分別為0.49℃、3.87%,此時(shí)整體數(shù)據(jù)壓縮率可達(dá)59.1%。
分布密集的眾多節(jié)點(diǎn)使得傳感器網(wǎng)絡(luò)內(nèi)部產(chǎn)生了巨大的數(shù)據(jù)傳輸量。如何對(duì)數(shù)據(jù)進(jìn)行有效壓縮以應(yīng)對(duì)WSN資源受限的現(xiàn)狀是WSN應(yīng)用研究中一項(xiàng)具有挑戰(zhàn)性的課題。針對(duì)監(jiān)測(cè)參數(shù)間相關(guān)性特點(diǎn),本文給出了一種基于分段線(xiàn)性回歸的多參數(shù)WSN數(shù)據(jù)融合算法PWLR。仿真實(shí)驗(yàn)表明,算法以基準(zhǔn)數(shù)據(jù)集為自變量,對(duì)分段數(shù)據(jù)進(jìn)行最優(yōu)線(xiàn)性回歸搜索,最小化回歸方程誤差,從而在高壓縮率的條件下保證數(shù)據(jù)融合質(zhì)量,較原始傳輸策略顯著降低數(shù)據(jù)傳輸量。
[1] Akyildiz I F,Su W,Sankarasubramaniam Y,et al.A Survey on Sensor Networks[J].IEEE Communication Magazine,2002,40 (8):102-114.
[2] Yick J,Mukherjee B,Ghosal D.Wireless Sensor Network Survey [J].Computer Networks,2008,52(12):2292-2330.
[3] 林蔚,韓麗紅.無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的數(shù)據(jù)壓縮算法綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2012,33(9):2043-2048.
[4] 陳正宇,楊庚,陳蕾,等.無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合技術(shù)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2011,28(5):1601-1604.
[5] 康健,左憲章,唐力偉,等.無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合技術(shù)[J].計(jì)算機(jī)科學(xué),2010,37(4):31-35.
[6] Nakamura E F,Loureiro A A F,F(xiàn)rery A C.Information Fusion for Wireless Sensor Networks:Methods,Models,and Classifications [C]//ACM Comput.2007,39:9.
[7] DeligiannakisA,KotidisY,RoussopoulosN.Compressing Historical Information in Sensor Networks.In Proceedings of ACM SIGMOD Conference,2004.
[8] 王玲,石為人,石欣,等.基于時(shí)間相關(guān)性的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)壓縮與優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用,2013,33(12):3453-3456.
[9] 王舉,房鼎益,陳曉紅,等.文物監(jiān)測(cè)中無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)壓縮算法[J].西安電子科技大學(xué)學(xué)報(bào),2012,39(1):157-162.
[10]宋欣,王翠榮.基于線(xiàn)性回歸的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)分布式數(shù)據(jù)采集優(yōu)化策略[J].計(jì)算機(jī)學(xué)報(bào),2012,35(3):568-580.
[11]楊圣洪,賈焰,周四望.無(wú)線(xiàn)傳感器網(wǎng)絡(luò)基于虛擬節(jié)點(diǎn)的小波壓縮算法[J].軟件學(xué)報(bào),2013,24(3):557-563.
[12]李楊,郭龍江,李金寶,等.傳感器網(wǎng)絡(luò)基于小波分段常值壓縮的數(shù)據(jù)收集研究[J].儀器儀表學(xué)報(bào),2013,34(1):119-127.
[13]Deepak Ganesan,Deborah Estrin,John Heidemann.DIMENSIONS:Why do We Need a New Data Handling Architecture for Sensor Networks?[C]//Proceedings of the ACM HotNets,ACM,2002:143-148.
[14]Ganesan D,Greenstein B,Perelyubskiy D,et al.An Evaluation of Multi-Resolution Search and Storage in Resource-Constrained Sensor Networks[C]//Proceedings of the First ACM Conference on Embedded Networked Sensor Systems(SenSys),2003.
[15]侯鑫,張文東,鐘鳴.基于事件驅(qū)動(dòng)和神經(jīng)網(wǎng)絡(luò)的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合算法研究[J].傳感技術(shù)學(xué)報(bào),2014,27(1):142-148.
[16]楊永健,劉帥.基于SOFM神經(jīng)網(wǎng)絡(luò)的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)融合算法[J].傳感技術(shù)學(xué)報(bào),2013,26(12):1757-1763.
[17]Olfati-Saber R.Distributed Kalman Fltering for Sensor Networks [C]//Proc 46th IEEE Conf Decision and Control,New Orleans,LA,2007.
張瑞瑞(1983-),男,博士生,國(guó)家農(nóng)業(yè)智能裝備工程技術(shù)研究中心助理研究員,主要從事傳感器網(wǎng)絡(luò)、傳感器智能化技術(shù)研究,Rui7986@126.com;
陳立平(1973-),女,國(guó)家農(nóng)業(yè)智能裝備工程技術(shù)研究中心研究員、博士生導(dǎo)師,主要從事農(nóng)業(yè)智能裝備技術(shù)與系統(tǒng)研究,Chenliping@iea.ac.cn。
杜尚豐(1961-),男,中國(guó)農(nóng)業(yè)大學(xué)信電學(xué)院教授、博士生導(dǎo)師,主要從事復(fù)雜系統(tǒng)建模與控制,無(wú)線(xiàn)傳感器網(wǎng)絡(luò)理論,機(jī)器人控制技術(shù)研究,Ca800@ 263.net;
Data Compression Method with Piece-Wise Linear Regression in WSN*
ZHANG Ruirui1,2,3,DU Shangfeng1,CHEN Liping2,3*,KAN Jie4,XU Gang2,3
(1.College of Information and Electrical Engineering,China Agriculture University,Beijing 100083,China;2.Beijing Research Center of Intelligent Equipment for Agriculture,Beijing Academy of Agriculture and Forestry Sciences,Beijing 100097,China;3.National Engineering Research Center of Intelligent Equipment for Agriculture,Beijing 100097,China;4.College of Information Engineering,Capital Normal University,Beijing 100048,China)
Suffering from the limitation of bandwidth,WSN is confronting the challenge of big data transmission.By obtaining Base-data and constructing piece-wise linear regression equation,this paper proposed a data compression transmission algorithm for WSN with large data volume and strong correlation and redundancy multi-parameter.Taking environment temperature,relative air humidity and soil temperature data obtained by a WSN system located in Beijing Xiao Tangshan national demonstration base of precision agriculture as research object,we tested the compression and data recovery efficiency of the algorithm.Results show that data compression ratio is as high as 51.9% when the RMSE between restored data and raw data are 3.87%and 0.49℃,which brings an enormous reduction of the amount of data transmission.
WSN;data fusion;linear regression;correlation analysis EEACC:7230
TP391.9
A
1004-1699(2015)04-0531-06
10.3969/j.issn.1004-1699.2015.04.014
項(xiàng)目來(lái)源:北京市自然科學(xué)基金項(xiàng)目(4121001);北京市農(nóng)林科學(xué)院青年科研基金項(xiàng)目(QNJJ201217);國(guó)家863高技術(shù)研究發(fā)展計(jì)劃項(xiàng)目(2012AA101901)
2014.11.6 修改日期:2014.12.24