亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        無(wú)線傳感器網(wǎng)絡(luò)中基于模式頻繁度的異常檢測(cè)方法*

        2018-01-29 01:42:19施曉斌吳丹萍程紅舉
        關(guān)鍵詞:分區(qū)區(qū)間觀測(cè)

        施曉斌,吳丹萍,程紅舉

        (福州大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福建 福州 350108)

        0 引言

        在WSN中,由于環(huán)境噪聲和感知器件誤差的影響,感知數(shù)據(jù)帶有一定的不確定性。軟件與硬件故障將導(dǎo)致不準(zhǔn)確和不可靠讀數(shù)的出現(xiàn)。而事件的發(fā)生也將導(dǎo)致與正態(tài)分布明顯不同的觀測(cè)值的出現(xiàn)。那些特征與正態(tài)分布特征明顯不同的觀測(cè)值被稱為異常值[1]。異常值檢測(cè),是基于某種措施來(lái)識(shí)別偏離其余數(shù)據(jù)模式的數(shù)據(jù)實(shí)例的過(guò)程,用于過(guò)濾噪聲數(shù)據(jù),查找故障節(jié)點(diǎn)和發(fā)現(xiàn)用戶感興趣的事件。

        區(qū)分異常值的來(lái)源是一個(gè)重要的問(wèn)題。一般來(lái)說(shuō),如果檢測(cè)到的異常值是錯(cuò)誤或噪聲數(shù)據(jù),則應(yīng)將其從傳感數(shù)據(jù)中去除,以確保數(shù)據(jù)質(zhì)量和準(zhǔn)確性,并避免通信負(fù)載造成的能耗。但是,若是事件造成的異常值,消除異常值將導(dǎo)致關(guān)于事件的重要隱藏信息的丟失[2]。

        傳統(tǒng)的集中式異常檢測(cè)技術(shù)將會(huì)產(chǎn)生巨大的能量和帶寬的消耗,這對(duì)資源受限的WSN網(wǎng)絡(luò)來(lái)說(shuō)并不友好[3]。此外事件在網(wǎng)絡(luò)中發(fā)生的概率通常不高,在沒(méi)有發(fā)生事件的情況下收集到的數(shù)據(jù)價(jià)值是十分有限的??紤]到節(jié)點(diǎn)有限的資源,因此需要限制異常檢測(cè)算法的復(fù)雜度,盡可能設(shè)計(jì)輕量級(jí)的分布式在線算法[4]。

        本文考慮以下問(wèn)題:如何以在線和分布式的方式快速準(zhǔn)確地檢測(cè)WSN中的異常數(shù)據(jù),并區(qū)分異常值的來(lái)源。本文研究了流數(shù)據(jù)的數(shù)據(jù)變化模式和數(shù)據(jù)的空間相關(guān)性在異常檢測(cè)問(wèn)題上的運(yùn)用,提出了一種基于數(shù)據(jù)變化模式頻繁度和空間相關(guān)性的PFSC(Pattern Frequency and Spatial Correlation)異常檢測(cè)方法。PFSC異常檢測(cè)方法分兩個(gè)階段進(jìn)行。第一階段,為數(shù)據(jù)創(chuàng)建一個(gè)分布模型,根據(jù)數(shù)據(jù)變化模式的頻繁程度篩選出潛在的異常數(shù)據(jù);第二階段,利用相鄰節(jié)點(diǎn)數(shù)據(jù)間的空間相關(guān)性來(lái)區(qū)分異常值的來(lái)源,此處本文通過(guò)拉依達(dá)準(zhǔn)則完成異常值來(lái)源的判定。

        1 相關(guān)工作

        針對(duì)WSN中集中式與分布式異常檢測(cè)方法的研究,Lau等人[5]提出了一種基于名為CNBD的樸素貝葉斯框架的集中算法,其中端到端傳輸時(shí)間在sink處收集,并使用樸素貝葉斯框架進(jìn)行分析。Subramaniam等[6]提出了一種用于傳感器網(wǎng)絡(luò)的分布式在線異常值檢測(cè)技術(shù),以分布式方式計(jì)算多維數(shù)據(jù)分布近似的框架,以便在資源有限的傳感器網(wǎng)絡(luò)中實(shí)現(xiàn)復(fù)雜的應(yīng)用。Xu等人[7]通過(guò)比較連續(xù)時(shí)間實(shí)例的數(shù)據(jù),得出是否存在瞬時(shí)故障的結(jié)論。如果存在瞬態(tài)故障,則使用其標(biāo)記為正常的實(shí)例數(shù)據(jù)來(lái)校正數(shù)據(jù)。文獻(xiàn)[8]提出了一種基于信譽(yù)的投票和決策樹(shù)的分布式事件檢測(cè)方法,并評(píng)估了用于早期發(fā)現(xiàn)災(zāi)害特別是住宅火災(zāi)的性能和適用性。

        針對(duì)在線數(shù)據(jù)連續(xù)積累、實(shí)時(shí)更新的特點(diǎn),文獻(xiàn)[9]提出了一種環(huán)境數(shù)據(jù)流偏離歷史模式的識(shí)別方法。該方法是基于數(shù)據(jù)流及其預(yù)測(cè)區(qū)間的自回歸數(shù)據(jù)驅(qū)動(dòng)模型。文獻(xiàn)[10]將基于聚類的算法和最近鄰異常值檢測(cè)方法相結(jié)合,用于實(shí)現(xiàn)高效聚類和對(duì)異常值檢測(cè),訓(xùn)練階段需要對(duì)一段時(shí)間內(nèi)的觀測(cè)值進(jìn)行聚類。文獻(xiàn)[11]提出了一種基于距離相似性的技術(shù)來(lái)識(shí)別傳感器網(wǎng)絡(luò)中的全局異常值。該技術(shù)嘗試通過(guò)相鄰節(jié)點(diǎn)之間的一組代表性數(shù)據(jù)交換來(lái)減少通信開(kāi)銷。每個(gè)節(jié)點(diǎn)使用距離相似度來(lái)本地識(shí)別異常值,然后將離群值廣播到相鄰節(jié)點(diǎn)進(jìn)行驗(yàn)證。相鄰節(jié)點(diǎn)重復(fù)該過(guò)程,直到網(wǎng)絡(luò)中的整個(gè)傳感器節(jié)點(diǎn)最終同意全局異常值。然而廣播帶來(lái)的通信開(kāi)銷使其無(wú)法應(yīng)用到大型網(wǎng)絡(luò)。

        2 網(wǎng)絡(luò)模型與相關(guān)知識(shí)

        2.1 網(wǎng)絡(luò)模型

        WSN由隨機(jī)部署在一個(gè)平面區(qū)域上的一組傳感器節(jié)點(diǎn)S={s1,s2, …,sn}組成。節(jié)點(diǎn)i通信范圍內(nèi)的鄰居節(jié)點(diǎn)用Si={s1,s2, …,sk}表示。節(jié)點(diǎn)i在時(shí)刻t的觀測(cè)值表示為xi(t),xmax表示有效的節(jié)點(diǎn)觀測(cè)值最大值,xmin為有效的節(jié)點(diǎn)觀測(cè)值最小值,節(jié)點(diǎn)i到n時(shí)刻為止的觀測(cè)值集合以Xi(n)表示,即Xi(n)={xi(1),xi(2), …,xi(n)}。

        本文假設(shè)指定區(qū)域內(nèi)節(jié)點(diǎn)密度較高(如小型家居系統(tǒng)),當(dāng)一個(gè)事件發(fā)生時(shí),多個(gè)臨近事件發(fā)生地的節(jié)點(diǎn)都將及時(shí)地捕獲到該事件。

        定義1數(shù)據(jù)變化模式:節(jié)點(diǎn)i在t時(shí)刻的數(shù)據(jù)變化模式Δxi(t)與上一時(shí)刻的觀測(cè)值相關(guān),Δxi(t)=│xi(t)-xi(t-1)│,Δxi(t)∈D,其中D為區(qū)間[0,xmax-xmin]。不失一般性,本文將數(shù)據(jù)變化模式簡(jiǎn)稱為模式。

        ΔXi(n)表示節(jié)點(diǎn)i從2時(shí)刻到n時(shí)刻為止所有數(shù)據(jù)變化模式的集合,即:

        ΔXi(n)={Δxi(2),Δxi(3), …, Δxi(n)}

        其中│ΔXi(n)│=n-1。

        定義2模式區(qū)間:D為區(qū)間[0,xmax-xmin],將D均勻地劃分為若干區(qū)間{d1,d2, …,dk},稱為模式區(qū)間,ΔXi(n)中任意的一個(gè)數(shù)據(jù)變化模式在D的某一個(gè)模式區(qū)間內(nèi)。

        定義3區(qū)間頻繁度:在節(jié)點(diǎn)的數(shù)據(jù)變化模式集合ΔXi(n)= {Δxi(2),Δxi(3), …, Δxi(n)}中,屬于模式區(qū)間dj的模式的個(gè)數(shù)記為V(j),則稱P(j)=V(j)/(n-1)為模式區(qū)間dj的頻繁度。

        2.2 相關(guān)知識(shí)

        2.2.1數(shù)據(jù)異常

        根據(jù)本地節(jié)點(diǎn)異常的原因?qū)Ξ惓_M(jìn)行分類,有點(diǎn)異常、上下文異常與集體異常三類[12]。

        (1)點(diǎn)異常:相對(duì)于數(shù)據(jù)集被認(rèn)為是異常的單個(gè)數(shù)據(jù)實(shí)例。

        (2)上下文異常:在當(dāng)前上下文中被認(rèn)為是異常的數(shù)據(jù)實(shí)例。在不同的上下文中,相同的數(shù)據(jù)實(shí)例可能被認(rèn)為是正常的。

        (3)集合異常:連續(xù)多個(gè)測(cè)量值為常數(shù),即在一段時(shí)間內(nèi)測(cè)量值幾乎沒(méi)有什么波動(dòng)。

        圖1 異常類型

        圖1顯示了Chandola等人定義的異常[12]。在時(shí)段24發(fā)生點(diǎn)異常,即數(shù)據(jù)實(shí)例對(duì)于整個(gè)數(shù)據(jù)集是異常的。在時(shí)段43出現(xiàn)上下文異常,但是如果該觀測(cè)值出現(xiàn)在時(shí)刻t1,t2,t3或t4,則不會(huì)被認(rèn)為是異常的。最后,集合異常發(fā)生在時(shí)間段54~71,節(jié)點(diǎn)由于故障在該時(shí)段內(nèi)連續(xù)出現(xiàn)多個(gè)幾乎沒(méi)有什么波動(dòng)的觀測(cè)值。本文將上下文異常視為點(diǎn)異常的一種特例。

        2.2.2WSN中數(shù)據(jù)空間相關(guān)性

        在WSN中,數(shù)據(jù)實(shí)例之間經(jīng)常存在相對(duì)位置關(guān)系,這樣的數(shù)據(jù)稱為空時(shí)數(shù)據(jù)(spatio temporal dam)。在進(jìn)行異常檢測(cè)時(shí),常常利用數(shù)據(jù)的空間相關(guān)特性區(qū)分節(jié)點(diǎn)故障和事件。由于組成事件的感知數(shù)據(jù)之間具有較強(qiáng)的時(shí)空關(guān)聯(lián)性,當(dāng)事件發(fā)生時(shí),臨近節(jié)點(diǎn)將擁有相似的觀測(cè)值,這是因?yàn)榛谠肼暅y(cè)量與傳感器故障可能隨機(jī)無(wú)關(guān),而事件測(cè)量可能在空間上相關(guān)的事實(shí)。這一觀察使我們能夠區(qū)分事件和錯(cuò)誤。例如,對(duì)Intel室內(nèi)項(xiàng)目[13]的數(shù)據(jù)進(jìn)行空間相關(guān)性的分析。圖2給出了兩個(gè)鄰近的節(jié)點(diǎn)(節(jié)點(diǎn)4,6)和一個(gè)非臨近節(jié)點(diǎn)(節(jié)點(diǎn)24)的溫度隨時(shí)間變化的趨勢(shì)圖。可以明顯地看出4,6節(jié)點(diǎn)彼此鄰近,其同一時(shí)刻的觀測(cè)值更加接近。在空間上彼此鄰近的鄰居節(jié)點(diǎn)的數(shù)據(jù)具有一定程度的相似性。

        圖2 節(jié)點(diǎn)溫度變化趨勢(shì)圖

        3 異常檢測(cè)算法

        數(shù)據(jù)的變化模式由節(jié)點(diǎn)上連續(xù)觀測(cè)值的差值構(gòu)成。本文異常檢測(cè)方法的思想是將數(shù)據(jù)流的數(shù)據(jù)變化模式映射到某個(gè)特征空間的分區(qū)中,將非頻繁出現(xiàn)的分區(qū)認(rèn)為是異常分區(qū),頻繁出現(xiàn)的分區(qū)認(rèn)為是正常分區(qū)。若某時(shí)刻數(shù)據(jù)的變化模式映射到特征空間的異常分區(qū),則將該時(shí)刻的數(shù)據(jù)當(dāng)做潛在異常值,并利用相鄰節(jié)點(diǎn)數(shù)據(jù)的空間相關(guān)性對(duì)其進(jìn)行驗(yàn)證。

        該算法的目標(biāo)是識(shí)別出潛在的異常觀測(cè)值并將其分類。在判斷異常觀測(cè)值產(chǎn)生的原因時(shí),目標(biāo)節(jié)點(diǎn)收集其鄰居節(jié)點(diǎn)集Si的當(dāng)前時(shí)刻觀測(cè)值,并利用數(shù)據(jù)的空間相關(guān)性進(jìn)行判斷,避免了將節(jié)點(diǎn)數(shù)據(jù)傳輸至Sink節(jié)點(diǎn)產(chǎn)生的大量能量消耗。PFSC方法是一個(gè)自學(xué)習(xí)-檢測(cè)的過(guò)程,可分為兩個(gè)階段,即第一階段為訓(xùn)練階段,第二階段為異常檢測(cè)階段。

        3.1 數(shù)據(jù)變化模式

        節(jié)點(diǎn)的數(shù)據(jù)流是按時(shí)間順序排列的一系列數(shù)據(jù)的集合,也稱為時(shí)間序列。在時(shí)間序列數(shù)據(jù)挖掘的研究中,通常用時(shí)間序列模式表示來(lái)描述原始的時(shí)間序列,即將原始時(shí)間序列映射到某個(gè)特征空間中,并用它在這個(gè)特征空間中的映像來(lái)描述原始序列。時(shí)間序列模式一定程度上保留了時(shí)間序列的主要特征,更能反應(yīng)時(shí)間序列的變化情況。分段線性表示(PLR)是將時(shí)間序列表示成多段相鄰的直線,用多段直線段擬合原時(shí)間序列,時(shí)間序列Xi(n)的PLR模型表示為:

        Xi(n)={xi(1),xi(2),…,xi(n)}

        L(Xi(n))={L(y1,y2),L(y2,y3),…,L(yk-1,yk)}

        (1)

        式中,yj∈Xi(n),L(yj,y(j+1))表示連接兩點(diǎn)的直線段。

        在此基礎(chǔ)上,本文將PLR中的線段長(zhǎng)度壓縮為1,分段數(shù)量設(shè)置為n-1,同時(shí)用│y(j+1)-yj│來(lái)描述分段L(yj,y(j+1))的特征,得到Xi(n)的數(shù)據(jù)變化模式:

        H(Xi(n))={Δxi(2),Δxi(3),…,Δxi(n)}

        (2)

        數(shù)據(jù)變化模式一定程度上保留了時(shí)間序列在各個(gè)時(shí)刻的數(shù)據(jù)變化情況。通常在正常的工作環(huán)境下,節(jié)點(diǎn)的讀數(shù)在連續(xù)的時(shí)間內(nèi)是漸變的過(guò)程,而異常觀測(cè)值與正常值存在明顯的差異,并且在節(jié)點(diǎn)的工作過(guò)程中異常值出現(xiàn)的頻率通常遠(yuǎn)低于正常數(shù)據(jù)。因此,若將數(shù)據(jù)變化模式映射到某個(gè)特征空間的分區(qū)中,數(shù)據(jù)流中正常數(shù)據(jù)的變化模式落在特征空間的高頻率分區(qū),而異常值的變化模式相對(duì)處于低頻率分區(qū)。

        3.2 訓(xùn)練階段

        訓(xùn)練階段的思想是:在數(shù)據(jù)流中為數(shù)據(jù)變化模式集ΔXi(n)創(chuàng)建一個(gè)分布模型,即將數(shù)據(jù)變化模式映射到某個(gè)特征空間的分區(qū)中,確定非頻繁出現(xiàn)的分區(qū)。

        數(shù)據(jù)變化模式Δxi(t)=│xi(t)-xi(t-1)│,其取值范圍為[0,xmax-xmin],記為D。為了對(duì)數(shù)據(jù)流的模式創(chuàng)建一個(gè)分布模型,將每個(gè)采樣周期產(chǎn)生的模式映射到特征空間中,模式的取值范圍D= [0,xmax-xmin]被均勻地劃分為若干個(gè)模式區(qū)間{d1,d2, …,dk}。模式區(qū)間數(shù)量根據(jù)領(lǐng)域知識(shí)進(jìn)行估計(jì)。每一個(gè)模式區(qū)間對(duì)應(yīng)D的一個(gè)小的取值范圍。

        訓(xùn)練階段開(kāi)始時(shí),對(duì)每個(gè)采樣周期的模式判斷其在哪一個(gè)模式區(qū)間內(nèi),該模式區(qū)間dj出現(xiàn)的次數(shù)V(j)加1。圖3給出了節(jié)點(diǎn)i在訓(xùn)練階段的操作過(guò)程。

        圖3 節(jié)點(diǎn)i訓(xùn)練階段圖

        圖3中,節(jié)點(diǎn)i的訓(xùn)練階段,在時(shí)刻4數(shù)據(jù)變化模式為Δxi(4),判斷其屬于d2分區(qū),V(2)加1。同理,節(jié)點(diǎn)進(jìn)行下一個(gè)時(shí)刻數(shù)據(jù)變化模式Δxi(5)的映射,此時(shí)V(1)為2,該過(guò)程直至訓(xùn)練階段結(jié)束。

        在訓(xùn)練階段結(jié)束時(shí),對(duì)D中的模式區(qū)間統(tǒng)計(jì)其模式出現(xiàn)的次數(shù),計(jì)算各個(gè)模式區(qū)間的頻繁度。

        (3)

        頻繁模式區(qū)間閾值為P,若P(j)

        3.3 檢測(cè)階段

        3.3.1異常識(shí)別

        異常識(shí)別的任務(wù)是篩選出數(shù)據(jù)流中的潛在異常值。學(xué)習(xí)階段結(jié)束后可以獲取特種空間中非頻繁模式區(qū)間。在異常識(shí)別過(guò)程中,將目標(biāo)數(shù)據(jù)映射到特種空間的分區(qū)中,如果該時(shí)刻數(shù)據(jù)的模式落在非頻繁模式區(qū)間,則將其當(dāng)做潛在的異常值進(jìn)行處理。映射過(guò)程與學(xué)習(xí)階段相似。

        3.3.2異常分類

        為了確認(rèn)是否真的出現(xiàn)了異常并對(duì)異常進(jìn)行分類,本文利用WSN數(shù)據(jù)的空間相關(guān)性進(jìn)行驗(yàn)證。當(dāng)節(jié)點(diǎn)i產(chǎn)生一個(gè)潛在異常觀測(cè)值xi(t)時(shí),該節(jié)點(diǎn)利用無(wú)線信道向其鄰節(jié)點(diǎn)Si= {s1,s2, …,sk}請(qǐng)求其t時(shí)刻的數(shù)據(jù)xj(t),其中j∈Si。計(jì)算其鄰居節(jié)點(diǎn)xj(t)的平均值μ和標(biāo)準(zhǔn)差σ。根據(jù)拉依達(dá)準(zhǔn)則,若

        |xi(t)-μ|<δσ

        (4)

        則認(rèn)為該節(jié)點(diǎn)觀測(cè)值與其鄰居節(jié)點(diǎn)觀測(cè)值狀態(tài)相一致,該異常觀測(cè)值是由事件引起的;若不滿足式(4),則認(rèn)為該節(jié)點(diǎn)觀測(cè)值與其鄰居節(jié)點(diǎn)觀測(cè)值狀態(tài)不一致,該異常觀測(cè)值是由節(jié)點(diǎn)軟、硬件故障或者環(huán)境等其他因素引起的錯(cuò)誤數(shù)據(jù)。

        δ的取值根據(jù)實(shí)際應(yīng)用確定。假設(shè)事件是一個(gè)Bernoulli過(guò)程,并且事件過(guò)程中,數(shù)據(jù)符合正態(tài)分布,將事件過(guò)程的數(shù)據(jù)化簡(jiǎn)為符合正態(tài)分布的隨機(jī)變量:

        =1-(Φ(δ)-Φ(-δ))

        =2-2Φ(δ)

        (5)

        其中Φ(δ)為標(biāo)準(zhǔn)正態(tài)分布,當(dāng)Φ(δ)>0.9時(shí),p<0.1,查表可得當(dāng)δ取大于1.29時(shí),Φ(δ)>0.9。本文將在實(shí)驗(yàn)中對(duì)拉依達(dá)系數(shù)δ的取值進(jìn)行討論。

        4 實(shí)驗(yàn)

        本文在MATLAB環(huán)境下采用Inter室內(nèi)實(shí)驗(yàn)室項(xiàng)目[13]數(shù)據(jù)集來(lái)分析算法的性能。所采用的數(shù)據(jù)集的數(shù)據(jù)格式如表1所示。

        表1 Inter室內(nèi)實(shí)驗(yàn)室項(xiàng)目數(shù)據(jù)格式

        4.1 評(píng)估指標(biāo)

        異常值檢測(cè)算法通常使用檢測(cè)率(召回率)、查準(zhǔn)率和誤報(bào)率(虛警率)進(jìn)行評(píng)估。為了定義這些度量,此處采用混淆矩陣,如表2所示。

        表2 混淆矩陣

        因此,檢測(cè)率(Detection rate)、查準(zhǔn)率(Precision rate)和誤報(bào)率(False alarm rate)定義如下:

        檢測(cè)率:Dr=TP/(TP+FN)

        (6)

        查準(zhǔn)率:Pr=TP/(TP+FP)

        (7)

        誤報(bào)率:Fr=FP/(FP+TN)

        (8)

        4.2 算法性能

        本文所提出的算法有兩個(gè)參數(shù)對(duì)算法的性能具有影響,分別為D的分區(qū)頻繁度閾值p和拉依達(dá)準(zhǔn)則的系數(shù)δ。實(shí)驗(yàn)分兩組進(jìn)行,分別分析在設(shè)置不同的分區(qū)頻繁度閾值p和設(shè)置不同拉依達(dá)法則系數(shù)δ的情況下,PFSC算法的性能。

        圖4展示了PFSC算法性能隨分區(qū)頻繁度閾值p變化趨勢(shì)圖。其中p增大時(shí),PFSC算法的檢測(cè)率增大,而查準(zhǔn)率減小,誤判率因查準(zhǔn)率的減小而增大。這是因?yàn)楫?dāng)p取較大值時(shí),算法在判斷潛在異常數(shù)據(jù)時(shí)不僅識(shí)別出實(shí)際異常值,同時(shí)將部分變化模式較大的正常數(shù)據(jù)也識(shí)別為潛在異常數(shù)據(jù),導(dǎo)致算法在檢測(cè)率增大的同時(shí)查準(zhǔn)率下降。當(dāng)p取0.05時(shí),PFSC算法檢測(cè)率為83.903%,準(zhǔn)確率為73.589%,誤判率為1.581%,此時(shí)PFSC性能較好。

        圖4 頻繁模式區(qū)間閾值實(shí)驗(yàn)圖

        圖5展示了不同拉依達(dá)準(zhǔn)則系數(shù)δ對(duì)PFSC算法性能的影響。δ在1.5前后PFSC的檢測(cè)率呈現(xiàn)不同狀態(tài),當(dāng)δ大于1.5時(shí),檢測(cè)率逐漸減小。圖中可以明顯看出,PFSC的準(zhǔn)確率隨δ增大而增大,同時(shí)誤判率持續(xù)減小,這是因?yàn)槔肋_(dá)準(zhǔn)則系數(shù)δ控制錯(cuò)誤數(shù)據(jù)的判定,δ越大說(shuō)明異常數(shù)據(jù)越偏離其鄰居節(jié)點(diǎn)數(shù)據(jù),它為錯(cuò)誤數(shù)據(jù)的可能性越大。其中δ取1.5時(shí),PFSC的檢測(cè)率為83.835%,準(zhǔn)確率為74.093%,誤判率為1.54%。

        圖5 拉依達(dá)準(zhǔn)則系數(shù)δ實(shí)驗(yàn)圖

        從實(shí)驗(yàn)結(jié)果可以看出,PFSC算法在p取0.05,δ取1.5時(shí)性能最好。

        為判定數(shù)據(jù)不同程度的異常率對(duì)算法性能的影響,本文將比較PFSC算法與文獻(xiàn)[14]提出的基于小波的異常檢測(cè)算法(Wavelet Based Outlier Detection,WBOC)和文獻(xiàn)[15]提出的基于K最近鄰的KNN異常檢測(cè)算法在數(shù)據(jù)不同異常率下的性能。其中PFSC算法p取0.05,δ取1.5,WBOC誤差閾值取2,KNN誤差閾值取2。

        實(shí)驗(yàn)效果如圖6~圖7所示。可以看出,當(dāng)節(jié)點(diǎn)采集的數(shù)據(jù)異常率從5%增大到20%時(shí),三種算法的檢測(cè)率都呈下降趨勢(shì)。當(dāng)異常率較大時(shí),在PFSC與KNN算法中,目標(biāo)節(jié)點(diǎn)因鄰居節(jié)點(diǎn)潛在的異常數(shù)據(jù)而影響本地異常值的判定,鄰居節(jié)點(diǎn)集Si中的異常數(shù)據(jù)越多,算法檢測(cè)率越低。其中PFSC算法的異常鑒定與KNN相似,其檢測(cè)率接近于KNN算法。在數(shù)據(jù)異常率為12.5%時(shí),PFSC的檢測(cè)率為80.27%。

        圖6 數(shù)據(jù)異常率對(duì)檢測(cè)率影響

        圖7 數(shù)據(jù)異常率對(duì)誤報(bào)率影響

        圖7展示,當(dāng)節(jié)點(diǎn)產(chǎn)生5%到20%不同程度異常率的數(shù)據(jù)時(shí),PFSC算法的誤判率維持在2.41%左右,相比于WBOC與KNN有更低的誤判率。

        5 結(jié)論

        本文研究了無(wú)線傳感器網(wǎng)絡(luò)中的異常值檢測(cè)問(wèn)題。由于網(wǎng)絡(luò)的特殊特性和資源限制,本文提出了一種基于數(shù)據(jù)變化模式頻繁度與數(shù)據(jù)空間相關(guān)性的PFSC算法,并以在線和分布式的方式檢測(cè)異常。實(shí)驗(yàn)表明,PFSC算法在檢測(cè)不同異常率的數(shù)據(jù)流時(shí)有較高的檢測(cè)率和較小的誤判率。

        [1] MA L,GU X D, WANG B W. Correction of outliers in temperature time series based on sliding window prediction in meteorological sensor network[J]. Information, 2017, 8(2):60.

        [2] GANGULY A R, GAMA J, OMITAOMU O A, et al. Knowledge discovery from sensor data[M]. Springer Berlin Heidelberg, 2010.

        [3] RASSAM M A, ZAINAL A, MAAROF M A. Advancements of data anomaly detection research in wireless sensor networks: a survey and open issues[J]. Sensors, 2013, 13(8): 10087-10122.

        [4] ZHANG Y. Observing the unobservable: distributed online outlier detection in wireless sensor networks[D]. Enschede: University of Twente, 2010.

        [5] LAU B C P, MA E W M, CHOW T W S. Probabilistic fault detector for wireless sensornetwork[J]. Expert Systems with Applications, 2014, 41(8): 3703-3711.

        [6] SUBRAMANIAM S, PALPANAS T, PAPADOPOULOS D, et al. Online outlier detection in sensor data using non-parametric models[C]//Proceedings of the 32nd International Conference on Very Large Data Bases, 2006: 187-198.

        [7] XU X, GENG W, YANG G, et al. LEDFD: A low energy consumption distributed fault detection algorithm for wireless sensor networks[J]. International Journal of Distributed Sensor Networks, 2014, 10(2): 714530.

        [8] BAHREPOUR M, MERATNIA N, POEL M, et al. Distributed event detection in wireless sensor networks for disaster management[C]//Intelligent Networking and Collaborative Systems (INCOS), 2010 2nd International Conference on. IEEE, 2010: 507-512.

        [9] HILL D J, MINSKER B S. Anomaly detection in streaming environmental sensor data: A data-driven modeling approach[J]. Environmental Modelling & Software, 2010, 25(9): 1014-1022.

        [10] FAWZY A, MIKHTAR H M O, HEGAZY O. Outliers detection and classification in wireless sensor networks[J]. Egyptian Informatics Journal, 2013, 14(2): 157-164.

        [11] BRANCH J W,GIANNELLA C, SZYMANSKI B, et al. In-network outlier detection in wireless sensor networks[J]. Knowledge and Information Systems, 2013, 34(1): 23-54.

        [12] O′REILLY C, GLUHAK A, IMRAN M A, et al. Anomaly detection in wireless sensor networks in a non-stationary environment[J]. IEEE Communications Surveys & Tutorials, 2014, 16(3): 1413-1432.

        [13] Intel. IntelLab data[EB/OL].(2004-××-××).http://www.select.cs. cmu.edu/data/labapp3/index.html.

        [14] ZHUANG Y Z, CHEN L. In-network outlier cleaning for data collection in sensor networks[C]// Int′l VLDB Workshop on Clean Databases, Cleandb 2006.

        [15] XIE M, HU J K, HAN S, et al. Scalable hypergrid k-NN-based online anomaly detection in wireless sensor networks[J]. IEEE Transactions on Parallel and Distributed Systems, 2013, 24(8): 1661-1670.

        猜你喜歡
        分區(qū)區(qū)間觀測(cè)
        觀測(cè)到恒星死亡瞬間
        軍事文摘(2023年18期)2023-11-03 09:45:42
        解兩類含參數(shù)的復(fù)合不等式有解與恒成立問(wèn)題
        你學(xué)會(huì)“區(qū)間測(cè)速”了嗎
        上海實(shí)施“分區(qū)封控”
        浪莎 分區(qū)而治
        天測(cè)與測(cè)地VLBI 測(cè)地站周圍地形觀測(cè)遮掩的討論
        可觀測(cè)宇宙
        太空探索(2016年7期)2016-07-10 12:10:15
        區(qū)間對(duì)象族的可鎮(zhèn)定性分析
        高分辨率對(duì)地觀測(cè)系統(tǒng)
        太空探索(2015年8期)2015-07-18 11:04:44
        基于SAGA聚類分析的無(wú)功電壓控制分區(qū)
        538在线视频| 免费观看激色视频网站| 亚洲av纯肉无码精品动漫| 国产日韩久久久精品影院首页| 中文字幕无线精品亚洲乱码一区| 中文字幕人妻久久久中出| 亚洲人成网线在线播放va蜜芽| 国产性一交一乱一伦一色一情| 99JK无码免费| 国产自拍成人在线免费视频| 国精产品一区一区二区三区mba| 亚洲av永久无码天堂网毛片| 国产系列丝袜熟女精品视频| 一区二区三区成人av| 久久久久人妻精品一区二区三区| 久久夜色精品国产亚洲av老牛 | 蜜桃tv在线免费观看| 无人区一码二码三码四码区| 日韩一欧美内射在线观看| 狠狠亚洲超碰狼人久久老人| 久久久精品国产免费看| 国产av旡码专区亚洲av苍井空| 2021国产视频不卡在线| 综合久久青青草免费观看视频| 亚洲国产一区二区三区| 久久精品噜噜噜成人| 国产高清吃奶成免费视频网站| 激情免费视频一区二区三区| 中文字幕亚洲综合久久| 99精品视频在线观看免费| 国产香蕉尹人在线视频你懂的| 亚洲天堂一区二区偷拍| 精品www日韩熟女人妻| 国产成人av综合亚洲色欲| 美女射精视频在线观看| 亚洲精品国产成人片| 亚洲av无码片一区二区三区| 亚洲av综合色区久久精品天堂| 青青草亚洲视频社区在线播放观看| 国产麻豆剧传媒精品国产av| 日本香蕉久久一区二区视频|