梁花,李瑋,高爽,吳超,解紹詞
(1.國網(wǎng)重慶市電力公司電力科學(xué)研究院,重慶 401123;2.南瑞集團(tuán)有限公司(國網(wǎng)電力科學(xué)研究院有限公司),江蘇 南京 211106;3.南京南瑞信息通信科技有限公司,江蘇 南京 211106;4.重慶郵電大學(xué) 軟件工程學(xué)院,重慶 400065)
近年來,雷電、臺風(fēng)、山火等極端自然災(zāi)害頻發(fā),給輸電線路運(yùn)行帶來嚴(yán)峻考驗(yàn)。面對復(fù)雜的輸電線路環(huán)境,目前還沒有完美的解決方案來對輸電線路安全進(jìn)行監(jiān)控和緊急處理。傳統(tǒng)方法都是建立在數(shù)學(xué)模型的基礎(chǔ)上,能否有效地解決實(shí)際問題還有待驗(yàn)證[1]。因此,使用物聯(lián)網(wǎng)(Internet of things, IoT)進(jìn)行安全監(jiān)控和事故預(yù)警對于確保輸電線路的安全運(yùn)行具有重要的現(xiàn)實(shí)意義。及時(shí)準(zhǔn)確的安全警告仍然存在許多挑戰(zhàn):無線網(wǎng)絡(luò)傳輸溫度數(shù)據(jù)不可靠,容易丟失數(shù)據(jù);對環(huán)境溫度數(shù)據(jù)進(jìn)行多源異常檢測時(shí),準(zhǔn)確率不高,以及在惡劣環(huán)境中基站會產(chǎn)生極大的能耗[2-3]。實(shí)時(shí)數(shù)據(jù)異常檢測具有重要的實(shí)際應(yīng)用。在輸電線路中,不同的傳感器節(jié)點(diǎn)會定期收集環(huán)境數(shù)據(jù)信息,通過檢測傳感數(shù)據(jù)流的異常情況,可以預(yù)測發(fā)生異常事件的概率,從而及時(shí)進(jìn)行響應(yīng)和處理。首先,輸電線路需要部署多種類型的傳感器來收集數(shù)據(jù),主要包括溫度、濕度、氣體、風(fēng)速、應(yīng)力、位移等,如何對多源傳感器數(shù)據(jù)進(jìn)行異常檢測是一個挑戰(zhàn)。其次,針對異常數(shù)據(jù)檢測的安全預(yù)警需要考慮低延遲需求。最后,數(shù)據(jù)收集在地理上是相關(guān)的且對時(shí)間敏感,這在很大程度上取決于收集節(jié)點(diǎn)的時(shí)間和地理位置信息,如何確定其相關(guān)性和準(zhǔn)確性是異常檢測的一個挑戰(zhàn)。
為了提高異常檢測率,本文提出基于鏈形混合拓?fù)涞妮旊娋€路溫度異常檢測方法,用于輸電線路的早期安全預(yù)警。本文的主要內(nèi)容如下:
a)針對傳統(tǒng)的異常檢測算法功耗大、檢測率低的問題,設(shè)計(jì)單源數(shù)據(jù)異常檢測算法(single-source data anomaly detection algorithm,SDADA),在保證低能耗的前提下,實(shí)現(xiàn)整個系統(tǒng)的負(fù)載均衡和低延遲數(shù)據(jù)處理。算法基于時(shí)間維度建立,同時(shí)考慮相鄰時(shí)刻的數(shù)據(jù)值,對多個連續(xù)時(shí)刻的異常數(shù)據(jù)檢測結(jié)果進(jìn)行綜合分析,避免由于單側(cè)的異常而導(dǎo)致的異常檢測結(jié)果誤差。
b)針對輸電線路中特殊的結(jié)構(gòu),提出一種在基站端執(zhí)行的多源多維數(shù)據(jù)異常檢測算法(multi-source and multi-dimensional data anomaly detection algorithm,MDADA)。當(dāng)異常檢測算法工作時(shí),將選擇具有位置相關(guān)的傳感器數(shù)據(jù)進(jìn)行綜合分析,避免由于某一個傳感器故障引起的錯誤。
c)將本文提出的方法與其他異常方法進(jìn)行實(shí)驗(yàn)比較,以證明本文方法的有效性。
目前,對IoT的研究主要集中在實(shí)時(shí)處理、安全可靠傳輸?shù)确矫鎇4-9]。數(shù)據(jù)異常檢測的研究主要針對無線傳感器網(wǎng)絡(luò)(wireless sensor networks,WSN)。文獻(xiàn)[10]提出一種WSN中的數(shù)據(jù)異常檢測方法,但是無法解決實(shí)際的應(yīng)用問題。文獻(xiàn)[11]提出了一種醫(yī)療無線傳感器網(wǎng)絡(luò)數(shù)據(jù)異常檢測方法,能夠有效地檢測異常變化,及時(shí)預(yù)警動態(tài)變化;然而,這種方法要求在無線環(huán)境下具有較高的可靠性和實(shí)時(shí)性。
無線傳感器網(wǎng)絡(luò)異常檢測的研究進(jìn)展如下:
a)基于統(tǒng)計(jì)的異常檢測方法。該方法是一種古老而成熟的方法,它為數(shù)據(jù)集建立分布模型,與目標(biāo)數(shù)據(jù)相吻合的正常數(shù)據(jù)落在高概率區(qū)間,而異常值落在低概率區(qū)間。根據(jù)模型中目標(biāo)數(shù)據(jù)集中落的概率判斷異常。文獻(xiàn)[12]提出了一種MDADA,該方法通過統(tǒng)計(jì)的方法進(jìn)行檢測,主要應(yīng)用于平臺空間,利用二維坐標(biāo)位置確定節(jié)點(diǎn)間的關(guān)系。文獻(xiàn)[13]研究了基于時(shí)間序列的異常檢測方法,提出了一種基于概率區(qū)間統(tǒng)計(jì)的異常檢測方法,該算法比聚合算法具有更高的數(shù)據(jù)識別率。文獻(xiàn)[14]研究了異常檢測方法在城市交通分析中的應(yīng)用,重點(diǎn)研究了基于異常值的檢測方法。該方法能夠有效地分析交通數(shù)據(jù),但在交通條件復(fù)雜的城市,應(yīng)用效果有限。
b)基于距離的異常檢測方法。該方法通常建立在相同的基本假設(shè)基礎(chǔ)上,即正常數(shù)據(jù)對象之間的距離較近,異常數(shù)據(jù)對象與正常數(shù)據(jù)對象之間的距離較遠(yuǎn)。在數(shù)據(jù)對象的屬性變量是連續(xù)的情況下,通常使用歐幾里德距離來測量數(shù)據(jù)對象之間的遠(yuǎn)近關(guān)系。文獻(xiàn)[15]提出了一個確定相鄰節(jié)點(diǎn)之間關(guān)系的模型,基于密度估計(jì)的統(tǒng)計(jì)性質(zhì),導(dǎo)出了插入在樣本容量、樣本維數(shù)和潛在概率分布方面的偏差和方差。文獻(xiàn)[16]提出了一種基于鄰居節(jié)點(diǎn)信息的數(shù)據(jù)異常檢測方法。該方法采用機(jī)器學(xué)習(xí)算法,通過分布式處理實(shí)現(xiàn)數(shù)據(jù)異常檢測,減少通信開銷。
c)基于聚類的異常檢測方法。聚類是將相似或相關(guān)的數(shù)據(jù)對象分類到一個類別中[17]。如果一個數(shù)據(jù)對象在聚類過程中不能被歸類到任何一個聚類中,那么這個數(shù)據(jù)對象就可以被認(rèn)為是異常的。文獻(xiàn)[18]分析了WSN中數(shù)據(jù)完整性的異常檢測,通過溫度、濕度、電壓等特性,采用聚類分析的方法,完成數(shù)據(jù)異常檢測,該方法能保證較高的檢測精度。文獻(xiàn)[19]提出了一種用于微聚類的數(shù)據(jù)異常檢測方法,并設(shè)計(jì)了一種利用局部異常點(diǎn)作為離線組件來檢測和指定異常點(diǎn)的方法。文獻(xiàn)[20]定義了無線傳感器網(wǎng)絡(luò)中數(shù)據(jù)的異常值,提出了一種基于數(shù)據(jù)分類的概率密度函數(shù)估計(jì)和計(jì)算方法,該方法已被證明適用于不同類型的數(shù)據(jù)測試,包括高斯分布。
d)基于人工智能的異常檢測方法。目前,人工智能理論已應(yīng)用于數(shù)據(jù)異常檢測。其中,以深度學(xué)習(xí)和機(jī)器學(xué)習(xí)為代表的相關(guān)算法解決了一些問題。通過人工智能方法,可以訓(xùn)練大數(shù)據(jù)集來提高檢測精度。文獻(xiàn)[21]提出了一種基于空間分析和光譜異常檢測的數(shù)據(jù)挖掘異常檢測方法,用于檢測原始損失。該方法可用于視頻流等連續(xù)性數(shù)據(jù)案例。目前無線傳感器網(wǎng)絡(luò)中有很多數(shù)據(jù)異常檢測方法[22],并取得了很好的效果。然而,對于特殊領(lǐng)域的研究還很少,特別是氣溫?cái)?shù)據(jù)的異常檢測還有待進(jìn)一步研究。
本方法主要由基于時(shí)間維度的SDADA、基于SDADA改進(jìn)的MDADA和基于SDADA和MDADA的異常檢測模型3部分構(gòu)成。異常檢測模型如圖1所示,它的主要部分由SDADA和MDADA構(gòu)成。首先,傳感器對采集的數(shù)據(jù)預(yù)處理;其次,基站端執(zhí)行SDADA對數(shù)據(jù)進(jìn)行異常檢測;最后,為了提高異常檢測率,MDADA分析位于不同基站的多個傳感器的數(shù)據(jù),將空間維度添加到SDADA中,根據(jù)位置維度和時(shí)間維度判斷數(shù)據(jù)是否異常。
根據(jù)輸電線路環(huán)境要求,輸電線路安全監(jiān)控由多個有線總線型拓?fù)浣Y(jié)構(gòu)組成,每個基站包含多個傳感器,構(gòu)成一個星形WSN的拓?fù)?,不同干道通過主光纖連接到遠(yuǎn)程云服務(wù)器。圖1描述了系統(tǒng)的整體拓?fù)洹C總€傳感器收集環(huán)境數(shù)據(jù)后簡單處理,定期將無線數(shù)據(jù)發(fā)送到基站,然后基站通過有線鏈路將其發(fā)送到服務(wù)器進(jìn)行分析并處理。通常,每個干道的結(jié)構(gòu)基本相同且彼此獨(dú)立。
圖1 系統(tǒng)拓?fù)浣Y(jié)構(gòu)
(1)
圖2 基站數(shù)據(jù)緩沖隊(duì)列
傳統(tǒng)的數(shù)據(jù)異常檢測算法通常在遠(yuǎn)程云中執(zhí)行異常決策,并利用云平臺上的大數(shù)據(jù)存儲和分析功能對數(shù)據(jù)進(jìn)行異常檢測和分析。但是,輸電操作復(fù)雜多變,隨時(shí)可能發(fā)生異常事件。這需要數(shù)據(jù)異常檢測同時(shí)滿足準(zhǔn)確性和實(shí)時(shí)性要求。在許多輸電線路安全事故中,由于不能及時(shí)檢測環(huán)境異常,導(dǎo)致無法在災(zāi)難發(fā)生時(shí)有效地安排疏散和救災(zāi)工作。為此,本文提出將異常決策轉(zhuǎn)移到邊緣基站。
根據(jù)IoT中用于輸電線路的特殊拓?fù)浣Y(jié)構(gòu),將數(shù)據(jù)異常檢測操作分布在不同的節(jié)點(diǎn)單元中進(jìn)行處理。
異常檢測模型的整體架構(gòu)如圖3所示。按照異常檢測的功能劃分,用于輸電線路安全監(jiān)控和預(yù)警的IoT系統(tǒng)主要由3部分組成:遠(yuǎn)程云服務(wù)器、基站(匯聚節(jié)點(diǎn))和傳感器。圖3(a)顯示了預(yù)警系統(tǒng)的物理架構(gòu),其中遠(yuǎn)程云負(fù)責(zé)存儲和分析基站上傳的數(shù)據(jù);傳感器負(fù)責(zé)定期收集諸如溫度、濕度、氣體濃度等數(shù)據(jù),并通過無線介質(zhì)將其發(fā)送到相應(yīng)的基站;基站負(fù)責(zé)匯總傳感器收集的數(shù)據(jù),并通過有線鏈路轉(zhuǎn)發(fā)該數(shù)據(jù)。圖3(b)顯示了預(yù)警系統(tǒng)的邏輯模型,該模型分為基站和傳感器2個單元;基站的硬件設(shè)備在處理能力和存儲容量方面均優(yōu)于傳感器,另外,基站設(shè)備通常由有線電源供電,備用電池容量也很大;因此,基站的任務(wù)主要是執(zhí)行MDADA,傳感器節(jié)點(diǎn)的任務(wù)是執(zhí)行SDADA。
圖3 異常檢測模型
預(yù)警系統(tǒng)的工作過程概括如下:
a)傳感器程序根據(jù)要求定期收集環(huán)境狀態(tài)數(shù)據(jù)。收集數(shù)據(jù)后,執(zhí)行SDADA。檢測完成后,原始數(shù)據(jù)和檢測結(jié)果將發(fā)送到基站。傳感器的處理器通常僅具有簡單的信息處理和無線傳輸功能,因此只能執(zhí)行簡單的數(shù)據(jù)異常檢測。
b)基站等待接收傳感器側(cè)發(fā)送的數(shù)據(jù)。基站接收到數(shù)據(jù)后,進(jìn)行多源異常檢測,并與接收到的單源異常檢測結(jié)果相結(jié)合,進(jìn)行綜合分析,獲得最終的異常檢測結(jié)果,將其與原始數(shù)據(jù)一起發(fā)送到云中?;驹O(shè)備具有相對強(qiáng)大的處理器,例如MSP430和ARM(Advanced RISC Machines),因此在基站處部署多源多維異常檢測程序以執(zhí)行。此外,當(dāng)數(shù)據(jù)檢測觸發(fā)異常事件時(shí),系統(tǒng)將根據(jù)輸電線路的安全預(yù)防和預(yù)警級別啟動緊急預(yù)警和處理計(jì)劃。
c)云平臺側(cè)等待接收基站發(fā)送的數(shù)據(jù)。接收到數(shù)據(jù)后,將其存儲在云平臺的數(shù)據(jù)庫中。然后,決策中心使用數(shù)據(jù)挖掘、人工智能等算法對原始數(shù)據(jù)進(jìn)行分析和決策,并實(shí)施相應(yīng)的決策處理方案。
在輸電線路工作環(huán)境中,正常范圍內(nèi)的不同數(shù)據(jù)也具有不同的含義。例如,假設(shè)2個溫度數(shù)據(jù)15 ℃和23 ℃均為正常溫度值,很明顯,這是不同的工作環(huán)境。因此,將異常數(shù)據(jù)定義為是否能反映實(shí)際情況。傳統(tǒng)的SDADA只會考慮單個基站所收集的數(shù)據(jù),不能準(zhǔn)確地判斷出該數(shù)據(jù)是否為正常數(shù)據(jù),因此提出了基于時(shí)間維度的SDADA。
(2)
本文實(shí)驗(yàn)數(shù)據(jù)集選取的是中國氣象數(shù)據(jù)網(wǎng)2018年北京市6個區(qū)每日24 h的平均氣溫。由于晝夜溫差較大且采集氣溫?cái)?shù)據(jù)的基站之間距離較遠(yuǎn),使得基站之間采集的氣溫?cái)?shù)據(jù)具有明顯的差異。例如,在夏天正午時(shí)刻的時(shí)候,農(nóng)村地區(qū)的氣溫明顯比城市里低2~5 ℃,且農(nóng)村地區(qū)升溫較慢,這就造成采集的氣溫?cái)?shù)據(jù)集具有一定的波動性。因此,為了提高數(shù)據(jù)異常檢測的準(zhǔn)確性,本文采用異常檢測方法結(jié)果進(jìn)行分析,重新定義式(2)為
(3)
多源異常數(shù)據(jù)變化如圖4所示,假設(shè)在時(shí)間t,需要對時(shí)間t-w+1,...t-2,t-1,t之間的數(shù)據(jù)進(jìn)行異常檢測,其中1 圖4 多源異常數(shù)據(jù)變化曲線 雖然傳感器B的值在時(shí)間t小于傳感器A的值,但傳感器B的數(shù)據(jù)為異常的。因此需要進(jìn)行多源數(shù)據(jù)異常檢測,分析相鄰傳感器數(shù)據(jù)的結(jié)果。 ?i∈[1,N],j∈[1,ci],t∈[1,T]有: (4) 因?yàn)榛臼褂镁彌_隊(duì)列來存儲傳感數(shù)據(jù),因此傳感數(shù)據(jù)的存儲量不能超過緩沖區(qū)隊(duì)列的長度。假設(shè)在基站i,存儲隊(duì)列Qi最多存儲數(shù)據(jù)量為Cnt(Qi),Pi為第i個基站的傳感器數(shù)量。基站i的第j個傳感器,可以在緩沖區(qū)隊(duì)列中存儲的數(shù)據(jù)量為|Cnt(Qi)/pi,即 (5) 根據(jù)式(4)、(5),有 (6) (7) (8) SDADA采用式(3)和(8)來檢測傳感器數(shù)據(jù)。對于第i基站的第j個傳感器在時(shí)間t處檢測異常數(shù)據(jù)的算法分為兩部分:首先,根據(jù)式(6)計(jì)算時(shí)間t處單源數(shù)據(jù)的異常值,并在傳感器處執(zhí)行該部分的算法;其次,根據(jù)式(8),對時(shí)間t之前單源數(shù)據(jù)的異常值進(jìn)行綜合分析。第i個基站的第j個傳感器在時(shí)間t時(shí)的SDADA如下: a)在傳感器側(cè),根據(jù)式(3),計(jì)算時(shí)間t的異常數(shù)據(jù)值Dec(i,j,t),將其余原始數(shù)據(jù)一起發(fā)送到基站,并存儲在基站的緩沖隊(duì)列Q中。 c)根據(jù)式(8)返回異常檢測結(jié)果?;就ㄟ^一個緩沖隊(duì)列發(fā)送傳感器數(shù)據(jù),對于基站i,存儲隊(duì)列Qi最多存儲Cnt(Qi)數(shù)據(jù)。傳感器數(shù)據(jù)包括傳感器數(shù)量、時(shí)間、原始數(shù)據(jù)和簡單的異常檢測結(jié)果?;緦⒒咎枴碜詡鞲衅鞯臄?shù)據(jù)信息和SDADA的最終結(jié)果存儲在緩沖隊(duì)列。數(shù)據(jù)的存儲結(jié)構(gòu)分別由傳感器數(shù)據(jù)幀(sensor data frame,SDF)和基站數(shù)據(jù)幀(base station data frame,BDF)表示。 傳感器將SDF數(shù)據(jù)發(fā)送到基站,基站將SDF數(shù)據(jù)存儲在本地緩存隊(duì)列中,依次遍歷緩沖區(qū)隊(duì)列中的SDF數(shù)據(jù),并多次執(zhí)行SDADA,最終將檢測結(jié)果和SDF數(shù)據(jù)封裝為BDF數(shù)據(jù)。 SDADA往往依賴單個傳感器的數(shù)據(jù),但是該異常檢測結(jié)果沒有考慮其他傳感器節(jié)點(diǎn)檢測結(jié)果,這就會造成準(zhǔn)確率相對較低。例如,由于設(shè)備故障,傳感器收集的數(shù)據(jù)值異常,但是這種異常不是真實(shí)數(shù)據(jù),因此需要考慮多個相似節(jié)點(diǎn)的異常數(shù)據(jù)值,于是提出了MDADA。 MDADA的目的是分析相同傳感器類型的多個傳感器數(shù)據(jù)。與SDADA不同,此方法不依賴單個傳感器的數(shù)據(jù),而是分析位于不同基站的多個傳感器的數(shù)據(jù)。因此,將空間維度添加到等式(8)的時(shí)間維度。MDADA需要確定多個傳感器的位置,并根據(jù)位置獲取離傳感器較近的節(jié)點(diǎn)集。本文通過位置相關(guān)性定義不同傳感器之間的距離關(guān)系,用于確定候選異常數(shù)據(jù)隊(duì)列,并對特定時(shí)間的異常數(shù)據(jù)值進(jìn)行綜合分析。 文獻(xiàn)[20]中提出了一種基于平面坐標(biāo)位置的節(jié)點(diǎn)關(guān)聯(lián)計(jì)算方法,但是該方法計(jì)算復(fù)雜。輸電線路傳輸環(huán)境空間很大,為了便于設(shè)計(jì),將二維坐標(biāo)簡化為一維,如圖1的拓?fù)鋱D屬于混合網(wǎng)絡(luò)拓?fù)?,它由基站的總線型結(jié)構(gòu)和基站與傳感器的星形網(wǎng)絡(luò)結(jié)構(gòu)組成。因此,在輸電線路中,傳感器的位置僅由距離確定。假設(shè)相鄰傳感器之間的距離相同,并且基站和傳感器根據(jù)其位置編號。傳感器的位置相關(guān)定義如下: 第i個基站的第j個傳感器與第m個基站的第n個傳感器之間的位置相關(guān)值 (9) 式中g(shù)(g≥2)是相關(guān)整數(shù)系數(shù),根據(jù)輸電線路的具體要求設(shè)置。 如果相關(guān)值大于0,則表明存在相關(guān);如果小于等于0,則表示沒有相關(guān)性。因此,本文選取相關(guān)大于0的數(shù)據(jù)作為候選數(shù)據(jù)分析,并使用H(i,j)作為第i個基站的第j個傳感器的候選節(jié)點(diǎn)集,?m∈[1,N],n∈[1,cm],有: (10) 第i基站的第j個傳感器在時(shí)間t的MDADA結(jié)果 (11) 為了評估本文提出的異常檢測方法的有效性,構(gòu)建驗(yàn)證平臺開展大量實(shí)驗(yàn)。本文實(shí)驗(yàn)數(shù)據(jù)集[23]選取的是中國氣象數(shù)據(jù)網(wǎng)2018年北京市6個區(qū)每天24 h的平均氣溫。晝夜溫差較大且采集氣溫?cái)?shù)據(jù)的基站之間距離較遠(yuǎn),使得基站之間采集的氣溫?cái)?shù)據(jù)具有明顯的差異;例如,在夏天正午時(shí)刻的時(shí)候,農(nóng)村地區(qū)的氣溫明顯比城市里低2 ~5 ℃,且農(nóng)村地區(qū)升溫較慢,這就造成采集的氣溫?cái)?shù)據(jù)集具有一定的波動性。用C語言編寫算法程序,數(shù)據(jù)結(jié)果用Python分析。為了檢測算法在不同實(shí)驗(yàn)條件下的性能,對不同數(shù)據(jù)規(guī)模下的準(zhǔn)確性和延遲指標(biāo)進(jìn)行測量。測試數(shù)據(jù)集隨機(jī)生成異常數(shù)據(jù),整體數(shù)據(jù)值服從正態(tài)分布。式(8)、(9)、(11)中,設(shè)ξ=0.5,x=5,ψ=0.4。實(shí)驗(yàn)平臺環(huán)境及參數(shù)設(shè)置見表1。 表1 實(shí)驗(yàn)參數(shù) 與仿真不同,實(shí)驗(yàn)主要探討如何在實(shí)際的嵌入式系統(tǒng)上執(zhí)行異常檢測,因此將根據(jù)情況簡化一些理論參數(shù)。例如,假定CPU處理速率為常數(shù)1。此設(shè)置也符合實(shí)際情況。 本文主要研究檢測算法的2個性能指標(biāo):檢測精度,算法執(zhí)行時(shí)間。檢測精度定義為數(shù)據(jù)異常檢測的結(jié)果數(shù)與異??倲?shù)之比,該指標(biāo)可以反映檢測算法的執(zhí)行效率。算法執(zhí)行時(shí)間定義為數(shù)據(jù)異常檢測所需的總時(shí)間,用于測量算法執(zhí)行的時(shí)間復(fù)雜度。平均延遲定義為異常檢測中所有數(shù)據(jù)的處理時(shí)間的平均值,用于測量檢測方案的時(shí)間敏感性。在當(dāng)前的數(shù)據(jù)異常檢測方法中,基于聚類的方法被廣泛使用,主要方法包括具有噪聲的基于密度的聚類方法 (density-based spatial clustering of applications with noise,DBSCAN)、k均值聚類算法(k-means clustering algorithm,k-means)等。其中,DBSCAN是學(xué)術(shù)界研究最多的方法之一。因此,本文選擇基于DBSCAN的異常檢測方法進(jìn)行比較分析。實(shí)驗(yàn)探索3種異常檢測方案的性能:傳統(tǒng)的異常檢測方法(DBSCAN)、SDADA和MDADA。在相同數(shù)據(jù)集的情況下,實(shí)驗(yàn)比較并分析不同方案之間檢測效率和成本的差異。 3種方案的精度比較如圖5所示,隨著數(shù)據(jù)量的增加,MDADA的檢測精度最高,這表明所提出的檢測方法可以有效地分析數(shù)據(jù)的時(shí)空變化并獲得合理的結(jié)果。此外,SDADA和MDADA方法的檢測精度都隨著數(shù)據(jù)量的增加而呈線性增長,而DBSCAN方法的檢測精度卻隨著數(shù)據(jù)量的增加而變化不大。這是因?yàn)镈BSCAN主要依賴于單點(diǎn)數(shù)據(jù)值,并且數(shù)據(jù)規(guī)模的變化不會影響其檢測精度。隨著數(shù)據(jù)規(guī)模的增加,MDADA算法與SDADA的檢測精度增大。根據(jù)圖5中的數(shù)據(jù)變化情況,數(shù)據(jù)規(guī)模對DBSCAN的影響較小,而對MDADA的影響較大。因此,MDADA方法非常適合用于輸電線路的大規(guī)模無線傳感網(wǎng)絡(luò)中的大量數(shù)據(jù)異常檢測。根據(jù)實(shí)驗(yàn)分析,當(dāng)數(shù)據(jù)規(guī)模較大時(shí),MDADA可以獲得更高的異常檢測精度。 圖5 數(shù)據(jù)異常檢測的準(zhǔn)確率 3種檢測方案之間的執(zhí)行時(shí)間比較如圖6所示。從圖6可以看出,MDADA方法分析連續(xù)時(shí)間和相關(guān)位置節(jié)點(diǎn)的多個數(shù)據(jù),因此執(zhí)行時(shí)間比SDADA方法多。從圖6可以看出隨著數(shù)據(jù)規(guī)模的增加,MDADA和DBSCAN的執(zhí)行時(shí)間都呈現(xiàn)出近似線性增長的趨勢??傮w而言,DBSCAN比MDADA執(zhí)行更多的時(shí)間。特別是當(dāng)數(shù)據(jù)規(guī)模很大時(shí),2種算法執(zhí)行時(shí)間的差異就很明顯。從實(shí)驗(yàn)結(jié)果可以看出,MDADA的執(zhí)行時(shí)間少于DBSCAN,并且數(shù)據(jù)規(guī)模對執(zhí)行時(shí)間的影響近似線性。這是因?yàn)镸DADA執(zhí)行時(shí)間分散在基站和傳感器節(jié)點(diǎn)上,從而實(shí)現(xiàn)了有效的負(fù)載平衡并降低了節(jié)點(diǎn)能耗。 圖6 執(zhí)行時(shí)間 本文提出了一種基于鏈形混合拓?fù)涞妮旊娋€路溫度異常檢測方法,旨在對輸電環(huán)境中的物聯(lián)網(wǎng)進(jìn)行事故預(yù)警。根據(jù)總線型網(wǎng)絡(luò)和鏈型網(wǎng)絡(luò)的特殊混合拓?fù)洌紫忍岢龌赟DADA和MDADA算法的異常檢測模型,該模型可以在基站端執(zhí)行MDADA,以實(shí)現(xiàn)負(fù)載均衡和低延遲數(shù)據(jù)處理。其次,提出基于時(shí)間維度的SDADA,該算法考慮了監(jiān)測數(shù)據(jù)的時(shí)間相關(guān)性。最后,設(shè)計(jì)考慮多源數(shù)據(jù)時(shí)空相關(guān)性的MDADA。實(shí)驗(yàn)驗(yàn)證結(jié)果表明,所提出的方案在檢測精度和執(zhí)行時(shí)間方面比傳統(tǒng)的方案表現(xiàn)更好。2.3 基于SDADA改進(jìn)的MDADA
3 實(shí)驗(yàn)分析和結(jié)果
4 結(jié)束語