孫瀅濤,張鋒明,陳水標(biāo),葛 晶
(國(guó)網(wǎng)紹興供電公司,紹興 312000)
隨著智能電網(wǎng)的建設(shè)與發(fā)展,電力部門在發(fā)電、輸電、變電、配電、用電和調(diào)度6大環(huán)節(jié)中,安裝和部署了大量數(shù)據(jù)采集傳感器。這些傳感器每天會(huì)產(chǎn)生大量來(lái)源各異、結(jié)構(gòu)多樣、形式不同的電力數(shù)據(jù),是當(dāng)前電力大數(shù)據(jù)的主要來(lái)源。通過(guò)對(duì)電力大數(shù)據(jù)進(jìn)行有效挖掘,可以大力推動(dòng)電網(wǎng)從傳統(tǒng)以物理模型為核心的業(yè)務(wù)模式轉(zhuǎn)向以數(shù)據(jù)為基礎(chǔ)的業(yè)務(wù)模式[1-2]。
然而由于數(shù)據(jù)來(lái)源不同,對(duì)相同數(shù)據(jù)的統(tǒng)計(jì)口徑不同,操作人員錄入習(xí)慣差異及缺乏統(tǒng)一的數(shù)據(jù)質(zhì)量管理體系,經(jīng)常會(huì)導(dǎo)致異常數(shù)據(jù)的產(chǎn)生。異常數(shù)據(jù)往往蘊(yùn)藏著電力系統(tǒng)產(chǎn)生故障的相關(guān)信息,能夠?yàn)殡娋W(wǎng)技術(shù)人員深入了解電力系統(tǒng)運(yùn)行狀態(tài),提高異常事件查處命中率等提供幫助,因此具有巨大的研究?jī)r(jià)值。早期的異常檢測(cè)多采用人工巡檢方式,效率低且準(zhǔn)確率不高,隨著電力大數(shù)據(jù)技術(shù)的發(fā)展,如何在大量、多源、異構(gòu)數(shù)據(jù)中,快速、準(zhǔn)確地實(shí)現(xiàn)對(duì)異常數(shù)據(jù)的自動(dòng)化檢測(cè),成為當(dāng)前的研究熱點(diǎn)[3-5]。
目前,國(guó)內(nèi)外學(xué)者針對(duì)電力大數(shù)據(jù)異常檢測(cè)的研究主要可分為基于統(tǒng)計(jì)的異常檢測(cè)方法、基于聚類的異常檢測(cè)方法和基于分類的異常檢測(cè)方法。①基于統(tǒng)計(jì)的異常檢測(cè)方法認(rèn)為正常數(shù)據(jù)服從相同的概率分布模型,而異常數(shù)據(jù)的概率分布模型與正常數(shù)據(jù)存在區(qū)別,因此通過(guò)對(duì)數(shù)據(jù)的統(tǒng)計(jì)模型進(jìn)行分析便可實(shí)現(xiàn)對(duì)數(shù)據(jù)集中的異常值進(jìn)行檢測(cè)。文獻(xiàn)[6]和文獻(xiàn)[7]分別介紹了基于有參數(shù)統(tǒng)計(jì)模型的異常數(shù)據(jù)檢測(cè)方法和基于無(wú)參數(shù)統(tǒng)計(jì)模型的異常數(shù)據(jù)檢測(cè)方法,實(shí)驗(yàn)結(jié)果表明,該方法在數(shù)據(jù)統(tǒng)計(jì)規(guī)律簡(jiǎn)單且數(shù)據(jù)量不大時(shí),能獲得較好的檢測(cè)性能。然而電力大數(shù)據(jù)具有典型的時(shí)間強(qiáng)耦合、高維復(fù)雜等特點(diǎn),在這種情況下,該類方法往往不能得到很好的檢測(cè)結(jié)果。②基于聚類的異常檢測(cè)方法是當(dāng)前應(yīng)用最廣的一種方法,其思路是利用K-means(K-均值),根據(jù)密度的聚類DBSCAN(densitybased spatial clustering of applications with noise)等聚類方法對(duì)數(shù)據(jù)集進(jìn)行分析,聚類后不屬于任何聚類簇或者離聚類中心較遠(yuǎn)的數(shù)據(jù)點(diǎn)即判定為異常數(shù)據(jù)。文獻(xiàn)[8]利用K-近鄰K-NN(K-nearest neigh?bor)對(duì)DBSCAN進(jìn)行優(yōu)化,提出一種改進(jìn)的快速密度峰值聚類算法實(shí)現(xiàn)對(duì)電力大數(shù)據(jù)異常值的檢測(cè);文獻(xiàn)[9]對(duì)傳統(tǒng)K-means算法初始聚類中心的選取策略進(jìn)行優(yōu)化,提出一種改進(jìn)K-means算法的異常檢測(cè)方法,該方法能在有效降低迭代次數(shù)的同時(shí)獲得較高的聚類準(zhǔn)確率和異常檢測(cè)性能;文獻(xiàn)[10]針對(duì)竊電等異常用電行為,提出一種模糊聚類算法對(duì)智能電表收集到的數(shù)據(jù)進(jìn)行分析,并對(duì)采樣的真實(shí)數(shù)據(jù)集開(kāi)展實(shí)驗(yàn),驗(yàn)證了算法對(duì)異常用電行為檢測(cè)的有效性。然而基于聚類的異常檢測(cè)算法性能受聚類簇個(gè)數(shù)影響較大,目前常用的主觀試湊法存在運(yùn)算量大和主觀性強(qiáng)的問(wèn)題,對(duì)不同數(shù)據(jù)集獲得的結(jié)果往往差異較大,魯棒性不足。③基于分類的異常檢測(cè)方法在對(duì)電力大數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,利用低維特征向量對(duì)原始高維數(shù)據(jù)進(jìn)行表征,有效降低算法復(fù)雜度,然后利用模式分類方法對(duì)特征向量進(jìn)行分類識(shí)別,自動(dòng)確定異常數(shù)據(jù)[11]。文獻(xiàn)[12]首先利用隨機(jī)森林算法自動(dòng)選擇電力數(shù)據(jù)中重要性較高的特征,然后利用雙向長(zhǎng)短期記憶LSTM(long short-term memory)網(wǎng)絡(luò)進(jìn)行分類,自動(dòng)實(shí)現(xiàn)網(wǎng)絡(luò)異常行為的檢測(cè);文獻(xiàn)[13]從額定電壓偏離度、電壓不平衡度、電流不平衡度、電流相關(guān)系數(shù)和日用電量離散系數(shù)5個(gè)維度提取特征,實(shí)現(xiàn)對(duì)正常、疑似和異常3種用電行為的有效檢測(cè)。
本文在上述研究的基礎(chǔ)上,提出一種基于多域特征提取的電力大數(shù)據(jù)異常檢測(cè)方法。首先,提取波動(dòng)性、趨勢(shì)性和變動(dòng)性特征等9維特征對(duì)電力數(shù)據(jù)時(shí)間序列進(jìn)行表征;然后,利用相關(guān)向量機(jī)RVM(relevance vector machine)自動(dòng)選擇最優(yōu)2維特征構(gòu)成特征向量;最后,采用支撐向量數(shù)據(jù)描述SVDD(support vector data description)構(gòu)造一類分類器,對(duì)特征向量進(jìn)行分類,從而實(shí)現(xiàn)對(duì)異常數(shù)據(jù)檢測(cè)。針對(duì)SVDD核參數(shù)σ和懲罰因子C的設(shè)置問(wèn)題,將磷蝦KH(krill herd)算法引入SVDD優(yōu)化領(lǐng)域,提升算法收斂精度;基于某地電網(wǎng)用戶電力負(fù)荷數(shù)據(jù)開(kāi)展實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明所提方法能夠?qū)崿F(xiàn)對(duì)所有異常數(shù)據(jù)的正確檢測(cè),當(dāng)信噪比低至-6 dB時(shí)依然能夠獲得較好的檢測(cè)性能,具有較強(qiáng)噪聲魯棒性。
電力大數(shù)據(jù)是一種物理信息耦合,可以將與時(shí)間緊密相關(guān)的數(shù)據(jù)集合,作為典型的1維時(shí)間序列x(t)進(jìn)行處理,其中,x(t)為t時(shí)刻的采樣值,t=1,2,…,E,E為時(shí)間序列總長(zhǎng)度。由于x(t)具備高維、非線性、結(jié)構(gòu)復(fù)雜和大規(guī)模等特點(diǎn),直接進(jìn)行分析要消耗大量的運(yùn)算資源,異常檢測(cè)效率低。同時(shí)數(shù)據(jù)中不可避免地會(huì)存在量測(cè)噪聲和隨機(jī)誤差等問(wèn)題,也會(huì)影響檢測(cè)結(jié)果的準(zhǔn)確性和可靠性。因此需要對(duì)原始數(shù)據(jù)進(jìn)行處理以降低檢測(cè)算法的運(yùn)算復(fù)雜度并提升噪聲穩(wěn)健性。
特征提取是機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域中一種常用的數(shù)據(jù)降維手段,通過(guò)對(duì)原始高維數(shù)據(jù)進(jìn)行分析,從中創(chuàng)造凝練出一些特征,這些特征能夠準(zhǔn)確描述原始數(shù)據(jù)的本質(zhì)屬性,從而達(dá)到數(shù)據(jù)降維的同時(shí)降低噪聲等隨機(jī)誤差影響的目的[14]。本節(jié)將針對(duì)電力數(shù)據(jù)隨時(shí)間變化特征,從波動(dòng)性、趨勢(shì)性和變動(dòng)性3個(gè)維度提取9維特征,對(duì)原始時(shí)間序列x(t)進(jìn)行描述和表征。
1.1.1 波動(dòng)性特征
1.1.2 趨勢(shì)性特征
1.1.3 變動(dòng)性特征
得到9維特征后,可以直接將其作為特征向量輸入到分類器中進(jìn)行分類識(shí)別和異常檢測(cè),但由于本文采用的是人工特征提取方法,提取的特征中不可避免地會(huì)存在一些冗余特征,這些特征的存在不僅不會(huì)增加對(duì)分類識(shí)別和異常檢測(cè)的有用信息,相反可能會(huì)降低檢測(cè)性能的可靠性。因此有必要進(jìn)行特征選擇,進(jìn)一步對(duì)9維特征進(jìn)行降維,選取對(duì)檢測(cè)性能有重要影響的少數(shù)特征。
RVM是在2001年被提出的一種貝葉斯框架下的模式分類算法,與支撐向量機(jī)SVM(support vec?tor machine)類似,RVM也是利用核函數(shù)將低維空間中的線性不可分問(wèn)題轉(zhuǎn)化為高維空間的線性可分問(wèn)題,但在3個(gè)方面又優(yōu)于SVM:①具備更高的稀疏性,能夠自動(dòng)完成特征選擇;②特征選擇與分類識(shí)別采用相同的優(yōu)化函數(shù),能夠獲得更優(yōu)的分類性能;③核函數(shù)的選擇不再依賴于摩西準(zhǔn)則,能夠提供概率式的預(yù)測(cè)。因此本文采用RVM進(jìn)一步對(duì)特征進(jìn)行分析,自動(dòng)實(shí)現(xiàn)最優(yōu)特征組合的選擇。
對(duì)于1個(gè)訓(xùn)練樣本的特征向量集合{ym,zm},其中,m=1,…,M,M為訓(xùn)練樣本總數(shù);ym為特征向量;zm∈{0 ,1}為類別標(biāo)號(hào)。RVM分類問(wèn)題的優(yōu)化函數(shù)可表示為
式中:K(y,ym)為核函數(shù);y、w分別為模型中的待求變量;wm為第m個(gè)訓(xùn)練樣本對(duì)應(yīng)權(quán)重;ε為高斯白噪聲。
為了對(duì)輸入特征對(duì)應(yīng)的目標(biāo)值做出概率預(yù)測(cè),RVM將sigmoid函數(shù)引入,此時(shí)似然函數(shù)可表示為
式中,σ[·]為沖擊函數(shù)。
為了構(gòu)建完整貝葉斯模型,進(jìn)一步對(duì)模型中參數(shù)的先驗(yàn)分布進(jìn)行構(gòu)建,假設(shè)w服從0均值、方差為α-1的高斯分布,而α-1和噪聲方差τ-1的先驗(yàn)分布為伽馬分布,即
式中:a=b=c=d=10-6為超參數(shù),不提供任何信息;α為方差α-1的逆;αm為α的第m個(gè)分量;τ為噪聲方差τ-1的倒數(shù)。
模型求解通常采用變分貝葉斯期望最大VBEM(variational bayes expectation maximization)算法,求解過(guò)程中大部分α?xí)呄驘o(wú)窮大,對(duì)應(yīng)的w則趨于0,從而實(shí)現(xiàn)了權(quán)值向量的稀疏化,迭代終止時(shí)不為0的權(quán)值對(duì)應(yīng)的特征向量即為最終要選擇的最優(yōu)特征組合[15]。
KH算法是Gandomi等學(xué)者于2012年提出的一種模擬KH活動(dòng)規(guī)律的優(yōu)化算法,其基本思想是將覓食過(guò)程中KH的位置狀態(tài)作為優(yōu)化問(wèn)題的解,隨著時(shí)間的推移KH逐漸聚集于食物所在地,即不斷尋找最優(yōu)解。作為一種隨機(jī)搜索算法,KH算法具備控制參數(shù)少、實(shí)現(xiàn)簡(jiǎn)單等優(yōu)點(diǎn),同時(shí)算法迭代過(guò)程中同時(shí)包含全局尋優(yōu)和局部尋優(yōu)兩種策略,兩種策略并行搜索使算法兼有局部開(kāi)發(fā)與全局勘探的平衡[18]。因此本文將KH算法引入SVDD參數(shù)優(yōu)化領(lǐng)域,利用KH算法對(duì)SVDD中核參數(shù)σ和懲罰因子C進(jìn)行優(yōu)化,提出KH算法優(yōu)化的SVDD即KHSVDD的一類分類方法。
圖1給出了本文所提基于特征提取和改進(jìn)SVDD的電力數(shù)據(jù)異常檢測(cè)算法的流程。由圖1可以看出,算法從左到右包含2個(gè)階段,分別為訓(xùn)練階段和測(cè)試階段;從上到下又可以分為2個(gè)層次,第1層為電力數(shù)據(jù)特征表示,第2層為特征數(shù)據(jù)異常檢測(cè)。
圖1 所提算法流程Fig.1 Flow chart of the proposed algorithm
1)訓(xùn)練階段具體步驟
步驟1將獲取的正常電力數(shù)據(jù)構(gòu)成訓(xùn)練樣本集作為訓(xùn)練階段的算法輸入。相對(duì)于其他異常檢測(cè)方法需要正常數(shù)據(jù)和異常數(shù)據(jù)2種數(shù)據(jù)集,本文所提方法只需實(shí)際中容易獲取的正常樣本即可完成訓(xùn)練,降低了數(shù)據(jù)獲取難度。
步驟2根據(jù)式(1)~(9)對(duì)訓(xùn)練數(shù)據(jù)集提取9維特征構(gòu)成特征向量,實(shí)現(xiàn)原始高維數(shù)據(jù)的降維,并降低算法運(yùn)算復(fù)雜度。
步驟3采用第2.2節(jié)中的RVM算法自動(dòng)進(jìn)行特征選擇,得到低維特征向量。在剔除冗余特征的同時(shí)能夠進(jìn)一步降低算法運(yùn)算復(fù)雜度,提升算法實(shí)時(shí)性。
步驟4將步驟3得到的特征向量作為SVDD分類器的輸入完成最優(yōu)分類面的求解,在這一過(guò)程中,運(yùn)用第2.2節(jié)KH算法對(duì)SVDD的核參數(shù)σ和懲罰因子C進(jìn)行全局尋優(yōu),提升算法穩(wěn)健性。
2)測(cè)試階段具體步驟
步驟1輸入測(cè)試數(shù)據(jù)(正常數(shù)據(jù)或異常數(shù)據(jù))。
步驟2根據(jù)訓(xùn)練階段中步驟3選擇的低維特征向量提取特征,構(gòu)成測(cè)試數(shù)據(jù)的特征向量。
步驟3利用訓(xùn)練階段步驟4得到的最優(yōu)SVDD分類面對(duì)特征向量進(jìn)行分類,給出數(shù)據(jù)是否正常的判決結(jié)果。
3)所提方法的優(yōu)勢(shì)
(1)由于導(dǎo)致電力數(shù)據(jù)出現(xiàn)異常的原因很多,且發(fā)生時(shí)機(jī)較為隨機(jī),通常難以獲得足夠的異常數(shù)據(jù)集,而所提方法只需正常樣本一類數(shù)據(jù)即可完成模型訓(xùn)練,降低了數(shù)據(jù)獲取難度,適合應(yīng)用于電力大數(shù)據(jù);
(2)通過(guò)9維特征提取和RVM自動(dòng)特征選擇大大降低了訓(xùn)練階段的運(yùn)算復(fù)雜度;
(3)KH算法優(yōu)化SVDD KH-SVDD(krill herd op?timized SVDD)分類器能夠獲得更優(yōu)的分類性能和魯棒性;
(4)測(cè)試階段直接提取訓(xùn)練階段RVM選擇的特征,降低了特征提取的運(yùn)算量,提升了算法的實(shí)時(shí)性。
在電力大數(shù)據(jù)范圍內(nèi),電力負(fù)荷數(shù)據(jù)是一種典型的終端數(shù)據(jù),隨時(shí)間連續(xù)變化,曲線特征明顯,能夠很好地反映用戶的用電習(xí)慣,因此本文以電力用戶的月平均負(fù)荷數(shù)據(jù)作為研究對(duì)象。選取某地電網(wǎng)98個(gè)用戶的連續(xù)用電負(fù)荷數(shù)據(jù)開(kāi)展實(shí)驗(yàn),其中85戶為正常用戶,13戶為異常用戶,異常用戶比例為13.27%。實(shí)驗(yàn)中首先隨機(jī)從85個(gè)正常用戶中選取80個(gè)用戶數(shù)據(jù)作為訓(xùn)練樣本集,剩余5個(gè)正常用戶和13個(gè)異常用戶作為測(cè)試樣本集。
根據(jù)圖1算法流程,首先對(duì)80組正常用戶電力數(shù)據(jù)提取9維特征,同時(shí)由第2.1節(jié)可以看出不同特征對(duì)應(yīng)的度量單位是不一致的,因此需要對(duì)其進(jìn)行歸一化處理。本文采用Z-score歸一化方法,利用數(shù)據(jù)的均值和標(biāo)準(zhǔn)差對(duì)數(shù)據(jù)進(jìn)行處理,使歸一化后的數(shù)據(jù)集合服從均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布,從而消除不同度量單位的影響。Z-score歸一化方法的表達(dá)式為
式中:f為原始數(shù)據(jù);f′為歸一化后的數(shù)據(jù);mean(f)、std(f)分別為f的均值和方差。
采用RVM對(duì)訓(xùn)練數(shù)據(jù)特征集合進(jìn)行分析和自動(dòng)特征選擇,迭代終止時(shí)9維特征對(duì)應(yīng)的權(quán)值如圖2所示。由圖2可知,特征2和特征8對(duì)應(yīng)的權(quán)值較大,而特征1、特征3、特征4~7、特征9對(duì)應(yīng)的權(quán)值均較小(小于0.1),即RVM自動(dòng)選取特征2和特征8作為最優(yōu)特征組合。
圖2 RVM特征選擇結(jié)果Fig.2 Feature selection results of RVM
為了判斷RVM選擇的特征是否最優(yōu),運(yùn)用相關(guān)矩陣對(duì)9維特征的線性相關(guān)程度進(jìn)行分析,特征之間相關(guān)性越大,表明特征之間包含較多的重疊冗余信息,可以只取其中一個(gè)作為最優(yōu)特征代替。表1給出了相關(guān)矩陣,由表1可以看出特征1、特征3與特征2之間的相關(guān)系數(shù)較大,而特征5~7、特征9與特征8之間的相關(guān)系數(shù)較大,表明特征2和特征8包含了9維特征中的大部分有用信息,驗(yàn)證了RVM特征提取的有效性。特征4的幾何平均數(shù)與其他8維特征的相關(guān)性均較小,但是RVM并沒(méi)有將其選為最優(yōu)特征,究其原因在于幾何平均數(shù)更適合分析具有等比或近似等比關(guān)系的數(shù)據(jù),而用戶電力負(fù)荷數(shù)據(jù)是累加關(guān)系,因此幾何平均數(shù)特征并不適合本文的應(yīng)用場(chǎng)景。
表1 特征相關(guān)性分析Tab.1 Feature correlation analysis
得到訓(xùn)練特征集合后,利用訓(xùn)練特征對(duì)SVDD分類器進(jìn)行訓(xùn)練,同時(shí)采用KH算法對(duì)SVDD的核參數(shù)σ和懲罰因子C進(jìn)行優(yōu)化,迭代過(guò)程中σ和C的變化曲線如圖3所示。由圖3可知,經(jīng)大約20次迭代,KH-SVDD算法收斂,此時(shí)最優(yōu)參數(shù)組合為σ*=0.3,C*=8.5。
圖3 KH算法優(yōu)化SVDD參數(shù)過(guò)程Fig.3 Optimization of SVDD parameters by the KH algorithm
在得到最優(yōu)SVDD分類面后,根據(jù)圖1所示流程,算法進(jìn)入測(cè)試階段。首先對(duì)測(cè)試數(shù)據(jù)提取RVM選擇的2維特征構(gòu)成特征向量,利用最優(yōu)SVDD分類器進(jìn)行分類判決實(shí)現(xiàn)異常檢測(cè)。圖4給出了最終的判決結(jié)果,由圖4可知,測(cè)試數(shù)據(jù)中的13組異常樣本全部落在最優(yōu)分類面之外,測(cè)試樣本中的5組正常樣本全部落在最優(yōu)分類面以內(nèi),表明測(cè)試數(shù)據(jù)集中的所有樣本均被正確判決,驗(yàn)證了所提方法的有效性。
圖4 所提方法異常檢測(cè)結(jié)果Fig.4 Results of anomaly detection using the proposed method
接收機(jī)工作特性ROC(receiver operating char?acteristic)曲線被廣泛應(yīng)用于評(píng)估分類模型的性能。圖5給出了對(duì)本文所提模型進(jìn)行評(píng)估計(jì)算得到的ROC曲線,其中,橫軸為模型的虛警概率FPR(false positive rate),縱軸為模型的檢測(cè)概率TPR(true positive rate);同時(shí)為了對(duì)比,在圖5中也給出了相同條件下采用文獻(xiàn)[9]中模型計(jì)算得到的ROC曲線,可以看出所提模型的ROC曲線更靠近于二維平面的左上方,曲線下面積AUC(area under curve)值大于文獻(xiàn)[9]方法,因此可以獲得更優(yōu)的分類性能。
圖5 不同方法ROC曲線Fig.5 ROC curves of different methods
為了進(jìn)一步驗(yàn)證所提方法在噪聲等隨機(jī)誤差存在情況下的穩(wěn)健性,采取向測(cè)試數(shù)據(jù)加入高斯白噪聲的方式構(gòu)建不同信噪比的測(cè)試數(shù)據(jù)集,本文信噪比定義為
式中:為信號(hào)的平均功率;Pε為高斯噪聲信號(hào)ε的功率。
表2和表3分別給出了不同信噪比條件下所提方法和文獻(xiàn)[9]方法得到的檢測(cè)結(jié)果混淆矩陣。由表2可知,當(dāng)信噪比高于-2 dB時(shí),所提方法均可以正確完成異常數(shù)據(jù)檢測(cè);當(dāng)信噪比低于-4 dB時(shí),所提方法能夠?qū)崿F(xiàn)對(duì)所有異常數(shù)據(jù)的檢測(cè),此時(shí)1組正常樣本被判決為異常數(shù)據(jù),出現(xiàn)了虛警;當(dāng)信噪比低至-6 dB時(shí),所提方法依舊能夠?qū)崿F(xiàn)對(duì)所有異常數(shù)據(jù)的檢測(cè),只有2組正常樣本被判決為異常數(shù)據(jù)。同樣由表3所示結(jié)果可以看出,采用文獻(xiàn)[9]所提方法在信噪比為0 dB時(shí)所有異常數(shù)據(jù)均被正確檢測(cè),但此時(shí)1組正常數(shù)據(jù)被錯(cuò)誤判決為異常樣本;當(dāng)信噪比高于2 dB時(shí),文獻(xiàn)[9]所提方法方能對(duì)所有數(shù)據(jù)實(shí)現(xiàn)正確分類識(shí)別。表2、表3結(jié)果表明,所提方法的異常檢測(cè)性能明顯優(yōu)于文獻(xiàn)[9]方法,并且具有更強(qiáng)的噪聲魯棒性,在低信噪比條件下能夠有效實(shí)現(xiàn)異常檢測(cè)。
表2 不同信噪比下異常檢測(cè)結(jié)果(所提方法)Tab.2 Results of anomaly detection at different SNRs(using the proposed method)
表3 不同信噪比下異常檢測(cè)結(jié)果(文獻(xiàn)[9]方法)Tab.3 Results of anomaly detection at different SNRs(using the method in Ref.[9])
針對(duì)電力大數(shù)據(jù)非線性、高維度、時(shí)間強(qiáng)耦合的特點(diǎn),本文提出一種多特征提取和KH-SVDD的電力數(shù)據(jù)異常檢測(cè)方法。首先,采用特征提取思路實(shí)現(xiàn)對(duì)高維電力數(shù)據(jù)時(shí)間序列的降維,利用9維波動(dòng)性、趨勢(shì)性和變動(dòng)性特征對(duì)時(shí)間序列進(jìn)行表征。然后,采用RVM進(jìn)行特征選擇,自動(dòng)確定最優(yōu)特征組合作為特征向量輸入到SVDD分類器進(jìn)行分類判決;針對(duì)SVDD參數(shù)選擇問(wèn)題將KH算法引入,對(duì)核參數(shù)σ和懲罰因子C進(jìn)行全局尋優(yōu),提升異常檢測(cè)性能。最后,通過(guò)對(duì)某地電網(wǎng)用戶電力負(fù)荷數(shù)據(jù)進(jìn)行異常檢測(cè)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,所提方法能夠有效實(shí)現(xiàn)異常用電檢測(cè),提升電力稽查自動(dòng)化程度和稽查效率,節(jié)省人力物力,具有較高應(yīng)用前景。
電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)2022年6期