劉 灝,朱世佳,畢天姝
(新能源電力系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(華北電力大學(xué)),北京市 102206)
同步相量測(cè)量單元(synchrophasor measurement unit,PMU)因其同步性、快速性和準(zhǔn)確性,已成為實(shí)現(xiàn)狀態(tài)感知的重要裝置[1]。此外,PMU 可以為決策控制、振蕩檢測(cè)和狀態(tài)估計(jì)[2-4]等應(yīng)用提供數(shù)據(jù)。截至2018 年,中國(guó)已安裝投運(yùn)了約3 000 臺(tái)PMU,覆蓋全部220 kV 及以上電壓等級(jí)變電站、發(fā)電廠和大部分并網(wǎng)可再生能源發(fā)電機(jī)組[5]。2017 年底,北美也安裝了約2 500 臺(tái)PMU[6]。
然而,受通信擁塞、干擾和網(wǎng)絡(luò)攻擊等諸多因素的影響,PMU 存在不同程度的數(shù)據(jù)質(zhì)量問題[7]。北美約10%~17%的PMU 數(shù)據(jù)存在質(zhì)量問題[8],這一比例在中國(guó)高達(dá)20%~30%。PMU 數(shù)據(jù)質(zhì)量問題嚴(yán)重制約其在電網(wǎng)監(jiān)測(cè)、保護(hù)與控制等應(yīng)用中的運(yùn)行效果。尤其是連續(xù)壞數(shù)據(jù)與擾動(dòng)數(shù)據(jù)高度相似,可能會(huì)導(dǎo)致控制中心做出錯(cuò)誤的決策,甚至威脅系統(tǒng)安全。因此,準(zhǔn)確檢測(cè)PMU 連續(xù)壞數(shù)據(jù)至關(guān)重要。
目前檢測(cè)PMU 壞數(shù)據(jù)的方法主要有模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩大類。文獻(xiàn)[9]給出了一種結(jié)合卡爾曼濾波和平滑算法的時(shí)間序列預(yù)測(cè)模型來(lái)檢測(cè)壞數(shù)據(jù)。文獻(xiàn)[10]提出了一種基于無(wú)跡卡爾曼濾波器并結(jié)合狀態(tài)估計(jì)的方法,實(shí)時(shí)檢測(cè)壞數(shù)據(jù)。文獻(xiàn)[11]提出了一種魯棒的廣義估計(jì)量,根據(jù)測(cè)量的時(shí)間相關(guān)性和統(tǒng)計(jì)一致性來(lái)檢測(cè)壞數(shù)據(jù)?;谀P偷姆椒ǘ夹枰到y(tǒng)拓?fù)浜途€路參數(shù)的先驗(yàn)知識(shí),因此,若系統(tǒng)拓?fù)鋮?shù)未知或存在偏差,2 種方法的效果都會(huì)受到影響。
數(shù)據(jù)驅(qū)動(dòng)的方法近年來(lái)受到廣泛關(guān)注。文獻(xiàn)[12]以神經(jīng)網(wǎng)絡(luò)的加權(quán)輸出殘差作為聚類特征,再采用距離代價(jià)函數(shù)的K 均值算法來(lái)檢測(cè)壞數(shù)據(jù)。文獻(xiàn)[13]對(duì)誤差序列進(jìn)行聚類,并利用間隙統(tǒng)計(jì)算法確定最佳聚類個(gè)數(shù),從而對(duì)壞數(shù)據(jù)進(jìn)行識(shí)別。文獻(xiàn)[14]提出了一種集成學(xué)習(xí)算法來(lái)檢測(cè)壞數(shù)據(jù)。這些方法僅適用于靜態(tài)數(shù)據(jù)中的異常檢測(cè)。
文獻(xiàn)[15]構(gòu)造了雙層長(zhǎng)短期記憶網(wǎng)絡(luò),通過(guò)分解重構(gòu)誤差檢測(cè)壞數(shù)據(jù)。文獻(xiàn)[16]提出了一種基于主成分分析的方法來(lái)檢測(cè)壞數(shù)據(jù),利用低維主成分對(duì)擾動(dòng)敏感、高維主成分對(duì)壞數(shù)據(jù)敏感的特征來(lái)區(qū)分?jǐn)_動(dòng)數(shù)據(jù)。文獻(xiàn)[17]基于四點(diǎn)斜率特征構(gòu)造決策樹區(qū)分?jǐn)_動(dòng)數(shù)據(jù)和壞數(shù)據(jù)。但是這些方法均是有監(jiān)督的,存在離線訓(xùn)練的負(fù)擔(dān)。
文獻(xiàn)[18]提出了一種基于時(shí)空相似性的方法在線檢測(cè)壞數(shù)據(jù)。文獻(xiàn)[19]構(gòu)造了Hankel 矩陣,通過(guò)隨機(jī)置換數(shù)據(jù)矩陣的列,并對(duì)置換前后Hankel 矩陣的秩進(jìn)行比較來(lái)區(qū)分壞數(shù)據(jù)和擾動(dòng)數(shù)據(jù),其本質(zhì)是利用置換后數(shù)據(jù)時(shí)間相關(guān)性丟失這一性質(zhì)進(jìn)行區(qū)分。上述方法對(duì)擾動(dòng)過(guò)程中攻擊注入的動(dòng)態(tài)相關(guān)性強(qiáng)的連續(xù)壞數(shù)據(jù)可能不適用。
因此,本文提出了一種無(wú)監(jiān)督的基于動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)和局部離群因子(local outlier factor,LOF)的檢測(cè)方法。該方法能在區(qū)分?jǐn)_動(dòng)數(shù)據(jù)的同時(shí),有效檢測(cè)歷史數(shù)據(jù)攻擊這類更隱蔽攻擊以及存在次同步振蕩的連續(xù)壞數(shù)據(jù)。
本文主要研究因通信擁塞、干擾或網(wǎng)絡(luò)攻擊等導(dǎo)致的PMU 連續(xù)壞數(shù)據(jù)。在正常或擾動(dòng)條件下,所有良好的PMU 數(shù)據(jù)本質(zhì)上為同一電網(wǎng)不同物理位置的PMU 量測(cè)序列。因此,相近位置獲得的良好PMU 數(shù)據(jù)往往具有相似的動(dòng)態(tài)行為,因?yàn)榇砹讼嗤牡讓游锢硐到y(tǒng)動(dòng)態(tài)。然而,壞數(shù)據(jù)被認(rèn)為是由其他數(shù)據(jù)源生成,因此具有不同的動(dòng)態(tài)特性[20]。以PMU 幅值數(shù)據(jù)為例,現(xiàn)場(chǎng)實(shí)測(cè)擾動(dòng)數(shù)據(jù)、連續(xù)壞數(shù)據(jù)和正常數(shù)據(jù)之間的對(duì)比如圖1 所示。
圖1 實(shí)測(cè)擾動(dòng)數(shù)據(jù)、連續(xù)壞數(shù)據(jù)以及正常數(shù)據(jù)比較Fig.1 Comparison of measured disturbance data,continous bad data,and normal data
圖1 中PMU1、PMU2、…、PMUn分別為鄰近的第1 臺(tái)PMU、第2 臺(tái)PMU、…、第n臺(tái)PMU。由圖1可以看到,在出現(xiàn)擾動(dòng)時(shí),雖然數(shù)據(jù)表現(xiàn)出時(shí)序異常,但在擾動(dòng)過(guò)程中多臺(tái)PMU 數(shù)據(jù)表現(xiàn)出相同的波動(dòng)趨勢(shì)。而出現(xiàn)壞數(shù)據(jù)時(shí),個(gè)別PMU 數(shù)據(jù)不僅時(shí)序異常,而且在空間上也和其他PMU 數(shù)據(jù)不同。
基于上述分析可知,在正常和擾動(dòng)運(yùn)行條件下,PMU 壞數(shù)據(jù)與其相鄰PMU 良好的數(shù)據(jù)具有弱時(shí)空相關(guān)性,因此可以視為時(shí)空異常值;PMU 連續(xù)壞數(shù)據(jù)在同一時(shí)間窗內(nèi)具有弱空間相似性,而擾動(dòng)數(shù)據(jù)具有強(qiáng)空間相似性。因此,根據(jù)這一特性可在線識(shí)別連續(xù)壞數(shù)據(jù),并保證擾動(dòng)數(shù)據(jù)不被誤判。
值得注意的是,弱時(shí)空相關(guān)性的特征也適用于協(xié)同網(wǎng)絡(luò)攻擊。假設(shè)攻擊者只有有限的資源,只能在短時(shí)間內(nèi)攻擊一小部分PMU。與系統(tǒng)物理擾動(dòng)可能會(huì)影響在本地區(qū)域內(nèi)獲得的大量PMU 數(shù)據(jù)不同,資源有限的攻擊者只能操作有限數(shù)量的PMU。因此,部分協(xié)同攻擊下的PMU 數(shù)據(jù)也與其相鄰的無(wú)攻擊數(shù)據(jù)保持微弱的時(shí)空相關(guān)性。
擾動(dòng)數(shù)據(jù)表現(xiàn)出強(qiáng)的空間相似性,而連續(xù)壞數(shù)據(jù)表現(xiàn)出弱的空間相似性。DTW 的優(yōu)勢(shì)是在2 個(gè)時(shí)間序列長(zhǎng)度不一致時(shí)(例如1 臺(tái)PMU 出現(xiàn)數(shù)據(jù)丟失),仍能很好評(píng)估相似性。采用相關(guān)系數(shù)法計(jì)算協(xié)方差時(shí)需要2 個(gè)PMU 序列長(zhǎng)度一致,且相關(guān)系數(shù)接近1 的程度受PMU 數(shù)據(jù)量的影響。因此,本文利用DTW 距離來(lái)衡量2 臺(tái)PMU 的空間相似性。
DTW 算法采用動(dòng)態(tài)規(guī)劃的思想,通過(guò)調(diào)整PMU 序列中不同時(shí)刻對(duì)應(yīng)元素之間的關(guān)系,找到一條最優(yōu)彎曲路徑,使路徑的距離最小,從而評(píng)估PMU 序列之間的關(guān)系[21]。DTW 路徑示意圖如圖2所示。給定2 臺(tái)PMU 數(shù)據(jù)X={x1,x2,…,xn}和Y={y1,y2,…,ym},X和Y可以同為電壓幅值或頻率。本文以幅值為例,構(gòu)造了距離矩陣Dn×m,其元素D(i,j)為:
式中:xi和yj分別為第i個(gè)測(cè)量點(diǎn)和第j個(gè)測(cè)量點(diǎn)的相量幅值;n和m分別為第1 臺(tái)和第2 臺(tái)PMU 數(shù)據(jù)的測(cè)量點(diǎn)數(shù)。
式(1)表示2 臺(tái)PMU 數(shù)據(jù)點(diǎn)xi和yj的歐幾里德距離。矩陣D中每組相鄰元素(圖2 中S1和S2)的集合稱為彎曲路徑,需要滿足邊界性、連續(xù)性和單調(diào)性的約束[22]。滿足上述約束條件的彎曲路徑有多條。彎曲路徑可以表示為P={p1,p2,…,ps,…,pk},其中k是路徑中元素的總數(shù),元素ps是路徑上點(diǎn)s的坐標(biāo),即ps=(i,j),其中i和j分別為不同PMU 的測(cè)量點(diǎn)。
圖2 DTW 路徑示意圖Fig.2 Schematic diagram of DTW path
DTW 的目的是找到一條最優(yōu)的彎曲路徑,使PMU 數(shù)據(jù)X和Y的彎曲總代價(jià)最小,即找到一條最短路徑(如圖2 中藍(lán)色實(shí)心方塊所示的路徑):
式中:DTW(X,Y)為被用來(lái)計(jì)算PMU 數(shù)據(jù)X和Y距離的函數(shù)。
DTW 距離越小,表示2 臺(tái)PMU 數(shù)據(jù)間的空間相似度越高。利用式(2)可以評(píng)估任意1 臺(tái)PMU 數(shù)據(jù)與所研究系統(tǒng)中其他PMU 數(shù)據(jù)在一段時(shí)間窗內(nèi)的空間相似性,以此作為區(qū)分?jǐn)_動(dòng)數(shù)據(jù)和連續(xù)壞數(shù)據(jù)的特征。
使用上面的過(guò)程能夠提取出可區(qū)分連續(xù)壞數(shù)據(jù)和擾動(dòng)數(shù)據(jù)的空間特征。在一段時(shí)間窗內(nèi)空間相似性強(qiáng)的數(shù)據(jù)將被視為正常(擾動(dòng))數(shù)據(jù),空間相似性弱的PMU 數(shù)據(jù)被確認(rèn)為在當(dāng)前窗口存在壞數(shù)據(jù)的PMU。如何根據(jù)所研究系統(tǒng)中任意2 臺(tái)PMU 計(jì)算得到空間相似性矩陣,并得到每臺(tái)PMU 的異常情況就成為難點(diǎn)。本章擬通過(guò)計(jì)算任意2 臺(tái)PMU 空間相似性的比值作為2 臺(tái)PMU 的距離,進(jìn)一步基于密度得到每臺(tái)PMU 的異常分?jǐn)?shù)(LOF 值)。
LOF 法是基于密度的方法,它旨在發(fā)現(xiàn)數(shù)據(jù)集中異常模式。異常與否,取決于樣本點(diǎn)與周圍鄰居的密度比。在本文所研究的問題中,LOF 法中的樣本點(diǎn)即空間內(nèi)每臺(tái)PMU,通過(guò)計(jì)算每臺(tái)PMU 和它相鄰PMU 的密度比值來(lái)判斷任意1 臺(tái)PMU 在空間上的異常程度。
圖3 中,每個(gè)點(diǎn)表示空間中不同位置的PMU。C1和C2代表正常PMU 簇;O1和O2代表離群的異常PMU。由圖3 可知,如果1 臺(tái)PMU 的密度比較小,而它周圍臨近PMU 的密度比較高,那么它越離群(例如圖中的O1),從而成功選出空間相似度弱的PMU。
圖3 LOF 示意圖Fig.3 Schematic diagram of LOF
在LOF 法中,通過(guò)給每臺(tái)PMU 都分配1 個(gè)依賴于鄰域密度的LOF 值,可以判斷該臺(tái)PMU 是否為空間異常。對(duì)圖3 中任意2 臺(tái)PMU 的距離定義如下:
式中:N為所研究系統(tǒng)中PMU 的臺(tái)數(shù);Li為第i臺(tái)PMU 數(shù)據(jù)。
式(3)將基于DTW 算法求得的任意1 臺(tái)PMU與其他PMU 的平均距離作為其空間特征,2 臺(tái)PMU 的空間相似性的比值作為L(zhǎng)OF 法里任意2 臺(tái)PMU 的距離,從而便于挑選出空間相似性弱的點(diǎn)(離群點(diǎn))。
在式(3)的基礎(chǔ)上,可計(jì)算每臺(tái)PMU 的LOF值,見附錄A。LOF 值超過(guò)閾值被認(rèn)為是壞數(shù)據(jù),由此實(shí)現(xiàn)正?;驍_動(dòng)數(shù)據(jù)和連續(xù)壞數(shù)據(jù)的劃分。
在一個(gè)平穩(wěn)的擾動(dòng)數(shù)據(jù)集,LOF 值為2 可能就是一段壞數(shù)據(jù),而在一個(gè)強(qiáng)烈波動(dòng)的數(shù)據(jù)集里,LOF 值為5 可能仍然是一個(gè)正常值,所以簡(jiǎn)單地采用一個(gè)常數(shù)作為閾值明顯不合理。本文提出了一種基于箱線圖的閾值確定法,根據(jù)PMU 數(shù)據(jù)集的整體波動(dòng)情況靈活設(shè)定閾值。
箱線圖是一種用作顯示一組數(shù)據(jù)分散情況的統(tǒng)計(jì)圖,是利用數(shù)據(jù)中的5 個(gè)統(tǒng)計(jì)量(最小值、上四分位數(shù)、中位數(shù)、下四分位數(shù)、最大值)來(lái)描述數(shù)據(jù)的一種方法。箱線圖示意圖如圖4 所示。圖4 中,上四分位數(shù)、下四分位數(shù)指的是一組LOF 值按從小到大順序排列后,處于25%、75%位置的數(shù)值。由于本文中LOF 值越大表明該臺(tái)PMU 空間相似性越弱,在當(dāng)前窗口越有可能存在壞數(shù)據(jù),因此設(shè)定閾值如下:
圖4 箱線圖示意圖Fig.4 Schematic diagram of box-plot
式中:η為閾值;Q3和Q1分別為1 組LOF 值里的上四分位數(shù)和下四分位數(shù);IQR=Q3-Q1,為上四分位數(shù)和下四分位數(shù)的差值。
箱線圖提供了識(shí)別異常LOF 值的一個(gè)標(biāo)準(zhǔn):異常值被定義為大于Q3+3IQR的值。這與經(jīng)典的3σ準(zhǔn)則不同,3σ 準(zhǔn)則是以數(shù)據(jù)服從正態(tài)分布為前提,但實(shí)際數(shù)據(jù)往往并不嚴(yán)格服從正態(tài)分布。而且均值和標(biāo)準(zhǔn)差的耐抗性極小,異常值本身會(huì)對(duì)它們產(chǎn)生較大影響。顯然,非正態(tài)分布數(shù)據(jù)中判斷異常值,其有效性是有限的。箱線圖依靠實(shí)際數(shù)據(jù),不需要事先假定數(shù)據(jù)服從特定的分布形式,它只是真實(shí)直觀地表現(xiàn)數(shù)據(jù)形狀的本來(lái)面貌;另一方面,箱線圖判斷異常值的標(biāo)準(zhǔn)以四分位數(shù)為基礎(chǔ),四分位數(shù)具有一定的耐抗性,所以異常值不會(huì)對(duì)這個(gè)標(biāo)準(zhǔn)產(chǎn)生影響,箱線圖識(shí)別異常值的結(jié)果比較客觀。
值得一提的是,箱線圖中內(nèi)限是Q3±1.5IQR,外限是Q3±3IQR,超過(guò)內(nèi)限是有可能異常的LOF 值,超過(guò)外限是絕對(duì)異常LOF 值。本文選擇超過(guò)外限是因?yàn)閷?shí)際上不同位置PMU 數(shù)據(jù)的空間相似性可能不嚴(yán)格很強(qiáng),因此外限作為閾值能適度避免誤判。
所提算法的流程如圖5 所示。首先,利用前一段干凈數(shù)據(jù)時(shí)間窗的平均值進(jìn)行標(biāo)準(zhǔn)化處理,消除各PMU 自身的影響;然后,采用不同PMU 數(shù)據(jù)的DTW 距離作為特征量進(jìn)行空間相似性分析;最后,基于LOF 法和箱線圖對(duì)連續(xù)壞數(shù)據(jù)進(jìn)行檢測(cè)。由于三相短路過(guò)程中不同母線相量幅值下降深度差異較大,有可能引起誤判,因此,為了避免對(duì)三相短路擾動(dòng)的誤判,整體流程中在LOF 值與設(shè)定閾值比較后又增加了判據(jù):是否超過(guò)半數(shù)PMU,其當(dāng)前窗口數(shù)據(jù)的最大相鄰差值Kt( =(zt-zt-1)/zt)大于0.2,其中zt和zt-1分別為時(shí)刻t和時(shí)刻t-1 的數(shù)據(jù)。
圖5 連續(xù)壞數(shù)據(jù)檢測(cè)算法流程圖Fig.5 Flow chart of detection algorithm for continuous bad data
對(duì)本文所提方法進(jìn)行了驗(yàn)證,并且將結(jié)果與文獻(xiàn)[18]中時(shí)空相似性的方法進(jìn)行了比較。
采用IEEE 10 機(jī)39 節(jié)點(diǎn)系統(tǒng)對(duì)不同擾動(dòng)條件下的仿真信號(hào)進(jìn)行了測(cè)試。窗長(zhǎng)為40 個(gè)數(shù)據(jù)點(diǎn)(0.4 s)。在三相斷線后設(shè)置一段偏差為0.09%的斜坡類型的連續(xù)壞數(shù)據(jù),本文方法和文獻(xiàn)[18]中的方法均能檢測(cè),見附錄B。
切機(jī)后注入偏差為0.15%的歷史擾動(dòng)壞數(shù)據(jù),這是目前更難檢測(cè)到的一種攻擊方式,如圖6所示。
圖6 歷史擾動(dòng)壞數(shù)據(jù)Fig.6 Historical disturbance bad data
利用所提方法和文獻(xiàn)[18]中的時(shí)空相似性的方法對(duì)圖6 中壞數(shù)據(jù)進(jìn)行檢測(cè),檢測(cè)結(jié)果如圖7 所示。由圖7 可知,所提方法能檢測(cè)到PMU1 中歷史擾動(dòng)壞數(shù)據(jù),但是時(shí)空相似性的方法無(wú)法有效檢測(cè)。原因是文獻(xiàn)[18]中時(shí)空相似性方法基于不同母線標(biāo)準(zhǔn)化后的方差計(jì)算LOF 值,而基于標(biāo)準(zhǔn)化方差的方法僅表示數(shù)據(jù)時(shí)間上前后波動(dòng)幅度的變化,有些明顯是壞數(shù)據(jù)但波動(dòng)幅度前后變化不明顯的壞數(shù)據(jù)無(wú)法有效檢測(cè)。
圖7 歷史擾動(dòng)壞數(shù)據(jù)的檢測(cè)結(jié)果Fig.7 Detection results of historical disturbance bad data
為驗(yàn)證所提方法的有效性,與文獻(xiàn)[18]中方法進(jìn)行了在不同壞數(shù)據(jù)偏差下的對(duì)比實(shí)驗(yàn),每種偏差下設(shè)置了5 種不同壞數(shù)據(jù)類型,共20 組檢測(cè)結(jié)果,準(zhǔn)確率如表1 所示。
表1 兩種方法準(zhǔn)確率對(duì)比Table 1 Comparison of accuracy between two methods
由表1 可知,所提方法對(duì)偏差為0.2%及以上的壞數(shù)據(jù)有較高準(zhǔn)確率,而文獻(xiàn)[18]中方法對(duì)于偏差0.2%的壞數(shù)據(jù)檢測(cè)效果變差,原因是太小偏差的連續(xù)壞數(shù)據(jù)和其他母線正常的擾動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)差相差不大。因此,所提方法在檢測(cè)范圍和整體準(zhǔn)確率上相較于文獻(xiàn)[18]中方法有一定優(yōu)勢(shì)。
為測(cè)試所提方法在輸入信號(hào)中含有噪聲時(shí)的有效性,采用IEEE 10 機(jī)39 節(jié)點(diǎn)系統(tǒng)在切負(fù)荷后的仿真數(shù)據(jù)加60 dB 高斯白噪聲對(duì)所提方法和文獻(xiàn)[18]方法進(jìn)行了驗(yàn)證(因?yàn)檩旊娋W(wǎng)噪聲一般在60 dB[23])。在含噪聲下設(shè)置了4 組不同偏差的斜坡攻擊壞數(shù)據(jù),所提方法和文獻(xiàn)[18]中方法的檢測(cè)結(jié)果如表2所示。
表2 兩種方法的檢測(cè)結(jié)果對(duì)比Table 2 Comparison of detection results between two methods
由表2 可知,所提方法對(duì)信號(hào)中含噪聲壞數(shù)據(jù)的識(shí)別效果要優(yōu)于文獻(xiàn)[18]中的方法,但對(duì)于有噪聲和存在偏差0.15%的壞數(shù)據(jù),所提方法也僅能識(shí)別少數(shù),存在漏判的問題,60 dB 噪聲造成的數(shù)據(jù)偏差最大達(dá)0.3%,會(huì)影響壞數(shù)據(jù)辨識(shí)結(jié)果。噪聲的存在確實(shí)會(huì)使小偏差的壞數(shù)據(jù)淹沒在噪聲里而難以檢測(cè)。
利用中國(guó)西部地區(qū)實(shí)測(cè)數(shù)據(jù)來(lái)驗(yàn)證所提方法的有效性。加入偏差為0.5%的尖峰壞數(shù)據(jù)(如圖8 所示)和偏差為0.2%攻擊注入的連續(xù)壞數(shù)據(jù)(如圖9所示),利用LOF 值和箱線圖法設(shè)定的閾值比較后的檢測(cè)結(jié)果分別如圖10 和圖11 所示。
圖8 帶尖峰的實(shí)測(cè)數(shù)據(jù)Fig.8 Measured data with spikes
圖9 存在攻擊注入的實(shí)測(cè)連續(xù)壞數(shù)據(jù)Fig.9 Measured continuous bad data with attack injection
圖10 顯示,當(dāng)尖峰數(shù)據(jù)的偏差小于0.6%時(shí),文獻(xiàn)[18]中的時(shí)空相似性方法無(wú)法對(duì)其進(jìn)行有效檢測(cè)。所提方法可有效檢測(cè)實(shí)測(cè)數(shù)據(jù)中偏差為0.5%的連續(xù)尖峰壞數(shù)據(jù)。原因可能是文獻(xiàn)[18]中的方法基于方差的特征不明顯。
圖10 實(shí)測(cè)尖峰數(shù)據(jù)的檢測(cè)結(jié)果Fig.10 Detection results of measured spike data
圖11 表明,當(dāng)攻擊注入歷史擾動(dòng)數(shù)據(jù)作為壞數(shù)據(jù)時(shí),時(shí)空相似性方法無(wú)法檢測(cè),原因是次同步振蕩數(shù)據(jù)本身存在一定方差,注入的PMU 數(shù)據(jù)和沒有注入的PMU 數(shù)據(jù)方差相差不大,因此基于方差做差或者方差做比來(lái)定義2 臺(tái)PMU 的距離檢測(cè)不到壞數(shù)據(jù)。而所提方法基于數(shù)據(jù)波動(dòng)趨勢(shì)建立相似性的比值作為2 臺(tái)PMU 的距離,可以檢測(cè)到空間波動(dòng)趨勢(shì)不一致的攻擊數(shù)據(jù)。由此可見,文獻(xiàn)[18]中的時(shí)空相似性方法仍有一定的局限性,而本文所提方法可滿足系統(tǒng)不同類型連續(xù)壞數(shù)據(jù)的檢測(cè)要求。
圖11 實(shí)測(cè)連續(xù)壞數(shù)據(jù)的檢測(cè)結(jié)果Fig.11 Detection results of measured continuous bad data
本文提出了一種數(shù)據(jù)驅(qū)動(dòng)的在線PMU 連續(xù)壞數(shù)據(jù)檢測(cè)算法。它沒有離線訓(xùn)練的負(fù)擔(dān),且能避免對(duì)擾動(dòng)數(shù)據(jù)的誤判,并可以提高PMU 數(shù)據(jù)的質(zhì)量,為PMU 在電力系統(tǒng)中的各類應(yīng)用提供數(shù)據(jù)基礎(chǔ)。得到主要結(jié)論如下。
1)提出了一種基于DTW 的衡量PMU 數(shù)據(jù)空間相似性方法。通過(guò)計(jì)算不同PMU 數(shù)據(jù)的DTW距離,提取了區(qū)分?jǐn)_動(dòng)數(shù)據(jù)和連續(xù)壞數(shù)據(jù)的空間特征。
2)利用LOF 法對(duì)連續(xù)壞數(shù)據(jù)進(jìn)行檢測(cè)。它能夠在線檢測(cè)出擾動(dòng)過(guò)程中的連續(xù)壞數(shù)據(jù),而現(xiàn)有方法則不易檢測(cè)。
3)提出了基于箱線圖的閾值確定方法,與其他方法相比,解決了單一固定閾值對(duì)不同波動(dòng)情況的PMU 數(shù)據(jù)集設(shè)置不合理的問題。
4)仿真和現(xiàn)場(chǎng)數(shù)據(jù)測(cè)試證明了所提方法對(duì)連續(xù)壞數(shù)據(jù)的識(shí)別和檢測(cè)是有效的,可以為電力系統(tǒng)提供高質(zhì)量的PMU 數(shù)據(jù)。
本文未考慮大量PMU 在同一時(shí)間段存在攻擊注入連續(xù)壞數(shù)據(jù)的情況。下一步將對(duì)更多PMU 遭受同一類型攻擊引起的連續(xù)壞數(shù)據(jù)進(jìn)行深入研究。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。