申曉杰,廖 華,李 闖,潘 鵬,李更達
(中國南方電網(wǎng) 超高壓輸電公司 南寧監(jiān)控中心,廣西 南寧 530025)
隨著“智慧電網(wǎng)”的建設(shè)和發(fā)展,數(shù)字化通信、自動化控制、智能傳感器等新型智能信息化系統(tǒng)也不斷出現(xiàn)在電力行業(yè),傳統(tǒng)電力系統(tǒng)中的發(fā)變電、配輸電等各個環(huán)節(jié)也需要得到進化和升級[1]。通過智能化設(shè)備和數(shù)字化控制技術(shù)將電氣電子設(shè)備和各級用戶聯(lián)系起來構(gòu)成智慧電網(wǎng),能夠保證電力系統(tǒng)大大提升電能利用效率和能源轉(zhuǎn)化效率,極大地保證了電力系統(tǒng)的供電質(zhì)量和安全可靠性[2-3]。
電力監(jiān)控防護系統(tǒng)能夠在電網(wǎng)的安全運維中時刻監(jiān)視并控制電力系統(tǒng)和電網(wǎng)線路,是智慧電網(wǎng)最重要、最關(guān)鍵的核心環(huán)節(jié)之一。在電力系統(tǒng)的發(fā)變電和配輸電過程中,電力監(jiān)控防護系統(tǒng)能夠更加靈活、平穩(wěn)和高效地監(jiān)控電力設(shè)備工作狀態(tài)。2003年,美國和加拿大出現(xiàn)大面積電力癱瘓,經(jīng)濟生活受到了嚴重影響。究其原因,是因為電力系統(tǒng)預(yù)警提示過程出現(xiàn)了嚴重故障,導(dǎo)致電力監(jiān)控防護系統(tǒng)不能及時處理。2015年,網(wǎng)絡(luò)黑客對烏克蘭的電力監(jiān)控防護系統(tǒng)進行瘋狂攻擊后,造成了境內(nèi)大規(guī)模電力癱瘓。2019年,網(wǎng)絡(luò)黑客對委內(nèi)瑞拉的電力監(jiān)控防護系統(tǒng)進行攻擊,最終導(dǎo)致國內(nèi)出現(xiàn)了大規(guī)模停電,嚴重威脅國家安全。所以,當前智慧電網(wǎng)的建設(shè)和運維面臨的最大問題是如何能保證電力監(jiān)控防護系統(tǒng)的安全穩(wěn)定運行[4-5]。
安全防護方案的關(guān)鍵在于實時感知電力監(jiān)控防護系統(tǒng)的安全態(tài)勢。從一個角度來說,常規(guī)的安全防護屏障主要設(shè)置在網(wǎng)絡(luò)系統(tǒng)外部,檢測外部惡意攻擊;而電力監(jiān)控防護系統(tǒng)在保證感知外部攻擊的同時,還能敏銳察覺來自系統(tǒng)內(nèi)部漏報的危險和攻擊[6-8]。從另一個角度來說,風(fēng)險或者攻擊來臨時,如果能夠提前感知異常信號,并做出相應(yīng)措施,將大大提高安全監(jiān)控防護系統(tǒng)的準確率和可靠性。因此,實時監(jiān)控智慧電網(wǎng)和智能電力系統(tǒng)的運行狀態(tài),準確捕捉電力通訊網(wǎng)絡(luò)和電力數(shù)據(jù)系統(tǒng)的異常信號,在構(gòu)建智慧電網(wǎng)過程中具有重要研究價值。
該文構(gòu)建了電力監(jiān)控防護系統(tǒng)安全識別指標體系;構(gòu)建了基于SVR的安全態(tài)勢識別模型;構(gòu)建了基于GRU的安全態(tài)勢預(yù)測模型,三個研究點之間關(guān)系如圖1所示。去除冗雜安全因素,構(gòu)建電力監(jiān)控防護系統(tǒng)安全識別指標體系;基于安全識別指標體系,構(gòu)建電力監(jiān)控防護系統(tǒng)安全態(tài)勢識別模型;基于安全識別數(shù)據(jù)和歷史數(shù)據(jù),構(gòu)建電力監(jiān)控防護系統(tǒng)安全態(tài)勢預(yù)測模型;設(shè)計并實現(xiàn)電力監(jiān)控防護系統(tǒng)安全態(tài)勢識別與預(yù)測系統(tǒng)。該研究為電力監(jiān)控防護系統(tǒng)的安全運維提供重要參考,為構(gòu)建智慧電網(wǎng)提供了技術(shù)支撐。
圖1 研究體系框架
首先,基于支持向量機的遞歸特征消除(SVM-RFE)技術(shù)分析了電力監(jiān)控防護系統(tǒng)中所有安全識別指標的相關(guān)性;然后,采用皮爾森相關(guān)系數(shù)(Pearson)對所有指標之間的冗雜度,去除冗雜特征;最后,構(gòu)建了最優(yōu)特征子集目標函數(shù)篩選出最優(yōu)指標集,并建立了電力監(jiān)控防護系統(tǒng)安全識別指標體系。
該文采用支持向量機(Support Vector Machine,SVM)分類算法將數(shù)據(jù)分為兩類,并分別貼上標簽secure和danger。通過人工技術(shù)對原始樣本數(shù)據(jù)標注為yi,構(gòu)成訓(xùn)練集T:
(1)
在此設(shè)定第i條樣本數(shù)據(jù)為Ti(i∈[1,m]),類別標簽為yi∈{1,-1},樣本數(shù)據(jù)的評估指標維度為n,第i條樣本數(shù)據(jù)的第j個評估指標數(shù)值為xij,最后將電力監(jiān)控防護系統(tǒng)的運行狀態(tài)定義為安全(secure:1)和不安全(danger:-1)。同時,對于運行狀態(tài)的樣本數(shù)據(jù)定義為x,f(x)是分類決策函數(shù),是對樣本數(shù)據(jù)x的分類結(jié)果,表達式如式(2)所示。式中的αi和b分別為通過訓(xùn)練得到的拉格朗日乘子和位移,sgn()是符號函數(shù)。通過SVM模型訓(xùn)練樣本數(shù)據(jù)T,第j個向量ω的指標權(quán)重可表達為式(3):
(2)
(3)
通過SVM-RFE進行序列后向選擇(SBS)。對于包含所有安全指標的集合S,逐個去除對模型分類結(jié)果影響最小的安全指標x,直到獲得指標相關(guān)性排序。特征與模型分類的相關(guān)性強度與評價分數(shù)cj呈正相關(guān),第j個安全指標的權(quán)重系數(shù)為ωj,則剔除最小影響的安全指標x可以通過權(quán)重平方表達式計算:
(4)
通過SVM-RFE篩除部分冗雜指標之后,安全指標之間仍然會存在識別效果相近的線性冗雜指標,因此,該文采用皮爾森相關(guān)系數(shù)(Pearson)對冗雜指標的線性相關(guān)性進行分析,并進一步剔除冗雜安全指標[9]。Pearson相關(guān)系數(shù)取值范圍為(-1,0),其絕對值與兩個指標相關(guān)度呈正相關(guān),絕對值越大,冗雜度越大,則公式如下:
(5)
通過對電力監(jiān)控防護系統(tǒng)的所有安全指標進行篩選,再篩選剩下的安全指標構(gòu)建最優(yōu)指標子集,最后構(gòu)成最優(yōu)安全識別指標體系[10]。該文利用適應(yīng)函數(shù)同時考慮分類準確率和特征子集的豐富度,函數(shù)值越大,指標集越優(yōu),適應(yīng)函數(shù)表達式為:
(6)
式中,Q是電力監(jiān)控防護系統(tǒng)的全部安全指標集合,S為剔除冗雜安全指標后進行相關(guān)性排序的子集,|S|和|Q|分別為指標集S和Q的指標數(shù)量,P(S)為對指標集S進行訓(xùn)練后的模型分類準確率,P(S)與|S|和|Q|之間的權(quán)重因子由μ表示,μ∈[0,1]。
該文共選用35個安全狀態(tài)指標構(gòu)建安全狀態(tài)候選指標集,其中包括20個流量特征候選指標和15個設(shè)備運行候選指標。模擬網(wǎng)絡(luò)對相同設(shè)備進行攻擊,計算、統(tǒng)計并提取指標數(shù)據(jù),以3 s為間隔獲取設(shè)備運行時的400個樣本數(shù)據(jù)。構(gòu)建四個安全指標體系對該方法進行驗證。指標體系A(chǔ):包含所有指標;指標體系B:剔除了大冗余度指標;指標體系C:對指標集進行相關(guān)性排序,構(gòu)成最優(yōu)特征子集;指標體系D:根據(jù)該方法,對剔除冗雜指標的指標集進行相關(guān)性排序,構(gòu)成最優(yōu)特征子集。通過對四個指標體系進行相應(yīng)的SVM模型訓(xùn)練,并基于secure和danger數(shù)據(jù)樣本以2∶3的比例構(gòu)成測試集,以驗證SVM分類模型的準確性。
依據(jù)文中方法,首先對安全指標進行相關(guān)性排序,通過選擇得到了表1的剔除前最優(yōu)指標集(第1列),剔除了最優(yōu)指標集中的冗雜指標后,得到了表1的剔除后最優(yōu)指標集(第2列)。分析表1可知,剔除后的最優(yōu)指標集較之前缺少了指標retr_counts,這是因為retr_counts和SYN_pkts的冗雜度為0.764,同時retr_counts的相關(guān)性較低,因此retr_counts被剔除。對四個指標體系的分類結(jié)果進行分析,結(jié)果如圖2所示。分析圖2可知,基于SVM的分類準確率從高到低排列為:體系D>體系C>體系B>體系A(chǔ)。因此,剔除冗雜度較大的安全指標可以提高分類準確率(B>A),剔除相關(guān)性較小的安全指標也可以提高分類準確率(C>B)。同時,由于體系C不僅剔除了相關(guān)性較小的安全指標,也剔除了部分冗雜度較小的安全指標,而體系D同時剔除了相關(guān)性較小、冗雜度較大的安全指標,造成分類準確率低于體系D的實驗結(jié)果(D>C)。所以,該文構(gòu)建的最優(yōu)安全指標集滿足了電力監(jiān)控防護系統(tǒng)的感知需求。
表1 剔除前后最優(yōu)指標集構(gòu)建結(jié)果
圖2 四種指標體系實驗結(jié)果對比
支持向量回歸(Support Vector Regression,SVR)在面對小樣本、非線性和高維度的實際問題上可以保持優(yōu)秀的泛化能力,準確識別電力監(jiān)控防護系統(tǒng)的運行狀態(tài)[11]。通過前文得到了m個識別指標的最優(yōu)安全指標集I(i1,i2,…,im),第i條樣本數(shù)據(jù)的輸入向量為xi,樣本記錄為Ti(i∈[1,n]),樣本標簽為yi,并構(gòu)建訓(xùn)練數(shù)據(jù)集T:
(7)
在此定義一個函數(shù)φ(x)實現(xiàn)輸入空間到高維希爾伯特空間的非線性映射,并且w和b分別為權(quán)向量和位移,則高維特征空間的線性回歸函數(shù)為:
y=f(x)=wφ(x)+b
(8)
定義變量ε為f(x)與y的最大偏差,損失函數(shù)為:
L(f(x),y,ε)=
(9)
因此,該問題可轉(zhuǎn)化為:
(10)
(i=1,2,…,n)
(11)
(12)
通過上式可對w和b進行求解:
(13)
得到最終的SVR模型:
y=f(x)=wφ(x)+b=
(14)
核函數(shù)K(xi,xj)的選擇決定了是否能夠?qū)⒕€性不可分問題轉(zhuǎn)化為可分問題[13]。高斯徑向基核函數(shù)(RBF)能夠在參數(shù)少和線性不可分的情況下體現(xiàn)良好的性能,因此選擇RBF作為SVR預(yù)測模型的核函數(shù):
(15)
安全態(tài)勢的計算前提需要對設(shè)備權(quán)重w進行賦值dv,第i個設(shè)備重要性賦值dvi:
(16)
通過SVR模型識別的第i個設(shè)備安全態(tài)勢值為yi,則電力監(jiān)控防護系統(tǒng)的安全態(tài)勢值PSS可以通過下式計算:
(17)
為驗證基于SVR構(gòu)建的安全態(tài)勢識別模型的有效性,該文模擬了惡意攻擊,將900個數(shù)據(jù)樣本以3∶1的比例構(gòu)建訓(xùn)練集和測試集。同時,利用粒子群尋優(yōu)算法(PSO)將最優(yōu)算法參數(shù)定義為:C=83.54,σ=6.67,ε=0.01。對SVR識別模型和BPNN識別模型進行對比分析,實驗結(jié)果如圖3和圖4所示。
圖3 模型識別結(jié)果對比
圖4 模型實驗結(jié)果對比
分析圖3可知,BPNN識別模型的安全態(tài)勢識別值和實際值差值波動較大,明顯高于SVR識別模型。這表明SVR識別模型具有更高的識別準確率,并且具有更加穩(wěn)定的識別效果。分析圖4可知,SVR模型的評估值與實際值誤差絕對值為0、1、2的樣本數(shù)量明顯多于BPNN模型,而隨著誤差絕對值越來越大,SVR模型的樣本個數(shù)明顯少于BPNN模型。SVR模型的識別精度整體優(yōu)于BPNN模型。對SVR模型和BPNN模型進一步進行對比,結(jié)果如表2。分析表2可知,相較于BPNN模型,SVR模型在RMSE上降低了43.60%,在MAPE上降低了70.23%。這說明,所構(gòu)建的SVR安全態(tài)勢識別模型具有更好的識別能力和模型準確率。對比SVR和BPNN兩個識別模型可知,SVR模型能夠在樣本數(shù)量少的情況下保證較高的泛化能力,準確識別未知數(shù)據(jù),能夠在降低訓(xùn)練成本的前提下保證攻擊樣本的類型和壓力。而BPNN往往需要進行大量訓(xùn)練和參數(shù)尋優(yōu),如果初始化參數(shù)取值不當,BPNN模型容易出現(xiàn)陷入局部最優(yōu)的情況。同時,BPNN需要構(gòu)建樣本大、維度高的訓(xùn)練數(shù)據(jù)集,面對小樣本的情況還會出現(xiàn)過擬合現(xiàn)象。
表2 模型識別結(jié)果對比
(18)
(1)定義神經(jīng)元輸入為xt,Wz和Uz分別為輸入層到隱藏層、上一個狀態(tài)到當前狀態(tài)的更新門權(quán)重,設(shè)置激活函數(shù)為sigmoid,矩陣拼接表達為+,更新門zt的表達式為:
(19)
(20)
(3)定義神經(jīng)元輸入為xt,Wr和Ur分別為輸入層到隱藏層、上一個狀態(tài)到當前狀態(tài)的重置門權(quán)重,設(shè)置激活函數(shù)為sigmoid,矩陣拼接表達為+,重置門rt的表達式為:
rt=σ(Wrxt+Urht-1)
(21)
為保證預(yù)測模型的準確率,同樣采用sigmoid函數(shù)作為GRU隱藏層的激活函數(shù)。由于函數(shù)能夠在處理非線性問題的時候保證較快的收斂速度和較好的處理效果,不會出現(xiàn)梯度消失的問題[16],因此,采用leaky_ReLU函數(shù)作為GRU全連接層的激活函數(shù):
(22)
設(shè)定損失值為loss,定義yi和ytrue為第i個樣本的模型預(yù)測值和實際值,損失函數(shù)為:
(23)
該文對比分析了三種模型在進行安全態(tài)勢預(yù)測的模型預(yù)測精度,分別為:徑向基函數(shù)(RBF)預(yù)測模型[17]、SVR預(yù)測模型和該文設(shè)計的GRU預(yù)測模型,其中RBF神經(jīng)網(wǎng)絡(luò)模型是一種單隱層的三層前饋網(wǎng)絡(luò),采用的是改進布谷鳥搜索法對RBF模型進行優(yōu)化,并引入了動態(tài)發(fā)現(xiàn)概率和模擬退火。采用RMSE和MAPE對三種預(yù)測模型進行對比分析,結(jié)果如表3所示。分析表3可知,設(shè)計的GRU預(yù)測模型相較于RBF模型和SVR模型的均方差誤差(RMSE)分別降低了19.23%和23.56%,平均絕對百分比誤差(MAPE)降低了48.33%和58.73%。對比三者實驗結(jié)果可知,GRU具有更擅長執(zhí)行時間序列的學(xué)習(xí)能力,在安全態(tài)勢預(yù)測上具有更高的預(yù)測精度。
表3 模型預(yù)測精度對比
截取其中100個數(shù)據(jù)樣本的預(yù)測結(jié)果與實際值進行對比分析,預(yù)測結(jié)果對比分析如圖5所示。數(shù)據(jù)樣本1~33、34~66和67~100分別對應(yīng)模型預(yù)測的安全態(tài)勢在上升階段、峰值階段和下降階段。分析圖5可知,所構(gòu)建的GRU預(yù)測模型在數(shù)據(jù)樣本安全態(tài)勢的上升、下降和峰值預(yù)測中均能保證良好的吻合效果,無論是變化趨勢還是預(yù)測值準確率,GRU預(yù)測模型相較于RBF和SVR模型均具有更小的預(yù)測誤差。
圖5 100個數(shù)據(jù)樣本的模型預(yù)測結(jié)果對比
所設(shè)計的電力監(jiān)控防護系統(tǒng)主要分為數(shù)據(jù)分析、安全態(tài)勢和用戶交互三個部分,如圖6所示,其中安全態(tài)勢部分主要包括指標體系模塊、安全態(tài)勢識別模塊和安全態(tài)勢預(yù)測模塊。
圖6 原型系統(tǒng)功能架構(gòu)設(shè)計
利用python攻擊模擬器對電力監(jiān)控防護系統(tǒng)進行攻擊模擬。分析模擬結(jié)果可知,所設(shè)計的電力監(jiān)控防護系統(tǒng)能夠?qū)崟r感知系統(tǒng)內(nèi)部或者外部的惡意攻擊,準確捕捉設(shè)備或者網(wǎng)絡(luò)運行狀態(tài),能夠及時預(yù)警反饋安全問題。當設(shè)備或者網(wǎng)絡(luò)受到威脅或者攻擊時,能夠?qū)崟r識別并準確預(yù)測,證明了該方法的有效性、準確性以及系統(tǒng)可行性。
為了實現(xiàn)“智慧電網(wǎng)”背景下對電力監(jiān)控防護系統(tǒng)的精細化、實時化和智能化的復(fù)雜要求,從指標體系構(gòu)建、安全識別模型和狀態(tài)預(yù)測模型共三個方面對電力監(jiān)控防護系統(tǒng)的設(shè)計進行了研究,并實現(xiàn)了新型電力監(jiān)控防護系統(tǒng)的可視化,主要創(chuàng)新點如下:
(1)基于支持向量機的遞歸特征消除(SVM-RFE)技術(shù),基于皮爾森相關(guān)系數(shù)(Pearson)去除冗余特征,構(gòu)建了電力監(jiān)控防護系統(tǒng)安全識別指標體系。
(2)基于支持向量回歸(SVR)技術(shù),構(gòu)建了基于SVR的安全態(tài)勢識別模型。相較于BPNN模型,SVR模型的安全態(tài)勢識別結(jié)果在RMSE上降低了43.60%,在MAPE上降低了70.23%。
(3)基于門循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò),構(gòu)建了基于GRU的安全態(tài)勢預(yù)測模型。GRU預(yù)測模型相較于RBF模型和SVR模型的均方差(RMSE)分別降低了19.23%和23.56%,平均絕對百分比(MAPE)降低了48.33%和58.73%。
(4)實現(xiàn)了電力監(jiān)控防護系統(tǒng),通過實驗驗證了系統(tǒng)可行性。
該研究為電力監(jiān)控防護系統(tǒng)的安全運維提供重要參考,為構(gòu)建智慧電網(wǎng)提供了技術(shù)支撐。