蘇向敬,鄧 超,栗風永,符 楊,蕭士渠
(1.上海電力大學電氣工程學院,上海市 200090;2.上海電力大學計算機科學與技術(shù)學院,上海市 200090)
在新型電力系統(tǒng)背景下,虛擬電廠、負荷聚合商、綜合能源系統(tǒng)等新型電力業(yè)務(wù)不斷涌現(xiàn)。作為電網(wǎng)和海量終端資源的中間橋梁紐帶,新型電力業(yè)務(wù)不僅可大幅降低終端接入對電力專網(wǎng)的通信和數(shù)據(jù)交互壓力,而且可使分布式靈活資源呈現(xiàn)出更大的可控效能。然而,新型電力業(yè)務(wù)的通信和數(shù)據(jù)平臺普遍基于公用互聯(lián)網(wǎng)設(shè)計運行,其公網(wǎng)開放性強的特性使得電力系統(tǒng)在信息交互過程中極易受到惡意網(wǎng)絡(luò)攻擊,如拒絕服務(wù)攻擊、負載重分布攻擊、拓撲篡改攻擊和虛假數(shù)據(jù)注入攻擊(false data injection attack,F(xiàn)DIA)等[1-5]。其中,F(xiàn)DIA 作為隱蔽性網(wǎng)絡(luò)攻擊,通過破壞數(shù)據(jù)完整性嚴重威脅電網(wǎng)安全運行,故須建立快速有效的FDIA 檢測機制[6]。
針對虛假數(shù)據(jù)注入攻擊,近年來提出的檢測方法主要分為以下2 類:1)模型驅(qū)動的方法[7-8];2)數(shù)據(jù)驅(qū)動的方法[9-15]。其中,基于模型驅(qū)動的方法不需要歷史數(shù)據(jù)集訓練,僅通過量測數(shù)據(jù)與系統(tǒng)狀態(tài)之間的關(guān)系即可建立FDIA 檢測模型。但是,模型檢測的準確度受系統(tǒng)參數(shù)影響較大,且電網(wǎng)規(guī)模的不斷擴大會導(dǎo)致模型的復(fù)雜度增加。而相比之下,基于數(shù)據(jù)驅(qū)動的FDIA 檢測算法不涉及參數(shù)設(shè)定問題,只與數(shù)據(jù)量緊密相關(guān),海量的電網(wǎng)數(shù)據(jù)恰好為其提供了強大的數(shù)據(jù)支撐[6],正受到越來越多的關(guān)注。例如,為捕捉FDIA 過程中的電網(wǎng)量測數(shù)據(jù)時序特征,文獻[9]利用長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)在時間序列預(yù)測方面的強大記憶能力來識別潛在的受損測量值。文獻[10]針對LSTM 網(wǎng)絡(luò)無法同時處理量測數(shù)據(jù)前后參數(shù)信息和FDIA 關(guān)聯(lián)的問題,提出了一種基于Transformer的FDIA 檢測框架。同時,為捕獲虛假與正常數(shù)據(jù)的空間差異,文獻[11]通過多層卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)提取量測數(shù)據(jù)空間特征,并與不良數(shù)據(jù)檢測(bad data detection,BDD)結(jié)合實現(xiàn)FDIA 檢測。文獻[12]則通過變分模態(tài)分解提取量測數(shù)據(jù)的空間特征,并結(jié)合輕量型CNN 實現(xiàn)FDIA 檢測。但是,上述傳統(tǒng)神經(jīng)網(wǎng)絡(luò)沒有考慮不同測量設(shè)備在電網(wǎng)部署時的空間關(guān)聯(lián),難以對電網(wǎng)拓撲結(jié)構(gòu)進行建模,導(dǎo)致檢測性能不佳[16]。對此,近年來發(fā)展迅速的圖神經(jīng)網(wǎng)絡(luò)可很好地捕捉圖網(wǎng)絡(luò)的拓撲連接,為上述問題提供了良好的解決方案。文獻[13]提出采用切比雪夫圖卷積網(wǎng)絡(luò) (Chebyshev graph convolution network,ChebGCN)識別FDIA,通過電力系統(tǒng)固有圖拓撲結(jié)構(gòu)提取量測數(shù)據(jù)的空間特征。文獻[14]通過門控圖神經(jīng)網(wǎng)絡(luò)(gated graph neural network,GGNN)提取電網(wǎng)拓撲連接信息和運行數(shù)據(jù)的空間特征,實現(xiàn)FDIA 檢測。
總之,上述基于深度學習的FDIA 檢測研究主要僅針對電網(wǎng)量測數(shù)據(jù)的時序或空間特征進行建模,鮮有同時提取其時空特征。考慮到電力系統(tǒng)發(fā)生FDIA 時,其運行狀態(tài)會發(fā)生顯著變化,數(shù)據(jù)采集與監(jiān)控(supervisory control and data acquisition,SCADA)量測數(shù)據(jù)呈現(xiàn)出時間和空間強關(guān)聯(lián)的特點[17]。僅用單一空間或時序特征,F(xiàn)DIA 檢測模型會存在攻擊檢測精度不足、抗噪聲能力差等不足。對此,文獻[15]通過卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)(CNN-LSTM)捕獲量測數(shù)據(jù)的時空特征,實現(xiàn)FDIA 檢測。但該文獻模型把量測數(shù)據(jù)作為歐氏數(shù)據(jù)處理,將電網(wǎng)所有節(jié)點特征通過長向量拼接,無法有效利用電網(wǎng)固有圖拓撲結(jié)構(gòu)與量測數(shù)據(jù)空間相關(guān)性,導(dǎo)致其時空特征信息挖掘不充分。
更重要的是,基于深度學習的FDIA 檢測方法普遍為“黑盒”模型,其模型透明性低,從而降低了檢測模型的可解釋性和檢測結(jié)果的可信度。如何實現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的可解釋性已成為當前研究的熱點[18]。文獻[19]提出了一種基于時空注意力機制的海上風機齒輪箱狀態(tài)監(jiān)測方法,實現(xiàn)了故障診斷的可解釋;文獻[20]在海上風電超短期出力預(yù)測中引入特征和時序雙重注意力模塊,在提升模型預(yù)測性能的同時,實現(xiàn)了模型特征和時間維度上的可解釋性。
針對上述挑戰(zhàn)并結(jié)合已有研究基礎(chǔ),本文提出了一種基于多頭圖注意力網(wǎng)絡(luò)和時間卷積網(wǎng)絡(luò)(multi-head graph attention network and time convolution network,MGAT-TCN)模型的可解釋電網(wǎng)FDIA 檢測方法。首先,通過多頭圖注意力網(wǎng)絡(luò)(multi-head graph attention network,MGAT)模塊考慮不同測量設(shè)備在電網(wǎng)部署中的拓撲結(jié)構(gòu)關(guān)聯(lián),以全面提取量測數(shù)據(jù)的空間特征。同時,MGAT 空間拓撲感知注意力機制通過分配權(quán)重量化模型在學習過程中對量測數(shù)據(jù)的空間關(guān)注程度,實現(xiàn)模型的可解釋性;接著,為避免時序信息丟失并提升模型訓練效率,利用時間卷積網(wǎng)絡(luò)(time convolution network,TCN)模塊并行提取量測數(shù)據(jù)的時序特征;最后,在IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)對所提MGAT-TCN 模型進行仿真驗證。
狀態(tài)估計是通過SCADA 量測數(shù)據(jù)估計電力系統(tǒng)運行狀態(tài)的一種重要機制[21]。圖1 展示了新型電力系統(tǒng)背景下電網(wǎng)虛假數(shù)據(jù)注入攻擊的可能場景。海量分布式終端資源借助公用互聯(lián)網(wǎng)平臺聚合接入,逐漸成為新型電力系統(tǒng)的重要組成部分。網(wǎng)絡(luò)攻擊者可以較低成本攻擊公用互聯(lián)網(wǎng)平臺終端設(shè)備,進而跨越公用互聯(lián)網(wǎng)和電力專網(wǎng)邊界危害電力專網(wǎng),如入侵測量終端和數(shù)據(jù)傳輸通道等?;谠O(shè)計好的虛假量測數(shù)據(jù),攻擊者可規(guī)避狀態(tài)估計不良數(shù)據(jù)檢測機制,而造成的錯誤狀態(tài)估計結(jié)果又會導(dǎo)致調(diào)度中心對潮流計算、事故分析和調(diào)度控制等做出錯誤決策,危害電網(wǎng)運行安全[17]。
圖1 電網(wǎng)FDIA 可能場景Fig.1 Possible scenarios of FDIA in power grid
電力系統(tǒng)狀態(tài)估計通常假設(shè)電壓幅值為1,忽略電阻和接地支路的影響,僅考慮相位角的狀態(tài)變化[14]。具體計算公式如下:
式中:Z∈Rm×1為測量向量,包括傳輸線有功潮流和節(jié)點注入有功功率,其中,m為測量向量維數(shù);x∈Rn×1為系統(tǒng)狀態(tài)向量,包括節(jié)點電壓相位角,其中,n為狀態(tài)向量維數(shù);H∈Rm×n為狀態(tài)估計的非線性函數(shù),是表示電網(wǎng)物理拓撲信息的矩陣[14];?∈Rm×1為測量誤差向量。
在此基礎(chǔ)上,采用線性加權(quán)最小二乘法得到狀態(tài)估計的目標函數(shù)F(x):
式中:R為測量值的誤差協(xié)方差矩陣。
接著,利用加權(quán)最小二乘法求解式(2)的最小化目標函數(shù),得到系統(tǒng)狀態(tài)向量估計值x?:
為確保狀態(tài)估計結(jié)果的可靠性,基于殘差檢驗原理的不良數(shù)據(jù)檢測機制得到了廣泛應(yīng)用[22]。其中,殘差r表示測量向量Z與其估計值Z?=Hx?差值的歐氏范數(shù),如式(4)所示。
將殘差r與殘差閾值τ進行比較:當r>τ時,檢測機制認為SCADA 量測數(shù)據(jù)存在壞數(shù)據(jù);當r<τ時,則認為數(shù)據(jù)正常。
如果攻擊者入侵控制中心并獲得電網(wǎng)物理拓撲信息矩陣H,則可以根據(jù)H生成特定的攻擊向量。這種攻擊向量可躲避不良數(shù)據(jù)檢測機制,并影響電力系統(tǒng)狀態(tài)估計結(jié)果。
假設(shè)攻擊向量為a∈Rm×1,與測量向量Z同維數(shù),則被攻擊的測量向量為Za=Z+a。如果向量a中的第i個元素不為零,則意味著第i個測量值被攻擊。經(jīng)狀態(tài)估計后得到系統(tǒng)狀態(tài)值xc=x+c,其中,c∈Rn×1表示系統(tǒng)狀態(tài)的攻擊注入向量,xc為被攻擊的狀態(tài)向量。不良數(shù)據(jù)檢測機制通過計算相應(yīng)的測量殘差來檢測錯誤數(shù)據(jù),在受到FDIA 后的殘差rc為:
由式(5)可知,若a=Hc,則攻擊向量可通過不良數(shù)據(jù)檢測,且測量殘差不會增加[22]。
本文所構(gòu)建MGAT-TCN 模型,主要包含MGAT 模塊、TCN 模塊和全連接層。
本文選擇SCADA 量測數(shù)據(jù)的所有節(jié)點注入有功功率和無功功率作為輸入特征,通過滑動時間窗將其轉(zhuǎn)化為MGAT-TCN 模型所需的時序圖數(shù)據(jù)V,即V=[v1,v2,…,vN]∈RN×W×2,其中,vi=分別為時間窗內(nèi)節(jié)點i的時序圖數(shù)據(jù)、時序注入有功功率和無功功率[12],i=1,2,…,N;W為滑動序列長度;N為測量設(shè)備數(shù)量。模型輸入滑動時間窗口設(shè)置如附錄A 圖A1所示。
鄰接矩陣是圖結(jié)構(gòu)數(shù)據(jù)的重要組成部分??紤]不同測量設(shè)備在電網(wǎng)部署的圖拓撲關(guān)聯(lián),本文選取電網(wǎng)鄰接矩陣A作為輸入矩陣,如式(6)所示。
式中:lij為元素,若節(jié)點i和j相連,則lij=1,否則lij=0,i=1,2,…,N,j=1,2,…,N。
根據(jù)上面定義,該FDIA 檢測模型的輸出表示為:
為充分考慮電網(wǎng)圖拓撲結(jié)構(gòu)和量測數(shù)據(jù)間的空間相關(guān)性,MGAT 需對圖中節(jié)點間的關(guān)系進行建模。假設(shè)每個節(jié)點的輸入vi由序列向量vi={∈[0,W]}表示,圖注意力層數(shù)為3,則對應(yīng)的MGAT 在附錄A 圖A2 中展示。給定N個節(jié)點的圖,即{v1,v2,…,vN},計算節(jié)點的輸出為:
式中:vi,out為節(jié)點i的輸出,與輸入vi維數(shù)相同;Ωi為與節(jié)點i相連接的鄰域節(jié)點集合,由Ai決定,Ai為電網(wǎng)鄰接矩陣的第i行向量;σ(·)為sigmoid 激活函數(shù);αij為注意力得分,用于衡量節(jié)點j對節(jié)點i的貢獻,可由式(9)和式(10)計算。
式中:⊕為表示2 個節(jié)點特征拼接的運算符;w∈RF×1為可學習參數(shù)的列向量,F(xiàn)為每個節(jié)點特征向量的維數(shù);eij和eio分別為節(jié)點j和節(jié)點o對節(jié)點i的注意力系數(shù),其中,節(jié)點j和節(jié)點o為Ai中與節(jié)點i連接的節(jié)點之一;LeakyReLU(·)為非線性激活函數(shù)。此處通過圖神經(jīng)網(wǎng)絡(luò)實現(xiàn)空間特征提取,并采用多頭注意力機制突出關(guān)鍵空間特征表達,進而實現(xiàn)對量測數(shù)據(jù)空間特征的有效提取。
由于深度學習的“黑盒”屬性,模型對FDIA 的檢測可信度不足。而注意力機制作為一種資源分配機制,可自適應(yīng)地為輸入變量分配注意力權(quán)值,使模型關(guān)注重要信息,并可借助熱力圖可視化注意力權(quán)重的形式來實現(xiàn)模型的可解釋性[23]。附錄A 圖A3展示了空間拓撲感知注意力機制計算相鄰節(jié)點特征向中心節(jié)點聚集的過程。
為解決FDIA 檢測模型黑盒、可信度低問題,本文對數(shù)據(jù)預(yù)處理后包含正常樣本和攻擊樣本的時序圖數(shù)據(jù)V在電網(wǎng)鄰接矩陣A上通過空間拓撲感知注意力機制賦予貢獻權(quán)重,并以權(quán)重熱力圖實現(xiàn)可視化,提升FDIA 檢測模型對攻擊判別的可解釋性和可靠性。具體而言,采用注意力機制動態(tài)計算電網(wǎng)中節(jié)點功率注入權(quán)重,通過變化的空間注意力系數(shù)與輸入變量進行加權(quán),得到的加權(quán)注意力權(quán)重可用來表達電網(wǎng)各節(jié)點量測數(shù)據(jù)對FDIA 的貢獻度,從而實現(xiàn)模型在空間維度的可解釋性和可信度,降低其“黑盒”屬性。
在處理電網(wǎng)量測時序數(shù)據(jù)時,為避免時序信息丟失并提升模型訓練效率,此處采用TCN 模塊進行提取。具體在滑動時間窗口內(nèi),基于目標時刻W之前的時序圖數(shù)據(jù)[v1,v2,…,vW-1],利用TCN 模塊的擴張因果卷積對上一層的輸出進行擴張采樣,從而提取時序特征,實現(xiàn)W時刻的數(shù)據(jù)輸出v?W。其中,擴張因果卷積計算公式如下。
式中:G(s)為第s個神經(jīng)元擴張卷積后的輸出;g(h)為第h個過濾器;vs-dp為s-dh時刻的輸入序列;k為卷積核大小;h為卷積核序號;d為擴張系數(shù);s為擴展因果卷積神經(jīng)元序號。
為使時序特征輸出能夠考慮更長的歷史序列信息,本文TCN 模塊通過2 層殘差網(wǎng)絡(luò)和多層卷積的不同擴張系數(shù)來實現(xiàn)。其中,殘差網(wǎng)絡(luò)結(jié)構(gòu)見附錄A 圖A4(a),包含擴展因果卷積、權(quán)值歸一化、ReLU激活函數(shù)和Dropout 隨機丟棄層,4 部分的組合可防止模型過擬合,且通過卷積并行計算捕獲時序特征,可加快模型訓練速度。附錄A 圖A4(b)為擴張因果卷積計算圖,卷積核大小k為3,擴張系數(shù)d分別為1、2、4。
基于MGAT 模塊提取的空間特征ysp和TCN模塊提取的時序特征ytem,全連接層通過softmax 函數(shù)完成輸入特征的非線性映射,具體公式如下。
式中:ypred為模型的預(yù)測輸出;λ為映射權(quán)重參數(shù);b為偏置誤差向量。
為降低模型訓練損失和提高FDIAs 檢測精度,本文采用交叉熵(cross-entropy,CE)函數(shù)作為損失計算函數(shù),并通過adam 優(yōu)化器自適應(yīng)調(diào)節(jié)學習率更新模型參數(shù)。其中,損失ψloss如式(13)所示。
式中:M為批尺寸大??;ypred,i為第i個模型預(yù)測結(jié)果;ui為第i個實際電網(wǎng)運行狀態(tài)標簽。
基于MGAT-TCN 模型的可解釋FDIA 檢測流程主要分為3 個部分:數(shù)據(jù)預(yù)處理及電網(wǎng)圖拓撲構(gòu)建、MGAT-TCN 模型訓練和模型測試評估,如圖2所示。
圖2 基于MGAT-TCN 模型的可解釋FDIA 完整檢測流程Fig.2 Complete interpretable detection process for FDIA based on MGAT-TCN model
可解釋FDIA 檢測具體流程如下。
步驟1:對SCADA 量測數(shù)據(jù)進行預(yù)處理。首先,將包含正常量測數(shù)據(jù)和受攻擊量測數(shù)據(jù)通過滑動時間窗處理為MGAT-TCN 模型輸入所需的時序圖數(shù)據(jù)V,維數(shù)為M×N×W×F;接著,在此基礎(chǔ)上,完成相應(yīng)系統(tǒng)的圖拓撲并構(gòu)建A,同時,對圖數(shù)據(jù)V進行最大最小歸一化處理;最后,將預(yù)處理后的圖數(shù)據(jù)V劃分為訓練集和測試集,并結(jié)合A作為整個MGAT-TCN 模型的輸入。
步驟2:模型訓練。首先,將訓練集圖數(shù)據(jù)V和電網(wǎng)鄰接矩陣A輸入到MGAT 層,感知并提取電網(wǎng)拓撲結(jié)構(gòu)和量測數(shù)據(jù)的空間特征ysp,并將數(shù)據(jù)V輸入到TCN 層,提取量測數(shù)據(jù)的時序特征ytem;接著,將提取的時空特征輸入到全連接層,并根據(jù)所設(shè)訓練輪數(shù)(epoch)進行模型參數(shù)迭代更新,完成MGAT-TCN 模型訓練;最后,利用訓練集對訓練好的MGAT-TCN 模型進行閾值ε網(wǎng)格搜索,以檢測最大準確率為條件,在[0,1]區(qū)間選擇最優(yōu)閾值ε。
步驟3:模型測試。首先,將測試集的數(shù)據(jù)V和電網(wǎng)鄰接矩陣A輸入到MGAT-TCN 模型完成目標特征預(yù)測,利用預(yù)測值與閾值ε實現(xiàn)FDIA 檢測;然后,通過預(yù)測攻擊標簽與真實標簽進行對比,完成模型測試評估;同時,為實現(xiàn)模型空間維度可解釋,將MGAT 層的空間拓撲感知注意力權(quán)值進行可視化,通過觀察不同節(jié)點量測數(shù)據(jù)對FDIA 檢測的貢獻度,降低所提MGAT-TCN 模型的“黑盒”屬性,提高模型檢測可信度。
實際應(yīng)用中,本文所提可解釋FDIA 檢測模型可與狀態(tài)估計的不良數(shù)據(jù)檢測配合開展。例如,SCADA 量測數(shù)據(jù)可借助所提MGAT-TCN 模型進行FDIA 檢測,以剔除攻擊數(shù)據(jù);利用狀態(tài)估計的不良數(shù)據(jù)檢測機制,篩除不良量測數(shù)據(jù);經(jīng)過上述處理后的數(shù)據(jù),可有效支撐能量管理系統(tǒng)對電網(wǎng)運行狀態(tài)的可靠估計和控制決策。
本文采用準確率(accuracy)、精確率(precision)、召回率(recall)和F1 分數(shù)等機器學習目標檢測領(lǐng)域通用的評測指標,評價所提模型的檢測性能[24]。評估指標所涉及統(tǒng)計變量定義如下:
1)真負類(true negative):表示將電網(wǎng)正常量測數(shù)據(jù)正確識別為正常數(shù)據(jù)的數(shù)量,記為βTN。
2)假正類(false positive):表示將電網(wǎng)正常量測數(shù)據(jù)錯誤識別為FDIA 的數(shù)量,記為βFP。
3)真正類(true positive):表示將電網(wǎng)FDIA 數(shù)據(jù)正確識別為FDIA 的數(shù)量,記為βTP。
4)假負類(false negative):表示將電網(wǎng)FDIA 數(shù)據(jù)錯誤識別為正常數(shù)據(jù)的數(shù)量,記為βFN。
相應(yīng)地,給出4 個評估指標的計算表達式如下。1)準確率計算表達式為:
式中:IAcc為所有被正確判斷的樣本所占的比值。準確率越高,表明檢測模型總體效果越好。
2)精確率計算表達式為:
式中:IPre為預(yù)測攻擊樣本中真實攻擊樣本所占的比值。精確率越高,表明檢測模型誤報率越低,檢測效果越好。
3)召回率計算表達式為:
式中:IRec為在真實攻擊樣本中預(yù)測正確攻擊樣本所占的比值。召回率越高,表明檢測模型漏報率越低,檢測效果越好。
4)F1 分數(shù)計算表達式為:
式中:IF1為精確率和召回率的諧波平均值,在選擇精確率或召回率可能導(dǎo)致模型分別給出高誤報和漏報的情況下用做綜合評價指標。F1 分數(shù)越高,表明檢測模型總體性能越好。
實驗選擇IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)作為測試案例,其中,網(wǎng)絡(luò)拓撲、節(jié)點數(shù)據(jù)、支路參數(shù)等均從MATPOWER 獲得。對于攻擊樣本,本文基于1.1 節(jié)和1.2 節(jié)的FDIA 原理與構(gòu)建方法生成。對于IEEE 14 節(jié)點系統(tǒng),攻擊節(jié)點設(shè)為節(jié)點3、5、11;對于IEEE 39 節(jié)點系統(tǒng),攻擊節(jié)點設(shè)為節(jié)點3、5、11、17、26。附錄A 圖A5 展示了IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)受攻擊前、后狀態(tài)變化情況。同時,考慮到FDIA 的真實性,設(shè)置正常樣本數(shù)量遠大于攻擊樣本,并結(jié)合攻擊強度和量測噪聲來實現(xiàn)檢測模型的性能評估。其中,攻擊強度定義為攻擊節(jié)點狀態(tài)估計值與真值的比值,并默認取0.1;設(shè)定量測噪聲滿足高斯分布N(0,0.25);設(shè)置每次攻擊注入虛假數(shù)據(jù)的持續(xù)時間為15 個步長,每個步長內(nèi)采用MATPOWER 工具包進行1 次潮流計算,且攻擊后測量殘差小于殘差閾值τ,以規(guī)避不良數(shù)據(jù)檢測。表1 和表2 分別給出了IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)的訓練和測試數(shù)據(jù)集。
表1 IEEE 14 節(jié)點系統(tǒng)的訓練數(shù)據(jù)集和測試數(shù)據(jù)集Table 1 Training data set and test data set of IEEE 14-bus system
表2 IEEE 39 節(jié)點系統(tǒng)的訓練數(shù)據(jù)集和測試數(shù)據(jù)集Table 2 Training data set and test data set of IEEE 39-bus system
為驗證所提MGAT-TCN 模型的優(yōu)越性,在相同數(shù)據(jù)集下,本文采用CNN、MGAT、LSTM、TCN,以及同樣提取時空特征的CNN-LSTM 模型作為對比模型,并設(shè)置epoch 為15。表3 給出了MGAT-TCN、MGAT、TCN、CNN-LSTM、CNN 和LSTM 模型在IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)中的FDIAs 檢測性能。表4 給出了LSTM、TCN、CNN-LSTM 和MGAT-TCN 模型的訓練時間。
表3 不同模型檢測性能對比Table 3 Detection performance comparison of different models
表4 不同模型訓練時間對比Table 4 Comparison of training time with different models
由表3 可知,6 種模型對FDIA 檢測的準確率均不低于95%,說明這些模型對FDIA 和正常數(shù)據(jù)均能做到有效分辨。但由于真實場景中FDIA 屬于小樣本事件,正常樣本的數(shù)量會遠超F(xiàn)DIA 樣本數(shù)量,單憑檢測準確率不足以驗證模型的性能。因此,通過對比分析模型的精確率、召回率和F1 分數(shù)來進一步驗證檢測方法的性能。表3 給出了以上指標的測試結(jié)果。
從表3 可以看到,在IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)中,CNN 檢測模型的精確率分別只有0.584 和0.825。由于精確率表征檢測模型的誤報率,故CNN 模型預(yù)測的攻擊樣本中,正常數(shù)據(jù)被預(yù)測為攻擊樣本的數(shù)量占比高,攻擊樣本被誤判數(shù)量過大。相比之下,所提MGAT 模型在2 個測試系統(tǒng)中,檢測精確率分別高達0.855 和0.857,表明正常樣本被預(yù)測為攻擊樣本的數(shù)量占比較低,攻擊樣本被誤判的數(shù)量相對減少。同樣,F(xiàn)1 分數(shù)作為精確率和召回率的綜合評價指標,在2 個測試系統(tǒng)中,CNN模型分別為0.635 和0.740,而MGAT 模型則分別為0.767 和0.779,這表明所提MGAT 模型在提取空間特征上更全面,檢測效果也更加穩(wěn)定。另外,從表4可以看出,無論是單個epoch 模型訓練時間,還是總訓練時間,TCN 模型的訓練時間均優(yōu)于LSTM 模型。這是因為TCN 模型通過擴張卷積并行計算可捕獲多個序列的時序特征,加快了模型計算速度,并避免時序信息丟失,使得模型具有更優(yōu)越的時序特征提取能力。
最后,結(jié)合表3 和表4 可知,所提模型與CNNLSTM 相比,其F1 分數(shù)在2 個測試系統(tǒng)中分別提升了0.048 和0.064,模型訓練時間分別減少了66 s 和112 s。這表明所提MGAT-TCN 模型充分挖掘了電網(wǎng)量測數(shù)據(jù)的時空特征信息,使得檢測性能進一步得到提升。
為驗證所提MGAT-TCN 模型可解釋的合理性,對空間拓撲感知注意力的學習權(quán)重進行可視化,并結(jié)合FDIA 領(lǐng)域知識實現(xiàn)合理性驗證。圖3 分別展示了IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)在不同的樣本條件下和模型訓練過程中的空間注意力權(quán)重變化情況,其中,顏色越深表示權(quán)重越大。
圖3 正常樣本和攻擊樣本的空間拓撲注意力權(quán)值可解釋圖Fig.3 Interpretable graph of spatial-topology attention weights for normal samples and attack samples
由4.1 節(jié)數(shù)據(jù)說明可知,對于IEEE 14 節(jié)點系統(tǒng),設(shè)計攻擊目標是系統(tǒng)節(jié)點3、5、11 的狀態(tài)值。同時,依據(jù)本文FDIA 原理的領(lǐng)域知識,攻擊向量a是假定攻擊者掌握電網(wǎng)物理拓撲信息矩陣H,通過對H中對應(yīng)節(jié)點5、6、8、13、14 進行虛假量測數(shù)據(jù)注入,從而改變節(jié)點3、5、11 的狀態(tài)值來實現(xiàn)FDIA。由圖3(b)可以看到,在IEEE 14 節(jié)點系統(tǒng)攻擊樣本下,節(jié)點5、6、8、13、14 顏色較深,其空間拓撲注意力權(quán)重值穩(wěn)定在0.375 左右,該結(jié)果與上述FDIA 的領(lǐng)域知識基本保持一致。攻擊者通過對H中的節(jié)點5、6、8、13、14 進行虛假量測數(shù)據(jù)注入,從而改變了節(jié)點3、5、11 的狀態(tài)變量值,且成功躲過了不良數(shù)據(jù)檢測,故這幾個節(jié)點的權(quán)重在模型學習過程中也相應(yīng)地被賦予較高的權(quán)重。相比之下,其他節(jié)點輸入變量與FDIA 的相關(guān)性有限,空間拓撲注意力權(quán)重被賦予了較小的數(shù)值。由圖3(a)可知,對于正常樣本,由于沒有受到攻擊,電網(wǎng)物理拓撲信息矩陣H的相應(yīng)節(jié)點沒有虛假量測數(shù)據(jù)注入,故在模型訓練迭代過程中,空間拓撲注意力權(quán)重對正常樣本的分配會更趨于平均。
對IEEE 39 節(jié)點系統(tǒng)同樣存在上述結(jié)論。由圖3(d)可以看到,節(jié)點1、2、10、16、21、26、31、36顏色較深,其空間拓撲注意力權(quán)重值穩(wěn)定在0.291~0.375 范圍內(nèi),這表明攻擊者通過對電網(wǎng)物理拓撲信息矩陣H中相應(yīng)節(jié)點進行虛假量測數(shù)據(jù)注入,改變了節(jié)點3、5、11、17、26 的狀態(tài)值,故所提模型的空間注意力權(quán)重在學習過程中對這幾個被虛假數(shù)據(jù)注入的節(jié)點賦予了更高權(quán)值。結(jié)合圖3(c)可知,對于IEEE 39 節(jié)點系統(tǒng)的正常樣本,因沒有受到攻擊,空間拓撲注意力權(quán)重對所有節(jié)點的權(quán)值賦予也趨于平均。
由上述分析可知,本文所提空間拓撲感知注意力機制可以實現(xiàn)模型的可解釋性,提高了檢測結(jié)果的可信度,并且針對可解釋圖中經(jīng)常被攻擊的節(jié)點,電網(wǎng)可提前對空間注意力權(quán)重較高節(jié)點采取相應(yīng)防御措施[25]。
基于IEEE 14 節(jié)點系統(tǒng),進一步對不同環(huán)境噪聲下所提模型的魯棒性進行驗證。將環(huán)境數(shù)據(jù)噪聲的方差分別設(shè)為0.25、0.30、0.35、0.40、0.45、0.50,并對所提MGAT-TCN 模型和CNN-LSTM 模型在不同環(huán)境數(shù)據(jù)噪聲下的性能進行了測試,測試結(jié)果如圖4 所示。由圖4 可以看出,隨著噪聲方差增加,本文所提模型的F1 分數(shù)緩慢下降,而CNN-LSTM 模型的F1 分數(shù)則快速降低。這是因為當噪聲水平升高時,CNN-LSTM 模型很難區(qū)分正常測量值和受到干擾后的正常測量值。但是,所提MGAT-TCN模型的F1 分數(shù)始終顯著優(yōu)于CNN-LSTM 模型,特別是當噪聲方差小于0.4 時,依然可達到0.8 以上。這說明當量測環(huán)境噪聲引起的差異小于FDIA 引起的差異時,所提MGAT-TCN 模型的抗噪聲能力更強,檢測性能更具魯棒性。
圖4 不同環(huán)境噪聲下的模型魯棒性對比Fig.4 Comparison of model robustness with different environmental noises
為驗證所提模型中不同模塊對FDIA 檢測的有效性,在IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)上進行消融實驗。表5 給出了消融實驗結(jié)果。由表5可見,在2 個測試系統(tǒng)中,當禁用TCN、僅用MGAT時,所得F1 分數(shù)相比MGAT-TCN 分別下降了0.168 和0.138。同樣,當禁用MGAT、僅用TCN時,所得F1 分數(shù)相比MGAT-TCN 分別下降了0.067 和0.060。事實上,電網(wǎng)圖拓撲結(jié)構(gòu)和量測數(shù)據(jù)是高度時空相關(guān)的。面向空間特征的MGAT 模塊通過空間拓撲感知注意力機制有助于準確捕捉空間相關(guān)性;而面向時序特征的TCN 模塊對所提模型性能也至關(guān)重要,擴張因果卷積并行運算在加快模型訓練速度的同時,也防止了早期信息丟失,可更好地挖掘時序依賴關(guān)系。
表5 MGAT-TCN 模型中每個模塊的消融實驗結(jié)果Table 5 Ablation experiment results of each module in MGAT-TCN model
針對電網(wǎng)面臨的FDIA,為充分提取SCADA 量測數(shù)據(jù)和電網(wǎng)拓撲信息的時空特征,本文提出了一種MGAT 和TCN 結(jié)合的可解釋檢測模型,即MGAT-TCN 模型。通過在IEEE 14 節(jié)點系統(tǒng)和IEEE 39 節(jié)點系統(tǒng)上進行仿真驗證,得到以下結(jié)論:
1)MGAT 充分考慮不同測量設(shè)備在電網(wǎng)部署中的拓撲結(jié)構(gòu)關(guān)聯(lián)關(guān)系,從而提取更全面的量測數(shù)據(jù)空間特征;TCN 通過并行卷積提取電網(wǎng)量測數(shù)據(jù)的時序特征,縮短了模型訓練時間。
2)在不同節(jié)點測試系統(tǒng)中,與現(xiàn)有主流模型進行檢測性能對比的結(jié)果表明,MGAT-TCN 模型具有更高的檢測準確率和模型訓練效率,驗證了所提方法的有效性和優(yōu)勢;在不同量測噪聲環(huán)境下驗證了所提MGAT-TCN 模型的魯棒性。
3)本文方法展現(xiàn)出良好的可解釋性,空間拓撲感知注意力機制可以引導(dǎo)模型自適應(yīng)聚焦重點特征,通過權(quán)重量化模型在學習過程中計算不同樣本的空間關(guān)注程度,實現(xiàn)空間維度上攻擊檢測可解釋性。
本文驗證了所提模型對FDIA 檢測的有效性,未來研究可關(guān)注公用互聯(lián)網(wǎng)與電力專網(wǎng)互動的新型電力業(yè)務(wù)系統(tǒng)更加復(fù)雜的攻擊行為和場景,拓展可信人工智能在電力網(wǎng)絡(luò)安全中的應(yīng)用。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。