石家宇 陳 博 俞 立
智能電網(wǎng)作為下一代電力系統(tǒng),通過(guò)采用先進(jìn)的數(shù)字信息和通信技術(shù)能夠?qū)崿F(xiàn)電網(wǎng)各個(gè)環(huán)節(jié)重要運(yùn)行參數(shù)的在線(xiàn)監(jiān)測(cè)和實(shí)時(shí)信息掌控,并在此基礎(chǔ)上整合物聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)分析,實(shí)現(xiàn)了更環(huán)保、更安全和更高效的電力管理[1].在發(fā)電側(cè),由于電能無(wú)法大量存儲(chǔ),控制中心需要密切監(jiān)控電網(wǎng)運(yùn)行參數(shù),以控制電網(wǎng)中的發(fā)電與電能消耗相平衡.在電網(wǎng)側(cè),系統(tǒng)也需要估計(jì)系統(tǒng)的運(yùn)行狀態(tài),將其用于最優(yōu)潮流算法以制定發(fā)電方案,實(shí)現(xiàn)經(jīng)濟(jì)上的最優(yōu)調(diào)度.因此需要有大量的信息控制設(shè)備和通信傳感網(wǎng)絡(luò)接入電網(wǎng),實(shí)時(shí)發(fā)送各個(gè)節(jié)點(diǎn)的測(cè)量值到控制中心,確保電力系統(tǒng)的高效經(jīng)濟(jì)可靠運(yùn)行.但是通信設(shè)施的接入,也讓智能電網(wǎng)面臨著潛在的網(wǎng)絡(luò)攻擊風(fēng)險(xiǎn),成為軍事或恐怖活動(dòng)的目標(biāo),例如2015 年12 月的烏克蘭電網(wǎng)攻擊事件,造成了30 個(gè)變電站被關(guān)閉,約有23 萬(wàn)人無(wú)法用電[2].特別地,隱匿虛假數(shù)據(jù)入侵(False data injection,FDI)攻擊可以繞過(guò)電力系統(tǒng)中傳統(tǒng)的壞數(shù)據(jù)檢測(cè)機(jī)制,通過(guò)篡改測(cè)量數(shù)據(jù),使得對(duì)電力系統(tǒng)的狀態(tài)估計(jì)不準(zhǔn)確,進(jìn)而干擾控制中心決策以擾亂電力市場(chǎng)正常秩序,存在重大的經(jīng)濟(jì)和安全隱患[3].
FDI 攻擊自2009 年提出以來(lái)[4],便受到了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注.針對(duì)不同的FDI 攻擊場(chǎng)景提出了相應(yīng)的保護(hù)策略和攻擊檢測(cè)方案.在保護(hù)策略方面,主要是通過(guò)放置相量測(cè)量單元(Phasor measurement units,PMU)來(lái)增強(qiáng)通信安全.注意到PMU 是配備有全球定位系統(tǒng)(Global positioning system,GPS)技術(shù)的測(cè)量設(shè)備,通過(guò)與GPS時(shí)間同步,PMU 能夠?yàn)殡娋W(wǎng)中地理上分散的節(jié)點(diǎn)提供精確的同步相量測(cè)量,使得攻擊者更難以篡改PMU 收集的測(cè)量數(shù)據(jù)[5].然而,高昂的成本卻制約著大規(guī)模地部署PMU,因此如何找到放置PMU 的關(guān)鍵位置以最大限度地減少PMU 的數(shù)量對(duì)于保護(hù)電力系統(tǒng)免受FDI 攻擊起著重要的作用.為此,Kim 等[5]提出了一種關(guān)鍵節(jié)點(diǎn)保護(hù)機(jī)制,通過(guò)選擇關(guān)鍵節(jié)點(diǎn)實(shí)施保護(hù)以盡可能提高攻擊者的攻擊成本.文獻(xiàn)[6]從圖論的角度分析智能電網(wǎng)的結(jié)構(gòu),提出了一種啟發(fā)式算法來(lái)尋找最佳的測(cè)量保護(hù)集,達(dá)到防御效果.與此同時(shí),在攻擊檢測(cè)方面,Liu 等[7]利用狀態(tài)測(cè)量的時(shí)間相關(guān)性,以及FDI 攻擊的稀疏性來(lái)檢測(cè)廣義上的FDI 攻擊[8].文獻(xiàn)[9]提出了一種分布式狀態(tài)估計(jì)方法,根據(jù)估計(jì)結(jié)果的偏差判斷是否遭受FDI 攻擊,且能夠準(zhǔn)確定位被篡改的狀態(tài)變量.對(duì)于具有特殊結(jié)構(gòu)的隱匿FDI 攻擊,文獻(xiàn)[10?13]則將其看作是一個(gè)統(tǒng)計(jì)學(xué)習(xí)問(wèn)題,把歷史數(shù)據(jù)作為訓(xùn)練樣本,根據(jù)攻擊向量會(huì)讓正常測(cè)量值與被攻擊測(cè)量值產(chǎn)生“距離”上的變化這一特征[10],采用機(jī)器學(xué)習(xí)方法對(duì)測(cè)量值做分類(lèi),以實(shí)現(xiàn)隱匿FDI 攻擊檢測(cè)的目的.具體地,Ozay 等[10]采用了感知機(jī),k 近鄰,支持向量機(jī)等經(jīng)典機(jī)器學(xué)習(xí)方法驗(yàn)證其檢測(cè)效果.Esmalifalak 等[11]提出了分布式的支持向量機(jī)(Support vector machine,SVM)方法,驗(yàn)證了機(jī)器學(xué)習(xí)方法在隱匿FDI 攻擊檢測(cè)中的有效性.除了傳統(tǒng)的機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)因其具有自動(dòng)提取原始數(shù)據(jù)特征,能夠提取更深層更抽象特征信息的特性,也受到了許多學(xué)者的關(guān)注.文獻(xiàn)[12]便提出了一種基于深度學(xué)習(xí)的檢測(cè)機(jī)制,采用深度信念網(wǎng)絡(luò)(Deep belief networks,DBN)作為檢測(cè)模型,并結(jié)合條件高斯?伯努利受限玻爾茲曼 機(jī)(Conditional Gaussian-Bernoulli restricted Boltzmann machines,CGBRBM)提取高維時(shí)間特征,以降低訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜度與訓(xùn)練時(shí)間,仿真結(jié)果表明該方法比神經(jīng)網(wǎng)絡(luò)和SVM 的檢測(cè)方法有更高的檢測(cè)精度.文獻(xiàn)[13]則針對(duì)交流狀態(tài)估計(jì)中的隱匿FDI 攻擊,提出了一種結(jié)合小波變換和深度神經(jīng)網(wǎng)絡(luò)的檢測(cè)機(jī)制,其中小波變換提取空間上的相關(guān)性,深度神經(jīng)網(wǎng)絡(luò)則提取時(shí)域中的特征.為了得到更好的訓(xùn)練結(jié)果,文獻(xiàn)[13]構(gòu)造了20 萬(wàn)個(gè)訓(xùn)練樣本以保證樣本能夠包含所有隱匿FDI 攻擊特征,最終的訓(xùn)練結(jié)果能夠很好地提取系統(tǒng)在時(shí)域和空間域上的特征,達(dá)到了滿(mǎn)意的檢測(cè)精度,但在訓(xùn)練過(guò)程中也耗費(fèi)了大量的時(shí)間與計(jì)算資源.
雖然傳統(tǒng)機(jī)器學(xué)習(xí)方法在檢測(cè)隱匿FDI 攻擊方面取得了一些進(jìn)展,但都是在訓(xùn)練集和測(cè)試集具有高度相似性的前提下得到的,因此當(dāng)測(cè)試集與訓(xùn)練集出現(xiàn)較大差異時(shí),傳統(tǒng)機(jī)器學(xué)習(xí)方法將很大可能出現(xiàn)差的學(xué)習(xí)效果.而且電力系統(tǒng)往往是高度復(fù)雜的,其歷史數(shù)據(jù)的維度往往是幾百甚至幾千維,這使得傳統(tǒng)機(jī)器學(xué)習(xí)方法面臨“維數(shù)災(zāi)難”的問(wèn)題,訓(xùn)練結(jié)果容易出現(xiàn)過(guò)擬合,進(jìn)而限制了泛化能力.而近年來(lái)的深度學(xué)習(xí)方法的性能雖然不受維數(shù)的限制,但也存在訓(xùn)練時(shí)間長(zhǎng)、占用大量計(jì)算資源的缺陷.因此,在利用機(jī)器學(xué)習(xí)方法檢測(cè)隱匿FDI 攻擊中,通過(guò)降維避免訓(xùn)練結(jié)果過(guò)擬合,減少模型訓(xùn)練時(shí)間顯得尤為重要.為此,本文提出了基于拉普拉斯特征映射降維的神經(jīng)網(wǎng)絡(luò)檢測(cè)學(xué)習(xí)機(jī)制,通過(guò)拉普拉斯特征映射方法來(lái)提取攻擊向量的信息,將測(cè)量數(shù)據(jù)預(yù)先降維處理,再用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)得到合適的檢測(cè)模型.在MATPOWER 中的IEEE 57-bus 上進(jìn)行了實(shí)驗(yàn)驗(yàn)證,并與沒(méi)有降維預(yù)處理的神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果,深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果以及利用主成分分析降維預(yù)處理后的訓(xùn)練結(jié)果做了對(duì)比.實(shí)驗(yàn)結(jié)果表明,在智能電網(wǎng)的大規(guī)模量測(cè)數(shù)據(jù)壓縮降維方面,拉普拉斯特征映射相比主成分分析能夠很好地提取低維特征,所提出的方法不僅可以有效地檢測(cè)出隱匿FDI 攻擊,而且其泛化性能優(yōu)于單獨(dú)使用神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的檢測(cè)方法.
電力系統(tǒng)中的狀態(tài)估計(jì)是指根據(jù)各個(gè)總線(xiàn)上儀表的測(cè)量數(shù)據(jù)估計(jì)系統(tǒng)的狀態(tài),其中測(cè)量包括總線(xiàn)電壓、總線(xiàn)有功和無(wú)功功率,狀態(tài)變量包括總線(xiàn)電壓和電壓相角,其交流潮流模型的表達(dá)形式為:
其中,x∈RD為電網(wǎng)的狀態(tài)變量,即節(jié)點(diǎn)電壓和相角變量,z∈RN為測(cè)量向量,是傳感器的測(cè)量數(shù)據(jù),n ∈RN是測(cè)量噪聲,h(x) 則表示測(cè)量值與狀態(tài)變量之間的非線(xiàn)性關(guān)系,其形式由電網(wǎng)的拓?fù)浣Y(jié)構(gòu)及總線(xiàn)上的參數(shù)決定[14].在這里我們假設(shè)噪聲服從均值為0,協(xié)方差矩陣為 Λ 的高斯分布,且系統(tǒng)的狀態(tài)在一段時(shí)間內(nèi)的變化是緩慢的,因此可以通過(guò)在操作點(diǎn)附近泰勒展開(kāi),將非線(xiàn)性的交流模型做線(xiàn)性近似,得到直流潮流模型,其數(shù)學(xué)描述為:
其中,H∈RN×D是測(cè)量雅可比矩陣,則狀態(tài)向量估計(jì)可以通過(guò)加權(quán)最小二乘估計(jì)求解得到[15]:
FDI 攻擊是指攻擊者通過(guò)篡改傳感器中的測(cè)量數(shù)據(jù)使得系統(tǒng)產(chǎn)生錯(cuò)誤的狀態(tài)估計(jì),進(jìn)而使控制中心做出錯(cuò)誤決策.當(dāng)電網(wǎng)遭受到攻擊時(shí),量測(cè)方程(2)變?yōu)?
其中,a∈RN為攻擊向量.針對(duì)攻擊信號(hào)a,常用的檢測(cè)方法就是壞數(shù)據(jù)檢測(cè)(Bad data detection,BDD)[15],即:
當(dāng)測(cè)量殘差超過(guò)一定閾值γ >?0,就判斷為受到攻擊,其中?0為需要設(shè)定的閾值.
從BDD 檢測(cè)機(jī)制來(lái)看,如果攻擊者知道系統(tǒng)的拓?fù)浣Y(jié)構(gòu)H,可以構(gòu)造隱匿FDI 攻擊向量a=Hc在不改變測(cè)量殘差的情況下對(duì)系統(tǒng)狀態(tài)估計(jì)造成影響[4].當(dāng)遭遇隱匿FDI 攻擊時(shí),由式(5)可得:
從上式可以看出測(cè)得的殘差γ的大小只受噪聲影響,傳統(tǒng)的BDD 檢測(cè)方法并不能檢測(cè)出隱匿虛假數(shù)據(jù)入侵攻擊.
然而要構(gòu)造這類(lèi)攻擊也并不容易,攻擊者需要掌握電網(wǎng)系統(tǒng)的各種電氣參數(shù)和拓?fù)湫畔?(H雅可比矩陣),或者掌握系統(tǒng)所有的測(cè)量信息,利用主成分分析(PCA)構(gòu)造攻擊向量[16].即使攻擊者能夠掌握這些信息,也會(huì)受到各種資源等因素的限制,只能篡改部分測(cè)量設(shè)備的數(shù)據(jù).因此在這里我們定義I={i1,···,ik}表示攻擊者無(wú)法篡改的測(cè)量的下標(biāo)集合,為對(duì)應(yīng)的補(bǔ)集,則雅可比矩陣H可以拆分為HI和兩部分,HI表示集合I中下標(biāo)對(duì)應(yīng)的行,則為補(bǔ)集中下標(biāo)對(duì)應(yīng)的行,從而隱匿FDI攻擊可以表示為如下形式:
通過(guò)上述分析,攻擊者可以構(gòu)建針對(duì)直流狀態(tài)估計(jì)的攻擊向量,且不會(huì)被基于殘差的壞數(shù)據(jù)檢測(cè)方法檢測(cè)到.因此如何設(shè)計(jì)一種隱匿FDI 攻擊的檢測(cè)方法是本文要解決的問(wèn)題.
由第1.2 節(jié)可知,隱匿FDI 攻擊可以繞過(guò)傳統(tǒng)的壞數(shù)據(jù)檢測(cè),故如何基于機(jī)器學(xué)方法訓(xùn)練分類(lèi)器以識(shí)別系統(tǒng)是否受到攻擊為這一問(wèn)題提供了可行的解決思路.然而,隨著電網(wǎng)規(guī)模的不斷擴(kuò)大,測(cè)量數(shù)據(jù)的維數(shù)也成倍增長(zhǎng),進(jìn)而導(dǎo)致機(jī)器學(xué)習(xí) 檢測(cè)方法面臨維數(shù)災(zāi)難挑戰(zhàn),使得訓(xùn)練結(jié)果存在陷入過(guò)擬合的風(fēng)險(xiǎn).為了克服上述缺點(diǎn),本文提出了如圖1 所示的檢測(cè)機(jī)制:
圖1 基于拉普拉斯特征映射降維學(xué)習(xí)的檢測(cè)機(jī)制Fig.1 Detection mechanism based on Laplacian eigenmaps
首先我們采用拉普拉斯特征映射對(duì)歷史數(shù)據(jù)進(jìn)行降維預(yù)處理,從而提取低維流形特征,使降維后的數(shù)據(jù)相比原始數(shù)據(jù)更易處理,然后借助于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法訓(xùn)練分類(lèi)器以實(shí)現(xiàn)隱匿FDI 攻擊信號(hào)的檢測(cè).
拉普拉斯特征映射(Laplacian eigenmaps,LE)是一種非線(xiàn)性的降維方法,用局部的角度去構(gòu)建數(shù)據(jù)之間的關(guān)系,可以反映出數(shù)據(jù)內(nèi)在的流形結(jié)構(gòu)[17].它的直觀(guān)思想是希望相互間有關(guān)系的點(diǎn)在降維后的空間中盡可能地靠近,其最小化的目標(biāo)函數(shù)是:
通過(guò)最小化目標(biāo)函數(shù)(8),保證了相近的z(i)和z(j)映射后u(i)和u(j)兩點(diǎn)仍能夠保持相近.目標(biāo)函數(shù)經(jīng)過(guò)整理后可以表示為如下二次型的形式:
其中,u=(u(1),u(2),···,u(m))T,m表示樣本集中的樣本數(shù)量,L=D∑?W為拉普拉斯矩陣,D是一個(gè)對(duì)角矩陣,滿(mǎn)足Dii=jwij,W是一個(gè)對(duì)稱(chēng)鄰接矩陣,且拉普拉斯矩陣L是半正定的.
最終需要求解如下最小化問(wèn)題:
其中,約束uTDu=1 避免了縮放的影響,最小化目標(biāo)函數(shù)的向量u由廣義特征值問(wèn)題的最小特征值解給出[16]:
求解得到的非零特征值所對(duì)應(yīng)的特征向量就是降維后的輸出.
通過(guò)上述方法將訓(xùn)練樣本降維處理,選擇最大的兩個(gè)廣義特征值對(duì)應(yīng)的廣義特征向量作為低維流形特征.然后基于低維流形特征,建立如圖2 所示的三層神經(jīng)網(wǎng)絡(luò),有輸入層、隱藏層和輸出層組成[18].
圖2 神經(jīng)網(wǎng)絡(luò)示意圖Fig.2 Neural network
其中,輸入層有2 個(gè)神經(jīng)元組成,為原始數(shù)據(jù)降維后得到的u=(u1,u2)T.隱藏層由5 個(gè)神經(jīng)元組成,通過(guò)下式計(jì)算得到:
其中,ωh對(duì)應(yīng)每個(gè)隱藏層神經(jīng)元的偏置,ωhi對(duì)應(yīng)輸入ui到神經(jīng)元th的權(quán)重,σ則是激活函數(shù)σ(x)=最后輸出層有2 個(gè)神經(jīng)元組成,當(dāng)他們的輸出值大于0.5 時(shí),分別表示受到攻擊與未受到攻擊兩種檢測(cè)結(jié)果,其表達(dá)式為:
其中,υj為對(duì)應(yīng)輸出的偏置,υjh為對(duì)應(yīng)輸入th到輸出y?j的權(quán)重.最后通過(guò)求解以下最優(yōu)化問(wèn)題來(lái)訓(xùn)練得到權(quán)重ωhi,υjh和偏置ωh,υj:
其中,ykj為樣本xk的標(biāo)簽.綜上所述,最終的檢測(cè)算法步驟歸納如下:
算法 1.
步驟1.收集歷史測(cè)量數(shù)據(jù)
步驟2.拉普拉斯特征映射降維預(yù)處理
1) 構(gòu)建鄰接矩陣W
ifz(j)在z(i)的k個(gè)鄰居中
2) 特征映射
求解廣義特征問(wèn)題
Lu=λDu
得到降維處理后的樣本
u=(u(1),u(2),···,u(m))T
步驟3.BP 算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)
在0 附近初始化權(quán)重ωhi,υjh和偏置ωh,υj
b)計(jì)算輸出層梯度
c)計(jì)算隱藏層梯度
d)更新權(quán)重ωhi,υjh和偏置ωh,υj
Until 達(dá)到停止條件
步驟4.將新的測(cè)量放入歷史數(shù)據(jù)降維處理,作為神經(jīng)網(wǎng)絡(luò)檢測(cè)模型的輸入,得到檢測(cè)結(jié)果.
本文利用IEEE 57-Bus 系統(tǒng)模型驗(yàn)證所提出隱匿FDI 攻擊檢測(cè)方法的優(yōu)點(diǎn)和有效性,即:采用LE 降維、PCA 降維的樣本集分別訓(xùn)練了神經(jīng)網(wǎng)絡(luò)檢測(cè)模型,以及未降維預(yù)處理的樣本集訓(xùn)練了神經(jīng)網(wǎng)絡(luò)與深度神經(jīng)網(wǎng)絡(luò)模型并做對(duì)比與分析,其中系統(tǒng)的測(cè)量雅可比矩陣H來(lái)自MATPOWER 工具箱[19].通過(guò)對(duì)MATPOWER 中的案例進(jìn)行潮流計(jì)算得到電網(wǎng)的系統(tǒng)狀態(tài)x∈RD,并用于計(jì)算得到系統(tǒng)的量測(cè)z∈RN. IEEE 57-Bus 系統(tǒng)如圖3 所示,其中狀態(tài)維數(shù)D=113,測(cè)量維數(shù)N=217,這些測(cè)量信息將作為本文提出學(xué)習(xí)算法的訓(xùn)練樣本.
圖3 IEEE 57-Bus 系統(tǒng)Fig.3 IEEE 57-Bus system
在實(shí)驗(yàn)中,我們考慮攻擊者可以訪(fǎng)問(wèn)系統(tǒng)中的k個(gè)測(cè)量,可以理解為電網(wǎng)系統(tǒng)中,這k個(gè)測(cè)量存在被FDI 攻擊的隱患,而其余的測(cè)量受到保護(hù).例如:在這k個(gè)節(jié)點(diǎn)配備了PMU,則測(cè)量信息不易被篡改.事實(shí)上,由于成本限制,電網(wǎng)系統(tǒng)不能在每個(gè)節(jié)點(diǎn)上設(shè)置PMU;與此同時(shí),攻擊者往往也只能夠入侵電網(wǎng)中的部分測(cè)量,因此這種假設(shè)符合實(shí)際情況.注意到當(dāng)k ≤104 時(shí),意味著系統(tǒng)中受保護(hù)的節(jié)點(diǎn)超過(guò)狀態(tài)的維數(shù),從被攻擊者的角度,防御方完全可以選取合適的量測(cè)節(jié)點(diǎn),使得HIc=0 只有零解,讓攻擊者無(wú)法構(gòu)造隱匿FDI 攻擊[10].因此,在實(shí)驗(yàn)中我們選取了k=190,170,150,130四種攻擊場(chǎng)景做了仿真驗(yàn)證.且為了令構(gòu)造的攻擊向量更有“實(shí)際意義”,能夠?qū)χ悄茈娋W(wǎng)系統(tǒng)造成有效的影響,我們還對(duì)攻擊引起的狀態(tài)向量變化做了進(jìn)一步地限制.
其中,c為隱匿FDI 攻擊對(duì)系統(tǒng)狀態(tài)的影響,即隱匿FDI攻擊要對(duì)智能電網(wǎng)系統(tǒng)中至少一個(gè)狀態(tài)造成超過(guò)大小為τ的篡改.由于在現(xiàn)實(shí)中針對(duì)電力系統(tǒng)的網(wǎng)絡(luò)攻擊案例并不多見(jiàn),且很難得到真實(shí)的數(shù)據(jù),因此我們還不能確定τ值的大小,對(duì)此我們?cè)诜抡鎸?shí)驗(yàn)中設(shè)置了τ=1,5,10,15 這4 種情況來(lái)分別檢驗(yàn)所提出方法的有效性.
此外,為了驗(yàn)證檢測(cè)模型的泛化能力,我們?cè)O(shè)置了不同的環(huán)境噪聲 N(0,σ) ,σ=0.01,0.25,0.50,0.75,1.00.通過(guò)求解HIc=0,構(gòu)造隱匿攻擊向量a,并針對(duì)不同的τ,k和σ重復(fù)1 000 次來(lái)分別生成訓(xùn)練和測(cè)試樣本Z=[z(1),···,z(m)]T.訓(xùn)練和測(cè)試的樣本中分別包含500個(gè)被攻擊的樣本和500 個(gè)未被攻擊的樣本.根據(jù)前文式(7)的隱匿FDI 攻擊構(gòu)造方法,我們?cè)O(shè)置環(huán)境噪聲σ=0.01,狀態(tài)變化閾值τ=10,得到一個(gè)篡改了18 個(gè)測(cè)量數(shù)據(jù)的隱匿FDI 攻擊,其對(duì)系統(tǒng)狀態(tài)估計(jì)的影響如圖4所示.
由圖4 可以看到所構(gòu)造的隱匿FDI 攻擊對(duì)系統(tǒng)中的部分狀態(tài)估計(jì)產(chǎn)生了很大的影響.例如:節(jié)點(diǎn)20,30,50,51 以及52 的電壓相角都出現(xiàn)了不同大小的偏差,而系統(tǒng)的殘差幾乎沒(méi)有變化,攻擊前的殘差為0.0688,攻擊后的殘差為0.0895.其中節(jié)點(diǎn)30 的狀態(tài)變化如圖5 所示,從第20 分鐘開(kāi)始受到隱匿FDI 攻擊,攻擊持續(xù)時(shí)間為十分鐘.
圖4 隱匿FDI 攻擊對(duì)系統(tǒng)狀態(tài)估計(jì)的影響Fig.4 The effect of stealthy FDI attack on system state estimation
圖5 節(jié)點(diǎn)30 的狀態(tài)變化曲線(xiàn)Fig.5 The state curve of node 30
進(jìn)一步地,在不同環(huán)境噪聲下的系統(tǒng)被隱匿FDI 攻擊前后的平均殘差變化如圖6 所示,被攻擊后的殘差變化很小,可見(jiàn)利用殘差檢測(cè)的方法對(duì)隱匿FDI 攻擊是無(wú)效的,且環(huán)境噪聲變化對(duì)殘差的影響也很顯著.
圖6 不同環(huán)境噪聲下的殘差變化Fig.6 Residual change under different environmental noise
將樣本集進(jìn)行拉普拉斯特征映射降維處理,取最小的兩個(gè)非零特征值對(duì)應(yīng)的廣義特征向量,數(shù)據(jù)降維后的二維空間分布如圖7 所示.
圖7 LE 降維后的樣本點(diǎn)分布Fig.7 Sample distribution after LE dimension reduction
此外,我們也比較了PCA 降維的效果,采用PCA 方法選擇協(xié)方差矩陣最大的兩個(gè)特征值對(duì)應(yīng)的特征向量,將高維數(shù)據(jù)壓縮到二維,降維后的樣本點(diǎn)分布如圖8 所示.
圖8 PCA 降維后的樣本點(diǎn)分布Fig.8 Sample distribution after PCA dimension reduction
由圖7 和圖8 可以看到直接用PCA 方法將數(shù)據(jù)降到二維丟失了許多主成分信息,降維后樣本點(diǎn)是雜糅在一起的,而應(yīng)用拉普拉斯特征映射降維后,正常的測(cè)量數(shù)據(jù)都聚集在一起,且與被攻擊樣本有明顯的分離,便于機(jī)器學(xué)習(xí)方法找到?jīng)Q策平面.拉普拉斯特征映射降維方法之所以能夠很好地區(qū)分?jǐn)?shù)據(jù)點(diǎn),是因?yàn)閮深?lèi)數(shù)據(jù)間的距離存在如下的關(guān)系[10]:
其中,S表示正常樣本的集合,表示被攻擊樣本的集合,zi,分別為正常測(cè)量和被攻擊的測(cè)量,ai為攻擊向量,可以看出被攻擊的樣本和未被攻擊的樣本存在一定的距離‖a‖2.拉普拉斯特征映射在構(gòu)建鄰接圖的時(shí)候也抓取了這些信息,只要選取合適的鄰居個(gè)數(shù)k,就可以使得所有未被攻擊的樣本點(diǎn)之間有一個(gè)非零的權(quán)重,且與被攻擊的樣本無(wú)連接.最后通過(guò)求解優(yōu)化問(wèn)題,使得S中的樣本降維后盡可能接近,而且盡可能不包含Sˉ中的樣本,因此具有區(qū) 分異常點(diǎn)的特性.
本文采用接受者操作特征(Receiver operating characteristic,ROC)曲線(xiàn)中的假陽(yáng)性率(False positive Rate,FPR)和準(zhǔn)確率(Accuracy,ACC)作為評(píng)價(jià)各個(gè)算法優(yōu)劣的指標(biāo),FPR和ACC計(jì)算方式如下:
其中,TP、FP、TN和FN分別表示正確分類(lèi)的被攻擊樣本、錯(cuò)誤分類(lèi)的正常樣本、正確分類(lèi)的正常樣本和錯(cuò)誤分類(lèi)的被攻擊樣本.FPR表示正常樣本被誤分為被攻擊的概率,定義為誤報(bào)率,ACC則為所有樣本被正確分類(lèi)的概率,定義為檢測(cè)精度.我們希望檢測(cè)精度高的同時(shí),發(fā)生誤報(bào)的概率也盡可能的低,因?yàn)榧词故? %的誤報(bào)率,在不斷生成的測(cè)量數(shù)據(jù)面前,也會(huì)產(chǎn)生頻繁的誤報(bào),對(duì)電網(wǎng)控制帶來(lái)很大影響,所以我們的目標(biāo)是ACC指標(biāo)盡可能高,而FPR指標(biāo)盡可能低,或者為零.
這里取噪聲方差為σ=0.01 ,狀態(tài)變化閾值τ=10,生成原始樣本集,用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)和一個(gè)三層的神經(jīng)網(wǎng)絡(luò),并將LE 降維處理后和PCA 降維處理后的樣本集分別訓(xùn)練神經(jīng)網(wǎng)絡(luò),其中深度神經(jīng)網(wǎng)絡(luò)我們采用了長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long short-term memory,LSTM)[20],由輸入特征數(shù)為217 的輸入層,具有100 個(gè)隱藏單元的雙向LSTM 層,大小為9 的全連接層,softmax 層和分類(lèi)層5 層結(jié)構(gòu)組成.則它們的迭代收斂效果如圖9 所示.由此圖可知發(fā)現(xiàn),基于拉普拉斯特征映射降維的神經(jīng)網(wǎng)絡(luò)均方誤差最小,與深度神經(jīng)網(wǎng)絡(luò)的均方誤差一致,且收斂速度要比深度神經(jīng)網(wǎng)絡(luò)快很多,與而基于主成分分析的神經(jīng)網(wǎng)絡(luò)收斂效果不明顯,均方誤差較大.
圖9 收斂效果Fig.9 Convergence performance
然后將訓(xùn)練好的檢測(cè)模型在另外的測(cè)試樣本中檢驗(yàn)檢測(cè)精度與誤報(bào)率,通過(guò)多次的訓(xùn)練并測(cè)試,得到各個(gè)算法的ROC 曲線(xiàn)如圖10?11 所示.
圖10 四種檢測(cè)機(jī)制在不同隱患測(cè)量數(shù)k 下的檢測(cè)精度ACCFig.10 Detection accuracy of four detection mechanisms
圖11 四種檢測(cè)機(jī)制在不同隱患測(cè)量數(shù)k 下的誤報(bào)率FPRFig.11 The false positive rate of four detection mechanisms
從圖10?11 可以看出,基于神經(jīng)網(wǎng)絡(luò)的檢測(cè)方法有較高的檢測(cè)精度,精度可以達(dá)到90 %左右,但是誤報(bào)率達(dá)到了8 %左右,這意味著平均每 100次檢測(cè),會(huì)錯(cuò)誤報(bào)警8次,因此在實(shí)際當(dāng)中不能將神經(jīng)網(wǎng)絡(luò)方法直接用于隱匿FDI 攻擊檢測(cè).而采用PCA 降維預(yù)處理的訓(xùn)練結(jié)果,由于丟掉了大部分主成分信息,檢測(cè)效果反而下降明顯,其誤報(bào)率也達(dá)到了30 %以上.此外,深度神經(jīng)網(wǎng)絡(luò)具有很高的檢測(cè)精度,均達(dá)到了98 %以上,且誤報(bào)率都在0.3 %以下.最后本文的檢測(cè)機(jī)制的檢測(cè)精度均達(dá)到了95 %以上,且誤報(bào)率均在0.5 %以下,最少能達(dá)到0.1 %,相比神經(jīng)網(wǎng)絡(luò)的方法,基于LE 降維學(xué)習(xí)方法的檢測(cè)精度提升明顯,且十分接近深度神經(jīng)網(wǎng)絡(luò)的檢測(cè)效果.
此外,為了驗(yàn)證檢測(cè)模型的泛化能力,我們?cè)陔[患測(cè)量數(shù)k=150,狀態(tài)變化閾值τ=10 的情景下,用上述訓(xùn)練得到的檢測(cè)模型分別對(duì)不同噪聲環(huán)境下的測(cè)試樣本做了檢測(cè),其中PCA 降維預(yù)處理的檢測(cè)模型由于測(cè)試精度不高,便不再討論其泛化性能,檢測(cè)結(jié)果如圖12?13 所示.
圖12 四種檢測(cè)方法在不同環(huán)境噪聲中的檢測(cè)精度ACC 變化Fig.12 Detection accuracy of three detection mechanisms in different environmental noises
圖13 四種檢測(cè)方法在不同環(huán)境噪聲中的誤報(bào)率FPR 變化Fig.13 False positive rate of three detection mechanisms in different environmental noises
從圖12?13 中的仿真結(jié)果可以看出,單純神經(jīng)網(wǎng)絡(luò)檢測(cè)方法的性能易受到環(huán)境噪聲變化的影響,噪聲變大時(shí),檢測(cè)精度下降明顯,誤報(bào)率也在7 %以上.深度神經(jīng)網(wǎng)絡(luò)的檢測(cè)精度也在噪聲變大時(shí),出現(xiàn)了一定幅度的下降,但也保持了90 %以上的檢測(cè)精度和5 %以下的誤報(bào)率.而本文提出的檢測(cè)機(jī)制幾乎不受噪聲變化的影響,隨著噪聲增大,檢測(cè)精度并沒(méi)有顯著下降,仍均有95 %以上的檢測(cè)精度,誤報(bào)率也不超過(guò)0.8 %.因此,與神經(jīng)網(wǎng)絡(luò)方法相比,所提出的LE 降維學(xué)習(xí)方法具有更好的泛化性能和魯棒性.
最后,考慮到狀態(tài)變化閾值的選取對(duì)檢測(cè)結(jié)果會(huì)有明顯的影響,我們?cè)陔[患測(cè)量數(shù)k=150,噪聲方差為σ=0.01的情景下,用上述訓(xùn)練得到的檢測(cè)模型對(duì)不同的τ值的測(cè)試樣本做了檢測(cè),檢測(cè)結(jié)果如圖14 所示.
圖14 閾值 τ 對(duì)檢測(cè)精度的影響Fig.14 The effect of threshold τ on detection accuracy
從圖14 可以看出,系統(tǒng)狀態(tài)量篡改的幅值越大,檢測(cè)效率也越高,而當(dāng)攻擊改變的狀態(tài)量較小時(shí),三種方法的檢測(cè)精度都有顯著的降低,其中本文提出的檢測(cè)機(jī)制受閾值影響最小,可見(jiàn)本文所提出方法具有很好的魯棒性.
本文針對(duì)電力系統(tǒng)中隱匿FDI 攻擊信號(hào)的檢測(cè)問(wèn)題,利用拉普拉斯特征映射將歷史數(shù)據(jù)映射到低維空間,然后通過(guò)構(gòu)建合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以建立相應(yīng)的檢測(cè)模型,從而形成基于拉普拉斯特征映射降維學(xué)習(xí)的隱匿FDI 攻擊信號(hào)檢測(cè)機(jī)制.最后通過(guò)IEEE 57-Bus 模型驗(yàn)證了這種檢測(cè)機(jī)制的有效性.仿真結(jié)果表明采用拉普拉斯特征映射方法能夠使正常的測(cè)量數(shù)據(jù)與受攻擊的數(shù)據(jù)很好地分離;相比于神經(jīng)網(wǎng)絡(luò)方法,這種檢測(cè)機(jī)制能明顯提升檢測(cè)精度,達(dá)到與深度神經(jīng)網(wǎng)絡(luò)接近的檢測(cè)效果.進(jìn)一步的,相比于深度神經(jīng)網(wǎng)絡(luò),本文的方法不僅能有相似的檢測(cè)精度,并且在訓(xùn)練時(shí)間上花費(fèi)更少,且具有更好的泛化能力.