潘駿,夏祥武,2,李梁,劉非文
(1. 上海電力大學(xué)電氣工程學(xué)院,上海市 200090;2. 中煤科工集團(tuán)上海有限公司,上海市 200030;3. 國網(wǎng)上海市電力公司超高壓分公司,上海市 200063)
異常用電是指電力用戶通過對(duì)用電數(shù)據(jù)進(jìn)行非法篡改引起的電力欺詐與能源盜竊行為,異常用電行為是配電網(wǎng)中非技術(shù)性損耗(non-technical loss, NTL)的主要原因,直接造成電網(wǎng)巨額的經(jīng)濟(jì)損失,危害電網(wǎng)的平穩(wěn)運(yùn)行[1-6]。電力企業(yè)對(duì)異常用電檢測業(yè)務(wù)重視程度不斷加大,促使部分非法用電方法從對(duì)電能表的物理破壞轉(zhuǎn)變?yōu)榇鄹拇鎯?chǔ)數(shù)據(jù)的數(shù)據(jù)攻擊[7-10],使得傳統(tǒng)的用電稽查手段面臨新的難題。隨著智能電網(wǎng)的發(fā)展,廣泛部署的高級(jí)量測架構(gòu)(advanced metering infrastructure, AMI)提供了海量的多維耦合用電數(shù)據(jù)[11-13],如何從信息耦合的電力數(shù)據(jù)中挖掘出潛在的異常用電用戶,提高現(xiàn)場稽查異常用電的準(zhǔn)確性,是目前異常用電檢測的研究重點(diǎn)。
目前,異常用電檢測的技術(shù)可大致劃分為3類:基于線損分析、基于用電模式特征和基于潮流約束[14]。第一類方法將異常用電檢測問題描述成用電量與臺(tái)區(qū)線損間的關(guān)聯(lián)性分析[15-16]。此類方法理論研究較為完善,但缺乏對(duì)多元用電信息的運(yùn)用,應(yīng)用場景較為狹窄。
第二類方法基于數(shù)據(jù)驅(qū)動(dòng)的方法,將不同于正常用戶用電模式特征的異常用戶區(qū)分出來。根據(jù)有無數(shù)據(jù)標(biāo)簽,劃為有監(jiān)督和無監(jiān)督方法。有監(jiān)督學(xué)習(xí)是通過學(xué)習(xí)用電特征信息的分類器模型[17-19],以此區(qū)分正負(fù)樣本。同時(shí)為解決數(shù)據(jù)正負(fù)樣本不平衡問題,提出了基于Wasserstein生成對(duì)抗網(wǎng)絡(luò)的異常樣本過采樣方法[20]等異常檢測模型。這類方法檢測準(zhǔn)確率較高,但依賴足量的標(biāo)記樣本數(shù)據(jù),而完整的異常樣本標(biāo)簽獲取成本較高。無監(jiān)督算法能從未標(biāo)記的用電數(shù)據(jù)中學(xué)習(xí)潛在樣本分布對(duì)數(shù)據(jù)進(jìn)行劃分,如文獻(xiàn)[21]提出了對(duì)用戶電量進(jìn)行分簇計(jì)算離群度識(shí)別異常用電模式的方法,文獻(xiàn)[22]提出了對(duì)用戶電量進(jìn)行編碼重構(gòu)的方法來校驗(yàn)異常用電。這類方法通常從用戶歷史用電量角度制定電量的差異性指標(biāo)來區(qū)分異常用戶,但受到用戶負(fù)荷隨機(jī)性和獨(dú)立性的影響。
第三類是考慮到電力網(wǎng)絡(luò)的狀態(tài)變量受潮流約束的影響,異常用電行為將導(dǎo)致系統(tǒng)狀態(tài)的不一致性[23-24]。大部分研究都是基于狀態(tài)估計(jì)的異常檢測方法[25-27],通過分析異常用電行為導(dǎo)致系統(tǒng)狀態(tài)的異常特征,比較電壓、功率的量測值與估計(jì)值的殘差進(jìn)行異常檢測。這類方法有著較高的檢測精度,但依賴于精確的配網(wǎng)拓?fù)鋮?shù)以及額外的儀表量測,限制了此類方法的使用范圍,僅適用于網(wǎng)絡(luò)拓?fù)鋮?shù)完善的用電稽查場景。
針對(duì)狀態(tài)估計(jì)方法受限于拓?fù)鋮?shù)的問題,本文通過構(gòu)建神經(jīng)網(wǎng)絡(luò)等值潮流模型與潮流回溯機(jī)制,實(shí)現(xiàn)不依賴線路參數(shù)的關(guān)聯(lián)潮流感知,挖掘異常用電的殘差特征。提出的基于關(guān)聯(lián)潮流感知與高斯混合模型(associative power flow sensing and Gaussian mixture model, APFS-GMM)由2個(gè)部分組成:關(guān)聯(lián)潮流感知網(wǎng)絡(luò)和估計(jì)網(wǎng)絡(luò)。首先,基于潮流計(jì)算方程的配網(wǎng)電壓功率特征存在著相互關(guān)聯(lián)相互約束的物理聯(lián)系,挖掘出潮流方程兩端關(guān)聯(lián)約束的電壓與功率殘差特征。其中,在正向潮流映射中,將圖注意力(graph attention network, GAT)機(jī)制用于聚合目標(biāo)節(jié)點(diǎn)與鄰居節(jié)點(diǎn)間的功率數(shù)據(jù),學(xué)習(xí)關(guān)聯(lián)潮流函數(shù)關(guān)系,實(shí)現(xiàn)不依賴于網(wǎng)絡(luò)參數(shù)的等值潮流計(jì)算;同時(shí)在潮流感知網(wǎng)絡(luò)中引入潮流回溯機(jī)制,通過動(dòng)量迭代思想,不斷攻擊注入功率,使之回溯至與量測電壓相對(duì)應(yīng)的回溯功率。然后,提取出映射電壓和回溯功率的殘差特征作為異常用電特征向量,設(shè)計(jì)基于高斯混合模型的估計(jì)網(wǎng)絡(luò)對(duì)構(gòu)造的異常用電特征向量計(jì)算異常概率能量,將處于低密度區(qū)域的用戶視為異常用電用戶。最后,與多種異常用電檢測模型對(duì)比表明,該模型在異常用電檢測問題上具有更優(yōu)的性能。
異常用電行為將產(chǎn)生異常的電表量測數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)異常用電檢測方法是以用電量數(shù)據(jù)為基礎(chǔ),分析用電曲線的異常波動(dòng)特征進(jìn)行檢測。
各場景下的用戶用電曲線如圖1所示,當(dāng)用戶處于低谷用電量時(shí),用戶的正常用電波動(dòng)與異常用電行為將難以區(qū)分。
圖1 各場景下的用戶用電曲線
配電網(wǎng)是由電源節(jié)點(diǎn)、負(fù)荷節(jié)點(diǎn)和功率傳輸網(wǎng)絡(luò)構(gòu)成的物理拓?fù)洹T谕粋€(gè)時(shí)間斷面上,由于電網(wǎng)的物理模型及潮流方程約束,各節(jié)點(diǎn)系統(tǒng)狀態(tài)具有一致性,狀態(tài)量間具有較強(qiáng)的非線性關(guān)聯(lián)[28]。
當(dāng)系統(tǒng)正常運(yùn)行時(shí),任意節(jié)點(diǎn)i的節(jié)點(diǎn)電壓Vi和功率Si表達(dá)式為:
(1)
(2)
當(dāng)系統(tǒng)中k點(diǎn)發(fā)生異常用電行為時(shí),將異常負(fù)荷等效導(dǎo)納設(shè)為ΔYc,則任意節(jié)點(diǎn)i的異常用電后的節(jié)點(diǎn)電壓Vi′和異常用電后的功率S′i可以表示為:
(3)
(4)
由式(3)、(4)可知,系統(tǒng)發(fā)生異常未量測的功率分流時(shí),該用戶節(jié)點(diǎn)的電壓和功率都會(huì)增加一個(gè)與異常用電負(fù)荷相關(guān)的變量,變量的變化特性與異常用電負(fù)荷性質(zhì)相關(guān)聯(lián)。
正常的用電負(fù)荷波動(dòng)滿足系統(tǒng)的潮流約束,不會(huì)產(chǎn)生異常注入量,而異常用電行為產(chǎn)生的異常注入量即為量測值與狀態(tài)量之間的誤差。
居民智能電表的電量計(jì)量是對(duì)電壓、電流的實(shí)時(shí)采樣計(jì)算,計(jì)量公式為:
W=∑Pmea,tΔtt=∑Vmea,tImea,tcosθmea,tΔtt
(5)
式中:Pmea,t、Vmea,t、Imea,t、θmea,t分別為t時(shí)刻電表量測的有功功率、相電壓、相電流和相角。
針對(duì)上述電能計(jì)量原理,用戶只需更改任意參量均能導(dǎo)致電能表慢轉(zhuǎn)、停轉(zhuǎn)乃至反轉(zhuǎn)[29]。實(shí)際營銷業(yè)務(wù)中的異常用電手法類型眾多,除了傳統(tǒng)的用電竊電,還包括新型光伏竊電,如用戶通過篡改光伏計(jì)量表來騙取新能源補(bǔ)貼。但究其原理大多可歸為針對(duì)智能電表的電流、電壓和功率因數(shù)等電氣狀態(tài)參量進(jìn)行篡改,以達(dá)到變更計(jì)量電量的目的。
根據(jù)針對(duì)的電氣狀態(tài)量的區(qū)別,異常用電行為可分為如下3類[30]:
1)針對(duì)電壓參數(shù)的異常用電方法,如:欠壓法、光伏升壓法。其特征在于更改計(jì)量電能表的測量電壓,Vmea
2)針對(duì)功率參數(shù)的異常用電方法,如:欠流法、移相法、無表法和光伏升流法。其特征在于通過改變流經(jīng)電流、改變相位或繞表用電的方法,更改計(jì)量功率數(shù)值,Pmea
3)針對(duì)電壓、功率參數(shù)的異常用電方法,如:擴(kuò)差法和市電改接法。其特征在于外力破壞、干擾和更改電表讀數(shù),電壓和功率電氣參數(shù)變化規(guī)律更為復(fù)雜。
綜上所述,當(dāng)用戶側(cè)出現(xiàn)異常用電行為時(shí),電表的量測功率和電壓將無法滿足基本的潮流約束。針對(duì)電表數(shù)據(jù)的感知校驗(yàn),能夠充分發(fā)現(xiàn)發(fā)生異常負(fù)荷分流后系統(tǒng)狀態(tài)產(chǎn)生的變化特征,適用于檢測上述多類型的異常用電行為。
考慮到用戶異常功率作為等值潮流方程的輸入量時(shí),會(huì)引起關(guān)聯(lián)用戶的潮流計(jì)算電壓與量測電壓間的誤差,導(dǎo)致出現(xiàn)殘差污染的情況。對(duì)此,本文提出了基于GAT的潮流感知網(wǎng)絡(luò),以注意力機(jī)制擬合關(guān)聯(lián)用戶的功率注入,提高用戶電壓擬合精度,同時(shí)在不改變感知網(wǎng)絡(luò)參數(shù)的條件下,通過動(dòng)量攻擊法反向回溯與量測電壓對(duì)應(yīng)的回溯功率,最終以相互關(guān)聯(lián)的正向映射電壓和反向回溯功率2個(gè)特征構(gòu)建異常用電的殘差特征。
電力系統(tǒng)中的節(jié)點(diǎn)電壓和注入功率需要滿足物理潮流約束,對(duì)于拓?fù)鋮?shù)完整、導(dǎo)納矩陣完備的系統(tǒng),可建立如下的潮流物理方程:
F(P,Q,θ,V)=0
(6)
式中:P、Q分別為節(jié)點(diǎn)的注入有功和無功功率;θ、V分別為節(jié)點(diǎn)的電壓相角和幅值。
然而,我國中低壓配電網(wǎng)線路存在著長期運(yùn)行與維護(hù)等情況,導(dǎo)致網(wǎng)架結(jié)構(gòu)脆弱、網(wǎng)架參數(shù)實(shí)際值與標(biāo)記值存在偏差、臺(tái)區(qū)線路參數(shù)缺失等問題,難以構(gòu)建精確數(shù)學(xué)建模的物理潮流模型進(jìn)行計(jì)算。
我國中低壓配電網(wǎng)大多呈輻射狀結(jié)構(gòu),線路電阻較大,潮流非線性關(guān)系強(qiáng),輻射狀配電網(wǎng)中的節(jié)點(diǎn)電壓分布情況與各節(jié)點(diǎn)功率分布相關(guān)聯(lián),其計(jì)算公式為:
(7)
式中:ΔVm為節(jié)點(diǎn)m的電壓變化量;N為節(jié)點(diǎn)注入功率發(fā)生變化的節(jié)點(diǎn)集合;ki,PV和ki,QV分別為第i個(gè)節(jié)點(diǎn)的有功功率變化量ΔPi和無功功率變化量ΔQi對(duì)第m個(gè)節(jié)點(diǎn)的電壓靈敏度系數(shù)。
由式(7)可知,P、Q對(duì)θ、V的偏導(dǎo)雅可比矩陣J=?F/?[θ,V],且系統(tǒng)正常運(yùn)行狀態(tài)下J是可逆的,由隱函數(shù)存在定理可知,存在從P、Q到V的唯一函數(shù)映射[31]。同時(shí),深度神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性擬合能力,通過構(gòu)建神經(jīng)網(wǎng)絡(luò)等值潮流模型,利用大量的歷史量測數(shù)據(jù)擬合P、Q與V之間存在的潮流映射關(guān)系在理論上是可行的。
電力系統(tǒng)本質(zhì)上是圖結(jié)構(gòu)的系統(tǒng),用電數(shù)據(jù)實(shí)質(zhì)是物理信息的耦合[32]?;趫D結(jié)構(gòu)的圖注意力網(wǎng)絡(luò)能利用鄰接矩陣的節(jié)點(diǎn)關(guān)聯(lián)信息,從空間上提取配電網(wǎng)結(jié)構(gòu)的關(guān)聯(lián)特征,通過注意力機(jī)制定義聚合函數(shù),為節(jié)點(diǎn)間的聚合信息重新設(shè)置權(quán)重,實(shí)現(xiàn)自適應(yīng)地聚合鄰接節(jié)點(diǎn)的信息[33]。
圖注意力網(wǎng)絡(luò)通過構(gòu)建注入功率與電壓的潮流映射關(guān)系,繞過潮流計(jì)算對(duì)線路導(dǎo)納矩陣的需求,擬合潮流約束中功率、電壓變量間的函數(shù)關(guān)系,實(shí)現(xiàn)了不依賴于線路參數(shù)的等值潮流計(jì)算,其函數(shù)關(guān)系表示為:
V=gGAT(P,Q)
(8)
關(guān)聯(lián)信息聚合過程如圖2所示。具體而言,將配網(wǎng)中包含拓?fù)潢P(guān)聯(lián)信息的G(X,A)進(jìn)行信息聚合,獲得具有數(shù)據(jù)關(guān)聯(lián)信息的嵌入特征向量X′。
圖2 電力系統(tǒng)關(guān)聯(lián)信息聚合過程示意圖
(9)
注意力系數(shù)aij經(jīng)過softmax歸一化的計(jì)算過程為:
(10)
式中:eij表示鄰居節(jié)點(diǎn)vj對(duì)目標(biāo)節(jié)點(diǎn)vi的重要程度權(quán)重系數(shù)。
(11)
如式(11)將特征向量通過“‖”進(jìn)行連接操作,然后輸入到單層前饋神經(jīng)網(wǎng)絡(luò)中,計(jì)算兩節(jié)點(diǎn)相關(guān)度,最后通過非線性激活函數(shù)LeakyReLU得到eij。如圖3所示,說明了圖注意力層中注意力運(yùn)算的機(jī)制。
圖3 圖注意力運(yùn)算原理
基本迭代法(basic iterative method, BIM)作為一種基礎(chǔ)地迭代攻擊算法,通過多步迭代得到擾動(dòng),沿最優(yōu)方向修改輸入值,將多次迭代的樣本裁剪(Clip)到規(guī)定范圍內(nèi),獲取目標(biāo)輸出值:
(12)
對(duì)抗攻擊算法常用于修改輸入圖像以影響目標(biāo)分類能力,相應(yīng)裁剪迭代值為整型。而功率回溯機(jī)制基于對(duì)抗攻擊以獲取目標(biāo)輸出值的思想。
對(duì)此本文對(duì)基本迭代法的對(duì)抗攻擊過程進(jìn)行了相應(yīng)的改進(jìn),提出了一種基于動(dòng)量攻擊法(momentum iterative method, MIM)的潮流回溯機(jī)制:
1)梯度更新引入動(dòng)量迭代思想,在計(jì)算每次擾動(dòng)過程中,將動(dòng)量項(xiàng)整合到迭代攻擊中,通過梯度累加,確保了梯度更新方向的穩(wěn)定性,并刪除了符號(hào)函數(shù),來獲取潮流回溯功率:
(13)
(14)
式中:gt表示累計(jì)梯度;μ表示衰減因子。
2)由于功率回溯過程中僅在電壓幅值下引導(dǎo)學(xué)習(xí),而缺乏電壓相角,潮流回溯功率P、Q可能不是唯一解。因此將注入功率解耦,僅考慮與用戶異常用電行為更相關(guān)的有功功率回溯,保持系統(tǒng)無功不變的情況下,使之回溯變化量累加至有功變化量上,具體如下:
(15)
APFS-GMM是一個(gè)用于異常用電檢測的深度學(xué)習(xí)模型,其模型框架的具體結(jié)構(gòu)如圖4所示。
圖4 APFS-GMM模型結(jié)構(gòu)
主要由關(guān)聯(lián)潮流感知網(wǎng)絡(luò)和估計(jì)網(wǎng)絡(luò)2個(gè)模塊組成。具體而言,利用低壓配電網(wǎng)末端用戶側(cè)智能電表所采集的功率與電壓數(shù)據(jù)和包含臺(tái)區(qū)拓?fù)湫畔⒌泥徑泳仃囎鳛檎麄€(gè)模型的輸入;在關(guān)聯(lián)潮流感知網(wǎng)絡(luò)中引入圖注意力機(jī)制聚合網(wǎng)絡(luò)節(jié)點(diǎn)的關(guān)聯(lián)特征,將功率特征映射到電壓上,實(shí)現(xiàn)功率-電壓的潮流映射;然后引入潮流回溯機(jī)制,通過對(duì)抗攻擊方式回溯潮流功率,構(gòu)成輸入輸出關(guān)聯(lián)的潮流感知模型;最后在基于高斯混合模型的估計(jì)網(wǎng)絡(luò)中,將提取出的關(guān)聯(lián)潮流約束誤差特征作為異常用電特征,計(jì)算概率密度矩陣作為網(wǎng)絡(luò)輸出,相對(duì)于給定閾值來檢測異常用電。
本文為獲得具有代表性的異常用電差異性特征,根據(jù)異常用電行為引起的電表數(shù)據(jù)變化的特點(diǎn),以關(guān)聯(lián)聚合的潮流映射網(wǎng)絡(luò)和動(dòng)量迭代攻擊的潮流回溯網(wǎng)絡(luò)的相互作用,共同構(gòu)建了關(guān)聯(lián)潮流感知網(wǎng)絡(luò),生成符合異常用電行為特點(diǎn)的誤差特征。
1)潮流映射網(wǎng)絡(luò)。
將拓?fù)溥B接信息編入潮流映射網(wǎng)絡(luò)中,通過在每個(gè)節(jié)點(diǎn)上執(zhí)行注意力機(jī)制,實(shí)現(xiàn)節(jié)點(diǎn)關(guān)聯(lián)電氣信息聚合,減小了潮流擬合的信息差,進(jìn)一步提升了潮流擬合精度,引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)輸入功率與電壓間的非線性函數(shù)映射。
2)潮流回溯網(wǎng)絡(luò)。
為了更好地應(yīng)對(duì)復(fù)雜多樣的異常用電手法引起的電氣量異常值,本文采用了一種動(dòng)量迭代攻擊算法回溯功率,將用戶量測電壓Vmea定為輸出目標(biāo),通過不斷迭代對(duì)抗攻擊網(wǎng)絡(luò)的輸入功率,使網(wǎng)絡(luò)輸出的潮流映射電壓Vmap有效地逼近于用戶量測電壓Vmea。
在迭代對(duì)抗攻擊過程中,正常用戶的有功回溯在合理誤差范圍內(nèi),而使得異常用電用戶的潮流回溯有功差異不斷增大,從而提取出了與異常負(fù)荷相關(guān)的功率變化特征。
異常用電數(shù)據(jù)引起的電氣狀態(tài)量異變不符合潮流約束,難以完整進(jìn)行潮流映射和潮流回溯的過程,產(chǎn)生的殘差特征將明顯偏離于正常用戶。本文基于GMM架構(gòu)設(shè)計(jì)了估計(jì)網(wǎng)絡(luò),對(duì)異常用電殘差特征計(jì)算在高斯混合模型中的權(quán)重概率,從而完成異常用電檢測。
為了讓估計(jì)網(wǎng)絡(luò)同時(shí)學(xué)習(xí)到兩類關(guān)聯(lián)特征,對(duì)感知數(shù)據(jù)的電壓映射誤差ΔV和功率回溯誤差ΔP進(jìn)行拼接(concatenate)生成殘差特征Z。將Z輸入估計(jì)網(wǎng)絡(luò)估計(jì)樣本的混合概率系數(shù)P∈RN×M。最后,根據(jù)模型的概率密度來計(jì)算竊電用戶的異常用電概率能量。具體計(jì)算步驟如下:
1)殘差特征Z的構(gòu)建:為了考慮每個(gè)樣本的映射誤差和回溯誤差,采用Euclidean距離和余弦距離計(jì)算誤差函數(shù),計(jì)算公式為:
(16)
(17)
式中:ZV、ZP分別為映射電壓誤差和回溯功率誤差;Cos(·)表示采用余弦距離計(jì)算誤差函數(shù);Euc(·)表示采用Euclidean距離計(jì)算誤差函數(shù)。
將2種計(jì)算誤差作為2個(gè)不同的特征分別級(jí)聯(lián)拼接構(gòu)造成最終的殘差特征Z:
Z=[ZV‖ZP]
(18)
2)混合概率系數(shù)P的計(jì)算:
P=softmax[MLP(Z,θm)]
(19)
式中:θm為估計(jì)網(wǎng)絡(luò)的參數(shù);MLP(Z,θm)為估計(jì)網(wǎng)絡(luò)的輸出特征;softmax為激活函數(shù)。
3)利用P計(jì)算估計(jì)網(wǎng)絡(luò)的參數(shù),計(jì)算公式為:
(20)
(21)
(22)
式中:φm、μm和Σm分別代表估計(jì)網(wǎng)絡(luò)的第m個(gè)分布的混合概率、均值和協(xié)方差。
4)樣本能量E(z)計(jì)算公式為:
(23)
估計(jì)網(wǎng)絡(luò)的輸出結(jié)果表示每個(gè)樣本服從于整體近似樣本分布的概率分布,它也是系統(tǒng)狀態(tài)量理論值和量測值的偏差與系統(tǒng)總體量測精度的偏離程度,可認(rèn)為是異常用電的可能性。
綜上,APFS-GMM模型的損失函數(shù)為:
(24)
式中:第一項(xiàng)是關(guān)聯(lián)潮流感知網(wǎng)絡(luò)的殘差;第二項(xiàng)是估計(jì)網(wǎng)絡(luò)的預(yù)測能量;第三項(xiàng)是防止協(xié)方差矩陣不可逆的懲罰項(xiàng)。
為了驗(yàn)證APFS-GMM模型用于異常用電檢測的有效性,本節(jié)采用浙江省某典型示范區(qū)數(shù)據(jù)作為原始數(shù)據(jù),分析了包含20個(gè)臺(tái)賬明確的配電臺(tái)區(qū),用戶3 000余戶的用電數(shù)據(jù),其中包括3個(gè)商業(yè)用戶臺(tái)區(qū)、5個(gè)農(nóng)村用戶臺(tái)區(qū)和12個(gè)城鎮(zhèn)居民用戶臺(tái)區(qū)。該數(shù)據(jù)集包含了從2019年3月至2019年4月共50天,用電數(shù)據(jù)采集頻率為15 min,總計(jì)4 800組功率與電壓的樣本數(shù)據(jù)。為提供足夠的異常用電數(shù)據(jù),在上述用電數(shù)據(jù)中,根據(jù)文獻(xiàn)[14]模擬了異常用電行為篡改智能電表數(shù)據(jù)的特征,生成異常用電數(shù)據(jù),來驗(yàn)證模型的有效性。本文提出的APFS-GMM模型在Pytorch-Geometric框架下實(shí)現(xiàn)。
異常用電檢測作為一個(gè)正負(fù)樣本不平衡的二分類問題,同時(shí)存在著嚴(yán)重的正負(fù)樣本不平衡問題,不能簡單地用準(zhǔn)確率來評(píng)判模型的性能。為了評(píng)價(jià)模型的性能,本文參考異常檢測領(lǐng)域相關(guān)成果,本文采用準(zhǔn)確率σACC、召回率Fr、F1指數(shù)F1-score和誤報(bào)率(false positive rate, FPR)kFPR作為評(píng)價(jià)指標(biāo)以衡量模型的性能,上述評(píng)估指標(biāo)(不包含誤報(bào)率)的值越大表示模型檢測性能越好。計(jì)算上述指標(biāo)的依據(jù)來源為異常用電檢測的混淆矩陣,如表1所示。
表1 異常用電檢測混淆矩陣
將上述4種情況對(duì)應(yīng)的用戶樣本數(shù)量設(shè)置為MTP、MTN、MFN和MFP。
采用準(zhǔn)確率σACC、召回率Fr、F1指數(shù)F1-score和誤報(bào)率kFPR作為檢測性能指標(biāo):
(25)
(26)
(27)
(28)
對(duì)于關(guān)聯(lián)特征聚合的圖神經(jīng)網(wǎng)絡(luò)層數(shù)的選擇,注意力層太少面臨特征聚合效果不明顯,太大則面臨特征退化的問題。具體的層數(shù)選擇通過對(duì)比1—4層模型的訓(xùn)練效果選擇最優(yōu)層數(shù)。注意力頭數(shù)的取值范圍為1~8,同樣根據(jù)訓(xùn)練結(jié)果進(jìn)行比選。
對(duì)于關(guān)聯(lián)感知的潮流映射任務(wù),本文選擇均方差(mean squared error, MSE)YMSE作為衡量模型的性能。
(29)
本文固定其他網(wǎng)絡(luò)層的結(jié)構(gòu),通過比較圖注意力網(wǎng)絡(luò)電壓映射能力與異常檢測性能指標(biāo)來確定GAT層的超參數(shù),實(shí)驗(yàn)結(jié)果如圖5所示。
圖5 GAT層的實(shí)驗(yàn)結(jié)果
由圖5(a)可知,僅單層的GAT網(wǎng)絡(luò)聚合關(guān)聯(lián)信息的能力較差,各項(xiàng)指標(biāo)上檢測效果不佳,兩層的GAT網(wǎng)絡(luò)可以有效地聚合各鄰接節(jié)點(diǎn)間的關(guān)聯(lián),但隨著更多GAT層的加入,準(zhǔn)確率、召回率、F1指數(shù)和FPR的性能指標(biāo)隨之逐步下降,同時(shí)在電壓均方差上也是兩層的GAT網(wǎng)絡(luò)損失最小,性能最優(yōu),因此本模型采用兩層的GAT網(wǎng)絡(luò)層。根據(jù)圖5(b)可知,注意力頭數(shù)為4時(shí),模型關(guān)聯(lián)感知性能最優(yōu),相應(yīng)的電壓映射均方差最小,與此同時(shí)的異常檢測F1指數(shù)最優(yōu)。關(guān)聯(lián)感知網(wǎng)絡(luò)中圖注意力參數(shù)設(shè)置如表2所示。
表2 關(guān)聯(lián)潮流感知網(wǎng)絡(luò)參數(shù)
估計(jì)網(wǎng)絡(luò)學(xué)習(xí)輸入殘差特征Z的分布特性,通過softmax激活函數(shù)輸出樣本的混合概率系數(shù)矩陣P。同時(shí)在網(wǎng)絡(luò)中添加Dropout層防止估計(jì)網(wǎng)絡(luò)發(fā)生過擬合[34]。最后,在CA-GMM中采用Adam優(yōu)化,批處理量為20,學(xué)習(xí)率為0.001,λ1=0.1,λ2=0.005,迭代次數(shù)為5 000,估計(jì)網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)如表3所示。
表3 估計(jì)網(wǎng)絡(luò)參數(shù)設(shè)置
4.3.1 GAT網(wǎng)絡(luò)潮流映射能力
為了驗(yàn)證模型中圖注意力網(wǎng)絡(luò)的電壓映射能力的有效性,本文還嘗試了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)和多層感知機(jī)(multilayer perceptron,MLP)這2種網(wǎng)絡(luò)作為潮流映射的神經(jīng)網(wǎng)絡(luò),并與GAT模型進(jìn)行對(duì)照,關(guān)聯(lián)感知網(wǎng)絡(luò)和估計(jì)網(wǎng)絡(luò)的其他模塊保持相同。CNN網(wǎng)絡(luò)采用文獻(xiàn)[31]的輸入構(gòu)成方式進(jìn)行對(duì)比。
各模型經(jīng)過充分訓(xùn)練后,采用城鎮(zhèn)居民用戶臺(tái)區(qū)4月1日到10日的960組數(shù)據(jù)作為驗(yàn)證集,各模型的電壓擬合結(jié)果如圖6所示。
圖6 不同模型下電壓擬合誤差曲線
在潮流映射電壓擬合效果上,MLP網(wǎng)絡(luò)并不完全收斂,電壓映射誤差較大;CNN網(wǎng)絡(luò)通過提取鄰近節(jié)點(diǎn)的局部特征,具有相對(duì)有效的電壓映射能力;GAT網(wǎng)絡(luò)通過嵌入鄰接矩陣信息,提升了模型的感知視野,進(jìn)一步聚合關(guān)聯(lián)節(jié)點(diǎn)的信息,提高了電壓映射能力,測試集上電壓映射誤差小于0.005,可以滿足異常用電檢測任務(wù)的性能要求。
4.3.2 殘差特征可視化
為了體現(xiàn)模型學(xué)習(xí)過程中殘差特征的嵌入質(zhì)量,本文選用tSNE工具對(duì)估計(jì)網(wǎng)絡(luò)的誤差特征輸入量進(jìn)行可視化展示,結(jié)果如圖7所示。
圖7 基于tSNE的誤差特征可視化
APFS-GMM模型由于借助于鄰接矩陣提供的全局視野,進(jìn)行了關(guān)聯(lián)特征聚合過程,提取到有效的電壓殘差特征,同時(shí)增加了回溯功率的殘差特征,將用電數(shù)據(jù)進(jìn)行更有效地區(qū)分,從可視化圖中,異常樣本聚集明顯且能夠與正常樣本分離,為后續(xù)的異常檢測提供了有效的輸入特征。
4.3.3 與其他算法的對(duì)比
為了驗(yàn)證APFS-GMM模型的異常用電檢測性能,選取浙江省某區(qū)域50個(gè)有異常用電記錄的臺(tái)區(qū)歷史用電數(shù)據(jù),根據(jù)異常用電方法(分壓法、分流法、移相法等)[14]和電力公司稽查確認(rèn)的異常用電用戶案例為依據(jù),構(gòu)建相應(yīng)的異常用電用戶數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)集,給予相應(yīng)的異常用電用戶標(biāo)簽,標(biāo)簽只用于驗(yàn)證模型結(jié)果,不參與模型訓(xùn)練。將各種檢測方法按不同異常用電方法進(jìn)行分類檢測,其異常用電檢測結(jié)果如表4所示。
表4 不同模型的異常用電行為檢測結(jié)果
由表4可知,與傳統(tǒng)的利用日用電量曲線等負(fù)荷時(shí)間序列的辨識(shí)方法相比,本文所提AFPS-GMM異常用電檢測模型的準(zhǔn)確率σACC接近1,有很好的辨識(shí)效果,且誤報(bào)率kFPR十分接近0,較低的誤報(bào)率更有利于電力公司稽查效率的提高。相應(yīng)的F1指數(shù)F1-score和召回率Fr都接近1,異常檢測性能表現(xiàn)具有一定的優(yōu)勢。APFS-GMM模型不會(huì)受到用戶負(fù)荷隨機(jī)波動(dòng)與特殊用戶不尋常用電習(xí)慣的影響,所提出的差異性指標(biāo)更符合異常用電行為特征。
4.3.4 多目標(biāo)異常用電檢測能力分析
為了驗(yàn)證APFS-GMM模型在同時(shí)段出現(xiàn)多個(gè)異常用電用戶時(shí)的檢測性能。本文設(shè)置在不同用戶規(guī)模下,同時(shí)出現(xiàn)3、4、5、6和7個(gè)異常用電用戶時(shí)進(jìn)行異常用電檢測,檢測結(jié)果如圖8所示。
圖8 多目標(biāo)異常用電檢測結(jié)果
由圖8可知,當(dāng)臺(tái)區(qū)內(nèi)同時(shí)段異常用電用戶數(shù)維持在3~4戶時(shí),APFS-GMM模型以較高F1指數(shù)和較低誤報(bào)率檢測出相應(yīng)的異常用戶;當(dāng)用戶數(shù)攀升至5戶往上時(shí),在小規(guī)模臺(tái)區(qū)的檢測性能相對(duì)可靠,但隨著檢測規(guī)模的擴(kuò)大,相應(yīng)檢測性能也有明顯下降。
為驗(yàn)證在各類型臺(tái)區(qū)下的多目標(biāo)檢測能力,選擇了3種不同類別用戶的臺(tái)區(qū)進(jìn)行試驗(yàn),試驗(yàn)結(jié)果如表5所示。
表5 不同類型臺(tái)區(qū)多目標(biāo)檢測能力
其中最小F1-score與最大kFPR皆為異常用戶增多至9個(gè)時(shí)所對(duì)應(yīng)的值,可以發(fā)現(xiàn)APFS-GMM的多目標(biāo)檢測能力約為3個(gè)。同時(shí)異常用電行為用戶只占極少一部分,單個(gè)臺(tái)區(qū)同時(shí)段內(nèi)發(fā)生3個(gè)以上異常用戶的概率幾乎為0。在不同臺(tái)區(qū)下,APFS-GMM的多目標(biāo)檢測能力的魯棒性均較為顯著。
4.3.5 APFS-GMM的拓?fù)渥儎?dòng)適應(yīng)性校驗(yàn)
為了測試APFS-GMM在臺(tái)區(qū)拓?fù)渥儎?dòng)情況的適應(yīng)性,本文與文獻(xiàn)[31]的電壓擬合卷積模型從網(wǎng)絡(luò)拓?fù)渥儎?dòng)方面進(jìn)行對(duì)比驗(yàn)證。
在臺(tái)賬明確的配電臺(tái)區(qū)中選用3號(hào)農(nóng)村用戶臺(tái)區(qū),APFS-GMM與擬合CNN模型在拓?fù)渥儎?dòng)前進(jìn)行充分訓(xùn)練,學(xué)習(xí)相應(yīng)的潮流映射過程,在仿真環(huán)境下將10、18號(hào)用戶改接入6號(hào)用戶所處支路重新計(jì)算潮流,同時(shí)15、25號(hào)用戶屬于異常用電用戶,測試結(jié)果如圖9所示。
圖9 拓?fù)渥儎?dòng)下的異常用電檢測能力對(duì)比
在3號(hào)臺(tái)區(qū)中,將異常概率能量大于0.5的用戶視為異常用電用戶。拓?fù)渥儎?dòng)前后,APFS-GMM通過更新鄰接矩陣,與擬合CNN依賴于相鄰用戶順序編號(hào)的輸入量對(duì)比,掌握了一定的拓?fù)渥儎?dòng)信息,仍能準(zhǔn)確地進(jìn)行關(guān)聯(lián)潮流感知,具有較好的拓?fù)渥儎?dòng)適應(yīng)性。
為了從信息耦合的電力數(shù)據(jù)中挖掘出潛在的異常用電用戶,提高現(xiàn)場稽查異常用電的準(zhǔn)確性,提出了針對(duì)智能電表數(shù)據(jù)感知校驗(yàn)的異常用電檢測方法,得到如下結(jié)論:
1)分析了異常用電行為后系統(tǒng)狀態(tài)產(chǎn)生的變化特征,建立起異常用電與智能電表量測數(shù)據(jù)異常間關(guān)聯(lián)性,提高了方法的異常預(yù)警能力。
2)由于配電網(wǎng)異常用電行為產(chǎn)生的異常電氣數(shù)據(jù)存在耦合關(guān)聯(lián)性,本文提出了APFS-GMM模型進(jìn)行異常用電檢測,重點(diǎn)研究了神經(jīng)網(wǎng)絡(luò)等值潮流模型與潮流回溯機(jī)制,實(shí)現(xiàn)了對(duì)用戶側(cè)潮流數(shù)據(jù)的關(guān)聯(lián)感知,挖掘了受潮流約束的異常用電關(guān)聯(lián)殘差特征進(jìn)行異常檢測。
3)與其他方法相比較,APFS-GMM對(duì)電壓功率的異常用電特征進(jìn)行關(guān)聯(lián)建模,提取出受潮流約束的關(guān)聯(lián)殘差特征,最大化保留了原始數(shù)據(jù)信息,在實(shí)際應(yīng)用中適用于多種類型用戶臺(tái)區(qū)檢測,具有更好的準(zhǔn)確率,對(duì)異常用電用戶可準(zhǔn)確辨識(shí),為配網(wǎng)異常用電檢測與分析提供了全新有效的方案。