薛 陽,張蓬鶴,楊藝寧,宋如楠,彭彥林,趙海森
(1. 中國電力科學(xué)研究院有限公司,北京市 100192;2. 國網(wǎng)重慶市電力公司,重慶市 400015;3. 新能源電力系統(tǒng)國家重點實驗室(華北電力大學(xué)),北京市 102206)
電力系統(tǒng)中的竊電行為是用戶通過一定的技術(shù)手段和工具,非法篡改電能表或者侵入量測系統(tǒng),導(dǎo)致用電量或電費低于其實際使用量[1]。固定比例竊電指的是用戶竊電量和總電量的比值是不隨時間變化的常量,因此是一種線性的攻擊方式。大多數(shù)篡改電能表硬件的竊電手法,如欠壓法、欠流法,均表現(xiàn)為固定比例竊電[2]。雖然最近也出現(xiàn)了一些針對電網(wǎng)信息流的非線性竊電方式,但是這些高科技竊電所涉及的技術(shù)門檻較高,在竊電成本和普及范圍等方面遠(yuǎn)不如固定比例竊電。而近年來,用戶竊電行為呈現(xiàn)團(tuán)體化、群體化的趨勢。因此,群體性固定比例竊電是電網(wǎng)公司反竊電工作中所面臨的最主要竊電方式。
當(dāng)前的竊電檢測方法大致可以分為3 類[3]:基于博弈論、基于用電行為模式和基于系統(tǒng)狀態(tài)的方法。第1 類方法將竊電問題描述成竊電用戶與電力供應(yīng)商之間的博弈,通過分析正常和竊電用戶在用電量分布上的差異,實現(xiàn)竊電檢測[4]。該方法的主要問題在于建模難度較大。第2 類方法假設(shè)竊電用戶的用電模式偏離正常用戶的用電模式,通常采用分類和聚類等人工智能技術(shù)(例如基于支持向量機(jī)[5]、卷積神經(jīng)網(wǎng)絡(luò)[6]和其他神經(jīng)網(wǎng)絡(luò)法[7-8]等)來分析用電數(shù)據(jù)。這類方法需要大量可靠的訓(xùn)練樣本,同時會受到樣本污染[9]的影響。而聚類方法不需要帶標(biāo)簽的訓(xùn)練樣本,重點關(guān)注數(shù)據(jù)中的離群信息。文獻(xiàn)[10]和文獻(xiàn)[11]分別采用基于密度和噪聲應(yīng)用的空間聚類(density-based spatial clustering of applications with noise,DBSCAN)法和密度峰值快速搜索(clustering by fast search and find of density peaks,CFSFDP)法計算待檢用戶的異常度。聚類方法的問題是不擅長檢測出固定比例的竊電用戶。第3 類方法利用竊電行為會打破數(shù)據(jù)協(xié)同性[3]這一現(xiàn)象來檢測竊電用戶[12-13]。文獻(xiàn)[14]和文獻(xiàn)[15]利用三相狀態(tài)估計來檢測繞越用戶。此類方法雖然能夠檢測固定比例的竊電用戶,但是需要實時掌握配電網(wǎng)的精細(xì)拓?fù)浼皡?shù)。
目前,針對固定比例竊電最有效的檢測方法是基于相關(guān)性分析的方法。該方法采用數(shù)據(jù)集中器記錄一個臺區(qū)內(nèi)所有用戶的總用電量。文獻(xiàn)[16]通過求解一組欠定線性方程來檢測固定比例竊電用戶。文獻(xiàn)[17]采用最大信息系數(shù)(maximum information coefficient,MIC)檢 測 與 非 技 術(shù) 性 損 失(nontechnical loss,NTL)相關(guān)性強(qiáng)的竊電用戶。該方法擅長檢測單個固定比例的竊電用戶,在面對群體性的固定比例竊電時容易出現(xiàn)漏判。
為了克服上述方法的局限性,本文提出了一種基于線損協(xié)方差分析(line loss covariance,LLC)的竊電檢測方法,主要工作為:1)建立了固定比例竊電用戶電量和NTL 之間的數(shù)學(xué)模型,并發(fā)現(xiàn)了兩者的相關(guān)性存著一種遞增現(xiàn)象;2)把對群體性固定比例竊電的檢測問題轉(zhuǎn)化一個組合優(yōu)化問題,并提出了求解該組合優(yōu)化問題的尋優(yōu)算法;3)利用中國某省電力公司提供的實測數(shù)據(jù)和竊電模擬實驗平臺生成的竊電數(shù)據(jù)進(jìn)行了數(shù)值試驗,結(jié)果表明LLC 方法對于群體性固定比例竊電場景具有較好的準(zhǔn)確度和穩(wěn)定性。
典型的10 kV 配電網(wǎng)結(jié)構(gòu)如附錄A 圖A1 所示。其中,關(guān)口變壓器同時向多個臺區(qū)供電,每一個臺區(qū)包含一組鄰近的用戶。本文提出的方法適用于安裝了數(shù)據(jù)集中器的臺區(qū),得益于線路拓?fù)涞姆€(wěn)定和集中器本身的安全,集中器記錄的電量是臺區(qū)內(nèi)所有用戶真實電量的累加。在這種情況下,臺區(qū)的NTL就可直接由集中器記錄的電量Wt減去全體用戶的表計電量計算得出,表達(dá)式為:
式中:A為臺區(qū)全體用戶組成的集合;u~i,t為用戶i在t時段的表計電量;Wt為t時段臺區(qū)集中器記錄的表計電量;ωt為臺區(qū)t時段NTL。
對于沒有安裝數(shù)據(jù)集中器的臺區(qū),其NTL 可以通過文獻(xiàn)[18]和文獻(xiàn)[19]中的損耗估計算法間接求得。這種情形下,本文方法仍然適用。
現(xiàn)假設(shè)臺區(qū)內(nèi)存在若干竊電用戶,記全體竊電用戶組成的集合為C,其元素數(shù)量為m;同時記剩余正常用戶的集合為B,其元素數(shù)量為n。本文重點探討的問題是:當(dāng)C只包含固定比例的竊電用戶時,怎樣準(zhǔn)確檢測出這些竊電用戶。
假設(shè)用戶i∈C,且真實用電量為ui,t。如果用戶i是一個固定比例的竊電用戶,其攻擊方式是線性的,表達(dá)式為:
式 中:αi為 用 戶i的 表 計 電 量u~i,t與 真 實 電 量ui,t的 比值,且ai∈(0,1),它是一個不隨時間變化的常量,取值與用戶i具體實施的竊電手法有關(guān)。
而當(dāng)C只包含固定比例的竊電用戶時,由這群用戶產(chǎn)生的NTL 為:
式中:i∈C;βi=1/αi-1,為竊電用戶i電能表少記的電量與表計電量的比值。由于ai∈(0,1),故βi∈(0,+∞)。
把一天T個時間段的NTL 和用戶表計電量向量化,得到對應(yīng)的NTL 向量ω=[ω1,ω2,…,ωT]T和 表 計 電 量 向 量=[,,…,]T,由 式(3)可得:
上式表明,當(dāng)C只包含固定比例的竊電用戶時,臺區(qū)的NTL 向量ω可以由這群竊電用戶的表計向量線性表示,表示系數(shù)為βi。因此,可以認(rèn)為ω與竊電用戶|i∈C的相關(guān)性遠(yuǎn)大于其與正常用戶′|i′∈B的 相關(guān)性,表達(dá)式為:
式中:F(·)為相關(guān)性函數(shù)。
當(dāng)臺區(qū)內(nèi)只有單個固定比例竊電用戶時,式(5)是嚴(yán)格成立的。但當(dāng)臺區(qū)內(nèi)存在多個固定比例竊電用戶時,由于NTL 向量是由這群竊電用戶共同決定,可能導(dǎo)致某些情況下,式(5)不一定成立。以附錄A 圖A2 中包含4 個固定比例竊電用戶的臺區(qū)為例,這4 個竊電用戶的電量曲線與臺區(qū)的NTL 曲線在形態(tài)上并不相似。同時,附錄A 表A1 的皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC)也表明單個竊電用戶的u~i與ω之間的線性相關(guān)性并不強(qiáng)。在這種情況下,如果仍然按照相關(guān)性的強(qiáng)弱來檢測竊電用戶,將出現(xiàn)嚴(yán)重漏判。
臺區(qū)NTL 向量ω和組合向量u~C將具有很強(qiáng)的相關(guān)性。此外,附錄A 表A1 的數(shù)據(jù)顯示,竊電用戶表計電量每疊加一次,疊加后的向量與ω的相關(guān)性也越來越強(qiáng),即出現(xiàn)遞增現(xiàn)象,如式(7)所示。
式中:Fp(·)為皮爾森相關(guān)性函數(shù)。
如果式(7)所示的遞增現(xiàn)象不是個例,就可以用來檢測群體性固定比例竊電用戶。在利用上述遞增現(xiàn)象來檢測竊電用戶之前,首先要分析其成立的前提條件。為了便于分析,需要將所有的向量按照下式進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化后的NTL 向量ω*和表計向量,表達(dá)式為:
式中:x*為標(biāo)準(zhǔn)化后的向量;x為標(biāo)準(zhǔn)化前的向量;xh為向量x的第h個的元素;max {xh}為x中最大元素的值。
標(biāo)準(zhǔn)化處理使得所有向量具有同一量綱,協(xié)方差的大小也能夠衡量向量之間線性相關(guān)性的強(qiáng)弱[20]。因此,對式(7)成立性的分析可以轉(zhuǎn)變成對式(9)的證明,表達(dá)式為:
式中:Fcov(·)為協(xié)方差函數(shù);上標(biāo)*表示標(biāo)準(zhǔn)化后的向量。
綜上,如果任意2 個固定比例竊電用戶的表計電量正相關(guān),隨著竊電用戶表計電量逐漸疊加,它們與NTL 的相關(guān)性也越來越強(qiáng)。盡管滿足這種遞增現(xiàn)象是需要一定條件,但從工程實用角度出發(fā),依據(jù)這一現(xiàn)象進(jìn)行竊電檢測是可行的。
根據(jù)1.3 節(jié)的分析,當(dāng)式(15)的條件滿足時,固定比例竊電用戶具有遞增性,但這種遞增性并不是固定比例竊電用戶所獨有的。為了準(zhǔn)確檢測出C,還需要另一個關(guān)于固定比例竊電用戶特性的有用信息。
記用戶集合A中任意一個具有1.3 節(jié)所述遞增性質(zhì)的子集為P*,即存在著一種排序,使得P*中的用戶按照這種順序依次疊加,疊加后的表計向量與NTL 向量ω*的相關(guān)性越來越強(qiáng)。為了便于表示,將集合P*全體用戶的表計向量疊加起來得到的組合向量記為,即:
顯然,當(dāng)式(15)條件滿足時,集合C也是一個P*。由于ω*與竊電用戶的滿足線性方程(11),可以認(rèn)為竊電用戶集合CR中的竊電用戶電量全部疊加后與ω*的協(xié)方差Fcov(ω*,)近似為所有P*中Fcov(ω*,)的最大值,表達(dá)式為:
基于式(17),可以把對C的檢測問題轉(zhuǎn)化為下述優(yōu)化問題:從所有具有上述遞增性的用戶集合P*中,找到使得Fcov(ω*,)最大的集合,具體表達(dá)式如式(18)所示。
當(dāng)式(15)的條件滿足時,問題(18)的解P*max就近似為C。
4)終止條件:在k階尋優(yōu)后,如果k=m+n-1,說明尋優(yōu)過程已經(jīng)遍歷完所有用戶,尋優(yōu)終止;或者,在k階尋優(yōu)后,在進(jìn)行k+1 尋優(yōu)時,如果不存在k+1 階遞增路徑,說明協(xié)方差已不再增加,尋優(yōu)終止。
在應(yīng)用過程中,上述方法還需要考慮2 個實際問題。
第1 個問題是檢測耗時。LLC 方法耗時主要取決于2 個因素:待檢用戶數(shù)量,即集合A的大?。灰约白訂栴}最優(yōu)解搜尋過程中,對應(yīng)的搜尋終止階數(shù)。由于待檢用戶總數(shù)是無法控制的,為了提高LLC 方法在不同規(guī)模數(shù)據(jù)中的適用性,可以適當(dāng)松弛2.1 節(jié)中的終止條件。通過設(shè)置一個可調(diào)節(jié)的終止階數(shù)K,把終止條件改寫為:在k階尋優(yōu)后,如果k=K-1,則尋優(yōu)終止;或者在k階尋優(yōu)后,在進(jìn)行k+1 尋優(yōu)時,如果不存在k+1 階遞增路徑,則尋優(yōu)終止。這一調(diào)整使得每一個包含的用戶數(shù)量不超過K個。與原始終止條件相比,上述處理大幅提高了整體尋優(yōu)效率。在4.2 節(jié)中,比較了LLC 方法(有和沒有K)與其他算法在用時方面的性能。
第2 個問題是當(dāng)待檢用戶中含有非固定比例的竊電用戶時,LLC 方法可能失效。為此,需要在LLC 的計算流程中增加一道閉鎖環(huán)節(jié),以規(guī)避這一問題。需要說明的是,隨著非固定比例竊電用戶數(shù)量的增加,和ω*將不再滿足式(11)所示的線性方程,LLC 搜尋得到的與ω*的線性相關(guān)性也越來越弱。附錄A 表A2 中Fcov(ω*,)和Fp(ω*,)的變化也體現(xiàn)了這一結(jié)論,其中為最優(yōu)解的表計 向 量。 因 此,可 以 利 用Fcov(ω*,) 和Fp(ω*,)來判別分析的場景是否為固定比例竊電場景。由于皮爾森相關(guān)性系數(shù)的取值范圍固定在[-1,1]之間,F(xiàn)p(ω*,)更適合作為LLC 目標(biāo)場景的判斷標(biāo)準(zhǔn)。設(shè)定閾值θ,當(dāng)Fp(ω*,)>θ時,認(rèn)為分析的場景以固定比例竊電為主,輸出嫌疑用戶集合Csus=Pmax;當(dāng)Fp(ω*,)≤θ時,認(rèn)為分析對象不是目標(biāo)場景,為了避免算法失效,輸出Csus=?,閉鎖LLC。為了在實際未知的情況下取得較好的檢測效果,本文在經(jīng)過大量的試驗后建議θ取值范圍為0.96~0.98。
基于上述原理和求解過程,本文提出了LLC 在實際情景下的檢測框架,由預(yù)處理環(huán)節(jié)、檢測環(huán)節(jié)和判斷環(huán)節(jié)組成,如附錄A 圖A3 所示。
假設(shè)某臺區(qū)包含了用戶M天的表計電量數(shù)據(jù),對每一個用戶i,預(yù)處理環(huán)節(jié)把第d天的表計電量向量化得到u~i,d。然后由式(4)計算臺區(qū)的NTL 并向量化,得到每d天的NTL 向量ωd,并按式(8)對所有向量進(jìn)行標(biāo)準(zhǔn)處理得到和。
最后按嫌疑度γi大小降序排列,得到待檢用戶的嫌疑度排名pi。最終選擇排名最靠前的若干個用戶進(jìn)行現(xiàn)場稽查。
1)正常數(shù)據(jù)集
采用中國某省電力公司提供的用電數(shù)據(jù)作為正常數(shù)據(jù)集來進(jìn)行數(shù)值試驗,該數(shù)據(jù)集的信息如附錄A 表A3 所示。因該數(shù)據(jù)集所有用戶均來自線損率低于3%的臺區(qū),可以認(rèn)為均為正常用戶。該數(shù)據(jù)集包含3 000 個單相用戶和500 個三相用戶285 d(2019 年4 月1 日—2019 年12 月31 日)的電壓、電流、功率因數(shù)、用電量等用電數(shù)據(jù),所有數(shù)據(jù)每15 min 記錄一次。
2)竊電數(shù)據(jù)集
依托竊電仿真模擬實驗平臺(electricity theft emulator,ETE)對正常數(shù)據(jù)進(jìn)行竊電改造,生成驗證所需的竊電數(shù)據(jù)集。該平臺結(jié)構(gòu)如附錄A 圖A4所示,它主要由負(fù)載、負(fù)載控制區(qū)和電能表區(qū)3 個部分組成,是一個物理仿真實驗平臺。在生成竊電數(shù)據(jù)時,通過負(fù)載控制界面輸入正常用戶電壓、電流和功率因數(shù)的時間序列,負(fù)載可以模擬該用戶的真實用電過程。同時,負(fù)載的用電數(shù)據(jù)將被電能表記錄并上傳。如果電能表被篡改,如電流線圈欠流,該電能表所記錄的數(shù)據(jù)就是該用戶采用欠流法進(jìn)行竊電的竊電數(shù)據(jù)。通過復(fù)現(xiàn)真實場景中存在的各種改表方式,該平臺能夠準(zhǔn)確且靈活地模擬各種真實的物理竊電手法。由該平臺生成的部分竊電樣本如附錄A 圖A5 所 示。
本文主要采用欠壓法、欠流法和部分移相法等固定比例的竊電手法來生成試驗所需要的竊電數(shù)據(jù),相關(guān)竊電手法的具體實現(xiàn)方式可參見文獻(xiàn)[2]。
采用廣泛應(yīng)用于機(jī)器學(xué)習(xí)領(lǐng)域分類評估的2 種指標(biāo)對檢測結(jié)果的準(zhǔn)確度進(jìn)行評價:曲線下方面積(aera under curve,AUC)和 平 均 查 準(zhǔn) 度(mean average precision,MAP)。
AUC 指的是受試者工作特性(receiver operating characteristic,ROC)曲線下方的面積。ROC 曲線是查全率(true positive rate,TPR)和誤報率(false positive rate,F(xiàn)PR)隨模型閾值變化的軌跡。除了繪制ROC 曲線外,還可以直接計算AUC[21],表達(dá)式為:
式 中:Eauc為AUC 的 數(shù) 值,且Eauc∈(0,1);m和n分別為竊電用戶數(shù)量和正常用戶數(shù)量。Eauc越接近1,檢測效果越好。與FPR 和TPR 相比,AUC 能更加綜合地表征模型的檢測特性及檢測準(zhǔn)確度。
MAP 常應(yīng)用于評價信息檢索的準(zhǔn)確度[22]。為了計算MAP,先定義查準(zhǔn)率為:
式中:s為排名最靠前的若干用戶中,最后一個用戶的排名;y為排名最靠前的s個用戶中竊電用戶的數(shù)量;f(s)為查準(zhǔn)率,代表排名最靠前的s個用戶中竊電用戶的占比。
然后,按照式(24)計算MAP 的值:
式中:Emap(R)為MAP 的值,且Emap∈[0,1];r為排名最靠前的R個用戶中竊電用戶的數(shù)量;si為排名最靠前的R個用戶中第i個竊電用戶的排名。
可以看出Emap(R)衡量的是竊電用戶在輸出的嫌疑名單中靠前的程度:竊電用戶排名越靠前,Emap(R)的值就越接近1;反之,如果輸出的前R個用戶中沒有竊電用戶,則Emap(R) 為0。當(dāng)然,Emap(R)的大小也與R的取值有關(guān)。本文取R為40來評價檢測方法的準(zhǔn)確率。需要說明的是,本文在計算Eauc和Emap(40)時所使用的排名均為2.3 節(jié)按嫌疑度γi降序排列得到的pi。
為了分析LLC 方法的優(yōu)勢及不足,選擇其他幾種相關(guān)性分析方法和基于用電行為模式的檢測方法進(jìn)行對比:
1)PCC[23]:可以表征2 個變量的線性相關(guān)程度,PCC 越大,竊電嫌疑越高。
2)MIC[23]:可有效表征2 個變量非線性相關(guān)程度的量度,以MIC 作為竊電嫌疑度,MIC 越大,竊電嫌疑越高。
3)CFSFDP[24]:一種新型的基于密度和距離的聚類算法,文獻(xiàn)[16]將這一算法改造成離群點檢測算法用于竊電辨識。本文以文獻(xiàn)[16]改造后的CFSFDP 作為對比方法。
4)局部離群因數(shù)(local outlier factor,LOF)[25]:經(jīng)典的基于局部密度的離群點檢測方法,LOF 值越大竊電嫌疑越高。
在第1 組試驗中,首先選擇61 d 的數(shù)據(jù),將500 個三相用戶均分成10 組,代表10 個供電臺區(qū)。每個臺區(qū)選擇5 個用戶進(jìn)行竊電改造。改造的竊電手法從3.1 節(jié)的幾種固定比例的竊電方式中隨機(jī)選取。最終,每個臺區(qū)竊電用戶占比為10%。此外,為了說明NTL 和用戶表計電量的隨機(jī)分布特性,附錄A 圖A6 展示了其中一個臺區(qū)5 個竊電用戶表計電量和NTL 的平均頻率分布直方圖與核密度分布。
通過臺區(qū)的隨機(jī)構(gòu)造和竊電用戶的隨機(jī)選取,進(jìn)行了100 次重復(fù)試驗。5 種方法在100 次試驗中的最優(yōu)得分如表1 所示。5 種方法在100 次試驗中Eauc和Emap(40)的平均值如圖1(a)所示。由表1 和圖1(a)可以看出,基于用電行為模式方法最高的Emap(40) 僅為0.323,而相關(guān)性分析方法最低的Emap(40)高達(dá)0.737,同時,2 類方法Eauc的得分也相差懸殊。這說明后者在固定比例竊電檢測中的優(yōu)越性。進(jìn)一步分析在3 種相關(guān)性分析方法中,LLC 的Eauc和Emap(40) 都在0.95 以上,其得分在PCC(0.787,0.758)和MIC(0.768,0.737)的基礎(chǔ)上提升了約25%,表明LLC 提高了這一類方法對群體性固定比例竊電用戶的檢測能力。
表1 試驗1 的5 種檢測方法的最優(yōu)結(jié)果Table 1 Optimal results of five detection methods for test 1
5 種方法在100 次試驗中Eauc和Emap(40)的標(biāo)準(zhǔn)差如圖1(b)所示。可以看出,雖然LLC 的標(biāo)準(zhǔn)差略高于CFSFDP 和LOF,但是相比另外2 種相關(guān)性分析方法,LLC 在固定比例竊電場景下的檢測穩(wěn)定性具有更佳的檢測穩(wěn)定性。
圖1 試驗1 評估結(jié)果Fig.1 Evaluation results of test 1
試驗2 主要測試5 種方法在不同規(guī)模待檢樣本下的檢測耗時。 選擇3 種不同的數(shù)據(jù)規(guī)模:15 500 條、30 500 條 和76 500 條,分 別 對 應(yīng)500 個 三相用戶31 d、61 d 和153 d 的負(fù)荷數(shù)據(jù)。同時,為了評估終止階數(shù)K對LLC 方法檢測耗時和檢測準(zhǔn)確率的影響,設(shè)置了不同終止階數(shù)(K=20、15、10、5、3)。其余設(shè)置依然效仿試驗1。測試平臺為一臺CPU 型號為AMD Ryzen 95900(主頻為4.7 GHz),內(nèi)存容量為64 GB的臺式機(jī)。5種方法都是基于Python 3.8,它們各自的檢測用時及準(zhǔn)確率指標(biāo)如圖2 所示。
圖2 試驗2 評估結(jié)果Fig.2 Evaluation results of test 2
可以看出,MIC 和PCC 在不同規(guī)模待檢樣本中的檢測用時均低于25 s,是5 種方法中用時最少的。與之相對應(yīng),LLC 處理完76 500 條待檢樣本耗時為93.75 s,幾乎是MIC 時長的5 倍。而隨著數(shù)據(jù)規(guī)模的增加,LLC 的檢測用時逐漸倍增。上述結(jié)果表明,在處理大規(guī)模的待檢樣本時,LLC 確實面臨著嚴(yán)重的耗時問題。
為了解決LLC 的這一問題,設(shè)置了可供調(diào)節(jié)的終止階數(shù)K。從圖2 可知,隨著階數(shù)K從20 減少至3,LLC 的檢測用時也逐漸降低。同時,LLC 的Emap(40)和Eauc在整個過程中并沒有顯著下降,甚至在K=3 時,LLC 的Emap(40)仍然保持在0.85 以上。這一結(jié)果表明,可以通過設(shè)置終止階數(shù)把LLC 的檢測用時控制在合理的水平而不會引起檢測準(zhǔn)確率的顯著降低。
為了進(jìn)一步探究固定比例竊電用戶數(shù)量的變化對不同檢測方法的影響,在保證每個臺區(qū)用戶總數(shù)不變的情況下,將竊電用戶數(shù)量從2 增加到16(步長為2),這一過程中不同方法的檢測結(jié)果如圖3 所示。可以看出,當(dāng)竊電用戶數(shù)量較少時,3 種相關(guān)性分析方法都具有很高的檢測準(zhǔn)確度;隨著竊電用戶的增加,PCC 和MIC 的Eauc迅速下降,且與LLC 的得分逐漸拉開。整個過程中,PCC 和MIC 的Eauc降幅分別為0.231 和0.251,而LLC 的降幅只有0.111;三者的Emap(40)也具有類似的變化。這表明此類用戶群體性竊電的確會給PCC 和MIC 的檢測準(zhǔn)確度帶來負(fù)面影響,且隨著竊電用戶數(shù)量的增加,這種負(fù)面影響會進(jìn)一步加劇。LLC 得分雖然也有所降低,但總體依然保持在很高的水平,表明LLC 在此場景下優(yōu)越的檢測能力。因此,基于用電行為模式方法的Eauc和Emap(40)對竊電用戶數(shù)量的變化并不敏感。
圖3 隨固定比例竊電用戶數(shù)量變化的評估結(jié)果Fig.3 Evaluation results of changes with number of fixedratio electricity-theft users
1.3 節(jié)的分析證明了在所有竊電用戶電量曲線都正相關(guān)時,LLC 輸出嫌疑用戶集合Csus必定包含竊電用戶集合CR。但仍需考慮當(dāng)竊電用戶不滿足給定條件或滿足程度不同時,LLC 是否還具備相應(yīng)的能力。為此,本節(jié)以平均余弦相似度作為衡量竊電用戶電量曲線相關(guān)性強(qiáng)弱的指標(biāo)。平均余弦相似度是一群竊電用戶電量兩兩余弦相似度的算術(shù)平均值。它的大小及正負(fù)可以表征群竊電用戶是否滿足式(15)及滿足的程度。本節(jié)選取10 組具有不同平均余弦相似度的用戶作為竊電用戶,且這10 組用戶的平均余弦相似度近似均勻地分布在-1 到1 之間。5 種檢測方法在這一變化過程中對應(yīng)的Eauc變化如圖4 所示。
由圖4 可以看出,基于用電行為模式方法的Eauc在這一過程中并沒有明顯的起伏,表明了此類方法對于竊電用戶相關(guān)性強(qiáng)弱變化并不敏感。而與此相反,3 種線損相關(guān)性方法的曲線顯示,隨著余弦相似度減小,3 種方法的Eauc有著不同程度下降。其中,LLC 的曲線以0 為界,當(dāng)余弦相似度為正時,LLC的Eauc降幅極小;當(dāng)余弦相似度為負(fù)時,LLC 的Eauc降幅開始增大。這表明當(dāng)竊電用戶電量曲線負(fù)相關(guān)時,的確會影響LLC 檢測固定比例竊電用戶的能力。盡管如此,LLC 的曲線依然在此過程中表現(xiàn)出了最佳的抗干擾性,且其最低的Eauc也達(dá)到了0.784,這表明LLC 具有更優(yōu)的推廣能力。
圖4 不同平均余弦相似度的EaucFig.4 Eauc whith different average cosine similarities
本文針對群體性固定比例竊電這一場景,提出了一種基于線損協(xié)方差分析的竊電辨識方法LLC,并通過中國某省電力公司的實測數(shù)據(jù)對LLC 方法的有效進(jìn)行了驗證。主要結(jié)論如下:
1)當(dāng)任意兩固定比例竊電用戶電量曲線正相關(guān)時,竊電用戶電量和NTL 之間的相關(guān)性存在著一種遞增性質(zhì)。
2)基于上述遞增性質(zhì),通過搜尋線損協(xié)方差最大的用戶組合,實現(xiàn)了對群體性固定比例竊電用戶的檢測。結(jié)果表明,LLC 的檢測準(zhǔn)確度在PCC 和MIC 的基礎(chǔ)上提升了近25%。
當(dāng)然,LLC 方法也存在一定的局限性。首先,該方法僅分析了用戶電量數(shù)據(jù)和臺區(qū)的NTL,利用的信息較為有限;其次,LLC 方法僅能檢測線性攻擊的固定比例竊電用戶。因此,綜合利用多源信息實現(xiàn)對非固定比例竊電用戶的檢測也是后續(xù)重點的研究方向之一。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。