李秋紅
基于改進(jìn)粒子群算法的前饋神經(jīng)網(wǎng)絡(luò)識(shí)別用戶竊電行為
李秋紅
(山東農(nóng)業(yè)工程學(xué)院,濟(jì)南 250100)
為減小用戶竊電行為對(duì)電網(wǎng)運(yùn)營(yíng)造成的負(fù)面影響、提高竊電巡檢能力和識(shí)別竊電用戶的準(zhǔn)確率,提出基于改進(jìn)粒子群算法(BFO-PSO)的前饋神經(jīng)網(wǎng)絡(luò)模型用于識(shí)別用戶竊電行為。以某市近四年的用電數(shù)據(jù)為基礎(chǔ),通過特征提取,得到四個(gè)對(duì)竊電行為影響較大的特征作為輸入樣本,構(gòu)建基于BFO-PSO算法的前饋神經(jīng)網(wǎng)絡(luò)識(shí)別模型,利用BFO-PSO計(jì)算BP神經(jīng)網(wǎng)絡(luò)模型的最優(yōu)權(quán)重值。對(duì)比BP神經(jīng)網(wǎng)絡(luò)模型、基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型及基于BFO-PSO的BP神經(jīng)網(wǎng)絡(luò)模型識(shí)別結(jié)果發(fā)現(xiàn),基于BFO-PSO的BP神經(jīng)網(wǎng)絡(luò)模型能夠更好地識(shí)別出竊電用戶,識(shí)別準(zhǔn)確率高達(dá)94%,訓(xùn)練速度提升了5%,有望廣泛應(yīng)用于竊電用戶識(shí)別中。
竊電;改進(jìn)粒子群算法;前饋神經(jīng)網(wǎng)絡(luò);用戶識(shí)別
隨著經(jīng)濟(jì)飛速發(fā)展,人們的用電需求越來越高,出現(xiàn)一些不法分子實(shí)施竊電行為。全國(guó)每年因竊電造成的損失逾百億元,給電力系統(tǒng)的安全與穩(wěn)定帶來極大隱患[1-2]。由于竊電手段繁多,且多發(fā)生在偏遠(yuǎn)地區(qū),人為排查耗時(shí)耗力,難以獲取確鑿證據(jù)。因此,當(dāng)出現(xiàn)竊電行為時(shí),能在復(fù)雜環(huán)境中進(jìn)行準(zhǔn)確定位獲得有力證據(jù),對(duì)維護(hù)電力系統(tǒng)的穩(wěn)定有重要意義。
借助電力計(jì)量設(shè)備獲取各相電流、電壓、功率因數(shù)等數(shù)據(jù)和一些異常警報(bào)信息,通過分析處理這些數(shù)據(jù),提取竊電用戶的關(guān)鍵特征,構(gòu)建竊電用戶識(shí)別模型,可判斷用戶是否有竊電行為[3]。文獻(xiàn)[4]通過用戶負(fù)荷曲線與特征曲線之間的相似度,篩選具有竊電嫌疑的用戶;文獻(xiàn)[5]基于傳遞熵密度聚類的方法,構(gòu)建與線損電量的傳遞熵模型,再結(jié)合密度聚類算法,達(dá)到識(shí)別用戶竊電行為的目的。
竊電用戶識(shí)別模型的建立方法有多種,BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型因具有較好的非線性映射能力及容錯(cuò)性,在建模及圖像識(shí)別領(lǐng)域得到了廣泛關(guān)注。但該模型所需訓(xùn)練數(shù)據(jù)多,易陷入局部最優(yōu)解,最終導(dǎo)致預(yù)測(cè)結(jié)果與實(shí)際值偏差較大[6]。為了提高BP神經(jīng)網(wǎng)絡(luò)模型的收斂速度,引入粒子群優(yōu)化算法(particle swarm optimization, PSO),但傳統(tǒng)粒子群算法與神經(jīng)網(wǎng)絡(luò)模型結(jié)合時(shí)易出現(xiàn)局部最優(yōu)解、計(jì)算精度不高等問題。細(xì)菌覓食優(yōu)化算法(bacterial foraging optimization, BFO)除了具有與PSO相同的優(yōu)點(diǎn)外,還具有較強(qiáng)的局部搜索能力。因此,將BFO與PSO相結(jié)合[7],建立基于改進(jìn)粒子群算法(BFO-PSO)的前饋神經(jīng)網(wǎng)絡(luò)模型,通過數(shù)據(jù)處理確定模型訓(xùn)練樣本,并合理設(shè)定模型初始化參數(shù),可有效解決粒子群算法與神經(jīng)網(wǎng)絡(luò)模型相結(jié)合時(shí)的局部收斂和收斂速度慢等問題。將該模型用于竊電用戶行為識(shí)別,可實(shí)現(xiàn)快速準(zhǔn)確識(shí)別。
BP神經(jīng)網(wǎng)絡(luò)模型是一種按誤差反向傳播訓(xùn)練的前饋神經(jīng)網(wǎng)絡(luò)模型,其以梯度下降法為思想,通過梯度搜索使模型的實(shí)際輸出值與期望輸出值的誤差方均差為最小。目前使用最多且最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型由三層結(jié)構(gòu)組成,即輸入層、輸出層和隱含層[8-9]。神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)如圖1所示,訓(xùn)練過程如圖2所示。
圖1 神經(jīng)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)
圖2 訓(xùn)練過程
假設(shè)搜索空間維度為,個(gè)不同的粒子構(gòu)成種群,粒子在每次搜索過程中,按照式(1)和式(2)來自動(dòng)更新速度和位置。
為解決PSO易陷入局部最優(yōu)和收斂速度慢等問題,將標(biāo)準(zhǔn)PSO作為變異算子引入BFO中,去掉式(1)中第二部分,得到改進(jìn)后的粒子速度和位置更新公式為
按式(3)和式(4)更新粒子菌群位置,計(jì)算出新的適應(yīng)值。
由于用電負(fù)荷不能直接表征用戶的竊電行為,終端報(bào)警信息也存在不準(zhǔn)確性。因此,在識(shí)別模型建立之前需要對(duì)采集到的原始數(shù)據(jù)進(jìn)行處理。
對(duì)用戶用電量進(jìn)行周期性分析后不難發(fā)現(xiàn),正常用戶的用電量趨勢(shì)沒有太大波動(dòng),基本趨于平穩(wěn);而竊電用戶的用電量趨勢(shì)下降明顯。因此,可根據(jù)用戶電量趨勢(shì)變化來判斷正常用戶和竊電用戶。由于竊電用戶在全國(guó)用電用戶中居于少數(shù),并且像醫(yī)院、學(xué)校、銀行等非居民類別的用戶不可能存在竊電行為,為獲取更為有效的竊電行為數(shù)據(jù),在采集到的原始數(shù)據(jù)中需將不可能出現(xiàn)竊電行為的用戶用電量數(shù)據(jù)濾除。由于正常情況下節(jié)假日的用電量比工作日低,因此節(jié)假日的用電數(shù)據(jù)也需要濾除。
在提取用戶用電量數(shù)據(jù)時(shí),會(huì)存在部分?jǐn)?shù)據(jù)缺失。為更好地建立模型,通過拉格朗日插值法插補(bǔ)缺失的數(shù)據(jù)[12],用戶電量補(bǔ)全部分?jǐn)?shù)據(jù)見表1。
表1 用戶電量補(bǔ)全部分?jǐn)?shù)據(jù)
通過計(jì)量?jī)x表采集的數(shù)據(jù),雖能表征竊電行為的某些規(guī)律,但作為模型的訓(xùn)練樣本,其特征不清晰,需進(jìn)行特征提取。利用逐步回歸法進(jìn)行特征篩選,篩選出與竊電關(guān)聯(lián)度較高的指標(biāo)因子,將這些因子構(gòu)成數(shù)據(jù)集作為輸入樣本來反映竊電行為。竊電評(píng)價(jià)指標(biāo)體系如圖3所示。
圖3 竊電評(píng)價(jià)指標(biāo)體系
本文給出一種改進(jìn)粒子群算法(BFO-PSO),基于該算法建立竊電用戶識(shí)別模型。在樣本準(zhǔn)備完成后,需要?jiǎng)澐譁y(cè)試樣本和訓(xùn)練樣本,隨機(jī)選取20%的數(shù)據(jù)作為測(cè)試樣本,剩下的作為訓(xùn)練樣本。模型輸入包括用電量下降趨勢(shì)、線損增長(zhǎng)率、終端告警數(shù)和欠費(fèi)次數(shù)。識(shí)別模型算法流程如圖4所示。
圖4 識(shí)別模型算法流程
1)初始化不變參數(shù)。
2)用隨機(jī)函數(shù)隨機(jī)確定每個(gè)粒子的速度和位置。
3)確定解空間,進(jìn)行遷徙操作。
4)執(zhí)行復(fù)制操作。
5)按式(5)執(zhí)行趨向操作。
7)菌群尋找最優(yōu)位置,并按式(3)和式(4)更新菌群位置,按式(6)計(jì)算菌群的適應(yīng)值,與last比較,更新last。
8)判斷迭代次數(shù)是否滿足條件,滿足則將最優(yōu)解輸入BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,不滿足則返回第3)步進(jìn)行下一代集群處理。
由于竊電識(shí)別結(jié)果有竊電和正常兩種情況,屬于二分類問題,因此采用ROC(receiver operating characteristic)曲線和AUC(area under curve)作為竊電識(shí)別模型的評(píng)價(jià)指標(biāo)。ROC曲線的橫軸為假正率(false positive rate, FPR),表示識(shí)別模型識(shí)別的正常樣本中含有竊電樣本數(shù)據(jù)的比例;縱軸為真正率(true positive rate, TPR),表示識(shí)別模型識(shí)別的正常樣本中實(shí)際正常樣本占所有正常樣本數(shù)據(jù)的比 例[13]。因此,TPR值越大,表示識(shí)別為正常數(shù)據(jù)中真正為正常數(shù)據(jù)的樣本越多;而FPR值越小,表示識(shí)別為正常樣本的數(shù)據(jù)中真正為竊電數(shù)據(jù)的樣本越少。所以,ROC曲線越趨于左上角,表示模型對(duì)用戶竊電行為識(shí)別的準(zhǔn)確率就越高。
將ROC曲線與橫軸包圍的面積值定義為AUC,利用AUC的值能有效衡量模型的分類性能。對(duì)于竊電識(shí)別這一二分類問題,由于識(shí)別模型的預(yù)測(cè)能力必須要高于隨機(jī)猜測(cè),通常AUC>0.5,當(dāng)AUC>0.9時(shí),表示識(shí)別模型具有非常高的預(yù)測(cè)能力。
為了驗(yàn)證基于改進(jìn)粒子群算法的前饋神經(jīng)網(wǎng)絡(luò)識(shí)別模型的識(shí)別能力,選取某市近四年用電數(shù)據(jù)中2 242個(gè)數(shù)據(jù)為算例樣本,與BP神經(jīng)網(wǎng)絡(luò)模型和基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行仿真對(duì)比。仿真時(shí),BP神經(jīng)網(wǎng)絡(luò)模型的隱含層設(shè)定9個(gè)節(jié)點(diǎn),通過tansig和purelin函數(shù)分別激活隱含層和輸出層,設(shè)定迭代200次,最小誤差設(shè)為0.000 1,學(xué)習(xí)率為0.01;遺傳算法進(jìn)化設(shè)為30代,種群規(guī)模為20,交叉選擇概率設(shè)為0.25,變異選擇概率設(shè)為0.15;粒子群算法進(jìn)化設(shè)為30代,種群規(guī)模為20,學(xué)習(xí)因子1=2=1.5。
通過仿真建立BP神經(jīng)網(wǎng)絡(luò)模型、基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型和基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型,得到訓(xùn)練時(shí)間見表2。
從表2可以看出,基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí)間最短;與BP神經(jīng)網(wǎng)絡(luò)模型相比,基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練速度提升了5%。仿真得到三種模型的ROC曲線分別如圖5~圖7所示,識(shí)別結(jié)果對(duì)比見表3。
圖5 BP神經(jīng)網(wǎng)絡(luò)模型ROC曲線
圖6 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型ROC曲線
圖7 基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型ROC曲線
表3 識(shí)別結(jié)果對(duì)比
表3中,TP為正常用戶識(shí)別正確的數(shù)量,F(xiàn)P為正常用戶識(shí)別錯(cuò)誤的數(shù)量,F(xiàn)N為竊電用戶識(shí)別錯(cuò)誤的數(shù)量,TN為竊電用戶識(shí)別正確的數(shù)量。將表3中的識(shí)別結(jié)果代入式(7)~式(9)計(jì)算出識(shí)別率對(duì)比見表4。
表4 識(shí)別率對(duì)比
通過對(duì)比分析三種模型的ROC曲線可得,基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型的ROC曲線更趨向于左上角,AUC值最大,分類識(shí)別性能優(yōu)于其他兩種模型。三種模型均能識(shí)別出竊電用戶,但識(shí)別率不同。BP神經(jīng)網(wǎng)絡(luò)模型的識(shí)別準(zhǔn)確率為83%,誤判率為10.28%,漏判率為23.45%;基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型的識(shí)別準(zhǔn)確率僅為71%,低于另外兩種模型,誤判率為27.21%,漏判率為30.71%;基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型的識(shí)別準(zhǔn)確率為94%,誤判率為6.19%,漏判率為5.77%。仿真結(jié)果表明,基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型識(shí)別準(zhǔn)確率最高,漏判、誤判率最低,訓(xùn)練時(shí)間最短,能更好地識(shí)別出竊電用戶。
針對(duì)識(shí)別用戶竊電行為的問題,本文提出了一種基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型。以某市近四年用電數(shù)據(jù)中2 242個(gè)樣本數(shù)據(jù)為例,仿真分析所提出模型的可行性及有效性。通過與BP神經(jīng)網(wǎng)絡(luò)模型和基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,得出本文所提基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型的識(shí)別準(zhǔn)確率最高、誤判率和漏判率最低、訓(xùn)練時(shí)間最短的結(jié)論。該模型可用于識(shí)別竊電用戶,為保障電力系統(tǒng)安全運(yùn)行提供理論支撐。
[1] 張宇帆, 艾芊, 李昭昱, 等. 基于特征提取的面向邊緣數(shù)據(jù)中心的竊電監(jiān)測(cè)[J]. 電力系統(tǒng)自動(dòng)化, 2020, 44(9): 128-134.
[2] 雷怡琴, 孫兆龍, 葉志浩, 等. 電力系統(tǒng)負(fù)荷非侵入式監(jiān)測(cè)方法研究[J]. 電工技術(shù)學(xué)報(bào), 2021, 36(11): 2288-2297.
[3] 唐冬來, 劉友波, 熊智臨, 等. 基于時(shí)空關(guān)聯(lián)矩陣的配電臺(tái)區(qū)反竊電預(yù)警方法[J]. 電力系統(tǒng)自動(dòng)化, 2020, 44(19): 168-176.
[4] 宋少杰, 張長(zhǎng)勝, 李英娜, 等. 基于曲線相似度和集成學(xué)習(xí)的竊電識(shí)別[J]. 數(shù)據(jù)通信, 2022(3): 39-44.
[5] 劉康, 李彬, 薛陽, 等. 基于傳遞熵密度聚類的用戶竊電識(shí)別方法[J/OL]. 中國(guó)電機(jī)工程學(xué)報(bào), 2022, https://kns.cnki.net/kcms/detail/11.2107.TM.20211203. 0323.003.html.
[6] 金晟, 蘇盛, 曹一家, 等. 基于格蘭杰歸因分析的高損臺(tái)區(qū)竊電檢測(cè)[J]. 電力系統(tǒng)自動(dòng)化, 2020, 44(23): 78-86.
[7] 楊萍, 孫延明, 劉小龍, 等. 基于細(xì)菌覓食趨化算子的PSO算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2011, 28(10): 3640-3642.
[8] 徐揚(yáng), 張紫濤. 基于遺傳模擬退火算法改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的中長(zhǎng)期電力負(fù)荷預(yù)測(cè)[J]. 電氣技術(shù), 2021, 22(9): 70-76.
[9] 聞楓, 荊凡勝, 李強(qiáng), 等. 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的無線電能傳輸系統(tǒng)接收線圈參數(shù)優(yōu)化[J]. 電工技術(shù)學(xué)報(bào), 2021, 36(增刊2): 412-422.
[10] 楊尚君, 王社偉, 陶軍, 等. 基于混合細(xì)菌覓食算法的多目標(biāo)優(yōu)化方法[J]. 計(jì)算機(jī)仿真, 2012, 29(6): 218-222.
[11] 李濤, 方文田. 基于粒子群優(yōu)化算法的金屬氧化物避雷器阻性電流計(jì)算方法研究[J]. 電氣技術(shù), 2021, 22(11): 104-108.
[12] 趙莉, 孫娜, 李麗萍, 等. 拉格朗日插值法在數(shù)據(jù)清洗中的應(yīng)用[J]. 遼寧工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 42(2): 102-105, 117.
[13] 巢政, 溫蜜. 一種基于SMOTE和XGBoost的竊電檢測(cè)方案[J]. 智慧電力, 2020, 48(11): 97-102.
Feedforward neural network based on improved particle swarm optimization algorithm for identification of user electricity stealing behavior
LI Qiuhong
(Shandong Agriculture and Engineering University, Ji’nan 250100)
In order to reduce the negative impact of electricity theft on power grid operation, improve the ability of electricity theft inspection and the accuracy of identifying electricity theft users, a feedforward neural network model based on improved particle swarm optimization algorithm (BFO-PSO) is proposed. Based on the electricity consumption data of a city in recent four years, through feature extraction, four features that have a greater impact on electricity stealing behavior are obtained as input samples. A feedforward neural network recognition model based on BFO-PSO algorithm is constructed, and the optimal weight value of BP neural network model are calculated by using algorithm BFO-PSO. By comparing the recognition results of BP neural network model, the genetic algorithm based BP neural network model and the BFO-PSO based BP neural network model, it is found that the BP network model based on BFO-PSO can better identify the power stealing users. The recognition accuracy is as high as 94%, and the training speed is increased by 5%. It is expected to be widely used in the power stealing user recognition.
stealing electricity; improved particle swarm optimization; feedforward neural network; user identification
2022-07-04
2022-07-26
李秋紅(1990—),女,山東省臨清市人,碩士,助教,主要從事智能電器、電氣設(shè)備智能化方面的研究工作。