楊玉銳,程 杰,周 剛,徐詒玥,吳偉健,吳 佳
(國網(wǎng)浙江平湖市供電公司,浙江 平湖 314200)
供電的非技術(shù)損失是供電領(lǐng)域關(guān)注的重要問題[1]。通常,非技術(shù)損失主要有兩部分來源,即電力企業(yè)自身和電力用戶。電力企業(yè)可以通過提高自身的管理水平大大減少甚至消除由其自身造成的損失;但由電力用戶異常用電所導致的非技術(shù)損失,卻因異常用電檢測技術(shù)的限制而很難避免。因此,電力用戶的異常用電檢測的研究具有重要的現(xiàn)實意義。
早期的方法是每個電力用戶安裝檢測設(shè)備[2]。盡管這種方法檢測準確度很高,卻需要耗費高額的現(xiàn)場檢測運營成本以及人力資源。為此,Cabral等[3]提出了一種基于粗糙集的異常用電檢測統(tǒng)計方法。近年來,一些基于數(shù)據(jù)挖掘技術(shù)和智能優(yōu)化算法的異常檢測方法也相繼被提出,包括決策樹[4],人工神經(jīng)網(wǎng)絡(luò)[5],負荷模式[6],SVM(支持向量機)[7],OPF(最佳路徑林)分類[8]以及極端學習機[9]。另外,Nagi等[10]提出一種基于改進SVM的異常檢測模型,并使用包含知識和專家意見的模糊推理系統(tǒng)。Ramos等[11]提出一種基于和聲搜索算法和OPF分類的混合特征選擇算法,并成功應(yīng)用到電力系統(tǒng)。Pereira等[12]提出一種利用電場算法訓練多層感知機的人工神經(jīng)網(wǎng)絡(luò)方法。
在上述方法中,負荷模式方法使用最為廣泛。這得益于智能電能表的普及使用,能記錄所有用戶的負荷數(shù)據(jù),提取用戶的負荷模式成本低,負荷模式方法已在異常用電檢測領(lǐng)域得到成功的運用。因此,針對電力用戶異常用電檢測問題,提出一種基于果蠅算法[13]的負荷模式方法。
負荷模式是指1個電力用戶或電力用戶群在一段時間內(nèi)消耗電量的模式[14]。負荷模式方法通常研究如何提取和記錄電力用戶負荷特征的信息[15]。該方法已經(jīng)被證明是識別電力用戶行為的合適技術(shù)工具[16]。
一般而言,負荷模式方法包含2個階段:確定一個時間段內(nèi)客戶的分類類型;運用特定技術(shù)(如聚類),將用戶劃分到具體的分類中。負荷模式方法的核心是負荷模型,目前主要有2種負荷模式模型:基于地理范圍的區(qū)域模型;基于相似用戶負荷的分類模型。2種模型都各有其優(yōu)劣。在此提出一種結(jié)合2種模型優(yōu)勢的負荷模式模型:基于同區(qū)域相似用戶正常用電負荷數(shù)據(jù)提取用戶的CSLP(相似負荷模式);基于用戶正常的歷史負荷數(shù)據(jù)提取用戶的CLP(自負荷模式)。CSLP和CLP共同組成了用戶的負荷模式,稱之為綜合模型。
用戶負荷數(shù)據(jù)來源于電力營銷業(yè)務(wù)應(yīng)用系統(tǒng),系統(tǒng)儲存有用戶每月的用電信息,能實時查詢用戶電量等信息。
考慮到用戶的用電負荷隨季節(jié)變化,用戶負荷數(shù)據(jù)按月收集。系統(tǒng)每15 min測量1次用戶的負荷,因此每天可以獲得每個用戶24×4個數(shù)據(jù)點。需要收集同區(qū)域相似用戶正常的用電負荷數(shù)據(jù)、被檢測用戶的正常歷史負荷數(shù)據(jù)和當月的負荷數(shù)據(jù)。具體包括,去年同區(qū)域N個正常用戶對應(yīng)月的用電負荷數(shù)據(jù):
式中:Xi,j為第i個相似用戶的第j天的負荷數(shù)據(jù)。
過去兩年用戶對應(yīng)月正常的歷史負荷數(shù)據(jù)
式中:Yi,j為過去第i年該月第j天的負荷數(shù)據(jù)。
用戶當月的負荷數(shù)據(jù):
式中:Zi為當月第i天的負荷數(shù)據(jù)。每個負荷數(shù)據(jù)組為一條負荷曲線。
一般而言,同區(qū)域相似用戶的用電負荷有較大的相似性。通常,一天中相似用戶的用電負荷的變化趨勢比較一致,用電高峰低谷出現(xiàn)的時間等也都比較接近。但其用電的絕對負荷可能由于不同用電設(shè)備的種類和數(shù)量不同而差異較大。另外,用戶在相鄰年份的同一月份里負荷變化一般不大?;谏鲜隹紤],對于同區(qū)域的相似用戶負荷應(yīng)強調(diào)其變化趨勢,而對用戶的歷史負荷則應(yīng)強調(diào)其絕對值。因此,對數(shù)據(jù)進行不同的預處理,即對同區(qū)域相似用戶的負荷數(shù)據(jù)進行歸一化處理,而用戶的歷史負荷數(shù)據(jù)則不作處理。數(shù)據(jù)的歸一化按如下方式進行:
式中:ximin和ximax為第i個用戶的最小和最大負荷。
果蠅算法是一種模擬果蠅覓食行為的群體智能搜索算法。算法將搜索尋優(yōu)的過程模擬為果蠅種群的覓食過程,如圖1所示,基于果蠅覓食行為中對嗅覺和視覺的運用,設(shè)計對應(yīng)的嗅覺和視覺搜索操作,通過迭代進化實現(xiàn)對果蠅種群中心位置的優(yōu)化,從而獲得優(yōu)化問題的近似最優(yōu)解。果蠅算法的流程如下:
(1)初始化種群中心位置;
(2)嗅覺搜索。在種群中心位置附近,隨機產(chǎn)生NP個鄰域解;
(3)評價個體。通過評價機制,計算每個個體的適應(yīng)度值;
(4)視覺搜索。選擇最優(yōu)鄰域解,更新為種群中心位置;
(5)判斷終止準則是否滿足。是,輸出最優(yōu)解;否則,轉(zhuǎn)至步驟2。
每個果蠅表示一個解,用負荷向量F=[f1,f2,…,f96]表示,向量中每個元素代表不同時刻的負荷。按照隨機的方法初始化種群中的解。嗅覺搜索按照如下方式進行:
式中:a為隨機數(shù)。
引入經(jīng)典聚類方法的判定函數(shù),采用下式計算味道濃度值∶
圖1 果蠅覓食過程
式中:M為負荷曲線的數(shù)量;ski為第k條負荷曲線第i個時刻的負荷。
味道濃度判定函數(shù)設(shè)計如下:
基于上述編碼方式、嗅覺操作設(shè)計以及評價機制,經(jīng)過若干代的優(yōu)化迭代,得到種群中的最優(yōu)果蠅個體,其所代表的負荷向量,即為果蠅算法所提取出的模式。運用果蠅算法可以最終得到負荷模式,包括歸一化的同區(qū)域相似用戶的代表負荷模式曲線 L=[l1,l2,…,l96](記為 SLD),用戶的歷史負荷代表模式曲線H=[h1,h2,…,h96](記為 HLD)。
獲得用戶的負荷模式后,可采用時間序列匹配的方法來檢測用戶的異常用電。由于負荷模式強調(diào)用戶與SLD的變化趨勢匹配以及與HLD的絕對數(shù)值匹配。考慮到基于相關(guān)系數(shù)的時間序列相似性度量更加側(cè)重變化趨勢的相似,基于相對距離的時間序列相似性度量側(cè)重數(shù)值的絕對匹配。因此,分別使用基于相關(guān)系數(shù)指標和相對距離指標進行基于時間序列的模式匹配。
在匹配之前,需要根據(jù)用戶當月的實際負荷,得到用戶當月的代表負荷模式。首先,將用戶當月的負荷 Zi(i=1,2,…,30)歸一化,得到歸一化后的用戶當月負荷(i=1,2,…,30);然后按如下方式得到檢測用戶的當月代表負荷模式曲線U=[u(1),u(2),…,u(96)](記為 CLD)及歸一化后的用戶當月代表負荷模式曲線 U′=[u′(1),u′(2),…,u′(96)](記為 nCLD),式中:
基于相關(guān)系數(shù)指標的時間序列匹配nCLD和SLD,得到匹配度m1:
基于平均相對距離指標的時間序列匹配CLD和HLD,得到匹配度m2為:
得到用戶代表負荷曲線與相似用戶代表負荷曲線的匹配度m1,歸一化用戶代表負荷曲線與用戶歷史代表負荷曲線的匹配度m2后,根據(jù)實際情況確定對兩匹配度的偏好度ω1和ω2,最終加權(quán)得到用戶的用電正常度η:
供電企業(yè)根據(jù)對用戶的信用調(diào)查設(shè)置用電正常度警戒閾值,如果用戶的用電正常度η高于警戒閾值,則該用戶為正常用電,否則,則將用戶列為異常用電嫌疑用戶,需要派遣用電檢查人員到用戶現(xiàn)場檢測,根據(jù)檢測結(jié)果斷定用戶是否存在異常用電。
基于果蠅算法的負荷模式異常用電檢測方法的流程如圖2所示。
對2個商業(yè)用電用戶進行異常用電檢測,用戶1有明顯的高峰時段,用戶2用電較為平均。算法得到的用戶CLD與HLD,nCLD與SLD分別如圖 3—4(用戶1),圖 5—6(用戶 2)所示。
圖2 基于果蠅算法的負荷模式異常用電檢測方法流程
圖3 用戶1的CLD與HLD參數(shù)
圖4 用戶1的nCLD與SLD參數(shù)
算法中設(shè)置的匹配偏好度ω1=0.3,ω2=0.7,對于用戶1,算法得到兩匹配度m1=0.952,m2=0.911。加權(quán)后得到用戶的最終用電正常度=0.923,大于設(shè)置的警戒閾值0.8。因此,該電力用戶為正常用電用戶。對于用戶2,算法得到的量匹配度m1=0.59,m2=0.38,加權(quán)后得到用戶的最終用電正常度η=0.443,小于警戒閾值0.8,因此該用戶被列為異常用電的嫌疑用戶?,F(xiàn)場實際調(diào)查表明,用戶1為正常用戶,用戶2存在竊電行為,算法結(jié)果與實際的情況一致。
為了進一步驗證算的準確性和有效性,將果蠅算法用于30個居民用戶(記為C1,C2,…,C30)的用電檢測計算,并且將算法與經(jīng)典的聚類算法(K-means)進行比較,結(jié)果如表1所示。
圖5 用戶2的CLD與HLD參數(shù)
圖6 用戶2的nCLD與SLD參數(shù)
表1 算法比較結(jié)果
由表1可見,果蠅算法是一種有效且準確率較高的異常用電檢查方法,準確率比K-means算法高13%左右。
提出一種基于同區(qū)域相似用戶的負荷數(shù)據(jù)與用戶歷史負荷數(shù)據(jù)的綜合負荷模式,并應(yīng)用果蠅算法提取基于數(shù)據(jù)的負荷模式曲線。另外,根據(jù)用戶用電負荷與用電歷史變化不大以及用戶用電與同區(qū)域的相似用戶具有相似的用電變化規(guī)律,對用戶用電負荷采取不同的數(shù)據(jù)處理方式以及負荷模式曲線的匹配評價方式?;谙嚓P(guān)系數(shù)和基于相對距離的時間序列匹配評價方式,對負荷模式進行了準確的匹配。電力用戶負荷實例計算分析證明了方法的有效性和準確性,為異常用電檢測提供了一種新的數(shù)據(jù)分析方法。
[1]NIZAR A,DONG Z."Identification and detection of electricity customer behaviour irregularities[C].2009 IEEE PES Power Systems Conf Expo∶1-10.
[2]NIZAR A H,DONG Z Y,JALALUDDIN M,et al.Load profiling method in detecting non-technical loss activities in a power utility[C].2006 IEEE 1st Int Power and Energy Conf∶82-87.
[3]CABRAL J E,PINTO J O P,GONTIJO E M,et al.Fraud detection in electrical energy consumers using rough sets[C].2004 IEEE Int Conf.Systems,Man and Cybernetics∶3625-3629.
[4]NIZAR A H,DONG Z Y,ZHAO J H,et al.A data mining based NTL analysis method[C].2007 IEEE Power Eng Soc General Meeting∶1-8.
[5]MONEDERO I,BISCARRI F,BISCARRI J,et al.Detection of non-technical losses in electrical consumption using neural networks and statistical techniques[C].In Proceedings of the international conference on computational science and applications∶3984.
[6]NIZAR A H,DONG Z Y,JALALUDDIN M,et al.Load profiling method in detecting non-technical loss activities in a power utility[C].2006 IEEE 1st Int Power and Energy Conf∶82-87.
[7]NAGI J,MOHAMMAD A M,YAP K S,et al.Non-technical loss analysis for detection of electricity theft using support vector machines[C].2008 of the 2nd IEEE international power and energy conf∶907-12.
[8]RAMOS C C,SOUZA A N,PAPA J P,et al.A new approach for nontechnical losses detection based on opti mum-path forest[J].IEEE Trans Power Syst,2011(26)∶181.
[9]NIZAR A H,DONG Z Y,WANG Y.Power utility nontechnical loss analysis with extreme learning machine method[J].IEEE Transactions on Power Systems,2008,23 (3)∶946-55.
[10]NAGI J,YAP K S,TIONG S K,et al.Improving SVM-based nontechnical loss detection in power utility using the fuzzy inference system[J].IEEE Transactions on power delivery,2011,26(2)∶1284-1285.
[11]RAMOS C C,SOUZA A N,CHIACHIA G,et al.A novel algorithm for feature selection using Harmony Search and its application for non-technical losses detection[J].Computers and Electrical Engineering,2011(37)∶886-894.
[12]PEREIRA L A M,AFONSO L C S,PAPA J P,et al.Mul tilayer perceptron neural networks training through charged system search and its Application for non-technical losses detection[C].2013 IEEE Innovative Smart Grid Technologies Latin America(ISGT LA)∶1-6.
[13]PAN W T.A new fruit fly optimization algorithm∶taking the financial distress model as an example[J].Knowledge-Based Systems,2012,26(2)∶69-74.
[14]ALLERA S V,HORSBURGH A G.Load profiling for the energy trading settlements in the UK electricity markets[C].in Presentation Report From Distribu-TECH Europe DA/DSM Conf,1998∶27-29.
[15]CHEN C S,KANG M S,WANG J C,et al.Implementation of the load survey system in Taipower[C].1999 IEEE Transmission and Distribution Conf.
[16]NIZAR A H,DONG Z Y,ZHAO J H.Load profiling and data mining techniques in electricity deregulated market[C].2006 IEEE Power Engineering Society General Meeting∶1-7.