舒一飛,劉興杰,康潔瑩,劉鵬,樊博
1. 國網(wǎng)寧夏電力有限公司 營銷服務中心,寧夏 銀川 750002
2. 寧夏大學 電氣工程及其自動化系,寧夏 銀川 750021
居民用戶異常用電不僅會造成電網(wǎng)輸配電損失,破壞正常的經(jīng)濟秩序,而且存在一定的安全隱患。通常,對于異常用電的檢測主要依靠技術人員現(xiàn)場排查,費時費力,且無法避免網(wǎng)絡和通信中一些高級手段的應用[1-2]。
隨著技術的發(fā)展,利用用電信息采集系統(tǒng)采集海量用戶數(shù)據(jù),使得開展數(shù)據(jù)驅(qū)動的異常用電檢測、準確識別成為可能[3-4]。對此研究人員提出了多種異常值檢測方法,主要涵蓋監(jiān)督學習和非監(jiān)督學習兩方面。監(jiān)督學習通過訓練集來學習分類器,常用方法有K 近鄰、支持向量機、極限學習機、深度卷積神經(jīng)網(wǎng)絡等算法,這類方法準確率較高,但在實際業(yè)務中,若訓練集較少,可能影響分類的準確性[5-12]。非監(jiān)督學習不使用樣本標定信息,通常采用K-Means、模糊C 均值以及譜聚類等算法對數(shù)據(jù)進行聚類,分析各類用戶的用電行為,適用于初期尚未構建異常數(shù)據(jù)集時的檢測,但這類方法對參數(shù)的依賴性較強[13-16]。
由于異常用電行為具有特定的時頻特性,這種特性必然引起線損數(shù)據(jù)發(fā)生異常,使其具有相應的時頻特性,且與嫌疑用戶的用電數(shù)據(jù)產(chǎn)生時頻關聯(lián)。因為該時頻特性往往具有強隨機不確定性,固定參數(shù)相關的分析方法無法很好地處理此類數(shù)據(jù)。經(jīng)驗模式分解(EMD)方法是一種自適應處理方法,不需要預設基函數(shù)和參數(shù),且不需要帶標簽的數(shù)據(jù)集。另一方面,經(jīng)EMD 分解能夠得到有限個基本模式分量(intrinsic mode function,IMF)和剩余分量(residual component,RES),這些IMF 能夠突出原始數(shù)據(jù)的局部特征,有利于發(fā)掘數(shù)據(jù)內(nèi)部特有的時頻特征。EMD 已被證明在很多方面的應用效果皆優(yōu)于其他信號處理方法[17-19]。
為此,將EMD 方法應用于電力系統(tǒng)異常用電檢測中,提出一種基于EMD 的異常用電檢測方法。首先,針對供電線路中可能存在大量的小電量零電量用電戶的情況,給出了一種初步篩選方法,以提高檢測效率;采用EMD 方法對篩選用戶的用電量和線損電量時間序列進行自適應分解,獲取對應的基本模式分量;進一步提取EMD 分解所得高頻分量,通過對其變化趨勢和相關性進行分析,最終標定異常用電用戶。采用該方法對現(xiàn)場實采數(shù)據(jù)進行了分析計算,驗證了其有效性。
經(jīng)驗模態(tài)分解方法是美籍華人Huang 提出的Hilbert-Huang 變換的核心內(nèi)容,其分解方法是基于以下假設條件:
1)數(shù)據(jù)至少有2 個極值,一個最大值和一個最小值;
2)數(shù)據(jù)的局部時域特性是由極值點間的時間尺度唯一確定;
3)如果數(shù)據(jù)沒有極值點但有拐點,則可以通過對數(shù)據(jù)微分一次或多次求得極值,然后再通過積分來獲得分解結果。
可見,這種方法的本質(zhì)是通過數(shù)據(jù)的特征時間尺度來獲得本征波動模式IMF,然后分解數(shù)據(jù)。在這一過程中,特征時間尺度及IMF 的定義都具有一定的經(jīng)驗性和近似性。與其他信號處理方法相比,EMD 方法分解所用的特征時間尺度是源自于原始信號,具有后驗性和自適應性。這種基于EMD 的時頻分析方法既適合于非線性、非平穩(wěn)信號的分析,也適合于線性、平穩(wěn)信號的分析,并且對于線性、平穩(wěn)信號的分析也比其他的時頻分析方法更好地反映了信號的物理意義。
采用EMD 方法對用戶異常行為進行分析,具體流程如圖1 所示。
圖1 基于EMD 的異常用電行為檢測流程
由于通信失敗和設備故障等原因,可能導致抄表時出現(xiàn)數(shù)據(jù)缺失、數(shù)據(jù)錯誤等問題,因此必須首先對從關口表和各用戶電能表獲取的計量數(shù)據(jù)進行預處理,包括查漏補缺和數(shù)據(jù)更正。如對缺失數(shù)據(jù)使用插值進行補充,全零數(shù)據(jù)直接進行剔除等。計算得到總供入電量qSi(i為時間采樣點,i=1,2 ,···,M)、總損耗電量qLi和各用戶消耗電量qKi(K為用戶編號,K=1,2, ···,N)的時間序列。
當進行線損分析時,主要以變壓器為單位(包括公變用戶和專變用戶),其用戶數(shù)量相對較少且電量一般較大,可直接對此類用戶在EMD 分解之后進行異常用電分析。而針對公變臺區(qū)用戶數(shù)量較多且存在零電量和低電量用戶亦較多的實際情況,直接對此類用戶進行EMD 分解將導致計算量大增且排查效率低下??紤]到除了暗線跨越表計外,用戶的異常用電量與其用電量一般成比例關系,且總損耗電量相關性強,故本文提出預先采用相關性和用戶用電量等指標相結合的方法對高損公變臺區(qū)用戶的異常用電初步篩選,以提高檢測效率。具體篩選過程如下:
4)將對應的位次相加作為最終排序結果;
5)提取排序前5%用戶作為初篩用戶。
對初篩用戶進行進一步EMD 分析篩查,若未發(fā)現(xiàn)嫌疑用戶,則擴大排查比例直至發(fā)現(xiàn)嫌疑用戶。對于用戶數(shù)較少的情況,如小于10 個,可以將所有用戶都標記為嫌疑用戶,直接進行EMD 分析。需要指出的是,當線路所帶變壓器較多且存在較多小電量用戶時,也須預先采用上述方法進行初步篩選。
EMD 的目的是將組成原始信號的各尺度分量不斷從高頻到低頻進行提取,得到頻率由高到低排列特征模態(tài)函數(shù)。能量大的高頻分量代表原信號的主要特性,是最主要的組成分量。因此,根據(jù)EMD 方法對篩選所得用戶的qKi和qLi進行分解,提取分解所得基本模式分量中的高頻分量,通過其變化趨勢和相關性指標分析標定嫌疑用戶。
某段線路由A、B 和D 這3 個專變用戶和1 個公變臺區(qū)C 組成,供出為某10 kV 變電站關口。利用采集系統(tǒng)每隔6 h 進行一次線損計算,連續(xù)觀察一個月,其線損曲線圖2 所示。
圖2 線路線損率曲線
從圖2 中可以看出,該10 kV 線路日線損率在5%~25%波動,而正常線損率應在5%以下,故存在異常用電行為。
由于該段線路僅有4 戶用戶,不需進行初篩,直接對這4 戶的電量qKi和 線損電量qLi進行EMD分解,得到若干IMF 和RES 分量。根據(jù)所得的EMD 結果,首先計算了各IMF 和RES 與其原始時間序列的Pearson 互相關系數(shù),結果如表1 所示。
表1 EMD 分解后各分量和原信號的Pearson 互相關系數(shù)
由表1 可見,各用戶電量EMD 分解后的高頻分量(HIMF)與原信號相關性最強,都在0.77 以上;而中低頻分量的相關性在0.3 以下,即高頻信號占據(jù)了原始信號的主要成分,能體現(xiàn)原始信號的主要特性。因此,對高頻信號進行分析即可有效揭示原信號的性質(zhì)和關聯(lián)性。為此,進一步繪制了用戶的qKi和 線損電量qLi經(jīng)EMD 分解后的高頻分量對比結果,如圖3 所示。圖中SHIMF 為線損電量時間序列EMD 分解后的高頻分量。
圖3 各用戶和線損電量EMD 高頻分量對比
從圖3 可以看出,D 用戶用電量的時頻變化與線損的時頻變化具有高度一致性,說明該線路的線損產(chǎn)生與D 用戶密切相關。經(jīng)現(xiàn)場監(jiān)測排查,D 用戶存在異常用電行為。
為了進一步驗證所提算法的有效性,對另一高損公變臺區(qū)進行了分析。該公變臺區(qū)有92 個用戶,臺區(qū)日線損率如圖4 所示,均處于15%~25%,顯然存在有異常用電行為的用戶。
圖4 某公變臺區(qū)日線損率
對于此類公變臺區(qū),由于用戶數(shù)量較多,且存在零電量用戶和低電量用戶,直接采用EMD 方法低效且意義不大,故采用互相關性和用戶用電量相結合的方法進行初步篩查。
為此計算得到了各用戶日均用電量,如圖5所示,同時對用戶qKi線 損電量qLi的Pearson 互相關系數(shù)進行了計算,結果
圖5 各用戶日均用電量
圖6 各用戶電量與損耗電量的Pearson 互相關系數(shù)
按照初步篩查方法對所有92 戶用戶進行排序,篩選出編號為1、2、30、49、50 的用戶作為EMD 的對象。提取各用戶經(jīng)EMD 處理后的高頻分量,并進行歸一化處理(各高頻分量序列除以該序列的最大值)。這是由于qLi和 用戶電量qKi之間存在數(shù)量級差別,歸一化能夠更清晰地展示其相對變化趨勢,結果如圖7 所示。
如圖6 所示。
圖7 歸一化的各用戶高頻分量和線損高頻分量
從圖7 中可以看出,用戶30 的高頻分量在前30 d和線損高頻分量高度重合,后30 d 出現(xiàn)顯著差異;
用戶49 的高頻分量和線損高頻分量波形重合度相對較高,而其余3 個用戶的波形明顯差異較大。經(jīng)現(xiàn)場排查,用戶30 和49 確為異常用電用戶。
算例1 中用戶少、電量集中,數(shù)據(jù)為 h 平均用電量,算例2 中用戶多、電量分散,數(shù)據(jù)為日均用電量。對比圖3 和圖7 可以發(fā)現(xiàn),存在異常用電行為的用戶,其用電量qKi和 線損電量qLi經(jīng)EMD 處理后,高頻分量的變化趨勢在算例1 中幾乎完全一致,而在算例2 中局部存有偏差。為此,進一步對2 個算例中的數(shù)據(jù)進行了討論,計算了算例1 和算例2 中各用戶qKi和qLi原始序列的Pearson 互相關系數(shù)(rOL,K),經(jīng)EMD 分解得到的高頻分量時間序列的Pearson 互相關系數(shù)(rhL,K),結果分別示于表2 和表3。
表2 算例1 的Pearson 相關系數(shù)
表3 算例2 的Pearson 相關系數(shù)
從表2 和表3 中可以看出,算例1 中用戶D 的rOL,K和rhL,K均為最大;算例2 中用戶49 的rhL,K最 高,而用戶1 的rOL,K為最大,用戶49 次之。用戶49 和用戶1 的rOL,K都較大,說明這兩戶的電量時間序列和線損電量的變化密切關聯(lián)。我們知道,線損電量包含2 部分:一部分是技術損耗引起的,是固有的低頻變化部分;另一部分是管理損耗,是由異常用電引起的,其變化頻率與用戶用電量及用戶用電行為模式有關,往往呈現(xiàn)出高頻變化,且隨著用電量的波動呈一定比例波動。用戶49 與線損的高頻分量波形高度重合且rhL,K最高,說明存在異常用電行的概率最大。用戶1 的rhL,K較小的原因應是由其電量變化與技術損耗變化趨勢一致而引起的。
綜上分析,可見若直接通過用戶qKi和 線損電量qLi的相關性來檢測異常用電用戶,可能會形成誤判。而通過對用戶qKi和 線損電量qLi進行EMD 處理,分析其高頻分量變化趨勢及互相關性,可有效檢測是否存在異常用電行為。同時,對比算例1 和算例2,不難發(fā)現(xiàn),算例1 中數(shù)據(jù)顆粒度較細(h 間隔),其電量時間序列反映用戶用電行為和特征的信息更豐富,EMD 分解后得到的高頻分量在反映用戶用電行為方面更清晰直觀;而算例2 中,由于數(shù)據(jù)顆粒度較粗(d 間隔),導致很多隨晝夜變化的用電行為和特征信息丟失,EMD 分解后得到的高頻和次高頻分量的波形識別度較算例1 有所下降。因此,顆粒度更細的數(shù)據(jù)更有利于分析異常用電。
鑒于EMD 在數(shù)據(jù)處理中的優(yōu)越性,提出了一種基于EMD 的異常用電檢測方法,首先針對所分析對象的數(shù)據(jù)特點進行初篩,采用EMD 方法對篩選用戶的用電量和線損電量時間序列進行自適應分解,提取其高頻分量,通過對比高頻分量變化趨勢和相關性分析,標定異常用電用戶。通過2 個實際案例,驗證了所提方法的有效性,得到了如下結論:
1)經(jīng)EMD 分解后的用戶用電量高頻分量與原信號相關性最強,體現(xiàn)了原始信號的主要特性。
2)對于用戶數(shù)量多、用電量分散的公變臺區(qū)用戶,采用互相關性和用戶用電量相結合的方法進行初篩,可有效提高排查效率。
3)存在異常用電行為的用戶,其用電量和線損電量的高頻分量變化趨勢一致性強且Pearson互相關系數(shù)高。
4)較細的原始數(shù)據(jù)的顆粒度有利于提高所提檢測方法的識別度。