程興亮
(國網(wǎng)瀘州供電公司)
隨著社會的發(fā)展,電力在現(xiàn)代社會中變得越來越重要。竊電行為不僅會給用電企業(yè)帶來經(jīng)濟(jì)損失,而且還會給用戶造成電器損壞等不良影響。針對傳統(tǒng)的人工巡檢竊電檢測方法存在效率低、無法全面覆蓋和易出現(xiàn)漏檢情況,研究者們提出了許多對竊電行為進(jìn)行檢測的方法和裝置[1-2],并取得一定的效果。
文獻(xiàn)[3]提出了一種基于用電信息采集系統(tǒng)的竊電行為定位方案,該方案對用電數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)數(shù)據(jù)的異常狀況,結(jié)合相關(guān)竊電行為,可實現(xiàn)對主站監(jiān)控盲區(qū)時段的竊電行為定位,但是該方法定位精確度不高,存在漏檢情況。
文獻(xiàn)[1]提出了一種采用稠密度聚類方法對低電壓臺區(qū)的竊電行為進(jìn)行識別。該方法通過及時更新用電竊電行為的數(shù)據(jù),建立非負(fù)矩陣,計算綜合分值,以此實現(xiàn)對用電竊電行為的識別。雖然該方法能對竊電行為進(jìn)行識別,但定位性不高,只能識別出是否有竊電行為,不能對其進(jìn)行定位。
文獻(xiàn)[4]提出采用雙向深度循環(huán)神經(jīng)網(wǎng)絡(luò)模型對竊電行為進(jìn)行檢測的方法。該方法利用門控循環(huán)單元和長短時記憶網(wǎng)絡(luò)建立模型,通過采集到的用電量數(shù)據(jù),利用網(wǎng)絡(luò)提取數(shù)據(jù)的時序特性,并進(jìn)行分類,以實現(xiàn)對竊電的檢測。雖然該方法對竊電行為檢測的準(zhǔn)確度較高,但不能對竊電行為進(jìn)行定位。
基于此,本文針對現(xiàn)有文獻(xiàn)存在的準(zhǔn)確度不高、漏檢和不能實現(xiàn)對竊電行為準(zhǔn)確定位等問題,提出了改進(jìn)的K-means聚類算法,主要是通過平均密度與最遠(yuǎn)距離確定初始聚類中心[5];將處理后的用電信息采集系統(tǒng)中采集的與竊電行為相關(guān)的特征參數(shù)作為自變量,建立以定位竊電用戶為目的的三維特征因子關(guān)聯(lián)模型,與電壓和電流不平衡率的波動情況相結(jié)合[6],實現(xiàn)對竊電行為定位。
竊電行為定位是指利用遙感技術(shù)、電磁波定位技術(shù)、GPS定位技術(shù)等方式,對竊電行為進(jìn)行定位和監(jiān)控,以保障電力系統(tǒng)的穩(wěn)定運行和公共安全。本研究中用電信息采集系統(tǒng)主要包含電能計量裝置、數(shù)據(jù)采集裝置、數(shù)據(jù)處理軟件和數(shù)據(jù)中心或云平臺等部分[7]。電能計量裝置用于實時測量電力系統(tǒng)的電能消耗情況,通常包括電能表、智能電表等。通過用電信息采集系統(tǒng),可以幫助用戶實時監(jiān)測和管理電力消耗情況,優(yōu)化能源使用效率,降低用電成本。用電信息采集系統(tǒng)的結(jié)構(gòu)圖如圖1所示。
圖1 用電信息采集系統(tǒng)結(jié)構(gòu)
竊電技術(shù)是一種非法獲取電力的手段,具有隱蔽性強(qiáng)、技術(shù)要求高、危害性大和社會普遍性等特點[8]。新型的竊電手段通常包括對電表計量設(shè)備進(jìn)行修改和破壞、利用磁場對電表進(jìn)行計量干擾、破壞電表和供電回路等類型,竊電技術(shù)分析如圖2所示。
圖2 竊電技術(shù)分析圖
通過圖2可知,竊電技術(shù)通常是圍繞電能計量進(jìn)行展開的,因此對竊電行為進(jìn)行定位分析時,以線損、電量、電壓、電流和功率因數(shù)等數(shù)據(jù)為主要研究對象是必要的。在竊電行為定位中,遙感技術(shù)是常用的一種技術(shù)。該技術(shù)可以通過發(fā)送電磁波來探測目標(biāo)物體的位置、大小等信息,從而實現(xiàn)對竊電行為的實時監(jiān)測。
K-means算法是一種常用的聚類算法。該算法的目標(biāo)是將樣本分為k個不同的簇,使得同一個簇內(nèi)的數(shù)據(jù)相似度較高,而不同簇之間的數(shù)據(jù)點相似度較低[9]。具體流程如下:
(1)初始化:隨機(jī)選擇k個用電信息數(shù)據(jù)樣本點作為初始的聚類中心,即確定類別數(shù)目k和初始質(zhì)心。
(2)計算距離:對于每個數(shù)據(jù)樣本點,統(tǒng)計其與k個中心的距離,將該數(shù)據(jù)樣本點劃分到最近的簇中。對其進(jìn)行相似度測試:
式(1)是歐式距離表達(dá)式。其中,Lij是各個數(shù)據(jù)點到不同初始聚類中心的距離;Zik是數(shù)據(jù)的歸一值;Zjk是步驟(1)中的初始質(zhì)心;μ為參數(shù),用于調(diào)整相似度;n是常數(shù)。
(3)更新聚類中心:對于每個簇,再一次計算簇內(nèi)數(shù)據(jù)樣本點的均值,將其作為新的聚類中心。
(4)重復(fù)步驟(2)和(3),直到收斂(即聚類中心不再變化)為止。其收斂性判斷公式為:
式中,E為收斂性判斷;Zε為聚類Ci中的數(shù)據(jù)樣本;mi為步驟(3)中確定的新的聚類中心。
此算法是一種經(jīng)典的聚類算法,優(yōu)點在于簡單易懂、計算速度快。在對竊電行為進(jìn)行定位分析時,需要處理用電信息采集系統(tǒng)采集到的大量的數(shù)據(jù),算法相對來說可伸縮性強(qiáng)且高效。
但是K-means算法的缺點也較為明顯,如對初始聚類中心的選擇較為敏感,對數(shù)據(jù)點分布不均勻的情況容易出現(xiàn)聚類效果不佳等問題?;诖?,通過利用平均密度與最遠(yuǎn)距離的變異加權(quán)改進(jìn)K-means算法,實現(xiàn)對初始聚類中心的穩(wěn)定選擇;對用電信息采集系統(tǒng)中采集的樣本數(shù)據(jù)進(jìn)行降維、降噪和歸一化處理,用于解決數(shù)據(jù)點分布不均勻等問題。
本研究將上述方法應(yīng)用到全球定位系統(tǒng)(GPS)技術(shù)中,對竊電行為進(jìn)行精確定位。該技術(shù)可以確定目標(biāo)物體的位置和方向,并且不受地形地貌的影響,因此可以實現(xiàn)對竊電行為的高精度定位。通過在GPS定位中加入數(shù)字定位以提高用電信息采集系統(tǒng)竊電定位能力。
在進(jìn)行竊電技術(shù)分析時,例如私自接線、竊用電、電力盜竊等違反電力法規(guī)行為、硬件破壞行為、以及數(shù)據(jù)變更行為等,在定位這些行為時,不僅需要進(jìn)行位置定位,也需要數(shù)據(jù)定位和分析。由于初始聚類中心的選取較為敏感且對聚類結(jié)果有較大影響,本文提出對K-means算法進(jìn)行改進(jìn)。設(shè)樣本數(shù)據(jù)集為X={xi|xi∈Rw,i=1,2,…,n},其中,w為維數(shù);xi為樣本數(shù)據(jù);Rw為w維的實數(shù)。
在對竊電行為特征權(quán)重的改進(jìn)上,采用變異系數(shù)的歐式距離實現(xiàn)對數(shù)據(jù)特征的加權(quán)。變異系數(shù) =(標(biāo)準(zhǔn)差 ÷平均值)×100%。當(dāng)變異系數(shù)較低時,說明數(shù)據(jù)較為集中,反之則說明數(shù)據(jù)更加分散。因此,變異系數(shù)可用來比較不同數(shù)據(jù)集或樣本的離散程度大小。
定義樣本中每個維度的特征加權(quán)系數(shù)為vj:
本文采用平均密度與最遠(yuǎn)距離方法對初始聚類中心進(jìn)行選取。
根據(jù)式(1)計算出平均距離:
式(4)中,Avg Dist是平均距離。
密度參數(shù)計算公式如下:
式中,Dens(xi)是密度參數(shù)平均密度表達(dá)式如下:
式中,Avg Dens(D)是平均密度。孤立點判定式如下:
式中,α是倍數(shù)。將滿足式(7)的樣本數(shù)據(jù)點集合到數(shù)據(jù)集N中,其余數(shù)據(jù)點放入集合S中,在S中選取平均密度最大的視為初始聚類中心,將大于Avg Dens(D)的β倍的數(shù)據(jù)點且離初始質(zhì)心最遠(yuǎn)的點作為下一個聚類中心。從而實現(xiàn)對算法的初始聚類中心的確定,即K的確定。
通過上述方法,對不同類型的數(shù)據(jù)信息進(jìn)行分類、定位和分析,以提高不同類型用電信息采集或竊電行為分析效率。
從用電信息采集系統(tǒng)獲取的數(shù)據(jù),存在一定的異常值,采用格拉布斯準(zhǔn)則對其進(jìn)行判別[10]。判別公式為:
式中,M(α,n)是準(zhǔn)則的臨界值,可查表獲得;α是顯著性水平,當(dāng)α=0.01或0.05時,數(shù)據(jù)滿足式(8),即為異常值;n是重復(fù)觀測次數(shù);是數(shù)據(jù)的算術(shù)平均值;s是標(biāo)準(zhǔn)偏差;xd是重復(fù)觀測值;xi是最大殘差絕對值。
本文采用改進(jìn)的K-means聚類算法,需要對多個簇同時進(jìn)行,對于不同的采樣參數(shù),其值有較大差異,若直接對其進(jìn)行聚類,會對精度造成影響。因此需要對各采樣參數(shù)進(jìn)行歸一化處理。
對電壓數(shù)據(jù)進(jìn)行歸一化處理:
式中,U′是歸一化后的采樣電壓值;U是采樣值;Uε是采樣額定值。
對A相、C相電流不平衡率的絕對值進(jìn)行歸一化處理:
式中,θAC是AC兩相的電流不平衡率;IA是A相電流;IC是C相電流;λ是補(bǔ)償參數(shù)。
對其他量綱不同的用電信息參數(shù)進(jìn)行歸一化處理如下:
在對竊電行為定位實現(xiàn)上,本文構(gòu)建三維特征因子關(guān)聯(lián)數(shù)學(xué)模型,通過分析電壓、電流和功率等數(shù)據(jù)的關(guān)聯(lián)性,建立關(guān)聯(lián)模型,通過模型計算值判斷該用戶是否存在竊電行為,從而實現(xiàn)對竊電行為的定位。
將電流、電壓和功率作為竊電評估的主要對象,對用電信息采集系統(tǒng)提供的數(shù)據(jù)經(jīng)過降噪和歸一化處理后,利用K-means算法對此三類參數(shù)進(jìn)行分析,選擇出每一類的離散值,采用關(guān)聯(lián)模型對離散值綜合評判,確定是否屬于竊電用戶。定位竊電用戶流程圖如圖3所示。
圖3 定位竊電用戶流程圖
結(jié)合上述流程圖,現(xiàn)在對上述定位竊電用戶數(shù)據(jù)信息進(jìn)行分析,其中三維關(guān)聯(lián)模型如下:
式中,P是關(guān)聯(lián)模型的計算值;eωi是不同參數(shù)的補(bǔ)償值;ωi是三種參數(shù)的不同權(quán)值,其大小需要根據(jù)竊電行為發(fā)生與實際用電之間關(guān)聯(lián)程度設(shè)定。當(dāng)關(guān)聯(lián)模型值P大于閾值時,可判定該用電用戶處存在竊電。
以某市竊電現(xiàn)象較為嚴(yán)重的5個臺區(qū)中的400戶用戶作為分析對象,使用1~400的編號代表用戶名稱,構(gòu)成實驗樣本。通過定位竊電用戶流程對用電信息采集系統(tǒng)中采集到的數(shù)據(jù)樣本進(jìn)行篩選,采用大數(shù)據(jù)分析軟件Orange對樣本數(shù)據(jù)進(jìn)行聚類分析,其中離散點是需要重點關(guān)注的對象。K-means聚類算法對處理后的數(shù)據(jù)樣本進(jìn)行聚類的結(jié)果如圖4所示,其中△表示電壓數(shù)據(jù)樣本的聚類結(jié)果;表示電流數(shù)據(jù)樣本的聚類結(jié)果;○表示功率數(shù)據(jù)樣本的聚類結(jié)果。
圖4 K-means聚類結(jié)果
從圖4中可以看出,數(shù)據(jù)樣本分布的較為廣泛,不利于對個別特殊離散點進(jìn)行判斷。為了使竊電用戶定位的更加準(zhǔn)確,本文在試驗部分采用邏輯回歸對聚類結(jié)果進(jìn)行處理,提高對離散點判斷的準(zhǔn)確性。邏輯回歸分析結(jié)果如圖5所示。
圖5 邏輯回歸分析結(jié)果
由圖5可知,離散點多處在不同聚類間的臨界處,將圖4和圖5中共同存在的離散點選取出來,利用三維特征因子關(guān)聯(lián)模型對其進(jìn)行綜合評判,從而實現(xiàn)對竊電行為的發(fā)現(xiàn)。
單純利用關(guān)聯(lián)模型對算法聚類結(jié)果進(jìn)行綜合評判,會出現(xiàn)一定的誤判現(xiàn)象。為了提高定位竊電用戶的準(zhǔn)確性,本文結(jié)合用電信息采集系統(tǒng)中檢測的用戶電壓、電流變化趨勢進(jìn)行分析。當(dāng)用戶存在竊電行為時,其電壓和電流的不平衡率會發(fā)生一定的變化波動[11],且電壓不平衡率允許波動值為40%。
電壓不平衡率的計算公式如下:
式中,f是電壓不平衡率;fl是額定電壓;fs是電壓實際值。電流不平衡率的計算公式如下:
式中,i是電流的實際測試值。
根據(jù)用電信息采集系統(tǒng)采集到的電壓、電流數(shù)據(jù)值,經(jīng)過數(shù)據(jù)處理后,對某竊電用戶分析其在竊電時間內(nèi)的電壓和電流不平衡率的波動情況,如圖6所示。
圖6 電壓、電流不平衡率波動情況
由圖6可知,電壓不平衡率在一定時間內(nèi)波動較大,超過正常值較多;電流不平衡率在一定時間內(nèi)出現(xiàn)異常情況。由此可識別出用戶存在竊電行為。
將關(guān)聯(lián)模型對改進(jìn)的K-means聚類算法得出的離散點進(jìn)行綜合評判后的結(jié)果,與電壓、電流不平衡率的波動情況進(jìn)行結(jié)合,用來定位對竊電行為。
為確定本文方案的有效性和準(zhǔn)確性,稽查工作人員對這400戶用戶進(jìn)行逐個篩選排查,得出有8戶存在竊電行為,其中有7戶是本文方案篩選出的,另外1戶因竊電量較少而未被本文方案篩選出,見下表。
表本文方案檢測竊電行為及現(xiàn)場核實情況
本文方案針對400戶用戶進(jìn)行竊電行為的篩查,只有1戶用戶的竊電行為未被篩選出,且沒有出現(xiàn)誤判現(xiàn)象,其準(zhǔn)確率能達(dá)到99%,可滿足供電公司對竊電行為定位的需求,具有一定的實用價值。
本文針對當(dāng)前竊電手段技術(shù),明確了定位竊電行為是一種聚類問題,將用戶分為竊電用戶和正常用電用戶?;谟秒娦畔⒉杉到y(tǒng)采集到的數(shù)據(jù)參數(shù),提出采用改進(jìn)的K-means聚類算法對數(shù)據(jù)樣本進(jìn)行分析,與三維特征因子關(guān)聯(lián)模型和電壓、電流不平衡率的波動情況相結(jié)合,實現(xiàn)對竊電用戶的準(zhǔn)確定位。通過實驗也驗證了該方案對竊電行為的判斷準(zhǔn)確率能達(dá)到99%,且不會將正常用電用戶誤判為竊電用戶,保障了用電企業(yè)和用電用戶的經(jīng)濟(jì)利益,具有較強(qiáng)的實用價值。
本文方案對竊電行為定位的準(zhǔn)確率較高是建立在實驗用戶較少的基礎(chǔ)上進(jìn)行的,對較多、較復(fù)雜的用戶進(jìn)行判定,其準(zhǔn)確率不能保障。且本文所提方案不具有自主學(xué)習(xí)優(yōu)化能力,后續(xù)還需進(jìn)一步研究。