肖濤,陳湘媛,劉樹來,許陽,肖建紅
(1.國網湖南省電力有限公司供電服務中心(計量中心)智能電氣量測與應用技術湖南省重點實驗室,湖南長沙 410004;2.國網湖南省電力有限公司,湖南長沙 410004)
目前,社會上仍存在一些竊電不良行為,竊電者不僅打亂了供電秩序,也會給國家供電造成一定經濟損失[1]。目前,低電壓電力用戶群分布廣泛,該群體中大量用戶存在偷電行為,總數可達98%以上,為電力用戶帶來極大危害[2]。尤其在用電高峰期間,低壓竊電會給部分臺區(qū)線路造成嚴重損毀。近年來,隨著智能電表及用電信息采集系統(tǒng)的廣泛應用,積累了大量用戶的用電數據。如何將這些數據應用于更全面、準確的竊電探測,防止竊電發(fā)生,具有重要的現實意義。
針對這一問題,相關學者提出了兩種竊電行為識別方法,分別是線損異常判斷[3]和離群點算法[4]的行為識別方法。其中,基于線損異常判斷方法是結合曲線相似性方式判斷低壓臺區(qū)竊電行為;另外一種方法是基于離群點算法的行為識別方法,將數據采集系統(tǒng)與離群算法相結合,在低壓平臺上識別竊電行為。
盡管上述兩種方法識別通過局部迭代搜索,識別了部分竊電行為,但無法做到全局搜索,導致最終識別結果不精準。為此,結合稠密度聚類技術識別低壓臺區(qū)用電竊電行為。
作為一種統(tǒng)計分析方法,稠密度聚類分析是通過對樣本或指數進行分析與研究。與不屬于同一集群的模式相比,集群模式之間的相似點更相似。
根據低壓臺區(qū)用戶用電的規(guī)律性,分析用戶用電記錄的負荷曲線,按照其規(guī)律性特點將用戶用電分為生活用電、辦公用電和生產用電三種。這三種用電量各不相同,一般情況下,生活用電是用電的底層,用電量較少,每天的用電量分布比較均勻;與生活用電相比,辦公用電量較多,由于這些機關事業(yè)單位是按照規(guī)定的作息時間用電,因此,辦公用電的使用范圍也比較廣,被稱為用電頂層[5];生產用電最多,其用電特點是具有嚴格的作息時間,具有鮮明的行業(yè)特點。從每日生產用電的最高水平分布中可以推斷出用戶日程安排和行業(yè)特征[6]。
為了有效測量這三種用電方法,采用同一塊電表進行連續(xù)24 小時的測量。根據所有用戶的用電時間和類型,對其生成的負荷曲線分布圖進行判斷。分別記錄用電用戶的上班時間、下班時間、加班以及全天工作的用電情況,分析當前電流分配規(guī)律。
基于稠密度聚類的初始用電竊電行為數據中心點確定步驟如下所示。
步驟一:通過對數據集中兩兩對象間的d(i,j)進行計算,建立一個n×n維的上三角矩陣[7-9]。
步驟二:建立目標密集區(qū),將每一個對象(編號0,1,…,n-1)作為核心對象,并設置參數MinPts,再根據式(1)計算,即可獲得第一層域的對象編號[10]:
式中,oi表示核心研究對象;p表示固定對象;ε0表示鄰域半徑;MinPts 表示對象個數;coredis(oi,p)表示oi與對象的距離[11]。
步驟三:設定領域層數N,按式(2)計算稠密區(qū)域的物體數目,按半徑擴展逐層展開,把所產生的物體稠密區(qū)域集中起來:
式中,當領域層數N≥2 時,需控制半徑增長速度,增強稠密度的凝聚性。
步驟四:對每個對象稠密區(qū)域的密度進行計算,如式(3)所示:
式中,Ci表示稠密區(qū)域對象個數;U表示整個區(qū)域對象個數。設有n個稠密區(qū)域,確定稠密區(qū)域的平均密度計算公式:
按式(4)計算所有密集區(qū)的平均密度,剔除密度小于平均密度的對象密集區(qū),可得到致密區(qū)域,該方法能有效地消除密集區(qū)和離散點存在的噪聲[12]。
采用常規(guī)K-MedoID 算法計算量大,時間復雜度高,其時間復雜度為O(K(n-K)2),在此過程中,每次迭代處理都需要經過重新聚類分析[13]。為了改善以往識別方法迭代次數多且收斂速度慢的問題,需及時搜索更新用電竊電行為數據中心點,滿足初始中心點的計算需求[14]。通過設定初始聚類中心后,確定o1,o2,…,ok為中心點,即為密集區(qū)域C1,C2,…,CK的中心點。將K中心點的搜索范圍劃分成不同密集的小區(qū)域,能夠有效改善傳統(tǒng)識別方法存在的問題,極大地縮短搜索時間[15]。
根據搜索及時更新的基于稠密度聚類的竊電行為數據中心點,可精準獲取所需數據,由此設計用電竊電行為識別流程。
步驟一:選擇數據源,進行數據篩選,準備用戶用電數據[16]。利用電力信息采集系統(tǒng)和營銷業(yè)務應用系統(tǒng),對近三年內專變竊電用戶的用電負荷信息、事件記錄和檔案信息進行提取、驗證。對竊電用戶的原始數據進行篩選,以排除計量裝置故障造成的誤判數據和完整性差的數據。
步驟二:根據竊電行為特征進行變量選擇,由此得到原始竊電特征集。
步驟三:基于非負矩陣分解的竊電行為進行特征提取。
非負矩陣表達公式為:
式中,A表示竊電特征矩陣;B表示系數矩陣;V表示原始竊電特征矩陣。
利用竊電特征矩陣代替原始竊聽特征量,以提取竊電特征,并將其作為特征變量構建用戶樣本數據集。
步驟四:根據非負矩陣表達公式,計算綜合分值,并且對所有用戶進行竊電嫌疑篩選,最終得到高竊電嫌疑用戶,由負責人員到現場進行核實確認。
1)劃分層次
劃分用電異常指標層次,由上至下的指標層分別為0 層、A 層、B 層。其中0 層表示用電竊電嫌疑指標層;A 層表示歷史數據分析層;B 層表示單項指標層。依據B 層的指標,判斷用戶用電竊電行為,該指標值越大,說明低壓臺區(qū)用電竊電嫌疑也就越大。
2)設置權重
設置B 層指標對應的用電竊電異常行為指數權重,主要為:
3)計算竊電行為指數
通過上述確定的權重,設定R=[]r1,r2,r3,…,rn為A 層指標的狀態(tài)值。則該層指標a1的竊電行為指數表達公式為:
基于式(7)的計算原理,確定ω為各項指標的權重系數,基于此,計算綜合分值:
采用累積法計算B 層指標的方法獲得A 層指標的特征值,并通過累積A 層指標可以得到綜合的用電竊電異常行為評價指標,該指標越大,低壓臺區(qū)用電竊電行為越明顯,由此完成用電竊電行為的識別。
為了驗證基于稠密度聚類的低壓臺區(qū)用電竊電行為識別方法的可行性,對實際低壓臺區(qū)用電竊電產生的數據進行仿真實驗分析,并統(tǒng)計低壓臺區(qū)供電所轄區(qū)內的所有居民在2020 年12 月至2021 年11月的所有用電量。所管轄的低壓臺區(qū)內,共有155 個居民用戶,電能表共156個(1個總表,155個電能表)。
選擇編號為35 和52 的電能表,對比分析這兩個電能表對應的用戶用電竊電情況,如圖1 所示。
圖1 兩個用戶竊電及線損情況對比分析
由圖1 可知,由于在同一低壓臺區(qū)的網絡線路是保持恒定不變的,因此,單一臺區(qū)內線損變化相對穩(wěn)定。依據該指標,構建5×350 高維隨機矩陣,并對該矩陣擴展處理后,轉化為50×350 高維隨機矩陣。在該矩陣中添加白噪聲后,經過滑動窗口切割變換,轉為500×100 高維隨機矩陣。該矩陣在低壓臺區(qū)電能表正常運行和出現竊電行為時的屬性,如圖2所示。
圖2 竊電前后協方差特征值譜分布圖
由圖2 可知,當電能表正常運行時,高維隨機矩陣屬性分布于內環(huán)、外環(huán)以及高維隨機矩陣屬性值譜密度之間;當電能表出現竊電行為后,由于構成的高維隨機矩陣容易出現異常數據,不能再獨立分布,此時的高維隨機矩陣屬性集中分布在內環(huán)。
分別使用線損異常判斷、離群點算法的竊電行為識別方法和基于稠密度聚類識別方法,對比分析竊電發(fā)生后高維隨機矩陣屬性值譜密度函數示意圖,如圖3 所示。
圖3 三種方法竊電發(fā)生后高維隨機矩陣屬性值譜密度函數示意圖
由圖3 可知,當低壓臺區(qū)內電能表正常運行時,線損指標構成的矩陣特征平均譜半徑在整個觀測時間范圍內處于平穩(wěn)狀態(tài),高維隨機矩陣屬性集中分布在內環(huán),不會出現新的竊電行為。當有竊電行為發(fā)生時,高維隨機矩陣屬性值的平均譜半徑在第100天和160 天時,出現兩個顯著突變點,存在新竊電的可能性較大,說明使用基于稠密度聚類的識別方法識別結果更加精準。
文中提出的基于稠密度聚類的低壓臺區(qū)用電竊電行為識別方法,其優(yōu)點是通過定位搜索中心所在區(qū)域的中心點,大大減少了迭代次數和有效區(qū)域更新中心的搜索次數,從而保證了聚類的準確性。在同一時間利用現有數據來分析當前和過去的竊電行為,可以及時發(fā)現異常用電行為。