摘" 要: 在智能電網(wǎng)時代,大部分用電異常行為都會伴隨用電負(fù)荷的變化,研究用戶用電行為對于電力系統(tǒng)的運行和管理都至關(guān)重要。為此,提出一種直接利用負(fù)荷數(shù)據(jù)進(jìn)行計算,通過計算特征用電負(fù)荷曲線與日用電負(fù)荷曲線之間的相關(guān)度來判斷用戶是否存在異常用電行為的方法。在相關(guān)度計算過程中,將歐氏距離與皮爾遜相關(guān)系數(shù)相結(jié)合,以更準(zhǔn)確地判斷用戶的用電負(fù)荷是否發(fā)生重大變化。此外,為提高判斷的準(zhǔn)確性和靈活性,采用自適應(yīng)閾值策略對500組數(shù)據(jù)進(jìn)行實驗研究。相關(guān)度計算的結(jié)果表明,其中122組被判斷為負(fù)荷變化過大,99組數(shù)據(jù)存在負(fù)荷異常事件,該方法的判斷準(zhǔn)確率達(dá)到了81.1%。
關(guān)鍵詞: 異常用電行為; 負(fù)荷檢測; 日用電負(fù)荷曲線; 特征負(fù)荷曲線; 相關(guān)度; 皮爾遜相關(guān)系數(shù); 歐氏距離; 閾值判斷
中圖分類號: TN915.12?34" " " " " " " " " " " " " 文獻(xiàn)標(biāo)識碼: A" " " " " " " " " " "文章編號: 1004?373X(2024)10?0001?05
Abnormal detection and identification of changes in user electricity load
Abstract: In the era of smart grids, most abnormal electricity consumption behaviors will be accompanied by the changes in electricity load. The research on user electricity consumption behavior is crucial for the operation and management of the power system. On this basis, a method of directly using load data for calculation is proposed to determine whether users have abnormal electricity consumption behavior, which can be realized by the correlation between the characteristic electricity consumption load curve and the daily electricity consumption load curve. In the process of correlation calculation, the Euclidean distance is combined with the Pearson correlation coefficient to more accurately determine whether the user's electricity load has undergone significant changes. An adaptive threshold strategy is adopted for the experimental research on 500 sets of data to improve the accuracy and flexibility of judgment. The correlation calculation results show that 122 groups’ data have excessive load changes, and 99 groups’ data have abnormal load events. The accuracy of this method can reach 81.1%.
Keywords: abnormal electricity consumption behavior; load detection; daily electricity load curve; characteristic load curve; correlation; Pearson correlation coefficient; Euclidean distance; threshold judgment
0" 引" 言
21世紀(jì)以來,隨著智能電網(wǎng)的迅猛發(fā)展,電力系統(tǒng)成為了人們?nèi)粘I钪胁豢苫蛉钡囊徊糠?。智能電網(wǎng)不僅直接關(guān)聯(lián)著人們的用電需求,還對經(jīng)濟(jì)發(fā)展和國家安全具有重要影響。在智能電網(wǎng)中,大量涉及用戶用電數(shù)據(jù)的信息可以通過數(shù)據(jù)分析方法得以挖掘,這對于理解用戶用電行為規(guī)律、用電負(fù)荷預(yù)測和防竊電檢測等具有重要意義[1]。
研究用戶用電行為規(guī)律對于電力系統(tǒng)運行和管理至關(guān)重要。通過深入分析用戶用電數(shù)據(jù),可以揭示出不同時間段的用電負(fù)荷特征、高負(fù)荷時段以及用電行為的異常變化等信息。這些分析結(jié)果為電力系統(tǒng)規(guī)劃、電力調(diào)度和資源優(yōu)化提供了寶貴的參考,有助于優(yōu)化電力供應(yīng)和提高電網(wǎng)運行的效率和穩(wěn)定性[2]。此外,利用用戶用電數(shù)據(jù)進(jìn)行負(fù)荷預(yù)測可以幫助電力系統(tǒng)工作人員做出準(zhǔn)確的負(fù)荷調(diào)度安排,提前預(yù)測和應(yīng)對高負(fù)荷時段的能源需求。這對于實現(xiàn)電力系統(tǒng)的高效運行、優(yōu)化能源資源利用以及提升供電質(zhì)量都具有重要意義[3]。因此,對用戶用電行為規(guī)律的研究以及利用數(shù)據(jù)分析方法來挖掘和分析用戶用電數(shù)據(jù),在智能電網(wǎng)中具有重要的研究意義和實際應(yīng)用價值。這將為電力系統(tǒng)的可持續(xù)發(fā)展和高效運行提供有力支持,同時也有助于推動能源領(lǐng)域的創(chuàng)新和進(jìn)步[4]。
目前對用戶異常用電行為檢測主要采用機器學(xué)習(xí)的方法。其中,聚類方法[5?8]和深度學(xué)習(xí)方法[9?10]運用最為廣泛。但是這些利用機器學(xué)習(xí)的檢測方法一般都需要大量的人工標(biāo)記數(shù)據(jù),且離散型數(shù)據(jù)需要進(jìn)行類型轉(zhuǎn)換,因而容易導(dǎo)致重要信息的丟失。本文提出一種直接利用負(fù)荷數(shù)據(jù)進(jìn)行計算,從而判斷用戶是否存在異常用電行為的方法。
1" 異常用電行為
目前電力部門所記錄的異常事件為26類,并將導(dǎo)致異常的原因分為6類,其中與用電負(fù)荷變化有關(guān)的異常事件有10類,導(dǎo)致發(fā)生負(fù)荷變化的異常原因[11]有5類。某省某縣一年所有異常事件的統(tǒng)計結(jié)果如表1所示。
負(fù)荷類異常分為用電負(fù)荷異常和用電量異常兩種類型。在實際情況中,當(dāng)用電負(fù)荷增加時,即單位時間內(nèi)消耗電能的能力或需求增加,將導(dǎo)致用電量增加;同樣,當(dāng)用電負(fù)荷減少時,即單位時間內(nèi)消耗電能的能力或需求減少,將導(dǎo)致用電量減少。由表1可見,低壓非居民和低壓居民類型的用戶負(fù)荷異常事件占比超過95%。因此,研究低壓用戶的用電負(fù)荷是否發(fā)生重大變化具有非常重要的意義。該研究有助于更好地了解和識別用戶用電負(fù)荷的異常情況,從而提供有效的異常檢測和監(jiān)測手段,確保電力系統(tǒng)的穩(wěn)定運行和資源的合理利用。
2" 研究方法
本文提出了一種組合模型,旨在通過計算特征用電負(fù)荷曲線與日用電負(fù)荷曲線之間的相關(guān)度來判斷用戶用電負(fù)荷是否發(fā)生重大變化。該模型綜合運用了皮爾遜相關(guān)系數(shù)和歐氏距離兩種方法,以便更全面地評估用戶用電負(fù)荷的變化情況。
首先,使用皮爾遜相關(guān)系數(shù)計算特征用電負(fù)荷曲線與日用電負(fù)荷曲線之間的線性相關(guān)程度。皮爾遜相關(guān)系數(shù)是一種常用的統(tǒng)計指標(biāo),用于衡量兩個變量之間的線性關(guān)系程度。通過計算這一系數(shù)可以獲取兩條曲線之間的相關(guān)性程度。
然而,當(dāng)2天的負(fù)荷變化曲線相似性較高,但總量變化較大時,僅通過皮爾遜相關(guān)系數(shù)可能無法準(zhǔn)確地反映出這種變化。為了解決這個問題,本文引入了歐氏距離,通過計算特征用電負(fù)荷曲線與日用電負(fù)荷曲線之間的歐氏距離,綜合考慮線性關(guān)系和總量變化,衡量兩者的整體差異。將皮爾遜相關(guān)系數(shù)和歐氏距離相結(jié)合,得到的相關(guān)度指標(biāo)更全面。再通過自適應(yīng)閾值的確定方法獲得相關(guān)度大小的判斷閾值,從而識別用戶是否發(fā)生了重大用電負(fù)荷變化。該組合模型算法思路如圖1所示。
2.1" 歐氏距離
歐氏距離[12]是一種常用的度量方法,用于計算兩個向量或數(shù)據(jù)點之間的距離。它是基于向量空間的概念,通過計算兩個向量中對應(yīng)元素差值的平方和的平方根來衡量它們之間的距離。歐氏距離的計算方法簡單直觀,可以用于度量數(shù)值型特征或數(shù)據(jù)之間的差異性或相似性。其計算結(jié)果是一個非負(fù)實數(shù),數(shù)值越小表示兩個向量越相似,數(shù)值越大表示兩個向量越不相似。歐氏距離在數(shù)據(jù)挖掘、模式識別、聚類分析等領(lǐng)域中得到廣泛應(yīng)用,可以幫助大家比較和理解不同數(shù)據(jù)點之間的距離關(guān)系,從而進(jìn)行數(shù)據(jù)分析和決策。對于兩個向量[x]和[y],它們的歐氏距離可以通過公式(1)計算得到。
式中:[x1,x2,…,xn]和[y1,y2,…,yn]是向量中對應(yīng)的元素。
2.2" 皮爾遜相關(guān)系數(shù)
皮爾遜相關(guān)系數(shù)[13]是一種用于衡量兩組數(shù)據(jù)之間線性相關(guān)程度的統(tǒng)計量,衡量的是兩組數(shù)據(jù)之間的線性關(guān)系的強度和方向,取值范圍在-1~1之間。皮爾遜相關(guān)系數(shù)通過計算兩組數(shù)據(jù)之間的協(xié)方差和它們各自標(biāo)準(zhǔn)差的乘積來計算,體現(xiàn)的是兩個變量的變化趨勢是否一致,以及變化的幅度是否相似。皮爾遜相關(guān)系數(shù)計算公式如下:
為了減少皮爾遜相關(guān)系數(shù)的誤差,采用滑動窗口取值法對兩組數(shù)據(jù)計算的皮爾遜相關(guān)系數(shù)取均值,計算公式如下:
式中:[s]為每組數(shù)據(jù)個數(shù);[n]為窗口大小。
2.3" 相關(guān)度組合模型
結(jié)合式(1)和式(3)建立相關(guān)度計算的組合模型。將用滑動窗口取值法計算得到的皮爾遜相關(guān)系數(shù)與歐氏距離相除,最后對結(jié)果進(jìn)行處理,得到相關(guān)度[c]的計算模型,計算公式為:
由于皮爾遜相關(guān)系數(shù)的取值范圍為[-1,1],為了確保得到的相關(guān)度為正值,因此將[ρ]的取值范圍通過[ρ+1]的操作平移至[0,2]。為了放大皮爾遜相關(guān)系數(shù)的影響,將其乘以放大系數(shù)k,從而保證其在最終的相關(guān)度[c]中具有足夠的權(quán)重,以便在后續(xù)的分析和比較中更為直觀。
2.4" 自適應(yīng)閾值計算方法
為了準(zhǔn)確評估不同用戶的相關(guān)性,需要設(shè)定一種適用于各個用戶的自適應(yīng)閾值。自適應(yīng)閾值的計算包括以下3個步驟。
1) 通過分析用戶歷史日用電負(fù)荷曲線與特征用電負(fù)荷曲線的皮爾遜相關(guān)系數(shù)得到,當(dāng)涵蓋超過300個數(shù)據(jù)點,確定大約90%以上的相關(guān)系數(shù)小于某一特定值[ρx]時,將[ρx]作為皮爾遜相關(guān)系數(shù)的閾值系數(shù)。
2) 基于電力部門專家經(jīng)驗,當(dāng)用戶的日用電負(fù)荷總和與特征用電負(fù)荷總和之間的差距超過特征用電負(fù)荷總和的[15]時,將此視為潛在的負(fù)荷變化異常情況。
3) 將皮爾遜相關(guān)系數(shù)的閾值[ρx]與負(fù)荷差值的[15]相除,同樣為了放大皮爾遜相關(guān)系數(shù)的作用,乘以一個放大因子[k](同式(4)),得到最終的自適應(yīng)閾值。具體的計算公式如下:
式中:[cx]為自適應(yīng)閾值;[sa]為特征用電總負(fù)荷;[sx]為日用電總負(fù)荷。
3" 算例分析
3.1" 數(shù)據(jù)預(yù)處理
本文針對某省某低壓工廠一年期間的瞬時有功功率數(shù)據(jù)缺失問題進(jìn)行研究,數(shù)據(jù)包括每天96個時刻的數(shù)據(jù)點。為了填補缺失的瞬時有功功率值,本文采用均值法進(jìn)行補齊,并引入了月均值法來填充特定時刻的缺失數(shù)據(jù)。此外,由于在瞬時有功功率數(shù)據(jù)分析中,完整性是非常關(guān)鍵的,缺失太多的數(shù)據(jù)點可能會導(dǎo)致那一天的數(shù)據(jù)失去代表性,而當(dāng)缺失點超過3個時刻,這種失真可能會對整體分析產(chǎn)生不良影響。因此當(dāng)某一天的用電負(fù)荷數(shù)據(jù)中缺失超過3個時刻點時,將該天的數(shù)據(jù)從數(shù)據(jù)集中移除。
3.2" 負(fù)荷曲線提取
用電日負(fù)荷曲線是根據(jù)處理后的數(shù)據(jù)按每日96個時刻繪制的曲線,用來表示該用戶在不同時刻的瞬時有功功率。該曲線展示了用戶在一天內(nèi)不同時間點的能量需求情況。通過觀察用電日負(fù)荷曲線,可以獲得用戶用電行為的一些關(guān)鍵信息,例如高負(fù)荷時段、低負(fù)荷時段以及負(fù)荷的峰值和谷值。這些信息對于電力系統(tǒng)規(guī)劃、能源管理和負(fù)荷優(yōu)化等方面具有重要的參考價值。通過繪制用電日負(fù)荷曲線,能夠直觀地了解用戶在不同時間點的用電需求,從而更好地進(jìn)行用電行為分析。
從每日用電負(fù)荷曲線中提取出特征用電負(fù)荷曲線,提取的方法為將日用電負(fù)荷曲線前面正常的10日對應(yīng)時刻負(fù)荷取平均值,構(gòu)成特征用電負(fù)荷曲線[14]。圖2和圖3分別為該工廠5月24日和5月25日的特征用電負(fù)荷曲線與該日的日用電負(fù)荷曲線。
由圖2可知,5月24日的特征用電負(fù)荷曲線與日負(fù)荷曲線的趨勢相似,且在每個時間段內(nèi)功率差異較小,反映了該日期的正常用電情況。由圖3可知,5月25日的特征用電負(fù)荷曲線與日負(fù)荷曲線存在明顯的差異。經(jīng)證實該日發(fā)生了工廠竊電事件,導(dǎo)致用電負(fù)荷出現(xiàn)了明顯的下降趨勢。
3.3" 相關(guān)度計算
按上述方法,將每天的日用電負(fù)荷曲線與對應(yīng)的特征用電負(fù)荷曲線利用式(1)~式(4)進(jìn)行相關(guān)度計算。式(3)中的[n]取值為10,式(4)中的系數(shù)[k]取值為50。部分計算結(jié)果如表2所示。
由表2可得,5月17日—24日平均相關(guān)度為0.889,與5月25日和5月26日差異較大。這是由于該廠在5月25日和5月26日發(fā)生了竊電事件,導(dǎo)致這兩日的用電負(fù)荷曲線與特征用電負(fù)荷曲線的相關(guān)度遠(yuǎn)遠(yuǎn)小于之前正常時期的相關(guān)度。
3.4" 閾值確定及判定結(jié)果
根據(jù)上述相關(guān)度計算流程,將包括正常用電用戶、設(shè)備故障、疑似竊電等可能導(dǎo)致負(fù)荷發(fā)生不正常變化的用戶共計1 000組日用電負(fù)荷曲線與特征用電負(fù)荷曲線作為訓(xùn)練組,對其進(jìn)行了相關(guān)度計算。通過分析這些數(shù)據(jù),并結(jié)合第2.4節(jié)的自適應(yīng)閾值計算方法,確定判斷閾值。首先取這1 000組數(shù)據(jù)中231組異常事件取正后的皮爾遜相關(guān)系數(shù),超過90%的負(fù)荷異常事件皮爾遜相關(guān)系數(shù)小于0.2,因此皮爾遜相關(guān)系數(shù)取0.2;然后,將皮爾遜相關(guān)系數(shù)取0.2與負(fù)荷差值的[15]相除,并對結(jié)果取相同的放大系數(shù)[k],即[k]=50,代入式(5),得到最后的閾值。
通過這個計算方法確定自適應(yīng)變化的閾值,對上述1 000組訓(xùn)練組數(shù)據(jù)用戶是否發(fā)生負(fù)荷變化過大的情況進(jìn)行判斷,其中256組被判斷為負(fù)荷變化過大情況,實際情況下在這256組中有231組存在負(fù)荷異常事件,判斷準(zhǔn)確率達(dá)到90.2%。取500組測試組數(shù)據(jù)進(jìn)行測試,122組被判斷為負(fù)荷變化過大,其中99組為存在負(fù)荷異常事件,判斷準(zhǔn)確率達(dá)到81.1%;但有兩組存在負(fù)荷異常事件未被判斷為負(fù)荷變化過大,召回率為98%。判定結(jié)果如表3所示。
4" 結(jié)" 語
本文提出了一種用于判斷用戶每日用電負(fù)荷是否存在變化過大的方法。通過對用戶的日用電負(fù)荷曲線與特征用電負(fù)荷曲線的相關(guān)度計算,能夠獲得一個量化指標(biāo),用于判斷負(fù)荷變化的程度。通過引入自適應(yīng)閾值的判斷機制,能夠根據(jù)具體情況動態(tài)調(diào)整閾值,提高判斷的準(zhǔn)確性和靈活性。
本文利用實際數(shù)據(jù)對所提方法進(jìn)行了實驗驗證,判斷準(zhǔn)確率可以達(dá)到80%以上。可見應(yīng)用該方法能夠及時發(fā)現(xiàn)負(fù)荷變化異常的用戶,為后續(xù)的異常事件研究提供有力支持。同時,該方法具有一定的實用性和可操作性,在智能電網(wǎng)時代,準(zhǔn)確判斷用戶用電負(fù)荷是否發(fā)生重大變化對于能源管理、竊電檢測以及設(shè)備故障預(yù)警等方面都具有重要意義。
然而,本文所提方法仍存在一定的局限性和待改進(jìn)之處。例如,自適應(yīng)閾值確定中仍存在一定的主觀性,需要進(jìn)一步探索更客觀和可靠的確定方法。此外,本文僅針對特定領(lǐng)域的數(shù)據(jù)進(jìn)行了分析,未考慮其他因素的影響,因此在應(yīng)用到其他領(lǐng)域時需要進(jìn)一步的驗證和調(diào)整。
參考文獻(xiàn)
[1] 穆晨宇,薛文斌,穆羨瑛,等.基于VMD?LSTM?Attention模型的短期負(fù)荷預(yù)測研究[J].現(xiàn)代電子技術(shù),2023,46(17):174?178.
[2] 萬偉,劉紅旗,杜單單,等.考慮負(fù)荷季節(jié)特性的電力用戶用電行為畫像[J].哈爾濱理工大學(xué)學(xué)報,2023,28(3):45?55.
[3] 李坤奇,孟潤泉,李鳳蓮.融合聚類?卷積?門循環(huán)的居民用電短期負(fù)荷預(yù)測方法[J].太原理工大學(xué)學(xué)報,2023,54(1):203?210.
[4] 何宗澤.基于數(shù)據(jù)挖掘的用戶用電行為分析研究[D].長春:吉林大學(xué),2022.
[5] 王瑩,項雯,張群,等.泛在電力物聯(lián)網(wǎng)下基于DPSO?Kmeans的客戶用電行為分析[J].哈爾濱理工大學(xué)學(xué)報,2022,27(2):106?113.
[6] 武靈耀,郭賀宏,趙慶生,等.基于MACD指標(biāo)與聚類算法的電力用戶用電行為分析[J].上海電力大學(xué)學(xué)報,2023,39(2):105?111.
[7] 鄭思達(dá),梁琪琳,彭鑫霞,等.基于模糊聚類的異常用電行為識別研究[J].電測與儀表,2020,57(19):40?44.
[8] 毛源軍,陳超強,舒一飛,等.基于居民用戶用電行為分析的室內(nèi)大麻種植檢測[J].電力科學(xué)與技術(shù)學(xué)報,2022,37(4):198?208.
[9] 鄒念,張穎,蘇盛,等.基于小時尺度周期特征LSTM?Transformer的用戶竊電識別方法[J/OL].電網(wǎng)技術(shù):1?11[2023?01?06].https://doi.org/ 10.13335/j.1000?3673.pst.2022.1531.
[10] 夏睿,高云鵬,朱彥卿,等.基于SE?CNN模型的竊電檢測方法研究[J].電力系統(tǒng)保護(hù)與控制,2022,50(20):117?126.
[11] 楊培.用電信息采集系統(tǒng)中計量異常事件分析方法與應(yīng)用研究[D].杭州:中國計量大學(xué),2019.
[12] 孫林,張一曼,張辰珂,等.基于改進(jìn)粒子群和K?means聚類的優(yōu)化算法[J].江蘇科技大學(xué)學(xué)報(自然科學(xué)版),2023,37(3):81?90.
[13] 趙源上,林偉芳.基于皮爾遜相關(guān)系數(shù)融合密度峰值和熵權(quán)法的典型新能 源出力場景研究[J/OL].中國電力:1?10[2023?02?27].http://kns. cnki.net/kcms/detail/11.3265.TM.20230227.0856.006.html.
[14] 于小青.基于Storm流數(shù)據(jù)聚類算法的用電異常行為在線監(jiān)測研究[D].北京:華北電力大學(xué)(北京),2021.