徐濤,楊龍雨,王蓉蓉,范延赫
(1.國網(wǎng)寧夏電力有限公司石嘴山供電公司,寧夏 銀川 753000;2.天津大學(xué)電氣自動化與信息工程學(xué)院,天津 300072)
隨著新能源、電動汽車等充電業(yè)務(wù)規(guī)?;尤牒涂焖侔l(fā)展,智能配電網(wǎng)負荷波動非常頻繁且具有多樣性,常常出現(xiàn)同一臺區(qū)不同時間段電力負荷對應(yīng)差異較大的負荷曲線。即使在同一區(qū)域、同一時間,多類型電力用戶的負荷曲線也會呈現(xiàn)出不同的形式。傳統(tǒng)的用電行為劃分方法已經(jīng)不能滿足現(xiàn)代社會對電能分配的要求,更細致、準確、實用的智能配電網(wǎng)柔性負荷分析技術(shù)被不斷提出和應(yīng)用。掌握電力系統(tǒng)的負荷特性和負荷組成,建立結(jié)構(gòu)穩(wěn)定、參數(shù)準確的綜合負荷模型,有助于保障電力系統(tǒng)的正常運行,為電力公司提供正確的決策支持。海量的居民和商業(yè)組成的住宅用戶作為電力需求側(cè)的重要組成部分,資源調(diào)控潛力巨大,因此,結(jié)合居民積累的大量用電數(shù)據(jù),對于分析居民用電行為模式,充分調(diào)動用戶側(cè)的可調(diào)度資源具有重要意義。采用智能配電網(wǎng)柔性負荷聚類分析算法根據(jù)用戶的用電行為和習(xí)慣對用戶進行分類,然后將用電習(xí)慣相似的用戶歸為同一類,并將同一類別用戶的用電數(shù)據(jù)疊加在一起,建立各類別用戶的負荷預(yù)測模型,有利于優(yōu)化負荷調(diào)度,實現(xiàn)能源管理和優(yōu)化,指導(dǎo)策略制定和市場交易,以及支持負荷預(yù)測和規(guī)劃。
近年來,國內(nèi)外學(xué)者對于智能配電網(wǎng)柔性負荷聚類分析進行了一些研究,主要集中在以下三個方面:(1)設(shè)計合適的負荷聚類算法,提高聚類的有效性,保證聚類結(jié)果的應(yīng)用價值[1-3];(2)根據(jù)負荷聚類的目的改進負荷相似度度量,使聚類更加準確有效[4-5];(3)從高維負荷數(shù)據(jù)中提取能有效反映負荷特征差異的低維特征,提高聚類的質(zhì)量和效率[6-7]。通過將聚類技術(shù)應(yīng)用于無標(biāo)記負荷曲線分類中,可以得到基于負荷特征差異的分類結(jié)果,有助于電力公司準確把握用戶的用電行為模式[8],為需求側(cè)響應(yīng)[9-10]、負荷預(yù)測[11-12]、用電量異常檢測[13]等應(yīng)用提供支持。文獻[14]采用降維技術(shù)和基于動態(tài)時間彎曲距離(dynamic time warping,DTW)的K均值(K-means)算法精確提取負荷曲線特征點。文獻[15]提出一種基于多維標(biāo)度的日負荷曲線聚類方法,使用多維標(biāo)度進行降維處理,使用臨界熵加權(quán)法確定降維指標(biāo)的權(quán)重,并使用加權(quán)歐氏距離作為相似準則。文獻[16]針對數(shù)據(jù)高維爆炸問題,提出一種基于非參數(shù)核密度估計和改進的光譜多流聚類方法。文獻[17]采用灰狼優(yōu)化算法(grey wolf optimizer,GWO)對模糊C均值(fuzzy C-means,FCM)初始聚類中心選擇進行優(yōu)化,用于日負荷曲線聚類分析,有效提高了算法的魯棒性。目前的負荷聚類研究大多采用單一的聚類算法,但這些算法普遍存在局限性,而且上述每種聚類算法針對特定的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)維度都有特定的優(yōu)化準則[17],其聚類效果[18]、聚類精度和魯棒性[19-20]往往難以平衡。
針對上述問題,本文提出一種基于投票策略的智能配電網(wǎng)柔性負荷聚類分析算法,通過考慮用戶負荷曲線數(shù)據(jù)的特點,維護電力系統(tǒng)的正常運行,為電力公司提供正確的決策支持[21]。通過智能配電網(wǎng)柔性負荷聚類分析,能夠更好地理解負荷特征和需求,提高配電網(wǎng)的靈活性、穩(wěn)定性和能源利用效率[22-23],為實現(xiàn)可持續(xù)發(fā)展的智能電力系統(tǒng)做出貢獻。分析寧夏回族自治區(qū)智能配電臺區(qū)實際運行數(shù)據(jù),驗證了所提基于投票策略的智能配電網(wǎng)柔性負荷聚類分析算法的有效性。
投票聚類的意義在于提高聚類結(jié)果的穩(wěn)定性,減少主觀性和算法依賴性,綜合不同方法的優(yōu)點處理大規(guī)模和高維數(shù)據(jù),以及融合先驗知識和專家經(jīng)驗。通過集成多個聚類結(jié)果,能夠得到更可靠、全面且具有泛化能力的聚類結(jié)果,為智能配電網(wǎng)柔性負荷聚類提供有力支持。投票聚類在配電網(wǎng)柔性負荷分析、預(yù)測、調(diào)度和管理等方面具有一定的關(guān)系[24]。通過應(yīng)用投票聚類方法,可以綜合不同的聚類結(jié)果,提高智能配電網(wǎng)柔性負荷的分類準確性、預(yù)測準確性,優(yōu)化調(diào)度策略,并支持柔性負荷的市場交易和管理。這為電力系統(tǒng)的可靠運行、能源管理和市場運營提供了有力支持。
投票聚類是一種基于投票原則的聚類算法[25]。如圖1所示,在聚類過程中,每個數(shù)據(jù)點都被視為一個候選聚類中心,并通過與其他數(shù)據(jù)點的相似度進行投票來確定最終的聚類中心。
圖1 投票聚類
投票法的思想是最大限度地利用基礎(chǔ)聚類算法對數(shù)據(jù)進行區(qū)分,根據(jù)基礎(chǔ)聚類結(jié)果對數(shù)據(jù)進行分類[26]。但是,在每個基礎(chǔ)聚類結(jié)果中沒有統(tǒng)一的分類識別,因此需要在投票方法中設(shè)計不同聚類算法結(jié)果的統(tǒng)一函數(shù)來處理該問題。投票聚類的步驟如下:
1)初始化。將每個數(shù)據(jù)點視為一個獨立的聚類中心。
2)計算相似度。通過計算數(shù)據(jù)點之間的相似度,如歐氏距離或余弦相似度,來度量它們之間的相似性。
3)投票。對于每個數(shù)據(jù)點,計算與其相似度高于閾值的其他數(shù)據(jù)點數(shù)量,并將其視為投票數(shù)。
4)根據(jù)投票結(jié)果更新聚類中心。選取投票數(shù)最高的數(shù)據(jù)點作為當(dāng)前聚類中心,將其他數(shù)據(jù)點分配給最近的聚類中心[27]。
5)重復(fù)步驟3)和4),直到?jīng)]有新的聚類中心產(chǎn)生或滿足停止條件(如達到最大迭代次數(shù))為止。
確定柔性負荷聚類數(shù)量在智能配電網(wǎng)中具有重要的意義,可以幫助系統(tǒng)實現(xiàn)負荷調(diào)度與控制、負荷預(yù)測和優(yōu)化、能源管理與供需平衡以及系統(tǒng)規(guī)劃與擴展等目標(biāo)。輪廓系數(shù),是用于評價聚類效果好壞的一種指標(biāo),可以描述聚類后各個類別的輪廓清晰度。如式(1)所示:
(1)
式中:ai表示內(nèi)聚性,即一個樣本點與類內(nèi)元素的緊密程度;bi表示分離度,即同一類別中不同樣本之間的距離。ai的計算公式見式(2)。
(2)
式中:d(i,j)表示同一類中樣本i與樣本j之間的距離;ai越小表示該類越緊密,聚類效果越好。
bi的計算方式與ai類似,需要遍歷其他類以獲得多個值,并選擇最小值作為最終值。
選取馬氏距離作為d的距離函數(shù),如式(3)所示。
(3)
式中:P為數(shù)據(jù)集的協(xié)方差矩陣;x=(x1,x2,x3,x4,…,xp,)T,μ=(μ1,μ2,μ3,μ4,…,μp,)T是數(shù)據(jù)集各維的均值矩陣。
一致性功能設(shè)計可以實現(xiàn)負荷平衡和調(diào)度優(yōu)化,提高系統(tǒng)可靠性和魯棒性,優(yōu)化能源管理和實現(xiàn)彈性響應(yīng),同時促進用戶參與和提升用戶滿意度。選取一種聚類算法作為基準算法,并將其余聚類算法與基準算法進行比較。假設(shè)選擇C1作為基準聚類算法,將數(shù)據(jù)集劃分為k類,另一種聚類算法Cn(n=2,3,4…)構(gòu)造結(jié)果一致的矩陣S1n,如式(4)所示。
式中:S1n為聚類算法C1與聚類算法Cn結(jié)果的統(tǒng)一矩陣;Smn表示C1中第m類與Cn中第n類重疊的樣本個數(shù)。
取每一行數(shù)據(jù)的最大值所對應(yīng)的n作為m的匹配類別標(biāo)簽,即Cn中的n和C1中的m為對應(yīng)的類別標(biāo)簽,通過這種方法可以統(tǒng)一不同聚類算法的類別標(biāo)簽。
基準聚類算法的確定是設(shè)計投票聚類一致性函數(shù)的重要步驟,而基準聚類算法的設(shè)置對最終聚類結(jié)果起著關(guān)鍵作用。在本文中,通過卡林斯基-哈拉巴斯指數(shù)(Calinski-Harabaz,CH)度量來衡量聚類結(jié)果的有效性,以選擇基準聚類。CH指數(shù)通過類間方差和類內(nèi)方差來計算,值越大,表示類本身越緊密,類間越分散,即聚類效果越好。
(5)
SSb=tr(Bk)
(6)
(7)
SSW=tr(Wk)
(8)
(9)
式中:k表示聚類數(shù)量,N表示所有樣本的個數(shù),SSb為類間方差,SSw為類內(nèi)方差,Bk為類間距離,Wk為類內(nèi)距離,nq為第q類的樣本個數(shù),cq為類q的聚類中心,cE為所有類的聚類中心,Cq是q中所有數(shù)據(jù)的集合。
選擇合適的特征指標(biāo)有助于提高智能配電網(wǎng)中柔性負荷的聚類精度,實現(xiàn)電網(wǎng)優(yōu)化運行、負荷平衡、電力質(zhì)量提升和能源經(jīng)濟效益的目標(biāo)。首先,對用戶基線用電等變量進行標(biāo)準化處理;其次,用戶負荷曲線是一個細粒度的時間序列數(shù)據(jù),如果直接將其作為算法的輸入量,其高維性會降低算法中距離測量的準確性,從而影響聚類精度;因此,對電力負荷曲線進行聚類,一般是先提取其特征指標(biāo),實現(xiàn)降維;最后,選擇在機器學(xué)習(xí)中廣泛使用的集成樹模型來擬合數(shù)據(jù)。訓(xùn)練過程基于交叉驗證的網(wǎng)格搜索,集成樹模型參數(shù)設(shè)置如下:
把熵作為模型信息增益度的評價指標(biāo),設(shè)對原始數(shù)據(jù)集進行放回抽樣生成的子數(shù)據(jù)集個數(shù)為100熵,單樹構(gòu)建過程中的最大特征數(shù)為16熵,決策樹最大深度為21熵,節(jié)點可分的最小樣本數(shù)為6熵。通過對模型進行擬合,得到6個具有代表性的電力消耗維度指標(biāo),各指標(biāo)的物理含義如下:(1)日常用電量,工作日每日平均用電量;(2)假期用電量,休息日每日平均用電量;(3)日常高峰時段用電量,工作日11:00—13:00的用電量;(4)假期高峰時段用電量,休息日11:00—13:00的用電量;(5)電力消費的長期增長率,用電量的增長幅度;(6)歷史平均用電量,指用戶每月平均用電量。
智能配電網(wǎng)柔性負荷使用投票聚類方法可以支持負荷響應(yīng)、能源調(diào)度、故障檢測與隔離等關(guān)鍵任務(wù),提供決策支持和規(guī)劃依據(jù),促進智能配電網(wǎng)的可靠性、靈活性和經(jīng)濟性。輸入用電量數(shù)據(jù)集,對數(shù)據(jù)進行預(yù)處理,然后進行特征工程,實現(xiàn)大量高維數(shù)據(jù)降維,得到反映用戶能耗特征的數(shù)據(jù)。采用投票聚類算法對數(shù)據(jù)集進行獨立聚類,對聚類結(jié)果計算CH指數(shù),確定基準聚類算法;通過一致性函數(shù)矩陣統(tǒng)一各成員算法的聚類結(jié)果,并將其劃分為全票和非全票的樣本輸出,如圖2所示。
圖2 投票聚類算法
本研究的數(shù)據(jù)來源于2020年至2022年寧夏回族自治區(qū)智能配電臺區(qū)實際運行數(shù)據(jù)。經(jīng)過篩選,選取1 694戶作為研究人群,利用這1 694戶的96點日負荷曲線數(shù)據(jù)(包括工作日和休息日)進行基于投票策略的智能配電網(wǎng)柔性負荷聚類分析。
對數(shù)據(jù)集中的日負荷數(shù)據(jù)進行聚類。選取了K-means算法、GWO-FCM算法、高斯模糊(Gaussian Fuzzy)算法和自組織映射(self-organizing map,SOM)算法等4種算法。圖3顯示了對于給定數(shù)量的不同聚類,每個算法獨立運行時聚類結(jié)果的輪廓系數(shù)度量與度量之和。
圖3 不同算法的輪廓系數(shù)
從圖3可以看出,四種聚類算法對用戶數(shù)據(jù)集的聚類效果相對穩(wěn)定。當(dāng)聚類數(shù)為3時,4種算法的輪廓系數(shù)得分均較高,因此本文選擇的最優(yōu)聚類數(shù)為K=3。
選取傳統(tǒng)K-means算法、GWO-FCM算法及投票聚類算法進行聚類研究。設(shè)聚類數(shù)K=3,對負荷曲線進行聚類分析。圖4—圖6顯示了以上3種聚類算法的日負荷曲線聚類結(jié)果。
(a)三峰型曲線
(b)晚高峰型曲線
(c)平穩(wěn)型曲線圖4 K-means算法日負荷曲線聚類結(jié)果
(a)三峰型曲線
(b)晚高峰型曲線
(c)平穩(wěn)型曲線圖5 GWO-FCM算法日負荷曲線聚類結(jié)果
(a)三峰型曲線
(b)晚高峰型曲線
(c)平穩(wěn)型曲線圖6 投票聚類算法日負荷曲線聚類結(jié)果
通過比較不同類型的日負荷曲線可知,對于單條負荷曲線的聚類,投票聚類算法的聚類結(jié)果中同一類的負荷曲線之間較為緊密,而傳統(tǒng)K-means算法和GWO-FCM算法均存在部分日負荷曲線偏離聚類中心較遠的情況。因此,相較于其他算法,投票聚類算法效果更優(yōu)。
以1 694個智能配電臺區(qū)住宅用戶的日負荷曲線得到的特征指標(biāo)作為輸入量,計算出各算法的CH值和聚類時間,對其他算法和投票聚類算法進行了測試。表1給出了各聚類算法的CH信息值,表2給出了不同算法所消耗的時間。
表1 不同聚類結(jié)果的CH值
表2 不同算法的聚類時間
4種算法中,傳統(tǒng)K-means算法和SOM算法的聚類穩(wěn)定性高于其余2種算法的穩(wěn)定性,聚類效果保持在較好的水平。GWO-FCM算法的聚類效果得分在4種算法中排名第一,但其穩(wěn)定性不如K均值算法和SOM算法。用CH指數(shù)作為聚類效果有效性的度量可以看出,投票聚類算法在工作日和休息日的CH值都保持了最高的排名,相對于K-means、GWO-FCM、高斯模糊(Gaussian fuzzy)和自組織映射(SOM)算法的平均CH指標(biāo)分別提高了34.61%、7.38%、57.72%和24.30%,聚類結(jié)果的有效性平均提高了31%,并且投票聚類算法相較于其他4種算法消耗的時間最少。驗證了本文提出的基于投票策略的智能配電網(wǎng)柔性負荷聚類分析算法使寧夏回族自治區(qū)智能配電臺區(qū)數(shù)據(jù)聚類的效率顯著提高。
研究了基于投票策略的智能配電網(wǎng)柔性負荷聚類分析算法,解決了傳統(tǒng)聚類算法的聚類效果、聚類精度以及魯棒性難以平衡的問題。通過集成樹擬合,實現(xiàn)智能配電網(wǎng)臺區(qū)柔性負荷高維數(shù)據(jù)的降維。利用馬氏距離克服聚類指標(biāo)維度的相關(guān)性,進而確定有效聚類數(shù)。通過CH指數(shù)確定基準聚類算法,最終選擇一致性函數(shù)矩陣對聚類結(jié)果進行統(tǒng)一,攻克了聚類結(jié)果不穩(wěn)定的問題,得到一個更一致、更穩(wěn)定的總體聚類結(jié)果。通過寧夏回族自治區(qū)智能配電臺區(qū)實際運行數(shù)據(jù)分析,驗證了所提基于投票策略的聚類算法的有效性。
供電公司可以通過這種聚類方法對轄區(qū)內(nèi)居民用電數(shù)據(jù)進行分析,了解居民用電行為特征,制定科學(xué)的調(diào)控策略,引導(dǎo)用戶合理用電,避峰消谷,實現(xiàn)電力資源的合理配置,提高智能配電網(wǎng)的靈活性、穩(wěn)定性和能源利用效率。