馬宗彪,許素安,朱少斌,王晶
(中國計量大學(xué) 機電工程學(xué)院,浙江 杭州 310018)
近年電力市場廣泛發(fā)展,供電側(cè)及電力需求側(cè)管理技術(shù)的普遍應(yīng)用,電力系統(tǒng)的負荷分類已成為電力規(guī)劃、定制電價、負荷預(yù)測、負荷建模等工作的基礎(chǔ)性研究內(nèi)容[1]。因此,深入研究電力系統(tǒng)的負荷分類方法,有利于研究掌握客戶負荷的變化趨勢,對供電側(cè)的科學(xué)管理用電工作具有重要意義。
電力負荷曲線是描述電力負荷需求隨時間變化的特性曲線[2]。在實際應(yīng)用中,通常采用具有代表性的典型季節(jié)的日負荷曲線,將典型的日負荷曲線進行歸一化處理,可得到典型日最大(小)負荷、平均負荷率等信息。針對電力負荷的特征提取及聚類算法,國內(nèi)外學(xué)者進行了相當(dāng)深入的研究工作。目前較為流行的聚類方法有K-means[3]、支持向量機[4]、模糊C均值[5]、自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)[6]等,其中聚類算法能夠深入挖掘數(shù)據(jù)的隱性規(guī)律,具備無監(jiān)督學(xué)習(xí)能力。在文獻[7]提出的模糊集理論基礎(chǔ)上,模糊C均值聚類在樣本模糊隸屬度上,增強了樣本的類屬程度和分類準確性,因此得到廣泛關(guān)注。
歐式距離不僅是聚類分析,更是模糊C均值聚類分析中最常用的距離度量方法[8]。在歐式距離與FCM聚類分析相結(jié)合的研究之中,包含加權(quán)歐氏距離和非加權(quán)歐氏距離[9],根據(jù)加權(quán)歐式距離的性質(zhì),權(quán)值系數(shù)變化能夠明顯改變歐式距離的大小,因此根據(jù)實際應(yīng)用,確定權(quán)重系數(shù),并利用加權(quán)歐式距離進行聚類分析具有科學(xué)依據(jù)[10]。
本文考慮直接從供電側(cè)記錄的用戶負荷數(shù)據(jù)入手,對原始數(shù)據(jù)進行除壞點、歸一化等預(yù)處理操作后,求取每個用戶的典型日負荷曲線。其次,將變分模態(tài)分解中模態(tài)帶寬問題轉(zhuǎn)化為約束優(yōu)化求解,并對每階模態(tài)進行Hilbert變換,不斷更新模態(tài)(IMF)分量中心頻率和頻帶寬,從而避免信號模態(tài)混疊。利用變分模態(tài)分解對負荷曲線分別進行3、4、5階模態(tài)分解和構(gòu)造優(yōu)化,得到重構(gòu)的負荷曲線數(shù)據(jù)。最后,在歐式距離d上引入權(quán)重系數(shù)w,將負荷曲線進行特征加權(quán),利用模糊C均值聚類算法(fuzzy C-means,F(xiàn)CM)對分解后重構(gòu)的負荷曲線進行聚類分析,使得各時段具有不同的權(quán)重。引入典型的聚類有效性函數(shù)P'(U,c)作為判斷最佳聚類數(shù)目c的依據(jù),進而挖掘客戶間不同個體的用電負荷特性規(guī)律,將負荷曲線形態(tài)相似的歸為一類,從而將對應(yīng)的企業(yè)歸為同類負荷群體。
FCM算法是一種基于目標函數(shù)的模糊聚類算法,主要用于數(shù)據(jù)的聚類分析,是一種柔性的模糊劃分方法[11]。其核心思想是使被劃分到同一類的對象之間相似性最大,不同類之間相似性最小。為了借助目標函數(shù)達到求解最優(yōu)聚類的問題,研究者利用均方逼近法構(gòu)造了帶約束的非線性規(guī)劃模型,從而來求解最優(yōu)聚類。
定義數(shù)據(jù)集合X={x1,x2,…,xn}為樣本數(shù)據(jù)集,n為樣本總數(shù),則FCM算法目標函數(shù)Jm定義為
式中:C為聚類中心矩陣;c為聚類數(shù)目;m為隸屬度矩陣U的加權(quán)指數(shù)(m>1);n為樣本總數(shù);dij=||xi-ci||為傳統(tǒng)的歐幾里得距離,表示第i個樣本xi到第i個聚類中心ci的距離;uij為隸屬度矩陣U的元素,表示第i個樣本到第j個聚類中心的隸屬度,且滿足
應(yīng)用拉格朗日乘數(shù)求解目標函數(shù)Jm的條件極值,通過求取偏導(dǎo)得到隸屬度函數(shù)uij以及第i類的聚類中心ci分別為
特征加權(quán)FCM算法為在傳統(tǒng)歐氏距離dij的基礎(chǔ)上[12],引入各維度的特征權(quán)重系數(shù)w={w1,w2,…,wn},以此來考慮各個特征對分類結(jié)果的不同影響,即假定待分析的樣本各維特征對分類結(jié)果的影響程度為w。傳統(tǒng)歐氏距離dij及加入權(quán)重w的歐幾里得距離dij*表示為
基于特征加權(quán)的歐氏距離dij*,目標函數(shù)Jm、隸屬度函數(shù)uij及聚類中心函數(shù)ci中的歐氏距離dij相對應(yīng)變?yōu)榧訖?quán)歐氏距離dij*。
VMD算法是一種非遞歸性的變分模態(tài)分解方法,通過迭代來求解變分函數(shù)最優(yōu)解,適用于對非線性信號進行分解和重構(gòu)[13]。針對EMD算法對信號及采樣點敏感的問題,文獻[14]于2013年將經(jīng)典維納濾波器推廣到多個自適應(yīng)頻帶,利用乘法算子交替方向法(alternate direction method of multipliers,ADMM)對變分模型進行合理優(yōu)化,提出完全非遞歸的變分模式分解模型。VMD算法在電力負荷的特征提取方面鮮有研究,其中的維納濾波器可有效抑制負荷的噪聲和干擾[15?16],對相近負荷的特征頻率進行有效分離,具有良好的魯棒性。
VMD算法可通過構(gòu)造求解約束變分使原始信號分解為數(shù)個IMF分量[17]??杉俣▽⑿盘杅分解為K階模態(tài),相應(yīng)變分構(gòu)造問題概述如下。
(3)利用高斯平滑指標估計出各階模態(tài)IMF分量信號帶寬,可得約束變分問題為
式中:f為待解析信號,k為待解析模態(tài)數(shù)量,{uk}={u1,u2, …,uk}表示解析所得K階模態(tài)IMF分量,{ωk}={ω1,ω2, …,ωk}表示各 IMF 分量中心頻率。
通過引入Lagrange函數(shù)可將上述約束性變分問題轉(zhuǎn)換為非約束性變分問題,從而求取其最優(yōu)解,即
在電力系統(tǒng)中,用戶原始數(shù)據(jù)直接來源于電力采集系統(tǒng),然而由于動態(tài)的數(shù)據(jù)在采集過程中偶有通道擁堵、中斷等不良故障,嚴重影響負荷研究工作的準確性[19]。同時,在負荷特性提取方面,單一權(quán)重的負荷特征不能準確地表示實際負荷特性,在實際應(yīng)用中存在一定的局限性。本文提出基于特征加權(quán)的VMD-FCM算法,利用VMD算法在數(shù)據(jù)處理方面的良好的魯棒性,能有效解決模態(tài)混疊等問題。并且引入特征加權(quán)系數(shù),使FCM聚類分析算法在聚類時更好地與實際情況相結(jié)合。圖1為特征加權(quán)VMD-FCM算法應(yīng)用于負荷分類的流程。
圖1 加權(quán)VMD-FCM算法負荷分類流程Fig. 1 Flow chart of load classification with weighted VMD-FCM algorithm
其中,樣本數(shù)據(jù)為在工作日時間內(nèi)選取的一定容量的負荷數(shù)據(jù),并作為VMD算法的待解析信號組。由于電網(wǎng)采集系統(tǒng)采集到的數(shù)據(jù)結(jié)構(gòu)比較粗糙,可能具有壞點、斷點等,需要對不良數(shù)據(jù)進行修正、標準化和無量綱化等預(yù)處理。通過標準數(shù)據(jù)集,選定加權(quán)可能性劃分系數(shù)P'(U,c),并利用其確定聚類數(shù)目c,與VMD算法解析重構(gòu)后的數(shù)據(jù)組成參數(shù)組輸入到加權(quán)FCM算法中,最終得到分類結(jié)果并進行分析。負荷分類最終在于挖掘每個用戶的負荷特性,并作為電網(wǎng)進行相關(guān)決策的指導(dǎo)。
本案例負荷數(shù)據(jù)來自我國南方某地區(qū)電網(wǎng)供電公司數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(supervisory control and data acquisition,SCADA),根據(jù)帕累托二八定律[20], 即20%的用電用戶所消耗的用電量可占據(jù)全部用戶用電總量的80%,因此大用戶群體在負荷管理中表現(xiàn)出主導(dǎo)地位。本文選取的大用戶以工業(yè)用戶為主,主要包括金屬冶煉、礦物加工、化學(xué)化工等領(lǐng)域。選取20個大電力用戶的7月份工作日負荷數(shù)據(jù)進行實驗分析,其中采樣時間為以24 h為周期,每15 min采樣一次,即96點日負荷曲線圖。對用戶的日負荷數(shù)據(jù)作平均值處理,得到20個大用戶的典型日負荷數(shù)據(jù)曲線。雖同為大用戶群體,但各用戶負荷差異顯著,為比對不同負荷曲線,對20組典型日負荷曲線進行歸一化預(yù)處理,使之全部位于0到1之間。歸一化數(shù)據(jù)表達式為
隨機選取一條典型日負荷數(shù)據(jù)曲線,利用VMD算法分別對曲線進行3、4、5階模態(tài)的分解與重構(gòu)。重構(gòu)后的曲線特性如圖2所示,基于維納濾波器良好的魯棒性,在進行VMD重構(gòu)后的曲線可明顯去除原數(shù)據(jù)的噪聲,維持負荷曲線的連貫性及原有特性,并且從圖中可以看出與原曲線相比具有良好的相似度。
圖2 原曲線及重構(gòu)曲線Fig. 2 Original curve and reconstruction curve
3.2.1 聚類數(shù)目研究
在實際數(shù)據(jù)分類數(shù)未知的情況下,首先需要利用內(nèi)部有效性函數(shù)對聚類數(shù)目c進行確定。首先研究Xie-Beni指標XBI[21]、可能性劃分系數(shù)指標FP(U,c)[22]、模糊熵函數(shù)E(U,c)[23]、加權(quán)可能性劃分系數(shù)P'(U,c)[24]對聚類數(shù)目的影響,選取與負荷曲線特征數(shù)目更加接近及分類數(shù)目較為適中的glass數(shù)據(jù)集進行驗證分析。glass數(shù)據(jù)集由214個樣本組成,特征數(shù)為9,分類數(shù)為6,每類樣本數(shù)目分別為70、76、17、13、9、29。聚類結(jié)果如表1所示。
表1 glass數(shù)據(jù)聚類結(jié)果Table 1 Glass data clustering results
對上述具有較好分離性的數(shù)據(jù)集來說,上述指標大致都能反映出最優(yōu)聚類數(shù)目。針對glass數(shù)據(jù)集,P'(U,c)指標在聚類數(shù)為6時,其值為0.171 65,為P'(U,c)指標在所有聚類數(shù)中的最小值,滿足式(14)的指標定義式,在4個指標中最為準確。該指標突出了數(shù)據(jù)的類內(nèi)緊湊性及類間分離性,并且將數(shù)據(jù)的模糊劃分與幾何結(jié)構(gòu)相融合,可用于負荷分類研究。P'(U,c)指標定義公式為
式中:ci為第i個聚類中心。滿足式(14)的c*即為最佳的聚類結(jié)果[25]。
3.2.2 實例聚類分析
利用P'(U,c)指標對20個電力用戶進行聚類分析,根據(jù)FCM算法中求取P'(U,c)指標的最小值來獲得最佳的聚類數(shù)目c。選取FCM聚類數(shù)目c為3 ~8,隸屬度矩陣U指數(shù)m=2,權(quán)重系數(shù)ω取為96點權(quán)重都為1,選取VMD算法預(yù)設(shè)K值為3、4、5,利用原負荷曲線及VMD分解重構(gòu)的3組負荷曲線進行聚類結(jié)果分析,算法聚類的P'(U,c)指標結(jié)果如表2所示。
由表2中FCM算法的聚類結(jié)果可以看出,當(dāng)聚類數(shù)目c=3時,P'(U,c)指標達到最優(yōu)值。比較FCM算法及VMD-FCM算法的結(jié)果可知,經(jīng)過VMD分解后重構(gòu)的負荷曲線更適合FCM算法聚類,當(dāng)預(yù)設(shè)模態(tài)K=3時,聚類效果最佳,并且隨著聚類數(shù)目c的增加,指標特性分離程度更加明顯。由此表明VMD-FCM算法聚類結(jié)果優(yōu)于FCM聚類算法,提高了聚類的準確性。由圖3能夠看出,將原始數(shù)據(jù)帶入FCM聚類算法中,其迭代次數(shù)為20,經(jīng)過3 ~5階模態(tài)分解重構(gòu)后的曲線迭代次數(shù)分別為8、16、17,且經(jīng)VMD重構(gòu)后的實驗數(shù)據(jù)其目標函數(shù)值略低于原始數(shù)據(jù)。圖4、圖5為聚類數(shù)目c=3時,F(xiàn)CM算法及K=3時VMD-FCM算法的聚類結(jié)果,實驗表明VMD重構(gòu)曲線能明顯加快FCM聚類算法的收斂速度,且能夠提升聚類的類間緊湊性及分離性,在維持負荷曲線原有特性基礎(chǔ)上,提高其平滑度,降低噪聲干擾。
圖3 FCM及VMD-FCM迭代結(jié)果Fig. 3 FCM and VMD-FCM iteration results
圖4 FCM算法聚類結(jié)果Fig. 4 FCM algorithm clustering results
圖5 基于3階模態(tài)分解的VMD-FCM算法聚類結(jié)果Fig. 5 Clustering results of VMD-FCM algorithm based on third-order mode decomposition
表2 P'(U,c)指標聚類結(jié)果Table 2 P'(U,c) index clustering results
3.2.3 加權(quán)系數(shù)研究
用戶典型日負荷曲線在聚類分析時,構(gòu)成樣本集的特征矢量各維特征代表不同時刻的實際意義,因此存在聚類精度及實用性不強等弊端,為解決實用性低的問題,將一個單位周期內(nèi)所有的特征矢量賦予一定的特征權(quán)重,以此更加接近實際應(yīng)用效果,實現(xiàn)負荷分類的物理意義。
本文將特征權(quán)重系數(shù)w={w1,w2,…,wk}引入到歐式距離上,形成加權(quán)歐氏距離,從而控制各維特征矢量的權(quán)值與實際地區(qū)供電方案一致。首先設(shè)定三組特征權(quán)重,比較不同權(quán)重下的FCM目標函數(shù)Jm值及P'(U,c)指標的變化情況。設(shè)定wi=1(i=0,1,2,3,4,5,6,7,20,21,22,23),wi分別取 2、3、4(i=8,9,…,19),即取一天中用電量高峰時段(08:00—19:00)的權(quán)重系數(shù)w為2、3、4,其余時段的權(quán)重系數(shù)w為1。當(dāng)權(quán)重系數(shù)w都為平均權(quán)重1時,即為未加權(quán)重系數(shù)的FCM聚類。如表3所示,記錄了不同特征權(quán)重系數(shù)下的FCM目標函數(shù)Jm及P'(U,c)指標,表4為08:00—19:00時段w=3的P'(U,c)指標值,圖6為加入權(quán)重系數(shù)后最優(yōu)分類數(shù)為5的20個樣本VMD-FCM聚類結(jié)果,每類分別包含的樣本數(shù)為4、4、4、5、3個。
表3 時段08:00—19:00不同特征權(quán)重下的Jm及P'(U,c)Table 3 Jm and P'(U,c) under different feature weights in the period of 08:00—19:00
表4 時段08:00—19:00w=3的P'(U,c)指標值Table 4 The index value of P'(U,c) with w=3 in the period of 08:00—19:00
圖6 基于三階模態(tài)分解的加權(quán)VMD-FCM聚類結(jié)果Fig. 6 Weighted VMD-FCM clustering results based on third-order mode decomposition
由表3及表4結(jié)果可以看出,F(xiàn)CM算法加入特征權(quán)重w后,其聚類中心并沒有改變,但隸屬度矩陣U及目標函數(shù)Jm會受到影響,劃分系數(shù)P'(U,c)指標沒有發(fā)生大的變化。由表4能夠看出當(dāng)聚類數(shù)目為5時,P'(U,c)指標能夠達到最優(yōu)值,表明加入權(quán)重系數(shù)后的最優(yōu)分類數(shù)目會受到影響。5類負荷用戶在黑色虛線內(nèi),即時段08:00—19:00負荷處于高位,在08:00、19:00時附近負荷有驟降趨勢,說明這兩時間段內(nèi)用戶用電相對較少。在針對電網(wǎng)用電規(guī)劃方面,可適當(dāng)提高白天08:00—19:00時的w值,適當(dāng)降低時段06:00—09:00、19:00—21:00的w值,合理配置電力系統(tǒng)用電規(guī)律,為電網(wǎng)減負降耗。
特征權(quán)重w的加入,一定程度上改變了歐式距離的實際意義,從而將每個樣本各個特征分量進行加權(quán)處理,使得典型負荷曲線不再是單一權(quán)值的曲線,而是與地區(qū)電網(wǎng)供電方案的有效結(jié)合,根據(jù)供電實際需要,確定相應(yīng)的權(quán)重系數(shù),對樣本進行聚類分析,形成科學(xué)準確的負荷分類結(jié)果。
加權(quán)VMD-FCM算法能夠有效地區(qū)分同地區(qū)不同用戶的負荷曲線,本文在結(jié)合相關(guān)研究的基礎(chǔ)上,做了以下研究和分析,仿真實驗證明能夠準確地將地區(qū)電網(wǎng)的供電方案與算法相結(jié)合,為制定更為科學(xué)的分時電價、負荷預(yù)測等提供了理論基礎(chǔ)。
(1)通過不同聚類指標的研究,分析P'(U,c)指標在不同聚類數(shù)目下的實驗結(jié)果,結(jié)論所得的聚類數(shù)目c可有效應(yīng)用于FCM聚類中,提高了負荷分類時參數(shù)設(shè)置的準確性。
(2)引入VMD模態(tài)分解算法將典型負荷曲線進行重構(gòu),使P'(U,c)指標最多減小0.03305,改善了FCM聚類精度就收斂速度慢的問題,驗證了VMD算法在負荷分類中的應(yīng)用價值。
(3)針對FCM聚類權(quán)值單調(diào)且唯一的缺點,提出加權(quán)VMD-FCM算法,解決了VMDFCM算法單一權(quán)重的問題,提高了負荷分類的科學(xué)性及實用性。