江兵,李國榮,孫趙盟,龐宗強(qiáng)
(南京郵電大學(xué)自動化學(xué)院,江蘇省 南京市 210023)
峰谷分時(shí)電價(jià)作為一種常用的電力需求側(cè)管理手段,通過充分發(fā)揮電價(jià)杠桿作用,促使用戶采取合理的用電方式和用電結(jié)構(gòu),有利于實(shí)現(xiàn)電力負(fù)荷“削峰填谷”,提高電力系統(tǒng)穩(wěn)定性及安全性[1-2]。
峰谷時(shí)段的劃分是制定峰谷分時(shí)電價(jià)的基礎(chǔ),劃分方法的結(jié)果直接影響用戶的需求響應(yīng)程度,從而影響分時(shí)電價(jià)的實(shí)施效果[3-5]。當(dāng)前我國居民峰谷時(shí)段劃分主要依據(jù)地區(qū)負(fù)荷的基本特征及工作人員的經(jīng)驗(yàn),缺乏相應(yīng)的理論依據(jù)。因此,研究有效的居民峰谷時(shí)段劃分模型具有十分重要的理論與現(xiàn)實(shí)意義[6-7]。
一個(gè)科學(xué)合理的居民峰谷時(shí)段劃分模型應(yīng)滿足以下2 個(gè)特點(diǎn):1)長期適用性。時(shí)段劃分結(jié)果應(yīng)在一個(gè)較長的時(shí)間范圍內(nèi)適用,如1 季度、半年、1 年等;2)差異性。同一時(shí)段負(fù)荷數(shù)據(jù)差異最小化,不同時(shí)段負(fù)荷數(shù)據(jù)差異最大化[5]。
當(dāng)前國內(nèi)外已有很多關(guān)于居民峰谷時(shí)段劃分的方法。文獻(xiàn)[8]采用半梯形隸屬度方法對單個(gè)典型日的負(fù)荷曲線進(jìn)行分析,通過判斷時(shí)段所處高峰或低谷的概率來劃分峰谷時(shí)段;文獻(xiàn)[9]提出一種基于用戶需求響應(yīng)的峰谷時(shí)段劃分方法,即在文獻(xiàn)[8]方法基礎(chǔ)上,對用戶進(jìn)行電價(jià)響應(yīng)評估,通過評估結(jié)果調(diào)整峰谷時(shí)段劃分屬性,然而,文獻(xiàn)[8-9]都僅考慮用戶某一典型日的負(fù)荷曲線特點(diǎn),無法保證時(shí)段劃分結(jié)果的長期適用性;文獻(xiàn)[10]提出一種以數(shù)據(jù)樣本集高維化處理和K均值聚類分析相結(jié)合的時(shí)段劃分模型,即對全年的用戶負(fù)荷數(shù)據(jù)進(jìn)行K 均值聚類,通過取平均值的方式獲得最終的時(shí)段劃分結(jié)果;文獻(xiàn)[11]采用密度聚類的方法對全年帶有時(shí)點(diǎn)信息的用戶負(fù)荷數(shù)據(jù)進(jìn)行聚類分析,將各時(shí)點(diǎn)的最大密度粒區(qū)間進(jìn)行合并,最終形成峰谷時(shí)段劃分結(jié)果。文獻(xiàn)[10-11]雖然滿足了時(shí)段劃分的長期適用性和差異性原則,但對全年的每條用戶負(fù)荷數(shù)據(jù)都進(jìn)行聚類分析,將無疑增大算法的迭代次數(shù)以及模型實(shí)現(xiàn)的復(fù)雜程度,不具有很強(qiáng)的實(shí)用性。
為了解決傳統(tǒng)峰谷時(shí)段劃分方法因只選取單一典型日而無法在較長時(shí)間范圍內(nèi)適用的問題,提出一種基于長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)和改進(jìn)型K-means 聚類算法(Kmeans clustering algorithm)的居民峰谷時(shí)段劃分模型,利用LSTM 神經(jīng)網(wǎng)絡(luò)強(qiáng)大的長時(shí)間序列提取能力及改進(jìn)型K-means 算法出色的聚類性能獲得用戶最終的時(shí)段劃分結(jié)果。結(jié)果表明,相對于經(jīng)典及當(dāng)?shù)氐臅r(shí)段劃分,所提方法的時(shí)段劃分輪廓系數(shù)結(jié)果平均值更大,方差更小,更能反映居民用戶實(shí)際的用電特點(diǎn)及用電規(guī)律,有利于挖掘用戶側(cè)需求響應(yīng)潛力,獲得更優(yōu)的削峰填谷效果。
居民用戶的負(fù)荷具有較強(qiáng)的規(guī)律性及相似性,受到季節(jié)、日期類型、天氣、經(jīng)濟(jì)發(fā)展水平等多種因素影響[12-13]。但由于居民的峰谷時(shí)段劃分結(jié)果具有長期適用性的特點(diǎn),需要根據(jù)往年的歷史負(fù)荷數(shù)據(jù)情況進(jìn)行長期分析判斷,因此在考慮居民負(fù)荷影響因素時(shí)應(yīng)選取每年固定且主要的部分。
通過研究發(fā)現(xiàn),符合條件的居民用戶負(fù)荷影響因素主要包含以下2 點(diǎn):
1)季節(jié)。不同季節(jié)的負(fù)荷特性存在較大差異,春秋2 季溫度適宜,負(fù)荷用量較少,夏冬2季由于過熱或過冷,用戶使用空調(diào)等調(diào)溫設(shè)備,負(fù)荷用量較大。
2)日期類型。同一季節(jié)工作日和節(jié)假日負(fù)荷存在較大差異,居民在節(jié)假日的負(fù)荷用量較多,休息日的負(fù)荷用量較少,這跟用戶在不同日期類型的用電習(xí)慣有很大關(guān)系。
因此,在對居民用戶進(jìn)行峰谷時(shí)段劃分時(shí),要充分考慮用戶在不同季節(jié)和不同日期類型的用電特點(diǎn)和用電規(guī)律,才能使時(shí)段劃分結(jié)果更符合用戶的實(shí)際情況,更好地發(fā)揮分時(shí)電價(jià)的效果。
如圖1 所示,為某一典型日的居民用戶負(fù)荷曲線分布情況,其中A 點(diǎn)為負(fù)荷曲線當(dāng)日最小值點(diǎn),B 點(diǎn)為負(fù)荷曲線當(dāng)日最大值點(diǎn),C 點(diǎn)為介于A、B 之間的某點(diǎn)。
圖1 某一典型日居民用戶負(fù)荷曲線Fig. 1 Residential user’s load curve in a typical day
針對用戶某一天的負(fù)荷曲線進(jìn)行峰谷時(shí)段劃分,基本原理是根據(jù)用戶當(dāng)天不同時(shí)段負(fù)荷的相對使用量來進(jìn)行評判[10]。即將用戶負(fù)荷使用量相對較多的時(shí)段劃分為峰時(shí)段,負(fù)荷使用量相對較少的時(shí)段劃分為谷時(shí)段,其余的劃分為平時(shí)段。由圖1 可以清楚地發(fā)現(xiàn),最小值A(chǔ) 點(diǎn)一定屬于谷時(shí)段的范圍,最大值B 點(diǎn)一定處于峰時(shí)段的范圍,且A、B 兩點(diǎn)很接近谷、峰時(shí)段的中心位置[5]。
但是,在對用戶較長一段時(shí)間(如1 季度、半年、1 年等)的負(fù)荷曲線進(jìn)行時(shí)段劃分時(shí),如果僅僅利用某一典型日的劃分結(jié)果來代表整段時(shí)間肯定是不合理的,這是因?yàn)橛脩裘刻斓呢?fù)荷曲線都會有一定差異,某一天的時(shí)段劃分結(jié)果不能涵蓋用戶在這段時(shí)間內(nèi)的所有用電信息。
理想的做法是將用戶在這段時(shí)間所有的負(fù)荷數(shù)據(jù)都進(jìn)行計(jì)算評判,然后選取出現(xiàn)最多的時(shí)段劃分結(jié)果。但由于用戶的負(fù)荷數(shù)據(jù)往往比較龐大且會存在一些極端情況,如停電等,傳統(tǒng)的數(shù)學(xué)方法在解決該類問題時(shí)比較棘手。因此,本文引入數(shù)據(jù)挖掘算法中的長短期記憶神經(jīng)網(wǎng)絡(luò)算法(LSTM)以及改進(jìn)型K-means 聚類算法,用以更好地解決居民用戶峰谷時(shí)段劃分問題。
相較于傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò),LSTM 長短期記憶神經(jīng)網(wǎng)絡(luò)可以挖掘時(shí)間序列之間的隱含規(guī)律,解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)在訓(xùn)練時(shí)梯度消失的問題,使得這種特殊的RNN 網(wǎng)絡(luò)具備強(qiáng)大的長時(shí)間序列特征提取能力[14-15],很適合解決峰谷時(shí)段劃分過程中居民負(fù)荷特征提取的問題。它的神經(jīng)元結(jié)構(gòu)如圖2 所示。
圖2 LSTM 神經(jīng)元結(jié)構(gòu)Fig. 2 Structure of LSTM neurons
每個(gè)LSTM 神經(jīng)元內(nèi)部由3 個(gè)門控單元組成,分別是遺忘門、輸入門以及輸出門[13]。
遺忘門決定上一時(shí)刻的單元狀態(tài)有多少要保留到當(dāng)前單元狀態(tài),它的計(jì)算公式如下:
其中:ft為遺忘門的輸出結(jié)果;Wf為遺忘門的權(quán)重矩陣;bf為遺忘門的偏置量;ht?1為上一時(shí)刻神經(jīng)元的輸出結(jié)果;xt為當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入值;[ht?1,xt]代表把ht?1和xt兩個(gè)向量連接為一個(gè)向量;σ為Sigmoid 函數(shù)。
K-means 作為常見的無監(jiān)督學(xué)習(xí)聚類算法,在處理數(shù)值型且無標(biāo)記的居民用戶電力負(fù)荷數(shù)據(jù)方面有著出色的能力[16]。但它的缺點(diǎn)也是顯而易見的,如K值的確定、初始聚類中心的選擇等,都會影響聚類結(jié)果[17-20]。本文結(jié)合電力用戶負(fù)荷的特性對K-means 算法進(jìn)行一定程度的改進(jìn),以提高算法在電力負(fù)荷聚類中的效果。
K值的確定:當(dāng)前我國大部分實(shí)行峰谷分時(shí)電價(jià)的地區(qū)將每天的時(shí)段劃分為峰段、平段以及谷段,且取得了良好的效果,本文采用峰、平、谷3 段劃分法,即K取值為3。
初始聚類中心的選擇:根據(jù)本文1.2 節(jié)的研究內(nèi)容,日負(fù)荷最大值有較大概率處于峰時(shí)段的中心,日負(fù)荷最小值有較大概率處于谷時(shí)段的中心,平時(shí)段的中心有較大概率處于峰谷中心的中間位置。因此,初始聚類中心選擇為最小值點(diǎn)、最大值點(diǎn)以及中值點(diǎn),用以加快聚類速度。
結(jié)合電力負(fù)荷特性的K-means 聚類步驟如下:
1)輸入樣本集S={x1,x2,···,xm},m為樣本的數(shù)量;聚類的簇?cái)?shù)目3;最大迭代次數(shù)N;輸出簇Ct=?,t=1,2,3。
2)計(jì)算樣本集中的最大值和最小值,并記錄其出現(xiàn)的位置分別為a、b;計(jì)算a與b平均值的取整結(jié)果c,則初始的聚類中心μ={a,b,c};
圖3 為本文所構(gòu)建的峰谷時(shí)段劃分模型。模型的執(zhí)行步驟如下。
圖3 峰谷時(shí)段劃分模型Fig. 3 Peak and valley time division model
1)首先輸入一年的負(fù)荷數(shù)據(jù),對負(fù)荷數(shù)據(jù)進(jìn)行有效性檢查和歸一化處理,確保數(shù)據(jù)的準(zhǔn)確可靠,其中歸一化公式如下:
2)根據(jù)本文1.1 節(jié)分析內(nèi)容對負(fù)荷數(shù)據(jù)按照不同季節(jié)和不同日期類型分類,確保分類數(shù)據(jù)具有較強(qiáng)的相似性。
3)將分類后的數(shù)據(jù)共8 組分別加入LSTM進(jìn)行訓(xùn)練,利用LSTM 神經(jīng)網(wǎng)絡(luò)強(qiáng)大的時(shí)間序列特征提取能力獲得用戶4 季度工作日及節(jié)假日的負(fù)荷特征數(shù)據(jù)。
4)將用戶4 季度的工作日及節(jié)假日負(fù)荷特征數(shù)據(jù)分別用改進(jìn)型K-means 算法進(jìn)行聚類,輸出用戶4 季度工作日及節(jié)假日的時(shí)段劃分結(jié)果。
5)由于各個(gè)季度的用電量有較大差異,因此應(yīng)該在權(quán)重矩陣中得到體現(xiàn)。本文以各個(gè)季度中間月份的平均負(fù)荷作為依據(jù),確定每個(gè)季度的權(quán)重系數(shù),公式如下:
6)利用步驟5)計(jì)算得到的時(shí)段權(quán)重矩陣,將4 季度工作日及節(jié)假日負(fù)荷時(shí)段劃分結(jié)果合并,獲得全年的工作日和節(jié)假日時(shí)段劃分結(jié)果。
7)通過模型計(jì)算出來的時(shí)段劃分結(jié)果還應(yīng)結(jié)合當(dāng)前已實(shí)施時(shí)段劃分方案的特點(diǎn),以使模型的輸出結(jié)果盡可能滿足實(shí)際的情況,具體包括:
①要盡可能保證用戶的總電費(fèi)支出不要出現(xiàn)大的波動;峰段、谷段2 個(gè)集合的時(shí)段數(shù)相差不要太大,峰段可以盡量縮短,但不能低于6 h;
②不要出現(xiàn)短時(shí)間(低于2 h)的孤立時(shí)段,如果出現(xiàn),將孤立時(shí)段合并到鄰近平時(shí)段或谷時(shí)段;
③不能確定的時(shí)段按照少數(shù)服從多數(shù)原則進(jìn)行合并。
模型最終輸出居民用戶的全年峰谷時(shí)段劃分結(jié)果,其本質(zhì)上屬于數(shù)據(jù)挖掘中的聚類問題。因此使用聚類有效性指標(biāo)來評估模型的最終輸出結(jié)果。
聚類性能有效性指標(biāo)主要分為2 種,即有監(jiān)督評估指標(biāo)和無監(jiān)督評估指標(biāo)。有監(jiān)督指標(biāo)需要用戶負(fù)荷曲線的實(shí)際分類情況,由于居民用戶負(fù)荷的靈活性,沒有針對某個(gè)用戶的標(biāo)準(zhǔn)分類,因此采用無監(jiān)督指標(biāo)作為評判的標(biāo)準(zhǔn)[14]。本文采用的是無監(jiān)督指標(biāo)中的輪廓系數(shù)Silhouette 指標(biāo),其公式如下
式中:mk為元素k與不包含該元素的集合中所有元素的平均距離;nk為元素k與所在集合中其他元素的平均距離;Sk是Silhouette 指標(biāo)下元素k的計(jì)算結(jié)果,取值范圍是[?1,1],其值越大表明該元素更匹配所屬集合而不與其他集合匹配,聚類效果更優(yōu)。
為了表征某一天的時(shí)段劃分結(jié)果是否合理,本文采用當(dāng)天所有元素的平均Silhouette 結(jié)果作為度量的標(biāo)準(zhǔn),其公式如下
為了驗(yàn)證本文建立峰谷時(shí)段劃分模型的科學(xué)性與合理性,以江蘇省常州某小區(qū)2200 戶居民2017 年全年電力負(fù)荷數(shù)據(jù)為例,進(jìn)行算例仿真。
首先對該小區(qū)居民用戶一年的負(fù)荷數(shù)據(jù)進(jìn)行有效性檢查和歸一化處理,并按不同季節(jié)和不同屬性日分類,最終的負(fù)荷數(shù)據(jù)分類情況如附錄A中的A1、A2 所示。
將分類后的用戶負(fù)荷數(shù)據(jù)重組為1 維的時(shí)間序列分別加入LSTM 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,網(wǎng)絡(luò)的參數(shù)配置如表1 所示。
表1 LSTM 神經(jīng)網(wǎng)絡(luò)參數(shù)配置Table 1 Configuration of LSTM neural network parameters
使用訓(xùn)練好的LSTM 神經(jīng)網(wǎng)絡(luò)模型連續(xù)預(yù)測出24 時(shí)段的用戶負(fù)荷數(shù)據(jù),作為當(dāng)前分類下用戶的負(fù)荷特征數(shù)據(jù)。最終獲得的居民用戶4 季度工作日、節(jié)假日負(fù)荷特征曲線如圖4 和圖5 所示。
圖4 4 季度工作日負(fù)荷特征曲線Fig. 4 Workday load characteristic curve in the fourth quarter
圖5 4 季度節(jié)假日負(fù)荷特征曲線Fig. 5 Holiday load characteristic curve in the fourth quarter
分別對4 季度工作日及節(jié)假日負(fù)荷特征數(shù)據(jù)進(jìn)行改進(jìn)型K-means 聚類,時(shí)段劃分結(jié)果如表2及表3 所示。
表2 全年工作日時(shí)段劃分結(jié)果Table 2 Time interval division results of annual workday
表3 全年節(jié)假日時(shí)段劃分結(jié)果Table 3 Time interval division results of annual holiday
由表2 和表3 可知,春秋2 季在工作日、節(jié)假日的時(shí)段劃分基本相同;夏冬2 季在工作日的谷段均有所延長,其中夏季的谷段是連續(xù)的,冬季的谷段分成2 個(gè)部分;4 個(gè)季節(jié)在節(jié)假日的時(shí)段劃分比較相近,但存在一定的差異。為了充分考慮到4 季的差異性,分別計(jì)算各個(gè)季度中間月份(即4 月、7 月、10 月及1 月)的平均負(fù)荷作為4 季的權(quán)重系數(shù),結(jié)果如下:
由計(jì)算結(jié)果可知,春秋2 季的平均負(fù)荷較為相近,夏季的平均負(fù)荷最高,其次是冬季。利用時(shí)段權(quán)重矩陣將全年工作日及節(jié)假日的結(jié)果合并,如表4 所示。
由表4 可知,與工作日時(shí)段劃分結(jié)果相比,節(jié)假日的峰平谷時(shí)段都相應(yīng)滯后1 h,這跟居民用戶的用電習(xí)慣基本一致。根據(jù)時(shí)段劃分原則對上述時(shí)段劃分結(jié)果進(jìn)行調(diào)整,獲得用戶最終的全年時(shí)段劃分結(jié)果為:峰段(17:00—23:00),共6 h;谷段(23:00—6:00),共7 h;平段(6:00—17:00),共11 h。當(dāng)?shù)貢r(shí)間的時(shí)段劃分結(jié)果為:峰段(8:00—21:00),共13 h;谷段(21:00—次日8:00),共11 h。2 者的時(shí)段劃分對比如圖6 所示。
表4 全年時(shí)段劃分結(jié)果Table 4 Annual time interval division results
圖6 時(shí)段劃分方案對比Fig. 6 Comparison of time interval division schemes
如圖6 所示,其中加號標(biāo)記的階梯線是本文方法的時(shí)段劃分結(jié)果,包含峰、平、谷3 段;圓圈標(biāo)記的階梯線為當(dāng)?shù)氐臅r(shí)段劃分結(jié)果,包含峰、谷2 段;其余的8 條普通曲線是該小區(qū)4 季度工作日與節(jié)假日的負(fù)荷特征曲線,代表小區(qū)用戶全年的負(fù)荷情況。通過曲線可以清楚地發(fā)現(xiàn),在根據(jù)當(dāng)?shù)貢r(shí)間時(shí)段劃分結(jié)果下(圓圈標(biāo)記),谷段的21:00—22:00 負(fù)荷值基本高于峰段全部負(fù)荷值,谷段的7:00—8:00 負(fù)荷值要高于部分峰段在14:00—15:00 的負(fù)荷值,而本文的時(shí)段劃分結(jié)果(加號標(biāo)記)出現(xiàn)類似不符合的情況較少,即本文的時(shí)段劃分結(jié)果要優(yōu)于當(dāng)?shù)氐臅r(shí)段劃分結(jié)果。
為了進(jìn)一步驗(yàn)證本文模型的性能,采用經(jīng)典的模糊半梯形隸屬度時(shí)段劃分方法對相同用戶的負(fù)荷數(shù)據(jù)進(jìn)行時(shí)段劃分,結(jié)果為:峰段(19:00—0:00),共5 h;谷段(0:00—6:00),共6 h;平段(6:00—19:00),共13 h。以該小區(qū)每月15 日的全天負(fù)荷作為測試數(shù)據(jù),分別計(jì)算本文時(shí)段劃分、經(jīng)典時(shí)段劃分及當(dāng)?shù)貢r(shí)段劃分結(jié)果的輪廓系數(shù)Silhouette 值,如圖7 所示。
圖7 不同時(shí)段劃分的輪廓系數(shù)Silhouette 值對比Fig. 7 Comparison of the value of silhouette coefficients under different time interval division
由圖7 可以看出,本文時(shí)段劃分及經(jīng)典時(shí)段劃分結(jié)果的Silhouette 值均在0.5 左右上下波動,但經(jīng)典時(shí)段劃分的曲線波動比較明顯,本文時(shí)段劃分的曲線波動相對較緩,兩者均在當(dāng)?shù)貢r(shí)段劃分曲線之上。通過計(jì)算得出,本文時(shí)段劃分、經(jīng)典時(shí)段劃分及當(dāng)?shù)貢r(shí)段劃分的Silhouette 平均值分別為0.4921、0.4826、0.0077,方差分別為0.0103、0.0568、0.0048。相比之下,本文時(shí)段劃分結(jié)果的平均值更大,方差更小,更能反映居民用戶實(shí)際的用電特點(diǎn)及用電規(guī)律,有利于挖掘用戶側(cè)需求響應(yīng)潛力,獲得更優(yōu)的削峰填谷效果。
1)相比于傳統(tǒng)的單一典型日選取,通過LSTM 神經(jīng)網(wǎng)絡(luò)算法提取的用戶用電特征可以涵蓋用戶在較長一段時(shí)間的用電信息,為時(shí)段劃分算法提供了比較全面的用戶特征數(shù)據(jù)。
2)將K-means 算法與用戶的負(fù)荷特點(diǎn)相結(jié)合,克服了傳統(tǒng)K-means 算法容易陷入局部最優(yōu)解的缺點(diǎn),大大提高了算法的執(zhí)行效率及準(zhǔn)確度。
3)通過模型計(jì)算出來的時(shí)段劃分結(jié)果還應(yīng)結(jié)合當(dāng)前已實(shí)施時(shí)段劃分方案的特點(diǎn),以使得模型的輸出結(jié)果盡可能滿足實(shí)際的情況。
4)通過算例表明,相對于經(jīng)典及當(dāng)?shù)氐臅r(shí)段劃分,本文的時(shí)段劃分Silhouette 平均值更大,方差更小,更能反映居民用戶實(shí)際的用電特點(diǎn)及用電規(guī)律,有利于挖掘用戶側(cè)需求響應(yīng)潛力,獲得更優(yōu)的削峰填谷效果。
(本刊附錄請見網(wǎng)絡(luò)版,印刷版略)