鐘光耀, 邰能靈, 黃文燾, 李 然, 傅曉飛, 紀(jì)坤華
(1. 上海交通大學(xué) 電子信息與電氣工程學(xué)院,上海 200240;2. 國(guó)網(wǎng)上海電力公司,上海 200122)
隨著“雙碳”目標(biāo)的提出,電力作為清潔、高效的二次能源,將在支撐社會(huì)經(jīng)濟(jì)發(fā)展、服務(wù)民生用能需求、構(gòu)建清潔低碳、安全高效能源體系中發(fā)揮更加重要的作用[1].電力供需平衡對(duì)于保障能源安全意義重大.配電網(wǎng)負(fù)荷預(yù)測(cè)是調(diào)度的基礎(chǔ),其預(yù)測(cè)精度對(duì)配電網(wǎng)運(yùn)行的可靠性、安全性與經(jīng)濟(jì)性均有重要影響[2].根據(jù)時(shí)間尺度劃分,配網(wǎng)負(fù)荷預(yù)測(cè)可分為超短期、短期、中期和長(zhǎng)期.在空間尺度上,系統(tǒng)負(fù)荷預(yù)測(cè)側(cè)重于一個(gè)城市、一個(gè)省甚至全國(guó)的負(fù)荷系統(tǒng),因此負(fù)荷水平通常較高,負(fù)荷曲線相對(duì)平滑[3].微電網(wǎng)負(fù)荷預(yù)測(cè)側(cè)重于用戶,因此負(fù)荷水平通常較低,負(fù)荷曲線有明顯的波峰波谷和周期特性.同時(shí)微電網(wǎng)負(fù)荷對(duì)城市交通等因素較為敏感.隨著配網(wǎng)管理的精細(xì)化發(fā)展,單個(gè)配變的短期負(fù)荷預(yù)測(cè)特點(diǎn)與系統(tǒng)級(jí)短期預(yù)測(cè)不同.配電變壓器因用戶數(shù)少,負(fù)載功率呈現(xiàn)波動(dòng)性強(qiáng)、非線性程度高等特點(diǎn),且單個(gè)配變的短時(shí)功率受天氣和用戶偶然用電行為等因素影響.因此配變短期預(yù)測(cè)準(zhǔn)確度較低.此外,隨著配網(wǎng)規(guī)模的不斷增長(zhǎng),負(fù)荷預(yù)測(cè)處理大量數(shù)據(jù)的效率尤為重要.
負(fù)荷短期預(yù)測(cè)方法主要有統(tǒng)計(jì)學(xué)方法以及機(jī)器學(xué)習(xí)方法[4].統(tǒng)計(jì)學(xué)方法包括卡爾曼濾波[5]、線性外推[6]、小波分解法[7]等.統(tǒng)計(jì)方法對(duì)時(shí)序序列的穩(wěn)定性要求較高,而短期預(yù)測(cè)數(shù)據(jù)的波動(dòng)與突變較為頻繁,因此難以有效反映氣象、事件等因素的非線性影響.近年來,模糊推理系統(tǒng)[8]、支持向量機(jī)[9]以及人工神經(jīng)網(wǎng)絡(luò)[10]等機(jī)器學(xué)習(xí)算法逐漸應(yīng)用于短期負(fù)荷預(yù)測(cè),有效提升了模型的非線性擬合能力,其預(yù)測(cè)準(zhǔn)確度普遍優(yōu)于統(tǒng)計(jì)方法.隨著深度學(xué)習(xí)方法的發(fā)展,循環(huán)神經(jīng)網(wǎng)絡(luò)以及深度置信網(wǎng)絡(luò)等均已應(yīng)用于短期負(fù)荷預(yù)測(cè).深度學(xué)習(xí)方法非線性擬合性強(qiáng),因此有更好的預(yù)測(cè)精度[11-12].由于循環(huán)神經(jīng)網(wǎng)絡(luò)易遇到梯度消失等問題,文獻(xiàn)[13]采用長(zhǎng)短期記憶(Long Short-Term Memory, LSTM)模型進(jìn)行超短期負(fù)荷預(yù)測(cè),解決了循環(huán)神經(jīng)網(wǎng)絡(luò)長(zhǎng)期記憶消失的問題,并驗(yàn)證了LSTM的準(zhǔn)確性高于梯度提升以及支持向量機(jī)算法.文獻(xiàn)[14]在LSTM 正向傳遞基礎(chǔ)上增加了反向傳遞,提出了一種針對(duì)新能源系統(tǒng)負(fù)荷的雙向長(zhǎng)短期記憶網(wǎng)絡(luò)短期預(yù)測(cè)模型.文獻(xiàn)[15]將 LSTM 和XGBoost 結(jié)合,利用混合模型進(jìn)行負(fù)荷預(yù)測(cè),有效提升了準(zhǔn)確度.文獻(xiàn)[16]利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)提取負(fù)荷特征,再利用LSTM進(jìn)行負(fù)荷預(yù)測(cè),減小了特征提取的誤差,從而提高了預(yù)測(cè)準(zhǔn)確度.然而,若輸入的時(shí)間序列過長(zhǎng),LSTM仍易出現(xiàn)長(zhǎng)期信息丟失的問題,影響負(fù)荷預(yù)測(cè)準(zhǔn)確率[17].深度學(xué)習(xí)中的Attention機(jī)制能夠自主增強(qiáng)局部信息的權(quán)重,增強(qiáng)模型的全局信息處理能力.在LSTM中引入Attention機(jī)制能夠有效突出序列中關(guān)鍵部分,提高LSTM長(zhǎng)期信息記憶力,從而提升負(fù)荷預(yù)測(cè)時(shí)間長(zhǎng)度以及準(zhǔn)確性.
配電網(wǎng)負(fù)荷數(shù)量大且用電行為特性存在巨大差異.采用統(tǒng)一泛化模型訓(xùn)練預(yù)測(cè)所有配變時(shí),算法收斂性差、預(yù)測(cè)準(zhǔn)確率低,甚至可能導(dǎo)致無法預(yù)測(cè).如果逐個(gè)對(duì)單臺(tái)配變進(jìn)行預(yù)測(cè)建模,雖不會(huì)產(chǎn)生收斂性問題,但計(jì)算資源需求大且穩(wěn)健性差.通過聚類將負(fù)荷分為多個(gè)群體,針對(duì)群體進(jìn)行針對(duì)性建模,能有效提升負(fù)荷預(yù)測(cè)準(zhǔn)確度以及效率[18].文獻(xiàn)[19-20]、[21-22]分別對(duì)負(fù)荷序列和日負(fù)荷峰谷值進(jìn)行聚類,有效提升了負(fù)荷預(yù)測(cè)的準(zhǔn)確率.文獻(xiàn)[23]、[24]分別使用主成分分析法和自編碼器對(duì)負(fù)荷序列進(jìn)行降維處理,提升了聚類效果.以上方法對(duì)負(fù)荷進(jìn)行聚類時(shí),僅利用負(fù)荷序列點(diǎn)對(duì)點(diǎn)的歐式距離或者部分負(fù)荷信息,喪失了負(fù)荷序列的時(shí)序特性.然而在負(fù)荷預(yù)測(cè)中,負(fù)荷的時(shí)序特性尤為重要.短期電力負(fù)荷主要受到天氣因素以及節(jié)假日等因素的影響[25].文獻(xiàn)[26]通過選取待預(yù)測(cè)日的影響因素相似日,構(gòu)建負(fù)荷預(yù)測(cè)模型,取得了較高的預(yù)測(cè)精度.文獻(xiàn)[27]通過聚類挑選合適的樣本,提升了節(jié)假日的預(yù)測(cè)準(zhǔn)確度.但相似日算法在每次預(yù)測(cè)時(shí),都需尋找待預(yù)測(cè)日的相似日進(jìn)行建模,計(jì)算較為繁瑣,且預(yù)測(cè)長(zhǎng)度有限.
本文針對(duì)大規(guī)模配電預(yù)測(cè)中負(fù)荷用電行為以及影響因素多樣的問題,提出一種基于多維聚類的配變負(fù)荷Attention-LSTM短期預(yù)測(cè)方法.利用動(dòng)態(tài)歸整算法計(jì)算了負(fù)荷序列的時(shí)序相似性,并利用改進(jìn)的k-means雙層聚類方法對(duì)負(fù)荷進(jìn)行聚類分析,將所有負(fù)荷分為歐式距離接近、時(shí)序相似性較高以及影響因素接近的類.再依據(jù)影響因素序列相似性對(duì)負(fù)荷數(shù)據(jù)集進(jìn)行分類.針對(duì)每一類負(fù)荷的每一種影響因素序列類搭建Attention-LSTM網(wǎng)絡(luò)模型,并進(jìn)行針對(duì)性訓(xùn)練以及預(yù)測(cè).經(jīng)某配網(wǎng)負(fù)荷多源數(shù)據(jù)驗(yàn)證,并與其他預(yù)測(cè)方法對(duì)比,證明本文所提方法準(zhǔn)確率提升了2.75%且效率提升了616.8%.
為了避免大規(guī)模配電負(fù)荷預(yù)測(cè)過程中資源消耗過大,對(duì)所有配變進(jìn)行如圖1所示的模型構(gòu)建.
圖1 負(fù)荷聚類預(yù)測(cè)模型構(gòu)建過程Fig.1 Process of load forecasting model construction
具體步驟如下:
步驟1由于電網(wǎng)數(shù)據(jù)在采集過程中,數(shù)據(jù)存在重復(fù)、缺失以及異常等問題.對(duì)配變負(fù)荷以及影響因素?cái)?shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,去除異常值和重復(fù)值以及插入缺失值.
步驟2對(duì)每個(gè)配變提取日負(fù)荷特征值,通過非參數(shù)核擬合得到代表配變?nèi)肇?fù)荷特征的典型日負(fù)荷序列.以典型日負(fù)荷序列作為配變的日負(fù)荷特征,能夠減少配變聚類的數(shù)據(jù)量和提升聚類的準(zhǔn)確度.
步驟3依據(jù)典型日負(fù)荷序列對(duì)所有配變進(jìn)行聚類分析,輸出共k′類的配變負(fù)荷分類結(jié)果.通過聚類降低了模型數(shù)量,提高了預(yù)測(cè)效率.
步驟4依據(jù)步驟3的配變負(fù)荷分類結(jié)果,對(duì)每一類配變負(fù)荷進(jìn)行影響因素序列分類,輸出共k″類的影響因素分類結(jié)果.通過影響因素序列分類使每一個(gè)分類結(jié)果對(duì)應(yīng)的負(fù)荷序列變化趨勢(shì)接近.
步驟5通過步驟3和4,得到k′k″類配變負(fù)荷和影響因素序列分類結(jié)果.對(duì)每一個(gè)分類結(jié)果構(gòu)建相應(yīng)負(fù)荷預(yù)測(cè)模型.
步驟6在配變負(fù)荷預(yù)測(cè)階段,每個(gè)配變選擇相應(yīng)的模型,得到最終負(fù)荷預(yù)測(cè)結(jié)果.
若將配變每日負(fù)荷序列加入聚類集合中,不僅造成聚類算法復(fù)雜度增大、效率降低,還會(huì)產(chǎn)生同一配變不同日負(fù)荷序列屬于不同類的情況,導(dǎo)致配變負(fù)荷分類不準(zhǔn)確.因此通過加權(quán)疊加每日負(fù)荷序列得到配變的典型日負(fù)荷序列,代表配變?nèi)肇?fù)荷特征,以便對(duì)配變進(jìn)行聚類分析.由于配變?nèi)萘枯^小,當(dāng)用戶啟動(dòng)或者關(guān)閉大功率電器時(shí),負(fù)荷波動(dòng)較大.因此判定異常數(shù)據(jù)較為困難,易造成典型日負(fù)荷序列計(jì)算不準(zhǔn)確.故采用非參數(shù)核擬合配變負(fù)荷日特征指標(biāo),以擬合聯(lián)合概率作為權(quán)重,降低異常數(shù)據(jù)影響.
從全天、峰期、平期、谷期4個(gè)角度選取5個(gè)特征來反映負(fù)荷的日負(fù)荷特點(diǎn).選取指標(biāo)如表1所示.表中:Pmax、Pmin、Pav分別為每日負(fù)荷最大值、最小值、平均值;Pav, peak、Pav, sh、Pav, val分別為峰期、平期、谷期負(fù)荷平均值.
表1 日負(fù)荷特征指標(biāo)Tab.1 Daily load pattern indexes
針對(duì)每個(gè)配變負(fù)荷,首先選取其過去一年的日負(fù)荷數(shù)據(jù)Xi,Xi=[xi,1xi,2…xi,96],i=1, 2, …, 365 (每15 min一個(gè)負(fù)荷點(diǎn)).再通過日負(fù)荷數(shù)據(jù)計(jì)算日負(fù)荷特征指標(biāo)Yi,Yi=[yi,1yi,2yi,3yi,4yi,5].
對(duì)表1中的5個(gè)特征指標(biāo)yi分別進(jìn)行非參數(shù)核概率密度擬合,得到每個(gè)配變負(fù)荷5個(gè)特征指標(biāo)的概率密度分布,擬合公式為
(1)
式中:h為平滑系數(shù);y為日特征指標(biāo)值;T為樣本選取時(shí)間長(zhǎng)度;K(·)為核函數(shù);σ為數(shù)據(jù)標(biāo)準(zhǔn)差;N為樣本數(shù)量.
核函數(shù)的選擇具有多樣性,當(dāng)平滑系數(shù)確定時(shí),核函數(shù)選擇對(duì)于擬合效果有重大影響.本文選取的核函數(shù)以及相應(yīng)曲線如圖2所示.在擬合過程中,選取擬合效果最優(yōu)的核函數(shù).
圖2 核函數(shù)形式與曲線圖Fig.2 Kernel function form and graphs
以特征指標(biāo)Yi的非參數(shù)核擬合聯(lián)合概率作為日負(fù)荷序列的權(quán)重值,對(duì)一年內(nèi)日負(fù)荷序列加權(quán)相加得到負(fù)荷的日典型負(fù)荷序列:
(2)
式中:fj(Yi)為負(fù)荷第j個(gè)特征值第i天的擬合概率;Li為第i天配變負(fù)荷日負(fù)荷序列.
為了實(shí)現(xiàn)負(fù)荷的準(zhǔn)確聚類,首先對(duì)典型日負(fù)荷序列進(jìn)行歸一化處理,隨后按典型日負(fù)荷序列相似性以及影響因素相似性進(jìn)行分類,得到具有最大相似負(fù)荷特性配變類.
2.2.1典型日負(fù)荷序列相似性 如圖3所示,序列a、b、c為3個(gè)配變負(fù)荷歸一化后的日典型負(fù)荷序列.由于序列a、c的歐式距離小于與序列b的歐氏距離,傳統(tǒng)k-means聚類方法常將序列a、c歸為一類.但是序列a、b的形狀接近,即負(fù)荷變化趨勢(shì)更加接近,在利用時(shí)序信息的預(yù)測(cè)算法中,更應(yīng)歸屬于同一類.因此引入動(dòng)態(tài)時(shí)間歸整(Dynamic Time Warping,DTW)算法來判斷序列的動(dòng)態(tài)相似性.DTW算法將時(shí)間序列進(jìn)行縮短和延伸調(diào)整不同時(shí)間點(diǎn)之間的對(duì)應(yīng)關(guān)系,以對(duì)應(yīng)點(diǎn)之間的距離衡量序列間的動(dòng)態(tài)相似性.經(jīng)計(jì)算,序列a、b的動(dòng)態(tài)歸整距離遠(yuǎn)小于與序列c的動(dòng)態(tài)歸整距離.因此DTW算法可以有效評(píng)估序列間的動(dòng)態(tài)特性.
圖3 負(fù)荷曲線圖Fig.3 Graph of load curves
兩個(gè)典型日負(fù)荷序列Lc,1、Lc,2,Lc,1=(l1,1,l1,2, …,l1,96),Lc,2=(y1,y2, …,ym′).歸整路徑為W=(w1,1,w1,2, …,wm,m′),i為序列Lc,1中的坐標(biāo),j為序列Lc,2中的坐標(biāo),i≤m,j≤m′.歸采用動(dòng)態(tài)規(guī)劃方法求解歸整路徑距離,動(dòng)態(tài)規(guī)劃計(jì)算公式為
(3)
所求得的wm, m′即是時(shí)間序列X、Y的動(dòng)態(tài)歸整路徑距離.
本文充分考慮同時(shí)刻負(fù)荷特性以及序列時(shí)序特性,將歐式距離與動(dòng)態(tài)歸整距離相結(jié)合,形成歐式歸整距離:
(4)
在k-means聚類中,以歐式歸整距離作為相似性計(jì)算方法.
2.2.2影響因素相似性 當(dāng)負(fù)荷日典型序列相似而影響因素不同時(shí),無法選取合適的影響因素相似時(shí)間序列.故在利用歐式歸整距離進(jìn)行k-means聚類基礎(chǔ)上,對(duì)同一類負(fù)荷根據(jù)影響因素進(jìn)一步分類.本文將每日負(fù)荷轉(zhuǎn)換為日平均負(fù)荷并分析與各種因素相關(guān)性,選取因素包括日平均溫度、日平均濕度、日平均風(fēng)速、日類型和天氣類型.其中日平均溫度、日平均濕度、日平均風(fēng)速均經(jīng)過歸一化得到相應(yīng)序列.日類型主要包括工作日、周末以及節(jié)假日.天氣類型主要包括晴、多云、陰、小雨、中雨、大雨.陰雨天不方便出行以及除濕需求會(huì)增加用電量,導(dǎo)致陰雨天比晴天用電量大.天氣以及日類型的標(biāo)記值如表2所示.當(dāng)一天存在多種天氣時(shí),標(biāo)記值取為當(dāng)天所有天氣標(biāo)記值最大值以及最小值的平均值.
表2 天氣以及日類型對(duì)應(yīng)標(biāo)記值Tab.2 Weather and day type corresponding tag values
通過格蘭杰因果檢驗(yàn)方法獲取負(fù)荷和不同因素的影響關(guān)系.以日平均負(fù)荷與日平均溫度為例,首先獲取同長(zhǎng)度的日平均負(fù)荷序列P以及日平均溫度序列T.其格蘭杰因果檢驗(yàn)?zāi)P蜑?/p>
(5)
(6)
式中:Pt為t時(shí)間的功率值;αu,0為無約束回歸模型的常數(shù)項(xiàng);p為變量P的最大滯后期數(shù);αu,i為無約束回歸模型滯后的變量P的系數(shù)估計(jì)值;Pt-i為P的第t-i個(gè)滯后項(xiàng);q為滯后的變量T的最大滯后期數(shù);βu, i為無約束回歸模型滯后的變量T的系數(shù)估計(jì)值;Tt-i為T的第t-i個(gè)滯后項(xiàng);εu,t為無約束回歸模型的隨機(jī)誤差項(xiàng);αr,0為有約束回歸模型的常數(shù)項(xiàng);αr,i為有約束回歸模型滯后的變量P的系數(shù)估計(jì)值;εr,t為有約束回歸模型的隨機(jī)誤差項(xiàng).式(5)為無約束回歸模型,式(6)為有約束規(guī)劃模型.
利用無約束和有約束回歸模型構(gòu)造F統(tǒng)計(jì)量:
F(q,n-p-q-1)
(7)
式中:RSSr和RSSu分別為有約束和無約束回歸模型的殘差平方和;n為樣本容量.
若F≥Fα(q,n-p-q-1) (α分位點(diǎn)),則認(rèn)為系數(shù)估計(jì)值βu,i顯著為0,即日平均溫度不是引起日平均負(fù)荷變化的格蘭杰原因,其間不存在聯(lián)動(dòng)關(guān)系;反之,若F 采用相同的方法求得日平均濕度、日平均風(fēng)速、日類型和天氣類型是否為日平均負(fù)荷的影響因素.若影響則標(biāo)記為1,若不影響則標(biāo)記為0.可得配變的影響特征向量Zi=[zi,1zi, 2zi, 3zi, 4zi, 5]. 2.2.3雙層k-means聚類方法k-means算法存在兩個(gè)問題,一是需要提前確定初始分類數(shù),二是初始中心分布對(duì)最終分類結(jié)果存在較大影響.同時(shí)將負(fù)荷影響因素相差巨大的負(fù)荷分在同一類不利于影響因素相似時(shí)間序列選取.因此為了得到負(fù)荷序列形態(tài)以及影響因素相似的配變簇,提出了基于反向修正原理的雙層聚類模型. (1) 以歐式歸整距離作為相似度的判定標(biāo)準(zhǔn),通過k-means聚類算法對(duì)日典型負(fù)荷序列進(jìn)行聚類,得到K類具有相似時(shí)序負(fù)荷特性的配變負(fù)荷. 選用大衛(wèi)-博爾丁指標(biāo)(Davies-Bouldin Index,DBI)作為聚類結(jié)果的評(píng)判指標(biāo),DBI指標(biāo)(IDBI)基于類內(nèi)距離與類間距離的比值,計(jì)算公式為 (8) (2) 針對(duì)同一配變?nèi)河?jì)算其影響因素特征序列熵值,計(jì)算公式為 (9) 式中:Z為配變?nèi)簝?nèi)影響特征序列的集合;z為集合Z中的特征序列;p(z)為z序列在Z集合中的占比. 若某一類熵值大于等于閾值,則代表該類配變的影響因素區(qū)別較大.不應(yīng)將這些配變分為同一類.因此,選取其中占比最大的兩個(gè)特征序列,并將其所對(duì)應(yīng)典型日負(fù)荷序列作為兩個(gè)新類.剩余特征序列分別計(jì)算與上述兩個(gè)特征序列的歐式距離,將對(duì)應(yīng)典型日負(fù)荷序列加入特征序列歐式距離較近類的子集.若某一類熵值小于閾值,則認(rèn)為該類負(fù)荷的特征序列接近. (3) 重復(fù)步驟(1)、(2)的聚類流程,直至聚類中心大于等于最大聚類中心數(shù)Kmax或者聚類結(jié)果不再變化.最終得到負(fù)荷序列形態(tài)以及影響因素相似的配變簇. LSTM擅長(zhǎng)處理時(shí)序性數(shù)據(jù).在對(duì)電力負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),LSTM可以有效挖掘數(shù)據(jù)之間的時(shí)序信息以及非線性關(guān)系.但是針對(duì)影響因素突變導(dǎo)致的負(fù)荷數(shù)據(jù)突變,LSTM擬合效果不佳.同時(shí)LSTM喪失了數(shù)據(jù)的周期性特征.若將影響因素作為特征輸入,導(dǎo)致網(wǎng)絡(luò)參數(shù)過多,模型收斂困難,準(zhǔn)確率的提升有限.為解決上述兩個(gè)問題,減弱氣象因素、日類型因素對(duì)短期電力負(fù)荷的影響,同時(shí)兼顧負(fù)荷數(shù)據(jù)的時(shí)序性、周期性、非線性,在第2節(jié)的基礎(chǔ)上,對(duì)同一個(gè)類負(fù)荷選擇影響因素相似時(shí)間序列構(gòu)建數(shù)據(jù)集. 通過第2節(jié)聚類后,每個(gè)類中負(fù)荷具有相似的影響因素特征向量.選取其中占比最大的特征向量作為該類的特征向量Zc. 再對(duì)Zc中分量為1的因素通過相關(guān)性分析計(jì)算影響的程度.分別計(jì)算日平均負(fù)荷與日平均溫度、日平均濕度、日平均風(fēng)速、日類型和天氣類型的相關(guān)系數(shù),得到每個(gè)類的相關(guān)系數(shù)向量ρ=[ρ1ρ2…ρM],M為影響因素特征數(shù)量. 選取連續(xù)D1時(shí)間內(nèi)的日平均溫度、日平均濕度、日平均風(fēng)速、日類型和天氣類型序列.選取時(shí)間窗為2D,滑動(dòng)步長(zhǎng)為1,共獲得D1-2D+1個(gè)2MD的影響因素矩陣: (10) 得到相似性: (11) AP(Affinity Propagation)聚類算法相對(duì)于k-means算法,無需同類取平均值作為聚類中心,無需提前指定聚類中心.同時(shí)AP聚類算法的誤差平方和低于其他聚類算法.因此在進(jìn)行影響因素相似時(shí)間序列選取時(shí),具有一定的優(yōu)勢(shì). 影響因素相似時(shí)間序列選取步驟如下: (1) 初始化吸引度矩陣R和歸屬度矩陣A. (2) 計(jì)算的相似性矩陣更新吸引度矩陣R: rt+1(i,k)= (12) 式中:rt+1(i,k)為第t+1輪迭代吸引度矩陣R的i行k列值;S(i,k)為相似度矩陣S的i行k列值;at(i,k)和rt(i,k)分別為歸屬度矩陣A和吸引度矩陣R的i行k列值. (3) 更新影響歸屬度矩陣A. at+1(i,k)= (13) (4) 根據(jù)衰減系數(shù)λ對(duì)吸引度矩陣R和歸屬度矩陣A進(jìn)行衰減 (14) (5) 若矩陣穩(wěn)定或者大于最大迭代次數(shù),輸出聚類中心,流程結(jié)束,得到k″類影響因素相似時(shí)間序列分類結(jié)果.否則轉(zhuǎn)至(2). 配變短期負(fù)荷預(yù)測(cè)中,歷史數(shù)據(jù)從采集到導(dǎo)入數(shù)據(jù)庫存在滯后性,因此預(yù)測(cè)長(zhǎng)度要求較長(zhǎng).當(dāng)預(yù)測(cè)長(zhǎng)度過長(zhǎng)時(shí),易導(dǎo)致LSTM訓(xùn)練難以收斂、長(zhǎng)期信息丟失等問題. 時(shí)序負(fù)荷數(shù)據(jù)中存在大量無關(guān)信息,每個(gè)時(shí)刻負(fù)荷往往與歷史負(fù)荷中的幾個(gè)時(shí)刻點(diǎn)相關(guān)性較高,例如前幾日同時(shí)刻負(fù)荷.Attention通過自動(dòng)對(duì)歷史負(fù)荷值進(jìn)行重要度分配,加強(qiáng)相關(guān)性較高時(shí)刻的負(fù)荷影響,減弱相關(guān)性較低時(shí)刻的負(fù)荷影響.提升了模型長(zhǎng)期信息記憶能力,從而提高LSTM負(fù)荷預(yù)測(cè)模型的準(zhǔn)確率.Attention-LSTM結(jié)構(gòu)如圖4所示. 圖4 Attention-LSTM結(jié)構(gòu)Fig.4 Structure of Attention-LSTM 主要包括4層模型,每層描述如下: (1) 輸入層:輸入經(jīng)過預(yù)處理后的歷史負(fù)荷數(shù)據(jù)l1,l2,…,lT. (2) LSTM層:多層LSTM結(jié)構(gòu)網(wǎng)絡(luò),對(duì)輸入的歷史負(fù)荷數(shù)據(jù)進(jìn)行特征提取,得到不同時(shí)刻的特征值ht. (3) Attention層:賦予LSTM隱層中各個(gè)特征權(quán)重αt, 代表不同時(shí)刻的負(fù)荷值對(duì)于預(yù)測(cè)時(shí)刻負(fù)荷的重要度.權(quán)重的更新公式為 (15) (16) St=f(St-1,yt-1,ct) (17) 式中:g,hj,atj,ct為神經(jīng)網(wǎng)絡(luò)中的隱藏參數(shù).當(dāng)短期負(fù)荷預(yù)測(cè)長(zhǎng)度過長(zhǎng)時(shí),Attention層能夠有效提高歷史信息中重要部分的重要度,忽略非重要部分.因此增加了LSTM 的長(zhǎng)期記憶能力,提高了負(fù)荷預(yù)測(cè)準(zhǔn)確度. (4) 輸出層:經(jīng)過Attention-LSTM結(jié)構(gòu)輸出負(fù)荷預(yù)測(cè)結(jié)果Y. 配電網(wǎng)計(jì)量系統(tǒng)一天共f個(gè)采樣點(diǎn).數(shù)據(jù)集構(gòu)建方式采用輸入-輸出對(duì)的形式,為考慮負(fù)荷的周期性,選取D作為輸入長(zhǎng)度和預(yù)測(cè)長(zhǎng)度.故每組數(shù)據(jù)包含作為輸入的前fD個(gè)點(diǎn)與作為輸出的后fD點(diǎn).總體框架如圖5所示. 圖5 短期負(fù)荷預(yù)測(cè)流程Fig.5 Forecasting process of short-term load (1) 針對(duì)每個(gè)典型負(fù)荷序列類的每個(gè)影響因素相似時(shí)間序列集合均構(gòu)建一個(gè)LSTM模型. (2) 根據(jù)影響因素相似時(shí)間序列的日期構(gòu)建輸入輸出集. (3) 選取80%的輸入輸出集作為訓(xùn)練集,20%作為測(cè)試集. (4) 對(duì)每個(gè)模型進(jìn)行訓(xùn)練,待模型收斂后,利用測(cè)試集進(jìn)行檢驗(yàn),若滿足要求則保存超參數(shù),否則重新訓(xùn)練. (5) 當(dāng)要預(yù)測(cè)下一個(gè)七天負(fù)荷時(shí),首先查找當(dāng)前配變所屬的類.再通過天氣預(yù)報(bào)構(gòu)建未來的天氣因素序列,查找該天氣因素序列與各個(gè)影響因素相似時(shí)間序列類中相似度最高的類.選擇相應(yīng)LSTM模型,載入超參數(shù).將歷史fD的負(fù)荷值輸入模型,得到未來fD的負(fù)荷值. 選取某市配網(wǎng)370臺(tái)公變以及340臺(tái)專變2019年7月1日至2020年10月1日的負(fù)荷數(shù)據(jù)以及氣象數(shù)據(jù),負(fù)荷數(shù)據(jù)的采樣頻率為15 min一次,一天有96個(gè)數(shù)據(jù),氣象數(shù)據(jù)為一天一個(gè)數(shù)據(jù)點(diǎn).以2019年7月1日至2020年6月30日的負(fù)荷以及氣象數(shù)據(jù)作為訓(xùn)練集,2020年7月1日至2020年10月1日的負(fù)荷以及氣象數(shù)據(jù)作為測(cè)試集.首先計(jì)算每個(gè)配變的典型日負(fù)荷序列作為配變特征.再對(duì)所有典型日負(fù)荷序列進(jìn)行聚類分析,得到負(fù)荷序列形態(tài)以及影響因素相似的配變簇.然后對(duì)每一個(gè)配變簇的數(shù)據(jù)集進(jìn)行相似時(shí)間序列分類.對(duì)相應(yīng)的相似時(shí)間序列類搭建Attention-LSTM模型并進(jìn)行訓(xùn)練,以測(cè)試集驗(yàn)證模型的準(zhǔn)確率以及效率. 對(duì)每個(gè)配變的負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理,去除重復(fù)值以及異常值,插入缺失值.提取每日的5個(gè)特征值:負(fù)荷率、日峰谷差率、峰期負(fù)載率、平期負(fù)載率、谷期負(fù)載率.對(duì)5個(gè)特征分別利用參數(shù)法和非參數(shù)法進(jìn)行概率密度估計(jì),其中參數(shù)法為高斯函數(shù),非參數(shù)核函數(shù)分別為高斯核函數(shù)、均勻核函數(shù)、葉帕涅奇核函數(shù)、指數(shù)核函數(shù)、三角核函數(shù)、余弦核函數(shù).5個(gè)特征的分布函數(shù)曲線以及實(shí)際概率密度分布如圖6所示. 圖6 負(fù)荷日特征擬合結(jié)果圖Fig.6 Fitting results of load daily feature 從圖6中可以看出,非參數(shù)核函數(shù)的擬合效果優(yōu)于參數(shù)法,其中三角核函數(shù)的擬合效果最優(yōu).因此選用作為三角核函數(shù)進(jìn)行非參數(shù)擬合.通過2.2節(jié)的方法得到每個(gè)配變的典型日負(fù)荷序列. 以歐式歸整距離作為相似性判定依據(jù),選取聚類中心數(shù)量范圍為2~13.對(duì)每種聚類中心數(shù)分別進(jìn)行多次k-means聚類,并選取IDBI值最低的聚類結(jié)果作為該種聚類中心數(shù)的最優(yōu)聚類結(jié)果,結(jié)果如表3所示.因此選取最優(yōu)聚類數(shù)k=5. 表3 DBI結(jié)果Tab.3 Results of DBI 對(duì)于每個(gè)類,通過格蘭杰因果檢驗(yàn)得到每個(gè)配變的影響特征序列.計(jì)算得到每個(gè)類的熵值如表4所示,選取閾值為0.4. 表4 每類熵值結(jié)果Tab.4 Entropy results for each type 第二類的信息熵值明顯大于其他類的信息熵值,且大于閾值.選取影響因素特征向量占比最大的兩類,Z1=[1 1 0 1 1],Z2=[1 1 0 0 1]作為新類.將剩余的配變分入影響特征向量歐式距離較近的一類.以6類負(fù)荷分類結(jié)果作為k-means初始狀態(tài)重新聚類,得到新的聚類中心結(jié)果如圖7所示,圖中t′為時(shí)刻.每類負(fù)荷影響因素特征向量的熵值均小于0.4,故停止聚類.聚類結(jié)果為6類,其中類2、3序列的歐式距離及時(shí)序特性較為接近,通過影響因素的不同區(qū)分成兩類. 圖7 負(fù)荷聚類中心圖Fig.7 Center graphs of load cluster 依照第3節(jié)的方法對(duì)過去一年的多維影響因素序列進(jìn)行影響因素相似時(shí)間序列選取,共得到9種類型.根據(jù)相關(guān)性分析結(jié)果,負(fù)荷普遍為溫度強(qiáng)驅(qū)動(dòng)型.故僅展示每種聚類結(jié)果的溫度信息.9條聚類中心曲線主要存在平均值以及動(dòng)態(tài)特征的差異.季節(jié)不同,負(fù)荷曲線的特性會(huì)存在明顯的區(qū)別.計(jì)算每條聚類中心曲線的平均值可以主要分為如圖8所示的3類,分別對(duì)應(yīng)冬季、春秋季、夏季的影響因素相似時(shí)間序列典型曲線. 圖8 影響因素相似時(shí)間序列劃分結(jié)果的溫度曲線Fig.8 Temperature curves of division results of similar time series of influencing factors 由于一般負(fù)荷具有周期性,因此輸入、輸出長(zhǎng)度均設(shè)置為96×7.將七天96×7個(gè)歷史負(fù)荷數(shù)據(jù)作為L(zhǎng)STM網(wǎng)絡(luò)的輸入層,輸出層為下個(gè)七天的96×7個(gè)負(fù)荷值.LSTM網(wǎng)絡(luò)參數(shù)設(shè)置為:神經(jīng)元數(shù)為8,學(xué)習(xí)率為0.002,網(wǎng)絡(luò)深度為2,優(yōu)化方式為自適應(yīng)矩估計(jì)優(yōu)化器.對(duì)每類配變的每類影響因素相似時(shí)間序列均訓(xùn)練一組超參數(shù).為驗(yàn)證本文方法有效性,設(shè)置3個(gè)對(duì)比組,使用模型均為L(zhǎng)STM.對(duì)比組1:LSTM模型僅利用歷史負(fù)荷數(shù)據(jù)且每個(gè)配變配置一套超參數(shù).對(duì)比組2:每個(gè)配變配置一套超參數(shù),LSTM在輸入歷史負(fù)荷序列的基礎(chǔ)上增加影響因素序列,包括每個(gè)時(shí)刻的溫度、濕度、風(fēng)速以及每天的天氣與日類型.對(duì)比組3:利用改進(jìn)k-means進(jìn)行負(fù)荷分類,但不進(jìn)行影響因素相似時(shí)間序列分類.每種負(fù)荷類配置一套超參數(shù). 為了評(píng)價(jià)模型的預(yù)測(cè)精度,選用平均絕對(duì)百分比誤差以及均方根誤差作為評(píng)判指標(biāo),其計(jì)算式分別為 (18) (19) 實(shí)驗(yàn)環(huán)境為i5-9400F處理器、16 GB內(nèi)存、NVIDIA GeForce GTX 1660顯卡,編程語言環(huán)境為python3.7,軟件架構(gòu)基于Tensorflow框架.應(yīng)用本文方法及對(duì)比組方法,均訓(xùn)練50輪 epoch.6個(gè)負(fù)荷類在不同方法下的MAPE、RMSE以及模型50輪epoch所需的訓(xùn)練時(shí)間和泛化時(shí)間如表5所示,預(yù)測(cè)結(jié)果曲線如圖9所示. 表5 預(yù)測(cè)結(jié)果Tab.5 Forecasting results 可見,對(duì)比組1、2、3的MAPE分別為5.42%、4.07%、4.88%,RMSE分別為0.166 kW、0.125 kW、0.148 kW.相對(duì)不同對(duì)比組,本文方法MAPE值分別降低了3.38%、2.03%、2.84%,RMSE分別降低了0.103 kW、0.063 kW以及 0.085 kW.710組配變的平均訓(xùn)練效率相對(duì)于對(duì)比組1、2分別提升了600%和616%.從圖9中可以發(fā)現(xiàn),對(duì)比組1、3由于在預(yù)測(cè)過程中未加入影響因素相關(guān)信息,預(yù)測(cè)負(fù)荷曲線與前七日負(fù)荷曲線接近,無法準(zhǔn)確預(yù)測(cè)出趨勢(shì)變化.實(shí)驗(yàn)組與對(duì)比組2增加了影響因素信息,預(yù)測(cè)曲線與實(shí)際曲線趨勢(shì)接近,準(zhǔn)確預(yù)測(cè)了負(fù)荷趨勢(shì)變化.兩種方法的準(zhǔn)確率均高于對(duì)比組1和3.對(duì)比組2由于模型參數(shù)過多,導(dǎo)致預(yù)測(cè)曲線存在一定的波動(dòng).對(duì)比組1結(jié)果表明配變負(fù)荷受到各個(gè)因素的影響較大.若僅基于歷史負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè),無法預(yù)測(cè)由于影響因素變化導(dǎo)致的負(fù)荷變化,導(dǎo)致預(yù)測(cè)精度不足.對(duì)比組2結(jié)果表明將影響因素加入LSTM神經(jīng)網(wǎng)絡(luò)能一定程度提升負(fù)荷預(yù)測(cè)準(zhǔn)確度.但是由于不同配變影響因素不同而且輸入維度的增加容易使網(wǎng)絡(luò)陷入局部最優(yōu),導(dǎo)致準(zhǔn)確度的提升有限.對(duì)比組3結(jié)果表明對(duì)負(fù)荷根據(jù)典型日負(fù)荷序列進(jìn)行聚類,能夠提升模型的準(zhǔn)確率.但是不進(jìn)行影響因素相似時(shí)間序列劃分,即不考慮影響因素,準(zhǔn)確性仍然較低. 圖9 負(fù)荷預(yù)測(cè)結(jié)果圖Fig.9 Graphs of load forecasting results 綜上所述,本文提出的基于多維聚類的配變負(fù)荷Attention-LSTM短期預(yù)測(cè)方法在效率以及準(zhǔn)確度的提升上具有良好的效果. 本文將負(fù)荷序列時(shí)序特性以及影響因素特性加入配網(wǎng)負(fù)荷聚類分析中,得到相似時(shí)序特性以及影響因素關(guān)聯(lián)性的配變簇.并依據(jù)影響因素特性進(jìn)行相似時(shí)間序列分類.有效解決了配網(wǎng)負(fù)荷數(shù)量大、特征復(fù)雜、預(yù)測(cè)難的問題,提高了配變負(fù)荷預(yù)測(cè)的準(zhǔn)確度以及效率.主要結(jié)論如下: (1) 利用非參數(shù)核方法有效提升了日負(fù)荷特征概率密度估計(jì)的準(zhǔn)確度,得到更加準(zhǔn)確的日典型負(fù)荷序列. (2) 對(duì)所有日負(fù)荷特征序列以歐式歸整距離以及影響因素作為相似性判定原則進(jìn)行雙層聚類得到負(fù)荷的分類結(jié)果.結(jié)果表明此方法在負(fù)荷序列聚類問題上具有良好的效果. (3) 利用AP聚類算法對(duì)多影響因素進(jìn)行相似時(shí)間序列分類,相較于傳統(tǒng)的k-means分類、余弦相似度分類,提升了效率與分類準(zhǔn)確性. (4) 利用負(fù)荷雙層聚類以及影響因素AP聚類的結(jié)果劃分?jǐn)?shù)據(jù)集,構(gòu)建不同的Attention-LSTM網(wǎng)絡(luò).選取某市級(jí)配網(wǎng)實(shí)測(cè)負(fù)荷數(shù)據(jù)以及氣象等影響因素?cái)?shù)據(jù)進(jìn)行對(duì)比實(shí)驗(yàn)表明,所提方法的負(fù)荷預(yù)測(cè)的準(zhǔn)確率提升了2.75%且效率提升了616.8%.能夠適用于大規(guī)模配變的負(fù)荷預(yù)測(cè)場(chǎng)景,具有較高的應(yīng)用價(jià)值.3 影響因素相似時(shí)間序列聚類
4 Attention-LSTM負(fù)荷預(yù)測(cè)模型
4.1 Attention機(jī)制
4.2 負(fù)荷預(yù)測(cè)模型
5 算例分析
5.1 典型日負(fù)荷序列計(jì)算
5.2 典型日負(fù)荷序列雙層聚類
5.3 影響因素相似時(shí)間序列劃分
5.4 基于LSTM的短期負(fù)荷預(yù)測(cè)
6 結(jié)論