陽曾,丁施尹,葉萌,李晶,薛書倩,吳昊天
(1.廣東電網(wǎng)有限責(zé)任公司廣州供電局電力調(diào)度控制中心,廣州 510000; 2.北京清軟創(chuàng)新科技股份有限公司,北京 100085; 3.華北電力大學(xué),北京 102206)
負(fù)荷預(yù)測(cè)是制定電力供應(yīng)計(jì)劃和電網(wǎng)電量供需平衡的關(guān)鍵挑戰(zhàn)之一,它是電力市場(chǎng)運(yùn)營(yíng)的基礎(chǔ)工作和電力規(guī)劃中不可或缺的組成部分[1]。電力系統(tǒng)負(fù)荷預(yù)測(cè)可根據(jù)預(yù)測(cè)的時(shí)間長(zhǎng)短分為超短期、短期、中期和長(zhǎng)期預(yù)測(cè)[2]。其中,短期負(fù)荷預(yù)測(cè)是電力日常調(diào)度工作中重要的一項(xiàng)內(nèi)容,同時(shí)是能量管理系統(tǒng)的重要組成部分。提高短期負(fù)荷預(yù)測(cè)的準(zhǔn)確性,有助于提高電力設(shè)備的利用率,降低能耗,緩解能源的供應(yīng)端和需求端兩者之間的不平衡[3-4]。
現(xiàn)階段,圍繞負(fù)荷序的時(shí)序性和非線性特點(diǎn),短期負(fù)荷預(yù)測(cè)方法層出不窮,有多元線性回歸法[5],其優(yōu)點(diǎn)在于結(jié)構(gòu)形式簡(jiǎn)單,預(yù)測(cè)速度快,但描述較復(fù)雜的問題時(shí),精度較低;卡爾曼濾波法[6],該算法能很好的解決數(shù)據(jù)中的噪聲問題,但這樣也會(huì)造成變化較大的負(fù)荷也被篩選出去,對(duì)預(yù)測(cè)結(jié)果造成一定的影響;灰色理論法[7],該方法所需數(shù)據(jù)量少,計(jì)算方便,但未考慮到相關(guān)因素之間的聯(lián)系,故誤差偏大;支持向量機(jī)[8],其泛化能力好,預(yù)測(cè)精度較高,預(yù)測(cè)但運(yùn)算時(shí)間太長(zhǎng),難以預(yù)測(cè)大規(guī)模數(shù)據(jù);隨機(jī)森林法[9],可以處理高維數(shù)據(jù),其泛化誤差小,但對(duì)于噪聲較大的數(shù)據(jù),易出現(xiàn)過擬合現(xiàn)象;以及應(yīng)用較為廣泛的神經(jīng)網(wǎng)絡(luò)法[10-11]等。隨著深度學(xué)習(xí)的興起與發(fā)展,多種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)逐漸應(yīng)用于負(fù)荷預(yù)測(cè)領(lǐng)域。文[11]利用LSTM網(wǎng)絡(luò)預(yù)測(cè)負(fù)荷功率, 在淺神經(jīng)網(wǎng)絡(luò)中,只能改變單隱層神經(jīng)元的數(shù)量,而在LSTM網(wǎng)絡(luò)中,寬度和深度都可以改變,它通過預(yù)訓(xùn)練方式緩解了傳統(tǒng)網(wǎng)絡(luò)局部最優(yōu)點(diǎn)問題。
對(duì)于隨機(jī)性、波動(dòng)性較強(qiáng)負(fù)荷序列而言,單一預(yù)測(cè)方法難以得到理想的預(yù)測(cè)精度。目前,各種組合預(yù)測(cè)方法廣泛應(yīng)用在短期負(fù)荷預(yù)測(cè)領(lǐng)域,以EMD[12]為主的分解方法能有效的實(shí)現(xiàn)原始負(fù)荷序列的分解,實(shí)現(xiàn)平穩(wěn)序列和非平穩(wěn)序列互相分離的目的,然后再結(jié)合預(yù)測(cè)方法對(duì)各個(gè)IMF分別進(jìn)行預(yù)測(cè)。但是,EMD分解方法難以避免模態(tài)混疊現(xiàn)象產(chǎn)生,得到的虛假IMF,會(huì)對(duì)預(yù)測(cè)精度產(chǎn)生不利影響。文[13]采用VMD將負(fù)荷數(shù)據(jù)分解為特征互異的模態(tài)函數(shù),避免了模態(tài)混疊現(xiàn)象發(fā)生,提升了信號(hào)的分析效果。
基于以上研究工作,文中以某地區(qū)負(fù)荷數(shù)據(jù)為研究對(duì)象,對(duì)負(fù)荷序列進(jìn)行VMD分解,獲得多個(gè)特征互異的子序列,并分別結(jié)合LSTM網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),將多個(gè)預(yù)測(cè)結(jié)果疊加后得到最終的預(yù)測(cè)結(jié)果。與單一LSTM和EMD-LSTM方法預(yù)測(cè)結(jié)果相比,驗(yàn)證了所提方法可有效挖掘負(fù)荷序列潛在特征,從而提升預(yù)測(cè)精度。
2014年Konstantin Dragomiretskiy提出一種新型的VMD估計(jì)方法,用于非平穩(wěn)信號(hào)的自適應(yīng)分解,可將復(fù)雜的信號(hào)分解成K個(gè)調(diào)頻調(diào)幅的子信號(hào)[14]。它本質(zhì)上是一個(gè)自適應(yīng)維納濾波器組,可以有效地將測(cè)試信號(hào)分解成一組有限帶寬的中心頻率。不同于EMD和EEMD方法,VMD方法采用了非遞歸及變分模態(tài)求解模式處理原始信號(hào),具有較好的抗噪聲性能和非平穩(wěn)性能信號(hào)處理效果。
VMD的目的是將多分量信號(hào)分解為帶寬上具有特定稀疏性的有限帶寬模式的集合;相反,這些分解的模式也能夠重構(gòu)輸入信號(hào)。求解約束變分優(yōu)化問題:
(1)
式中uk(t)為輸入信號(hào)的模態(tài)函數(shù);{uk}表示模態(tài)集合{u1,u2, ……,uk};wk是對(duì)應(yīng)于輸入信號(hào)的第k階模態(tài)的中心頻率;{wk}表示分解后的模態(tài)對(duì)應(yīng)的一組中心頻率{w1,w2, ……,wk};f(t)是輸入信號(hào);δ(t)是單位脈沖函數(shù)。
將拉格朗日乘子λ和二次懲罰因子α引入,可以將式(1)改寫為:
(2)
使用乘法算法的交替方向法求解(2),獲得一組模態(tài)分量及其各自的中心頻率。每個(gè)模態(tài)可由頻域中的解估算出來,表示為:
(3)
在式(3)中具有維納濾波結(jié)構(gòu)的特點(diǎn),它直接更新了傅立葉域中的模態(tài)。此外,還可以通過提取濾波分析信號(hào)傅里葉逆變換的實(shí)部,在時(shí)域內(nèi)得到這些模態(tài)。
(4)
傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在處理分類以及回歸問題時(shí)難以避免會(huì)陷入局部最優(yōu)點(diǎn),而深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)通過預(yù)訓(xùn)練方式緩解了這個(gè)問題[15]。LSTM網(wǎng)絡(luò)源自于循環(huán)神經(jīng)網(wǎng)絡(luò)的一種,而后者在每個(gè)時(shí)刻都對(duì)應(yīng)著一個(gè)輸出,同時(shí)結(jié)合其當(dāng)前時(shí)刻的狀態(tài)得到對(duì)應(yīng)的輸出。當(dāng)前的狀態(tài)是根據(jù)上一時(shí)刻的狀態(tài)以及此刻的輸入共同作用來決定的,通過這種結(jié)構(gòu)比較適合解決與時(shí)間序列有關(guān)的問題。但是,如果時(shí)間序列過長(zhǎng)會(huì)導(dǎo)致當(dāng)前時(shí)刻節(jié)點(diǎn)對(duì)歷史時(shí)刻節(jié)點(diǎn)的感知能力不足,從而出現(xiàn)梯度消失的問題。而且當(dāng)前時(shí)刻預(yù)測(cè)和當(dāng)前時(shí)刻所需信的息之間的跨度長(zhǎng)短不一致,這種長(zhǎng)期依賴的問題是傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)所不能解決的。
LSTM網(wǎng)絡(luò)對(duì)經(jīng)典循環(huán)神經(jīng)網(wǎng)絡(luò)做了改進(jìn),通過引入“遺忘門”,讓信息有選擇性地影響RNN中每個(gè)時(shí)刻的狀態(tài)。計(jì)算節(jié)點(diǎn)由輸入門、輸出門、遺忘門和cell組成[16],LSTM的計(jì)算節(jié)點(diǎn)圖見圖1。
圖1 LSTM模型結(jié)構(gòu)Fig.1 LSTM model structure
在圖1中,cell為計(jì)算節(jié)點(diǎn)的核心,記錄著當(dāng)前時(shí)刻的狀態(tài);控制信息的輸入和輸出則分別由輸入門、輸出門操控;而遺忘門則控制著細(xì)胞歷史時(shí)刻狀態(tài)信息的儲(chǔ)存。遺忘門的輸出值始終保持在[0, 1]之間,這得益于門利用的sigmoid激活函數(shù),輸出值為0,將上一狀態(tài)的信息全部丟棄,輸出值為1,上一狀態(tài)的信息則全部保存。如式(5)所示:
ft=σ(Wf·[ht-1,xt]+bf)
(5)
式中Wf是遺忘門的權(quán)重矩陣;bf是偏置項(xiàng);[ht-1,xt]是遺忘門的輸入向量;σ是sigmoid函數(shù)。
“輸入門”負(fù)責(zé)新狀態(tài)的補(bǔ)充,根據(jù)xt,ht-1來判斷ct-1狀態(tài)中的哪些部分應(yīng)當(dāng)寫入當(dāng)前時(shí)刻狀態(tài)ct中去,如下:
it=σ(Wi·[ht-1,xt]+bi)
(6)
式中Wi是輸入門的權(quán)重矩陣;bi是輸入門的偏置項(xiàng)。
同時(shí),新狀態(tài)的候選值c*t由tanh函數(shù)產(chǎn)生,c*t可能會(huì)加入到新狀態(tài)中,如下:
(7)
那么當(dāng)前時(shí)刻的狀態(tài)ct就是由上一時(shí)刻的狀態(tài)ct-1乘以遺忘門ft,再用新狀態(tài)候選值c*t乘以輸入門it,再將兩個(gè)乘積求和,有:
(8)
類似地,輸出門表示如式(9)所示:
ot=σ(Wo·[ht-1,xt]+bo)
(9)
式中Wo是輸入門的權(quán)重矩陣;bo是輸入門的偏置項(xiàng)。而LSTM最終的輸出ht是由輸出門與單元狀態(tài)共同決定的。
ht=ot·tanh(ct)
(10)
在網(wǎng)絡(luò)傳播的過程中,ot并不是唯一起作用的,ht才是LSTM網(wǎng)絡(luò)的特殊之處,它是根據(jù)三個(gè)門新增加的,有效解決了梯度消失的問題。
電力負(fù)荷基于用戶習(xí)慣性消費(fèi)信息,受人類活動(dòng)、氣象條件、社會(huì)經(jīng)濟(jì)和政治因素等不同程度的影響表現(xiàn)出一定的波動(dòng)性、隨機(jī)性的特點(diǎn)。然而,人類生活生產(chǎn)活動(dòng)有一定的規(guī)律性,因此,負(fù)荷也具有較強(qiáng)的周期特性。負(fù)荷序列本質(zhì)上具有不穩(wěn)性,為精細(xì)研究分析負(fù)荷序列特點(diǎn),采用VMD方法對(duì)原始負(fù)荷序列進(jìn)行分解,得到一系列有利于預(yù)測(cè)的負(fù)荷分量。由于深度學(xué)習(xí)算法具有多層次內(nèi)部結(jié)構(gòu)和重復(fù)學(xué)習(xí)特征的訓(xùn)練方式的特點(diǎn),所以能更好地應(yīng)對(duì)負(fù)荷預(yù)測(cè)問題,所以將各個(gè)負(fù)荷分量結(jié)合LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練預(yù)測(cè),疊加每個(gè)分量預(yù)測(cè)結(jié)果,進(jìn)而得到了VMD-LSTM模型的最終預(yù)測(cè)結(jié)果,模型框圖如圖2所示。
圖2 負(fù)荷預(yù)測(cè)模型Fig.2 Load forecasting model
圖2中給出了VMD的參數(shù)設(shè)置[14]:通過反復(fù)實(shí)驗(yàn)測(cè)試,模態(tài)函數(shù)個(gè)數(shù)K=5;二次懲罰因子α=1 000;收斂判據(jù)r=10-6。起始中心頻率w=0。LSTM網(wǎng)絡(luò)參數(shù)調(diào)試,通過調(diào)節(jié)LSTM網(wǎng)絡(luò)中的堆疊層數(shù)、隱含層神經(jīng)元個(gè)數(shù)、Dropout參數(shù)以及每批處理樣本數(shù)量來提升網(wǎng)絡(luò)的預(yù)測(cè)的性能。
(1)堆疊層數(shù)(Sk)和隱含層神經(jīng)元個(gè)數(shù)(Hd)
堆疊層數(shù)及隱含層神經(jīng)元個(gè)數(shù)的選取對(duì)負(fù)荷預(yù)測(cè)精度有著顯著的影響,以日周期分量數(shù)據(jù)為測(cè)試對(duì)象,計(jì)算了當(dāng)堆疊層數(shù)分別為1層~3層,隱含層神經(jīng)元個(gè)數(shù)分別為5、20、50、100個(gè)時(shí)訓(xùn)練集和測(cè)試集的MAPE,結(jié)果見表1所示。
表1 訓(xùn)練集及測(cè)試集的測(cè)試結(jié)果Tab.1 Test results of training set and test set
從表1中,可以看出當(dāng)網(wǎng)絡(luò)堆疊層數(shù)為2,隱含層神經(jīng)元個(gè)數(shù)為50時(shí)訓(xùn)練集和測(cè)試集的MAPE最小,故以此網(wǎng)絡(luò)參數(shù)進(jìn)行后續(xù)的短期負(fù)荷預(yù)測(cè)仿真實(shí)驗(yàn)。
(2)dropout參數(shù)
dropout參數(shù)的設(shè)置可以有效抑制神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過擬合。dropout的原理是在模型訓(xùn)練時(shí),以一定的概率讓某個(gè)神經(jīng)元失活。目前學(xué)術(shù)界對(duì)dropout的取值方法并無定論,具體到本文模型,采用遍歷的方法,通過計(jì)算平均準(zhǔn)確度(mean Accuracy, mAcc)選取最優(yōu)值,如式(11)所示:
(11)
本文嘗試了10種不同的dropout比例,實(shí)驗(yàn)結(jié)果如圖3所示,當(dāng)dropout參數(shù)從0.5增大至0.95,mAcc呈現(xiàn)了先增加后減小的變化趨勢(shì),在dropout取0.65時(shí)mAcc獲得最大值95.83%。
圖3 不同dropout參數(shù)下負(fù)荷預(yù)測(cè)mAccFig.3 mAcc of load forecasting with different dropout parameters
(3)每批處理樣本數(shù)量(batch)
在LSTM網(wǎng)絡(luò)中每批處理樣本數(shù)量如果值太小,則很容易不收斂;如果取值過大,容易陷入局部最優(yōu)解。本文選取的方法是以128為分界線,向上乘2,向下乘0.5,訓(xùn)練后比較測(cè)試結(jié)果,測(cè)試結(jié)果顯示向下更好,向下繼續(xù)乘0.5,直到結(jié)果不再提升為止,最終測(cè)試結(jié)果該參數(shù)值取16。
實(shí)驗(yàn)采用某地區(qū)2019-06-16至2019-06-30之間的負(fù)荷數(shù)據(jù),采樣間隔15 min,共計(jì)采樣點(diǎn)1 440個(gè),以前面12天的數(shù)據(jù)作為訓(xùn)練樣本,后面3天的數(shù)據(jù)作為測(cè)試樣本。原始數(shù)據(jù)集分別由EMD和VMD方法進(jìn)行分解,原始負(fù)荷序列及分解結(jié)果分別見圖4~圖6。
圖4 原始負(fù)荷序列Fig.4 Original load sequence
圖5 EMD分解結(jié)果Fig.5 EMD decomposition results
圖6 VMD分解結(jié)果Fig.6 VMD decomposition results
從圖4中可以看出,原始負(fù)荷序列的波動(dòng)性較強(qiáng),從圖5和圖6的分解結(jié)果可以看出,由EMD分解方法的模態(tài)分量多達(dá)8個(gè),而VMD分解出來的模態(tài)分量只有5個(gè),這大大減少了預(yù)測(cè)的計(jì)算規(guī)模;高頻分量不以利于預(yù)測(cè),可以看出VMD分解出來的高頻分量幅值占比更少,有利于減少預(yù)測(cè)誤差;中低頻部分VMD分解的分量的規(guī)律性則明顯比EMD分解的分量規(guī)律性要強(qiáng);兩者分解出來的低頻部分都較為平緩,可以看出VMD分解出的低頻分量更接近原始負(fù)荷序列的波動(dòng)趨勢(shì)。因此,從兩者分解結(jié)果來看VMD方法更有利于后續(xù)建模預(yù)測(cè)。
接著根據(jù)上一節(jié)LSTM網(wǎng)絡(luò)測(cè)試的參數(shù),利用LSTM網(wǎng)絡(luò)分別對(duì)原始負(fù)荷數(shù)據(jù)、EMD及VMD分解的分量序列進(jìn)行預(yù)測(cè),并分別疊加后兩種方法的預(yù)測(cè)結(jié)果,得到EMD-LSTM方法和VMD-LSTM方法的最終預(yù)測(cè)結(jié)果。圖7中給出了三種方法的預(yù)測(cè)結(jié)果曲線。
圖7 三種方法的預(yù)測(cè)結(jié)果比較Fig.7 Comparison of prediction results of the three methods
科學(xué)和全面的指標(biāo)在對(duì)各種負(fù)荷預(yù)測(cè)模型的篩選和糾正中發(fā)揮著重要作用。目前評(píng)價(jià)負(fù)荷預(yù)測(cè)結(jié)果的指標(biāo)眾多,通常是采用平均絕對(duì)百分誤差(Mean Absolute Percentage Error, MAPE)來評(píng)估模型優(yōu)劣,采用均方根誤差(Root Mean Square Error, RMSE)來反映預(yù)測(cè)的精密度,兩者數(shù)值越小,模型的預(yù)測(cè)效果越好[17-19]。三種方法的誤差統(tǒng)計(jì)結(jié)果見表2。
(12)
(13)
式中各符號(hào)的意義同式(11)。
圖7中的放大區(qū)域中可以看出單一采用LSTM方法在負(fù)荷峰谷值部分預(yù)測(cè)誤差很大,而VMD-LSTM方法略優(yōu)于EMD-LSTM方法,預(yù)測(cè)結(jié)果比較理想。在表2中,從預(yù)測(cè)日的平均值角度分析,VMD-LSTM方法的具有最好的預(yù)測(cè)精度,MAPE為0.62%,RMSE為7.91 MW,驗(yàn)證了該方法具有較好的預(yù)測(cè)性能。
表2 三種方法的誤差統(tǒng)計(jì)結(jié)果Tab.2 Error statistics results of the three methods
文章提出了一種基于VMD-LSTM的短期負(fù)荷預(yù)測(cè)方法。實(shí)驗(yàn)驗(yàn)證,在波動(dòng)性較強(qiáng)的負(fù)荷序列中,VMD可有效提取其內(nèi)在具有緊支撐傅里葉頻譜特性的負(fù)荷分量。對(duì)比EMD方法,VMD方法具有可手動(dòng)調(diào)節(jié)模態(tài)分量個(gè)數(shù)的優(yōu)勢(shì),進(jìn)而可減少預(yù)測(cè)的計(jì)算規(guī)模。同時(shí),考慮到LSTM具有預(yù)訓(xùn)練方式的特點(diǎn),可有效緩解傳統(tǒng)神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)點(diǎn)問題,可為高精度預(yù)測(cè)結(jié)果提供強(qiáng)力保障。對(duì)比LSTM和EMD-LSTM方法,突顯了本文方法優(yōu)越的預(yù)測(cè)性能,為研究短期負(fù)荷預(yù)測(cè)提供一定的參考意義。
在后續(xù)的研究中,可以考慮在輸入數(shù)據(jù)中加入影響負(fù)荷變化的特征,比如氣象條件、經(jīng)濟(jì)因素等;可考慮結(jié)合優(yōu)化算法,對(duì)LSTM的權(quán)值和閾值進(jìn)行逐層優(yōu)化,以達(dá)到提升預(yù)測(cè)精度的目的。