收稿日期:2022-12-31
基金項目:國家重點研發(fā)計劃(2021YFE0190900);國家自然科學(xué)基金(62073136;62203170);中國博士后科學(xué)基金(2022T150210)
通信作者:孔小兵(1987—),女,博士、副教授,主要從事電力生產(chǎn)過程建模與控制方面的研究。kongxiaobing@ncepu.edu.cn
DOI:10.19912/j.0254-0096.tynxb.2022-1993 文章編號:0254-0096(2024)05-0576-08
摘 要:針對光伏功率時間序列的非平穩(wěn)特性,提出一種基于最大重疊離散小波變換(MODWT)和長短期記憶網(wǎng)絡(luò)(LSTM)的光伏功率組合預(yù)測模型。利用皮爾遜相關(guān)系數(shù)確定影響光伏功率的重要氣象因素,基于MODWT算法對歷史光伏功率序列進行分解,將選取的氣象因素與分解得到的平穩(wěn)子序列共同構(gòu)成各個LSTM網(wǎng)絡(luò)輸入,通過匯總重構(gòu)每個LSTM網(wǎng)絡(luò)的子序列預(yù)測結(jié)果得到最終的光伏功率預(yù)測結(jié)果。從理論層面分析所建立的MODWT算法的完全重構(gòu)性,并基于李雅普諾夫穩(wěn)定性定理推導(dǎo)保證預(yù)測網(wǎng)絡(luò)收斂的學(xué)習(xí)率范圍。仿真對比結(jié)果顯示,所提出的光伏功率預(yù)測模型在預(yù)測精度和魯棒性方面具有明顯優(yōu)勢。
關(guān)鍵詞:光伏功率預(yù)測;長短期記憶網(wǎng)絡(luò);非平穩(wěn)時間序列分解;預(yù)測網(wǎng)絡(luò)收斂性
中圖分類號:TM615"""""""""""" """""""" """""""""文獻標(biāo)志碼:A
0 引 言
隨著光伏發(fā)電在電網(wǎng)中所占比例逐年攀升,其顯著的隨機性和波動性給電網(wǎng)運行的安全性和穩(wěn)定性帶來不可小覷的威脅。因此,準(zhǔn)確的光伏功率預(yù)測成為指導(dǎo)電網(wǎng)調(diào)度優(yōu)化、保障電網(wǎng)穩(wěn)定經(jīng)濟運行的重要前提[1-3]。隨著大數(shù)據(jù)、移動互聯(lián)網(wǎng)等先進技術(shù)的飛速發(fā)展,建立數(shù)據(jù)驅(qū)動的光伏功率預(yù)測模型已成為主流研究方向。光伏電站產(chǎn)生的歷史運行數(shù)據(jù)通常具有海量、高維、多源、異構(gòu)的特點,導(dǎo)致傳統(tǒng)的淺層機器學(xué)習(xí)模型難以從海量光伏數(shù)據(jù)中高效挖掘和提取有效信息,且收斂速度不穩(wěn)定甚至無法收斂到全局最優(yōu)[4]。深度學(xué)習(xí)能夠通過加深網(wǎng)絡(luò)層次從原始數(shù)據(jù)中提取淺層架構(gòu)無法挖掘到的抽象特征,因而廣泛應(yīng)用于光伏功率預(yù)測領(lǐng)域。長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)[5]作為一種典型的深度循環(huán)神經(jīng)網(wǎng)絡(luò),其記憶機制能夠捕捉到光伏序列數(shù)據(jù)中隱藏的時間關(guān)系,同時通過權(quán)重共享有效降低訓(xùn)練成本。文獻[6]立足于光伏功率序列數(shù)據(jù)的時序依賴性建立LSTM模型對其進行預(yù)測,并引入多種天氣預(yù)報數(shù)據(jù)作為預(yù)測模型輸入特征;文獻[7]進一步結(jié)合天氣分類建立基于LSTM網(wǎng)絡(luò)的日前光伏功率組合預(yù)測模型,針對理想天氣和非理想天氣兩種天氣類型分別建立預(yù)測模型。
光伏發(fā)電功率受到復(fù)雜多變的天氣影響,表現(xiàn)出較強的非平穩(wěn)性和非線性[8]。若直接將原始光伏功率作為預(yù)測模型的特征輸入,預(yù)測模型的準(zhǔn)確性和泛化能力將無法得到保證。因此,需要將非平穩(wěn)的光伏功率序列分解為多個平穩(wěn)子序列輸入至預(yù)測網(wǎng)絡(luò)進行訓(xùn)練,從而提高預(yù)測模型的精度和預(yù)測性能的穩(wěn)定性。常用的光伏功率序列分解方法主要包括經(jīng)驗?zāi)B(tài)分解[9](empirical mode decomposition, EMD)、變分模態(tài)分解[10](variational mode decomposition, VMD)等時頻序列分解方法。EMD方法通常伴隨著模態(tài)混疊和末端效應(yīng)等問題,VMD雖對模態(tài)混疊有一定抑制能力,但對噪聲非常敏感且其參數(shù)選取缺少完備的理論支撐。相較而言,最大重疊離散小波變換(maximum overlap discrete wavelet transform, MODWT)由于其多分解層次具有較高的時間分辨率,并且采用的小波系數(shù)和尺度系數(shù)具有平移不變性,能夠避免傳統(tǒng)分解方法的模態(tài)混疊和噪聲敏感問題,有利于提高光伏功率預(yù)測的準(zhǔn)確性和魯棒性。
綜上,本文提出一種基于MODWT算法和LSTM網(wǎng)絡(luò)的光伏功率預(yù)測模型。采用MODWT算法分解非平穩(wěn)光伏功率序列,得到多個平穩(wěn)且波動規(guī)律的子序列,便于深度神經(jīng)網(wǎng)絡(luò)提取其隱藏特征。將得到的子序列分別與選取的氣象因素序列組合作為各個LSTM網(wǎng)絡(luò)的輸入訓(xùn)練子預(yù)測模型。通過小波重構(gòu)算法將每個子預(yù)測模型的輸出重構(gòu)生成最終的光伏功率預(yù)測結(jié)果。結(jié)合MODWT算法的完全重構(gòu)性對所提預(yù)測模型的整體收斂性進行分析,基于李雅普諾夫穩(wěn)定性方法確定了保證LSTM網(wǎng)絡(luò)收斂性的學(xué)習(xí)率范圍。
1 光伏功率預(yù)測問題描述
光伏功率序列通??杀硎緸閇P=p(1), p(2),…, p(t-1), p(t),][p(t+1), …}],其中[p(t)]代表[t]時刻的光伏功率真實值。相應(yīng)地,采用光伏功率歷史數(shù)據(jù)和氣象因素歷史數(shù)據(jù)預(yù)測未來光伏功率值[p(t+1)]的過程可表示為:
[p(t+1)=f(p(t),p(t-1),…,p(t-N+1);θ)]"""" (1)
式中:[N]——光伏功率序列時間長度;[θ]——光伏功率預(yù)測模型參數(shù)集。
為評價光伏功率預(yù)測值與實際值間的擬合程度,定義其損失函數(shù)如下:
[floss=p(t+1)-p(t+1)2]"" (2)
式中:[p(t+1)]——[t+1]時刻的光伏功率預(yù)測值。為建立準(zhǔn)確的光伏功率預(yù)測模型,需要尋找合適的參數(shù)集[θ]使損失函數(shù)達到最小值。
本文采用來源于澳大利亞太陽能中心某處光伏設(shè)施的光伏功率和氣象數(shù)據(jù)開展預(yù)測方法研究。該光伏設(shè)施的裝機容量為5 kW,數(shù)據(jù)時間范圍為2009年1月—12月,數(shù)據(jù)采集的時間間隔為5 min,所涉氣象因素包括風(fēng)速、溫度、相對濕度、全球水平輻射、擴散水平輻射以及風(fēng)向。
考慮到采集的光伏數(shù)據(jù)和氣象數(shù)據(jù)存在錯誤或丟失的情況,應(yīng)用數(shù)據(jù)預(yù)處理方法以保證建模數(shù)據(jù)的質(zhì)量。先采用平均值填補缺失值,然后基于[3σ]原則識別異常數(shù)據(jù)并使用平均值將其替換。
由于氣象數(shù)據(jù)及光伏功率數(shù)據(jù)間存在數(shù)量級差異,采用min-max方法對其進行歸一化:
[X*=X-XminXmax-Xmin]""" (3)
式中:[X*]——歸一化后數(shù)據(jù);[X]——原始數(shù)據(jù);[Xmax]和[Xmin]——原始數(shù)據(jù)[X]中的最大值和最小值。
2 光伏功率影響因素分析
基于特征完備性與訓(xùn)練成本兩方面考慮,需從所有氣象因素中篩選出相關(guān)性較強的氣象因素作為光伏功率預(yù)測模型的特征輸入,從而在避免冗余的同時實現(xiàn)較高的預(yù)測精度。
皮爾遜相關(guān)系數(shù)法是使用最廣泛的相關(guān)性度量[11]方法,可用于衡量光伏功率與各氣象因素間的相關(guān)程度。設(shè)光伏功率[P]與氣象因素[M]間的皮爾遜相關(guān)系數(shù)為[r(P,M)],其計算式如下:
[r(P,M)=Cov(P,M)Ver[P]·Ver[M]]""""" (4)
式中:[M]——各氣象因素序列,分別是擴散水平輻射、風(fēng)速、相對濕度、溫度、全球水平輻射以及風(fēng)向數(shù)據(jù);[Cov(P,M)]——[P]和[M]間的協(xié)方差;[Ver(P)]和[Ver(M)]——[P]和[M]的方差。計算得到的各氣象序列和光伏功率序列之間的皮爾遜相關(guān)系數(shù)如表1所示。
由表1可得,光伏功率與全球水平輻射的相關(guān)性最高,與擴散水平輻射、風(fēng)速和溫度呈正相關(guān),與相對濕度呈負(fù)相關(guān),而與風(fēng)向呈現(xiàn)極弱的負(fù)相關(guān)性。因此,選取全球水平輻射、擴散水平輻射、風(fēng)速、溫度和相對濕度這5個氣象因素與歷史光伏功率共同構(gòu)成光伏功率預(yù)測模型的輸入。
3 基于MODWT的LSTM光伏功率預(yù)測模型
為避免光伏功率的非平穩(wěn)特性影響預(yù)測模型精度,本節(jié)使用MODWT算法將光伏功率序列分解為多個平穩(wěn)子序列,并與氣象因素組合共同構(gòu)成LSTM預(yù)測網(wǎng)絡(luò)的輸入。
3.1 最大重疊離散小波變換
MODWT算法是離散小波變換的改進算法,其小波系數(shù)和尺度系數(shù)具有平移不變性,高度冗余且非正交,對序列長度無特殊限制,尤其適用于光伏功率序列處理[12]。
針對長度為[N]的光伏功率序列[P],MODWT的高通濾波器[hl]和低通濾波器[gl]可分別表示如下:
[hl=hl2]" (5)
[gl=gl2]" (6)
式中:[hl]和[gl]([l=0,…,L-1])——離散小波變換中的高通濾波器和低通濾波器;[L]——濾波器長度。
為解決離散小波變換中下采樣造成的分解后序列長度減半問題,MODWT在第[j]個分解層次,在[hl]和[gl]之間隔插入([2j-1-1])個0值:
[h0,0,…,h1,0,…,hL-2,0,…,0,hL-1]""" (7)
[g0,0,…,g1,0,…,gL-2,0,…,0,gL-1]""" (8)
根據(jù)Mallat算法,在分解層次為1時,MODWT的尺度系數(shù)[V1,t]和小波系數(shù)[W1,t]按照式(9)、式(10)計算:
[V1,t=l=0L-1gj,lp(t-l)modN,t=0,…,N-1]"""""" (9)
[W1,t=l=0L-1hj,lp(t-l)modN,t=0,…,N-1]""""" (10)
式中:[gj,l]——MODWT在分解層次為[j]時的低通濾波器;[hj,l]——對應(yīng)的高通濾波器;mod——取余操作。
在分解層次為[j]時,MODWT的尺度系數(shù)[Vj,t]和小波系數(shù)[Wj,t]按照式(11)、式(12)計算:
[Vj,t=l=0L-1gj,lVj-1,(t-l)modN,t=0,…,N-1]" (11)
[Wj,t=l=0L-1hj,lVj-1,(t-l)modN,t=0,…,N-1] (12)
選取常用的Db3作為母小波函數(shù),對光伏功率序列進行4層分解,得到的5個子序列如圖1所示。
時間/(5 min)
3.2 LSTM光伏功率預(yù)測模型
與深度信念網(wǎng)絡(luò)(deep belief network, DBN)[13]、堆疊自動編碼器(stacked auto encoder, SAE)[14]等早期深度神經(jīng)網(wǎng)絡(luò)相比,LSTM的記憶功能使其能夠處理具有長期依賴的數(shù)據(jù),且它的權(quán)值共享結(jié)構(gòu)使其具有參數(shù)少、內(nèi)存占用低的特點。因此,選取LSTM網(wǎng)絡(luò)實施光伏功率預(yù)測對提高預(yù)測精度、降低訓(xùn)練成本有重要作用。
LSTM網(wǎng)絡(luò)中包含細(xì)胞狀態(tài)以及輸入門、遺忘門和輸出門3種門控結(jié)構(gòu)(圖2),能夠有效避免普通循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和梯度爆炸問題[15],其網(wǎng)絡(luò)更新規(guī)則如下:
[ft=σ(Wf?ht-1,xt+bf)]""" (13)
[it=σ(Wi?ht-1,xt+bi)]"""" (14)
[ot=σ(Wo?ht-1,xt+bo)]"" (15)
[ct=ft⊙ct-1+it⊙tanh(WC?ht-1,xt+bC)]"""""" (16)
[ht=ot⊙tanh(ct)]""" (17)
式中:[ft]、[it]和[ot]——遺忘門、輸入門和輸出門;[ct]——細(xì)胞狀態(tài);[Wf]、[Wi]、[Wo]以及[WC]——權(quán)值矩陣;[bf]、[bi]、[bo]和[bC]——偏差向量;[σ()]——sigmoid激活函數(shù);[⊙]——向量點乘操作。
3.3 MODWT-LSTM模型收斂性分析
MODWT-LSTM預(yù)測模型的收斂性是實施準(zhǔn)確光伏功率預(yù)測的重要理論前提。由于MODWT-LSTM模型集成了序列分解和網(wǎng)絡(luò)預(yù)測兩個主要環(huán)節(jié),其收斂性分析包括MODWT分解的完全重構(gòu)性分析和LSTM網(wǎng)絡(luò)的收斂性分析。
3.3.1 MODWT分解的完全重構(gòu)性分析
將長度為[N]的光伏功率序列表示為[P=Pt,t=0,1,2,…,N-1],將[hj,l]和[gj,l]進行周期性延拓得到的濾波器描述為[h°j,l]和[g°j,l]。以[H(·)]和[ψ(·)]分別表示[hl]的傳遞函數(shù)和平方增益函數(shù),以[G(·)]和[?(·)]分別表示[gl]的傳遞函數(shù)和平方增益函數(shù)。則有以下性質(zhì):
定理1:高通濾波器[h°j,l]和低通濾波器[g°j,l]滿足式(18)~式(22):
[?(f)+ψ(f)=1] (18)
[H?kNHkN=HkN2=ψkN]"""" (19)
[G?kNGkN=GkN2=?kN]""""" (20)
[Hjf=H2j-1fl=0j-2G(2lf)]""""" (21)
[Gjf=l=0j-1G(2lf)] (22)
此時,光伏功率序列[P]根據(jù)式(23)和式(24)分解后可根據(jù)式(25)~式(27)進行完全重構(gòu):
[Wj,t=l=0N-1h°j,lPt-lmodN] (23)
[Vj,t=l=0N-1g°j,lPt-lmodN] (24)
[P=j=1JDj+SJ]""""" (25)
[Dj=ωTjWj]" (26)
[SJ=νTJVJ]" (27)
其中:[Wj=ωjP],[Vj=νjP],
[ωj=h°j,0h°j,N-1h°j,N-2h°j,N-3…h(huán)°j,3h°j,2h°j,1h°j,1h°j,0h°j,N-1h°j,N-2…h(huán)°j,4h°j,3h°j,2h°j,2h°j,1h°j,0h°j,N-1…h(huán)°j,5h°j,4h°j,3????…???h°j,N-2h°j,N-3h°j,N-4h°j,N-5…h(huán)°j,1h°j,0h°j,N-1h°j,N-1h°j,N-2h°j,N-3h°j,N-4…h(huán)°j,2h°j,1h°j,0]。
用[g°j,l]替代[ωj]矩陣中的[h°j,l]即可構(gòu)成[νj]矩陣。
證明:將[h°j,l]和[g°j,l]的離散傅里葉變換(discrete Fourier transform,DFT)分別記為[HjkN]和[GjkN],[Pt]的DFT記為[χk]。
根據(jù)式(23)和式(24)可得出以下變換成立:
[Wj,t?HjkNχk]"""" (29)
[Vj,t?GjkNχk]""""" (30)
式中:[a?b]——[a]的離散傅里葉變換為[b]。
式(26)和式(27)可整理為:
[Dj,t=l=0N-1h°j,lWj,t+lmodN]""" (31)
[Sj,t=l=0N-1g°j,lVj,t+lmodN]""""" (32)
由于[Dj,t]、[Wj,t]可看作用濾波器[H?jkN]和[HjkN]分別對[Wj,t]和[Pt]進行循環(huán)濾波的結(jié)果,根據(jù)式(19)有:
[Dj,t?H?jkNHjkNχk=HjkN2χk]" (33)
[Sj,t?GjkN2χk]""" (34)
根據(jù)DFT的線性疊加性質(zhì)可推出:
[Dj,t+Sj,t?HjkN2+GjkN2χk]""""" (35)
對于[j≥2],根據(jù)式(18)、式(21)和式(22)可將式(35)化簡為:
[Dj,t+Sj,t?Gj-1kN2χk] (36)
由式(34)可得:
[Sj-1,t?Gj-1kN2χk]"""" (37)
結(jié)合式(36)和式(37),對任意[t]有:
[Sj-1=Dj+Sj]" (38)
當(dāng)[j=1]時,根據(jù)式(18)~式(20),式(35)可寫為:
[D1,t+S1,t?H1kN2+G1kN2χk=χk]"""" (39)
由于[Pt?χk],對任意[t]有:
[P=D1+S1]"""" (40)
結(jié)合式(38)和式(40),可得出對所有[J0≥1]有式(41)成立:
[P=j=1J0Dj+SJ0]"" (41)
且[Dj=ωTjWj],[Sj=νTjVj]。定理1得證。
3.3.2 LSTM網(wǎng)絡(luò)收斂性分析
本節(jié)通過李雅普諾夫穩(wěn)定性方法,推導(dǎo)LSTM網(wǎng)絡(luò)的收斂條件,指導(dǎo)學(xué)習(xí)率參數(shù)的選取。
針對MODWT算法分解后建立的5個LSTM網(wǎng)絡(luò),定義第[i]([i=1,2,3,4,5])個正定李雅普諾夫函數(shù)為:
[Vi(k)=12eTi(k)ei(k)]""" (42)
其中誤差項定義為:
[ei(k)=yi(k)-y(k)]"" (43)
式中:[yi(k)]——第[i]個LSTM網(wǎng)絡(luò)第[k]次訓(xùn)練的預(yù)期輸出;[y(k)]——實際光伏功率輸出。
定義第[i]個LSTM網(wǎng)絡(luò)的平方損失函數(shù)為:
[Ei(k)=12yi(k)-yi(k)2]"" (44)
[Ei(k)]和[ei(k)]滿足以下關(guān)系:
[?Ei(k)?Wi(k)=ei(k)?ei(k)?Wi(k)]"""""" (45)
當(dāng)系統(tǒng)滿足以下條件時,李雅普諾夫函數(shù)遞減:
[ΔVi(k+1)=Vi(k+1)-Vi(k)≤0]"""" (46)
結(jié)合式(42)和式(46)可得:
[ΔVi(k+1)=Vi(k+1)-Vi(k)=12ei(k+1)Tei(k+1)-ei(k)Tei(k)=12ei(k+1)+ei(k)Tei(k+1)-ei(k)=12[2ei(k)+Δei(k+1)]TΔei(k+1)]"""""" (47)
式中:[Δei(k+1)=ei(k+1)-ei(k)]。
將預(yù)測網(wǎng)絡(luò)的最終輸出表示為[y=Wyht],結(jié)合式(43)可由泰勒展開得到[ei(k)]的線性表達式為:
[ei(k+1)=ei(k)+?ei(k)?Wi(k)ΔWi(k)T+Ri]"" (48)
式中:[Wi=[Wf,Wi,Wo,Wc,B]i;][Ri]——泰勒展開的高階項。
定義[t]時刻損失函數(shù)對隱層的梯度為:
[δt=?E?ht]"""" (49)
相應(yīng)地,LSTM網(wǎng)絡(luò)中4個加權(quán)輸出以及對應(yīng)的梯度項可表示為;
[ε*,t=W*?ht-1,xt+b*"""""""" =W*hht-1+W*xxt+b*],[*=f,i,o,c]" (50)
[δ?,t=def?E(t)?ε?,t,*=f,i,o,c]"""""" (51)
定理2: 對于MODWT分解后的5個LSTM網(wǎng)絡(luò),若學(xué)習(xí)率[ηi]滿足:
[0lt;ηilt;min2(ei(k))-1j=1tδl*,j(k)hlj-1(k)2F,""""""""""" 2(ei(k))-1j=1tδl*,j(k)xlj(k)2F,2(ei(k))-1j=1tδl*,j(k)2F]"""""" (52)
式中:[*=f,i,o,c;][l=1,2],則每個LSTM網(wǎng)絡(luò)的建模誤差均收斂,即當(dāng)[k→∞]時,[ei(k)→0]。
下面以一個LSTM網(wǎng)絡(luò)為例,證明上述定理(證明過程省去下標(biāo)[i])。
證明: 若忽略高階項[R],式(48)可寫作:
[Δe(k+1)=e(k+1)-e(k)=?e(k)?W(k)ΔW(k)T]"""""" (53)
LSTM中[ΔW(k)]按照如下規(guī)則更新:
[ΔW(k)=-ηe(k)?e(k)?W(k)]" (54)
根據(jù)式(53)和式(54),式(47)可整理為:
[ΔV(k+1)=122e(k)-ηe(k)?e(k)?W(k)2FT-ηe(k)?e(k)?W(k)2F"""""""""""""""" =12ηe(k)Te(k)?e(k)?W(k)2Fη?e(k)?W(k)2F-2]"" (55)
根據(jù)LSTM的隨時間反向傳播算法,可按照式(56)由[δt]計算[t-1]時刻的梯度項[δt-1]:
[δt-1=?E?ht-1=?E?ht·?ht?ht-1=δt?ht?ht-1] (56)
結(jié)合式(13)~式(17),根據(jù)全導(dǎo)數(shù)公式可得:
[δt?ht?ht-1=δt?ht?ot·?ot?εo,t·?εo,t?ht-1+δt?ht?ct·?ct?ft·?ft?εf,t·?εf,t?ht-1+δt?ht?ct·?ct?it·?it?εi,t·?εi,t?ht-1+δt?ht?ct·?ct?ct·?ct?εc,t·?εc,t?ht-1""""""""""" =?E?εo,t·?εo,t?ht-1+?E?εf,t·?εf,t?ht-1+?E?εi,t·?εi,t?ht-1+?E?εc,t·?εc,t?ht-1""""""""""" =δo,t?εo,t?ht-1+δf,t?εf,t?ht-1+δi,t?εi,t?ht-1+δc,t?εc,t?ht-1]
(57)
由式(13)~式(17)與式(50)可得:
[δt-1=δo,tWoh+δf,tWfh+δi,tWih+δc,tWch]"""""" (58)
其中,
[δo,t=δt⊙tanh(ct)⊙ot⊙(1-ot)]"""""" (59)
[δf,t=δt⊙ot⊙(1-tanh(ct)2)⊙ct-1⊙ft⊙(1-ft)]"""""" (60)
[δi,t=δt⊙ot⊙(1-tanh(ct)2)⊙ct⊙it⊙(1-it)]""" (61)
[δc,t=δt⊙ot⊙(1-tanh(ct)2)⊙it⊙(1-ct2)]"""""" (62)
[δt=?E?ht=-eWy]"" (63)
可遞推得到任意[p]時刻損失函數(shù)對隱層的梯度為:
[δp=δp+1?hp+1?hp,p=1,2,…,t-1]"" (64)
設(shè)當(dāng)前處于第[l]層,則第[l-1]層的梯度項可表示為:
[δl-1t=def?E?hl-1t]"""""" (65)
第[l]層LSTM的輸入[xlt]為:
[xlt=fl-1(hl-1t)]"""" (66)
式中:[fl-1]——從第[l-1]層到第[l]層的激活函數(shù)。
[εlf,t,][εli,t,][εlc,t]和[εlo,t]均為[xlt]的函數(shù),根據(jù)全導(dǎo)數(shù)公式有:
[δl-1t=?E?εlf,t·?εlf,t?xlt+?E?εli,t·?εli,t?xlt+"""""""""" ?E?εlc,t·?εlc,t?xlt+?E?εlo,t·?εlo,t?xlt?xlt?hl-1t""""" =(δlf,tWlfx+δli,tWlix+δlc,tWlcx+δlo,tWlox)⊙f ′(hl-1t)]""""" (67)
第[l-1]層[p]時刻的梯度項包括從第[l]層傳過來的誤差項和本層[p+1]時刻傳過來的梯度項兩部分。結(jié)合式(64)和式(67),可得出第[l-1]層[p]時刻的梯度項為:
[δl-1p=δlf,pWlfx+δli,pWlix+δlc,pWlcx+δlo,pWlox⊙f ′hl-1p+" δl-1p+1?hl-1p+1?hl-1p," p=1,2,…,t-1]" (68)
根據(jù)式(59)~式(62)、式(64)、式(67)以及式(68)計算得到4個梯度項[δlf,t],[δli,t],[δlo,t],[δlc,t],可求出[t]時刻的權(quán)重梯度和偏置梯度為:
[?E?Wl*h,t=?E?εl*,t·?εl*,t?Wl*h,t=δl*,thlt-1," *=f,i,o,c,l=1,2]"""" (69)
[?E?Wl*x,t=?E?εl*,t·?εl*,t?Wl*x,t=δl*,txlt," *=f,i,o,c,l=1,2] (70)
[?E?bl*,t=?E?εl*,t·?εl*,t?bl*,t=δl*,t," *=f,i,o,c,l=1,2]""" (71)
將各個時刻的梯度累加得出最終梯度為:
[?E?Wl*h=j=1tδl*,jhlj-1,*=f,i,o,c,l=1,2]""" (72)
[?E?Wl*x=j=1tδl*,jxlj,*=f,i,o,c,l=1,2]"""""" (73)
[?E?bl*=j=1tδl*,j,*=f,i,o,c,l=1,2]"""""" (74)
由式(72)~式(74)和式(45)可得:
[?e(k)?Wl*h(k)=e(k)-1j=1tδl*,j(k)hlj-1(k),*=f,i,o,c,l=1,2]"""""" (75)
[?e(k)?Wl*x(k)=(e(k))-1j=1tδl*,j(k)xlj(k),*=f,i,o,c,l=1,2] (76)
[?e(k)?bl*(k)=(e(k))-1j=1tδl*,j(k),*=f,i,o,c,l=1,2]"""" (77)
若學(xué)習(xí)率[η]滿足式(52),則有:
[η?e(k)?W(k)2F-2lt;0]""" (78)
由于式(55)中學(xué)習(xí)率[η]為正,[e(k)Te(k)]及[?e(k)?W(k)2F]兩項均為非負(fù),根據(jù)式(55)及式(78)可得出:
[ΔV(k+1)≤0]""""" (79)
根據(jù)李雅普諾夫穩(wěn)定性定理,定理2得證。
綜合定理1和定理2,MODWT-LSTM模型的整體收斂性得證。
4 仿真結(jié)果與分析
仿真實驗選取澳大利亞太陽能中心的90000組數(shù)據(jù)對模型進行訓(xùn)練,使用4個不同季節(jié)的數(shù)據(jù)集:[S1]、[S2]、[S3]和[S4]進行測試。其中,[S1]、[S2]、[S3]和[S4]4組測試集數(shù)據(jù)分別選自1月11——20日(夏季)、4月11——20日(秋季)、7月11——20日(冬季)、10月11——20日(春季)。
為全面評價光伏功率預(yù)測模型的預(yù)測精度,采用平均絕對誤差(MAE)、均方根誤差(RMSE)和擬合系數(shù)([R2])3種指標(biāo):
[δMAE=1Mt=1Mp(t+1)-p(t+1)]" (80)
[δRMSE=1Mt=1Mp(t+1)-p(t+1)2]"""" (81)
[R2=1-t=1Mp(t+1)-p(t+1)2t=1Mp(t+1)-p(t+1)2] (82)
式中:[M]——數(shù)據(jù)采樣點個數(shù);[p(t+1)]——功率預(yù)測值;[p(t+1)]——功率真實值的平均值。
仿真實驗在安裝于同一臺PC(Windows 10 64 bits,AMD Core R5 3.60 GHz CPU,32GB RAM)的PyCharm平臺運行,使用Python語言。為驗證MODWT-LSTM模型的結(jié)構(gòu)優(yōu)勢,將其與MODWT-MLP網(wǎng)絡(luò)以及LSTM網(wǎng)絡(luò)進行比較;為顯示分解層數(shù)對MODWT-LSTM預(yù)測性能的影響,將采用4層分解的MODWT-LSTM模型與只進行3層分解的MODWT-LSTM模型進行比較。所有對比模型均釆用來自同一光伏電站的相同訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。所有LSTM網(wǎng)絡(luò)的結(jié)構(gòu)均設(shè)置為6-100-100-1,批量(batch size)值設(shè)為64,初始權(quán)值和偏差均選取為隨機值(服從均值為0、方差為0.01的高斯分布)。為確定LSTM網(wǎng)絡(luò)的時間步長,設(shè)置時間步長為1~10的自然數(shù)分別進行多組重復(fù)實驗,結(jié)果如圖3所示。將擁有最小RMSE的時間步長確定為最優(yōu)時間步長,即最優(yōu)時間步長選取為5。當(dāng)訓(xùn)練階段誤差變化小于[10-3]或最大迭代次數(shù)達到75時,網(wǎng)絡(luò)訓(xùn)練終止。相應(yīng)地,MODWT-MLP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置為30-100-100-1,最佳時間步長選取為5,采用相同的訓(xùn)練算法。
圖4~圖7給出了4種模型在測試集上的擬合效果,表2列出了測試集的誤差評價指標(biāo)結(jié)果。從圖4~圖7可看出,
MODWT-LSTM模型的預(yù)測曲線幾乎與實際功率曲線重合,相比之下MODWT-MLP模型和LSTM模型的預(yù)測曲線均出現(xiàn)較為明顯的偏離。與單純的LSTM模型相比,MODWT-LSTM模型通過引入MODWT將原始的非平穩(wěn)光伏功率序列分解成平穩(wěn)子序列,使得網(wǎng)絡(luò)能夠更有效地抽象提取出高層特征,從而提高了預(yù)測精度。同時,由于MODWT在一定程度上削弱了噪聲帶來的功率波動性,因此增強了網(wǎng)絡(luò)性能在不同條件下的泛化能力。與MODWT-MLP模型相比,MODWT-LSTM
引入具有記憶功能的LSTM網(wǎng)絡(luò),解決了高維光伏功率數(shù)據(jù)的長期依賴問題,使得模型能夠充分利用歷史光伏功率數(shù)據(jù)和氣象數(shù)據(jù)中包含的有效信息,從而獲得了更為精確的預(yù)測結(jié)果。
表2同樣印證了在采用不同季節(jié)數(shù)據(jù)進行模型測試時,MODWT-LSTM模型具有最高的預(yù)測精度,其MAE和RMSE值均遠(yuǎn)低于MODWT-MLP模型和LSTM模型,R2值均高于MODWT-MLP模型和LSTM模型。同時,只進行3層分解的MODWT-LSTM模型在部分樣本集上預(yù)測誤差略高于采用4層分解的MODWT-LSTM模型,證明了采用4層分解時基于MODWT-LSTM的光伏功率預(yù)測具有更高的準(zhǔn)確性和穩(wěn)定性。
5 結(jié) 論
光伏功率預(yù)測是指導(dǎo)新能源電力系統(tǒng)安全穩(wěn)定運行的重要環(huán)節(jié)。針對光伏功率的隨機性和波動性特點,本文提出一種基于MODWT分解算法和LSTM網(wǎng)絡(luò)的光伏功率預(yù)測模型。將原始光伏功率序列分解為高頻和低頻的平穩(wěn)子序列,構(gòu)建LSTM網(wǎng)絡(luò)對每個平穩(wěn)的子序列分別進行預(yù)測,通過小波重構(gòu)生成最終預(yù)測結(jié)果。證明了MODWT分解算法的完全重構(gòu)性,并利用李雅普諾夫穩(wěn)定性分析方法推導(dǎo)了保證LSTM網(wǎng)絡(luò)收斂性的學(xué)習(xí)率范圍。仿真實驗結(jié)果證明,所提方法顯著提高了光伏功率預(yù)測精度并有效抑制了噪聲影響。
[參考文獻]
[1]"""" 吉鋅格, 李慧, 葉林, 等. 基于波動特性挖掘的短期光伏功率預(yù)測[J]. 太陽能學(xué)報, 2022, 43(5): 146-155.
JI X G, LI H, YE L, et al. Short-term photovoltaic power forecasting based on fluctuation characteristics mining[J]. Acta energiae solaris sinica, 2022, 43(5): 146-155.
[2]"""" 王福忠, 王帥峰, 張麗. 基于VMD-LSTM與誤差補償?shù)墓夥l(fā)電超短期功率預(yù)測[J]. 太陽能學(xué)報, 2022, 43(8): 96-103.
WANG F Z, WANG S F, ZHANG L. Ultra short term power prediction of photovoltaic power generation based on VMD-LSTM and error compensation[J]. Acta energiae solaris sinica, 2022, 43(8): 96-103.
[3]"""" 張姍, 冬雷, 紀(jì)德洋, 等. 基于NWP相似性分析的超短期光伏發(fā)電功率預(yù)測[J]. 太陽能學(xué)報, 2022, 43(4): 142-147.
ZHANG S, DONG L, JI D Y, et al. Power forecasting of ultra-short-term"" photovoltaic"" station"" based"" on"" NWP similarity analysis[J]. Acta energiae solaris sinica, 2022, 43(4): 142-147.
[4]"""" LIU X J, ZHANG H, KONG X B, et al. Wind speed forecasting using deep neural network with feature selection[J]. Neurocomputing, 2020, 397: 393-403.
[5]"""" 張雲(yún)欽, 程起澤, 蔣文杰, 等. 基于EMD-PCA-LSTM的光伏功率預(yù)測模型[J]. 太陽能學(xué)報, 2021, 42(9): 62-69.
ZHANG Y Q, CHENG Q Z, JIANG W J, et al. Photovoltaic power prediction model based on EMD-PCA-LSTM[J]. Acta energiae solaris sinica, 2021, 42(9): 62-69.
[6]"""" QING X Y, NIU Y G. Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM[J]. Energy, 2018, 148: 461-468.
[7]"""" GAO M M, LI J J, HONG F, et al. Day-ahead power forecasting"" in" a" large-scale" photovoltaic" plant" based on weather"" classification" using"" LSTM[J]." Energy," 2019, 187: 115838.
[8]"""" LI P T, ZHOU K L, LU X H, et al. A hybrid deep learning" model" for" short-term" PV power" forecasting[J]. Applied energy, 2020, 259: 114216.
[9]"""" BEHERA M K, NAYAK N. A comparative study on short-term PV power forecasting using decomposition based optimized""" extreme"""" learning""" machine"""" algorithm[J]. Engineering science and technology, an international journal, 2020, 23(1): 156-167.
[10]""" 王粟, 江鑫, 曾亮, 等. 基于VMD-DESN-MSGP模型的超短期光伏功率預(yù)測[J]. 電網(wǎng)技術(shù), 2020, 44(3): 917-926.
WANG S, JIANG X, ZENG L, et al. Ultra-short-term photovoltaic power prediction based on VMD-DESN-MSGP model[J]. Power system technology, 2020, 44(3): 917-926.
[11]""" 王振華. 基于日志分析的網(wǎng)絡(luò)設(shè)備故障預(yù)測研究[D]. 重慶: 重慶大學(xué), 2015.
WANG Z H. Study on failure prediction for network equipment based on log analysis[D]. Chongqing: Chongqing University, 2015.
[12]""" KUSHWAHA V, PINDORIYA N M. A SARIMA-RVFL hybrid model assisted by wavelet decomposition for very short-term solar PV power generation forecast[J]. Renewable energy, 2019, 140: 124-139.
[13]""" 譚小鈺, 劉芳, 馬俊杰, 等. 基于DBN與T-S時變權(quán)重組合的光伏功率超短期預(yù)測模型[J]. 太陽能學(xué)報, 2021, 42(10): 42-48.
TAN X Y, LIU F, MA J J, et al. Ultra-short-term PV power forecasting model based on DBN and T-S time-varying" weight" combination[J]." Acta" energiae" solaris sinica, 2021, 42(10): 42-48.
[14]""" JIAO R H, HUANG X J, MA X H, et al. A model combining stacked auto encoder and back propagation algorithm for short-term wind power forecasting[J]. IEEE access, 2018, 6: 17851-17858.
[15]""" WANG K J, QI X X, LIU H D. Photovoltaic power forecasting based LSTM-convolutional network[J]. Energy, 2019, 189: 116225.
PHOTOVOLTAIC POWER FORECASTING BASED ON MAXIMUM OVERLAP DISCRETE WAVELET TRANSFORM AND DEEP LEARNING
Ma Lele,Kong Xiaobing,Guo Lei,Liu Yuanyan,Liu Xiangjie
(School of Control and Computer Engineering, North China Electric Power University, Beijing 102206, China)
Abstract:Aiming at the non-stationary characteristics of PV power time series, this paper proposes a hybrid PV power forecasting model based on maximum overlap discrete wavelet transform (MODWT) and long short-term memory network (LSTM). First, Pearson correlation coefficient is used to identify important meteorological factors while MODWT is used to decompose the historical PV power series. The selected meteorological factors and the decomposed stationary subsequences are combined to form the input of each LSTM network. The sub-sequence prediction results of each LSTM network are integrated and reconstructed to the final PV power prediction results. The complete reconstruction of MODWT algorithm established in this paper is analyzed at the theoretical level, and the range of learning rate to ensure the convergence of the prediction network is derived based on Lyapunov stability theorem. The simulation results show that this proposed forecasting model has the obvious advantages in forecasting accuracy and robustness.
Keywords:photovoltaic power forecasting; long short-term memory network; non-stationary time series decomposition; convergence of prediction network