朱希,林俊德,施翔宇,林金陽
(1. 福建理工大學 微電子技術(shù)研究中心,福建 福州,350118;2. 智能電網(wǎng)仿真分析與綜合控制福建省高校工程研究中心,福建 福州 350118)
“碳達峰、碳中和”雙碳目標的提出明確了我國未來能源將朝著低碳、清潔的方向發(fā)展,風能資源的利用是實現(xiàn)該目標的主要途徑之一[1]。然而,風能資源規(guī)律性差、隨機性強,大規(guī)模接入電網(wǎng)后會對電力系統(tǒng)的經(jīng)濟安全運行造成影響。風電的超短期預測是指對未來0~4 h內(nèi)的風電有功功率以15 min為分辨率進行滾動預測,其實時準確性使其在解決風電聯(lián)網(wǎng)問題上得到了廣泛的應用,對風電消納、保持系統(tǒng)實時功率平衡具有重要意義[2]。
風電功率預測方法包括物理法和統(tǒng)計學習法兩大類。物理法需根據(jù)風電場的周圍環(huán)境搭建數(shù)學模型,模型復雜度高,不確定環(huán)節(jié)多,不適合用于風電的短期預測[3]。統(tǒng)計學習法因其以風電場的歷史數(shù)據(jù)以及歷史氣象數(shù)據(jù)為基礎,通過對數(shù)據(jù)進行特征挖掘和分析,建立風電特征與預測結(jié)果的非線性映射關(guān)系,與周圍環(huán)境無關(guān),預測速度快,被廣泛使用在短期和超短期風電預測研究中[4]。文獻[5]使用改進的支持向量機(support vector machines,SVM)模型進行風功率的短期預測,模型的預測精度更高,適應性更強,但SVM的參數(shù)選擇依賴經(jīng)驗判斷,存在一定的局限性。針對這些問題有學者提出了結(jié)合信號分解算法的預測模型。文獻[6]提出了集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition, EEMD)結(jié)合支持向量機SVM的風電功率預測模型,得到了良好的預測效果。文獻[7]提出了變分模態(tài)分解(variational modal decomposition, VMD)結(jié)合極限學習機的組合預測模型用于短期風電功率的預測,驗證了VMD在非平穩(wěn)和非線性序列分解中的有效性,能更好地挖掘數(shù)據(jù)特征。文獻[8]將完全自適應噪聲集合經(jīng)驗模態(tài)分解與奇異譜分析(singular spectrum analysis ,SSA)相結(jié)合,建立了風速預測模型,其中SSA用于提取最高頻率子層的趨勢分量,可獲得更高準確度的實驗結(jié)果。為進一步降低預測誤差,提供更精確的預測值,一些學者在模型中引入了誤差補償策略。文獻[9]將風速誤差分為橫向誤差和縱向誤差,分別采用互相關(guān)法和卷積神經(jīng)網(wǎng)絡法進行補償,所得結(jié)果在原來模型基礎上均方根誤差降低了17.8%。文獻[10]采用廣義回歸神經(jīng)網(wǎng)絡對誤差進行預測的方式對風速預測模型進行預測,在原模型的基礎上均方根誤差降低了5.89%。
綜上,提高風電功率的預測精度需解決風電功率數(shù)據(jù)自身的隨機性、波動性問題。本研究利用SSA算法的優(yōu)勢對VMD分解后的數(shù)據(jù)進行重構(gòu),平緩序列波動性,突出序列趨勢特征,通過長短期記憶網(wǎng)絡(long and short-term memory network,LSTM)對重構(gòu)序列進行預測,結(jié)合高斯過程回歸(gaussian process regression,GPR)補償預測誤差,建立VMD-SSA-LSTM-GPR的預測模型。
變分模態(tài)分解是一種非遞歸信號處理算法,它可以將信號分解為一系列具有不同中心頻率和有限帶寬的序列[11]。風電功率序列經(jīng)VMD分解后獲得具有不同頻率和明顯特征的序列,提高了序列的平穩(wěn)性。
假設將原始風電功率序列分解為K個特征模態(tài)分量,則約束變分模型如下:
(1)
式中,uk(t)表示分解得到的K個特征模態(tài)分量;ωk表示K個分量的中心頻率。
為求解式(1)的約束變分問題,引入罰因子C和拉格朗日乘子θ,將約束變分問題轉(zhuǎn)化為無約束變分問題,即
(2)
對于(2)中的無約束變分問題,采用乘法算子交替方向法求解,對uk和ωk在兩個方向上加以更新,即
(3)
(4)
式中,n是迭代次數(shù);上標^表示傅里葉變換。迭代終止條件為:
(5)
式中,γ為收斂誤差。
奇異譜分析是一種處理非線性時間序列數(shù)據(jù)的方法,通過對目標序列的軌跡矩陣進行分解、重構(gòu)等操作,將序列中的趨勢、振蕩、噪聲等分量提取出來,進行數(shù)據(jù)分析和去噪[12]。針對經(jīng)VMD分解后所得的序列,利用SSA在提取趨勢分量中的出色效果,對序列中參雜成分較高的高頻分量進行特征重構(gòu)。
計算過程為以VMD分解所得的特征模態(tài)分量U1為例,將長度為m的時間序列U1={u1,…,um},根據(jù)給定的嵌入維數(shù)K,將其轉(zhuǎn)化為軌跡矩陣X,即
(6)
式中,L為窗口長度,M為時間序列長度,L與K應滿足K=M-L+1,通常L≤M/2。
對軌跡矩陣X進行奇異值分解,即
X=Z1+Z2+…+Zd
(7)
式中,Zi為經(jīng)奇異值分解所得的分量(i=1,2,…,d)。
通過計算矩陣X的r(0≤r≤d)個奇異值之和對矩陣的貢獻率η,對獲得的子序列進行分析評價,以奇異值發(fā)生較大跳躍的情況將矩陣按頻率進行分組,貢獻率的計算如式(8):
(8)
(9)
長短期記憶網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network, RNN)的變體,為解決RNN在長序列中出現(xiàn)的梯度爆炸或梯度消失的問題,在RNN的結(jié)構(gòu)上增加了3個控制傳遞的門控單元。LSTM的結(jié)構(gòu)如圖1所示,門控單元具體包括遺忘門、輸入門和輸出門。其中遺忘門在保留有用信息的同時避免了上一時刻的無用信息向后傳遞,輸入門和輸出門用于讀取數(shù)據(jù)并將處理后的數(shù)據(jù)向下一個時刻傳遞,具體計算過程如式(10)。
圖1 LSTM單元結(jié)構(gòu)Fig.1 Structure diagram of LSTM unit
(10)
式中,ft,it,Ct,ot指t時刻的遺忘門、輸入門、細胞狀態(tài)和輸出門;σ為sigmoid函數(shù);Wf、Wi、WC、Wo為遺忘門、輸入門、細胞狀態(tài)和輸出門的權(quán)重矩陣;ht為t時刻的隱藏層輸出;xt為t時刻的輸入;bf、bi、bC、bO為遺忘門、輸入門、細胞狀態(tài)和輸出門的偏置項;tanh為雙曲正切函數(shù)。
高斯過程回歸是一種基于貝葉斯理論和統(tǒng)計學習理論的機器學習回歸方法,適用于解決高維、非線性等復雜的回歸問題[13]。根據(jù)風電功率實際值與預測值做差的方式求取預測誤差,并對預測誤差進行概率密度分析,確定其是否符合高斯分布,然后使用高斯過程回歸進行誤差補償。
對于所獲得的誤差序列,若其服從聯(lián)合高斯分布,如式(11):
f(x)~GPR(m(x),k(x,x′))
(11)
式中,m(x)為均值函數(shù),k(x,x′)為協(xié)方差函數(shù)。
考慮到噪聲的存在,GPR預測模型可進一步表示為:
y=f(x)+ε
(12)
式中,y為目標輸出,ε是獨立于f(x)的高斯白噪聲。
結(jié)合式(11)(12),則由目標輸出y組成的高斯過程回歸可表示為:
(13)
根據(jù)貝葉斯原理,訓練樣本的目標輸出y和測試樣本的目標輸出y*的先驗分布為:
(14)
式中,K(z,z*)是訓練輸入向量z和測試輸入向量z*之間的協(xié)方差矩陣,K(z*,z*)是測試輸入本身的協(xié)方差矩陣,K(z,z)是n×n的對稱正定協(xié)方差矩陣。
對于測試輸入向量z*,其預測輸出y*的后驗概率分布可以表示為:
(15)
式中,ˉy*表示測試輸入向量z*對應預測值的均值,cov(y*)為測試輸入向量z*對應的預測值的方差。
針對超短期風電功率預測問題,本研究提出基于VMD-SSA-LSTM-GPR的風電功率預測模型。
采用VMD和SSA結(jié)合的方式對原始風電功率序列進行預處理,原始數(shù)據(jù)經(jīng)VMD分解后所得模態(tài)再由SSA進行數(shù)據(jù)分析,根據(jù)公式(8)計算貢獻率η,選擇貢獻率大于0.01%特征表現(xiàn)明顯的分量進行重構(gòu)。通過經(jīng)麻雀搜索算法整定超參數(shù)的LSTM網(wǎng)絡對重構(gòu)的序列進行預測,再與原始數(shù)據(jù)做差得誤差數(shù)據(jù),使用高斯過程回歸對誤差數(shù)據(jù)進行預測后補償?shù)筋A測結(jié)果中,具體流程如圖2所示。
對于VMD分解模態(tài)數(shù)K難以確定的問題,本研究采用相關(guān)系數(shù)分析的方式選擇合適的K值。首先,由于EMD存在過分解問題,所以可通過EMD確定K的最大值Kmax;再以K=1開始對原始序列進行VMD分解;然后將分解后的模態(tài)分量進行重構(gòu),計算重構(gòu)后的序列與原始序列的相關(guān)系數(shù),以反映兩者的相關(guān)程度[14]。當相關(guān)系數(shù)達到閾值時,原始信號被完全分解,本研究實驗驗證表明閾值取0.998時分解效果最好,具體流程如圖2所示。重構(gòu)序列與原始序列之間的相關(guān)系數(shù)定義如式(16):
(16)
式中,上標^表示y(n)的重構(gòu)序列,y(n)是原始序列,ρxy(k)是當分解模態(tài)數(shù)為K時的相關(guān)系數(shù)。
最后,采用基于高斯模型的GPR預測模型對預測結(jié)果進行誤差補償,以此來提高預測的精度。
為合理評價預測模型的預測性能,本研究選取均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)和擬合優(yōu)度R2作為評價模型預測精確度的指標,其中RMSE和MAE值越小說明預測值與實際值偏差越小,R2越接近1,則預測值對真實值的擬合效果越好。計算公式如下:
(17)
(18)
(19)
式中,Pi為預測值,Pyi為實際值,ˉPyi為實際值的均值。
本研究以西北某風電場數(shù)據(jù)進行算例分析,包含2017年全年的風力發(fā)電實測功率。該風電場裝機容量為99 MW,時間分辨率為15 min,選取2017年中連續(xù)的共8 640個樣本點?;赑yCharm平臺搭建VMD-SSA-LSTM-GPR模型。
采用VMD算法分解原始風電功率序列,通過互相關(guān)函數(shù)法確定最佳的模態(tài)數(shù)K,結(jié)果如圖3所示。當K值增加到5后,相關(guān)系數(shù)變化平緩,基本接近一條直線,所以選取K值為5。選取分解后的5個模態(tài)分量,采用SSA對各模態(tài)進行數(shù)據(jù)分析,根據(jù)公式(8)計算各分量貢獻率,選取貢獻率大于0.01%的特征分量重構(gòu),重構(gòu)后的序列效果如圖4(a)所示,圖4(b)為局部放大圖。由圖4(b) 可知,經(jīng)VMD分解和SSA重構(gòu)后的序列相較于原序列更平滑,趨勢特征更加明顯。
圖3 相關(guān)系數(shù)趨勢圖Fig.3 Trend of correlation coefficient
圖4 重構(gòu)后序列對比圖Fig.4 Comparison of reconstructed sequences
實驗采用的風電功率序列共包含8 640個樣本點,將前89 d的數(shù)據(jù)即8 544個數(shù)據(jù)樣本作為訓練集,后96個數(shù)據(jù)樣本作為測試集,通過LSTM模型進行風功率的預測。針對LSTM超參數(shù)選取問題,采用麻雀搜索算法對LSTM的超參數(shù)進行尋優(yōu),算法參數(shù)設置如表1所示。超參數(shù)尋優(yōu)結(jié)果如表2所示。
表1 麻雀搜索算法參數(shù)設置Tab.1 Sparrow search algorithm parameter settings
表2 LSTM超參數(shù)設置Tab.2 LSTM hyperparameter settings
為驗證預測模型的實用性,將一年數(shù)據(jù)劃分為4個季節(jié),分別對春季典型日和秋季典型日進行風電功率預測。圖5展示了支持向量回歸(support vector regression,SVR),LSTM,VMD-LSTM,EMD-LSTM,VMD-SSA-LSTM,VMD-SSA-LSTM-GPR等6種模型的預測結(jié)果。結(jié)合圖5(a)和圖5(b)可以看出,不論是功率波動較大時的春季模型,還是波動相對平緩的秋季模型,所提模型的風電功率序列的擬合效果都比同等條件下的其他模型更好。
圖5 典型日預測結(jié)果Fig.5 Predicted results for a typical day
對比春秋季不同模型的評價指標可知,所提模型無論是在風電變化頻率快的春季還是相對緩和的秋季,都具有較高的預測準確度。
由表3可知,以春季預測結(jié)果為例分析,單一模型SVR與LSTM在預測風電功率上具有一定的準確性,但準確度不高。結(jié)合圖5分析可知其原因在于SVR和LSTM雖可預測風電數(shù)據(jù)的變化趨勢,但難以把握數(shù)據(jù)的隨機波動性致使誤差較大。與LSTM相比,經(jīng)EMD分解后的EMD-LSTM模型的RMSE、MAE分別下降了48.88%,40.83%,R2提高了11.84%,說明結(jié)合信號分解算法能顯著提高預測模型的準確性。與EMD-LSTM相比VMD-LSTM模型的RMSE、MAE模分別減少了29.20%,17.33%,R2提高了2.08%,主要由于VMD相較于EMD具有更完備的數(shù)學理論,在處理非線性非平穩(wěn)信號上更有優(yōu)勢。與VMD-LSTM相比VMD-SSA-LSTM模型的RMSE、MAE分別減少了4.18%,12.92%,R2提高了0.17%,這是由于SSA對VMD分解后的各模態(tài)進行了特征的重提取,凸顯序列的主要成分,提高了強耦合數(shù)據(jù)所占的權(quán)重。與VMD-SSA-LSTM相比,VMD-SSA-LSTM-GPR模型的RMSE、MAE分別減少了10.2%,25.62%,R2提高了0.72%,主要由于VMD-SSA-LSTM-GPR模型引入了GPR誤差補償模塊,對數(shù)據(jù)預處理時優(yōu)化掉的部分數(shù)據(jù)以及預測模型產(chǎn)生的誤差進行補償,進一步提高模型的預測準確度。
表3 各模型評價指標對比Tab.5 Comparison of evaluation indicators of each model
為實現(xiàn)風電功率的實時準確預測,提出了一種基于VMD-SSA-LSTM-GPR的風電功率超短期預測模型,經(jīng)算例分析和不同預測模型結(jié)果對比,結(jié)果表明:
1)通過對風電功率序列進行VMD分解,再使用SSA對分解后的各模態(tài)進行數(shù)據(jù)分析重構(gòu)的預處理方式,能夠有效提升數(shù)據(jù)的平穩(wěn)性,減少噪聲信號的干擾,更利于神經(jīng)網(wǎng)絡進行數(shù)據(jù)的擬合。
2)采用GPR預測模型進行誤差補償,能夠有效補償神經(jīng)網(wǎng)絡模型產(chǎn)生的預測誤差,在增加預測精度的同時,進一步提高模型的抗干擾能力。
本研究僅針對風電功率數(shù)據(jù)進行預測,并未涉及影響風力發(fā)電的環(huán)境因素,未來可結(jié)合風電場環(huán)境數(shù)據(jù)與風電功率數(shù)據(jù)進行特征融合的方式進行預測模型的搭建,在提高模型預測準確性的同時提高其適應能力。