文 | 劉震,劉丹,王彥文,孫書貝,劉冰
隨著風(fēng)電并網(wǎng)規(guī)模的快速擴大,風(fēng)電的不確定性對電力系統(tǒng)與電力市場的穩(wěn)定性、充裕性及經(jīng)濟學(xué)的影響也日益增大,故及時和準(zhǔn)確地預(yù)測風(fēng)電 功率(Wind Power,WP)的 意義重大。風(fēng)電功率預(yù)測(Wind Power Prediction,WPP)根據(jù)風(fēng)速及相關(guān)因素的歷史數(shù)據(jù),演化其后續(xù)的過程。具體需要建立數(shù)學(xué)模型來反映WP與相關(guān)因素的關(guān)系,外推WP值。WPP可按時間尺度分為中長期、短期和超短期預(yù)測。用于風(fēng)電場規(guī)劃及年度發(fā)電計劃的長期預(yù)測以年為時效;用于檢修計劃的中期預(yù)測以周或月為時效。中長期預(yù)測對精度的要求不嚴格,但需要長時間的歷史數(shù)據(jù)積累。短期預(yù)測則要求較高的精度,以減少棄風(fēng),優(yōu)化常規(guī)電源的日發(fā)電計劃與冷熱備用,以及調(diào)整檢修計劃。超短期預(yù)測則有助于優(yōu)化調(diào)頻及旋轉(zhuǎn)備用容量,以及在線優(yōu)化機組組合與經(jīng)濟負荷調(diào)度。本文主要關(guān)注超短期預(yù)測。
超短期預(yù)測方法可以分為物理方法和統(tǒng)計方法。已有研究表明,對于超短期風(fēng)電功率預(yù)測方法應(yīng)采用統(tǒng)計方法。超短期風(fēng)電功率預(yù)測中所用到統(tǒng)計預(yù)測方法有支持向量機、卡爾曼濾波法、自回歸滑動平均(Auto Regressive Integrated Moving Average,ARIMA)模型、回歸模型,人工神經(jīng)網(wǎng)絡(luò)(ANN)等人工智能算法。
超短期預(yù)測考核第4h點已是一種趨勢,以上所提到的單體算法均不能很好擬合超短期第4h點的狀態(tài)?;诖?,本文提出組合算法進行超短期預(yù)測的研究。目前對組合算法的研究甚少,一般的研究思路是先對原始序列信號進行分解,再利用一些方法對子序列進行分類,最后對不同的子序列分別預(yù)測,再將預(yù)測值合并。所以說,此類組合方法體現(xiàn)在預(yù)測的不同階段選取不同的算法進行處理,但原始序列相對單一,從而所攜帶的信息量也相對較少。本文是從影響目標(biāo)各因素的角度出發(fā),考慮了天氣預(yù)報的影響,考慮了序列趨勢和規(guī)律性的影響,考慮了系統(tǒng)預(yù)測誤差的影響;選取了多元回歸算法、自回歸滑動平均(ARIMA)模型和卡爾曼濾波算法。本文將對這3種算法分別做獨立的預(yù)測工作,得到3組預(yù)測結(jié)果,并給出3組預(yù)測結(jié)果的評價指標(biāo);最終將3種算法所得預(yù)測結(jié)果通過最小方差法做加權(quán)組合,得到一組新的預(yù)測結(jié)果,并給出相應(yīng)的評價指標(biāo)。
回歸分析是預(yù)測最常用的方法之一。在實際工作中,某種現(xiàn)象或結(jié)果的產(chǎn)生通常與某些因素有關(guān),我們通過數(shù)據(jù)分析可以看出其中存在的某種趨勢和規(guī)律。
假設(shè)存在一個因變量y,n個自變量 (x1,x2, ,xn),則可建立它們之間的回歸方程:
其中β0,β1,β2, ,βn為待定系數(shù)B,稱為回歸系數(shù)。若實驗測得m組相互獨立的數(shù)據(jù),假設(shè)每次觀測時的隨機誤差ε為白噪聲,即ε~N(0,σ2)。為了求解系數(shù)B,則可利用最小二乘法來計算回歸系數(shù),使得殘差平方和達到最小,求得待定系數(shù)為:
時間序列分析的主要目的是根據(jù)已有的歷史數(shù)據(jù)對未來進行預(yù)測,時間序列中的時間可以是年份、季度、月份或其他任何時間形式;其次,其預(yù)測時效一般不會太長,且隨著預(yù)報時長的增加,預(yù)測精度逐漸下降。時間序列模型主要包括穩(wěn)定模型和非穩(wěn)定模型。常用的穩(wěn)定模型有自回歸(Auto Regressive,AR)模型、滑動平均(Moving Average,MA)模型、自回歸滑動平均(ARIMA)模型幾種。非穩(wěn)定模型可以經(jīng)過差分或相應(yīng)變換處理,將其轉(zhuǎn)換成平穩(wěn)序列,然后再使用上述常用的時間序列模型;一般對于非平穩(wěn)序列比較常用的有差分自回歸滑動平均(ARIMA)模型等。其中,ARIMA(p,d,q)模型的表達式為:
式中,{Xt}(t=1,2,3, )為時間序列;{εt}是均值為0、方差為σ2的白噪聲過程;?i(i=1,2, ,p)和θi(i=1,2, ,q)為模型的系數(shù);B為滯后算子;k=1-B;?(B)=1-?1B-?2B2- -?pBp;θ(B)= 1 -θ1B-θ2B2- -θqBq。
在模型建立時,首先,根據(jù)訓(xùn)練數(shù)據(jù)的自相關(guān)系數(shù)ρk和偏相關(guān)系數(shù)?kk進行模型定階;同時,選取最小信息準(zhǔn) 則(Akaike Information Criterion,AIC)和BIC進行模型定階,確定出p,q。通過訓(xùn)練數(shù)據(jù)得出模型系數(shù)估計值,得出模型表達式。
卡爾曼于1960年提出卡爾曼濾波算法,后來,此算法在許多領(lǐng)域得到廣泛的應(yīng)用。卡爾曼濾波的本質(zhì)是通過觀測值重新構(gòu)建了系統(tǒng)狀態(tài)變量;通過以預(yù)測-觀測-修正的流程依次迭代實現(xiàn)。所以,卡爾曼算法是一種動態(tài)修正的算法。
在卡爾曼濾波算法中,分為狀態(tài)方程和測量方程,其數(shù)學(xué)表達式如下:
式中,x(k)為在k時刻的狀態(tài)向量;z(k)為k時刻的觀測向量;Φ(k+1,k)和H(k+1)分別為系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣和輸出轉(zhuǎn)移矩陣;Γ(k+1,k)為激勵轉(zhuǎn)移矩陣;ω(k)和v(k)分別為系統(tǒng)噪聲以及測量噪聲,假定為相互獨立且服從高斯分布的白噪聲;對應(yīng)的協(xié)方差矩陣為W(k)和V(k)。
假設(shè)給定初始狀態(tài)向量x(0)=[0],則是由下面的遞推公式?jīng)Q定的,即:
式中,K(k+1)為卡爾曼增益(Kalman Gain),其計算公式如下:
為了使濾波器不斷更新下去,還要更新k+1時刻下狀態(tài)x(k+1)的協(xié)方差:
組合預(yù)測方法的基本思想是將不同的預(yù)測方法結(jié)合起來,組合預(yù)測方法能夠利用每個單體預(yù)測方法的信息;組合預(yù)測方法一般能增加系統(tǒng)預(yù)測的準(zhǔn)確性和穩(wěn)定性。
本文選取了三種單體算法,分別為多元回歸算法、時間序列算法以及卡爾曼濾波算法,考慮因變量和自變量之間影響因素,選擇了多元回歸算法;從預(yù)測的時效性考慮選用了時間序列算法(ARIMA);從動態(tài)修正的思想和系統(tǒng)誤差的角度考慮使用了卡爾曼濾波算法。
目前常用的組合預(yù)測方法包括最小方差法、無約束(約束)最小二乘方法、Bayes方法等。在實際應(yīng)用和理論研究中使用最多的是最小方差法,一般采用絕對誤差作為準(zhǔn)則來計算組合預(yù)測方法的權(quán)重系數(shù)。
假設(shè)第i個單體模型的誤差為ei,方差為Var(ei);組合預(yù)測模型的誤差為e,方差為Var(e),則:
組合預(yù)測的方差可以寫成:
要使得Var(e)達到最小,可以轉(zhuǎn)化為如下優(yōu)化問題來求解:
對這類約束優(yōu)化問題一般采用拉格朗日乘數(shù)法來求解,最終得出:
可以證明Var(e)min≤min(Var(ei)),所以說,一般組合預(yù)測方法的效果會優(yōu)于每種單體算法的效果。
本文以中國云南省某8個風(fēng)電場2016年的實際運行數(shù)據(jù)為例,數(shù)據(jù)主要包括實際功率和短期預(yù)測功率;實際功率數(shù)據(jù)是指現(xiàn)場實時的出力;短期預(yù)測功率數(shù)據(jù)由功率預(yù)測廠家提供;每種數(shù)據(jù)的分辨率均為15min,一天有96條記錄。
根據(jù)國家能源局2011年對現(xiàn)行風(fēng)電場風(fēng)電功率預(yù)測預(yù)報的管理規(guī)定:風(fēng)電實時預(yù)測(超短期預(yù)測)考核指標(biāo)一般僅采用準(zhǔn)確率指標(biāo),實時預(yù)測一般只是指未來15min~4h的預(yù)測。
(1)均方根誤差RMSE:
(2)準(zhǔn)確率r1:
式中,r1為預(yù)測計劃曲線準(zhǔn)確率;PMk為k時段的實際平均功率;PPk為k時段的預(yù)測平均功率;N為日考核總時段數(shù)(取96點-免考核點數(shù));Cap為風(fēng)電場開機容量。
月(年)平均風(fēng)電預(yù)測計劃曲線準(zhǔn)確率(%)為日平均預(yù)測計劃曲線準(zhǔn)確率的算術(shù)平均值。
(一)各單體算法訓(xùn)練樣本量的選取
本文將采用的3種單體算法分別進行研究,首先對其最優(yōu)訓(xùn)練樣本量進行選擇和測試。測試訓(xùn)練樣本量的選取從4h訓(xùn)練數(shù)據(jù)至40h訓(xùn)練數(shù)據(jù),時間跨度為4h。分別對未來15min、1h、2h、3h以及4h時刻(分別對應(yīng)第一個、第二個、第三個、第四個以及第五個點)的預(yù)測數(shù)據(jù)進行分析。以卡爾曼算法為例,圖1為卡爾曼算法五個點的預(yù)測均方根誤差與訓(xùn)練樣本量之間的關(guān)系。
由圖1可以看出,第一個點和第二個點的均方根誤差隨著訓(xùn)練樣本量的增加,基本上是逐漸增大的;而到第三個點時,此規(guī)律就沒有這么明顯;第四和第五個點的均方根誤差隨著訓(xùn)練樣本量的增加,幾乎沒有明顯變化,呈現(xiàn)出相對穩(wěn)定的狀態(tài)。因為卡爾曼算法的原理就是修正系統(tǒng)誤差,所以對鄰近時刻的數(shù)據(jù)比較敏感。綜合穩(wěn)定性和各單體算法的原理,將3種單體算法的訓(xùn)練樣本量設(shè)定為32(8h)個數(shù)據(jù)點。
(二)各單體算法的實現(xiàn)與驗證
本文選取的自變量為短期預(yù)測功率和時間向前推4h歷史實際功率,因變量為當(dāng)前歷史實際功率。同時,對回歸模型殘差服從標(biāo)準(zhǔn)正態(tài)分布的這一假設(shè)進行了驗證。圖2是多元回歸殘差的分布圖,從圖中可以看出殘差基本是以0為中心,向左右兩邊均勻分布的。
圖1 卡爾曼算法預(yù)測結(jié)果(不同預(yù)測點)的誤差和訓(xùn)練樣本量之間的關(guān)系
圖2 多元回歸模型所得殘差頻數(shù)分布直方圖
圖3 多元回歸模型所得預(yù)測結(jié)果和實際功率曲線圖
圖3展示了回歸模型的預(yù)測效果,可以看出,回歸模型的預(yù)測在整體上是把握了整體趨勢的變化;但在局部點上還是存在較大的差異。風(fēng)電功率預(yù)測誤差主要分為兩種,第一種是縱向誤差,第二種為橫向誤差;其中縱向誤差主要描述了某一時段的預(yù)測結(jié)果在豎直方向與實際結(jié)果的差別,可以用偏大或偏小來衡量;而橫向誤差則主要描述預(yù)測結(jié)果在水平時間軸上與實際結(jié)果的差別。可見回歸模型的優(yōu)點就是降低了橫向誤差,但對縱向誤差并沒有明顯的效果。
圖4為訓(xùn)練數(shù)據(jù)經(jīng)過平穩(wěn)化后的ACF和PACF圖,從圖中可以看出,ACF和PACF都是1階截尾的,所以可以初步確定模型為ARMA(1,1)。
最后,對未來4h的實際出力進行預(yù)測。圖5是ARIMA算法所得的超短期預(yù)測結(jié)果和實際出力的對比圖,可以看出,該模型能夠降低預(yù)測功率和實際功率的縱向誤差,較好地擬合未來4h實際功率的縱向波動。
卡爾曼算法主要從動態(tài)修正的思想和系統(tǒng)誤差這一方向來解決問題??柭惴ǖ妮斎霐?shù)據(jù)為歷史實際功率和短期預(yù)測功率,通過實時數(shù)據(jù)動態(tài)修正短期預(yù)測功率。圖6展示了卡爾曼算法的修正效果,從圖中可以看出,經(jīng)過卡爾曼算法對誤差的動態(tài)修正,使得超短期的預(yù)測更能“貼近”實際功率。因此,與多元回歸模型不同的是卡爾曼算法對降低縱向誤差有著顯著的效果。
(三)組合算法的實現(xiàn)與驗證
通過對每個單體算法的分析與驗證,給出了本文選取此3種算法的依據(jù)。將這3種算法通過最小方差組合算法進行組合。
圖4 平穩(wěn)數(shù)據(jù)的ACF和PACF圖
圖5 ARIMA超短期功率預(yù)測結(jié)果和實際功率曲線圖
圖6 卡爾曼模型所得預(yù)測結(jié)果和實際功率以及短期預(yù)測功率曲線圖
圖7 各單體算法和組合算法預(yù)測誤差對比圖
圖7是3種單體算法和組合算法預(yù)測誤差的對比圖。其中ARIMA算法和卡爾曼算法所得誤差的變化較劇烈;組合算法在每個點上的誤差幾乎都能達到最小。通過計算得組合預(yù)測誤差的方差為4.2519,ARIMA算法誤差的方差12.7935,多元回歸算法誤差的方差為6.2052,卡爾曼算法誤差的方差為11.8062。所以,可以驗證Var(e)min≤min(Var(ei))。
圖8是各單體算法和組合算法的超短期預(yù)測結(jié)果對比圖??梢娮钚》讲罱M合算法所得預(yù)測結(jié)果均優(yōu)于3種單體算法預(yù)測結(jié)果。
本文采用云南省份8個風(fēng)電場近半年的數(shù)據(jù)對每種算法進行訓(xùn)練,每種方法選取不同的預(yù)測長度進行分析,預(yù)測長度分為 15min、1h、2h、3h、4h。表1展示了不同預(yù)測長度下每種算法的預(yù)測誤差和準(zhǔn)確率。
實驗結(jié)果表明,當(dāng)預(yù)測時長小于2h時,單體算法ARIMA算法表現(xiàn)最優(yōu);當(dāng)預(yù)測時長在2~4h時,組合算法表現(xiàn)最優(yōu)。
圖8 各單體算法和組合算法的超短期功率預(yù)測結(jié)果對比圖
表1 不同預(yù)測步長不同算法的預(yù)測誤水平
風(fēng)電場的輸出功率在一定程度上呈現(xiàn)隨機性和波動性的特點,并且隨著預(yù)測時長的變大,這種隨機性和波動性的特點表現(xiàn)尤為突出。單體算法會導(dǎo)致某些預(yù)測點存在較大的誤差,組合算法會在某種程度上降低誤差。單體預(yù)測算法是組合算法的基礎(chǔ),其預(yù)測結(jié)果的好壞直接影響組合預(yù)測的效果,本文將不同的輸入信息分別輸入到3種單體算法中,并利用了單體算法自身的預(yù)測優(yōu)勢,有效避免了采用相似的單體預(yù)測算法進行組合帶來的模型冗余。在預(yù)測時段較長時,本文提出組合算法彌補了單體算法建模預(yù)測的不足。在進行超短期預(yù)測時,多元回歸算法能較準(zhǔn)確預(yù)測出實際功率未來4h的變化趨勢,但在縱向上多元回歸所產(chǎn)生的預(yù)測功率和實際功率還存在較大的誤差;ARIMA算法能夠較好地擬合未來4h實際功率的縱向波動,從而在多元回歸算法的基礎(chǔ)上,降低預(yù)測功率和實際功率的縱向誤差,卡爾曼算法能較好地對未來4h的實際功率預(yù)測值進行動態(tài)修正。針對西北和部分南方區(qū)域,超短期考核第4h點,組合算法表現(xiàn)較優(yōu)。