付 桐 林
(隴東學院 數(shù)學與統(tǒng)計學院,甘肅 慶陽 745000)
基于季節(jié)調(diào)整和時間序列相混合的中國環(huán)縣長期風速預測
付 桐 林
(隴東學院 數(shù)學與統(tǒng)計學院,甘肅 慶陽 745000)
風電系統(tǒng)中,風速是一個關鍵參數(shù),風速的準確預測可以減少調(diào)度錯誤,增加電網(wǎng)的可靠性。本文給出了基于季節(jié)調(diào)整法與自回歸滑動平均模型(ARMA)和廣義自回歸異方差模型(GARCH)的相結合的混合預測模型,對2013年環(huán)縣的月平均風速做出預測。仿真結果表明這種方法要比單獨使用ARMA或GARCH預測效果要好,能夠準確有效地實現(xiàn)月平均風速的預測。
ARMA;GARCH J-T檢驗;風速預測;季節(jié)調(diào)整
Abstract: Wind speed is a key parameter within the wind energy system and the forecasting of wind speed with a high degree of accuracy can minimize the scheduling errors and improve the reliability of power grid.In this paper,the hybrid models based on seasonal adjustment method(SAM)and the ARMA model or the GARCH model are proposed to forecast the monthly average wind speed in 2013 in Huanxian County.The simulation results show that the developed methods have better performance than the ARMA and GARCH model’s,and the monthly average wind speed can be forecasted accurately and effectively.
Keywords: ARMA;GARCH;J-T Test;Wind Speed Prediction;Seasonal Adjustment Method
能源危機促使人類去尋找一種可替代的新型能源,由于風能具有綠色環(huán)保和可再生性以及低投入和高收益的優(yōu)點而備受親睞。2015年,全球風電產(chǎn)業(yè)新增裝機63013MW,同比增長22%。其中,中國風電新增裝機容量達30500MW,占據(jù)了全球新增風電裝機容量的28.4%[1]。在風能開發(fā)的應用中,風速是關鍵參數(shù),而準確預測出風速非常困難,這就增加了開發(fā)風能的難度。近年來,很多學者根據(jù)歷史風速數(shù)據(jù)提出了多種預測方法以期提高風速預測精度[2-4],但是單獨地使用某個模型去預測風速會導致誤差較大,因此很多學者又提出了利用混合模型實現(xiàn)風速的預測[5-10]以及利用組合模型去預測風速的方法[4-6]。通常風速預測結果的相對平均誤差變化范圍是25%到40%[10],誤差來源不僅與預測方法有關,而且與預測時期以及預測區(qū)域有關。總的來說,風速預測周期越短,預測地點風速變化越穩(wěn)定,預測的誤差越小。
本文中,我們構建了基于季節(jié)調(diào)整法(SAM)與自回歸滑動平均模型(ARMA)和廣義自回歸異方差模型(GARCH)相結合的混合預測模型,據(jù)此環(huán)縣月平均風速進行預測,仿真結果表明這種方法要比單獨使用ARMA或GARCH預測精度要高。
考慮到月平均風速具有季節(jié)性差異(如圖1所示),需要對風速時間序列采取消除季節(jié)因子的措施,以便實現(xiàn)風速的準確預測。由于ARMA模型和GARCH模型適用于波動性時間序列的預測和分析,近年來有學者使用ARMA模型和GARCH模型來預測風速[2,3]。本文中,我們將這兩種方法相結合的預測模型稱為SAM-ARMA和SAM-GARCH模型。預測過程包括三個基本階段:(1)用J-T檢驗來檢驗2013年的月平均風速數(shù)據(jù)集是否具有顯著的差異,單位根的檢驗來檢驗2006-2013年風速時間序列的平穩(wěn)性;(2)若沒有顯著性差異,則采用季節(jié)調(diào)整法(SAM)消除季節(jié)性因素的影響;(3)分別用SAM-ARMA和SAM-GARCH模型來預測風速,并與單獨使用ARMA模型或GARCH模型預測風速的精度做比較。
1.1J-T檢驗
在多個獨立樣本非參數(shù)檢驗中,J-T檢驗可以檢驗多個獨立樣本的位置參數(shù)是否持續(xù)上升或下降,確定k組樣本是否來自同一總體。J-T的原假設是k組樣本來自同一總體或者說它們是來自總體位置參數(shù)的總體,其備擇假設是各個總體的位置參數(shù)按照升序排列或降序排列。J-T檢驗有兩個步驟:
(1)將兩組樣本值進行對比,計算第i組觀測值小于第i′組觀測值的對數(shù)Mi,i′。設xij是第i組第j個元素,k是樣本組數(shù),ni是第i組樣本的樣本點數(shù)。記xi,j (i=1,…,k;i′=1,…,k;i≠i′) (1) (2)計算J-T檢驗的統(tǒng)計量J=∑Mi,i′。在原假設成立時可以證明統(tǒng)計量: (2) 具有漸近正態(tài)性,即Z~N(0,1)。在給定的顯著水平α下求得Z的伴隨概率p,如果p值小于顯著性水平α,那么拒絕原假設。 1.2季節(jié)調(diào)整法(SAM) 假設有一系列的數(shù)據(jù)x1,x2,…,xT(T=ml),可以記為: x11,x12,…x1l;…;xm1,xm2,…xmlx21,x22,…x2l (3) 所以: (4) 季節(jié)調(diào)整滿足歸一化條件。通過相應的季節(jié)性指數(shù)Is對時間序列的每個元素xks進行分割yks=xks/IS,(k=1,2,…,m;s=1,2,…,l),從而得到一個不受季節(jié)性因素影響的時間序列。 1.3ADF檢驗 對時間序列單位根的檢驗就是對時間序列平穩(wěn)性的檢驗,非平穩(wěn)時間序列如果存在單位根,則一般可以通過差分的方法消除單位根,得到平穩(wěn)序列。單位根檢驗是建立ARMA模型的基礎。 1.4ARMA預測模型 定義yt為p階自回歸-q階滑動平均過程,簡記為ARMA(p,q): yt-φ1yt-1-φ2yt-2-…-φpyt-p= at-θ1at-1-θ2at-2…θqat-q (5) 或者φ(B)yt=θ(B)at,則稱時間序列yt服從(p,q)階自回歸移動平均。p是自回歸階數(shù),q是滑動平均階數(shù),yi(i=t,t-1,…,t-p)是剔除季節(jié)性因素后的時間序列,aj(j=t,t-1,…,t-p)是零均值白噪聲參數(shù),φ1,φ2…,φp稱為自回歸參數(shù),參數(shù)θ1,θ2,…,θq稱為滑動平均參數(shù)。 若p=0,則ARMA(0,q)模型yt=at-θ1at-1-θ2at-2-…θqat-q稱為q階滑動平均模型,記為MA(q)。若q=0,則ARMA(p,0)模型yt-φ1yt-1-φ2yt-2-…-φpyt-p=at稱為p階自回歸模型,記為AR(p)。 根據(jù)Box-Jenkins提出的方法,用樣本自相關函數(shù)與偏相關函數(shù)的截尾性識別ARMA模型的階數(shù)。若平穩(wěn)時間序列yt的pk呈q步截尾,而φkk拖尾,則識別序列yt為MA(q)序列;若pk拖尾,而φkk呈p步截尾,則識別序列yt為AR(p)序列;pk和φkk均拖尾,則診斷序列yt為ARMA(p,q)序列[2]。 1.5GARCH模型的構造 1982年美國人Engle開創(chuàng)性地提出自回歸異方差模型(ARCH)模型,刻畫出隨時間而變異的條件方差。1986年,Bollerslev對誤差的方差進一步研究,提出廣義的ARCH模型,即GARCH模型[2],將GARCH模型運用在時間序列分析上能夠更有效地捕捉條件方差的動態(tài)特征,特別適合進行波動性預測和分析。記服從(p,q)階回歸GARCH模型的時間序列: Engle在1982年提出檢驗殘差序列中是否存在ARCH效應的方法有BDS檢驗、拉格朗日乘數(shù)檢驗(LM)等,其中LM檢驗是最為常用的檢驗方法。首先用最小二乘法(OLS)進行參數(shù)估計,然后對殘差平方項進行輔助回歸,再檢驗所有回歸系數(shù)是否同時為0,最后在考察異方差原假設成立的前提下,檢驗統(tǒng)計量nR2是否具有漸近χ2(q)分布[14]。 1.6預測性能的評估 對預測結果進行評價,選擇絕對平均誤差MAE和相對平均誤差MAPE。定義如下: MAE和MAPE是評價預測精度的重要指標,一般地,MAE和MAPE值越小,預測精度越高。 環(huán)縣隸屬于甘肅省慶陽市,位于甘肅省東部、慶陽市西北部,地處北緯36°1′~37°9′,東經(jīng)106°21′~107°44′之間,屬黃土高原丘陵溝壑區(qū),全境90%以上面積為黃土覆蓋,土層厚度在60~240m之間。境內(nèi)有較大山脈106座,山掌400個,大小溝道17364條,大小殘原527塊。特殊的地理風貌和長期的農(nóng)業(yè)耕作使得該地區(qū)水土流失嚴重,環(huán)境惡化,脫貧致富路途遙遠。而這一區(qū)域海拔在1136至2089米之間,氣候屬溫帶大陸性季風氣候,適宜風電場的建設。在國家鼓勵新能源建設和精準扶貧的背景下,該區(qū)域調(diào)整產(chǎn)業(yè)結構,優(yōu)化資源配置,大力發(fā)展風電場開發(fā)與建設。因此,為了優(yōu)化風電并網(wǎng)管理和電力負荷預測,以及實現(xiàn)更大規(guī)模的風電場建設,亟需對黃土高原隴東區(qū)風電場風速做出預測,研究風速對風電項目產(chǎn)生的效益。 原始數(shù)據(jù)集包含兩部分,即2006年~2012年的月平均風速值和2013年的月平均風速值(如圖1所示),后者作為評價模型精度的參照對象,用來檢驗模型的預測效果。對數(shù)據(jù)集做J-T檢驗,結果如表1所示,檢驗的p值為0.591,大于顯著性水平0.05,因此接受原假設,即每年的數(shù)據(jù)集的分布不存在顯著差異,即2006~2013的月平均風速數(shù)據(jù)集包含周期為12的季節(jié)波動。 圖1 甘肅省環(huán)縣2006~2013年月平均風速 表1 J-T檢驗 季節(jié)性時間序列可以分解成一個季節(jié)性元素Is和非季節(jié)性元素yks(yks=xks/Is)的乘積,非季節(jié)性元素可以通過很多方法進一步預測。具體方法是基于SAM將原始數(shù)據(jù)集消除季節(jié)因子后,分別用ARMA和GARCH模型進行風速預測,再將季節(jié)性因素按照乘法模型加入到預測結果中。 用SAM消除季節(jié)因子后的風速序列如圖2所示,從圖2可以看出:序列波動幅度有所減緩。對于剔除季節(jié)性因素的時間序列利用Eviews軟件進行單位根檢驗,判斷時間序列是否為平穩(wěn)序,ADF檢驗的t統(tǒng)計量的值為-7.2177,分別小于檢驗水平為1%,5%和10%的t統(tǒng)計量臨界值-3.5113,-2.8968和-2.5856,而且t統(tǒng)計量相應的概率p非常小,因此在顯著性水平1%,5%和10%下,因此拒絕序列存在單位根的原假設,即剔除季節(jié)性因子的時間序列是平穩(wěn)序列,可以建立ARMA模型計算消除季節(jié)因子后的風速序列的自相關—偏自相關函數(shù)并繪圖如圖3所示。 圖2 消除季節(jié)因子的月平均風速 圖3 消除季節(jié)因子后風速序列的自相關和偏相關函數(shù)圖 由圖3可知:自相關函數(shù)圖確定q=1,偏相關函數(shù)圖確定p=3,選用ARMA(3,1)模型對消除季節(jié)因子后的風速序列做出預測。應用SAM-ARAM(3,1)模型預測環(huán)縣地區(qū)2013年的月平均風速并與真實值作圖比較,如圖4所示。 考慮到風速時間序列的變化特征,我們基于剔除季節(jié)性因子的數(shù)據(jù)又建立了廣義自回歸異方差模型(GARCH)來預測風速。首先,利用基于最小二乘法的回歸模型預測風速,再對回歸模型的殘差進行ARCH效應檢驗,檢驗結果中,概率p的值小于置信水平0.05,因此殘差具有ARCH效應,條件方差最優(yōu)滯后階數(shù)由AIC信息準則選擇,并且取SAM-GARCH模型的階數(shù)p=2,q=1。用SAM-GARCH(2,1)模型預測環(huán)縣地區(qū)2013年的月平均風速,并與真實值作圖比較,如圖4所示: 圖4 SAM-ARAM(3,1),SAM-GARCH(2,1)預測值和真實值比較 用MAE和MAPE這兩個指標來評價ARIMA(3,1)和SAM-ARIMA(3,1)的預測精度,相關結果見表2: 表2 ARMA(3,1),SAM-ARIMA(3,1),GARCH(2,1),SAM-GARCH(2,1)預測精度 從表2可以看出:SAM-ARMA(3,1)模型和SAM-GARCH(2,1)模型在環(huán)縣月平均風速預測中有著非常高的預測精度,相對平均誤差分別是15.79%和16.29%,比單獨使用ARMA(3,1)和GARCH(2,1)預測月平均風速精度要高。這表明在時間序列預測中,將數(shù)據(jù)預處理的方法(SAM)與傳統(tǒng)時間序列分析(ARMA和GARCH)相結合的方法在預測風速中取得了良好的效果。SAM-ARMA(3,1)模型和SAM-GARCH(2,1)模型有優(yōu)越的預測能力,能夠有效提高預測的精準度。 風速預測在風電系統(tǒng)中起著重要作用,但是囿于風速的非線性、非平穩(wěn)性和混沌特性,使得準確預測風速是一個具有挑戰(zhàn)性的問題。本文提供了一種基于季節(jié)調(diào)整消除季節(jié)因子的數(shù)據(jù)預處理方法和時間序列預測模型相混合的風速預測模型來預測環(huán)縣地區(qū)2013年月平均風速,仿真結果顯示使用混合方法預測風速精度要比單獨使用時間序列模型精度要高,這意味著這種預測方法有著比較滿意的預測能力,為風速預測提供了一種可行的預測方法。 [1]http://www.cehome.com/news/20160314/210615.shtml. [2]ERDEM E,SHI J.ARMA based approaches for forecasting the touple of wind speed and direction [J].Applied Energy,2011,5(88): 1405-1414. [3]高爽,冬雷,高陽.基于粗糙集理論的中長期風速預測[J].中國電機工程學報,2012,32(1):32-37. [4]王德明,王莉,張廣明.基于遺傳BP神經(jīng)網(wǎng)絡的短期風速預測模型[J].浙江大學學報,2015,46(5):837-841. [5]ZHANG G P,QI M.Neural network forecasting for seasonal and trend time series [J].European Journal of Operational Research,2005(160): 501-514. [6]GUO Z H,WU J,LU H Y.A case study on a hybrid wind speed forecasting method using BP neural network[J].Knowledge Based Systems,2011(24):1048-1056. [7]LI G,SHI J.On comparing three artificial neural networks for wind speed forecasting [J].Appl Energy,2010(87):2313-2320. [8]ZHOU JY,SHI J,LI G.Fine tuning support vector machines for short-term wind speed forecasting [J].Energy Conver Manage,2011(52):1990-1998. [9]BARTHELMIE R J,MURRAY F,PRYOR S C.The economic benefit of short-term forecasting for wind energy in the UK electricity market [J].Energy Policy,2008(36): 1687-1696. [10]YANG X,XIAO Y,CHEN S.Wind speed and generated power forecasting in wind farm [J].Proceedings of the CSEE,2005(25): 1-5. 【責任編輯朱世廣】 Long-TermWindSpeedPredictioninHuanxianCounty,China—AHybridApproachBasedonSeasonalAdjustmentandTimeSeries FU Tong-lin (CollegeofMathematicsandStatistics,LongdongUniversity,Qingyang745000,Gansu) O212.3;TP391.9 A 1674-1730(2017)05-0005-04 2016-09-30 付桐林(1977—),男,甘肅民樂人,副教授,碩士,主要從事應用概率統(tǒng)計、能源經(jīng)濟分析及預測理論與方法的研究。2 研究區(qū)域和數(shù)值結果
3 結論