張穎超,郭曉杰,鄧 華
?
一種基于改進GPR和Bagging的短期風電功率組合預測方法
張穎超1,2,郭曉杰1,鄧 華1,2
(1.南京信息工程大學信息與控制學院,江蘇 南京 210044;2.南京信息工程大學氣象災害預報預警與評估協(xié)同創(chuàng)新中心,江蘇 南京 210044)
為提高短期風電功率的預測精度并對功率預測的不確定性進行量化,提出了基于高斯過程回歸(Gaussian Process Regression,GPR)和Bootstrap Aggregation (Bagging)的組合預測方法。針對GPR的不穩(wěn)定性和計算量大的特點,引入了Bagging和訓練數(shù)據(jù)完全條件獨立下的近似方法(Fully Independent Training Conditional Approximation,F(xiàn)ITC)。同時,在貝葉斯決策 (Bayesian Committee Machine, BCM)的基礎上,提出了一種新的權(quán)重組合策略。實驗表明,基于Bagging和FITC的GPR方法在穩(wěn)定性、預測精度和訓練時間的消耗上都優(yōu)于傳統(tǒng)的GPR方法。在風電功率預測中,改進的GPR可以給出較準確的置信區(qū)間,且與極限學習機、最小二乘支持向量機相比較,該方法的預測精度也有明顯提高。
GPR;Bagging;風電功率預測;不確定性量化;BCM
根據(jù)世界風能協(xié)會統(tǒng)計,截止到2015年2月,中國、美國、德國的風電裝機容量分別達到了114.76 GW、65.88 GW和40.47 GW。風能作為清潔可再生能源,在世界范圍內(nèi)已經(jīng)得到了廣泛的利用。但風的間歇性和波動性,給風能有效、安全的利用帶來了極大的挑戰(zhàn),而準確的風電功率預測,可以為風資源并網(wǎng)發(fā)電、安全調(diào)度、市場競價等提供重要的參考[1]。隨著風力發(fā)電的快速發(fā)展,單一的短期風電功率預測方法的研究已經(jīng)較成熟,如高斯過程回歸[2]、神經(jīng)網(wǎng)絡[3]、支持向量機[4-5]等,由于單個模型無法全面地解釋風力發(fā)電整個過程的變化,風電功率預測方法逐漸轉(zhuǎn)向?qū)M合預測方法的研究[1]。組合預測方法可以分攤單個模型的誤差,提高預測精度。文獻[1,6]提出了兩種中尺度數(shù)值天氣預報(Numerical Weather Prediction,NWP)的組合方式,即同一個NWP模式不同變量的組合和不同的NWP模式間的組合,以達到模式間的互補;文獻[7]將NWP和GPR組合起來預測短期風電功率,預測精度較神經(jīng)網(wǎng)絡有明顯的提高;文獻[8]將模糊信息?;妥钚《酥С窒蛄繖C聯(lián)合建模,對風電功率的波動趨勢和波動范圍進行研究,可有效地預測風電功率的波動范圍。同時,由于風資源的波動性以及風機自身運行的特點,風速對應的功率隨機分布在一個范圍內(nèi),而非單一的值。因此,為輔助調(diào)度決策[1],對功率預測的不確定性進行量化也是研究重點之一。為量化預測功率的不確定性,文獻[9]提出了基于極限學習機和Bootstrap的概率預測;文獻[10]提出了實時風速和預報風速聯(lián)合條件下的離散預報誤差概率模型,可以預測風速以及風電功率變化的概率分布。
上述方法旨在通過組合方法提高預測精度或者通過概率分布對預測的不確定性進行量化,但未同時將功率預測精度的提高和預測不確定性的量化有效地結(jié)合起來。
基于此,本文將改進的GPR應用于短期風電功率預測中。針對GPR計算量大的缺點,引入FITC近似計算方法,即FITC-GPR,以減少GPR處理大量數(shù)據(jù)所消耗的時間。同時,為降低FITC-GPR的不穩(wěn)定性,提高預測精度,引入了Bagging方法,用于對FITC-GPR的組合。本文還提出了一種新的模型組合策略BFITC-GPR (FITC-GPR weighted by improved BCM),并與均值法MFITC-GPR (FITC-GPR weighted by means)進行比較,結(jié)果表明,該方法組合后的模型,在穩(wěn)定性和預測精度方面都有明顯的提高。最后,將BFITC-GPR應用到短期風電功率預測中,實驗證明,針對預測功率的不確定性,BFITC-GPR可以給出較準確的量化,與極限學習基(ELM)和最小二乘支持向量機(LSSVM)相比較,該方法的預測精度也有明顯提高。
1.1高斯過程簡介
高斯過程(Gaussian Process, GP)是一個隨機變量的集合,該集合中任意有限個隨機變量具有聯(lián)合高斯分布的特征,其性質(zhì)可由均值函數(shù)和協(xié)方差函數(shù)確定[11],即
(3)
1.2 使用FITC減少GPR的計算量
(8)
(9)
2.1 Bagging簡介
Bagging[15]是機器學習中的一種模型聚合算法,它先通過Bootstrap方法對訓練樣本進行重新抽樣,然后在新的樣本集合上分別訓練模型,最后通過均值法或權(quán)重法將新模型的預測值組合起來。GP屬于不穩(wěn)定的模型[11],而Bagging方法尤其適合對不穩(wěn)定的模型進行聚合[15]。
Bagging中模型的組合方法主要有均值法和權(quán)重法。均值法是對個FITC-GPR模型的預測分布求平均,即MFITC-GPR,而權(quán)重法是根據(jù)每個模型的預測能力,為每個模型賦予不同的權(quán)重。根據(jù)預測的不確定性,本文在BCM[16]的基礎上,提出了一種新的權(quán)重組合策略,對應的模型為BFITC-GPR。新的組合方法基于式(11)的規(guī)則。
(12)
2.2 BFITC-GPR預測方法
BFITC-GPR方法包括訓練和測試兩個階段。訓練階段,先通過Bootstrap對訓練樣本進行次重抽樣,產(chǎn)生個新的訓練集,再使用FITC-GPR,分別在個訓練樣本上進行訓練,產(chǎn)生個新的模型。測試階段,先將測試數(shù)據(jù)輸入個新的模型中,得到個不同的預測均值和方差,再根據(jù)式(14)、式(15)提出的模型組合策略,分別對均值和方差進行組合,產(chǎn)生最終的預測分布,即均值和方差。BFITC-GPR方法的預測流程如圖1所示。
圖1 BFITC-GPR方法預測流程圖
BFITC-GPR方法結(jié)合了FITC-GPR和Bagging的優(yōu)點。由式(12)知,F(xiàn)ITC-GPR的后驗分布即為預測值的概率分布,其均值為預測值,方差為對預測值的不確定性的量化。同時,針對FITC-GPR的不穩(wěn)定性,引入Bagging方法。Bagging可分攤單個FITC-GPR方法的誤差,減少偏差,從而提高模型的預測精度。本文將BFITC-GPR方法應用到了短期風電功率預測中,并在下文中通過實驗驗證該方法的有效性。
實驗數(shù)據(jù)來源于上海某風電場2014年全年數(shù)據(jù),包括風機的實際發(fā)電功率和風機監(jiān)測系統(tǒng)采集的風速、風向數(shù)據(jù),時間分辨率為15 min,以及2014年全年NWP預報的風速和風向,時間分辨率為15 min。其中,研究風機的切入風速為3 m/s,額定風速為12 m/s,切出風速為25 m/s,額定功率2 MW,掃風面積6 793。本文通過均方根誤差(Root Mean Square,RMSE)、絕對平均誤差(Mean Absolute Error,MAE)來評價算法的性能[17],其中,RMSE用來衡量誤差的分散程度,MAE用來評價預測誤差的平均幅度。
3.1 BFITC-GPR和傳統(tǒng)GPR方法對比
文中Bagging的重抽樣次數(shù)是通過對同一組數(shù)據(jù)取不同抽樣次數(shù)時,比較BFITC-GPR預測的來確定的。圖2為抽樣次數(shù)從1取到100時,BFITC-GPR預測值的RMSE。由圖2可知,當重抽樣次數(shù)大于10次以后,雖然測試樣本的RMSE仍然在波動,但波動的范圍趨于穩(wěn)定。因此本文將Bootstrap重抽樣的次數(shù)設定為10。
圖2確定Bootstrap重抽樣次數(shù)
GP屬于不穩(wěn)定的模型,訓練數(shù)據(jù)的變化,對GPR和FITC-GPR的參數(shù)和預測結(jié)果有較大的影響,因此本文通過Bagging組合方法,分攤FITC-GPR的誤差,減少偏差。圖3為在50個不同的數(shù)據(jù)集上,GPR、FITC-GPR、MFITC-GPR和BFITC-GPR的預測結(jié)果對比圖。由圖3可知, GPR和FITC-GPR方法在不同數(shù)據(jù)集上的預測結(jié)果波動較明顯,而經(jīng)過Bagging組合后的MFITC-GPR和BFITC-GPR方法預測的穩(wěn)定性要明顯優(yōu)于GPR和FITC-GPR方法。同時,提出的權(quán)重組合策略具有一定的概率意義,各個模型的權(quán)重正比于方差的倒數(shù),有效地減少了單個不穩(wěn)定模型對整體預測結(jié)果的影響。
圖3各種GPR的性能比較
圖4為MFITC-GPR和BFITC-GPR方法預測的RMSE的對比圖。由圖4可知,BFITC-GPR方法的預測精度和穩(wěn)定性要明顯優(yōu)于MFITC- GPR方法。針對GP計算量較大的缺點,引入的FITC近似方法可以有效地減小計算量。
圖4 BFITC-GPR和MFITC-GPR預測精度對比
圖5為GPR、FITC-GPR和BFITC-GPR在不同數(shù)量的訓練樣本上訓練所消耗的時間。隨著訓練樣本的不斷增加,GPR方法訓練消耗的時間近似指數(shù)增長,而FITC-GPR、BFITC-GPR方法訓練消耗的時間近似線性增長。因此經(jīng)過FITC改進后的GPR方法有效地減少了GPR的計算量。綜上所述,提出的基于Bagging和FITC的BFITC-GPR方法在穩(wěn)定性、預測精度和訓練時間的消耗上都優(yōu)于傳統(tǒng)的GPR方法。
圖5 GPR和FITC-GPR訓練消耗時間對比
3.2 BFITC-GPR和其他方法的對比
從四個季節(jié)中分別抽取25天的數(shù)據(jù),前24天數(shù)據(jù)用于訓練模型,后一天的數(shù)據(jù)用于模型的測試。先分別使用ELM、LSSVM、BFITC-GPR方法對NWP的風速進行訂正并預測功率,然后通過比較各種方法功率預測結(jié)果的RMSE和MAE來比較算法的性能。表1為春夏秋冬四個季節(jié)的數(shù)據(jù),先使用不同的方法訂正風速,再用修訂后的風速預測功率后得到輸出功率的和。
表1不同方法對功率的預測結(jié)果
Table 1 Different methods of power prediction
春秋季節(jié)風速較穩(wěn)定,而夏冬季節(jié)風速波動較明顯,由表1可知,春秋季節(jié)預測的RMSE要優(yōu)于夏冬季節(jié)。雖然夏季和冬季風速波動都較大,但夏季的平均風速要小于冬季的平均風速,因而出現(xiàn)了夏季的小于冬季,而卻大于冬季的現(xiàn)象。四個季節(jié)中,各個算法的和都波動較大,但在每個季節(jié)上BFITC-GPR的預測精度都高于ELM和LSSVM方法的預測精度。
圖6為四個季節(jié)中提前一天的功率預測值、實際值及置信區(qū)間。BFITC-GPR方法功率預測分布中,均值表示對實際功率逼近,方差表示對預測值的不確定性的量化。圖6中實際功率和預測功率大部分都位于95%的置信區(qū)間內(nèi),說明BFITC- GPR對預測的不確定性給出了準確的量化。
準確的置信區(qū)間可以在一定程度上反映發(fā)電功率的走勢和波動范圍,對風電的調(diào)度等有較大的參考價值。因此本文提出的BFITC-GPR方法,不僅在功率預測的精度上較ELM、LSSVM方法有所提高,且對預測的不確定性能夠進行準確的量化,具有一定的實用價值。
在短期風電功率預測中,單一的預測模型往往無法全面地解釋風力發(fā)電整個過程的變化。同時,風速對應的功率常分布在一定范圍內(nèi),而非一個固定值。針對以上問題,提出的BFITC-GPR方法將模型組合和不確定性量化結(jié)合起來,對功率的概率分布進行預測。
實驗表明,基于Bagging和FITC的GPR方法在穩(wěn)定性、預測精度和訓練時間的消耗上都優(yōu)于傳統(tǒng)的GPR方法。在風電功率預測中,BFITC-GPR方法的預測精度較ELM、LSSVM方法有明顯的提高,并可以給出較準確的置信區(qū)間。但從春、夏、秋、冬四個季節(jié)的預測結(jié)果可知,春秋季節(jié)風速較穩(wěn)定,夏冬季節(jié)風速波動較明顯,在模型擬合方面還需要考慮不同季節(jié)風的特征。綜上所述,BFITC-GPR方法既考慮了對風電功率預測過程中的不確定性的量化,又考慮了預測精度,在風電功率預測中具有一定的實用價值。
[1] 薛禹勝, 郁琛, 趙俊華, 等. 關于短期及超短期風電功率預測的評述[J]. 電力系統(tǒng)自動化, 2015, 39(6): 141-150.
XUE Yusheng, YU Chen, ZHAO Junhua, et al. A review on short-term and ultra-short-term wind power prediction[J]. Automation of Electric Power Systems, 2015, 39(6): 141-150.
[2] 甘迪, 柯德平, 孫元章, 等. 基于集合經(jīng)驗模式分解和遺傳-高斯過程回歸的短期風速概率預測[J]. 電工技術學報, 2015, 30(11): 138-147.
GAN Di, KE Deping, SUN Yuanzhang, et al. Short -term wind speed probabilistic forecasting based on EEMD and coupling GA-GPR[J]. Transactions of China Electrotechnical Society, 2015, 30(11): 138-147.
[3] 肖遷, 李文華, 李志剛, 等. 基于改進的小波-BP神經(jīng)網(wǎng)絡的風速和風電功率預測[J]. 電力系統(tǒng)保護與控制, 2014, 42(15): 80-86.
XIAO Qian, LI Wenhua, LI Zhigang, et al. Wind speed power prediction based on improved wavelet-BP neural network[J]. Power System Protection and Control, 2014, 42(15): 80-86.
[4] 王新, 孟玲玲. 基于EEMD-LSSVM的超短期負荷預測[J]. 電力系統(tǒng)保護與控制, 2015, 43(1): 61-66.
WANG Xin, MENG Lingling. Ultra-short-term load forecasting based on EEMD-LSSVM[J]. Power System Protection and Control, 2015, 43(1): 61-66.
[5] 劉愛國, 薛云濤, 胡江鷺, 等. 基于GA優(yōu)化SVM的風電功率的超短期預測[J]. 電力系統(tǒng)保護與控制, 2015, 43(2): 90-95.
LIU Aiguo, XUE Yuntao, HU Jianglu, et al. Ultra- short-term wind power forecasting based on SVM optimized by GA[J]. Power System Protection and Control, 2015, 43(2): 90-95.
[6] 王麗婕, 冬雷, 高爽. 基于多位置NWP與主成分分析的風電功率短期預測[J]. 電工技術學報, 2015, 30(5): 79-84.
WANG Lijie, DONG Lei, GAO Shuang. Wind power short-term prediction based on principal component analysis of NWP of Multiple locations[J]. Transactions of China Electrotechnical Society, 2015, 30(5): 79-84.
[7] CHEN N, QIAN Z, NABNEY I T, et al. Wind power forecasts using Gaussian processes and numerical weather prediction[J]. IEEE Transactions on Power Systems, 2014, 29(2): 656-665.
[8] 王愷, 關少卿, 汪令祥, 等. 基于模糊信息?;妥钚《酥С窒蛄繖C的風電功率聯(lián)合預測建模[J]. 電力系統(tǒng)保護與控制, 2015, 43(2): 26-32. WANG Kai, GUAN Shaoqing, WANG Lingxiang, et al. A combined forecasting model for wind power prediction based on fuzzy information granulation and least squares support vector machine[J]. Power System Protection and Control, 2015, 43(2): 26-32.
[9] WAN C, XU Z, PINSON P, et al. Probabilistic forecasting of wind power generation using extreme learning machine[J]. IEEE Transactions on Power Systems, 2014, 29(3): 1033-1044.
[10] 王松巖, 于繼來. 風速與風電功率的聯(lián)合條件概率預測方法[J]. 中國電機工程學報, 2011, 31(7): 7-15.
WANG Songyan, YU Jilai. Joint conditions probability forecast method for wind speed and wind power[J]. Proceedings of the CSEE, 2011, 31(7): 7-15.
[11]SCH?LKOPF B, HERBRICH R, SMOLA A, et al. Gaussian processes for machine learning[J]. International Journal of Neural Systems, 2006, 14(6): 3011-3015.
[12] CHEN T, MORRIS J, MARTIN E. Gaussian process regression for multivariate spectroscopic calibration[J]. Chemometrics and Intelligent Laboratory Systems, 2007, 87(1): 59-71.
[13] GROOT P, LUCAS P. Gaussian process regression with censored data using expectation propagation[C] // Sixth European Workshop on Probabilistic Graphical Models, 2012.
[14] QUI?ONERO-CANDELA J, RASMUSSEN, C E. A unifying view of sparse approximate Gaussian process regression[J]. Journal of Machine Learning Research, 2005, 6: 1939-1959.
[15] CHEN T, REN J. Bagging for Gaussian process regression[J]. Neurocomputing, 2009, 72(7): 1605-1610.
[16] TRESP V. A Bayesian committee machine[J]. Neural Computation, 2000, 12(11): 2719-2741.
[17]徐曼, 喬穎, 魯宗相. 短期風電功率預測誤差綜合評價方法[J]. 電力系統(tǒng)自動化, 2011, 35(12): 20-26.
XU Man, QIAO Ying, LU Zongxiang. A comprehensive error evaluation method for short-term wind power prediction[J]. Automation of Electric Power Systems, 2011, 35(12): 20-26.
(編輯 葛艷娜)
A combination method of short-term wind power forecasting based on improved GPR and Bagging
ZHANG Yingchao1, 2, GUO Xiaojie1, DENG Hua1, 2
(1. School of Information and Control, Nanjing University of Information Science & Technology, Nanjing 210044, China; 2. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters,Nanjing University of Information Science & Technology, Nanjing 210044, China)
In order to improve the accuracy of short-term wind power forecasting and quantify the uncertainty of power prediction, a combination forecasting method based on Gaussian Process Regression (GPR) and Bootstrap Aggregation (Bagging) is proposed. For the instability and large computing of GPR, Bagging and Fully Independent Training Conditional Approximation (FITC) are introduced. Meanwhile, a new weight strategy based on Bayesian Committee Machine (BCM) is raised. Experiments show that, GPR method which based on Bagging and FITC is better than the traditional method in the stability, precision and training time consuming. Furthermore the improved GPR can get a more accurate confidence interval, and the prediction accuracy of the proposed method also has improved significantly compared with ELM and LSSVM in the wind power prediction.
GPR; Bagging; short-term wind power forecast; uncertainty quantification; BCM
10.7667/PSPC152072
2015-11-27;
2016-01-20
張穎超(1960-),男,教授,博士生導師,研究方向為復雜系統(tǒng)建模與評估、氣象服務效益研究、風電功率預測、氣象數(shù)據(jù)質(zhì)量控制等;E-mail: yc.nim@163.com
郭曉杰(1988-),男,通信作者,碩士研究生,研究方向為短期風電功率預測;E-mail: gxj_workmail@163.com
鄧 華(1977-),男,工程師,博士研究生,研究方向為風電功率預測。E-mail: denghua@nuist.edu.cn
江蘇省六大人才高峰項目(WLW-021);國家公益性行業(yè)(氣象)科研專項項目(GYHY201106040)