廖玲瓏,李培強,唐 捷,李欣然,李 慧,李文英(湖南大學電氣與信息工程學院,長沙 4008;.廣東電網(wǎng)公司韶關供電局,韶關 5000)
信息粒化和相似數(shù)據(jù)結(jié)合的短期風速預測
廖玲瓏1,李培強1,唐捷2,李欣然1,李慧1,李文英1
(湖南大學電氣與信息工程學院,長沙 410082;2.廣東電網(wǎng)公司韶關供電局,韶關 512000)
準確地短期風速預測對電網(wǎng)安全穩(wěn)定具有重要意義。該文將信息?;拖嗨茢?shù)據(jù)搜索應用于風速預測中,實現(xiàn)對風速變化區(qū)間的預測。對原始風速數(shù)據(jù)用模糊信息粒化處理,在此基礎上運用新的相似數(shù)據(jù)搜索法和支持向量機結(jié)合的模型進行預測,得到變化區(qū)間。實例仿真表明,?;蟮臄?shù)據(jù)反映了風速變化特征,減少了數(shù)據(jù)的冗余,新的相似數(shù)據(jù)搜索法提高預測模型訓練樣本和預測樣本的相關性,提高了預測精度。通過風電場實際風速數(shù)據(jù)驗證,該模型能有效預測風速的變化范圍。
風速變化區(qū)間;信息?;幌嗨茢?shù)據(jù)搜索;支持向量機
DOI:10.3969/j.issn.1003-8930.2016.04.003
風能作為清潔能源和可再生能源已得到世界各國的高度重視與大力發(fā)展。由于風能的間歇性和波動性,大規(guī)模的風電接入電網(wǎng)會對電力系統(tǒng)的安全穩(wěn)定運行以及保證電能質(zhì)量帶來嚴峻挑戰(zhàn)[1],風電功率預測是解決這一問題的有效手段之一[2]。通過準確的風電功率預測,可以大幅度降低電網(wǎng)旋轉(zhuǎn)備用容量,從而有效降低風力發(fā)電系統(tǒng)的運行成本,為電網(wǎng)調(diào)度提供可靠依據(jù)[3]。風電場輸出功率與風電場風速有很大的關系,對風電場風速預測,再由風電場功率曲線得到風力發(fā)電功率,這是進行風力發(fā)電功率預測的有效途徑之一[4]。
風速預測方法可分為物理法和統(tǒng)計法?;谖锢砟P偷念A測方法采用數(shù)值天氣預報數(shù)據(jù)進行預測[5],基于歷史數(shù)據(jù)的統(tǒng)計方法是利用數(shù)據(jù)之間相關性進行預測,本文采用統(tǒng)計方法預測,統(tǒng)計方法有如持續(xù)法[6]、空間相關性法[7]、隨機時間序列法[8]、人工神經(jīng)網(wǎng)絡法[9]、卡爾曼濾波法[10]、支持向量機SVM(support vector machine)法[11]等。在風電功率預測研究中,大多數(shù)的方法是采用單一的模型和組合的模型,其目的是減少預測誤差[12]。文獻[13]指出這樣的模型預測誤差高度隨機,因而,風速預測中誤差總是存在,無法對風速進行精確預測。本文著重對風速的變化趨勢和變化空間進行預測,首先將歷史風速數(shù)據(jù)模糊?;?,生成原始數(shù)據(jù)變化的最小值、變化的平均水平和變化的最大值3個序列,再采用相似數(shù)據(jù)和SVM結(jié)合的方法對3個序列分別預測,最后得出風速的變化趨勢和變化空間。通過實例仿真,驗證了該預測模型的可行性。
信息?;拍钭钤缡怯蒐otfi A.Zadeh教授提出。信息?;菍⒁粋€整體分解為一個個部分進行研究,每個部分為一個信息粒。信息粒是一些元素的集合,這些元素由于難以區(qū)別、或相似、或接近、或某種功能而結(jié)合在一起。
1.1模糊信息?;?/p>
1979年Lotfi A.Zadeh教授在模糊集合論上首次提出模糊信息化理論[14],給出了一種數(shù)據(jù)粒的命題刻畫:
式中:x為論域U中取值變量;G為U的模糊子集,由隸屬函數(shù)μG來刻畫;λ為可能性概率,λ為單位區(qū)間的模糊子集;一般假設U為實數(shù)集合R(Rn);G 為U的凸模糊子集。
1.2模糊信息?;椒?/p>
模糊信息粒是以模糊集形式表示的信息粒。用模糊集方法對時間序列進行模糊?;譃閮蓚€步驟:劃分窗口和模糊化。
劃分窗口是將時間序列X={x1,x2,…,xn}分成若干小子序列X={ω1,ω2,…,ωm}其中:ωi={xi,xi+1,…,xi+k}稱為窗口。
模糊化是將產(chǎn)生的每一個窗口進行模糊化,生成一個個模糊信息粒。即在窗口片段ωi上確定一個能夠完全描述該窗口時序特征的模糊粒子Pi為
由上可知,模糊化過程本質(zhì)上就是確定一個函數(shù)A的過程,A是模糊概念G的隸屬函數(shù),即A=μG。常用的模糊粒子有:三角形、梯形、高斯型等。本文采用三角型進行模糊化,三角型模糊隸屬函數(shù)為
式中,a、m和b為參數(shù)。
在本文中,風速時間序列模糊粒化,針對每個風速窗口序列都得到3個模糊?;蟮淖兞浚簂ow、r 和up,它們分別對應三角型模糊?;街械腶、m和b3個參數(shù),其中對單個模糊粒子而言,low參數(shù)描述了原始序列變化的最小值,r參數(shù)描述了相應序列變化的大體平均水平,up參數(shù)描述了相應序列變化的最大值。
2.1支持向量機
支持向量機是一類基于統(tǒng)計學理論的新型機器學習算法,它通過非線性核函數(shù),將輸入樣本空間映射到高維線性特征空間,在這個高維空間中求得一個最優(yōu)分類面,得到輸入與輸出變量間的非線性關系,具有處理非線性回歸問題的能力。其最大的特點是改變了傳統(tǒng)的經(jīng)驗風險最小化原則,具有很好的泛化能力[15]。
SVM通過選取歷史數(shù)據(jù)作為訓練樣本進行訓練,它記錄的是訓練樣本輸入與輸出之間的非線性關系,可見選擇與預測樣本相似的數(shù)據(jù)作為訓練樣本,會使模型泛化能力和預測精度有較大提高[16]。在歷史數(shù)據(jù)中,尋找與預測樣本相似的數(shù)據(jù),用得到的相似數(shù)據(jù)創(chuàng)建訓練樣本集,訓練模型進行預測。SVM非線性回歸函數(shù)為
式中:xi∈Rn;s為訓練樣本數(shù);αi和為拉格朗日乘子,其中只有少數(shù)不為零,這些參數(shù)對應的向量為支持向量;b為常數(shù);K(xi,x)為核函數(shù),本文選用RBF核函數(shù),表達式為
式中,σ為核函數(shù)的參數(shù)。本文實驗仿真,SVM模型的建立是基于LIBSVM軟件包。
2.2相似數(shù)據(jù)檢索
首先確定預測樣本作為基準序列,從歷史數(shù)據(jù)中找出與基準序列具有相似變化趨勢和時間間隔且長度相同的時間序列,即在歷史時間序列中檢索出與預測樣本相似的時間序列,本文采用一種有效的數(shù)值型數(shù)據(jù)相似性搜索方法,它引用了一種新的距離測度函數(shù),設X={x1,x2,…,xd}為基準序列,Y={y1,y2,…,yd}歷史數(shù)據(jù)片段序列,可以將X和Y看作d維空間的兩個點,函數(shù)表達式為
式中:函數(shù)的值域為[0,1],H(X,Y)越接近1,則X 和Y越相近,給定閾值0<ε<1,若H(X,Y)≥ε,則稱X和Y相似。
新的相似度量函數(shù)不同之處在于該函數(shù)中占主導地位的是那些X和Y在其上非??拷木S。只要在某些數(shù)上X和Y的數(shù)值比較接近,就會表現(xiàn)出一定的相似性。它們的數(shù)值接近的維數(shù)越多,它們之間的相似程度也越高。由于風速的隨機性,在某些時刻變化大,采用傳統(tǒng)距離測度函數(shù),其大小受變化大的值影響,這會增加判斷相似性的誤差,本文新的測度函數(shù)可以緩解這一問題,更能準確判斷兩時間序列的相似性。
根據(jù)上面的方法,假設歷史風速序列為X1,X2,…,XN-1,預測樣本序列即基準風速序列為XN,依次選取Xi(i=1,2,…,N-1),計算H(Xi,XN),設定一個閾值ε,若Xi滿足H(X,Y)≥ε,則認為該歷史序列與基準序列相似,將其歸為一類,如此循環(huán),直到操作完成,得到與基準序列相似的歷史序列集,用它們創(chuàng)建預測模型的訓練樣本。
閾值的確定是基于歷史數(shù)據(jù),閾值的取值范圍為[0,1],設定初值以及改變的步長,確定一個閾值,基于此閾值對一定數(shù)量的歷史數(shù)據(jù)進行預測,計算出預測的誤差,誤差最小的相應閾值為最佳值,最佳閾值一旦確定,在對未來時刻的預測就不會再改變。
2.3相似數(shù)據(jù)和SVM結(jié)合的預測過程
本文用歷史數(shù)據(jù)建立SVM模型,設歷史序列為{x(t),t=1,2,…,n},構(gòu)造樣本對 (Xt,Yt),Xt={xt-m,xt-m+1,…,xt-1},即為模型輸入,其中m為輸入向量的維數(shù),Yt=xt即為模型的輸出,具體預測過程如下。
(1)對xt進行預測,確定輸入為Xt,即為預測樣本的輸入,作為基準序列,由式(6)設定好閾值,從歷史序列xt中搜索出相似的片段序列,即為訓練樣本的輸入,得到一個相似的序列集,假設其含有s個片段序列,每一個片段末端的下一時刻的值作為訓練樣本的輸出,從而可以構(gòu)造出訓練樣本的輸入輸出對。
(2)利用得到的訓練樣本訓練SVM模型,再輸入Xt,最后得到xt的預測值,表達式為
(3)將最新實際的xt加入歷史數(shù)據(jù)末端,確定輸入為 Xt+1,Xt+1={xt-m+1,xt-m+2,…,xt}對 xt+1預測,利用上面的方法,最終得到xt+1的值。
(4)每預測完一步,用最新的實際數(shù)據(jù)更新歷史數(shù)據(jù),再對下一時刻的值進行預測。在本文中,實際數(shù)據(jù)為風速數(shù)據(jù)模糊?;蟮臄?shù)據(jù)。
風速的隨機性給風能預測帶來很大難度,在風能預測研究中,大多數(shù)方法都是以減少預測誤差為目的。事實上,預測誤差總是存在,無法對風速進行精確的預測,這時候?qū)︼L速變化趨勢和變化空間進行預測就顯得尤為重要。本文選擇對風速的變換趨勢和變化空間進行預測,基本思路如下:將歷史風速數(shù)據(jù)進行模糊粒化,生成原始數(shù)據(jù)變化的最小值low、變化的平均水平r以及變化的最大值up,再分別對low、r和up運用相似數(shù)據(jù)檢索與SVM結(jié)合的預測方法進行預測,最后得到未來風速變化的趨勢和變化空間。預測流程如圖1所示。
圖1 預測流程Fig.1 Flow chart of prediction
以某風電場連續(xù)采集的2 636個風速數(shù)據(jù)作為原始數(shù)據(jù),采集間隔為30 min,用前面2 500個數(shù)據(jù)建立預測模型,后136個點用來驗證模型的可行性,原始風速數(shù)據(jù)分布如圖2所示。
圖2 風速分布Fig.2 Distribution of wind speed
4.1風速原始數(shù)據(jù)模糊信息?;?/p>
本文模糊粒化過程,選擇兩個數(shù)據(jù)點作為一個窗口,實現(xiàn)未來1 h的風速變化空間預測。圖3所示為原始數(shù)據(jù)?;蟮臄?shù)據(jù)分布,數(shù)據(jù)長度為原始數(shù)據(jù)的一半,從形狀上看保持原始數(shù)據(jù)的變化特征。
4.2low,r和up分別預測
利用相似數(shù)據(jù)搜索和SVM結(jié)合的方法對low,r 和up分別預測,SVM模型的輸入由相關性分析確定,low,r和up三者時間序列的自相關系數(shù)如圖4所示,在相似搜索法中,通過設定不同的閾值,查看預測效果如圖5所示,本文采用均方根誤差驗證預測效果。
圖3 ?;Y(jié)果Fig.3 Granulation results
圖4 low,r和up自相關系數(shù)Fig.4 Autocorrelation coefficient of low,r,up
圖5 不同閾值下的均方根誤差Fig.5 RMSE under different thresholds
由圖4可知,low,r和up三者自相關系數(shù)隨延時間隔的變化特征大致相同,相鄰的4個點的相關系數(shù)達到0.9以上,因此,認為對t時刻的值可由t-1、t-2、t-3時刻的值決定,即對應SVM輸入輸出樣本為
式中:M為SVM的一個輸入向量;N為相應的輸出;vt表示t時刻的值。
由圖5可知,在相似數(shù)據(jù)搜索中,設定不同的閾值,均方根誤差不同,由式(6)可知,閾值的范圍為[0,1],閾值越近1,表示搜索出來的數(shù)據(jù)與原始數(shù)據(jù)相似度越高。分析圖5可知,初始隨著閾值的增加,均方根誤差減少,到了某一個點,均方根誤差不降反升,說明閾值增大到一定程度,從歷史數(shù)據(jù)中搜索出的相似樣本大量減少,使得SVM的訓練樣本大量減少,引起均方根誤差增大,可見在相似數(shù)據(jù)搜索中,設定合適的閾值,可以減少預測模型訓練樣本,同時減少預測誤差。
本文中閾值確定為試驗法,設定閾值的初始值為0,改變的步長為0.1,每確定一個閾值,計算對68個點進行驗證預測的均方根誤差,誤差最小的對應的即為最優(yōu)閾值。結(jié)果由圖5可知,對于low預測,其閾值在0.7時均方根誤差最小為0.43;對于r預測,其閾值在0.6時均方根誤差最小為0.48;對于up預測,其閾值在0.6時均方根誤差最小為0.47。
4.3預測結(jié)果及分析
本文實驗是對歷史時間序列后136個風速變化區(qū)間進行預測,采用兩個數(shù)據(jù)點作為一個窗口生成一個信息粒,因而,相應于對low、r和up 3個時間序列的后68個數(shù)值進行預測。三者預測均方根誤差最小時效果如圖6所示。
圖6 ?;蛄蓄A測效果Fig.6 Forecasting results of graining sequence
由圖6可知,預測模型對low、r和up進行單步預測,預測值和實際值吻合較好。一個?;得枋龅氖莾蓚€數(shù)據(jù)點的數(shù)據(jù)特征,將low和up時間序列單個值對應兩個數(shù)據(jù)刻度,和實際值風速值放在同一個坐標軸內(nèi),驗證low和up曲線能否包含實際風速數(shù)值點,效果如圖7所示。
圖7 2個數(shù)據(jù)點變化空間預測效果Fig.7 Forecasting results of two data points
圖7所示,在136點中,風速變化趨勢單一時,實際風速值大多在low和up曲線之間,在風速波動頻繁時,low和up曲線也能較好地反映風速的變化趨勢,也有少數(shù)點在low和up曲線之外,有很大的偏差,這是由于風速的隨機性造成的。同時在極少數(shù)點上,low曲線在up曲線之上,這是前面對low和up分別預測的誤差造成的。為了更好地驗證可行性,在模糊?;校謩e采用3個數(shù)據(jù)點和5個數(shù)據(jù)點作為一個窗口,其他方法不變,預測效果如圖8和圖9所示。
圖8 3個數(shù)據(jù)點變化空間預測效果Fig.8 Forecasting results of three data points
圖9 5個數(shù)據(jù)點變化空間預測效果Fig.9 Forecasting results of five data points
由圖8看出采用3個數(shù)據(jù)點作為一個窗口,相比2個數(shù)據(jù)點,low和up曲線能更好地包含實際風速數(shù)值點,但是預測的區(qū)間范圍變大。由圖9看出,采用5個數(shù)據(jù)點的預測效果明顯變差,這是由于采用5個數(shù)據(jù)點是對未來更長時間的風速變化預測,同時?;蟮臄?shù)據(jù)序列更短,用于預測模型訓練的樣本相應減少,誤差增大。由圖7~9可知,在預測變化趨勢和變化區(qū)間綜合上,采用2個數(shù)據(jù)點表現(xiàn)最好。綜上所述,本文提出的預測模型中,模糊粒化過程中選擇合適數(shù)量的數(shù)據(jù)點作為一個窗口,相似搜索選擇合適的閾值,能夠?qū)Χ唐陲L速的變化范圍進行較好的預測,具有較大的實用價值。
(1)該文提出的相似數(shù)據(jù)檢索與SVM結(jié)合的預測模型,能夠減少SVM的訓練樣本數(shù),提高預測樣本和訓練樣本的相關性,并減少預測誤差。
(2)對原始風速序列進行模糊粒化,生成風速變化的最大值、最小值和平均水平,然后分別預測,實現(xiàn)了對未來風速變化趨勢的預測,并較好的量化風速變化區(qū)間。
(3)算例表明,本文提出的組合預測模型可以較好地跟蹤風速的變化規(guī)律,為風電決策者提供較好的依據(jù)。
[1]楊秀媛,肖洋,陳樹勇(Yang Xiuyuan,Xiao Yang,Chen Shuyong).風電場風速和發(fā)電功率預測研究(Wind speed and generated power forecasting in wind farm)[J].中國電機工程學報(Proceedings of the CSEE),2005,25 (11):1-5.
[2]孫斌,姚海濤,李田,等(Sun Bin,Yao Haitao,Li Tian,et al).基于Fast ICA和改進LSSVM的短期風速預測(Short-term wind speed forecasting based on fast ICA al?gorithm and improved LSSVM model)[J].電力系統(tǒng)及其自動化學報(Proceedings of the CSU-EPSA),2014,26 (1):22-27.
[3] 張麗英,葉廷路,辛耀中,等(Zhang Liying,Ye Tinglu,Xin Yaozhong,et al).大規(guī)模風電接入電網(wǎng)的相關問題及措施(Problems and measures of power grid accommo?dating large scale wind power)[J].中國電機工程學報(Proceedings of the CSEE),2010,30(25):1-9.
[4]栗然,陳倩,徐宏銳(Li Ran,Chen Qian,Xu Hongrui).考慮相關因素的最小二乘支持向量機風速預測方法(Wind speed forecasting method based on LS-SVM con?sidering the related factors)[J].電力系統(tǒng)保護與控制(Power System Protection and Control),2010,38(21):146-151.
[5]韓爽,楊勇平,劉永前(Han Shuang,Yang Yongping,Liu Yongqian).三種方法在風速預測中的應用研究(Appli?cation study of three methods in wind speed prediction)[J].華北電力大學學報(Journal of North China Electric Power University),2008,35(3):57-61.
[6]吳國旸,肖洋,翁莎莎(Wu Guoyang,Xiao Yang,Weng Shasha).風電場短期風速預測探討(Discussion about short-term forecast of wind speed on wind farm)[J].吉林電力(Jilin Electric Power),2005(6):21-24.
[7] Damousis I G,Alexiadis M C,Theocharis J B,et al.A fuzzy model for wind speed prediction and power genera?tion in wind parks using spatial correlation[J].IEEE Trans on Energy Conversion,2004,19(2):352-361.
[8]Kamal L,Jafri Y Z.Time series models to simulate and forecast hourly averaged wind speed in Quetta,Pakistan [J].Solar Energy,1997,61(1):23-32.
[9]范高鋒,王偉勝,劉純(Fan Gaofeng,Wang Weisheng,Liu Chun).基于人工神經(jīng)網(wǎng)絡的風電功率短期預測系統(tǒng)(Artificial neural network based wind power short term prediction system)[J].電網(wǎng)技術(Power System Technolo?gy),2008,32(22):72-76.
[10]Bossanyi E A.Short-term wind prediction using Kalman filters[J].Wind Engineering,1985,9(1):1-8.
[11]王愷,關少卿,汪令祥,等(Wan Kai,Guan Shaoqing,Wang Lingxiang,et al).基于模糊信息?;妥钚《酥С窒蛄繖C的風電功率聯(lián)合預測建模(A combined forecasting model for wind power predication based on fuzzy information granulation and least squares support vector machine)[J].電力系統(tǒng)保護與控制(Power System Protection and Control),2015,43(2):26-32.
[12]Bremnes J B.A comparison of a few statistical models for making quantile wind power forecasts[J].Wind Energy,2006,9(1/2):3-11.
[13]Pinson P,Kariniotakis G.Conditional prediction intervals of wind power generation[J].IEEE Trans on Power Sys?tems,2010,25(4):1845-1856.
[14]Zadeh L A.Toward a theory of fuzzy information granula?tion and its centrality in human reasoning and fuzzy logic [J].Fuzzy Sets and Systems,1997,90(2):111-127.
[15]王書舟,傘冶(Wang Shuzhou,San Ye).支持向量機的訓練算法綜述(A survey on training algorithms for support vector machine)[J].智能系統(tǒng)學報(CAAI Transactions on Intelligent Systems),2009,3(6):467-475.
[16]楊錫運,孫寶君,張新房,等(Yang Xiyun,Sun Baojun,Zhang Xinfang,et al).基于相似數(shù)據(jù)的支持向量機短期風速預測仿真研究(Short-term wind speed forecasting based on support vector machine with similar data)[J].中國電機工程學報(Proceedings of the CSEE),2012,32 (4):35-41.
Short-term Wind Speed Forecasting Based on Information Granulation and Similar Data
LIAO Linglong1,LI Peiqiang1,TANG Jie2,LI Xinran1,LI Hui1,LI Wenying1
(1.College of Electrical and Information Engineering,Hunan University,Changsha 410082,China;2.Shaoguan Power Supply Bureau of Guangdong Power Grid Corporation,Shaoguan 512000,China)
Accurate short-term wind forecasts for the grid security and stability is of great significance.In this paper,in?formation granulation and similar data search are applied to predict the range of wind speed.Wind data is processed with the theory of fuzzy information granulation.On this basis support vector machine(SVM)with similar data search is used to forecast.Finally,the range is obtained.The simulation results show that granulated data can not only reflect the characteristics of wind but also reduce redundant information.The new similar data search method improves the correla?tion of the forecasting samples and the training samples,and the prediction accuracy is improved.By validation with the actual wind speed data of a wind farm,this model can effectively predict the range of wind speed.
range of wind speed;theory of fuzzy information granulation;similarity data search;support vector machine
TK81
A
1003-8930(2016)04-0012-06
2014-05-31;
2015-06-29
國家自然科學基金資助項目(51277055)
廖玲瓏(1989—),男,碩士研究生,研究方向為風電功率預測。Email:llliao198978@hotmail.com
李培強(1975—),男,博士,副教授,研究方向為電力系統(tǒng)穩(wěn)定性分析與控制。Email:lpqcs@hotmail.com
唐捷(1979—),男,博士,高級工程師,研究方向為電力系統(tǒng)運行控制、電力需求側(cè)管理等方面的研究。Email:tangjiedavid@163.com