王為國(guó),竇震海,劉小煜,劉偉,申晉
(1.山東理工大學(xué) 電氣與電子工程學(xué)院,山東 淄博 255000;2.青島理工大學(xué) 琴島學(xué)院,山東 青島 266106)
風(fēng)電在給我國(guó)的環(huán)保事業(yè)、能源結(jié)構(gòu)調(diào)整等方面帶來(lái)利益的同時(shí),也伴隨著一些問(wèn)題的出現(xiàn)[1-2]。風(fēng)電作為一種間歇性能源,風(fēng)速、風(fēng)量的不可控性會(huì)使風(fēng)電輸出缺乏穩(wěn)定性。不穩(wěn)定的風(fēng)力發(fā)電上網(wǎng),使電力系統(tǒng)運(yùn)行中的不確定性因素增多,這對(duì)電力系統(tǒng)的供需平衡與安全穩(wěn)定運(yùn)行提出了新的挑戰(zhàn)[3]。
風(fēng)電場(chǎng)功率預(yù)測(cè)的準(zhǔn)確性主要取決于短期風(fēng)速的預(yù)測(cè)精度,由于風(fēng)速本身既存在著規(guī)律性的變化趨勢(shì),又具有因不確定性因素造成的隨機(jī)波動(dòng),使得對(duì)其進(jìn)行精確預(yù)測(cè)具有較大的難度[4-5]。在目前研究中,短期風(fēng)速預(yù)測(cè)模型主要有時(shí)間序列法和智能算法,而每種方法對(duì)風(fēng)速預(yù)測(cè)的絕對(duì)平均誤差一般在25%~40%之間,還未達(dá)到電力系統(tǒng)所要求的滿意程度[6]。時(shí)間序列模型是對(duì)風(fēng)速等隨機(jī)變量進(jìn)行擬合建模的一種常用方法,持續(xù)法是其中最簡(jiǎn)單的方法,更高級(jí)的時(shí)間序列模型主要有自回歸滑動(dòng)平均(ARMA)、卡爾曼濾波等模型[7]。智能算法是預(yù)測(cè)精度較高的風(fēng)速預(yù)測(cè)方法,主要包括神經(jīng)網(wǎng)絡(luò)、灰色模型、支持向量機(jī)等方法[8]。時(shí)間序列分析建模幾乎完全基于原始數(shù)據(jù)進(jìn)行預(yù)測(cè),算法過(guò)于簡(jiǎn)單;智能算法與黑匣子原理相似,雖然精度較高,但推導(dǎo)具體的預(yù)測(cè)解析式比較困難,并且在實(shí)際建模過(guò)程中需要大量的樣本數(shù)據(jù)。從目前研究成果看,因?yàn)轱L(fēng)速兼有隨機(jī)波動(dòng)性和趨勢(shì)性,加大了短期風(fēng)速預(yù)測(cè)的難度,如何提高風(fēng)速模型的預(yù)測(cè)精度仍然是一個(gè)亟待解決的問(wèn)題。
文獻(xiàn)[9]嘗試將在氣象學(xué)中應(yīng)用較為廣泛的均值生成函數(shù)模型運(yùn)用到風(fēng)電場(chǎng)的短期風(fēng)速預(yù)測(cè)中,該方法有效地提高了風(fēng)速預(yù)測(cè)模型的精度,對(duì)序列極值的跟隨性也較好,但在構(gòu)造均值生成函數(shù)過(guò)程中,因?yàn)橹芷谒惴ǖ木壒食?dǎo)致樣本序列尾部數(shù)據(jù)的作用失效。并且從預(yù)測(cè)經(jīng)驗(yàn)及物理意義上考慮,越靠近起報(bào)時(shí)刻的數(shù)據(jù)值包含對(duì)預(yù)測(cè)有用的信息越多,對(duì)預(yù)測(cè)越有價(jià)值,以均值生成函數(shù)為基函數(shù)建立的風(fēng)速預(yù)測(cè)模型并沒(méi)有考慮到這些因素,預(yù)測(cè)精度仍有待提高。針對(duì)上述研究現(xiàn)狀,文中在深入剖析均值生成函數(shù)預(yù)測(cè)模型特性的基礎(chǔ)上,對(duì)均值生成函數(shù)模型進(jìn)行了改進(jìn)和完善,建立了一種基于模糊均生函數(shù)(Fuzzy Mean Generating Function, FMGF)[10]和最優(yōu)子集回歸(Optimal Subset Regression, OSR)[11]相結(jié)合的短期風(fēng)速預(yù)測(cè)模型。通過(guò)定量對(duì)比表明,文中所構(gòu)建模型能夠獲得較好的預(yù)測(cè)效果,有效地提高短期風(fēng)速預(yù)測(cè)精度。
均值生成函數(shù)的基本思路是將原始時(shí)間序列樣本轉(zhuǎn)化為一系列可反映不同周期性質(zhì)的基函數(shù),然后根據(jù)不同情形選用不同的建模方案,既能夠向外多步進(jìn)行預(yù)測(cè),又能實(shí)現(xiàn)對(duì)極值的較好預(yù)測(cè)。其基本原理如下:
設(shè)一組樣本序列:
x(t)={x(1) ,x(2),…,x(n)}
(1)
式中n表示樣本序列所包含的元素?cái)?shù)量。接著,由式(2)定義其均值生成函數(shù):
式中i=1,2,…,l; 1≤l≤m;nl=INT(n/l);m=INT(n/2);INT為數(shù)據(jù)整數(shù)。
易知,均值生成函數(shù)處理樣本序列的思路是先按照一定的間隔挑選樣本,然后計(jì)算其平均值,從而得到一組周期函數(shù)。接著,將一個(gè)周期上的均值生成函數(shù)延拓至整個(gè)區(qū)間:
式中i=1,2,…,n;mod為同余算子。
于是得到均值生成函數(shù)的延拓矩陣:
F=(fi,j)n×l,fi,j≡fl(t)
(4)
式中n×l為矩陣階數(shù)。
為敘述方便,令起始預(yù)測(cè)時(shí)刻為tn,對(duì)時(shí)刻點(diǎn)tn+1,tn+2,…,tn+q進(jìn)行預(yù)測(cè)。在馬爾柯夫預(yù)測(cè)中,只有tn時(shí)刻的數(shù)據(jù)對(duì)預(yù)測(cè)有用,tn以前的數(shù)據(jù)不發(fā)揮作用。若樣本序列符合馬爾柯夫特點(diǎn),則隸屬度函數(shù)可定義為:
AM=0/u1+0/u2+…+1/un
(6)
式中AM為具有馬爾柯夫特點(diǎn)的隸屬度函數(shù)。
若從統(tǒng)計(jì)學(xué)角度考慮,則把樣本序列X(1),X(2) ,…,X(n)等概率對(duì)待,則隸屬度函數(shù)定義為:
AS=1/u1+1/u2+…+1/un
(7)
式中AS為統(tǒng)計(jì)學(xué)意義下的隸屬度函數(shù)。
在實(shí)際問(wèn)題中,既不能舍棄過(guò)多以往的信息,又要使近期觀測(cè)值對(duì)預(yù)測(cè)起到較大作用。因此,設(shè)計(jì)了隨觀測(cè)值的遠(yuǎn)近以指數(shù)形式遞減的隸屬度,即:
式中β依據(jù)對(duì)過(guò)去數(shù)據(jù)的重要性提前給出,一般為0.01.
若樣本序列具有周期性,則令隸屬度為:
式中l(wèi)為周期長(zhǎng)度;r為由經(jīng)驗(yàn)提前確定的常數(shù)。
若既考慮觀測(cè)值隨起報(bào)時(shí)刻遠(yuǎn)近效用逐漸下降又要體現(xiàn)周期性,則令隸屬度為:
(10)
式中β,l,r表示的含義同上。
基于均值生成函數(shù)的時(shí)間序列預(yù)測(cè)模型與自回歸滑動(dòng)平均、卡爾曼濾波、指數(shù)平滑等傳統(tǒng)時(shí)間序列模型相比,解決了隨預(yù)測(cè)期延長(zhǎng)預(yù)測(cè)值趨于平均化的問(wèn)題,并可以向外推多步進(jìn)行預(yù)測(cè),對(duì)極值的擬合預(yù)測(cè)效果也較好??墒牵@些建模方案仍不完善,文中在傳統(tǒng)均值生成函數(shù)預(yù)測(cè)模型的基礎(chǔ)上,對(duì)其進(jìn)行了改進(jìn)和完善。
具體改進(jìn)如下:
(1)從預(yù)測(cè)經(jīng)驗(yàn)及物理意義上考慮,距離起報(bào)時(shí)刻越近的觀測(cè)值包含對(duì)預(yù)測(cè)有用的信息越多,對(duì)預(yù)測(cè)越有價(jià)值,而以均值生成函數(shù)為基函數(shù)建立的預(yù)測(cè)模型忽視了這些因素。由于模糊均生函數(shù)計(jì)算方法能夠有效體現(xiàn)出近期的樣本數(shù)據(jù)對(duì)預(yù)測(cè)值的較大影響,并能夠充分利用樣本數(shù)據(jù)中所隱含的有用信息,自提出以來(lái),該理論在短期負(fù)荷預(yù)測(cè)、降水量預(yù)測(cè)、天然徑流預(yù)測(cè)、飛行事故率預(yù)測(cè)等領(lǐng)域已取得成功應(yīng)用。而目前尚未見使用模糊均生函數(shù)計(jì)算方法來(lái)進(jìn)行風(fēng)電場(chǎng)短期風(fēng)速預(yù)測(cè)的報(bào)道,因此文中嘗試用隨指數(shù)形式遞減的隸屬度構(gòu)造模糊均生函數(shù),進(jìn)而將其引入到短期風(fēng)速預(yù)測(cè)研究中,以提高風(fēng)速預(yù)測(cè)的精度;
(2)由于均值生成函數(shù)是由樣本數(shù)據(jù)按照一定的間隔計(jì)算均值而獲得的周期函數(shù),因此在生成均值生成函數(shù)過(guò)程中,常出現(xiàn)時(shí)間序列的尾部樣本值無(wú)法發(fā)揮作用的問(wèn)題。而大量實(shí)驗(yàn)表明,時(shí)間序列的尾部樣本值在整個(gè)實(shí)際預(yù)測(cè)過(guò)程中具有重要的意義。為了解決這一問(wèn)題,文中引入了文獻(xiàn)[11]推導(dǎo)出的逆推算法,使用該算法對(duì)均值生成函數(shù)的定義過(guò)程進(jìn)行了完善,以使得尾部樣本值在均值生成函數(shù)延拓序列中的作用能夠?qū)崿F(xiàn)。
上述過(guò)程在保留均值生成函數(shù)預(yù)測(cè)模型的主要優(yōu)勢(shì)(多步預(yù)測(cè)和極值預(yù)測(cè)效果好)的基礎(chǔ)上,進(jìn)一步考慮了近期數(shù)據(jù)對(duì)風(fēng)電場(chǎng)短期風(fēng)速預(yù)測(cè)結(jié)果的較大影響,并妥善解決了傳統(tǒng)預(yù)測(cè)模型中周期算法的尾部樣本值失效的問(wèn)題,為如何預(yù)測(cè)兼有隨機(jī)波動(dòng)性和趨勢(shì)性的短期風(fēng)速提供了一條新思路。
針對(duì)風(fēng)速兼有隨機(jī)波動(dòng)性和趨勢(shì)性的特點(diǎn),文中在改進(jìn)均值生成函數(shù)構(gòu)造原理的前提下,將其與最優(yōu)子集回歸模型相結(jié)合,建立基于FMGF-OSR的短期風(fēng)速預(yù)測(cè)模型。改進(jìn)模型的具體建模流程如下:
2.3.1 推導(dǎo)時(shí)間序列樣本的FMGF延拓序列
推導(dǎo)步驟如下:
步驟一:為了充分挖掘以往信息,又能使近期數(shù)據(jù)對(duì)數(shù)值的預(yù)測(cè)發(fā)揮較大作用。因此,文中選用了隨觀測(cè)值的遠(yuǎn)近以指數(shù)形式遞減的隸屬度,即:
步驟二:對(duì)于式(2),根據(jù)指數(shù)形式的隸屬度和逆推算法構(gòu)建FMGF如下:
(12)
式中Rl=n-nl·l;i=1,2,…,l; 1≤l≤m;nl=INT(n/l);m=INT(n/2);l為函數(shù)的周期;INT為數(shù)據(jù)取整;Rl為樣本總項(xiàng)n的余項(xiàng)??梢?,在定義FMGF過(guò)程中通過(guò)逆推算法調(diào)整了處理樣本序列的順序,即從樣本序列的第Rl+i項(xiàng)開始,一直計(jì)算到最后一項(xiàng)。通過(guò)改進(jìn)FMGF定義過(guò)程,確保了時(shí)間序列的尾部樣本值在各周期所對(duì)應(yīng)的FMGF序列中均能發(fā)揮作用。
步驟三:對(duì)FMGF序列進(jìn)行周期延拓:
式中i=1,2,…,n;mod為同余算子。即可得到FMGF的延拓矩陣:
F=(fi,j)n×l,fi,j≡fl(t)
(14)
步驟四:為了擬合原序列的高頻分量,對(duì)原序列分別進(jìn)行兩次差分處理:
x(1)(t)={Δx(1) ,Δx(2),…,Δx(n-1)}
(15)
x(2)(t)={Δ2x(1) ,Δ2x(2),…,Δ2x(n-1)}
(16)
步驟五:為了對(duì)原始序列中的變化趨勢(shì)進(jìn)行擬合,將一階差分周期延拓序列進(jìn)行累加處理:
式中fl(3)(1)=x(1);t=2,3,…,n;l=1,2,…,m。
2.3.2 雙評(píng)分標(biāo)準(zhǔn)CSC (Couple Score Criterion)
由2.3.1節(jié)可以得到約4m個(gè)FMGF延拓序列,每個(gè)序列將作為預(yù)測(cè)模型的一個(gè)預(yù)測(cè)因子。因?yàn)槎唐陲L(fēng)速樣本數(shù)據(jù)具有隨機(jī)波動(dòng)性和趨勢(shì)性的特點(diǎn),所以文中使用同時(shí)考慮趨勢(shì)和數(shù)量的雙評(píng)分標(biāo)準(zhǔn)[12]進(jìn)行預(yù)測(cè)因子的篩選:
CSC=S1+S2
(18)
式中S1表示數(shù)量評(píng)分;S2表示趨勢(shì)評(píng)分。
數(shù)量評(píng)分定義為:
式中R2表示復(fù)相關(guān)系數(shù);n表示風(fēng)速序列長(zhǎng)度;QK和QX分別表示殘差平方和、總離差平方和。
趨勢(shì)評(píng)分定義為:
S2=2[R1+(n-1)·ln(n-1)-R2-R3]
(20)
2.3.3 粗選預(yù)測(cè)因子
因?yàn)轭A(yù)測(cè)模型中含有大約4m個(gè)FMGF延拓序列,若把它們都當(dāng)作自變量,并按不同的自由組合與因變量建立回歸方程,這將導(dǎo)致計(jì)算量偏大,也沒(méi)有這樣進(jìn)行的實(shí)際意義。因此,文中首先使用雙評(píng)分標(biāo)準(zhǔn)對(duì)上述變量進(jìn)行篩選,剔除CSC值較低的預(yù)測(cè)因子。
2.3.4 精選最優(yōu)子集
將生成的2h-1個(gè)子集分別進(jìn)行多元線性回歸計(jì)算,并再次計(jì)算所有回歸結(jié)果的CSC值,然后從2h-1個(gè)子集中挑選得到CSC值最大的子集,即獲得風(fēng)速預(yù)測(cè)模型的最優(yōu)子集。
2.3.5 建立短期風(fēng)速預(yù)測(cè)模型
若最優(yōu)子集回歸方程由k個(gè)自變量組成,則得到的基于FMGF-OSR的短期風(fēng)速預(yù)測(cè)模型為:
若要進(jìn)行q步的風(fēng)速預(yù)測(cè),將式(21)中的FMGF序列fi(t)(i=1,2,…,k)仿照式(13)完成q步延拓,然后將其代入短期風(fēng)速預(yù)測(cè)模型,即可完成對(duì)風(fēng)速值的預(yù)測(cè)。
文中實(shí)驗(yàn)樣本來(lái)自中國(guó)北方某風(fēng)電場(chǎng)2017年2月份某一天的風(fēng)速值,按照10分鐘級(jí)的時(shí)間尺度對(duì)風(fēng)速進(jìn)行采樣,一共獲得144個(gè)數(shù)據(jù),實(shí)測(cè)風(fēng)速數(shù)據(jù)如圖1所示??紤]到仿真的復(fù)雜性,文中截取了前4 h的風(fēng)速值,并將獲得的24個(gè)實(shí)測(cè)值作為原始時(shí)間序列樣本,然后采用文中所構(gòu)建模型對(duì)其后1 h的風(fēng)速值進(jìn)行預(yù)測(cè)。為比較文中提出的預(yù)測(cè)模型的優(yōu)越性,文中同時(shí)采用了均值生成函數(shù)-最優(yōu)子集回歸模型(MGF-OSR)、均值生成函數(shù)-主成分回歸模型(MGF-PCA)和經(jīng)典的自回歸滑動(dòng)平均模型(ARMA)對(duì)未來(lái)風(fēng)速值進(jìn)行預(yù)測(cè)。其次,為了突出對(duì)MGF-OSR模型的改進(jìn)之處,文中將FMGF-OSR模型與MGF-OSR模型的建模流程進(jìn)行了對(duì)比,如圖2所示。
圖1 原始風(fēng)速信號(hào)Fig.1 Original wind speed series
圖2 兩個(gè)模型的建模流程Fig.2 Flowcharts of two models
為了有效和全面地對(duì)各預(yù)測(cè)模型的準(zhǔn)確率進(jìn)行量化評(píng)價(jià),誤差評(píng)價(jià)函數(shù)選用相對(duì)誤差(Relative Error, RE)、平均絕對(duì)百分誤差(Mean Absolute Percentage Error, MAPE)和均方根誤差(Root of the Mean Squared Error, RMSE),其表達(dá)式分別為:
使用MATLAB編程進(jìn)行仿真,分別采用4種預(yù)測(cè)模型得到的風(fēng)速預(yù)測(cè)值如圖3所示。
圖3 4種預(yù)測(cè)模型的風(fēng)速預(yù)測(cè)結(jié)果Fig.3 Wind speed prediction results by four models
由圖3可見,根據(jù)FMGF-OSR模型得到的風(fēng)速預(yù)測(cè)曲線與實(shí)際的風(fēng)速數(shù)據(jù)更為接近,預(yù)測(cè)精度最高。下面進(jìn)一步結(jié)合誤差評(píng)價(jià)函數(shù)來(lái)詳細(xì)說(shuō)明文中所建立預(yù)測(cè)模型的有效性和優(yōu)越性,依據(jù)式(22)~式(24)得到各種模型的預(yù)測(cè)誤差結(jié)果如表1和表2所示。
表1 風(fēng)速預(yù)測(cè)結(jié)果比較Tab.1 Comparison of wind speed prediction results
表2 各預(yù)測(cè)模型的誤差對(duì)比Tab.2 Errors comparison of different prediction models
由表1和表2可知,文中預(yù)測(cè)模型將實(shí)際風(fēng)速值與預(yù)測(cè)值之間的相對(duì)誤差基本控制在2.5%左右,表明該預(yù)測(cè)模型的有效性。同時(shí)通過(guò)3種典型的預(yù)測(cè)誤差量化指標(biāo),可知文中提出的FMGF-OSR模型較MGF-OSR模型、MGF-PCA模型、ARMA模型均明顯更優(yōu)。這是由于FMGF-OSR模型在保留MGF-OSR模型的優(yōu)勢(shì)基礎(chǔ)上,結(jié)合模糊理論和逆推算法對(duì)其進(jìn)行了進(jìn)一步的改進(jìn)和完善,使得改進(jìn)后的模型能夠充分挖掘原始數(shù)據(jù)中隱含的有用信息,對(duì)原始數(shù)據(jù)中的高頻分量及趨勢(shì)性都進(jìn)行了較好地?cái)M合,有效降低了風(fēng)速預(yù)測(cè)的誤差。在文中實(shí)際算例仿真中,推導(dǎo)出的風(fēng)速預(yù)測(cè)模型方程包括1個(gè)原始序列、1個(gè)一階差分序列和2個(gè)累加延拓序列的模糊均生函數(shù)序列。
文中提出了一種基于模糊理論和逆推算法改進(jìn)均值生成函數(shù)的短期風(fēng)速預(yù)測(cè)模型,該模型有效解決了傳統(tǒng)均生函數(shù)預(yù)測(cè)模型中由于周期算法導(dǎo)致的鄰近數(shù)據(jù)無(wú)法發(fā)揮作用的問(wèn)題,也使得距離預(yù)測(cè)點(diǎn)越近的風(fēng)速值對(duì)實(shí)際預(yù)測(cè)起到的影響越大,并引入了能夠體現(xiàn)不用周期特性的模糊均生函數(shù)序列作為預(yù)測(cè)因子,這對(duì)極值的擬合和預(yù)測(cè)都取得了比較理想的效果。實(shí)例表明,與常用的幾種風(fēng)速預(yù)測(cè)方法相比,該模型的風(fēng)速預(yù)測(cè)誤差基本控制在2.5%左右,其有效性和優(yōu)越性均得到了驗(yàn)證,具有較高的實(shí)際應(yīng)用價(jià)值。