董利江, 李 偉, 王 瑜, 錢白云, 沈中信,馬勤勇, 孔筱葉
(1. 新疆電力建設(shè)調(diào)試所,新疆 烏魯木齊 830011; 2. 國網(wǎng)新疆電力公司電力科學(xué)研究院,新疆 烏魯木齊 830000;3. 華北電力大學(xué)電子工程系,河北 保定 071003; 4. 四川中測輻射科技有限公司,四川 成都 610000)
風(fēng)速預(yù)測是風(fēng)力發(fā)電研究的基礎(chǔ)環(huán)節(jié)。對于風(fēng)力發(fā)電機來說,輸出功率與風(fēng)能關(guān)系密切,而風(fēng)能正比于風(fēng)速的三次方,風(fēng)速預(yù)測誤差對風(fēng)機功率預(yù)測有很大的影響,故電力系統(tǒng)對風(fēng)速模型預(yù)測誤差有著很高要求[1-2]。因此,建立一個有效的短期風(fēng)速預(yù)測模型具有一定的意義。風(fēng)速預(yù)測的方法主要有兩大類:一類是基于流場分析的預(yù)測模型,例如考慮尾流效應(yīng)、地形效應(yīng)等,但該類方法嚴(yán)重依賴于流場分析的準(zhǔn)確度;另一類是基于風(fēng)速時間序列的預(yù)測方法,即對風(fēng)速歷史數(shù)據(jù)建立預(yù)測模型,該類方法中模型參數(shù)的選取是當(dāng)前研究的重點。本文基于第二類方法建立短期風(fēng)速預(yù)測模型,并對預(yù)測模型參數(shù)的優(yōu)化選取進(jìn)行研究。
相關(guān)向量機[3](relevance vector machine,RVM)作為一種基于貝葉斯框架的稀疏概率模型,在短期風(fēng)速及功率預(yù)測過程中不僅誤差較低,而且計算時間短、魯棒性較強[4-5]。故本文選用RVM方法建立短期風(fēng)速回歸模型對風(fēng)速進(jìn)行預(yù)測。在使用RVM模型進(jìn)行預(yù)測分析時,訓(xùn)練樣本質(zhì)量決定了模型的學(xué)習(xí)能力。根據(jù)Takens[6]的嵌入定理,重構(gòu)空間與原時間序列的動力學(xué)特征相同,故本文選用相空間重構(gòu)法提取蘊含在風(fēng)速時間序列中的特征構(gòu)建樣本。相空間重構(gòu)中嵌入維數(shù)E和時間延遲τ往往通過混沌理論[7-8]計算得到,但得到的值未必是針對模型的最優(yōu)解。本文通過實驗驗證了這兩個參數(shù)確實對風(fēng)速預(yù)測模型最終的誤差有著不可忽視的影響。為進(jìn)一步降低模型預(yù)測回歸誤差,應(yīng)綜合考慮影響模型預(yù)測結(jié)果的各個參數(shù)?;诖?,本文首次提出一種多參數(shù)同步優(yōu)化方法,搜索(E,τ,σ)的最優(yōu)組合。隨著待優(yōu)化參數(shù)個數(shù)的增加,計算復(fù)雜度急劇增加,模型優(yōu)化的時間成本越來越高。故文中基于遺傳算法(genetic algorithm,GA)搜尋風(fēng)速預(yù)測模型超參數(shù)的全局最優(yōu)解。實驗結(jié)果驗證了本文方法對提高模型預(yù)測效率的有效性。
對于給定的風(fēng)速時間序列V={v1,v2,···,vN},在建立預(yù)測回歸模型之前,需事先得到模型的訓(xùn)練學(xué)習(xí)樣本,即特征向量x與目標(biāo)值t。本文采用時間延遲τ和嵌入維數(shù)E對V進(jìn)行空間重構(gòu),得到n個訓(xùn)練樣本:si={xi,ti}={[vi,vi+1×τ,···,vi+(E?1)×τ],vi+E×τ},i=1,2,···,n,n≤N-E×τ。
假定樣本目標(biāo)值ti獨立分布,樣本集中伴有均值為0、方差為σ2的高斯噪聲εi。RVM回歸模型可定義為
式中:n——樣本集總數(shù);
wi——權(quán)值;
K(x,xi)——徑向基核函數(shù)[9];
xi——第i個樣本的特征向量。
ti服從獨立分布,其似然估計為
由SVR的結(jié)構(gòu)風(fēng)險最小化原則可知[10],如若直接將式(2)最大化而不考慮權(quán)值w的約束,將導(dǎo)致十分嚴(yán)重的過擬合現(xiàn)象。因此為避免過擬合現(xiàn)象,需要限定各個權(quán)值wi滿足高斯先驗概率分布:
其中α=[α0,α1,···,αn]T為先驗分布的超參數(shù)。
權(quán)值的后驗概率分布由Bayes準(zhǔn)則計算:
權(quán)值的后驗分布均值和協(xié)方差表達(dá)式為
其中A=diag(α0,α1,···,αn)。
因此由權(quán)值后驗分布的均值μ得出權(quán)值的估計。后驗協(xié)方差矩陣Σ表示模型預(yù)測的不確定性。若α服從gamma分布,超參數(shù)的似然分布為
其中C=σ2I+ΦA(chǔ)?1ΦT。
使用MacKay[11]的方法最大化超參數(shù)似然分布:
其中λii為Σ中第i+1個對角元素。
反復(fù)計算式(7),再利用得到的結(jié)果不斷更新式(5),當(dāng)?shù)鷿M足收斂條件時,即求出模型訓(xùn)練結(jié)束。
風(fēng)電場所在地的氣候基本穩(wěn)定,風(fēng)速波動具有內(nèi)在的規(guī)律性。因此在1.1節(jié)訓(xùn)練過程中,本文通過對歷史風(fēng)速時間序列進(jìn)行空間重構(gòu)來提取出蘊含在其中的特征,進(jìn)而構(gòu)造訓(xùn)練樣本的特征。
RVM預(yù)測過程是利用已經(jīng)完成訓(xùn)練的模型對輸入待預(yù)測時刻的特征向量x*進(jìn)行計算的,得到預(yù)測值。若要預(yù)測第j時刻的風(fēng)速值vj*,按式(1)構(gòu)造相應(yīng)的特征向量:
將其代入RVM模型,預(yù)測結(jié)果表示為
τ和E的選擇對時間序列的重構(gòu)影響很大,目前,這兩個參數(shù)一般利用混沌理論求解得到。
相空間重構(gòu)方法中的重要參數(shù)E與τ,與機器學(xué)習(xí)樣本質(zhì)量有著極大的關(guān)聯(lián)。由于樣本質(zhì)量直接決定了機器學(xué)習(xí)的效果,因此E和τ對RVM模型的回歸能力應(yīng)該有著較大影響。本文通過實驗分析驗證了這一結(jié)論。
以時間延遲τ為例,運用單一變量法的思想,控制核函數(shù)寬度γ和嵌入維數(shù)E不變,改變τ的取值。以3.1節(jié)實驗為例,選取不同的τ值(σ=143,E=8),建立預(yù)測模型,并得到其誤差的變化,見表1。
表1 不同τ值的預(yù)測模型誤差
從表中可以明顯看出,模型的預(yù)測誤差隨τ的取值變化而變動,且沒有規(guī)律性。因此,E與τ在滿足時間序列動力特性的基礎(chǔ)上,還需要對其進(jìn)行優(yōu)化進(jìn)而匹配RVM預(yù)測模型。
通過以上分析,認(rèn)為應(yīng)當(dāng)對樣本特征參數(shù)E、τ和核函數(shù)參數(shù)σ進(jìn)行并行優(yōu)化,并將(E,τ,σ)組合的優(yōu)化結(jié)果作為風(fēng)速預(yù)測模型的最終參數(shù)??紤]到這3個參數(shù)的取值范圍都比較大,若采用傳統(tǒng)的遍歷算法,耗時過長。因此,應(yīng)選擇合適的優(yōu)化算法搜尋全局最優(yōu)解。GA算法由于其具備很強的全局搜索能力,同時精度可調(diào),故本文基于遺傳算法對風(fēng)速預(yù)測模型中的3個參數(shù)進(jìn)行多參數(shù)同步優(yōu)化。
GA算法是模擬自然界優(yōu)化選擇和遺傳的一類現(xiàn)代智能算法[12]。其核心思想是通過“適者生存”的法則篩出一批父代染色體,對其進(jìn)行交叉、變異和選擇復(fù)制,產(chǎn)生適應(yīng)能力更強的子代樣本,不斷逼近參數(shù)組合的最優(yōu)解。本文利用GA尋求3個參數(shù)的最優(yōu)組合,并以其作為RVM風(fēng)速預(yù)測模型超參數(shù)降低預(yù)測誤差。針對短期風(fēng)速時間序列s,具體步驟為:
1)規(guī)定遺傳算法的初始參數(shù):交叉概率、最大迭代次數(shù)以及初始種群規(guī)模等。
2)編碼待優(yōu)化參數(shù)和確定尋優(yōu)區(qū)間:本文需要編碼的參數(shù)為σ、E、τ,其中τ與E在優(yōu)化過程中必須是整數(shù)。
3)選擇適應(yīng)度函數(shù):由于適應(yīng)度函數(shù)值越大的染色體被選為父代的幾率越多,因此適應(yīng)度函數(shù)直接決定了待優(yōu)化參數(shù)的進(jìn)化方向。文中先計算預(yù)測值與真實值間的平均相對誤差,通過一些形式變化確定適應(yīng)度函數(shù),其表達(dá)式為
式中:t——測試樣本對應(yīng)的實測值;
ti′——測試樣本的預(yù)測值;
n——測試樣本的個數(shù);
C——隨著代數(shù)增加遞減的函數(shù)。
4)產(chǎn)生子代:計算父代染色體適應(yīng)度值,通過選擇、交叉、變異操作得到子代。
5)重復(fù)4),直到滿足最大迭代次數(shù)。選出最后一代中適應(yīng)值最大的個體,解碼后得到3個參數(shù)的最優(yōu)組合(σs,τs,Es)。利用τs和Es重構(gòu)風(fēng)速時間序列,構(gòu)建訓(xùn)練樣本集(xi,ti),i=1,2,···,n。
6)預(yù)測模型核函數(shù)參數(shù)設(shè)定為σs,(xi,ti)作為訓(xùn)練樣本,通過對(xi,ti)的學(xué)習(xí)訓(xùn)練使得預(yù)測模型獲得回歸能力。用相同的方式獲取待預(yù)測數(shù)據(jù)的特征xi,并將其輸入到預(yù)測模型中,計算出模型的預(yù)測目標(biāo)值ti′。
以A、B兩個風(fēng)力發(fā)電場歷史風(fēng)速實測數(shù)據(jù)為例,每20 min提取一個采樣點,記錄連續(xù)8 d內(nèi)的風(fēng)速值,共計576個數(shù)據(jù)。風(fēng)速曲線分別見圖1、圖2。
圖1 風(fēng)電場A的8 d風(fēng)速值
圖2 風(fēng)電場B的8 d風(fēng)速值
利用2.2節(jié)方法預(yù)測A、B兩個風(fēng)電場第8d的風(fēng)速值,具體步驟如下:
1)設(shè)定GA算法初始參數(shù)及待優(yōu)化參數(shù)的尋優(yōu)區(qū)間:σ∈[50,107 3],τ∈[1,16],E∈[5,20]。
2)將前6 d的數(shù)據(jù)作為學(xué)習(xí)樣本(N=432),運用第2節(jié)中給出的參數(shù)尋優(yōu)方法對第7 d的風(fēng)速值進(jìn)行預(yù)測。
3)在尋優(yōu)范圍內(nèi)搜出參數(shù)的最優(yōu)組合(σs,τs,Es),優(yōu)化結(jié)果見表2。
表2 3個參數(shù)的優(yōu)化結(jié)果
4)代入τs、Es值對前7 d的風(fēng)速時間序列進(jìn)行相空間重構(gòu),得到第8 d風(fēng)速的特征值?;赗VM預(yù)測模型對兩個風(fēng)場第8 d的風(fēng)速進(jìn)行預(yù)測(σs為RVM中核函數(shù)參數(shù))。
參照組中時間延遲τ和嵌入維數(shù)E分別采用互信息法[13]和Cao[14]方法求解。A、B風(fēng)場風(fēng)速時間序列對應(yīng)的E的求解見圖3、圖4。
圖3 風(fēng)速時間序列對應(yīng)嵌入維數(shù)(風(fēng)電場A)
E1和E2為定義的兩個參量,若二者大于E0時不再變化或趨于穩(wěn)定,則嵌入維數(shù)為E0+1。由圖3、圖4可以看出,兩個參數(shù)分別在13和10的位置趨于穩(wěn)定,那么可以確定嵌入位數(shù)為14和11。確定嵌入維數(shù)與時間延遲之后,再次用每組中的前6 d數(shù)據(jù)對第7 d的值進(jìn)行預(yù)測。另一方面,GA算法只對σ進(jìn)行尋優(yōu)。優(yōu)化結(jié)果見表3。
得到σc、Ec、τc后,仿照3.1節(jié)中的第4)步,對A、B兩個風(fēng)電場第8d的風(fēng)速值進(jìn)行預(yù)測。
圖4 風(fēng)速時間序列對應(yīng)嵌入維數(shù)(風(fēng)電場B)
表3 E與τ的計算結(jié)果及σ的優(yōu)化結(jié)果
本文方法與對照方法建立的RVM風(fēng)速預(yù)測模型預(yù)測結(jié)果的圖形比對見圖5、圖6。從圖中可以看出,本文方法的預(yù)測值與真實值間誤差較小,而對比方法的預(yù)測值在趨勢上反映了真實值的變化,但誤差相對較大。
為了較好地衡量本文風(fēng)速預(yù)測模型的擬合效果,本文利用縱向誤差、橫向誤差、模型效率和模型預(yù)測時間對擬合結(jié)果進(jìn)行綜合評價。其中縱向誤差包括平均相對誤差,均方根誤差,主要體現(xiàn)預(yù)測結(jié)果在豎直方向與真實值的差別,數(shù)值越小,表示預(yù)測值與真實值越接近;橫向誤差從時間軸上描述預(yù)測值與真實值的相關(guān)程度,用皮爾遜相關(guān)系數(shù)表示,數(shù)值越大,相關(guān)程度越高。兩種模型預(yù)測結(jié)果的縱向、橫向誤差見表4。
圖5 風(fēng)電場A風(fēng)速數(shù)據(jù)預(yù)測
圖6 風(fēng)電場B風(fēng)速數(shù)據(jù)預(yù)測
表4 縱向、橫向誤差
從縱向誤差來看,本文模型與對比模型相比,數(shù)值誤差更?。粡臋M向誤差來看,本文模型預(yù)測結(jié)果與真實值高度相關(guān),能更大程度上刻畫風(fēng)電場風(fēng)速波動的規(guī)律。
對于短期風(fēng)速預(yù)測,除了預(yù)測誤差外,模型效率(預(yù)測數(shù)據(jù)峰峰值之間有效點占總點數(shù)的百分比)和預(yù)測時間也是重要參考指標(biāo)。本文同時統(tǒng)計了兩種模型的預(yù)測時間和模型效率,見表5、表6。
表5 模型預(yù)測時間
表6 模型效率
從表中可以看出,基于GA多參數(shù)優(yōu)化的RVM預(yù)測模型預(yù)測時間更短、效率更高。因此本文模型可有利于電網(wǎng)及時調(diào)整調(diào)度計劃。
為了降低風(fēng)速預(yù)測誤差,本文提出一種基于GA的RVM風(fēng)速預(yù)測模型多參數(shù)同步優(yōu)化方法。得到以下結(jié)論:
1)基于相空間重構(gòu)方法構(gòu)建機器學(xué)習(xí)樣本時,嵌入維數(shù)和時間延遲都對風(fēng)速預(yù)測誤差具有較大影響。為了得到模型的最優(yōu)解,需要對參數(shù)E、τ、σ進(jìn)行同步優(yōu)化。
2)基于GA算法對E、τ、σ進(jìn)行同步優(yōu)化,可以降低模型的預(yù)測誤差。GA算法可以較為高效地搜索參數(shù)組合的全局最優(yōu)值,同時降低時間成本,具有良好的工程實用價值。
3)對于其他預(yù)測方法,如組合預(yù)測方法[15-16],為降低其預(yù)測誤差,同樣可以利用本文方法對其模型參數(shù)進(jìn)行同步優(yōu)化選取,因此將該方法應(yīng)用到組合預(yù)測中,將是本文后續(xù)的重要研究內(nèi)容。