李慧杰,劉亞南,衛(wèi)志農(nóng),李曉露,Kwok W Cheung,孫永輝,孫國(guó)強(qiáng)
(1.阿爾斯通電網(wǎng)技術(shù)中心有限公司,上海 201114;2.河海大學(xué) 可再生能源發(fā)電技術(shù)教育部工程研究中心,江蘇 南京 210098;3.ALSTOM Grid Inc.,Redmond,USA Washington 98052)
可再生能源的開(kāi)發(fā)利用得到世界各國(guó)的高度重視,風(fēng)力發(fā)電因具有環(huán)??稍偕?、全球可行、成本低且規(guī)模效益顯著等優(yōu)點(diǎn),已經(jīng)受到廣泛的重視,并且發(fā)展迅速[1]。近年來(lái),風(fēng)力發(fā)電機(jī)組容量的迅速增長(zhǎng),對(duì)電力系統(tǒng)的影響也越來(lái)越明顯。盡管風(fēng)力發(fā)電已經(jīng)成為一種較為成熟的技術(shù),但風(fēng)電場(chǎng)風(fēng)速的預(yù)測(cè)還未達(dá)到一定的滿(mǎn)意程度。準(zhǔn)確預(yù)測(cè)風(fēng)電場(chǎng)的風(fēng)速有利于調(diào)度部門(mén)調(diào)整計(jì)劃,從而有效減輕風(fēng)電對(duì)整個(gè)電網(wǎng)的不利影響,減少電力系統(tǒng)運(yùn)行成本,也有利于調(diào)度人員及時(shí)采取正確的調(diào)度措施[2]。
由于風(fēng)速受諸多因素的影響,具有很強(qiáng)的隨機(jī)性和不確定性,所以預(yù)測(cè)難度較大,尤其是進(jìn)行短期風(fēng)速預(yù)測(cè)[3]。文獻(xiàn)[4] 將經(jīng)典的ARMA模型用于短期風(fēng)速預(yù)測(cè),取得了較好的結(jié)果,但這種方法低階模型不能完全反映樣本的性能,高階模型的估計(jì)較為復(fù)雜,在計(jì)算中消耗時(shí)間,在氣候變化很大的情況下預(yù)測(cè)結(jié)果不甚理想。文獻(xiàn)[5-6] 分別采用BP神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行風(fēng)速預(yù)測(cè),但其算法容易陷入局部最小問(wèn)題,得不到全局最優(yōu)解,收斂速度也較慢。文獻(xiàn)[7] 將支持向量機(jī)(SVM)應(yīng)用到風(fēng)速預(yù)測(cè)中,同時(shí)采用微分進(jìn)化算法進(jìn)行參數(shù)優(yōu)化,相比神經(jīng)網(wǎng)絡(luò),該方法具有更高的精度和更強(qiáng)的魯棒性。文獻(xiàn)[8] 采用空間相關(guān)性法進(jìn)行短期風(fēng)速預(yù)測(cè),該方法需要考慮所測(cè)地點(diǎn)以及與之相近幾個(gè)地點(diǎn)的風(fēng)速時(shí)間序列,基于幾個(gè)地點(diǎn)風(fēng)速之間的空間相關(guān)性,進(jìn)行風(fēng)速預(yù)測(cè)。由于該方法需要大量的原始數(shù)據(jù),在實(shí)際操作中存在一定的難度。
混沌理論最早用于氣象學(xué)中,通過(guò)對(duì)風(fēng)速時(shí)間序列的Lyapunov指數(shù)計(jì)算,可以證明其具有混沌特性,而且混沌時(shí)間序列在短期內(nèi)可以預(yù)測(cè)。因此,利用混沌相空間重構(gòu)理論可以還原風(fēng)速時(shí)間序列的非線(xiàn)性動(dòng)力特性,使用一定的預(yù)測(cè)模型可以進(jìn)行短期風(fēng)速預(yù)測(cè)。文獻(xiàn)[9-10] 已經(jīng)將相空間重構(gòu)用于風(fēng)力發(fā)電功率預(yù)測(cè)中。本文通過(guò)相空間重構(gòu)的方法建立相關(guān)向量機(jī)(RVM)短期風(fēng)速預(yù)測(cè)模型,同時(shí)采用高斯核函數(shù)和多項(xiàng)式函數(shù)的組合作為RVM的核函數(shù),以此來(lái)提高預(yù)測(cè)精度。算例結(jié)果表明,RVM模型較之現(xiàn)有的風(fēng)速預(yù)測(cè)模型具有更高的精度。
根據(jù)Takens的嵌入定理[11],對(duì)于一個(gè)時(shí)間序列,延遲坐標(biāo)的維數(shù)m≥2d+1(d是動(dòng)力系統(tǒng)的維數(shù)),在該嵌入維空間里可以把有規(guī)律的軌道(吸引子)恢復(fù)出來(lái),即重構(gòu)的空間中的軌道與原吸引子的拓?fù)浣Y(jié)構(gòu)完全相同。對(duì)于一組時(shí)間序列{xi},則相空間重構(gòu)為:
其中,m為嵌入維數(shù),τ為延遲時(shí)間,Q=n-(m-1)τ為相空間中的相點(diǎn)個(gè)數(shù),i=1,2,…,Q。
在重構(gòu)過(guò)程中,嵌入維數(shù)和延遲時(shí)間選取至關(guān)重要,恰當(dāng)選擇2個(gè)參數(shù)將直接影響相空間重構(gòu)的質(zhì)量,從而影響預(yù)測(cè)精度。
利用計(jì)算互信息函數(shù)的第一極小值來(lái)確定最佳延遲時(shí)間 τ 的方法稱(chēng)為互信息法。
對(duì)于2組信號(hào){x(i),y(j)}(i,j=1,2,…,Q)給定x(i)的一個(gè)測(cè)量值,預(yù)測(cè) y(j)的平均信息量為互信息函數(shù):
其中,Px[x(i)] 為 x(i)的概率密度,Py[y(j)] 為 y(j)的概率密度,Pxy[x(i),y(j)] 為聯(lián)合概率;H(x)為信號(hào){x(i)}的熵,表示對(duì)指定系統(tǒng)的N個(gè)x(i)測(cè)量得到的平均信息量,H(y)的定義與 H(x)類(lèi)似,H(x,y)為聯(lián)合熵。本文采用等間距劃分網(wǎng)格方法計(jì)算互信息。
針對(duì)本文選取的時(shí)間序列,利用互信息法得到該序列互信息函數(shù)與延遲時(shí)間的關(guān)系如圖1所示,從圖中看出,延遲時(shí)間取10。
圖1 互信息函數(shù)與延遲時(shí)間關(guān)系Fig.1 Relationship between mutual information function and time delay
目前相空間重構(gòu)嵌入維數(shù)的求取廣泛采用Cao算法。對(duì)于混沌時(shí)間序列 x1,x2,…,xn,若嵌入維數(shù)為m,延遲時(shí)間為τ,則重構(gòu)的相空間如式(1)所示。定義:
其中,E(m)為所有 a(i,m)的均值,Ym+1(n(i,m))為Ym+1(i)的最鄰近的點(diǎn),Ym(n(i,m))為 Ym(i)的最鄰近的點(diǎn)。
當(dāng)嵌入維數(shù)m大于某個(gè)值時(shí),E1(m)不再變化,這時(shí)m就是飽和嵌入維數(shù)。針對(duì)本文選取的時(shí)間序列,利用 Cao 算法得到 E1(m)、E2(m)與嵌入維數(shù) m的關(guān)系如圖2所示。從圖中可以看出,嵌入維數(shù)m增加到7時(shí),E1(m)趨于穩(wěn)定,所以嵌入維數(shù)取8。
圖2 E1(m)、E2(m)與嵌入維數(shù) m 的關(guān)系Fig.2 Relationship between E1(m)/E2(m)and embedding dimension m
對(duì)于一個(gè)混沌系統(tǒng),至少存在一個(gè)正的Lyapunov指數(shù),它反映了軌道從初始條件附件開(kāi)始發(fā)散的速度。因此,可以通過(guò)估計(jì)最大Lyapunov指數(shù),來(lái)判斷系統(tǒng)的混沌屬性。本文采用Wolf法[12]估計(jì)最大Lyapunov指數(shù)。
步驟1 設(shè)初始時(shí)刻為t0,當(dāng)前時(shí)刻為t1,終點(diǎn)時(shí)刻為tM,M=P-(m+1)τ,P為時(shí)間序列終點(diǎn)。
步驟2 設(shè)初始點(diǎn)為 Y(t0),其與最近鄰點(diǎn) Y0(t0)的距離為L(zhǎng)0,經(jīng)過(guò)一定時(shí)間的演化到達(dá)2個(gè)新的點(diǎn)Y(t1)和 Y0(t1),此時(shí)間距超過(guò)一個(gè)預(yù)先給定的閾值ξ(ξ>0),即。
步驟3 保留 Y(t1),同時(shí)在 Y(t1)鄰近另找一個(gè)點(diǎn) Y1(t1),使得并且與之夾角盡可能小。
步驟4 繼續(xù)步驟3,直到到達(dá)時(shí)間序列的終點(diǎn)M,追蹤演化過(guò)程的迭代次數(shù)為tM-t0,則最大Lyapunov指數(shù)λ1為:
根據(jù)前述分析,取m=8、τ=10,這時(shí)最大Lyapunov指數(shù)大于0,其值為λ1=0.2851。由此看出,風(fēng)速時(shí)間序列具有混沌特性。
RVM[13-14]是在SVM的基礎(chǔ)上,基于貝葉斯學(xué)習(xí)理論提出的算法模型。與SVM相比,RVM有如下優(yōu)點(diǎn):相關(guān)向量的數(shù)目遠(yuǎn)遠(yuǎn)小于支持向量,具有高稀疏性;僅有核參數(shù)的設(shè)置,可以節(jié)約訓(xùn)練時(shí)間;核函數(shù)無(wú)需滿(mǎn)足Mercer條件,增加了核函數(shù)選擇的靈活性。
對(duì)于給定的訓(xùn)練樣本輸入集{xn}Nn=1和對(duì)應(yīng)的輸出集{ln}Nn=1,RVM 回歸模型[15-17]可定義為:
其中,ε 為服從 N(0,σ2)分布的各獨(dú)立樣本誤差,wi為權(quán)系數(shù),K(x,xi)為核函數(shù),N 為樣本數(shù)量。
對(duì)于相互獨(dú)立的輸出集,整個(gè)樣本的似然函數(shù)為:
其中,l=(l1,l2,…,lN),w=[w0,w1,…,wN]T,Φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(x1,xN),K(x2,xN),…,K(xn,xN))]T,y(xi;w)為預(yù)測(cè)值。
根據(jù)概率預(yù)測(cè)公式,所求的條件概率為:
其中,l*為目標(biāo)值。
為了避免直接使用最大似然方法求解w和σ2而帶來(lái)的過(guò)適應(yīng)現(xiàn)象,對(duì)w加上先決條件。根據(jù)貝葉斯理論,w為分布為零的標(biāo)準(zhǔn)正態(tài)分布,同時(shí)引入超參數(shù) α=[α0,α1,…,αN]T,可得:
因此,概率預(yù)測(cè)式改為:
RVM的一個(gè)重要特征就是對(duì)每個(gè)權(quán)值限定先決條件。α為權(quán)值w對(duì)應(yīng)的超參數(shù),符合伽馬分布。經(jīng)過(guò)足夠的更新次數(shù)后,大部分αi會(huì)趨近無(wú)限大,其對(duì)應(yīng)的權(quán)值趨于0,而其他的αi會(huì)穩(wěn)定地趨近有限值。而與之對(duì)應(yīng)的xi稱(chēng)之為相關(guān)向量,實(shí)現(xiàn)RVM稀疏特性。
在定義了先驗(yàn)概率分布及似然分布以后,根據(jù)貝葉斯原理,就可以求得所有未知參數(shù)的后驗(yàn)概率分布為:
其中,ψ=(σ-2ΦTΦ+A)-1,μ=σ-2ψΦTl,A=diag(α0,α1,…,αN)。
最后使用最大似然方法可以得到估計(jì)的超參數(shù)α和方差σ2。
若給定新的輸入值x*,則相應(yīng)的輸出概率分布服從高斯分布,其相應(yīng)的預(yù)測(cè)值為 y*=μTφ(x*)。
為了加快樣本的訓(xùn)練速度和收斂速度,需要對(duì)原始樣本進(jìn)行預(yù)處理,從而提高模型的預(yù)測(cè)精度。本文主要采用歸一化方法對(duì)樣本數(shù)據(jù)進(jìn)行處理:
RVM是基于核函數(shù)方法的模式識(shí)別技術(shù),本質(zhì)上講,核方法實(shí)現(xiàn)了數(shù)據(jù)空間、特征空間和類(lèi)別空間之間的非線(xiàn)性變換?;旌虾撕瘮?shù)的基本思想[18]是將多個(gè)不同的核函數(shù)結(jié)合起來(lái),使得組合后的核函數(shù)具有更好的特性。
高斯核函數(shù)在眾多核函數(shù)中表現(xiàn)出了優(yōu)異的特性,本文選擇多項(xiàng)式核函數(shù)進(jìn)行線(xiàn)性組合得到的函數(shù)作為RVM模型的核函數(shù)。為了方便起見(jiàn),選擇如下二項(xiàng)式函數(shù):
其中,G(xi,xj)為高斯核函數(shù);P(xi,xj)為二項(xiàng)式核;λ為核函數(shù)權(quán)重,0≤λ≤1,λ=0或λ=1時(shí)分別為單一核函數(shù)。
在基于核函數(shù)的模式識(shí)別技術(shù)中,核參數(shù)的選擇對(duì)結(jié)果起著至關(guān)重要的作用。RVM預(yù)測(cè)模型中超參數(shù)α可以通過(guò)訓(xùn)練自適應(yīng)得到最優(yōu)值,核函數(shù)寬度σ和權(quán)重λ的選取采用網(wǎng)格搜索法來(lái)獲得。
預(yù)測(cè)模型的預(yù)測(cè)效果采用平均絕對(duì)百分比誤差評(píng)價(jià),其表達(dá)式為:
風(fēng)速預(yù)測(cè)流程如圖3所示。
圖3 風(fēng)速預(yù)測(cè)流程圖Fig.3 Flowchart of wind speed forecasting
本文采用某風(fēng)電場(chǎng)前15天的1440個(gè)實(shí)測(cè)風(fēng)速值作為訓(xùn)練樣本,數(shù)據(jù)采樣間隔為15 min,建立RVM風(fēng)速預(yù)測(cè)模型,對(duì)第16天的96個(gè)采樣點(diǎn)的風(fēng)速值做提前1點(diǎn)(即15 min)的預(yù)測(cè)。建立模型前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,選取合理的參數(shù)。本文嵌入維數(shù)取8,延遲時(shí)間取10。
本文分別選擇了Sigmoid函數(shù)、線(xiàn)性函數(shù)、二次項(xiàng)函數(shù)、RBF函數(shù)及其組合函數(shù)作為核函數(shù),比較預(yù)測(cè)結(jié)果如表1所示。
表1 不同核函數(shù)的預(yù)測(cè)結(jié)果Tab.1 Forecasts by different kernel functions
由表1可以看出,不同的核函數(shù)對(duì)應(yīng)的eMAPE的差別很大,對(duì)于單一核函數(shù),二項(xiàng)式函數(shù)的eMAPE=2.62%,RBF核函數(shù)的eMAPE=2.65%,這2種核函數(shù)的誤差遠(yuǎn)小于其余的單一核函數(shù)。本文所采用的RBF核函數(shù)與二項(xiàng)式函數(shù)的組合核函數(shù)的eMAPE=2.58%,預(yù)測(cè)效果優(yōu)于RBF核函數(shù)和其他的組合核函數(shù)。
將RVM模型與時(shí)間序列模型、BP神經(jīng)網(wǎng)絡(luò)模型、SVM模型的預(yù)測(cè)結(jié)果分別進(jìn)行比較,這些模型在數(shù)據(jù)處理上基本相同,得到的提前15 min的預(yù)測(cè)結(jié)果如表2所示(由于篇幅有限,只列出部分?jǐn)?shù)據(jù))。
表2 不同預(yù)測(cè)模型的預(yù)測(cè)結(jié)果Tab.2 Forecasts by different forecasting models
時(shí)間序列模型預(yù)測(cè)結(jié)果的eMAPE=5.21%,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果的eMAPE=5.18%,SVM模型預(yù)測(cè)結(jié)果的eMAPE=3.22%,RVM模型預(yù)測(cè)結(jié)果的eMAPE=2.58%。由不同模型得到的eMAPE可以看出,RVM模型在風(fēng)速預(yù)測(cè)中精度比其他模型高。RVM模型計(jì)算的結(jié)果比較穩(wěn)定,比BP神經(jīng)網(wǎng)絡(luò)模型性能優(yōu)越,BP神經(jīng)網(wǎng)絡(luò)方法不能得到全局最優(yōu)解,因?yàn)槠洳捎锰荻认陆捣▋?yōu)化權(quán)值,而這一優(yōu)化過(guò)程只能保證收斂到其中一個(gè)點(diǎn)。SVM模型性能也很好,也可以得到全局最優(yōu)解,其收斂時(shí)間為550.98 s,但是RVM模型具有更高的稀疏性,能較快收斂,其收斂時(shí)間為345.53 s,從而驗(yàn)證了RVM理論在風(fēng)速預(yù)測(cè)中的可行性,具有一定的使用價(jià)值。
本文對(duì)風(fēng)速時(shí)間序列建立了非線(xiàn)性動(dòng)力學(xué)系統(tǒng)模型,通過(guò)估計(jì)嵌入維數(shù)、延遲時(shí)間以及最大Lyapunov指數(shù)檢驗(yàn)了該系統(tǒng)的混沌特性。在此基礎(chǔ)上,借助RVM方法,對(duì)風(fēng)速進(jìn)行了短期預(yù)測(cè)。該方法克服了神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間長(zhǎng)、泛化能力差、易陷入局部極小等缺點(diǎn),具有較強(qiáng)的小樣本學(xué)習(xí)和泛化能力。同時(shí)通過(guò)對(duì)不同的核函數(shù)進(jìn)行分析組合,選擇出了RBF核函數(shù)與二項(xiàng)式函數(shù)的組合核函數(shù)作為RVM模型的核函數(shù)。與SVM相比,該方法稀疏性更高,核函數(shù)選擇更加靈活,同時(shí)組合核函數(shù)的使用提高了預(yù)測(cè)的精度。作為一種新型的稀疏性學(xué)習(xí)方法,RVM可以同時(shí)輸出預(yù)測(cè)值和預(yù)測(cè)值方差,非常適用于有實(shí)時(shí)性要求的工程預(yù)測(cè)估計(jì)。