曾娜梅, 霍志紅, 許 昌, 鄧智文, 靳志杰
(1.河海大學 能源與電氣學院,南京 211100;2.河海大學 水利水電學院,南京 210098)
風力發(fā)電的大力推廣帶來很大經(jīng)濟效益的同時,也使風電場面臨一些挑戰(zhàn)。其中,自然風的隨機性與間歇性導致風電機組出力很不穩(wěn)定[1],嚴重影響接入電網(wǎng)系統(tǒng)的穩(wěn)定性,更不利于風電場的調(diào)度和控制。精準有效的功率預測是解決上述問題的關鍵,而準確預測風速是風電場功率預測的基礎[2]。通常整個風電場的控制系統(tǒng)從接收指令到響應結束用時在2 min內(nèi),因此為了更好地對風電場進行功率控制,亟需建立有效的分鐘級超短期預測系統(tǒng)。
超短期功率預測指提前量為0~4 h的滾動預測,被用于機組控制及載荷跟蹤[3]。國內(nèi)外常用的預測方法包括自回歸移動平均(ARMA)[4]模型、空間相關性方法[5-6]、支持向量回歸(SVR)[7-8]和小波神經(jīng)網(wǎng)絡[9]等。然而上述方法均集中于對預測方法的創(chuàng)新與改進,忽略了待預測物理量自身特性對模型預測效果的影響。由于風速的時間分辨率越小,其紊流特性及非高斯性就越強,對預測模型的要求也就越高,因此,結合數(shù)據(jù)預處理的組合預測方法成為近期熱點研究趨勢。李燕青等[10]基于解析模態(tài)分解(AMD)對風電功率序列進行分解,但該方法需提前確定信號中的各個頻率成分,不具備自適應性。Hong等[3]利用形態(tài)學高頻濾波器(MHF)將時間序列分解為平均分量和高頻分量,但平均分量的劃分參數(shù)需要大量仿真實驗來確定。He等[11]利用小波變換對風速序列進行分解,并采用深度置信網(wǎng)絡(DBN)進一步提取分解后子序列的高維特征,但小波基的選取較難。近年來,希爾伯特黃變換(Hilbert-Huang transform,HHT)因具有自適應性、適于非線性和非平穩(wěn)信號的處理而受到極大關注。趙倩等[8]利用經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)對風電功率序列進行分解,并采用模擬退火(SA)算法對SVR參數(shù)進行尋優(yōu)??紤]到集合經(jīng)驗模態(tài)分解得到的高頻分量對預測結果的影響,殷豪利用小波包分解對本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)分量1進行再分解處理。趙倩等[8]和殷豪等[12]均表明EMD方法有助于改善模型預測性能,但未充分研究IMF分量對預測結果的影響,預測精度還有待改進。
EMD分解得到的高頻分量振蕩較為嚴重,對整體的預測精度影響較大,對預測模型的要求也較高。目前已有的研究中,基于HHT的預測大多是將各分量預測結果直接疊加[13],忽略了不同頻率的IMF分量對預測結果的影響。因此,筆者提出權重浮動區(qū)間模型和數(shù)學解析模型2種權重優(yōu)化方法以分析各IMF分量權重系數(shù),進而建立了一種基于改進HHT的分鐘級超短期風速預測模型,有效提高了原HHT組合預測模型的性能。
HHT是Huang等人于1998年提出的一種針對非線性、非平穩(wěn)信號的處理方法[14],該方法易于實現(xiàn),直觀高效,具有自適應性、良好的時頻聚集性、完備性及可重構性[15]。HHT理論由EMD和希爾伯特變換(HT)兩部分組成。
EMD方法假設任何復雜信號均由簡單的IMF組成,每個IMF分量都是相互獨立的[16]。
對原始風速時間序列進行分解的具體過程如下:
(1) 識別信號v(t)的所有極大值點與極小值點,分別用三次樣條函數(shù)擬合成原始風速時間序列的上、下包絡線;
(2) 計算上下包絡線的均值m1(t),用v(t)減去m1(t)得到h1(t);
(3) 若h1(t)滿足IMF條件,記c1(t)=h1(t),則c1(t)為第一個IMF分量,為原始風速時間序列的最高頻分量;否則,將h1(t)看作新的v(t),重復上述步驟k次,直到h1(t)滿足IMF條件;
(4) 從原始信號中分離出c1(t),得到剩余分量:
r1(t)=v(t)-c1(t)
(1)
將r1(t)作為新的原始數(shù)據(jù),重復上述步驟,得到n個IMF分量和1個剩余分量,結果如下:
(2)
當rn(t)滿足給定的終止條件時,分解過程結束,原始風速時間序列可表示為:
(3)
式中:rn(t)為殘余函數(shù),代表信號的平均趨勢;ci(t)代表信號不同時間特征尺度的成分,其尺度從c1(t)到cn(t)依次增大。
采用Huang等人提出的分量終止條件——類柯西收斂準則,即把連續(xù)2次IMF篩選序列結果的標準偏差系數(shù)(Standard Deviation,SD)作為評判標準[17],此處用Sd表示,定義如下:
(4)
式中:α為預先設置的足夠小的數(shù)值,當Sd小于等于α時,篩選過程終止;T為原始風速時間序列的個數(shù)。
對于任意的時間序列X(t),Hilbert變換定義為X(t)與1/t的卷積Y(t):
(5)
式中:P為柯西主值,該變換對所有LP類均成立;τ為積分變量;t為當前時刻。
根據(jù)以上定義,可由X(t)與Y(t)得到復共軛解析信號Z(t):
Z(t)=X(t)+jY(t)=a(t)ejθ(t)
(6)
其中
(7)
此時,瞬時頻率如下:
(8)
Elman神經(jīng)網(wǎng)絡在普通前饋式網(wǎng)絡的基礎上增加了層間的反饋連接,是一個動態(tài)反饋系統(tǒng),由輸入層、隱含層、承接層和輸出層構成,其結構如圖1所示。其中,輸入層神經(jīng)元用于傳輸信號,輸出層神經(jīng)元用于輸出結果,承接層神經(jīng)元從隱含層接收反饋信號,用來記憶隱含層神經(jīng)元前一時刻的輸出值,再反饋給隱含層。
圖1 Elman神經(jīng)網(wǎng)絡結構
Elman神經(jīng)網(wǎng)絡的輸入輸出關系如下:
y(t)=g(ω3x(t)+B2)
(9)
x(t)=f(ω1xc(t)+ω2u(t-1)+B1)
(10)
xc(t)=βxc(t-1)+x(t-1)
(11)
式中:u為R維輸入向量;y為S維輸出向量;x為Y維隱含層輸出向量;xc為Y維承接層輸出向量;ω1、ω2、ω3分別為承接層到隱含層、輸入層到隱含層、隱含層到輸出層的連接權值;B1、B2分別為隱含層與輸出層的偏置;β為自連接反饋增益因子,當β為零時,為標準Elman網(wǎng)絡,否則為修正的Elman網(wǎng)絡,文中取β為零;g()為輸出神經(jīng)元傳遞函數(shù),通常取線性函數(shù);f()為隱含層神經(jīng)元傳遞函數(shù),通常取非線性函數(shù)。
為了提高預測精度,文中選取對數(shù)S型函數(shù)(logsig)和正切S型函數(shù)(tansig),表達式分別為:
(12)
(13)
Elman神經(jīng)網(wǎng)絡的學習算法采用梯度下降學習算法,其目標函數(shù)如下:
(14)
式中:Yk(t)和yk(t)分別為t時刻第k個輸出神經(jīng)元的期望輸出和實際輸出。
為了更好地評估所建預測模型的性能,采用3種誤差評估指標,分別為均方根誤差eRMSE(Root Mean Square Error,RMSE)、平均絕對誤差eMAE(Mean Absolute Error,MAE)和平均絕對百分比誤差eMAPE(Mean Absolute Percentage Error,MAPE),其表達式[18]分別為:
(15)
(16)
(17)
為求取各分量權重系數(shù),提出權重浮動區(qū)間模型和數(shù)學解析模型2種方法。
1.4.1 權重浮動區(qū)間模型
權重浮動區(qū)間模型基于原HHT方法,旨在通過實驗分析得到各分量權重系數(shù),該方法實施簡單。具體實施步驟如下:
(1) 參數(shù)初始化:初始狀態(tài)即不考慮各分量影響時的模型,故設定循環(huán)計數(shù)為1,各分量權重為1,即權重向量Q=[1,1,…,1],向量維數(shù)等于分量個數(shù);
(2) 計算出初始誤差向量E,E=[eRMSEeMAEeMAPE];
(3) 設定權重浮動區(qū)間為[-0.1,0.1],從而隨機生成權重增量Qs,該向量維數(shù)與Q一致;
(4) 求得新權重向量,即Qx=Q+Qs;
(5) 按新權重計算風速預測結果,進而求得新的誤差向量M,M=[eRMSEeMAEeMAPE];
(6) 循環(huán)計數(shù)加1;
(7) 判斷循環(huán)計數(shù)是否大于設定值,結果為真,則退出循環(huán),輸出最優(yōu)權重、預測結果及最終誤差值;否則,繼續(xù)循環(huán)。為保證最優(yōu)權重的質(zhì)量,此處的設定值應取較大值。
(8) 比較新誤差與初始誤差,若三項誤差都減小,則返回步驟(2)更新初始誤差向量,繼續(xù)循環(huán);否則,返回步驟(3)繼續(xù)循環(huán)。
詳細計算流程如圖2所示。經(jīng)反復運行統(tǒng)計,單次運行時間介于0.16~0.3 s,滿足預測要求。
圖2 權重浮動區(qū)間模型計算流程
1.4.2 數(shù)學解析模型
數(shù)學解析模型主要通過求解特定的數(shù)學模型來計算各分量權重系數(shù),具體思路及求解過程如下:
按權重疊加的風速預測結果為:
(18)
式中:Q1,…,Qn,Qn+1為各分量所對應的權重系數(shù);c1p(t),…,cnp(t),rnp(t)為各分量預測結果。
此處以均方根誤差最小為目標函數(shù)[19],即
(19)
求解上式,等同于求解式(20),即誤差平方和P最?。?/p>
(20)
將式(18)代入式(20)可得:
Qncnp(t)-Qn+1rnp(t))2
(21)
求P對各權重系數(shù)的偏導,使其滿足以下約束條件,即可求得最優(yōu)權重系數(shù):
(22)
建立了基于數(shù)據(jù)預處理與權重分配的組合預測模型。首先,基于數(shù)據(jù)預處理技術對原始風速時間序列進行EMD分解,得到一系列相對平穩(wěn)的IMF分量和1個剩余分量。然后,對各分量依次進行Hilbert變換,針對其頻譜特性,分別建立不同的Elman神經(jīng)網(wǎng)絡模型進行預測。最后,根據(jù)各分量預測結果,分別利用權重浮動區(qū)間模型和數(shù)學解析模型求取各分量權重系數(shù),按權重疊加各分量預測結果,得到2組風速預測值,通過線性組合得到最終預測結果。由于權重浮動區(qū)間模型和數(shù)學解析模型各有特點,因此運用組合思想,以預測誤差平方和最小為優(yōu)化目標,采用滾動時間窗動態(tài)調(diào)整2組風速預測值線性組合的權重系數(shù)。時間窗的選取會影響權重數(shù)值的變化,分別將時間窗設置為6、10和14,發(fā)現(xiàn)當時間窗較大時,權重波動較小,但可能丟失信號的某些特征;當時間窗較小時,權重波動較大,分析得到的特征可能已經(jīng)失去了實際意義,因此選取時間窗窗口大小為10。實際預測過程中,當前時刻的實際風速值未知,故用上一時刻求得的權重系數(shù)來計算當前時刻的預測風速值。詳細預測流程如圖3所示。
基本步驟如下:
(1) 對原始風速時間序列進行EMD分解。
(2) 對分解后的分量依次進行Hilbert變換,針對其頻譜特性,分別建立不同的Elman神經(jīng)網(wǎng)絡模型進行預測。
(3) 建立權重浮動區(qū)間模型和數(shù)學解析模型2種權重優(yōu)化模型。
圖3 組合預測流程圖
(4) 利用上述2種模型分別求取各分量權重系數(shù)。
(5) 按最優(yōu)權重線性組合2組預測結果,得到最終風速預測值。
選取中國陜西靖邊風電場某風電機組2015-08-22—2015-09-04的實際運行數(shù)據(jù)進行算例分析。數(shù)據(jù)的時間分辨率為1 min,經(jīng)數(shù)據(jù)清洗處理,取前1 200組作為實驗樣本,其中前1 164組為訓練集,后36組為測試集。實驗樣本原始風速數(shù)據(jù)的統(tǒng)計指標見表1。
表1 原始風速數(shù)據(jù)的統(tǒng)計指標
原始風速數(shù)據(jù)及其EMD分解結果如圖4所示,共分解出8個IMF分量和1個剩余分量。由圖4可以明顯看出IMF分量的時間特征尺度從IMF1到IMF8依次增大,其頻率由高到低變化。
對各IMF分量的原始數(shù)據(jù)進行歸一化處理,并建立各自的最佳Elman神經(jīng)網(wǎng)絡模型。為提高預測精度,用到2種線性歸一化方法,分別如下:
(23)
(24)
式中:xi為原始數(shù)據(jù)x的第i個值;min( )、max( )、mean( )分別為最小值、最大值、平均值求取函數(shù)。
(a) 原始風速時間序列
(b) IMF1
(c) IMF2
(d) IMF3
(e) IMF4
(f) IMF5
(g) IMF分量6~8及剩余分量
由式(23)可將數(shù)據(jù)歸一化到[0,1],由式(24)可將數(shù)據(jù)歸一化到[-1,1]。
為選取模型的輸入特征,利用皮爾遜相關系數(shù)分析了各IMF分量與原始數(shù)據(jù)間的相關關系,并對與原始數(shù)據(jù)相關性最大的3個分量進行實驗分析,結果見表2。綜合考慮模型復雜度及訓練耗時,本算例最終選取前12 min的風速數(shù)據(jù)作為網(wǎng)絡的輸入,對該機組的風速進行了提前1 min的滾動預測。
表2 輸入特征選取實驗結果
為了更好地驗證所建模型的有效性,還對原始風速數(shù)據(jù)建立了單一的徑向基函數(shù)(RBF)和Elman預測模型,預測結果對比如圖5所示。
圖5 實際風速及各模型的預測結果
由圖5可見,單一的RBF預測效果較差,有一定的時間滯后現(xiàn)象,當風速變化較大時,往往很難追蹤預測;單一的Elman預測效果較RBF略好一些,對風速數(shù)據(jù)的突變響應也存在滯后現(xiàn)象,但能夠較準確地預測個別點。而基于HHT的Elman神經(jīng)網(wǎng)絡預測模型的預測效果整體有所提高,基本不存在滯后現(xiàn)象,但是也存在個別突變點誤差較大的情況。相比之下,筆者所建立的基于改進HHT的組合預測模型的預測精度比原HHT組合預測模型有所提高。
各模型的誤差評估結果見表3。從表3可以直觀地看到本文所建模型的預測結果最優(yōu),其eRMSE、eMAE、eMAPE分別為0.364 4 m/s、0.287 0 m/s和5.14%,而單一RBF神經(jīng)網(wǎng)絡的eRMSE、eMAE和eMAPE分別為0.612 5 m/s、0.507 7 m/s和9.17%。此外,為了更客觀地比較各模型的性能,表4給出了其誤差改進情況。這表明通過HHT對隨機性、非線性極強的原始風速數(shù)據(jù)進行分解,并結合權重優(yōu)化算法求解各分量權重系數(shù)可有效提高預測精度,有一定的可行性。但是,本算例中分鐘級的預測對象不局限于風電機組,后續(xù)工作中可以將其應用于風電場或風電集群預測,并考察多步預測。此外,文中所提權重浮動區(qū)間模型尚存在一定的局限,未來研究中將進一步優(yōu)化模型,提高算法的魯棒性。
表3 不同預測模型的誤差評估結果
表4 不同預測模型的誤差改進情況
(1) 利用HHT方法在處理非線性、非平穩(wěn)性信號方面的優(yōu)勢,有效挖掘了風速固有的物理特性。
(2) EMD分解得到的分量對整體預測精度影響較大,通過權重浮動區(qū)間模型和數(shù)學解析模型分析各分量權重系數(shù),從某種層面量化了這種影響。
(3) 所提出的基于數(shù)據(jù)預處理與權重分配的組合預測模型能有效改善原HHT組合預測模型的預測效果。
(4) 所建立的組合預測模型挖掘了風速本身的物理特性,可有效提高超短期風速預測的精度并應用于實際風速預測。