閆 帆,李傲燃
(云南大學(xué),昆明 650504)
電力系統(tǒng)規(guī)劃調(diào)整的具體過(guò)程將通過(guò)實(shí)時(shí)檢測(cè)、數(shù)據(jù)綜合分析、反饋決策及決策優(yōu)化4個(gè)部分來(lái)實(shí)現(xiàn),其中風(fēng)速的準(zhǔn)確預(yù)測(cè)是電廠提高效益并擴(kuò)大規(guī)模的關(guān)鍵。雖然國(guó)內(nèi)已做過(guò)大量有關(guān)風(fēng)力預(yù)測(cè)的研究并提出大量模型,如數(shù)值天氣預(yù)報(bào)預(yù)測(cè)法、統(tǒng)計(jì)回歸預(yù)測(cè)法等,但基于風(fēng)速的間歇性、波動(dòng)性和不確定性,以上方法都有一定缺點(diǎn)。如數(shù)值天氣預(yù)報(bào)預(yù)測(cè)法[2]需要大量天氣環(huán)境數(shù)據(jù);單一的統(tǒng)計(jì)回歸預(yù)測(cè)模型[3]存在低階模型精確度低、高階模型結(jié)構(gòu)復(fù)雜、需要繁重的運(yùn)算資源等缺點(diǎn)[4]。
該文通過(guò)將風(fēng)速原始數(shù)據(jù)輸入模型,以分解時(shí)間序列,優(yōu)化機(jī)器學(xué)習(xí)預(yù)測(cè)算法為解決思路,建立預(yù)測(cè)誤差較小的風(fēng)速預(yù)測(cè)模型。針對(duì)風(fēng)速時(shí)間序列不確定性和單一預(yù)測(cè)模型預(yù)測(cè)精度不高的問(wèn)題,提出了以經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition, EMD)改進(jìn)算法為基礎(chǔ)的分解算法進(jìn)行風(fēng)速預(yù)測(cè)的思路,即通過(guò)集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)對(duì)時(shí)間序列進(jìn)行分解,建立優(yōu)化粒子群優(yōu)化算法(particle swarm optimization, PSO)優(yōu)化支持向量機(jī)(support vector machine,SVM)模型組合預(yù)測(cè)算法,將各模態(tài)分量預(yù)測(cè)值疊加與重構(gòu)得到預(yù)測(cè)結(jié)果。將預(yù)測(cè)結(jié)果與傳統(tǒng)預(yù)測(cè)模型進(jìn)行預(yù)測(cè)效果的比較,并進(jìn)行定量誤差分析。
為深入分析非平穩(wěn)時(shí)間序列數(shù)據(jù)的局部頻率特征,N. E. Huang等基于瞬時(shí)頻率概念提出一種自適應(yīng)非線性信號(hào)去噪技術(shù)——經(jīng)驗(yàn)?zāi)B(tài)分解算法[5]。該方法的核心是將原始信號(hào)分解成一組振蕩模式的單個(gè)分量信號(hào),即固有模態(tài)函數(shù)(intrinsic mode function,IMF),這一分解過(guò)程可以得到平穩(wěn)的、線性的IMF。
經(jīng)驗(yàn)?zāi)B(tài)分解的核心是篩選固有模態(tài)函數(shù),而對(duì)于非平穩(wěn)數(shù)據(jù),EMD分解也存在缺陷,主要原因是容易出現(xiàn)模態(tài)混疊。模態(tài)混疊是指一個(gè)IMF分量中包含差異極大的特征時(shí)間尺度。EEMD是一種基于噪聲輔助分析的集合經(jīng)驗(yàn)?zāi)B(tài)分解,可以消除模態(tài)混疊現(xiàn)象[6-8]。集合經(jīng)驗(yàn)?zāi)B(tài)分解的步驟如下:
1)將標(biāo)準(zhǔn)正態(tài)分布的白噪聲n(t)加到原信號(hào),得到信號(hào)X(t):
X(t)=x(t)+n(t)
(1)
2)對(duì)加入白噪聲的信號(hào)Xi(t)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,得到j(luò)個(gè)IMF分量:
(2)
式中:Xi(t)表示第i次附加白噪聲所得信號(hào);ci,j(t)是第i次試驗(yàn)的第j個(gè)IMF;ri,j(t)為余項(xiàng)。
3)重復(fù)步驟1)、2)M次,通過(guò)加入不同正態(tài)分布的白噪聲ni(t)得到IMF集合。
小麥新品種展示示范安排在我區(qū)東關(guān)街道辦五一村大田中,前茬作物為玉米,該地地勢(shì)平坦,灌溉方便,肥力中等。
4)將上述得到的IMF進(jìn)行集成平均運(yùn)算得到最終結(jié)果:
(3)
支持向量機(jī)(support vector machine, SVM)是一種基于二分類(lèi)算法思想和監(jiān)督?jīng)Q策思想的機(jī)器學(xué)習(xí)算法,用于尋找根據(jù)坐標(biāo)特性分割二維數(shù)據(jù)點(diǎn)的理想直線,該直線在進(jìn)行清晰劃分的同時(shí)具有較強(qiáng)的魯棒性和泛化能力。相比邏輯回歸等方式,支持向量機(jī)提供一種更優(yōu)的分類(lèi)方式。而當(dāng)待處理的數(shù)據(jù)集是三維及高維時(shí),該數(shù)據(jù)不具有線性可分性,因此希望通過(guò)加入相關(guān)參數(shù)將數(shù)據(jù)輸入高維空間,使數(shù)據(jù)集變成線性可分的形式,這個(gè)過(guò)程是由引入松弛變量和非線性映射實(shí)現(xiàn)的。在這個(gè)高維空間中,通過(guò)尋找超平面以進(jìn)行最優(yōu)分類(lèi):
(4)
r為樣本到超平面的距離,在超平面中,w取(w1,w2),x取(x1,x2),可以將超平面寫(xiě)成直角坐標(biāo)中直線y-y0=k(x-x0)的類(lèi)似形式。w為平面法向量,b為平面與原點(diǎn)的距離。
粒子群算法是一種以鳥(niǎo)類(lèi)捕食行為為原理的隨機(jī)搜索算法[10]。在迭代進(jìn)行時(shí),粒子具有一個(gè)速度值以決定前進(jìn)方向和距離,同時(shí)通過(guò)參考個(gè)體極值(ibest)和群體極值(gbest)更新相關(guān)參數(shù)。計(jì)算機(jī)實(shí)現(xiàn)模擬捕食的第一步是初始化粒子群位置、速度、gbest和ibest,迭代時(shí)不斷更新ibest和gbest,當(dāng)gbest符合要求時(shí)結(jié)束,反之繼續(xù)進(jìn)行更新。
為找到支持向量機(jī)模型中合適的參數(shù)以提高分類(lèi)性能和泛化能力,該文嘗試使用PSO優(yōu)化SVM的參數(shù)。該優(yōu)化方法基于交叉驗(yàn)證優(yōu)化,交叉驗(yàn)證的思想是將訓(xùn)練樣本分類(lèi),分別用于模型的預(yù)測(cè)和評(píng)估,再選擇性能較好的樣本作為模型,以達(dá)到評(píng)估和選擇模型的效果。選擇對(duì)其進(jìn)行十倍交叉驗(yàn)證,并將均值作為算法精度的估計(jì)。
以中國(guó)北方某風(fēng)電場(chǎng)2020年1月1日0時(shí)至12月23日24時(shí),采樣間隔為5 min的全年風(fēng)速數(shù)據(jù)為實(shí)例進(jìn)行風(fēng)速預(yù)測(cè)與分析??紤]到時(shí)間跨度和采樣間隔造成的影響,為減小試驗(yàn)干擾并保證結(jié)論普適性,選取2月1日0時(shí)至3月6日6時(shí)內(nèi),采樣間隔為1 h的數(shù)據(jù)集共800組。其訓(xùn)練數(shù)據(jù)數(shù)量的選取約為樣本數(shù)量的80%,剩余測(cè)試數(shù)據(jù)在時(shí)序上體現(xiàn)為訓(xùn)練數(shù)據(jù)的延拓。
采用誤差分析的不同模型對(duì)預(yù)測(cè)效果進(jìn)行分析和評(píng)估,使用到的分析模型包括均方根誤差(root mean squared error, RMSE)、平均絕對(duì)誤差(mean absolute error, MAE)和決定系數(shù)r2等。
將風(fēng)速原始序列進(jìn)行EMD分解,根據(jù)不同尺度或趨勢(shì)分量進(jìn)行逐級(jí)分解得到7個(gè)相互獨(dú)立的IMF分量和余項(xiàng)res,分解結(jié)果如圖1所示。
圖1 EMD分解結(jié)果及分量對(duì)應(yīng)頻譜圖
觀察EMD分解得到的各分量,IMF2與IMF3包含差異較小的特征時(shí)間尺度。為克服較嚴(yán)重的模態(tài)混疊現(xiàn)象,通過(guò)配置0.2白噪聲、集合次數(shù)100的EEMD分解,得到8個(gè)IMF分量,如圖2所示。觀察分解結(jié)果可以看到,在EEMD分解結(jié)果中,不同分量的時(shí)間尺度差距更加明顯。
圖2 EEMD分解結(jié)果及分量對(duì)應(yīng)頻譜圖
由于風(fēng)速的間歇性與波動(dòng)性,采用單一的預(yù)測(cè)方法難以取得較好的預(yù)測(cè)結(jié)果,提出一種EEMD-PSO-SVM組合預(yù)測(cè)模型。根據(jù)不同尺度、特征的趨勢(shì)分量,分別使用PSO對(duì)粒子樣本進(jìn)行學(xué)習(xí)訓(xùn)練,自適應(yīng)選擇最優(yōu)參數(shù),得到各分量對(duì)應(yīng)SVM模型中的c和p,c、p分別為懲罰系數(shù)、核函數(shù)參數(shù)。對(duì)上文所得模態(tài)分解結(jié)果進(jìn)行歸一化,再將分量輸入模型得到預(yù)測(cè)結(jié)果。分別計(jì)算平均絕對(duì)誤差MAE和決定系數(shù)r2,得到各IMF預(yù)測(cè)模型的參數(shù)及誤差評(píng)估結(jié)果,如表1所示,其中cbest和pbest分別為最佳懲罰系數(shù)和最佳核半徑。
表1 PSO-SVM模型參數(shù)表
為驗(yàn)證EEMD-PSO-SVM組合預(yù)測(cè)模型的優(yōu)越性,將原始序列及EEMD分解序列分別輸入向量機(jī)預(yù)測(cè)模型進(jìn)行對(duì)比試驗(yàn),得到SVM、EEMD-SVM模型風(fēng)速預(yù)測(cè)結(jié)果。其中對(duì)EEMD-SVM模型進(jìn)行定量精確度評(píng)估,得到模態(tài)分量預(yù)測(cè)參數(shù)及精度表,如表2所示。
表2 模態(tài)分量預(yù)測(cè)參數(shù)及精度表
最后將預(yù)測(cè)結(jié)果進(jìn)行反歸一化和重構(gòu),將225個(gè)測(cè)試樣本的前70例數(shù)據(jù)預(yù)測(cè)結(jié)果與原始序列進(jìn)行比較。圖3反映了分別使用EEMD-PSO-SVM,EEMD-SVM,SVM這3種模型分別進(jìn)行1 h風(fēng)速預(yù)測(cè)的結(jié)果(局部)和誤差分布情況。
圖3 不同模型預(yù)測(cè)結(jié)果對(duì)比(局部)
對(duì)于預(yù)測(cè)結(jié)果需要進(jìn)行定量分析,結(jié)合不同模型的預(yù)測(cè)結(jié)果,分別使用均方誤差(MSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)進(jìn)行計(jì)算,3種模型的誤差指標(biāo)如表3所示。
表3 不同模型的預(yù)測(cè)精度表
圖3和表3給出了不同預(yù)測(cè)模型的預(yù)測(cè)結(jié)果和統(tǒng)計(jì)誤差指標(biāo)??煽闯?該文提出的方法的預(yù)測(cè)曲線擬合程度較好、誤差較小。相比SVM模型,EEMD-SVM模型在引入模態(tài)分解的同時(shí)大幅提升了預(yù)測(cè)曲線與原序列的擬合度,避免了不同頻率尺度的相互干擾,體現(xiàn)了模態(tài)分解在處理非平穩(wěn)序列的優(yōu)越性。EEMD-PSO-SVM模型在上述基礎(chǔ)上優(yōu)化了向量機(jī)懲罰參數(shù)和核函數(shù)參數(shù)的選取,這是因?yàn)镻SO具有的全局搜索特性使向量機(jī)具有合適的學(xué)習(xí)能力和較強(qiáng)的泛化能力,同時(shí)也減小了處理部分?jǐn)?shù)據(jù)時(shí)陷入局部最優(yōu)的可能性。
結(jié)合圖3和表3,對(duì)比傳統(tǒng)單一預(yù)測(cè)模型和EEMD-SVM模型,后者的統(tǒng)計(jì)誤差指標(biāo)相比單一預(yù)測(cè)模型分別降低6.11 m/s、1.50 m/s和37.23%,而對(duì)比EEMD-SVM模型和EMD-PSO-SVM模型,后者的平均絕對(duì)誤差和平均絕對(duì)百分比誤差相比前者分別降低0.28 m/s和18.17%。
對(duì)于風(fēng)速序列中的極值點(diǎn)和發(fā)生較大波動(dòng)的數(shù)據(jù)點(diǎn),提出的組合預(yù)測(cè)模型相較于傳統(tǒng)預(yù)測(cè)模型有更好的擬合效果,相關(guān)誤差指標(biāo)均顯著降低,這也表明結(jié)合EEMD預(yù)處理和PSO優(yōu)化支持向量機(jī)能夠有效提高模型可靠性,實(shí)現(xiàn)較高精度的短期精度預(yù)測(cè)。
基于風(fēng)速的波動(dòng)性和間歇性,提出了EEMD-PSO-SVM組合預(yù)測(cè)模型。該預(yù)測(cè)模型將原始序列分解為具有不同尺度的IMF分量,分別建立PSO-SVM預(yù)測(cè)模型,優(yōu)化得到最佳向量機(jī)參數(shù),從而建立對(duì)應(yīng)的最優(yōu)預(yù)測(cè)模型。該組合預(yù)測(cè)模型實(shí)現(xiàn)了在保證精度和可靠性的同時(shí)避免復(fù)雜的模型結(jié)構(gòu)。
通過(guò)對(duì)實(shí)例數(shù)據(jù)進(jìn)行預(yù)測(cè),對(duì)比傳統(tǒng)單一預(yù)測(cè)模型與該文提出的EEMD-PSO-SVM組合預(yù)測(cè)模型,改進(jìn)模型的MAE、MAPE等統(tǒng)計(jì)誤差指標(biāo)大幅度降低,預(yù)測(cè)精度能更好地滿(mǎn)足工業(yè)和生產(chǎn)需要,具有較強(qiáng)可行性和工程應(yīng)用價(jià)值。