李嘉文,盛德仁,李 蔚
(浙江大學(xué) 能源工程學(xué)院,浙江 杭州310027)
隨著能源的低碳發(fā)展,以風(fēng)電為代表的可再生能源的普及率逐年增高。然而,由于自然界風(fēng)速具有隨機(jī)、不穩(wěn)定等固有特性,風(fēng)電并網(wǎng)將會(huì)給電力系統(tǒng)的安全、穩(wěn)定運(yùn)行造成威脅。為了保障電力系統(tǒng)的經(jīng)濟(jì)可靠運(yùn)行[1],需要對(duì)風(fēng)電場(chǎng)風(fēng)速進(jìn)行準(zhǔn)確、穩(wěn)定的預(yù)測(cè)。
目前,眾多學(xué)者對(duì)于如何提高短期風(fēng)速預(yù)測(cè)精度做了大量工作,所構(gòu)建的預(yù)測(cè)模型主要分為三大類,分別是統(tǒng)計(jì)模型、人工智能模型和混合預(yù)測(cè)模型[2]。統(tǒng)計(jì)模型通常結(jié)構(gòu)較為簡(jiǎn)單、運(yùn)行速度快,如自回歸移動(dòng)平均模型[3]等。這些模型一般在風(fēng)速序列具有顯著線性條件下,具有很好的預(yù)測(cè)效果,但由于實(shí)際風(fēng)速往往表現(xiàn)出較強(qiáng)的非線性特點(diǎn),從而導(dǎo)致統(tǒng)計(jì)模型的預(yù)測(cè)效果不佳。人工智能模型具有較強(qiáng)的非線性特征提取能力[4,5],但是神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、對(duì)參數(shù)選擇敏感、過擬合[6]等問題,限制了預(yù)測(cè)精度的進(jìn)一步提升。為彌補(bǔ)人工智能模型的缺點(diǎn),混合預(yù)測(cè)模型被廣泛應(yīng)用。文獻(xiàn)[7]提出了一種短期風(fēng)電功率預(yù)測(cè)方法,該方法結(jié)合集成經(jīng)驗(yàn)?zāi)B(tài)分解和利用自適應(yīng)布谷鳥算法優(yōu)化支持向量機(jī)。文獻(xiàn)[8]提出了一種改進(jìn)的PSO算法優(yōu)化LSSVM模型,并對(duì)初始預(yù)測(cè)結(jié)果采用馬爾科夫模型進(jìn)行誤差修正。文獻(xiàn)[9]提出一種基于混合模式分解(HMD)和在線序列離群魯棒極限學(xué)習(xí)機(jī)的短期風(fēng)速預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,所提模型可大幅提高預(yù)測(cè)精度。文獻(xiàn)[10]采用變分模態(tài)分解算法對(duì)原始風(fēng)速序列初步分解,利用4個(gè)不同的模型進(jìn)行初步預(yù)測(cè),并開發(fā)了改進(jìn)的Jaya算法對(duì)單個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行權(quán)值組合尋優(yōu),仿真結(jié)果表明,該混合模型獲得了良好的預(yù)測(cè)精度。文獻(xiàn)[11]提出了融合集成經(jīng)驗(yàn)?zāi)B(tài)分解、自適應(yīng)模態(tài)分解和樣本熵的數(shù)據(jù)預(yù)處理策略,利用該策略對(duì)原始序列進(jìn)行平滑處理,提高了模型的泛化能力和穩(wěn)定性。文獻(xiàn)[12]設(shè)計(jì)了一種基于奇異譜分析、經(jīng)驗(yàn)?zāi)B(tài)分解和卷積支持向量機(jī)的風(fēng)速預(yù)測(cè)模型,采用SSA技術(shù)提取數(shù)據(jù)的趨勢(shì)信息,利用EMD方法分解出數(shù)據(jù)的波動(dòng)特征,最后利用CNNSVM對(duì)各風(fēng)速子層進(jìn)行預(yù)測(cè)。結(jié)果發(fā)現(xiàn),該模型可以顯示出更好的預(yù)測(cè)性能。
本文提出一種基于分解去噪和最小二乘支持向量機(jī)的短期風(fēng)速預(yù)測(cè)模型。利用變分模態(tài)分解對(duì)風(fēng)速序列進(jìn)行平滑處理,采用樣本熵計(jì)算分解后每個(gè)子序列的復(fù)雜程度,對(duì)最無(wú)序子序列利用奇異譜分析消除冗余噪聲,最后利用算法優(yōu)化后的LSSVM進(jìn)行預(yù)測(cè)。案例表明,模型具有較好的預(yù)測(cè)效果。
VMD方法[13]采用完全非遞歸的方法尋求變分模型的最優(yōu)解。根據(jù)各分解分量的中心頻率和帶寬,實(shí)現(xiàn)信號(hào)的頻域分解和各分量的有效分離。與EMD族類方法不同,VMD將信號(hào)分解過程轉(zhuǎn)換為變分模式,并尋找約束變分模型的最優(yōu)解。算法的實(shí)施步驟總結(jié)如下:
(2)初始化模態(tài)數(shù)k=1;
(5)模式數(shù)K由EMD算法預(yù)定義,如果k=K;進(jìn)行下一步,否則,設(shè)置k=k+1,重復(fù)步驟(3)和步驟(4),直到k=K;
(7)對(duì)于給定的判別精度e>0,如果式(4)滿足判別精度,停止迭代,否則,重復(fù)步驟(1)到(6);
(8)得到變分模態(tài)分解結(jié)果。
SSA算法[14]是一種獨(dú)特的非參數(shù)方法,它通過對(duì)初始信號(hào)進(jìn)行識(shí)別和細(xì)化,得到重構(gòu)集,可以廣泛應(yīng)用于時(shí)間序列的檢測(cè)。具體過程如下:
(1)嵌入
給定風(fēng)速序列X(t)=(X1,X2,…XN),產(chǎn)生具有L行的軌跡矩陣Yi(t)=(Xi,Xi+1,…Xi+k-1)。
式中,k=N-L+1,Y代表著具有相同元素的漢克爾矩陣(i+j=const)。
(2)奇異值分解(SVD)
對(duì)矩陣XXT做奇異值分解,降序排列λi得到矩陣屬性(λi,Ui,Vi),λi代表第i個(gè)奇異值,Ui和Vi分別代表左右特征向量。軌跡矩陣Y可以進(jìn)一步表示為:
(3)重組
SE值越大表示信號(hào)復(fù)雜度越高,SE值越低表示信號(hào)復(fù)雜度越低,自相似度越高。
灰狼優(yōu)化算法[16](GWO)的靈感來(lái)源于灰狼在自然界中的領(lǐng)導(dǎo)力和狩獵行為。算法認(rèn)為α,β與δ狼為最好的三個(gè)解決方案,它們領(lǐng)導(dǎo)其余狼群找到最優(yōu)全局解。
Mohammad等開發(fā)了改進(jìn)的灰狼優(yōu)化算法(IGWO)[17],將基于維度學(xué)習(xí)的狩獵搜索策略(DLH)引入到傳統(tǒng)算法中,豐富了種群的多樣性,加強(qiáng)了算法全局搜索能力。
對(duì)于給定種群個(gè)體Xi(t)的更新位置,改進(jìn)算法提供了兩個(gè)候選解。候選解一:Xi-GWO(t+1)由傳統(tǒng)算法表述[16]。首先計(jì)算第i次迭代后前三個(gè)最佳的解決方案,其根據(jù)α,β與δ狼的位置由下式更新:
IGWO的偽代碼如算法1所示。
算法1
最小二乘支持向量機(jī)(LSSVM)由SVM發(fā)展而來(lái)。將SVM用于回歸問題,本質(zhì)上是將輸入通過非線性函數(shù)映射到高維特征空間,然后對(duì)高維特征空間進(jìn)行回歸分析。LSSVM[18]將最小二乘線性理論引入支持向量機(jī),代替?zhèn)鹘y(tǒng)的二次規(guī)劃來(lái)解決函數(shù)估計(jì)問題。因此,SVM的不等式約束變?yōu)榈仁郊s束,LSSVM的回歸函數(shù)和目標(biāo)函數(shù)變?yōu)槭剑?2)和式(23)。
上式中φ(x)代表非線性映射函數(shù),w,b,ei代表權(quán)重向量,偏置和誤差量。γ表示為正則化參數(shù)。將上述目標(biāo)函數(shù)轉(zhuǎn)變?yōu)榧s束方程。
綜上,本文提出的混合模型主要步驟如下,預(yù)測(cè)流程如圖1所示。
圖1 預(yù)測(cè)模型流程圖
(1)采用VMD分解技術(shù),將初始風(fēng)速序列分解為多個(gè)IMF分量,減少數(shù)據(jù)的非線性程度。
(2)采用樣本熵衡量各子序列的復(fù)雜程度,對(duì)最無(wú)序子序列進(jìn)行奇異譜分析,去除冗余噪聲,提取主要趨勢(shì)信息。
(3)利用IGWO算法優(yōu)化LSSVM關(guān)鍵參數(shù),對(duì)各子序列進(jìn)行預(yù)測(cè)。
(4)將各子序列預(yù)測(cè)結(jié)果線性相加,得到最終預(yù)測(cè)值。
為了檢驗(yàn)本文混合模型在短期風(fēng)速中的預(yù)測(cè)效果,以華中地區(qū)某風(fēng)電場(chǎng)2019年6月的實(shí)際風(fēng)速數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。實(shí)驗(yàn)數(shù)據(jù)共1000個(gè)樣本點(diǎn),采樣時(shí)間間隔為10min。其中第13至第800個(gè)數(shù)據(jù)為訓(xùn)練集,第801個(gè)至第1000個(gè)數(shù)據(jù)為測(cè)試集。風(fēng)速數(shù)據(jù)如圖2所示。
圖2 原始風(fēng)速序列
采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和決定系數(shù)(R2)作為評(píng)價(jià)指標(biāo)。
式中:yi是實(shí)際值,是預(yù)測(cè)值,N是數(shù)據(jù)的總數(shù)。
原始風(fēng)速數(shù)據(jù)具有明顯的非線性特征,為消除非平穩(wěn)因素對(duì)預(yù)測(cè)效果的影響,對(duì)原始風(fēng)速序列進(jìn)行變分模態(tài)分解。分解過程需預(yù)先設(shè)置分解層數(shù)K,當(dāng)K值較小時(shí),極易產(chǎn)生模態(tài)混疊,當(dāng)K值較大時(shí),會(huì)導(dǎo)致過度分解,產(chǎn)生無(wú)用分量。本文的K值選取由EMD算法預(yù)定義[9],原始風(fēng)速數(shù)據(jù)通過EMD算法分解成8個(gè)分量,故設(shè)定VMD分解層數(shù)K=8。VMD算法分解結(jié)果如圖3所示。
圖3 VMD分解結(jié)果
為進(jìn)一步獲得更高的風(fēng)速分解質(zhì)量,提高預(yù)測(cè)精度,計(jì)算所有分解子序列(IMF)的樣本熵如表1所示。IMF6的樣本熵值最大,說明該序列的無(wú)序性、復(fù)雜度最高,將對(duì)預(yù)測(cè)精度造成較大干擾[19]。利用SSA提取該序列準(zhǔn)周期趨勢(shì)分量,消除冗余信息,降低其無(wú)序程度(見圖4)。
表1 VMD分解子序列樣本熵
圖4 IMF6的主趨勢(shì)和噪聲
共進(jìn)行三次對(duì)比實(shí)驗(yàn),將所建立的組合模型和其他預(yù)測(cè)模型進(jìn)行對(duì)比。第一組實(shí)驗(yàn)比較了采用不同數(shù)據(jù)預(yù)處理技術(shù)時(shí)所提模型與對(duì)比模型的預(yù)測(cè)性能。第二組實(shí)驗(yàn)采用不同的優(yōu)化算法,比較了所提模型和對(duì)比模型的預(yù)測(cè)能力。第三組實(shí)驗(yàn)比較了所提出模型與幾種經(jīng)典個(gè)體模型的預(yù)測(cè)性能。具體實(shí)驗(yàn)結(jié)果由下面的章節(jié)描述。
采用不同的數(shù)據(jù)預(yù)處理技術(shù),驗(yàn)證本文所提出的分解去噪策略的有效性。預(yù)測(cè)結(jié)果如圖5所示。其中分解算法的參數(shù)設(shè)置按經(jīng)驗(yàn)選取[20,21]。由實(shí)驗(yàn)結(jié)果表2可看出,未經(jīng)分解處理的IGWOLSSVM模型預(yù)測(cè)表現(xiàn)最差,MAE、RMSE誤差指標(biāo)均大于基于分解的預(yù)測(cè)模型,這說明分解算法通過降低風(fēng)速序列的非平穩(wěn)性,可以有效提高模型的預(yù)測(cè)能力。FEEMD和CEEMDAN均是基于EEMD算法的改進(jìn),同時(shí)考慮了白噪聲和集合均值的思想,解決了分解過程中混合模態(tài)的問題。
表2 不同數(shù)據(jù)預(yù)處理測(cè)試結(jié)果的比較
圖5 不同數(shù)據(jù)預(yù)處理結(jié)果
通過結(jié)果分析,基于FEEMD和CEEMDAN分解的預(yù)測(cè)模型在三個(gè)評(píng)價(jià)指標(biāo)下數(shù)值相近,由于CEEMDAN克服了FEEMD的部分缺點(diǎn)[22],CEEMDAN-IGWO-LSSVM具有相對(duì)較優(yōu)的預(yù)測(cè)性能。
VMD-IGWO-LSSVM預(yù)測(cè)模型中的VMD算法將初始風(fēng)速分解為不同的頻段,降低了數(shù)據(jù)的復(fù)雜程度,提高了預(yù)測(cè)精度,對(duì)比未經(jīng)分解處理的IGWO-LSSVM模型,三個(gè)指標(biāo)分別下降了0.503、0.704、0.1721。
針對(duì)原始數(shù)據(jù)VMD分解,所產(chǎn)生的最無(wú)序子序列采用奇異譜技術(shù)提取準(zhǔn)周期趨勢(shì)后,VMDSSA-IGWO-LSSVM模型在所有比較模型中表現(xiàn)出最佳的預(yù)測(cè)效果,相較于VMD-IGWO-LSSVM模型,三個(gè)評(píng)價(jià)指標(biāo)均有改進(jìn),驗(yàn)證了本文所提分解去噪策略的有效性。
為了驗(yàn)證IGWO算法的有效性,選取灰狼[16]和哈里斯鷹[23]兩種群智能優(yōu)化算法,這兩種算法已被用于風(fēng)速預(yù)測(cè)領(lǐng)域中的參數(shù)優(yōu)化研究[24,25]。實(shí)驗(yàn)結(jié)果如表3和圖6所示。由表3可知,未經(jīng)參數(shù)尋優(yōu)的VMD-SSA-LSSVM模型預(yù)測(cè)效果最差,LSSVM經(jīng)GWO和HHO算法優(yōu)化后,模型預(yù)測(cè)精度有所上升,與GWO優(yōu)化相比,VMD-SSAHHO-LSSVM提供了更具競(jìng)爭(zhēng)力的預(yù)測(cè)結(jié)果。由于IGWO算法強(qiáng)大的全局尋優(yōu)能力,VMD-SSAIGWO-LSSVM模型提供了最優(yōu)的預(yù)測(cè)表現(xiàn)。相較其余三個(gè)比較模型,MAE、RMSE誤差指標(biāo)平均下降了0.012、0.016。
表3 不同優(yōu)化算法測(cè)試結(jié)果的比較
圖6 不同優(yōu)化算法對(duì)比
本實(shí)驗(yàn)將本文提出的混合模型和經(jīng)典個(gè)體模型進(jìn)行對(duì)比研究。各模型預(yù)測(cè)誤差如圖7所示,實(shí)驗(yàn)結(jié)果如表4所示。Persistence模型提供了最差的預(yù)測(cè)性能,其作為基準(zhǔn)模型,證實(shí)了其余模型的預(yù)測(cè)有效性。BP神經(jīng)網(wǎng)絡(luò)作為經(jīng)典的非線性預(yù)測(cè)器相較線性預(yù)測(cè)器ARIMA在MAE誤差指標(biāo)上改進(jìn)幅度最大,下降了0.03。本文所提混合模型相較ARIMA和BP,三個(gè)指標(biāo)MAE、RMSE、R2平均下降了0.555、0.785、0.199。這說明,混合模型的預(yù)測(cè)結(jié)果與其他個(gè)體模型的預(yù)測(cè)結(jié)果有一定差異,先進(jìn)的混合模型在短期風(fēng)速預(yù)測(cè)方面優(yōu)于經(jīng)典個(gè)體模型。為增加實(shí)驗(yàn)對(duì)比性,采用數(shù)據(jù)分解去噪技術(shù),并利用IGWO優(yōu)化ENN模型,結(jié)果表明,ENN混合模型在三個(gè)指標(biāo)上均劣于本文所提LSSVM混合模型。VMD-SSA-IGWO-LSSVM模型在所有對(duì)比模型中取得了最佳的預(yù)測(cè)效果。
表4 經(jīng)典模型測(cè)試結(jié)果的比較
圖7 預(yù)測(cè)誤差
灰色關(guān)聯(lián)分析(GRD)和穩(wěn)定性測(cè)試(VAR)是常用的統(tǒng)計(jì)分析指標(biāo)[25]。灰色關(guān)聯(lián)分析是評(píng)價(jià)預(yù)測(cè)模型性能的一種有效方法,用來(lái)判別兩個(gè)因素同步變化程度的高低,數(shù)值越高,模型的預(yù)測(cè)性能越好。利用預(yù)測(cè)誤差的方差作為比較預(yù)測(cè)穩(wěn)定性的指標(biāo),該值越小,說明模型的預(yù)測(cè)穩(wěn)定性越好。取前三組實(shí)驗(yàn)中,除本文所提模型外預(yù)測(cè)精度最好的模型,作為比較模型進(jìn)行對(duì)比分析,結(jié)果如表5所示,所提模型可以提供較高的預(yù)測(cè)精度和穩(wěn)定性。
表5 統(tǒng)計(jì)分析結(jié)果
提出了一種分解去噪和IGWO優(yōu)化LSSVM的混合短期風(fēng)速預(yù)測(cè)模型,算例證明混合模型具有良好的預(yù)測(cè)性能。
(1)風(fēng)速數(shù)據(jù)具有隨機(jī)性和波動(dòng)性,利用變分模態(tài)分解,降低數(shù)據(jù)復(fù)雜程度,可有效提高預(yù)測(cè)精度。
(2)對(duì)最無(wú)序子序列進(jìn)行奇異譜分解,提取主要趨勢(shì)分量,降低冗余信息干擾。
(3)采用先進(jìn)群智能進(jìn)化算法IGWO尋優(yōu)LSSVM關(guān)鍵參數(shù),提升預(yù)測(cè)性能。
(4)利用評(píng)價(jià)指標(biāo)和統(tǒng)計(jì)指標(biāo)對(duì)模型預(yù)測(cè)性能進(jìn)行評(píng)估,結(jié)果表明,所提出的混合模型具有最強(qiáng)的預(yù)測(cè)能力。