李振海,李鈺炎,易志高,蘇盛
(1.大唐華銀(湖南)新能源有限公司,湖南 長(zhǎng)沙 422000;2.智能電網(wǎng)運(yùn)行與控制湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410114; 3.長(zhǎng)沙理工大學(xué),湖南 長(zhǎng)沙 410114)
近年來(lái),隨著全球經(jīng)濟(jì)的蓬勃發(fā)展和人民生活水平的提升,人們對(duì)電力生產(chǎn)的需求不斷增加。然而,傳統(tǒng)的電力生產(chǎn)方式主要依賴(lài)于提取的化石燃料,如煤炭、石油和天然氣等,帶來(lái)了全球變暖等環(huán)境問(wèn)題。此外,因化石燃料的有限性和不可再生性,過(guò)度開(kāi)采可能導(dǎo)致能源資源的枯竭。因此,尋找清潔替代品已成為當(dāng)務(wù)之急。其中,風(fēng)能作為一種重要而有價(jià)值的資源,具備可持續(xù)生產(chǎn)的潛力。與傳統(tǒng)發(fā)電方式相比,風(fēng)力發(fā)電具有諸多優(yōu)勢(shì)[1-2]。全球范圍內(nèi)對(duì)風(fēng)力發(fā)電的關(guān)注不斷增加,人們認(rèn)識(shí)到其潛力和可持續(xù)性。為了更好地利用風(fēng)能資源,不斷改進(jìn)和創(chuàng)新風(fēng)力發(fā)電技術(shù)變得至關(guān)重要。各國(guó)紛紛投入資金和資源,加強(qiáng)風(fēng)力發(fā)電技術(shù)的研發(fā)和應(yīng)用,以推動(dòng)清潔能源的轉(zhuǎn)型和可持續(xù)發(fā)展。
風(fēng)力發(fā)電是受風(fēng)力影響較大的能源形式,而風(fēng)具有強(qiáng)烈的隨機(jī)性、波動(dòng)性和間歇性的特性,這給風(fēng)力發(fā)電接入電網(wǎng)帶來(lái)了挑戰(zhàn)[3]。由于風(fēng)力的不可控性,風(fēng)力發(fā)電機(jī)組的輸出功率會(huì)不斷變化,這對(duì)電網(wǎng)的穩(wěn)定性和平衡性造成了較大的沖擊[4]。準(zhǔn)確的風(fēng)電預(yù)測(cè)可以幫助電力公司和調(diào)度員預(yù)測(cè)未來(lái)的風(fēng)力功率,從而優(yōu)化電力系統(tǒng)的運(yùn)行,確保電力供需平衡。準(zhǔn)確的預(yù)測(cè)結(jié)果還有利于制定合理的發(fā)電計(jì)劃、電力輸送和儲(chǔ)存策略,提高電力系統(tǒng)的效率和穩(wěn)定性[5-6]。
大部分風(fēng)電功率預(yù)測(cè)是利用歷史輸出和數(shù)值天氣預(yù)報(bào)數(shù)據(jù),運(yùn)用學(xué)習(xí)方法進(jìn)行可靠的短期和長(zhǎng)期預(yù)測(cè)。近年來(lái)風(fēng)電功率預(yù)測(cè)所屬的時(shí)間序列預(yù)測(cè)問(wèn)題在方法上有了很大的進(jìn)步,早期的研究集中在線(xiàn)性統(tǒng)計(jì)模型。其中,李麗等人[7]使用平均滑動(dòng)方法對(duì)經(jīng)小波變換分解出的低頻和高頻功率成分進(jìn)行重構(gòu),LIU等人[8]采用差分整合移動(dòng)平均自回歸模型對(duì)非線(xiàn)性數(shù)據(jù)進(jìn)行平穩(wěn)化。然而,這些方法在構(gòu)造高度非線(xiàn)性數(shù)據(jù)的最佳結(jié)構(gòu)參數(shù)方面存在一定困難。隨著特征變量的可用性增加,越來(lái)越多的人開(kāi)始使用機(jī)器學(xué)習(xí)模型,如隨機(jī)森林[9]、支持向量機(jī)[10]和極端梯度增強(qiáng)[11],這些模型因在特征處理方面的有效性而受到歡迎。深度學(xué)習(xí)模型具有更強(qiáng)大的學(xué)習(xí)能力和表達(dá)能力,能夠?qū)W習(xí)到更復(fù)雜的模式和抽象概念。WANG等人[12]通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解將原始數(shù)據(jù)分解成不同頻率信號(hào),并使用神經(jīng)網(wǎng)絡(luò)對(duì)每個(gè)頻率特征進(jìn)行綜合,得到最終的功率曲線(xiàn)。HARBOLA等人[13]則提出了兩個(gè)一維卷積神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)時(shí)間風(fēng)電數(shù)據(jù)集中的主導(dǎo)風(fēng)速和風(fēng)向。此外,HAN等人[14]在長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short term memory,LSTM)的記憶單元中引入了一個(gè)參數(shù),用于抑制長(zhǎng)期記憶中的隨機(jī)成分,從而增強(qiáng)對(duì)風(fēng)電實(shí)際模式的學(xué)習(xí),并避免過(guò)度擬合。近年來(lái),組合模型在風(fēng)電功率預(yù)測(cè)中變得熱門(mén),不同算法的特點(diǎn)被結(jié)合利用,提高了預(yù)測(cè)模型的魯棒性。張紅濤等人[15]采用模糊聚類(lèi)分析篩選出與預(yù)測(cè)日相關(guān)性較大的歷史相似日,并建立樽海鞘群算法優(yōu)化極限學(xué)習(xí)機(jī)的超短期風(fēng)功率預(yù)測(cè)模型。劉大貴等人[16]利用熵值法對(duì)單一預(yù)測(cè)模型進(jìn)行權(quán)重組合預(yù)測(cè),再借鑒馬爾科夫鏈方法對(duì)熵值法組合預(yù)測(cè)結(jié)果進(jìn)行修正,得出未來(lái)一年的可用電量預(yù)測(cè)值。
LSTM在處理時(shí)間序列預(yù)測(cè)問(wèn)題上具有明顯的優(yōu)勢(shì),并且可以通過(guò)結(jié)合其他模型來(lái)改善預(yù)測(cè)效果。本論文旨在構(gòu)建一種組合模型,結(jié)合LSTM和輕梯度增強(qiáng)機(jī)(light gradient boosting machine,LGBM)模型,用于對(duì)風(fēng)電功率進(jìn)行多步預(yù)測(cè)。同時(shí),采用網(wǎng)格搜索法對(duì)各模型的參數(shù)進(jìn)行優(yōu)化,以最大程度地提升預(yù)測(cè)精度。
風(fēng)電場(chǎng)數(shù)據(jù)集的詳細(xì)信息包括風(fēng)電功率輸出的分布及一般數(shù)據(jù)特征,如風(fēng)速、風(fēng)向、氣溫、氣壓、濕度等數(shù)據(jù),數(shù)據(jù)維度高,特征波動(dòng)性強(qiáng)。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)和LSTM已被廣泛應(yīng)用于時(shí)間序列建模??梢越柚鶯STM算法的特征提取能力對(duì)輸入數(shù)據(jù)進(jìn)行特征提取,然后將提取的特征輸入到LGBM以建立新的組合預(yù)測(cè)模型。
LSTM是RNN的變體,具有強(qiáng)大的記憶和建模能力,特別適用于處理長(zhǎng)序列數(shù)據(jù)和捕捉序列中的長(zhǎng)期依賴(lài)關(guān)系。能夠在時(shí)間序列數(shù)據(jù)中增量地處理給定的信息,同時(shí)根據(jù)過(guò)去的信息完善正在處理的內(nèi)容[17-19],并在接收到新信息時(shí)不斷更新?tīng)顟B(tài),建立層內(nèi)之間的權(quán)重聯(lián)系。
LSTM的基本單元是一個(gè)帶有門(mén)控機(jī)制的循環(huán)單元,由一個(gè)細(xì)胞狀態(tài)(cell state)和三個(gè)門(mén)組成:遺忘門(mén)(forget gate)、輸入門(mén)(input gate)和輸出門(mén)(output gate)。這些門(mén)的目的是控制信息的流動(dòng)和更新,從而有效地處理序列數(shù)據(jù)。圖1為基本的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)。具體功能如下:
ft=σ(Wf(ht-1,xt)+bf)
(1)
遺忘門(mén)決定了在當(dāng)前時(shí)間步是否忘記之前的細(xì)胞狀態(tài)中的信息,根據(jù)當(dāng)前時(shí)間步的輸入和前一個(gè)時(shí)間步的隱藏狀態(tài)來(lái)生成一個(gè)介于0和1之間的遺忘向量,用于對(duì)細(xì)胞狀態(tài)進(jìn)行元素級(jí)別的遺忘操作。
it=σ(Wi(ht-1,xt)+bi)
(2)
(3)
輸入門(mén)決定了當(dāng)前時(shí)間步的輸入中哪些信息將被添加到細(xì)胞狀態(tài)中,由當(dāng)前時(shí)間步的輸入和前一個(gè)時(shí)間步的隱藏狀態(tài)共同決定。輸入門(mén)生成一個(gè)介于0和1之間的輸入向量,用于對(duì)當(dāng)前時(shí)間步的輸入進(jìn)行元素級(jí)別的篩選和更新[20]。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
(4)
ot=σ(Wo(ht-1,xt)+bo)
(5)
ht=ottanhCt
(6)
輸出門(mén)決定了在當(dāng)前時(shí)間步將細(xì)胞狀態(tài)中的哪些信息輸出到隱藏狀態(tài)中。輸出門(mén)由當(dāng)前時(shí)間步的輸入和前一個(gè)時(shí)間步的隱藏狀態(tài)共同決定。輸出門(mén)生成一個(gè)介于0和1之間的輸出向量,用于對(duì)細(xì)胞狀態(tài)進(jìn)行元素級(jí)別的篩選和輸出。
LGBM是一種高效的梯度提升決策樹(shù)框架,專(zhuān)注于處理大規(guī)模數(shù)據(jù)和高維特征,以提供快速的訓(xùn)練和高質(zhì)量的預(yù)測(cè)。LGBM采用基于梯度的學(xué)習(xí)算法,通過(guò)迭代地訓(xùn)練多個(gè)決策樹(shù)模型來(lái)不斷提升預(yù)測(cè)的準(zhǔn)確性。相較于傳統(tǒng)的梯度提升決策樹(shù)算法,LGBM引入互斥特征捆綁和直方圖算法,以加快訓(xùn)練速度和降低內(nèi)存消耗。LGBM還具有良好的可擴(kuò)展性和并行化能力,能夠利用多核處理器和分布式計(jì)算資源進(jìn)行高效訓(xùn)練和預(yù)測(cè)。此外,LGBM提供了豐富的參數(shù)調(diào)整選項(xiàng),使用戶(hù)可以根據(jù)不同的數(shù)據(jù)集和問(wèn)題進(jìn)行靈活配置,以獲得最佳的預(yù)測(cè)性能。
互斥特征捆綁用于處理高維稀疏特征[21]。在傳統(tǒng)的梯度提升決策樹(shù)算法中,每個(gè)特征都被視為一個(gè)獨(dú)立的特征列,會(huì)占用大量的內(nèi)存和計(jì)算資源。而互斥特征捆綁將相關(guān)性較高的特征進(jìn)行捆綁,形成一個(gè)新的特征列,從而減少特征的數(shù)量,提高計(jì)算效率。這種捆綁技術(shù)基于特征之間的互斥性,即同一樣本中只能選擇一個(gè)特征進(jìn)行使用。通過(guò)互斥特征捆綁,LGBM能夠更有效地處理高維稀疏特征,提升模型訓(xùn)練和預(yù)測(cè)的速度。
直方圖算法是LGBM用于構(gòu)建決策樹(shù)的一種優(yōu)化技術(shù)。傳統(tǒng)的梯度提升決策樹(shù)算法通常需要對(duì)特征進(jìn)行排序,以便在每個(gè)節(jié)點(diǎn)上選擇最佳的切分點(diǎn)[22]。這個(gè)排序操作在高維數(shù)據(jù)上的計(jì)算成本很高,而直方圖算法將特征進(jìn)行離散化處理,并構(gòu)建直方圖來(lái)近似表示特征的分布情況,具體功能如圖2所示。通過(guò)對(duì)直方圖進(jìn)行更新和搜索,LGBM可以快速選擇最佳的切分點(diǎn),從而減少排序操作的開(kāi)銷(xiāo)[23-24],大大加快了模型的訓(xùn)練速度。
圖2 直方圖累計(jì)算法的過(guò)程
在風(fēng)電功率預(yù)測(cè)任務(wù)中,除了風(fēng)電功率,數(shù)據(jù)集中還包含了其他相關(guān)參量。不同的特征對(duì)于預(yù)測(cè)模型的影響程度可能不同,因此需要對(duì)特征進(jìn)行篩選,保留那些與預(yù)測(cè)目標(biāo)密切相關(guān)的特征,同時(shí)剔除與目標(biāo)關(guān)聯(lián)性較低的特征,以提高預(yù)測(cè)模型的準(zhǔn)確度。本文利用Pearson相關(guān)系數(shù)來(lái)評(píng)估特征與風(fēng)電功率之間的關(guān)聯(lián)程度。具體計(jì)算公式為:
(7)
式中:Cov為協(xié)方差;σ為標(biāo)準(zhǔn)差。數(shù)據(jù)間的相關(guān)程度由K的絕對(duì)值反映,絕對(duì)值越大表示數(shù)據(jù)X與Y間的相關(guān)程度越高[25-26]。
根據(jù)表1中的結(jié)果,風(fēng)速、風(fēng)向和氣溫與風(fēng)電功率之間存在較強(qiáng)的相關(guān)性,而其他特征的相關(guān)性較小,因此選擇將風(fēng)速、風(fēng)向和氣溫作為氣象數(shù)據(jù)的重要特征。
表1 特征變量皮爾遜相關(guān)系數(shù)表
標(biāo)準(zhǔn)化可以消除不同特征之間的量綱差異,使得數(shù)據(jù)在同一尺度上進(jìn)行比較和分析。標(biāo)準(zhǔn)化可以使得數(shù)據(jù)的分布更接近于標(biāo)準(zhǔn)正態(tài)分布,有利于一些機(jī)器學(xué)習(xí)算法的收斂速度和穩(wěn)定性,尤其是對(duì)于使用基于梯度的優(yōu)化算法(如梯度下降)的模型。具體如下:
(8)
式中:Xi為標(biāo)準(zhǔn)化處理后的數(shù)據(jù);X為原始數(shù)據(jù);μ、D分別對(duì)應(yīng)原始數(shù)據(jù)集上的均值和方差。
通過(guò)堆疊多個(gè)LSTM可以提取時(shí)間序列數(shù)據(jù)中的多層次抽象特征。每個(gè)LSTM層的輸出可以作為下一層的輸入,從而逐漸提取出更高級(jí)別的特征表示。最后一層LSTM的輸出可以被用作時(shí)間序列數(shù)據(jù)的最終特征表示。具體功能如圖3所示。每一個(gè)LSTM輸入形式為樣本、時(shí)間步長(zhǎng)、特征,按時(shí)間依次記錄每個(gè)時(shí)間點(diǎn)上的信息,實(shí)現(xiàn)時(shí)間維度上的特征提取,并只將最后一個(gè)時(shí)間點(diǎn)上的隱藏信息ht輸出給下一層網(wǎng)絡(luò),完成風(fēng)電功率預(yù)測(cè)任務(wù)。
圖3 LSTM工作原理
將從LSTM中提取的特征輸入另一個(gè)機(jī)器學(xué)習(xí)模型中的方法,例如隨機(jī)森林和LGBM,以利用這些模型的優(yōu)點(diǎn)并提高預(yù)測(cè)性能。特別地,選擇以L(fǎng)GBM作為代表性的機(jī)器學(xué)習(xí)模型,并使用原始輸入特征及從LSTM中提取的特征來(lái)訓(xùn)練LGBM模型。整體模型架構(gòu)如圖4所示。首先從輸入數(shù)據(jù)中提取特征信息,這些特征由LSTM模型自動(dòng)學(xué)習(xí)并捕捉到時(shí)序上的模式和關(guān)聯(lián)。然后將這些平坦的特征輸出傳遞給LGBM模型。通過(guò)使用LGBM模型替代全連接層,可以避免因數(shù)據(jù)數(shù)量或質(zhì)量的限制而陷入局部最優(yōu)解。這種特征提取的方法為L(zhǎng)GBM模型提供了更強(qiáng)的表達(dá)能力,從而提高了預(yù)測(cè)性能。
圖4 LSTM-LGBM整體結(jié)構(gòu)
為了驗(yàn)證論文所提模型在風(fēng)電功率預(yù)測(cè)上的科學(xué)性和可靠性,選取某風(fēng)電場(chǎng)2020年10月1日至2021年2月15日共32 000多條風(fēng)電負(fù)荷產(chǎn)出作為原始數(shù)據(jù)進(jìn)行實(shí)驗(yàn),數(shù)據(jù)集包括對(duì)應(yīng)時(shí)間風(fēng)電功率和天氣特征,如溫度、氣壓、濕度、風(fēng)速等,采樣間隔為1 h。訓(xùn)練集和測(cè)試集數(shù)據(jù)比例為4∶1,并且按照時(shí)序劃分。
預(yù)測(cè)模型的準(zhǔn)確度和性能主要通過(guò)評(píng)估預(yù)測(cè)值與真實(shí)值之間的誤差來(lái)衡量。常用的評(píng)估指標(biāo)包括均方根誤差(root mean squared error,RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)和R平方(R-squared,R2)。RMSE用于度量預(yù)測(cè)值與真實(shí)值之間的偏差,其值越大表示預(yù)測(cè)誤差越大;MAE表示預(yù)測(cè)值誤差的平均絕對(duì)值;MAPE表示平均預(yù)測(cè)誤差與真實(shí)值之間的百分比差異;R2用于衡量因變量方差的百分比可以由模型解釋的程度。這些指標(biāo)的計(jì)算公式如下所示:
(9)
(10)
(11)
(12)
此外,模型的收斂速度也被視為一個(gè)重要的評(píng)價(jià)依據(jù)。快速的收斂速度意味著模型在相對(duì)較少的訓(xùn)練迭代次數(shù)內(nèi)能夠達(dá)到較好的擬合效果。這對(duì)實(shí)際應(yīng)用中的大規(guī)模數(shù)據(jù)集和實(shí)時(shí)預(yù)測(cè)任務(wù)非常重要,因?yàn)榭焖偈諗康哪P湍軌蚋斓赝瓿捎?xùn)練,從而減少計(jì)算資源和時(shí)間的消耗。
3.3.1模型超參數(shù)設(shè)置
在風(fēng)電數(shù)據(jù)集中,采用皮爾遜相關(guān)系數(shù)提取風(fēng)速、風(fēng)向和氣溫作為風(fēng)電多步功率預(yù)測(cè)的主要特征。首先,將數(shù)據(jù)集輸入到LSTM網(wǎng)絡(luò)中提取時(shí)序特征,然后將這些特征傳遞給LGBM模型進(jìn)行預(yù)測(cè)。此外,為了進(jìn)行全面的性能比較,研究選取3種基礎(chǔ)模型,分別是LSTM、LGBM和額外樹(shù)回歸(extra trees,ET)。為了降低機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中的隨機(jī)性影響,實(shí)驗(yàn)中采用隨機(jī)種子和隨機(jī)狀態(tài)值。針對(duì)所有預(yù)測(cè)模型進(jìn)行廣泛的超參數(shù)調(diào)優(yōu),而對(duì)于其他基礎(chǔ)模型,采用網(wǎng)格搜索的方法來(lái)確定最佳的參數(shù)組合。通過(guò)這樣的精細(xì)調(diào)整,優(yōu)化模型的性能和預(yù)測(cè)準(zhǔn)確度。最終,每個(gè)模型使用的超參數(shù)集合在表2和表3中展示,而超參數(shù)調(diào)優(yōu)實(shí)驗(yàn)的搜索結(jié)果見(jiàn)表4。這些實(shí)驗(yàn)和調(diào)優(yōu)過(guò)程,旨在提高預(yù)測(cè)模型的性能和準(zhǔn)確度。
表2 神經(jīng)網(wǎng)絡(luò)模型參數(shù)尋優(yōu)
表3 LGBM參數(shù)尋優(yōu)
表4 實(shí)驗(yàn)所采用模型超參數(shù)設(shè)置
3.3.2預(yù)測(cè)方法
風(fēng)電功率數(shù)據(jù)存在時(shí)間上的關(guān)聯(lián)性,可通過(guò)已有的時(shí)間序列數(shù)據(jù)訓(xùn)練模型進(jìn)而對(duì)下一時(shí)刻的風(fēng)電功率進(jìn)行多步預(yù)測(cè),多步預(yù)測(cè)可以采用滑動(dòng)窗口記錄時(shí)間信息,具體如圖5所示。使用滑動(dòng)窗口進(jìn)行時(shí)間序列預(yù)測(cè)是通過(guò)將時(shí)間序列數(shù)據(jù)分割為固定大小的窗口,提取特征、處理數(shù)據(jù)非平穩(wěn)性、建立序列模型,并實(shí)現(xiàn)對(duì)未來(lái)時(shí)間步的預(yù)測(cè)能力,從而使模型能夠更準(zhǔn)確地預(yù)測(cè)時(shí)間序列數(shù)據(jù)的趨勢(shì)和變化。在預(yù)測(cè)過(guò)程中,首先利用歷史數(shù)據(jù)對(duì)當(dāng)前時(shí)刻進(jìn)行預(yù)測(cè),通過(guò)采用固定窗口長(zhǎng)度為L(zhǎng)的特征量作為模型輸入,得到當(dāng)前時(shí)刻的功率預(yù)測(cè)值,然后將該預(yù)測(cè)值作為下一時(shí)刻功率預(yù)測(cè)的輸入。這種方法可以更準(zhǔn)確地捕捉時(shí)間序列數(shù)據(jù)的趨勢(shì)和變化,實(shí)現(xiàn)多步預(yù)測(cè)的功能。
圖5 滑動(dòng)窗原理
3.3.3模型組合
對(duì)于預(yù)測(cè)目標(biāo),選擇篩選后的特征作為模型輸入數(shù)量(為k),即輸入矩陣為x=(x1,…,xk);使用n種模型進(jìn)行預(yù)測(cè),對(duì)應(yīng)輸出矩陣為y=(y1,…,yn),關(guān)聯(lián)系數(shù)矩陣為w=(w1,…,wn);關(guān)聯(lián)系數(shù)w的值介于[0,1],則對(duì)應(yīng)組合模型的預(yù)測(cè)輸出矩陣為每組模型的預(yù)測(cè)值和對(duì)應(yīng)的關(guān)聯(lián)系數(shù)相乘,具體為:
(13)
以相關(guān)誤差達(dá)到最小值為目標(biāo)函數(shù),確定最佳關(guān)聯(lián)系數(shù)矩陣,尋優(yōu)公式表示為:
(14)
為驗(yàn)證論文中提出的風(fēng)電功率短期預(yù)測(cè)模型(LSTM-LGBM)的有效性,將LSTM-LGBM模型與其他單一模型(LSTM、LGBM、ET)進(jìn)行比較,并在相同的風(fēng)電功率數(shù)據(jù)上進(jìn)行訓(xùn)練和預(yù)測(cè)分析。各模型參數(shù)設(shè)置為網(wǎng)格搜索法中定義的最優(yōu)參數(shù),固定時(shí)間窗口步長(zhǎng)為8,規(guī)定訓(xùn)練集上的均方根誤差小于0.015時(shí)模型達(dá)到收斂狀態(tài)。表5列出了各模型的誤差評(píng)價(jià)指標(biāo)及模型收斂所需的迭代次數(shù),圖6展示了相應(yīng)的功率預(yù)測(cè)對(duì)比曲線(xiàn)。
表5 不同模型評(píng)價(jià)指標(biāo)及迭代次數(shù)
圖6 不同模型預(yù)測(cè)曲線(xiàn)對(duì)比
由表5可知,LGBM模型達(dá)到收斂狀態(tài)所需的迭代次數(shù)最少。得益于直方圖的分箱方法、互斥特征捆綁技術(shù)和梯度提升的機(jī)制,對(duì)比同為基于決策樹(shù)的ET算法,LGBM模型的收斂速度更快、預(yù)測(cè)性能更好。LSTM模型在處理序列模型時(shí),由于遞歸的性質(zhì),需要更多的計(jì)算資源和時(shí)間。但是捕捉時(shí)序特征的能力較強(qiáng),將第二個(gè)隱藏層上最后一個(gè)時(shí)間步上的64個(gè)隱藏狀態(tài)作為L(zhǎng)GBM模型的輸入特征,體現(xiàn)出LSTM對(duì)時(shí)序特征的敏感性和LGBM對(duì)高維數(shù)據(jù)的擬合能力。與單獨(dú)使用LGBM模型相比,組合模型顯著降低了RMSE指標(biāo),降幅達(dá)到了22.43%。與單獨(dú)使用LSTM模型相比,組合模型在RMSE、MAE、MAPE和R2數(shù)值上的提升分別為33.07%、42.08%、30.9%和3.1%,同時(shí)在一定程度上獲得更高的訓(xùn)練效率。圖6直觀(guān)地表現(xiàn)了各模型對(duì)功率的擬合能力,本文模型的預(yù)測(cè)值與真實(shí)值基本吻合。LSTM模型可以為L(zhǎng)GBM提供更有信息量的特征表示,從而讓LGBM能夠更準(zhǔn)確地進(jìn)行預(yù)測(cè)。這種組合模型在預(yù)測(cè)功率數(shù)值和趨勢(shì)方面都表現(xiàn)得更加準(zhǔn)確??紤]到風(fēng)機(jī)功率受環(huán)境影響較大,表現(xiàn)出波動(dòng)性和隨機(jī)性的特點(diǎn)。為了評(píng)估模型在不同的風(fēng)電功率變化場(chǎng)景下的預(yù)測(cè)效果,選擇兩個(gè)不同場(chǎng)景的風(fēng)電功率預(yù)測(cè)結(jié)果進(jìn)行展示,分別如圖7和圖8所示。
圖8 風(fēng)機(jī)功率波動(dòng)區(qū)段圖
在風(fēng)電功率趨于平穩(wěn)的區(qū)段,LGBM模型相比LSTM和ET模型展現(xiàn)出更好的預(yù)測(cè)能力。LGBM模型能夠準(zhǔn)確捕捉到風(fēng)電出力的趨勢(shì),并且具有較小的波動(dòng)性。同時(shí),結(jié)合LSTM和LGBM的組合模型在此基礎(chǔ)上實(shí)現(xiàn)了更為精確的預(yù)測(cè)曲線(xiàn),說(shuō)明本文模型對(duì)于穩(wěn)定狀態(tài)下的風(fēng)電功率具有較好的預(yù)測(cè)能力,能夠提供可靠的趨勢(shì)預(yù)測(cè)信息。在風(fēng)電功率波動(dòng)較大的區(qū)段,4個(gè)模型都能夠預(yù)測(cè)出一定規(guī)律的波動(dòng)。然而ET模型和LSTM模型在波動(dòng)規(guī)律上與真實(shí)值存在較大的偏差,并且存在一定的滯后性。相比之下,LGBM模型在這個(gè)場(chǎng)景中表現(xiàn)良好,預(yù)測(cè)曲線(xiàn)的趨勢(shì)與真實(shí)值基本一致,但仍然存在一定的偏置。值得注意的是,通過(guò)LSTM模型提取特征后的LGBM模型展現(xiàn)出更好的預(yù)測(cè)性能,無(wú)論是在趨勢(shì)還是數(shù)值上都與真實(shí)值基本吻合。
風(fēng)機(jī)出力受到風(fēng)速、風(fēng)向、氣象條件等多種因素的影響,與特征之間高度的非線(xiàn)性關(guān)系加大了風(fēng)電功率短期預(yù)測(cè)的難度。提取特征的意義在于從原始的風(fēng)機(jī)出力數(shù)據(jù)中提取出具有代表性和有意義的特征,用于建立預(yù)測(cè)模型和進(jìn)行分析。為進(jìn)一步提升風(fēng)電功率的預(yù)測(cè)精度,提出一種LSTM-LGBM的風(fēng)電功率短期預(yù)測(cè)方法,利用LSTM網(wǎng)絡(luò)對(duì)時(shí)間的敏感性提取出原始數(shù)據(jù)中的時(shí)序特征,通過(guò)LGBM模型迭代訓(xùn)練多個(gè)決策樹(shù)來(lái)進(jìn)行集成學(xué)習(xí),并設(shè)置了不同的超參數(shù),以選擇最優(yōu)的預(yù)測(cè)效果。驗(yàn)證結(jié)果表明該方法具有較好的預(yù)測(cè)性能和有效性。具體結(jié)論如下:
1)通過(guò)與其他單一預(yù)測(cè)模型進(jìn)行比較,本文提出的組合模型展現(xiàn)了更小的預(yù)測(cè)誤差,具有更高的預(yù)測(cè)精度和預(yù)測(cè)性能。
2)通過(guò)將LSTM和LGBM結(jié)合在一起,模型能夠充分利用LSTM提取的時(shí)序特征和LGBM模型的強(qiáng)大擬合能力。LSTM提供了對(duì)過(guò)去觀(guān)測(cè)值的建模,捕捉了風(fēng)電功率的長(zhǎng)期趨勢(shì)和周期性,而LGBM通過(guò)對(duì)LSTM提取的隱藏狀態(tài)的建模,進(jìn)一步改善了預(yù)測(cè)性能,提高了對(duì)未來(lái)風(fēng)電功率的準(zhǔn)確預(yù)測(cè)能力。
3)LSTM-LGBM模型在不同的風(fēng)電功率變化趨勢(shì)上都具有良好的擬合能力,對(duì)數(shù)據(jù)的解釋能力較強(qiáng),并且這種集成學(xué)習(xí)方式能夠提高模型的魯棒性和泛化能力,使得模型能夠更好地適應(yīng)不同的風(fēng)電功率預(yù)測(cè)任務(wù)。
模擬出力風(fēng)機(jī)功率預(yù)測(cè)任務(wù)中,還有一些待完善的方面,可以考慮引入天氣數(shù)據(jù)、季節(jié)性特征、時(shí)間相關(guān)特征等,以更好地捕捉風(fēng)機(jī)功率與環(huán)境因素之間的關(guān)系。可以嘗試使用可解釋性強(qiáng)的模型或方法,如SHAP值、特征重要性分析等,來(lái)解釋模型預(yù)測(cè)結(jié)果,并對(duì)預(yù)測(cè)結(jié)果進(jìn)行可解釋性的評(píng)估和解釋。