摘" 要: 精準的風功率預測對電網調度具有重大意義,針對現(xiàn)有預測方法中數(shù)據(jù)特征提取不充分、輸入序列過長時產生梯度消失和預測精度低的問題,提出一種基于改進時空圖卷積(STGCN)與神經基擴展分析(N?BEATS)模型的組合預測模型,該方法通過充分提取數(shù)據(jù)時空特征來提高預測精度。首先,利用STGCN對多元輸入序列進行深度特征提取,充分挖掘風機SCADA數(shù)據(jù)中的時空潛在關系;同時,為了進一步提高預測精度,通過構建序列分解模塊與多分辨率卷積對STGCN模型進行改進,使其能夠更好地適應風電數(shù)據(jù)的復雜特性;然后,神經基擴展分析(N?BEATS)新型神經網絡對STGCN提取的時空信息數(shù)據(jù)進行時序關系分析,得到最終預測結果;最后,以內蒙古某風場SCADA數(shù)據(jù)為例,通過多模型對比實驗與自身消融實驗驗證了所提組合模型策略的有效性以及對STGCN的改進效果。實驗結果表明,所設計模型在預測精度上取得了顯著的提升,為風電功率預測領域的研究提供了新的思路和方法。
關鍵詞: 超短期風功率預測; 時空圖卷積; 神經基擴展分析; 序列分解; 深度特征提??; 圖卷積網絡
中圖分類號: TN919?34; TM614" " " " " " " " " "文獻標識碼: A" " " " " " " " " " "文章編號: 1004?373X(2025)08?0115?07
Wind power ultra?short?term prediction based on improved STGCN with N?BEATS
CHENG Xuchu, LIU Jingxia, KANG Rongkai
(School of Automation and Electrical Engineering, Inner Mongolia University of Science and Technology, Baotou 014010, China)
Abstract: Accurate wind power forecasting is of great significance for grid dispatching. In order to solve the problems of insufficient data feature extraction, gradient vanishing when the input sequence is too long, and low prediction accuracy in the existing prediction methods, a combined prediction model based on improved spatio?temporal graph convolution network (STGCN) and neural basis expansion analysis for interpretable time series (N?BEATS) model is proposed, which can improve the prediction accuracy by fully extracting the spatio?temporal feature of the data. The STGCN is used to conduct the deep feature extraction of multivariate input sequences, so as to fully exploit potential spatial?temporal relationships in the SCADA data of wind turbines. In order to further improve the prediction accuracy, the STGCN model is improved by constructing a sequence decomposition module and multi?resolution convolution, so as to make it better adapt to the complex characteristics of wind power data. The N?BEATS new neural network is used to analyze the temporal series relationship of the spatio?temporal information data extracted by STGCN, so as to obtain the final prediction results. Taking SCADA data of a wind farm in Inner Mongolia as an example, the effectiveness of the proposed combined model strategy and the improvement effect of STGCN are verified by means of the multi?model comparison experiments and self?ablation experiments. The experimental results show that the designed model can realize significant improvement in prediction accuracy, which provides new ideas and methods for the research in the field of wind power prediction.
Keywords: ultra?short?term wind power forecast; spatio?temporal graph convolution; neural basis expansion analysis for interpretable time series; sequence decomposition; deep feature extraction; graph convolution network
0" "引" 言
隨著國家“雙碳”目標的提出,風能作為綠色可再生能源,是實現(xiàn)該目標的重要手段之一[1]。截止2023年底,全國風電累計裝機容量4.41萬億千瓦,風電并網比例逐漸增大,但是風力發(fā)電的不穩(wěn)定性、波動性和間歇性給電力系統(tǒng)的穩(wěn)定、電網調度安排以及電力市場規(guī)劃帶來較多不利影響[2]。準確的超短期風功率預測可以有效的解決上述問題,對保證電網穩(wěn)定運行及新能源的消納具有重要意義[3]。
現(xiàn)階段,深度學習是預測領域的主流方法,卷積神經網絡(CNN)、長短期記憶(LSTM)網絡等被廣泛應用[4]。文獻[5]利用小波變換對數(shù)據(jù)進行降噪處理,然后通過分類回歸樹選取重要特征,最后采用LSTM網絡進行預測任務。文獻[6]使用皮爾遜算法進行特征篩選,而經過遺傳算法優(yōu)化后的LSTM用來預測。上述文獻均注意到輸入特征對預測結果的影響,但未對數(shù)據(jù)特征關系進行深度挖掘,只在數(shù)據(jù)潛在時間關系方面進行了工作。為了進一步挖掘了數(shù)據(jù)時空特征,文獻[7]采用CNN來提取特征之間的關系,再通過LSTM網絡進行預測任務。文獻[8]通過皮爾遜算法進行特征篩選后,使用CNN?LSTM神經網絡捕獲數(shù)據(jù)的時空依賴性關系,進一步提高了預測精度。文獻[9?10]均以卷積神經網絡(CNN)和循環(huán)門控單元(GRU)為基礎模型,增添信號分解技術來進一步提高預測精度。上述研究均通過提取數(shù)據(jù)時空特征提高了預測精度,但仍存在一些問題:CNN學習局部空間信息的特性導致其對整體時空依賴關系的特征提取能力不足,限制了預測精度的提升;在風電預測中,數(shù)據(jù)的空間特征與時間特征相互耦合,將時序數(shù)據(jù)的時空特征分開提取,忽略了特征關系的動態(tài)性;輸入時間序列越長,隱藏信息越多,并且在處理長時間序列的問題上,LSTM、GRU等RNN變體結構存在信息丟失和梯度消失的問題。
針對上述問題,本文提出一種基于時空圖卷積(STGCN)和神經基擴展分析(N?BEATS)模型的超短期風功率預測模型。該模型具有以下創(chuàng)新點:為了避免CNN空間特征提取的局限性和動態(tài)提取數(shù)據(jù)時空特征,本文采用時空圖卷積網絡對輸入序列進行處理,提取多序列的時空特征;為了提高時空圖卷積模型的特征提取能力,本文構造序列分解模塊和多分辨率卷積對模型進行改進;采用N?BEATS新型預測模型,該模型在避免梯度消失等問題的同時,能從長時間序列中提取豐富的時序關系,進一步提高預測精度。
1" 基于改進時空圖卷積的特征提取模塊
STGCN通過將門控卷積和圖卷積層交錯排列來耦合提取數(shù)據(jù)的時空關系。該模型整體由兩層時空卷積層組成,層與層之間通過殘差結構相連,每個時空圖卷積層由門控卷積和圖卷積層交叉排列而成。為了提高該模型的特征提取能力,本文對門控卷積進行改進,在門控卷積中構造序列分解模塊,降低不規(guī)則序列的波動性,提高時間特征提取能力。然后,使用多分辨率卷積替代門控卷積中固定尺寸的卷積,充分提取數(shù)據(jù)的整體時間特征和局部時間特征,具體結構如圖1所示。圖中:[W]表示鄰接矩陣;[X]表示輸入序列。
1.1" 圖卷積網絡
圖卷積網絡(GCN)是一種在圖結構信息上進行卷積操作的神經網絡。相較于CNN模型,GCN不僅能避免空間信息提取不足限制預測精度的問題,而且在解釋模型的輸出和分析特征影響力時具有較好的可解釋性[11]。因此,本文采用GCN作為數(shù)據(jù)空間特征提取模型。GCN通過聚集本身以及相鄰節(jié)點信息,并根據(jù)鄰接矩陣來生成新的節(jié)點表達形式,通過這種卷積操作,可以有效地捕捉到不同特征之間的動態(tài)關系。本文將輸入特征定義為節(jié)點,特征之間的關聯(lián)定義為邊,以最大信息熵系數(shù)來定量表示特征之間的強弱關系,然后采用GCN將輸入特征視作節(jié)點,根據(jù)式(1)進行節(jié)點特征聚合[12]。該模型的結構圖如圖2所示。
式中:[A=A+I]表示帶自連接的圖結構鄰接矩陣,[A∈RN×N]([N]表示輸入特征數(shù)),[I]為單位矩陣;[D]表示臨界矩陣[A]的度矩陣;[Wl]表示第[l]層圖卷積的權重參數(shù);[Hl]表示第[l]層圖卷積的輸出;[σ·]表示激活函數(shù)。
1.2" 多分辨率分解門控卷積網絡
傳統(tǒng)的門控卷積網絡通過一維卷積和門控單元來提取數(shù)據(jù)時間特征,但是固定尺寸的卷積核只能提取局部時間信息,忽略了整體時序關系。為解決這個問題,本文采用多分辨率卷積核來提高門控卷積的時間特征提取能力。同時,不規(guī)則時序數(shù)據(jù)波動頻繁,導致該序列的主要時序特征被掩蓋,難以捕捉。針對這個問題,本文引入序列分解模塊來降低序列的波動性,凸顯序列的主要時序特征。時間特征提取層結構見圖3。輸入序列經過分解模塊后得到兩個序列,然后分別通過多分辨率門控卷積層,獨立提取不同序列的時序特征。
1.2.1" 多分辨率卷積
多分辨率卷積結構如圖4所示。采用小尺寸卷積來提取數(shù)據(jù)短期變化,大尺寸卷積來提取數(shù)據(jù)長期趨勢,通過不同大小的卷積核提取數(shù)據(jù)不同時間尺度下的特征,充分學習數(shù)據(jù)的整體時間趨勢和局部時間變化,然后將其拼接進行輸出,計算公式如下:
式中:[ftotal]表示融合后的特征;[f3]、[f5]、[f7]分別表示不同卷積核的輸出;[Concat(·)]表示拼接操作。
1.2.2" 序列分解模塊
序列分解模塊可以將時間序列分為趨勢序列和殘差序列兩類,這兩個序列反映了原序列的長期趨勢和短期變化。分解后的序列波動性降低,時序特征明顯,便于時序特征的提取。本文采用移動平均操作來平滑波動并突出長期趨勢,實現(xiàn)序列分解效果。該模塊示意圖如圖5所示。趨勢序列公式表示為:
式中:[X]表示輸入序列;[Xr]、[Xt∈RL×d]分別表示分解后的殘差序列和趨勢序列;[Avgpool·]表示移動平均操作;[Padding(·)]表示填充操作,保持序列長度不變。
2" 基于N?BEATS網絡的預測模塊
N?BEATS是一種基于正、反向殘差連接和深層全連接堆棧的深度網絡學習結構,該模型通過多層全連接進行時間序列分解,每層擬合時間序列部分信息,最后將每層的擬合信息進行疊加,得到最終的預測結果。相對傳統(tǒng)模型,該模型克服了序列過長時梯度消失的問題,而且學習速度快,可解釋性高[12?13]。為充分提取風機SCADA數(shù)據(jù)的時序特征,本文采用N?BEATS作為風功率預測模型,利用該模型的特殊結構可以充分學習風功率與時間之間的非線性關系。本文構建的N?BEATS模型結構如圖6所示。N?BEATS整體結構由趨勢模塊、殘差模塊構成,每個模塊由三個單元通過殘差結構連接,每個單元均由全連接層、線性層和對應的正反向預測層組成,這種深度殘差結構可以讓模型更好地捕捉時間序列的長期趨勢和短期波動。
2.1" 單元結構
單元結構分為兩部分,第一部分有2個分支,數(shù)據(jù)經過4個線性層后通過2個線性層進行線性變換,生成正向預測系數(shù)和反向預測系數(shù),公式表達如下:
式中:[xl]為第[l]個單元的輸入;[hl,k]為第[l]個單元中第[k]個全連接層的輸出,k=1,2,3,4;[FCl,k·]為第[l]個單元中第[k]個全連接層;[θfl]為第[l]個單元中用于正向預測的線性層輸出;[θbl]為第[l]個單元中用于反向預測的線性層輸出;[Linearbl·]為反向預測線性層;[Linearfl·]為正向預測線性層。
第二部分由正向預測層和反向預測層構成,分別用[gfl]和[gbl]表示。然后將[θfl]、[θbl]作為輸入,分別得到結果,公式表達如下:
式中:[Fl]表示正向分支的預測結果;[Hl]表示反向分支的預測輸出。
2.2" 特征提取構造
針對趨勢、殘差2種模塊,本文分別對單元的預測層采用不同的構建方法,使其學習時間序列的特定特征。趨勢的典型特征是變化緩慢且平緩,為了學習序列的趨勢特征,本文將[gbl]與[gfl]定義為約束函數(shù),形式為小次[p]階多項式,計算公式如下:
式中:[t=[0,1,2,…,H-2,H-1]TH],表示時間向量[t]由[0]~[H-1H]多個離散點構成,[H]表示預測時間步長;[θKl,i]表示趨勢模塊中第[l]個單元通過線性層產生的多項式系數(shù)([θbl]、[θfl]);[ftrendl]表示趨勢模塊中第[l]個單元提取的序列部分趨勢特征。
殘差的典型特征是變化頻率快,由于風功率本身的波動性,導致殘差序列波動更大,增大了特征提取的難度。對此,將[gbl]與[gfl]定義為線性層神經網絡,計算公式如下:
式中:[Wl]表示殘差模塊中第[l]個單元的預測層的權重系數(shù);[θKl]表示殘差模塊中第[l]個單元通過線性層產生的多項式系數(shù)([θbl]、[θfl]);[fresl]表示殘差模塊中第[l]個單元提取的序列部分殘差特征。
每個單元有兩個輸出:正向預測輸出為整體預測結果的一部分,反向預測輸出與輸入信號相減,成為下個單元的輸入。通過這種方式將時間序列進行逐層分解,每層處理的是前層無法正確擬合的殘差,預測時間序列某一部分,使模型具有可解釋性。最后,通過將單元的正向預測輸出求和,得到模型的最終預測結果。
3" 整體模型結構與預測流程
本文所提模型整體結構如圖7所示。模型整體流程為:首先,將輸入數(shù)據(jù)通過改進后的時空圖卷積特征提取模塊進行數(shù)據(jù)時空特征動態(tài)提取,該模塊由2個時空卷積層堆疊而成,每層時空圖卷積由2層多分辨率分解門控卷積和單個圖卷積層構成,多分辨率分解門控卷積利用序列分解模塊將原始序列分解為趨勢序列與殘差序列兩種,通過分解的方法減緩序列波動,凸顯序列的主要時間特征,降低特征提取難度,再采用多分辨率門控卷積對分解序列進行時間特征提取,通過多分辨率卷積操作提取序列不同時間尺度下的時間信息,進一步提高了模型特征提取能力;圖卷積網絡通過圖結構卷積將不同特征信息進行聚合,對數(shù)據(jù)空間特征進行提取,該模塊通過將多分辨率分解為門控卷積和圖卷積層交錯排列來耦合提取數(shù)據(jù)的時空關系。然后,將經過特征提取模塊的數(shù)據(jù)送入N?BEATS預測模塊,通過模型內部的趨勢模塊與殘差模塊分別學習序列的某一特征。最后將兩個模塊的結果相加,得到最終的預測結果。
實驗整體流程:首先,風場的SCADA數(shù)據(jù)經過數(shù)據(jù)清洗、歸一化處理后,通過最大互信息系數(shù)[14]得到特征鄰接矩陣,選取相關系數(shù)較大的特征作為模型輸入;然后,將鄰接矩陣和選定特征序列送入構建的模型中,得到預測結果;最后,通過對比實驗和消融實驗證明本文方案對提高預測精度起到了作用。
4" 算例結果與分析
4.1" 數(shù)據(jù)簡述
數(shù)據(jù)來源于內蒙古某風場,采用單風機2020年1月—12月的SCADA數(shù)據(jù),共包括12個特征,采樣間隔為15 min,共35 040個采樣點,80%為訓練集數(shù)據(jù),20%為測試集數(shù)據(jù)。本文通過式(10)進行歸一化,避免不同量綱導致較大的數(shù)值差異,考慮到過多的輸入特征不僅會導致模型計算量變大,增加時間成本,同時也會導致模型預測精度下降。
本文通過式(11)與式(12)使用最大互信息系數(shù)來篩選特征,并將其作為鄰接矩陣,結果如圖8所示。本文選取功率、風速、發(fā)電機轉速、轉子轉速、功率因數(shù)、葉片角度作為模型輸入。
式中:[x']表示歸一化后的值;[xmax]、[xmin]分別表示變量的最大值和最小值;[p(a,b)]表示特征變量的聯(lián)合概率;[I(a,b)]表示特征變量間的互信息;[n1]和[n2]表示網格分布個數(shù);[B]表示一個數(shù)據(jù)量為0.6次方的值。
4.2" 預測結果評價指標
為了直觀描述模型的優(yōu)劣,本文采用了平均絕對誤差(MAE)、均方根誤差(RMSE)和擬合系數(shù)(R2)作為模型評價指標,計算公式如下:
式中:[pi]表示預測功率;[pi]表示實際功率;[C]表示裝機容量;[pi]表示實際功率的平均值;[n]表示樣本點個數(shù)。
4.3" 預測結果對比分析
4.3.1" 預測性能對比
為證明本文方法能夠有效提升預測精度,將所提模型與目前主流的LSTM、TCN、CNN?LSTM等方法進行對比實驗,歷史步長為96。不同模型多步預測的實驗結果如表1所示。
從表中結果可知,本文方案多種預測步長的預測結果均優(yōu)于其他三種模型。以15 min單步預測為例,本文方案的均方根誤差相對LSTM、TCN、CNN?LSTM分別降低2.27、1.18、1.8。本文方案在擬合風功率方面同樣優(yōu)于其他模型,相較于其他三種模型,本文模型R2提高了約4%。隨著預測步長的增加,各模型性能均明顯下降,但是在預測步長為16的情況下,本文方案的性能指標均優(yōu)于其他三個,說明了本文方案在預測精度等方面優(yōu)于常規(guī)模型。為了便于觀察,本文選取測試集前一天的預測量進行展示,預測時間分辨率為15 min,即96個采樣點。單步預測效果如圖9所示。從圖中可知,測試數(shù)據(jù)波動頻繁,幅值差異較大。在該情況下,相較于其他模型,本文方案不僅滯后性較小,而且能夠較好地跟蹤實際功率變化趨勢,預測曲線與實際曲線擬合程度較高。在風功率波動較大的幅值處,其他模型預測結果均有較大誤差,而本文模型在峰值處可以得到較小誤差的預測結果,說明本文模型更符合實際應用中的需求,具有良好的適應性。
4.3.2" 模型消融實驗
為驗證本文對STGCN模型的改進與提出的組合策略是否有效,將本文改進后的組合模型分別與LSTM、TCN、CNN?LSTM、STGCN、N?BEATS、組合模型(STGCN?N?BEATS)進行對比,單步預測實驗結果如表2所示。
由表2可知,將STGCN模型與N?BEATS模型進行組合取得的預測精度高于任意單一模型與傳統(tǒng)模型,說明本文將STGCN與N?BEATS進行組合預測可以有效提高預測精度。通過序列分解模塊和多分辨率卷積改進后的組合模型,各方面性能均優(yōu)于改進前的組合模型,證明了本文改進的STGCN對提高預測精度起到了效果。
5" 結" 論
針對預測中數(shù)據(jù)信息利用不完整、不充分的問題,本文提出了一種基于改進STGCN與N?BEATS的超短期風功率預測方法,通過對比實驗與消融實驗,得到以下結論。
1) 將STGCN模型與N?BEATS模型進行組合預測,通過充分提取數(shù)據(jù)時空特征,并在此基礎上進行時間依賴關系分析,可以有效提高預測精度。
2) 通過引入序列分解模塊和多分辨率卷積對STGCN進行改進,提高了STGCN的數(shù)據(jù)時空特征提取能力,進一步提高了預測精度。
注:本文通訊作者為劉景霞。
參考文獻
[1] 馬燕峰,楊小款,王子建,等.基于風險價值的大規(guī)模風電并網電力系統(tǒng)運行風險評估[J].電網技術,2021,45(3):849?855.
[2] 劉文斌,謝麗蓉,張革榮.基于VMD?HS?LSSVM的風電功率短期預測[J].現(xiàn)代電子技術,2022,45(11):176?181.
[3] 陳家揚,陳華,張旭.基于NWP和深度學習神經網絡短期風功率預測[J].現(xiàn)代電子技術,2020,43(8):63?67.
[4] 武煜昊,王永生,徐昊,等.風電輸出功率預測技術研究綜述[J].計算機科學與探索,2022,16(12):2653?2677.
[5] 張群,唐振浩,王恭,等.基于長短時記憶網絡的超短期風功率預測模型[J].太陽能學報,2021,42(10):275?281.
[6] FARAH S, ZAMEER A, MUNEEB M. A novel genetic LSTM model for wind power forecast [J]. Energy, 2021, 223: 120069.
[7] 栗然,馬濤,張瀟,等.基于卷積長短期記憶神經網絡的短期風功率預測[J].太陽能學報,2021,42(6):304?311.
[8] 王東風,劉婧,黃宇,等.結合太陽輻射量計算與CNN?LSTM組合的光伏功率預測方法研究[J].太陽能學報,2024,45(2):443?450.
[9] 任東方,馬家慶,何志琴,等.基于AVMD?CNN?GRU?Attention的超短期風功率預測研究[J].太陽能學報,2024,45(6):436?443.
[10] 王瑞,徐新超,逯靜.基于特征選擇及ISSA?CNN?BiGRU的短期風功率預測[J].工程科學與技術,2024,56(3):228?239.
[11] 陳子含,滕偉,胥學峰,等.基于圖卷積網絡和風速差分擬合的中長期風功率預測[J].中國電力,2023,56(10):96?105.
[12] KIPF T N, WELLING M. Semi?supervised classification with graph convolutional networks [EB/OL]. [2024?04?21]. arXiv preprint arXiv:1609.02907, 2016.
[13] 范茜茜,王國強,羅賀,等.基于N?BEATS與輔助編碼器的短期電力負荷預測[J].電網技術,2024,48(4):1612?1621.
[14] 臧海祥,趙勇凱,張越,等.基于低風速功率修正和損失函數(shù)改進的超短期風電功率預測[J].電力系統(tǒng)自動化,2024,48(7):248?257.
[15] 楊國清,劉世林,王德意,等.基于Attention?GRU風速修正和Stacking的短期風電功率預測[J].太陽能學報,2022,43(12):273?281.
[16] 李永博.基于改進N?Beats網絡的短期電力負荷預測方法研究[D].秦皇島:燕山大學,2022.
作者簡介:程旭初(2000—),男,河南漯河人,碩士研究生,研究方向為時間序列預測。
劉景霞(1971—),女,內蒙古包頭人,碩士研究生,副教授,研究方向為新能源系統(tǒng)。
康榮凱(2000—),男,山東德州人,碩士研究生,研究方向為風功率預測。
收稿日期:2024?05?28" " " " " "修回日期:2024?07?10
基金項目:內蒙古自治區(qū)自然科學基金(2020LH05019)