楊 茂,白玉瑩
(現(xiàn)代電力系統(tǒng)仿真控制與綠色電能新技術(shù)教育部重點實驗室(東北電力大學),吉林省吉林市132012)
風電功率預測及其在調(diào)度運行中的應用是促進新能源消納的基礎(chǔ),研究風電功率預測技術(shù)有助于削弱風電功率并網(wǎng)時對電力系統(tǒng)帶來的不利影響,降低電網(wǎng)的運行成本,提高系統(tǒng)運行的可靠性,有效保證電網(wǎng)安全[1]。
目前,神經(jīng)網(wǎng)絡(luò)技術(shù)已成功應用于風電功率預測領(lǐng)域,通過挖掘輸入與輸出之間的隱含關(guān)系,解決靜態(tài)模型問題進而實現(xiàn)風電功率預測[2]。但是風電功率屬于非平穩(wěn)時間序列,其變化規(guī)律不僅與當前狀態(tài)有關(guān),還受歷史數(shù)據(jù)變化過程的影響。隨著大數(shù)據(jù)的發(fā)展,深度學習近年來引起國內(nèi)外研究學者的廣泛關(guān)注,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)應運而生,其中最有代表性的長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)是一種時間循環(huán)網(wǎng)絡(luò)[3]。目前已有研究[4]證明LSTM 網(wǎng)絡(luò)可有效提高風電功率超短期預測精度,但模型運行時間較長,不適用于工程實際,因此有研究學者在LSTM 網(wǎng)絡(luò)的基礎(chǔ)上提出了門控循環(huán)單元(gated recurrent unit,GRU),在確保精度的同時,使模型結(jié)構(gòu)更簡單,計算時間更短。
文獻[5]提出一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和GRU 的風電功率超短期預測模型,引入CNN 對GRU 模型中的隱藏狀態(tài)進行壓縮,縮短計算時間的同時也克服了訓練過程中容易出現(xiàn)的梯度消失和梯度爆炸問題,但對于數(shù)值天氣預報(NWP)的特征沒有進行篩選,易出現(xiàn)輸入信息冗余。文獻[6]考慮多位置NWP 和非典型特征,利用最大相關(guān)-最小冗余原則提取輸入變量,說明多位置NWP 和非典型特征均包含有效信息,但預測模型為淺層神經(jīng)網(wǎng)絡(luò),結(jié)果存在不確定性。文獻[7]提出一種基于提升回歸樹和隨機森林(random forest,RF)的風電功率預測方法,可以有效地提取數(shù)據(jù)中包含的信息,明顯改善預測精度。
本文為充分利用NWP 中的有效信息,考慮多個風電場的空間相關(guān)特性,提出一種基于多位置NWP 和GRU 的風電功率超短期預測模型。首先,通過RF 分析多位置NWP 信息對于風電場發(fā)電功率的重要度,基于累積貢獻率提取NWP 特征,按照重要度和關(guān)聯(lián)度大小分配權(quán)重,將加權(quán)的特征作為預測模型的輸入,并與灰色關(guān)聯(lián)提取的方法進行對比分析。然后,選取改進的灰狼尋優(yōu)算法對GRU 模型進行參數(shù)優(yōu)化,建立多變量時間序列預測模型。最后,算例采用中國某風電場的實測數(shù)據(jù)進行驗證,結(jié)果表明,本文方法可有效提取NWP 特征中包含的信息,提高預測精度和訓練速度。
風電功率預測模型主要建立NWP 信息與風電功率之間的對應關(guān)系,輸入變量以NWP 信息為主[8]。不計機組損耗,風電功率可表示為:
式中:P 為風電機組輸出功率;Cp為風能利用系數(shù);ρ為空氣密度,受溫度、濕度、氣壓等因素影響;A 為風電機組葉輪掃風面積,與風向等因素相關(guān);V 為輪轂高度處風速。
NWP 數(shù)據(jù)由第三方預報平臺購買的氣象產(chǎn)品提供,包含多個區(qū)域不同高度的風速和風向等氣象信息,然而過多的NWP 信息加入預測模型會增加模型的冗余度和訓練難度。因此,在進行預測之前需要篩選NWP 信息,提取出對風電功率超短期預測影響較大的特征作為模型的輸入,從而提升模型預測精度[9]。
在風能資源十分豐富的地區(qū),用于風電場發(fā)電的風系,其空間尺度通常為數(shù)百米以上[10],考慮空間相關(guān)性進行風電功率超短期預測的基本思想為:鄰近地區(qū)不同風電場的風速和風向等氣象信息具有一定的相關(guān)性[11],利用風電場群中其他風電場的NWP 信息來提高本地風電場功率的預測效果。以往文獻[12]只考慮單一風電場內(nèi)的NWP 信息,忽略了鄰近場站NWP 包含的有用信息,因此建模時應綜合考慮多位置NWP 信息。
常用的特征提取方法,如粗糙集、互信息和Pearson 系數(shù),大都通過分析特征與功率之間的一致性、信息熵、相關(guān)系數(shù)等特性進行篩選,對數(shù)據(jù)質(zhì)量要求較高[13]。RF 是對樣本進行分類和預測的一種分類器,通過分析輸入變量對分類或者預測結(jié)果的影響程度完成特征的提?。?4]。本文將這一思想應用于風電領(lǐng)域,基于RF 計算NWP 特征對于功率數(shù)據(jù)的重要程度,提取風電功率預測模型的輸入變量。
RF 通過隨機有放回抽樣(bootstrap sample)構(gòu)建每個樹的訓練集,即每個樹的訓練集是樣本集的非空真子集,假設(shè)某顆樹m,存在部分樣本沒有參與該樹訓練集的生成,這些樣本稱為該樹的袋外(outof-bag)樣本。
模型基于袋外錯誤率(out-of-bag error)訓練的計算方法如下:選出某個特征v 及RF 中的某顆樹m;將該特征樣本隨機賦值,其余特征樣本保持不變,放入所選樹m 上,產(chǎn)生一個分類結(jié)果,計算誤分率Om(v),即預測錯誤個數(shù)merr(v)與總數(shù)mall(v)的比例,作為RF 的袋外錯誤率,計算公式如式(2)所示。袋外錯誤率等同于RF 測試集的錯誤率,模型在測試集上表現(xiàn)好,說明泛化能力強,反之則說明泛化能力弱。
為考量NWP 特征對于功率數(shù)據(jù)的重要性,對NWP 中各個特征隨機初始化,若其中某個特征對于功率數(shù)據(jù)較為重要,那隨機賦值該特征后模型誤差將會增大,平均精度下降值(mean decrease in accuracy,MDA)也會增大[15],計算公式如下。
式中:M(v)為隨機賦值某特征v 后的MDA;n 為RF中決策樹的數(shù)目;O′m(v)為原始特征樣本集的平均袋外錯誤率。M(v)下降越多,表示特征v 對于功率數(shù)據(jù)越重要。
累積貢獻率[16]反映了NWP 特征對功率數(shù)據(jù)的影響程度。對于某風電場,通過RF 對該風電場的NWP 信息進行提取。為使模型泛化誤差最小,需設(shè)置決策樹的數(shù)目和每個節(jié)點的候選特征個數(shù),然后按MDA 降序排列,計算NWP 中各個特征的累積貢獻率βp,即
式中:N 為NWP 特征總數(shù);p 為累積特征數(shù)。
GRU 是LSTM 網(wǎng)絡(luò)的一個簡化變體,屬于門控循環(huán)神經(jīng)網(wǎng)絡(luò)家族。GRU 中的更新門是由LSTM 網(wǎng)絡(luò)中的遺忘門和輸入門合并而成,模型架構(gòu)更為簡單,在保證模型預測精度的同時減少了計算量和訓練時間[17]。
每個GRU 包括一個更新門u(t)和一個重置門r(t),在t 時 刻,GRU 接 收 當 前 狀 態(tài)x(t)、上 一 時 刻的隱藏狀態(tài)h(t-1),更新門同時進行遺忘和記憶2 個步驟,運算決定選擇多少信息輸入網(wǎng)絡(luò),遺忘多少過去的信息;重置門決定忘記過去的信息量;GRU 網(wǎng)絡(luò)的輸出h(t)最終由更新門和重置門的動態(tài)控制形成。GRU 內(nèi)部結(jié)構(gòu)如圖1 所示,各變量之間的計算公式如下。
式中:Wu,Wr,Wc為連接隱藏層輸出信號的參數(shù)矩陣;Uu,Ur,Uc為連接輸入信號的參數(shù)矩陣;ψ(?)為激活函數(shù),通常是sigmoid 激活函數(shù);φ(?)為任何非線性函數(shù)(原型中是雙曲正切函數(shù));h?(t)為混合了細胞狀態(tài)和隱藏狀態(tài)的中間記憶狀態(tài);⊙為邏輯運算符,表示矩陣中對應的元素相乘。
圖1 GRU 內(nèi)部結(jié)構(gòu)圖Fig.1 Internal structure of GRU
灰狼尋優(yōu)(gray wolf optimizer,GWO)算法[18]被廣泛應用于參數(shù)尋優(yōu)領(lǐng)域,具有收斂速度快、精確度高等優(yōu)點。GWO 算法將尋優(yōu)過程模擬為灰狼捕食獵物過程,算法核心內(nèi)容參見文獻[19]。
GWO 算法有較強的全局尋優(yōu)能力,但是受參數(shù)初始化影響,前期的尋優(yōu)能力較弱,可能無法搜索到最優(yōu)解?;诖?本文對GWO 算法存在的缺點進行改進,利用φp準則優(yōu)化的拉丁超立方抽樣(LHS)策略[20]對GWO 算法的種群參數(shù)進行初始化,形成改進的GWO(IGWO)算法,一方面保證了種群初始參數(shù)抽樣過程的穩(wěn)定性,另一方面使得初始參數(shù)更均勻地分布在解空間中,有效提高GWO的收斂速度。
在對GRU 模型訓練時發(fā)現(xiàn),影響風電功率超短期預測精度的主要模型參數(shù)分別是權(quán)重學習速率和隱層節(jié)點個數(shù)。因此,本文采用IGWO 算法來尋找GRU 模型的最優(yōu)參數(shù)組合,構(gòu)建IGWO-GRU 模型的具體流程如圖2 所示。
本文預測單個風電場的發(fā)電功率,首先對風電場可用數(shù)據(jù)進行預處理,考慮多位置NWP 信息,通過RF 篩選并提取預測模型輸入變量,建立基于IGWO-GRU 模型的風電場發(fā)電功率超短期預測模型,具體架構(gòu)見圖3。
圖2 IGWO-GRU 模型建立流程圖Fig.2 Flow chart of establishment for IGWO-GRU model
圖3 風電功率預測架構(gòu)Fig.3 Architecture of wind power prediction
以往相關(guān)文獻[21]評價超短期功率預測結(jié)果選的是4 h 的平均值,但在《風電功率預測功能規(guī)范》[22]中對單個風電場超短期預測的考核已修改為第4 個小時。所以本文以歸一化均方根誤差(root mean square error,RMSE)為依據(jù)對風電場超短期預測第4 個小時的預測結(jié)果進行評價,利用最大絕對誤差(maximum absolute error,MAE)分析超短期預測時偏差最大的情況,計算公式如下。
絕對誤差E 為:
式中:xi為模型第i 步的預測值;yi為模型第i 步的實際功率值;Nt為預測步長,在本文中Nt取16。
歸一化均方根誤差Enrmse為:
式中:Pcap為風電場額定裝機容量。
歸一化最大絕對誤差Emae為:
本文選擇中國某地區(qū)的風電場群進行算例分析,該場群共有10 個風電場,每個風電場的可用數(shù)據(jù)為歷史實測功率數(shù)據(jù)、測風塔數(shù)據(jù)以及配套的NWP 數(shù)據(jù),風電場的分布見附錄A 圖A1。每個位置的NWP 數(shù)據(jù)包括24 項特征,具體特征名稱及其含義見表A1。
在實際的風電場運營中,幾乎每個風電場都會出現(xiàn)數(shù)據(jù)異常[23],所以本文在預測前對數(shù)據(jù)進行處理:刪除棄風數(shù)據(jù),補齊時若缺失3 個點或3 個點以內(nèi),選用持續(xù)法補齊;若缺失超出3 個點,選用三次樣條插值補齊;以裝機容量替代大于裝機容量的功率數(shù)據(jù);以零替代小于零的功率數(shù)據(jù)。因NWP 不同特征之間量綱各不相同,為保證平等地考慮每一個變量與功率之間的關(guān)聯(lián)程度,需對NWP 數(shù)據(jù)和功率進行最大最小歸一化,將數(shù)據(jù)歸一化到區(qū)間[0,1]內(nèi),即
式中:x 和x′分別為數(shù)據(jù)歸一化前、后的值;xmax和xmin分別為樣本數(shù)據(jù)中的最大值和最小值。
將歸一化后的數(shù)據(jù)輸入預測模型中,得到的功率數(shù)據(jù)需要經(jīng)過反歸一化,使其具有明確的物理含義,即
為了進一步反映不同輸入變量對風電功率的影響程度,利用RF 量化分析NWP 特征對風電功率的重要度,模型輸入變量的權(quán)重按照重要度大小分配,權(quán)重ω′v的計算公式如下。
式中:pv為經(jīng)累積貢獻率篩選后的NWP 特征總數(shù);ωv為特征v 的重要度。
以5 號風電場為例,首先通過RF 對5 號風電場對應的NWP 信息進行篩選和提取。由于RF 訓練集采用的是有放回抽樣,經(jīng)多次試驗發(fā)現(xiàn)采用70%的數(shù)據(jù)作為訓練集時模型效果最優(yōu)。當使模型泛化誤差達到最小時,參數(shù)設(shè)置為決策樹的數(shù)目n=1 000 和每個節(jié)點候選特征個數(shù)s=4。按MDA 降序排列計算各特征的累積貢獻率??紤]多位置NWP特征時,每個位置的NWP 有24 項特征,共10 個位置,類似于單位置5 號風電場NWP 信息的建模過程。選擇當NWP 特征的βp大于80%時的前p 個特征作為預測模型的輸入變量。
為保證NWP 信息與風電功率相關(guān)性高的同時,縮減輸入特征數(shù)目,結(jié)合累積貢獻率選擇前8 個特征加權(quán)后作為單位置NWP 預測模型的輸入變量,建立RF-IGWO-GRU 模型,前12 個特征加權(quán)后作為多位置NWP 預測模型的輸入變量,建立mRFIGWO-GRU 模型,即本文方法。
在利用灰色關(guān)聯(lián)分析(gray relation analysis,GRA)方法[24]提取輸入變量時,計算NWP 各特征與風電功率的灰色關(guān)聯(lián)度及其累積貢獻率。選擇前6 個單位置NWP 特征加權(quán)值和前10 個多位置NWP特征加權(quán)值,分別建立基于單位置NWP 的GRAIGWO-GRU 模型和基于多位置NWP 的mGRAIGWO-GRU 模型。模型具體輸入設(shè)置見附錄A 表A2 和表A3。
本文對5 號風電場進行功率超短期預測,該風電場的裝機容量為45 MW,是該風電場群中裝機容量最小的一個風電場,與2 號、3 號和8 號風電場距離較近,可用數(shù)據(jù)為2012 年全年實測風速、風向、發(fā)電功率以及配套的NWP 數(shù)據(jù),時間分辨率統(tǒng)一為15 min。模型測試集的輸入為預測時段加權(quán)后的NWP 信息和上一時段歷史實測功率數(shù)據(jù)的歸一化值,輸出為預測時段反歸一化后的預測功率值。
本文利用Python 平臺中的Keras 框架構(gòu)建基于GRU 模型的風電功率超短期預測模型。預測模型初始化參數(shù)為:模型網(wǎng)絡(luò)隱藏層節(jié)點個數(shù)和權(quán)重學習速率由IGWO 算法確定,模型迭代次數(shù)為150,批處理量為1,采用sigmoid 函數(shù)作為GRU 模型的激活函數(shù)。
將5 號風電場每個季節(jié)前2 個月的數(shù)據(jù)作為模型的訓練集,第3 個月的數(shù)據(jù)作為測試集,建立基于IGWO-GRU 模型的預測模型,進行一天滾動96 次,一次提前16 步的多步預測。正文中僅展示5 號風電場春季預測效果,夏季、秋季以及冬季的預測誤差和訓練時間見附錄A 表A4。
5 號風電場功率的實際值與不同預測模型的第13 個預測值的對比效果見圖4。24 h 內(nèi)各模型的超短期預測第4 個小時指標的平均值見表1。由圖4和表1 可知,本文方法的第13 個功率預測值與實際值吻合較好,在風電功率拐點處能跟隨其波動趨勢。mGRA-IGWO-GRU 模型雖然也可以跟蹤功率變化趨勢,但效果不及本文方法;而RF-IGWOGRU 模型和GRA-IGWO-GRU 模型的預測值則較為平緩,不能很好地跟隨功率數(shù)據(jù)波動,說明僅選用單位置NWP 作為預測模型輸入時無法有效利用與功率數(shù)據(jù)強相關(guān)的信息,而考慮多位置NWP 可充分利用其中的有效信息,改善模型預測效果。
圖4 5 號風電場功率實際值與各模型預測值Fig.4 Actual power value of No.5 wind farm and predicted values of various models
表1 5 號風電場各預測模型的預測誤差和訓練時間Table 1 Prediction error and training time of each prediction model for No.5 wind farm
為了更準確和清晰地體現(xiàn)出本文所提方法相較于其他常用預測方法的優(yōu)勢,圖5 給出了5 號風電場各個預測模型絕對誤差的頻率分布,用于直觀評判各模型的預測效果,其中GRU 和LSTM 模型的輸入特征與本文方法一致,RF 模型輸入為歷史功率數(shù)據(jù)。
圖5 5 號風電場絕對誤差統(tǒng)計圖Fig.5 Statistical diagram of absolute error for No.5 wind farm
結(jié)合圖5 和表1 的結(jié)果可以看出,經(jīng)IGWO 算法優(yōu)化后的GRU 模型預測效果明顯優(yōu)于普通GRU模型,說明IGWO 算法可以更精確地找到模型最優(yōu)參數(shù)組合,進而改善預測效果。與其他預測方法相比,本文方法的絕對誤差峰值的出現(xiàn)位置較為靠前,最大絕對誤差和均方根誤差均小于其他方法;GRU模型與LSTM 模型相比,預測效果相當,但GRU 模型更簡單,運行時間更短,為實現(xiàn)較高精度的在線超短期功率預測技術(shù)提供了可能。
選擇9 號風電場進一步驗證本文方法的有效性,該風電場的裝機容量為400.5 MW,是風電場群中裝機容量最大的一個風電場,與3 號和7 號風電場距離較近,可用數(shù)據(jù)與5 號風電場一致。GRU 模型參數(shù)中迭代次數(shù)改為200。9 號風電場功率實際值與不同預測模型的第13 個預測值對比效果如附錄A 圖A2 所示,各預測方法絕對誤差統(tǒng)計圖如圖A3所示,春季、夏季、秋季以及冬季24 h 內(nèi)的超短期預測的第4 個小時預測誤差和模型訓練時間如表A5所示。觀察各模型預測效果與5 號風電場基本一致,進一步說明了本文方法可以有效提高預測模型精度。
為充分利用NWP 信息,進一步提高風電場發(fā)電功率超短期預測的準確性,本文提出了一種基于多位置NWP 和IGWO-GRU 模型的風電功率超短期預測方法,通過算例分析,得到如下結(jié)論。
1)對GWO 算法進行改進,利用IGWO 算法來優(yōu)化GRU 模型參數(shù),可以有效改善預測效果。
2)風電場周圍多個位置的NWP 數(shù)據(jù)包含更多的信息,考慮多位置NWP 的預測模型比只考慮單位置NWP 的預測模型精度更高。
3)在單/多位置NWP 情況下,利用RF 提取的輸入變量對風電功率進行預測,與通過GRA 方法建立的模型相比,可更有效地利用NWP 信息,提高預測精度。
4)在風電功率預測領(lǐng)域,GRU 模型相較于LSTM 模型預測性能相當,但結(jié)構(gòu)更簡單,計算速度更快。
本文考慮多位置NWP 信息,進行單場風電功率的超短期預測,如何利用單場功率信息和NWP信息進而預測集群風電功率將是下一步的研究重點。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。