李 艷,彭春華,傅 裕,孫惠娟
(1.華東交通大學電氣與自動化工程學院,江西 南昌330013;2. 國網(wǎng)江西省電力有限公司贛州供電分公司,江西 贛州341000)
目前,風電功率預測方面的研究方法一般可以分為物理模型、統(tǒng)計模型和人工智能三種[1-12]。物理模型是通過物理因素及氣象數(shù)據(jù)來預估風電功率,其在短期預測中表現(xiàn)欠佳。 統(tǒng)計方法是利用基于歷史數(shù)據(jù)的數(shù)學模型進行風速、風功率預測,典型統(tǒng)計模型是以風速數(shù)據(jù)是正態(tài)分布且為線性相關為前提的,因不符合實際情況,所以預測性能將不能得以保證。
為改進LSTM 存在的不足,提出一種基于CNN-LSTM 網(wǎng)絡模型的風電功率預測方法。借助CNN 序列特征抽象能力以有效提取子序列特征,去除干擾信息后輸入數(shù)據(jù)至LSTM,保留更長的有效記憶信息以解決梯度彌散問題。 與僅使用單一LSTM 模型進行比較,CNN-LSTM 網(wǎng)絡模型能提供大量的有效數(shù)據(jù)作為LSTM的輸入數(shù)據(jù),從而提高預測精度。
從物理本質上來說,風電功率影響因素包含風速、風向及溫度等[13]。在現(xiàn)有的部分研究中,只使用歷史功率數(shù)據(jù)對未來值進行預測,而不考慮其它相關環(huán)境影響因素,此類模型的外推能力不足。 因此,為提升預測的精度,在建立模型時需要考慮其它可能對風電出力造成影響的因素。
存在多個變量時,找出影響預測發(fā)電功率較大的變量十分必要。 采用Spearman 方法進行相關性分析。式(1)為2 個n 維向量x,y 的Spearman 相關系數(shù),其中x,y 表示進行相關性分析的兩個變量。
本文實驗獲取數(shù)據(jù)包含我國某風電場2018 年的實際測量數(shù)據(jù)變量,數(shù)據(jù)采樣間隔為15 分鐘。 數(shù)據(jù)包含:測風塔10 m 高度風速、30 m 高度風速、50 m 高度風速、70 m 高度風速和輪轂高度風速、風向、溫度、氣壓、濕度、發(fā)電功率。 通過對風電場2018 年風力發(fā)電功率與影響因素各變量數(shù)據(jù)間進行Spearman 相關性計算,分析結果如表1 所示。 風力發(fā)電功率與輪轂高度風速具有最強相關性,Spearman 系數(shù)達到0.91;同測風塔10 m 風速相關性次之,Spearman 系數(shù)是0.90;發(fā)電功率與溫度相關程度最低為-0.09,所以發(fā)電功率與實測數(shù)據(jù)中的主要影響變量選擇為發(fā)電功率、測風塔10 m 高度風速、30 m 高度風速、50 m 高度風速、70 m 高度風速和輪轂高度風速。
表1 風力發(fā)電功率與影響因子間Spearman 分析結果Tab.1 Results of Spearman analysis between wind power and influence factors
考慮風力發(fā)電功率不僅與前一時刻的影響因素有關,在不同時刻下,其影響程度高的因素可能還包含之前幾個時刻的風力發(fā)電功率及其它影響因子,預測模型輸入數(shù)據(jù)選擇為影響發(fā)電功率的多個時刻數(shù)據(jù)值時,其預測準確性就可能比只輸入前一時刻數(shù)據(jù)高。 為此,對表1 中與發(fā)電功率影響程度高的影響因子進行分時刻的進一步分析。
對風力發(fā)電功率、測風塔10 m 高度風速、30 m 高度風速、50 m 高度風速、70 m 高度風速和輪轂高度風速6 個變量各個時刻數(shù)據(jù)進行Spearman 相關性分析, 選擇出與預測時刻發(fā)電功率具有強相關性的某一個或某幾個時刻數(shù)據(jù),并以此為依據(jù)確定分時預測模型的輸入數(shù)據(jù)。 當前風力發(fā)電功率與歷史風力發(fā)電功率部分時刻、發(fā)電功率與測風塔10 m 高度風速部分時刻、發(fā)電功率與測風塔30 m 高度風速部分時刻、發(fā)電功率與測風塔50 m 高度風速部分時刻、發(fā)電功率與測風塔70 m 高度風速部分時刻、發(fā)電功率與輪轂高度風速部分時刻的相關性分析結果分別如表2~表7 所示。
表2 當前風力發(fā)電功率與歷史風力發(fā)電功率部分時刻Spearman 相關性分析結果Tab.2 Spearman correlation analysis results between current wind power and historical wind power
表3 當前發(fā)電功率與測風塔10 m 高度風速部分時刻Spearman 相關性分析結果Tab.3 Spearman correlation analysis results of current generation power and wind speed at the height of 10 m at some time
表4 當前發(fā)電功率與測風塔30 m 高度風速部分時刻Spearman 相關性分析結果Tab.4 Spearman correlation analysis results of current generation power and wind speed at the height of 30 m at some time
表5 當前發(fā)電功率與測風塔50 m 高度風速部分時刻Spearman 相關性分析結果Tab.5 Spearman correlation analysis results of current generation power and wind speed at the height of 50 m at some time
表6 當前發(fā)電功率與測風塔70 m 高度風速部分時刻Spearman 相關性分析結果Tab.6 Spearman correlation analysis results of current generation power and wind speed at the height of 70 m at some time
表7 當前發(fā)電功率與輪轂高度風速部分時刻Spearman 相關性分析結果Tab.7 Spearman correlation analysis results of current generation power and wind speed at the height of hub at some time
根據(jù)分析情況,選擇出與預測時刻發(fā)電功率Spearman 相關系數(shù)在0.9 以上的時刻數(shù)據(jù),并以此為依據(jù)確定風電功率網(wǎng)絡模型的輸入數(shù)據(jù)。 例如,預測6:45 時刻的發(fā)電功率,則輸入數(shù)據(jù)為5:15、5:30、5:45、6:00、6:15、6:30 時刻的發(fā)電功率,6:30 時刻的10 m 高度風速,6:30 時刻的30 m 高度風速,6:15、6:30 時刻的50 m高度風速及6:30 時刻的輪轂高度風速。
卷積神經(jīng)網(wǎng)絡源于Hubel 和Wiesel 對于貓腦感受野的探索,是將多層網(wǎng)絡結構進行成功訓練的學習算法[14]。 CNN 模型通過局部連接及共享權值的方式,交替使用卷積層和池化層以獲取數(shù)據(jù)有效表征。
LSTM 的記憶單元結構如圖1[15],記憶單元是記憶模塊的核心,表示時刻的細胞狀態(tài)。 LSTM 門結構的作用是增刪細胞狀態(tài)信息,選擇性地使信息通過。
各變量之間的計算公式如下
式中:it,ft,ot,Ct分別為輸入門、遺忘門、輸出門、記憶細胞狀態(tài)的向量;Wxi,Wxf,Wxc,Wxo為連接輸入 信 號Xt的 權 重 矩 陣;Whi,Whf,Whc,Who為 連 接輸出信號Ht的權重矩陣;Wci,Wcf,Wco為連接矢量Ct和門函數(shù)權重矩陣;bt,bc,bf,bo為偏置向量;σ 為激活函數(shù),通常為或函數(shù)。
CNN-LSTM 網(wǎng)絡模型的輸入數(shù)據(jù)結構是時間序列特征圖。 風力發(fā)電功率歷史數(shù)據(jù)、歷史時刻風速數(shù)據(jù)等數(shù)據(jù)為各自獨立的時間序列。 為耦合影響功率的特征信息,將某時刻的歷史發(fā)電功率和相關的特征表示成向量并聯(lián)合,成為新的時間序列數(shù)據(jù)。 如圖2 所示,T 時刻的歷史功率與相應影響因素耦合構成時刻的特征圖,下個時刻的特征圖利用滑動窗口的方式滑動一個時間間隔而成。 按順序把輸入的時間序列形成特征圖。 n 指時間步數(shù),t 代表特征圖以時間為尺度。
CNN-LSTM 網(wǎng)絡模型的構成分為兩部分,CNN 部分主要進行數(shù)據(jù)特征提取,LSTM 網(wǎng)絡則主要進行功率預測。經(jīng)實驗發(fā)現(xiàn),通過增加CNN層數(shù)能夠提高提取特征的能力, 模型精度會變得更高,但是當增加到一定層數(shù)之后,模型的擬合精度趨向穩(wěn)定, 因此最后將卷積層(Conv2D)數(shù)定為4。 卷積層通過將特征映射到池化層(Maxpooling2D),減少了輸出維數(shù),實現(xiàn)特征提取。然后使用Flatten 層進行扁平化操作,再采用全連接層(Dense)輸出向量,即歸一化后的風電功率預測結果。
圖1 LSTM 單元結構Fig.1 LSTM unit
圖2 CNN-LSTM 網(wǎng)絡模型輸入數(shù)據(jù)結構Fig.2 Structure of input data in CNN-LSTM network model
評估模型預測值與訓練值擬合程度采用均方誤差(MSE)作為損失函數(shù),若損失函數(shù)值越小,說明模型擬合的越好,則預測更精確。計算公式為式(7)。以平均絕對誤差(MAE)為指標對預測結果的進行評價,計算公式為式(8)。
式中:N 為樣本個數(shù);pi為發(fā)電功率預測值;Pi為發(fā)電功率實際值。
采用國內某風電場2018 年4 月6 日至2018 年4 月10 日采集的數(shù)據(jù)進行實驗,分別應用BP、LSTM 和CNN-LSTM 預測發(fā)電功率,可得到如圖3 所示的預測結果對比曲線,以及圖4 所示的對應各時刻的相對誤差情況。 可見CNN-LSTM 的預測結果與實際值最接近。
圖3 4 月9 日預測結果對比圖Fig.3 Comparison chart of forecast results on April 9th
圖4 4 月9 日預測相對誤差曲線Fig.4 The relative error curveof prediction on April 9th
表8 預測結果誤差對比Tab.8 Error comparison of prediction results
從表8 可看出,本文提出的CNN-LSTM 預測方法得到風電場2018 年4 月6 日至2018 年4 月10 日期間的eMAE明顯小于BP 和LSTM 網(wǎng)絡模型得到的eMAE,說明利用CNN-LSTM 模型可提高預測精度。
針對提升預測精度的要求,本文提出一種基于CNN-LSTM 網(wǎng)絡的風電功率預測方法,并經(jīng)過實驗驗證了其有效性。 算例表明:
1) 采用Spearman 分析不同變量間的相關性,可以對預測模型的多變量輸入進行篩選,從而降低數(shù)據(jù)規(guī)模,減少非有效信息給模型精度帶來的影響。
2) 基于CNN-LSTM 網(wǎng)絡構建的預測模型, 不僅具有CNN 適于提取數(shù)據(jù)特征的優(yōu)點, 又包含了LSTM處理時間序列的能力,實驗結果驗證文中預測方法能夠提高風電功率的預測精度。
當風力發(fā)電功率出現(xiàn)持續(xù)性突變時,深度學習算法的跟蹤性能需進一步加強。 下一步的研究可結合優(yōu)化算法來提升其預測效果。