劉 姝,張麗紅,祁慶豐
(1.沈陽工程學院新能源學院,遼寧 沈陽 110136;2.沈陽工程學院電力學院,遼寧 沈陽 110136;3.華能新能源股份有限公司遼寧分公司,遼寧 沈陽 110001)
受環(huán)境污染嚴重及相關政策影響,風電裝機容量持續(xù)增加[1]。高精度風電預測已成為新能源接入電力系統(tǒng)高比例運行的必要技術[2-3]。預測風機的運行狀態(tài),可以有效提高運行的可靠性,及時發(fā)現(xiàn)異常情況,提前進行預防性維護。深度學習和各種統(tǒng)計方法在風電預測中得到廣泛應用,風電預測的準確性不斷提高。
文獻[4]對氣象特征和風電數(shù)據(jù)的波動過程進行了劃分,建立了基于氣象特征和風電波動過程相關性的組合預測模型,有效提高了預測精度。文獻[5]基于天氣移動背景,對NWP中風速波動過程進行了劃分,建立了多步風速和風電功率預測模型?;诓▌舆^程的數(shù)據(jù)挖掘方法可以有效提高風電預測精度,但沒有考慮波動過程的劃分閾值對預測精度的影響。文獻[6]中設定風速、風向和槳距角作為系統(tǒng)輸入,轉(zhuǎn)子轉(zhuǎn)速作為系統(tǒng)輸出。最后利用模型輸出電機的轉(zhuǎn)子轉(zhuǎn)速值進行故障預測。文獻[7]對極限學習機的優(yōu)化采用多目標灰狼優(yōu)化方法,預測未來短期的風速,有效提高了風速預測的準確性和魯棒性。
本文探討風電機組的運行特性,對鐵嶺某風電場實際運行的50 MW并網(wǎng)風電機組SCADA系統(tǒng)數(shù)據(jù)進行分析,應用深度置信網(wǎng)絡進行建模,并通過實例進行仿真分析。經(jīng)統(tǒng)計數(shù)據(jù)驗證,風速、溫度、濕度和氣壓等參數(shù)可以直接影響機組的出力情況。因此,本文將風速、溫度、濕度、氣壓定為系統(tǒng)輸入,將功率作為系統(tǒng)輸出,最終利用所建模型輸出功率值進行預測。
風的產(chǎn)生是由于空氣密度不均勻?qū)е碌目諝饬鲃?,風能是空氣流動產(chǎn)生的動能[8]。簡單來說,風力發(fā)電就是將風能轉(zhuǎn)化為機械能再到電能的過程,機組的輸出功率為
(1)
式中:vn為額定風速;Pn為額定功率;Cp為風能利用系數(shù);ρ為空氣密度,kg/m3;A為風輪掃過的有效面積,m2;υ為實測風速,m/s。由式(1)可知,輸出功率主要與風速、空氣密度和被風輪掃過的有效面積有關,主要的影響因素為風速,風功率與風速的三次方成正比,即風速增大1倍,風電功率增加7倍。因此本文將風速作為主要影響因素進行研究分析[9]。
空氣密度與輸出功率也有直接關系,而根據(jù)氣象學知識,空氣密度與氣壓、溫度、濕度密切相關,關系式為
(2)
式中:p為氣壓,×100 Pa;t為溫度,℃;pw為水氣壓,×100 Pa。由式(2)可知,壓強、溫度和濕度會影響空氣密度的大小,進而決定風功率的大小。因此,在風電功率預測研究時,應考慮壓強、溫度和濕度等影響因素[10]。
本次研究綜合考慮所有影響因素,將風速、壓強、溫度和濕度作為預測模型的輸入變量。
深度置信網(wǎng)絡(deep belief network,DBN)由若干限制的玻爾茲曼機(restricted boltzmann machine,RBM)組成[11],是一種能夠隨機生成觀測數(shù)據(jù)的模型,該模型是生成模型和判別模型的結合。生成模型將RBM逐層疊加,使DBN模型從輸入數(shù)據(jù)中逐層提取相應的特征,進而得到一些高層次且準確的表達式。判別模型用于達到分類或預測的目的,是有監(jiān)督的神經(jīng)網(wǎng)絡模型[12]。
RBM是一種隨機神經(jīng)網(wǎng)絡,包含2層神經(jīng)元。一層是顯層,也稱可視層,由可見單元組成,用于訓練數(shù)據(jù)的輸入。另一層為隱藏層,由隱藏單元組成,用作特征檢測器。RBM構架如圖1所示。
這些單元除了自身調(diào)節(jié)外,還有0或1兩種存在形式:當單元為狀態(tài)1時,參與網(wǎng)絡權值的訓練過程;當狀態(tài)為0時,不參與訓練。設顯層單元的狀態(tài)為V,隱層單元的狀態(tài)為H,則RBM的能量函數(shù)為
(3)
式中:ai為第i個顯層單元偏置限定值;bj為第j個隱層單元偏置限定值;wij為第i顯層單元和第j隱層單元之間的權重;vi、hj為顯層和隱層單元的存在形式[13]。
能量函數(shù)的大小反映了整個結構框架的狀態(tài),訓練過程要實現(xiàn)參數(shù)尋優(yōu)的目的,使其與相應的樣本數(shù)值相吻合,這樣能量函數(shù)會逐漸趨于穩(wěn)定,在進行優(yōu)化的情況下,RBM神經(jīng)元節(jié)點的隨機分布規(guī)律要與樣本數(shù)值相同[14]。
在給定可見單元狀態(tài)時,連接其隱層單元的活化概率為
(4)
在其他條件相同時,限定隱藏層單元不變時,可見單元的活化概率為
(5)
RBM的激活公式為sigmoid函數(shù),此函數(shù)在(-∞,+∞)函數(shù)值始終在0~1,通過計算可以得出相應節(jié)點的激活概率[16],函數(shù)圖如圖2所示。
在訓練過程中,每次循環(huán)執(zhí)行命令時,會隨機為節(jié)點設置1個0~1的隨機數(shù),然后將該隨機數(shù)與激活概率進行對比。只有當隨機數(shù)大于激活概率時,各個單元才被激活。
在訓練預測模型時,隨機初始化參數(shù)使輸出值在穩(wěn)定值附近上下波動的次數(shù)增加,不能突出該模型的代表性特征。因此,需要確定最佳參數(shù)值來提高預測模型的性能,此時的參數(shù)雖是一個近似值,但在尋優(yōu)過程中可以減少波動次數(shù),提高模型的預測精度。尋優(yōu)參數(shù)為RBM的顯層和隱層節(jié)點數(shù)、迭代次數(shù)和學習效率。參數(shù)尋優(yōu)過程如圖3所示。由圖3可知,隨著迭代次數(shù)的增加,訓練誤差越來越小,逐漸逼近于零,當?shù)螖?shù)為1000時訓練誤差最小,因此本次試驗設置的迭代次數(shù)為1000。
由于風電系統(tǒng)歷史數(shù)據(jù)包含多個變量,每個變量具有不同的維度和大小,不利于數(shù)據(jù)特征的分析。為了消除不同維度在數(shù)據(jù)間的沖擊,避免計算節(jié)點飽和,減少計算量,需要將不同表征的數(shù)據(jù)歸一化到一定維度上,如圖4、圖5所示。在本研究中,使用最大和最小歸一化方法將每個數(shù)據(jù)限制在[0,1]范圍內(nèi)。歸一化公式如式(6)所示。
(6)
式中:x為待歸一化的序列;xmax和xmin分別為該序列的最大值和最小值;x′為歸一化結果[17]。
歸一化后可更明顯看出,幾個變量之間的變化程度及風速、溫度、濕度、壓強等變量之間的相互作用機制,更有利于模型訓練的建立。
DBN的訓練過程由2個階段組成,一種是正向的訓練階段,將訓練集作為輸入對RBM進行無監(jiān)督訓練,另一種是反向訓練階段,將上層輸出的誤差作為BP神經(jīng)網(wǎng)絡的輸入進行有監(jiān)督微調(diào)訓練,直至預測模型完成參數(shù)更新,獲得較好的結構參數(shù)[18]。預測模型結構如圖6所示。
該模型利用歸一化后的歷史數(shù)據(jù)作為輸入,預測功率作為輸出,將多層RBM結構和BP神經(jīng)網(wǎng)絡進行結合,通過誤差微調(diào)及反饋,提高了整個模型的性能。
深度置信網(wǎng)絡主要是將輸入數(shù)據(jù)和輸出數(shù)據(jù)建立對應關系來完成預測流程。該網(wǎng)絡基于經(jīng)過預處理的數(shù)值天氣預報數(shù)據(jù)和風電場的歷史數(shù)據(jù)建立風電場預測模型,該模型前2層由RBM組成,最后1層為BP神經(jīng)網(wǎng)絡輸出層,模型的算法流程如圖7所示。
具體步驟如下:
a.采集歷史數(shù)據(jù),并將數(shù)據(jù)集分為訓練集和預測集[19];
b.篩選數(shù)據(jù)并進行歸一化;
c.參數(shù)選擇,并進行尋優(yōu)處理;
d.將訓練集輸入到預測模型中進行訓練,調(diào)整RBM的學習速率,從而改變訓練過程中的權重;
e.當訓練誤差達到要求時,訓練結束,并根據(jù)此時的DBN模型參數(shù)建立預測模型,將預測集輸入到預測模型中進行預測,得出結果。
本文試驗研究數(shù)據(jù)來源鐵嶺風電場SCADA系統(tǒng)。實時采集系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù),會在傳輸過程中由于設備損壞、人工失誤等因素導致數(shù)據(jù)丟失和冗余,從而降低功率預測的準確性。因此收集到的數(shù)據(jù)需要進行處理,以保證預測結果的普遍性。異常數(shù)據(jù)的風速-功率曲線如圖8所示。
為了使預測結果在相應的誤差范圍內(nèi),需要對風場中提取的數(shù)據(jù)進行篩選和處理,具體處理方法如下:
a.數(shù)據(jù)的時間分辨率為15 min;
b.用相鄰數(shù)據(jù)的平均值代替中間的缺測數(shù)據(jù)或異常數(shù)據(jù);
c.采用風機的額定值代替超過閾值的功率值或小于零的值。
利用以上方法對源數(shù)據(jù)進行處理,要盡可能保留歷史信息,不破壞其本身的性質(zhì)。
舉部分數(shù)據(jù)點為例,選取3000個風場實際運行的數(shù)據(jù)點,從圖9中發(fā)現(xiàn)4個功率缺測點。
對發(fā)現(xiàn)的異常數(shù)據(jù)進行預處理后,樣本的功率缺失點消失,得到圖10。
經(jīng)處理過的數(shù)據(jù)信息更加完善,生成相對標準的風速-功率曲線進行仿真分析,如圖11所示。
基于圖6的算法,建立了深度置信網(wǎng)絡的風電功率預測模型。經(jīng)數(shù)據(jù)預處理,選取鐵嶺某風電場提供的2020年5月1日至10月31日每15 min采樣1次的數(shù)值天氣預報數(shù)據(jù)和風場實際運行數(shù)據(jù)進行功率預測。將數(shù)值天氣預報風速、溫度、濕度、氣壓及前一刻風電場功率作為模型的輸入,風電場實際輸出功率作為輸出進行訓練和預測。
DBN網(wǎng)絡的訓練過程首先使用訓練集訓練模型,其次為驗證預測模型的泛化性在測試集上運行模型,測試對新樣本的判斷能力,風電功率預測結果如圖12所示,藍色的圓形標點代表真實值,紅色的星形標點代表輸出預測值,均方誤差為105.9934。
為進一步說明深度置信網(wǎng)絡模型的功率預測效果,在均使用經(jīng)過篩選后的訓練樣本前提下,本文利用深度置信網(wǎng)絡和BP神經(jīng)網(wǎng)絡模型作比較分析,如圖13所示。
為了定量分析2種方法的預測效果,采用橫向誤差和縱向誤差進行對比分析??v向誤差反映了風電機組長期的工作情況,橫向誤差則說明了預測系統(tǒng)的性質(zhì)和效能。當分析模型的性能時,縱向誤差視為平均絕對誤差、均方根誤差,橫向誤差視為相關系數(shù)[20]。各指標的公式為
(7)
表1 誤差比較分析
通過表1可知,深度置信網(wǎng)絡(DBN)的預測模型優(yōu)于BP神經(jīng)網(wǎng)絡預測模型,在采用深層次多隱含層網(wǎng)絡結構時,BP神經(jīng)網(wǎng)絡結構的訓練能力低于深度學習網(wǎng)絡結構,深度學習模型更具優(yōu)勢。在訓練過程中對參數(shù)尋優(yōu),大大提高了預測模型的性能,與BP神經(jīng)網(wǎng)絡相比DBN預測模型的平均絕對誤差大大降低,精確度明顯提高,DBN預測模型更適用于風電場功率的分析預測。
本文結合風電機組的運行特點,將深度置信網(wǎng)絡應用到風功率預測中。在訓練過程中對RBM參數(shù)進行尋優(yōu),從而縮短訓練時間,減少振蕩次數(shù),提高了預測精度。最后通過實例驗證了DBN網(wǎng)絡模型的預測效果優(yōu)于BP神經(jīng)網(wǎng)絡,預測功率和實際功率之間的誤差較小。在功率平穩(wěn)變化階段,預測值與實際值比較接近。因此,可以及時更新風機數(shù)據(jù),實時調(diào)整誤差,實現(xiàn)深度置信網(wǎng)絡模型的優(yōu)化。通過對風電機組功率的預測,可以預知下一時間段的預測值,基于歷史數(shù)據(jù)對風電機組的有功、無功、電壓等進行預判,從而可以提前了解并調(diào)控風力機的運行狀態(tài)。