成驍彬
(上海電氣風電集團股份有限公司,上海 200241)
考慮到石油類能源的短缺和市場日益增長的需求,近幾年來我國的可再生能源,如太陽能、風能、水能、生物質(zhì)能源得到了迅猛的發(fā)展。風作為最重要的綠色能源之一,在發(fā)電過程中不會產(chǎn)生新的碳排放。在雙碳背景下,風電行業(yè)的裝機容量增長極為迅速,2016年全球風電的裝機總量大約在55 GW左右,而這個數(shù)字在2022年變?yōu)榱?87 GW。風力發(fā)電機組發(fā)電的源頭來自風,其擁有不確定性和難以預測性。因此,對于風速的精準預測在風電行業(yè)起著決定性的作用,同時在“源網(wǎng)荷儲”一體化的新型電力系統(tǒng)下,精準的風速預測可以有效地減少新能源對于電網(wǎng)的沖擊。Sun等[1~4]顯示結(jié)合各類LSTM模型的方法來進行短時風速預測,具有優(yōu)秀的成果。長短期記憶網(wǎng)絡(LSTM)算法是一種有記憶和遺忘機制的模型,能夠有效得解決“維數(shù)爆炸”的問題。Liao等[3]使用了一種雙層長短期記憶網(wǎng)絡和注意力機制的模型(DLSTM-AT)用于多尺度的預測。Shen等[4]使用了一種卷積網(wǎng)絡和長短期記憶網(wǎng)絡混合算法(CNN-LSTM)用于處理風機的時空屬性數(shù)據(jù)。但上述研究都沒有考慮到工業(yè)化應用,尤其是在小樣本數(shù)據(jù)時,對于LSTM算法在風速預測領域的精度提升,尤其是在不同尺度下的綜合預測進度表現(xiàn)。同時,算法模型本身的退化沒有得到很好的監(jiān)控,使得模型在線狀態(tài)屬于“黑盒”狀態(tài)。鑒于此,本文提出了一種自由分布LSTM算法,用于短時風速的預測。該算法利用指數(shù)分布(Exponential Distribution)和泊松分布(Poisson Distribution)的共軛屬性,形成一種自由分布解決方案,同時使用概率分布指標作為迭代過程中的損失方程,能讓模型更具有泛化性。該模型在多種尺度上均能保證預測精度。
數(shù)據(jù)收集與處理包含數(shù)據(jù)收集,數(shù)據(jù)分類和數(shù)據(jù)清洗。本文數(shù)據(jù)來源于中國江蘇省某4-MW風機機組,數(shù)據(jù)采集系統(tǒng)為30秒SCADA數(shù)據(jù)(Supervisory Control and Data Acquisition),數(shù)據(jù)采樣周期為2022年6月-2022年8月。本文將數(shù)據(jù)分為訓練集(1 000個觀測值)和測試集(4 500個觀測值)。在數(shù)據(jù)清洗過程中,本文進行了包含NA值和缺失值的過濾,為保證數(shù)據(jù)的真實性,本文并沒有對缺失值進行回填??紤]到行業(yè)機理,當風速小于切入風速時,風機不會啟動;當風速大于切出風速時,風機會進行停機保護。因此,本文去除了小于風機切入風速(3 m/s)和大于風機切出風速(25 m/s)的數(shù)據(jù)。
長短期記憶網(wǎng)絡(LSTM)算法作為一種時間序列的深度模型,其輸入應為時間序列數(shù)集。在經(jīng)過處理后的t時刻數(shù)據(jù)設定為θi=(x1,x2,…,xi,…,xi+t),此時刻LSTM算法公式為:
ft=σf(Wf·[ht-1,xt]+bf)
(1)
it=σi(Wi·[ht-1,xt]+bi)
(2)
ot=σ0(Wo·[ht-1,xt]+bo)
(3)
(4)
(5)
ht=ot·tanh(Ct)
(6)
在輸入訓練時間序列數(shù)據(jù)集后,該模型在多次迭代(1 000次)后獲得固定的權(quán)值W值和偏置b值??紤]到公式(1)-(6),長短期記憶網(wǎng)絡(LSTM)算法模型可以簡化為LSTM(θ|W,b)。
自由分布的LSTM算法模型假設LSTM算法輸出符合某一條件概率密度函數(shù)(CPD),同時使用負對數(shù)最大似然值(NLL)作為迭代過程中的損失函數(shù)。相比較傳統(tǒng)的基于誤差數(shù)值的損失函數(shù),基于統(tǒng)計概率的負對數(shù)最大似然值(NLL),具有更好的泛化性。該特性能夠使所提出的模型在小樣本狀態(tài)下?lián)碛懈玫念A測精度。自由分布的LSTM算法可簡化為:
(7)
(8)
表1 模型參數(shù)
在本文中,一個來自中國江蘇2022年7月-8月的真實風場數(shù)據(jù)作為案例進行分析。其中訓練集為1 000個觀察數(shù)值,風速從3.01 m/s到15.73 m/s,其風速數(shù)據(jù)主要集中在(3 m/s~7.5 m/s)風速段,概率密度函數(shù)呈現(xiàn)‘偏態(tài)’狀態(tài),類似韋伯分布;測試集為4 500個觀察數(shù)值,風速從3.01 m/s到11.42 m/s,其風速數(shù)據(jù)主要集中在(3 m/s~5 m/s)風速段并在(7 m/s~9 m/s)風速段也有一個副概率密度段,其概率密度函數(shù)呈現(xiàn)“兩頭”狀態(tài),類似2個正態(tài)分布組合分布。來自工業(yè)真實數(shù)據(jù)的訓練集和測試集數(shù)據(jù)不符合同一個分布假設,如圖1所示。本文使用Python 3.6,tensor-flow 2.0和tensor-flow probability 0.8 軟件環(huán)境,單機i5-6200U CPU和8GB RAM硬件環(huán)境進行建模,模型運行時間為9.8 min。其硬件環(huán)境和軟件環(huán)境不強依靠高端服務器算力,更具有工業(yè)應用推廣性。
圖1 風速數(shù)據(jù)分析
圖2為在測試集1小時預測尺度下,自由分布LSTM算法和真實數(shù)據(jù)的比對,兩者趨勢相同。尤其是在觀測值1 400時,在此前沒有訓練過的19 m/s風速下,自由分布LSTM算法依然能夠很好地進行跟隨,顯示其具有優(yōu)良的模型泛化性。圖3為模型誤差MAE自然對數(shù)值的監(jiān)測圖,本文使用自然對數(shù)能更好地監(jiān)測出異常值,選用2倍最大訓練集MAE自然對數(shù)值作為閾值(2),可以看出模型運行穩(wěn)定,如后續(xù)出現(xiàn)持續(xù)超出閾值情況,即可通知算法人員,進行模型的重新訓練。同時,表2為不同預測尺度(1小時、6小時、12小時、24小時、48小時)下,自由分布LSTM算法和傳統(tǒng)LSTM算法的比對。自由分布LSTM算法的MAE值分別為:0.64(1小時),1.21(6小時),1.86(12小時)和2.28(24小時),而傳統(tǒng)LSTM算法的MAE值分別為:0.77(1小時),1.33(6小時),2.01(12小時)和2.37(24小時)。在不同尺度下,從其統(tǒng)計指標均值-方差可以看出,自由分布LSTM算法(1.49~0.39)在多個預測尺度下均優(yōu)異于LSTM算法(1.62~0.38),這證明該算法具有一定的工業(yè)應用性和推廣性。
圖2 測試集風速驗證(1小時預測尺度)
圖3 模型狀態(tài)監(jiān)測(1小時預測尺度)
表2 MAE在不同尺度下的比較
本文利用一種自由分布的LSTM算法對風速進行短時預測。自由分布的LSTM算法模型利用指數(shù)分布和泊松分布的共軛性,去除了特定概率密度函數(shù)假設對于風速預測精度的應用。通過和其他方法(LSTM算法)比對,該案可有效地對風速進行預測,在不同尺度下均表現(xiàn)出優(yōu)異的效果,同時該方案還具有模型監(jiān)測功能,用于模型迭代時間點的提醒。若風電場的運行維護人員根據(jù)預測結(jié)果,及時對風機狀態(tài)進行校正處理,可提高風電場的發(fā)電量。未來,在基于該模型的基礎上,可以繼續(xù)探討此模型在不同風場數(shù)據(jù)下的遷移性,以及模型在運行過程中的模型退化監(jiān)測機制,為該模型在工業(yè)應用上的廣泛性進行驗證和推廣。