成驍彬
(上海電氣風(fēng)電集團(tuán)股份有限公司,上海 200241)
考慮到石油類(lèi)能源的短缺和市場(chǎng)日益增長(zhǎng)的需求,近幾年來(lái)我國(guó)的可再生能源,如太陽(yáng)能、風(fēng)能、水能、生物質(zhì)能源得到了迅猛的發(fā)展。風(fēng)作為最重要的綠色能源之一,在發(fā)電過(guò)程中不會(huì)產(chǎn)生新的碳排放。在雙碳背景下,風(fēng)電行業(yè)的裝機(jī)容量增長(zhǎng)極為迅速,2016年全球風(fēng)電的裝機(jī)總量大約在55 GW左右,而這個(gè)數(shù)字在2022年變?yōu)榱?87 GW。風(fēng)力發(fā)電機(jī)組發(fā)電的源頭來(lái)自風(fēng),其擁有不確定性和難以預(yù)測(cè)性。因此,對(duì)于風(fēng)速的精準(zhǔn)預(yù)測(cè)在風(fēng)電行業(yè)起著決定性的作用,同時(shí)在“源網(wǎng)荷儲(chǔ)”一體化的新型電力系統(tǒng)下,精準(zhǔn)的風(fēng)速預(yù)測(cè)可以有效地減少新能源對(duì)于電網(wǎng)的沖擊。Sun等[1~4]顯示結(jié)合各類(lèi)LSTM模型的方法來(lái)進(jìn)行短時(shí)風(fēng)速預(yù)測(cè),具有優(yōu)秀的成果。長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)算法是一種有記憶和遺忘機(jī)制的模型,能夠有效得解決“維數(shù)爆炸”的問(wèn)題。Liao等[3]使用了一種雙層長(zhǎng)短期記憶網(wǎng)絡(luò)和注意力機(jī)制的模型(DLSTM-AT)用于多尺度的預(yù)測(cè)。Shen等[4]使用了一種卷積網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)混合算法(CNN-LSTM)用于處理風(fēng)機(jī)的時(shí)空屬性數(shù)據(jù)。但上述研究都沒(méi)有考慮到工業(yè)化應(yīng)用,尤其是在小樣本數(shù)據(jù)時(shí),對(duì)于LSTM算法在風(fēng)速預(yù)測(cè)領(lǐng)域的精度提升,尤其是在不同尺度下的綜合預(yù)測(cè)進(jìn)度表現(xiàn)。同時(shí),算法模型本身的退化沒(méi)有得到很好的監(jiān)控,使得模型在線狀態(tài)屬于“黑盒”狀態(tài)。鑒于此,本文提出了一種自由分布LSTM算法,用于短時(shí)風(fēng)速的預(yù)測(cè)。該算法利用指數(shù)分布(Exponential Distribution)和泊松分布(Poisson Distribution)的共軛屬性,形成一種自由分布解決方案,同時(shí)使用概率分布指標(biāo)作為迭代過(guò)程中的損失方程,能讓模型更具有泛化性。該模型在多種尺度上均能保證預(yù)測(cè)精度。
數(shù)據(jù)收集與處理包含數(shù)據(jù)收集,數(shù)據(jù)分類(lèi)和數(shù)據(jù)清洗。本文數(shù)據(jù)來(lái)源于中國(guó)江蘇省某4-MW風(fēng)機(jī)機(jī)組,數(shù)據(jù)采集系統(tǒng)為30秒SCADA數(shù)據(jù)(Supervisory Control and Data Acquisition),數(shù)據(jù)采樣周期為2022年6月-2022年8月。本文將數(shù)據(jù)分為訓(xùn)練集(1 000個(gè)觀測(cè)值)和測(cè)試集(4 500個(gè)觀測(cè)值)。在數(shù)據(jù)清洗過(guò)程中,本文進(jìn)行了包含NA值和缺失值的過(guò)濾,為保證數(shù)據(jù)的真實(shí)性,本文并沒(méi)有對(duì)缺失值進(jìn)行回填??紤]到行業(yè)機(jī)理,當(dāng)風(fēng)速小于切入風(fēng)速時(shí),風(fēng)機(jī)不會(huì)啟動(dòng);當(dāng)風(fēng)速大于切出風(fēng)速時(shí),風(fēng)機(jī)會(huì)進(jìn)行停機(jī)保護(hù)。因此,本文去除了小于風(fēng)機(jī)切入風(fēng)速(3 m/s)和大于風(fēng)機(jī)切出風(fēng)速(25 m/s)的數(shù)據(jù)。
長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)算法作為一種時(shí)間序列的深度模型,其輸入應(yīng)為時(shí)間序列數(shù)集。在經(jīng)過(guò)處理后的t時(shí)刻數(shù)據(jù)設(shè)定為θi=(x1,x2,…,xi,…,xi+t),此時(shí)刻LSTM算法公式為:
ft=σf(Wf·[ht-1,xt]+bf)
(1)
it=σi(Wi·[ht-1,xt]+bi)
(2)
ot=σ0(Wo·[ht-1,xt]+bo)
(3)
(4)
(5)
ht=ot·tanh(Ct)
(6)
在輸入訓(xùn)練時(shí)間序列數(shù)據(jù)集后,該模型在多次迭代(1 000次)后獲得固定的權(quán)值W值和偏置b值。考慮到公式(1)-(6),長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)算法模型可以簡(jiǎn)化為L(zhǎng)STM(θ|W,b)。
自由分布的LSTM算法模型假設(shè)LSTM算法輸出符合某一條件概率密度函數(shù)(CPD),同時(shí)使用負(fù)對(duì)數(shù)最大似然值(NLL)作為迭代過(guò)程中的損失函數(shù)。相比較傳統(tǒng)的基于誤差數(shù)值的損失函數(shù),基于統(tǒng)計(jì)概率的負(fù)對(duì)數(shù)最大似然值(NLL),具有更好的泛化性。該特性能夠使所提出的模型在小樣本狀態(tài)下?lián)碛懈玫念A(yù)測(cè)精度。自由分布的LSTM算法可簡(jiǎn)化為:
(7)
(8)
表1 模型參數(shù)
在本文中,一個(gè)來(lái)自中國(guó)江蘇2022年7月-8月的真實(shí)風(fēng)場(chǎng)數(shù)據(jù)作為案例進(jìn)行分析。其中訓(xùn)練集為1 000個(gè)觀察數(shù)值,風(fēng)速?gòu)?.01 m/s到15.73 m/s,其風(fēng)速數(shù)據(jù)主要集中在(3 m/s~7.5 m/s)風(fēng)速段,概率密度函數(shù)呈現(xiàn)‘偏態(tài)’狀態(tài),類(lèi)似韋伯分布;測(cè)試集為4 500個(gè)觀察數(shù)值,風(fēng)速?gòu)?.01 m/s到11.42 m/s,其風(fēng)速數(shù)據(jù)主要集中在(3 m/s~5 m/s)風(fēng)速段并在(7 m/s~9 m/s)風(fēng)速段也有一個(gè)副概率密度段,其概率密度函數(shù)呈現(xiàn)“兩頭”狀態(tài),類(lèi)似2個(gè)正態(tài)分布組合分布。來(lái)自工業(yè)真實(shí)數(shù)據(jù)的訓(xùn)練集和測(cè)試集數(shù)據(jù)不符合同一個(gè)分布假設(shè),如圖1所示。本文使用Python 3.6,tensor-flow 2.0和tensor-flow probability 0.8 軟件環(huán)境,單機(jī)i5-6200U CPU和8GB RAM硬件環(huán)境進(jìn)行建模,模型運(yùn)行時(shí)間為9.8 min。其硬件環(huán)境和軟件環(huán)境不強(qiáng)依靠高端服務(wù)器算力,更具有工業(yè)應(yīng)用推廣性。
圖1 風(fēng)速數(shù)據(jù)分析
圖2為在測(cè)試集1小時(shí)預(yù)測(cè)尺度下,自由分布LSTM算法和真實(shí)數(shù)據(jù)的比對(duì),兩者趨勢(shì)相同。尤其是在觀測(cè)值1 400時(shí),在此前沒(méi)有訓(xùn)練過(guò)的19 m/s風(fēng)速下,自由分布LSTM算法依然能夠很好地進(jìn)行跟隨,顯示其具有優(yōu)良的模型泛化性。圖3為模型誤差MAE自然對(duì)數(shù)值的監(jiān)測(cè)圖,本文使用自然對(duì)數(shù)能更好地監(jiān)測(cè)出異常值,選用2倍最大訓(xùn)練集MAE自然對(duì)數(shù)值作為閾值(2),可以看出模型運(yùn)行穩(wěn)定,如后續(xù)出現(xiàn)持續(xù)超出閾值情況,即可通知算法人員,進(jìn)行模型的重新訓(xùn)練。同時(shí),表2為不同預(yù)測(cè)尺度(1小時(shí)、6小時(shí)、12小時(shí)、24小時(shí)、48小時(shí))下,自由分布LSTM算法和傳統(tǒng)LSTM算法的比對(duì)。自由分布LSTM算法的MAE值分別為:0.64(1小時(shí)),1.21(6小時(shí)),1.86(12小時(shí))和2.28(24小時(shí)),而傳統(tǒng)LSTM算法的MAE值分別為:0.77(1小時(shí)),1.33(6小時(shí)),2.01(12小時(shí))和2.37(24小時(shí))。在不同尺度下,從其統(tǒng)計(jì)指標(biāo)均值-方差可以看出,自由分布LSTM算法(1.49~0.39)在多個(gè)預(yù)測(cè)尺度下均優(yōu)異于LSTM算法(1.62~0.38),這證明該算法具有一定的工業(yè)應(yīng)用性和推廣性。
圖2 測(cè)試集風(fēng)速驗(yàn)證(1小時(shí)預(yù)測(cè)尺度)
圖3 模型狀態(tài)監(jiān)測(cè)(1小時(shí)預(yù)測(cè)尺度)
表2 MAE在不同尺度下的比較
本文利用一種自由分布的LSTM算法對(duì)風(fēng)速進(jìn)行短時(shí)預(yù)測(cè)。自由分布的LSTM算法模型利用指數(shù)分布和泊松分布的共軛性,去除了特定概率密度函數(shù)假設(shè)對(duì)于風(fēng)速預(yù)測(cè)精度的應(yīng)用。通過(guò)和其他方法(LSTM算法)比對(duì),該案可有效地對(duì)風(fēng)速進(jìn)行預(yù)測(cè),在不同尺度下均表現(xiàn)出優(yōu)異的效果,同時(shí)該方案還具有模型監(jiān)測(cè)功能,用于模型迭代時(shí)間點(diǎn)的提醒。若風(fēng)電場(chǎng)的運(yùn)行維護(hù)人員根據(jù)預(yù)測(cè)結(jié)果,及時(shí)對(duì)風(fēng)機(jī)狀態(tài)進(jìn)行校正處理,可提高風(fēng)電場(chǎng)的發(fā)電量。未來(lái),在基于該模型的基礎(chǔ)上,可以繼續(xù)探討此模型在不同風(fēng)場(chǎng)數(shù)據(jù)下的遷移性,以及模型在運(yùn)行過(guò)程中的模型退化監(jiān)測(cè)機(jī)制,為該模型在工業(yè)應(yīng)用上的廣泛性進(jìn)行驗(yàn)證和推廣。