成潤坤,岳賽雅,張國維,侯賽,劉達(dá)
(1.華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 102206;2.華北電力大學(xué)智慧能源研究所,北京 102206)
雙碳目標(biāo)下,綠色能源的供應(yīng)比例越來越高,其不確定性對電力能源穩(wěn)定供應(yīng)造成較大的壓力?;痣娋哂休^高的可控性和穩(wěn)定性,因此,火電在保障電力系統(tǒng)能源安全供給中發(fā)揮著重要作用。
未來長時(shí)間內(nèi)火電仍將是我國電力供應(yīng)的主要形式[1],燃煤發(fā)電在我國火力發(fā)電中一直占據(jù)主導(dǎo)地位[2],電煤的供給情況決定火電的生產(chǎn)。2021 年我國多地“拉閘限電”主要源于電煤供應(yīng)不足[3]。在能源和經(jīng)濟(jì)頻繁波動(dòng)下,為避免因煤炭供應(yīng)阻塞導(dǎo)致的發(fā)電動(dòng)力不足或燃煤過度積存致使電廠成本增加,亟需及時(shí)精準(zhǔn)感知電煤需求,以保障電力生產(chǎn)計(jì)劃順利執(zhí)行,及電力供給安全。
目前關(guān)于電煤需求預(yù)測的研究相對較少,主要集中于煤炭總需求的預(yù)測。在影響因素方面,僅陳夢等[4]分析了宏觀政策、運(yùn)力和價(jià)格對電煤需求的影響。大部分學(xué)者從煤炭總需求的角度分析了經(jīng)濟(jì)增長、能源消費(fèi)結(jié)構(gòu)、產(chǎn)業(yè)結(jié)構(gòu)、煤炭供給[5]、能源加工轉(zhuǎn)換效率[6]、煤炭利用效率、能源替代效應(yīng)[7]、煤炭價(jià)格、煤炭產(chǎn)量和總?cè)丝赱8]等因素的影響?;谙嚓P(guān)研究,本文采用格蘭杰因果檢驗(yàn)(Granger Causality Test,Granger)從大量宏觀經(jīng)濟(jì)及能源生產(chǎn)因素中挖掘顯著影響電煤需求的指標(biāo),以用于預(yù)測。在預(yù)測方法上,有學(xué)者采用系統(tǒng)動(dòng)力學(xué)仿真模型[9]、改進(jìn)X-12-ARIMA 模型[10]、單時(shí)序ARMA 和多元協(xié)整回歸模型[11]等預(yù)測電煤需求量,但現(xiàn)有部分模型存在缺乏客觀性、忽略外部因素影響、非線性信息感知弱等問題。
近年來,深度學(xué)習(xí)在諸多領(lǐng)域成功應(yīng)用[12],但在電煤需求預(yù)測中的應(yīng)用較少。相比傳統(tǒng)時(shí)間序列模型,神經(jīng)網(wǎng)絡(luò)可以更好地描述復(fù)雜的非線性問題,預(yù)測精度更高,可靠性更強(qiáng)[13-14],包括反向傳播神經(jīng)網(wǎng)絡(luò)(Back-propagationNeural Network,BP)[15-16]、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[17]、長短期記憶網(wǎng)絡(luò)(Long Short-term Memory,LSTM)[18-20]、門控循環(huán)單元網(wǎng)絡(luò)(Gate Recurrent Unit,GRU)[21]等。BP 模型可有效探索變量間的非線性關(guān)系,但容易陷入局部最優(yōu),收斂速度慢[22];LSTM 模型可以有效解決“長期依賴”問題,但參數(shù)多、且易陷入過擬合[23];GRU 模型利用較少參數(shù)即可保證預(yù)測性能,但不能充分挖掘非連續(xù)特征在高維空間中的聯(lián)系[24]。組合預(yù)測模型可以綜合多種方法所提供的信息,以此提升預(yù)測精度[25-27]。本文提出一種基于BP、LSTM和GRU 模型的組合模型充分挖掘電煤需求序列信息,預(yù)測我國電煤月度需求,該模型可以有效融合3個(gè)子預(yù)測模型的優(yōu)點(diǎn),提升預(yù)測能力。
現(xiàn)有關(guān)于電煤的月度需求研究較少,主要分析了煤炭年度需求,其數(shù)據(jù)頻率低,且預(yù)測可信度和實(shí)用性不足。為更加精準(zhǔn)感知電煤需求,本文收集大量月度經(jīng)濟(jì)及能源生產(chǎn)數(shù)據(jù),采用格蘭杰因果篩選顯著影響電煤需求的變量,構(gòu)建不同提前期范圍的數(shù)據(jù)集。然后用BP,LSTM 和GRU 模型分別構(gòu)建基于不同數(shù)據(jù)集的預(yù)測模型進(jìn)行預(yù)測,并使用回歸加權(quán)不同模型得到組合模型。最后對比單個(gè)模型最優(yōu)預(yù)測結(jié)果與組合模型預(yù)測結(jié)果,驗(yàn)證本文所提預(yù)測模型的可行性和有效性。
Granger 用來檢驗(yàn)一個(gè)時(shí)序變量是否對預(yù)測另一個(gè)時(shí)序變量有顯著意義[28-29],在分析變量影響關(guān)系方面得以廣泛應(yīng)用。其基本觀點(diǎn)是:未來的事件不會(huì)對目前與過去產(chǎn)生因果影響,而過去的事件對現(xiàn)在及未來產(chǎn)生影響。即Granger 具有一定的“預(yù)測”能力。為預(yù)測電煤需求,本文應(yīng)用格蘭杰因果探索特征變量和電煤需求間的影響關(guān)系及其提前期。
與傳統(tǒng)的相關(guān)關(guān)系檢驗(yàn)相比,格蘭杰因果關(guān)系不僅能檢驗(yàn)變量之間是否存在影響關(guān)系,同時(shí)也能分析變量之間影響的時(shí)序關(guān)系,這一特點(diǎn)使得該方法在預(yù)測領(lǐng)域變量篩選和提前期設(shè)置中得到普遍應(yīng)用。
BP 是一種按照誤差反向傳播訓(xùn)練的前饋網(wǎng)絡(luò)。其核心思想是利用梯度搜索技術(shù),使實(shí)際輸出值和期望輸出值的誤差均方差最小,常被用于預(yù)測領(lǐng)域。主要包含前向傳播和誤差反向傳播2 個(gè)過程。信息從輸入層輸入,經(jīng)過隱藏層非線性變化,產(chǎn)生輸出值。若輸出值與期望輸出值誤差未滿足要求,則將誤差信號反向傳播,據(jù)此調(diào)整網(wǎng)絡(luò)權(quán)重,直至滿足誤差要求[30]。但該算法學(xué)習(xí)速度慢,容易陷入局部極小值。
LSTM 模型是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),解決了一般循環(huán)神經(jīng)網(wǎng)絡(luò)存在的長期依賴問題,改善了RNN 模型梯度爆炸和消失問題[31]。LSTM 模型用門控機(jī)制來控制信息的更新或丟棄,引入了輸入門、遺忘門、輸出門,以此去除一些對當(dāng)下情況不重要的內(nèi)容,使得信息保存時(shí)間延長。
GRU 模型是LSTM 模型的一種變體,擁有與LSTM 模型相似的處理效果,結(jié)構(gòu)更加簡單,只包括2 個(gè)門[32]。具體結(jié)構(gòu)如圖1 所示,其中r和z分別為重置門和更新門,h和分別為當(dāng)前狀態(tài)的激活信息和候選激活信息。
圖1 GRU模型結(jié)構(gòu)Fig.1 Structure of GRU model
更新門用于控制前一時(shí)刻的狀態(tài)信息帶入情況。重置門決定前一狀態(tài)有多少信息需要遺忘。這2 個(gè)門控向量決定了哪些信息能夠作為門控循環(huán)單元的輸出。
不同的模型具有不同的特點(diǎn),且對數(shù)據(jù)信息的感知程度不同,因此本文對BP,GRU 和LSTM 模型進(jìn)行加權(quán)組合,以期提升預(yù)測精度,具體過程如圖2。
圖2 建模過程Fig.2 Modeling process
1)數(shù)據(jù)預(yù)處理。收集火電發(fā)電量、宏觀經(jīng)濟(jì)以及其他能源生產(chǎn)數(shù)據(jù)。采用均值插補(bǔ)法處理原始數(shù)據(jù)缺失值,然后計(jì)算同比增長值并做歸一化處理。
2)特征篩選。對預(yù)處理后的數(shù)據(jù)進(jìn)行格蘭杰因果檢驗(yàn),篩選5%顯著性水平下影響電煤需求量的因素,并確定變量影響電煤需求的提前期。
3)模型訓(xùn)練。
(1)子數(shù)據(jù)集構(gòu)建及劃分。利用篩選的提前期變量構(gòu)建不同提前期范圍下的子數(shù)據(jù)集,即將屬于同一提前期的變量歸入同一個(gè)子數(shù)據(jù)集,若設(shè)定最大提前期數(shù)為n,則會(huì)提取n個(gè)子數(shù)據(jù)集。然后對n個(gè)子數(shù)據(jù)集劃分訓(xùn)練集和測試集。
(2)單個(gè)模型訓(xùn)練。利用不同的數(shù)據(jù)集分別訓(xùn)練BP,GRU 和LSTM 子預(yù)測模型,共得到3×n個(gè)子預(yù)測模型。
(3)組合模型構(gòu)建。分別從BP,GRU 和LSTM3類子模型中各選取1 個(gè)子模型。然后,對所選的子模型進(jìn)行加權(quán)組合,利用回歸尋找各個(gè)子模型的最優(yōu)權(quán)重及參數(shù)。最后根據(jù)最優(yōu)權(quán)重和參數(shù)構(gòu)建組合模型。
4)預(yù)測及評價(jià)。對比不同模型的預(yù)測結(jié)果及誤差,驗(yàn)證組合模型的有效性。
2.1.1 數(shù)據(jù)來源
本文選取1998 年1 月至2021 年12 月共288個(gè)月的經(jīng)濟(jì)、能源生產(chǎn)等數(shù)據(jù)作為研究數(shù)據(jù),主要包含月度火電發(fā)電量、發(fā)電標(biāo)準(zhǔn)煤耗、價(jià)格指數(shù)、工業(yè)經(jīng)濟(jì)增加值、社會(huì)消費(fèi)品零售總額、水泥產(chǎn)量等共57 個(gè)變量,數(shù)據(jù)均來源于國家統(tǒng)計(jì)局和Wind 金融數(shù)據(jù)庫。
考慮到我國月度電力燃煤需求難以獲取,且火電主要來源于燃煤發(fā)電,因此將火電發(fā)電量所換算的標(biāo)準(zhǔn)煤耗近似等于電煤的標(biāo)準(zhǔn)煤耗量。每年的發(fā)電單位標(biāo)準(zhǔn)煤耗如表1 所示,由表1 可以看出不同年份的火力發(fā)電單位標(biāo)準(zhǔn)煤耗不同,由1998 年的373 g/kWh 下降至2021 年的285 g/kWh。
表1 歷年火力發(fā)電單位標(biāo)準(zhǔn)煤耗表Table 1 Standard coal consumption table for power generation over the years
2.1.2 數(shù)據(jù)處理
由于變量含有時(shí)間變化趨勢,某一時(shí)刻會(huì)受到前后時(shí)刻值的影響,因此本文采用均值插補(bǔ)法填補(bǔ)缺失值。各月份火電發(fā)電量及換算成標(biāo)準(zhǔn)煤耗趨勢如圖3 所示,由圖3 可以看出火電發(fā)電量和火電換算成標(biāo)煤量變化趨勢一致,均呈現(xiàn)波動(dòng)上升的趨勢,存在季節(jié)性和趨勢性。為消除季節(jié)和趨勢因素對預(yù)測的影響,本文對每一個(gè)變量采用同比增速處理。
圖3 火電發(fā)電量及火電換算成標(biāo)煤量趨勢Fig.3 Trend of thermal power generation and thermal power conversion into standard coal quantity
神經(jīng)網(wǎng)絡(luò)方法多采用梯度下降尋優(yōu),變量值的數(shù)量級將會(huì)影響模型尋優(yōu)能力。因此,本文對數(shù)據(jù)進(jìn)行歸一化處理,具體計(jì)算公式如式(1)所示:
式中:x_s為歸一化后的值;xmin為序列中的最小值;xmax為序列中的最大值。
經(jīng)過同比增速處理及歸一化之后的月度火電發(fā)電標(biāo)準(zhǔn)煤耗需求量如圖4 所示,數(shù)據(jù)預(yù)處理消除了火電發(fā)電標(biāo)準(zhǔn)煤需求量的趨勢性和周期性波動(dòng)。
圖4 預(yù)處理后的電煤需求量Fig.4 Thermal coal demand after preprocess
本文對數(shù)據(jù)預(yù)處理后,采用Granger 篩選5%顯著性水平下影響電煤需求量的變量,結(jié)果如圖5 所示。其中每個(gè)方格表示各變量(變量名分別用v1~v57 代替)分別在提前1—6 期下的格蘭杰因果關(guān)系顯著性水平。紅色表示顯著性水平在5%以下的提前期(圖5 中用t-1 至t-6 表示提前1 期至提前6 期的范圍)變量,顯著性水平越低,紅色越深。最終保留的經(jīng)濟(jì)和能源生產(chǎn)2 大類型中共26 個(gè)變量,經(jīng)濟(jì)方面主要有部分價(jià)格指數(shù)、進(jìn)出口總值累計(jì)增長、出口總值同比增長、國家財(cái)政收入、RPI 同比值、PPI 同比值、城市CPI 同比值等;能源生產(chǎn)方面主要有合成橡膠產(chǎn)量當(dāng)期值、水泥產(chǎn)量累計(jì)增長等。
圖5 格蘭杰檢驗(yàn)結(jié)果Fig.5 Granger test results
不同經(jīng)濟(jì)、能源生產(chǎn)因素對電煤需求量存在不同期的波動(dòng)傳導(dǎo)影響,且同一變量或不同變量在不同提前期范圍下對電煤需求量的影響不同,因此根據(jù)Granger 計(jì)算的結(jié)果構(gòu)建不同提前期范圍下數(shù)據(jù)集。本文共構(gòu)建6 個(gè)子數(shù)據(jù)集,表2 展示了每個(gè)子數(shù)據(jù)集的提前期時(shí)間范圍和保留的變量個(gè)數(shù)。
表2 不同提前期范圍的變量個(gè)數(shù)Table 2 Number of variables in different lead time ranges
本文將每個(gè)子數(shù)據(jù)集中1999 年1 月至2020年12 月劃分為訓(xùn)練集,以此訓(xùn)練模型;2021 年1 月至2021 年12 月的數(shù)據(jù)作為測試集,用于驗(yàn)證模型的有效性。
為評價(jià)模型的預(yù)測性能,選擇平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE)作為預(yù)測評價(jià)指標(biāo),二者的值分別為EMAP和ERMS,值越小,說明預(yù)測值與實(shí)際值之間的誤差越小,預(yù)測精度越高。
2.4.1 模型構(gòu)建
為提升電煤需求預(yù)測精度,本文構(gòu)建基于BP,LSTM 和GRU 模型的加權(quán)組合預(yù)測模型。首先用BP,LSTM,GRU 模型分別對6 個(gè)數(shù)據(jù)集進(jìn)行預(yù)測,預(yù)測結(jié)果如圖6 所示,各模型預(yù)測誤差如表3所示。
表3 不同模型在各數(shù)據(jù)集下的誤差指標(biāo)值Table 3 Error index values of different models under different datasets
圖6 不同模型在不同數(shù)據(jù)集中的預(yù)測結(jié)果Fig.6 Prediction results of different models under different datasets
圖6 展示了不同模型基于不同數(shù)據(jù)集的預(yù)測結(jié)果。其中,黑色線表示真實(shí)值,紅色、藍(lán)色、綠色線、分別表示BP 模型,GRU 模型,LSTM 模型預(yù)測結(jié)果。從圖6 中可以看出,不同模型基于不同數(shù)據(jù)集預(yù)測效果不同。綜合來看,GRU 模型預(yù)測值與真實(shí)值關(guān)系較為穩(wěn)定,LSTM 模型在部分?jǐn)?shù)據(jù)集中預(yù)測值與真實(shí)值更接近,與表3 結(jié)論相一致。
從表3 可以看出,EMAP和ERMS最小時(shí)BP 模型對應(yīng)的數(shù)據(jù)集為子數(shù)據(jù)集2,GRU 模型對應(yīng)的數(shù)據(jù)集為子數(shù)據(jù)集1,LSTM 模型對應(yīng)的數(shù)據(jù)集為子數(shù)據(jù)集5。其中,基于子數(shù)據(jù)集5 訓(xùn)練的LSTM 模型精度最高,驗(yàn)證了LSTM 模型可以較好感知多變量關(guān)系及時(shí)序信息。從預(yù)測穩(wěn)定性來看,BP 模型最穩(wěn)定,其次是LSTM 模型,最后是GRU 模型。
為提升預(yù)測精度,本文構(gòu)建組合模型預(yù)測電煤需求。分別從3 種單一模型中選擇1 個(gè)模型進(jìn)行多元回歸加權(quán)組合,并利用組合模型進(jìn)行預(yù)測。組合模型參數(shù)如表4 所示,模型如式(2)所示。
表4 模型參數(shù)表Table 4 Model parameter table
式中:Y為組合模型預(yù)測值;YLSTM為LSTM 模型預(yù)測值;YGRU為GRU 模型預(yù)測值;YBP為BP 模型預(yù)測值。
2.4.2 不同模型對比
依據(jù)各模型基于不同提前期數(shù)據(jù)集下的預(yù)測評價(jià)指標(biāo),BP,LSTM 和GRU 模型分別在子數(shù)據(jù)集2、子數(shù)據(jù)集5、子數(shù)據(jù)集1 數(shù)據(jù)集下預(yù)測效果最好。為驗(yàn)證組合模型的預(yù)測效果,將最佳提前期下的各單一模型與組合模型進(jìn)行對比,如圖7 所示。
從圖7(a)可知,相較于單一模型,組合預(yù)測模型對真實(shí)值的擬合效果更好,其預(yù)測效果優(yōu)于單一模型,能夠較好地感知電煤需求的變化趨勢與極值。
從圖7(b)可知,組合模型的箱體最窄、均值線最低且接近0,其次是BP 模型,然后是GRU 模型,最后是LSTM 模型。同時(shí),組合模型的樣本點(diǎn)百分比誤差的集中度更高,說明組合模型的預(yù)測性能最好且最穩(wěn)定,單一模型的預(yù)測精度較差且不穩(wěn)定。為進(jìn)一步評價(jià)組合模型和單一模型的預(yù)測性能,分別計(jì)算了單一模型和組合模型的EMAP和ERMS,如表5 所示。
從表5 可知,組合模型的EMAP和ERMS值最小。相比于單一模型,精度提高約3 個(gè)百分點(diǎn),說明基于BP 模型、LSTM 模型和GRU 模型的加權(quán)組合電煤需求預(yù)測模型預(yù)測效果最好,性能最穩(wěn)定,可以有效提取影響電煤需求的多個(gè)因素及時(shí)序信息和規(guī)律。因此,組合預(yù)測模型可以綜合利用單個(gè)模型的優(yōu)點(diǎn),彌補(bǔ)單一模型存在的不足,提升預(yù)測精度。
電煤需求隨時(shí)間動(dòng)態(tài)變化,受多種因素影響。本文利用Granger 篩選其影響因素,構(gòu)建基于BP,LSTM 和GRU 的加權(quán)組合模型預(yù)測我國電煤月度需求。算例表明,相較于單一模型,組合預(yù)測模型性能更好,提升了電煤需求預(yù)測精度,提高了雙碳目標(biāo)下保障電力系統(tǒng)穩(wěn)定運(yùn)行和能源供給安全的能力。
然而,本文工作還需優(yōu)化,如變量篩選和模型構(gòu)建。變量篩選及提前期確定方面,Granger 主要采用了受約束回歸模型,易受其它因素影響,魯棒性不足,且精確度有待提升。未來可進(jìn)一步優(yōu)化格蘭杰因果模型,提升變量篩選及提前期確定的準(zhǔn)確度。同時(shí),現(xiàn)有模型僅考慮了BP,LSTM 和GRU,未來可引入其他時(shí)序模型、樹模型等,以提升預(yù)測精度。