門東坡,王金力,何超平,張 凱
(1.國家能源投資集團(tuán)有限責(zé)任公司,北京 100011;2.中國礦業(yè)大學(xué)(北京),北京 100083)
煤炭是我國的主體能源,雖然能源結(jié)構(gòu)調(diào)整的實施限制了煤炭消費(fèi)的增長,但其占全國能源消費(fèi)量的比重仍保持在60%左右[1-3]。隨著“煤改電”“煤改氣”政策的實施和散煤燃燒治理工作推進(jìn),未來煤炭消費(fèi)結(jié)構(gòu)將進(jìn)一步向火電、冶金、建材和化工等主要耗煤行業(yè)集中。因此,客觀準(zhǔn)確地預(yù)測我國主要耗煤行業(yè)煤炭消費(fèi)量,有助于促進(jìn)煤炭消費(fèi)結(jié)構(gòu)優(yōu)化和煤炭產(chǎn)業(yè)健康發(fā)展,對我國能源戰(zhàn)略穩(wěn)步調(diào)整和社會經(jīng)濟(jì)穩(wěn)定運(yùn)行具有重要的意義[4]。
國內(nèi)外煤炭消費(fèi)預(yù)測方法較多,按建模原理和建?;A(chǔ),可分為單項預(yù)測模型法和組合預(yù)測模型法[5]。單項預(yù)測模型法一是根據(jù)煤炭消費(fèi)量隨時間變化規(guī)律建模的數(shù)學(xué)模型法,如移動平均法、回歸分析法、神經(jīng)網(wǎng)絡(luò)法和灰色模型法等;二是根據(jù)煤炭消費(fèi)量與經(jīng)濟(jì)指標(biāo)之間的關(guān)系建模的經(jīng)濟(jì)模型法,如投入產(chǎn)出法、消費(fèi)系數(shù)法和系統(tǒng)動力學(xué)法等。單項預(yù)測模型在煤炭消費(fèi)量預(yù)測中的應(yīng)用,王立杰[6]、謝和平[7]、Wang[8]、Zhu[9]等研究成果具有代表性,但單項預(yù)測模型往往存在一定缺陷,對復(fù)雜變動趨勢的擬合結(jié)果較差。組合模型法是由兩個或多個單項模型按照一定權(quán)重構(gòu)建預(yù)測模型的方法。Bates[10]首次提出了以均方根預(yù)測誤差值的加權(quán)平均組合預(yù)測模型。張友蘭[11]和耿奎[12]認(rèn)為組合預(yù)測法以最小均方誤差為原則,可以充分發(fā)揮各模型優(yōu)勢,最大程度利用有用信息,提高預(yù)測水平。組合模型在煤炭消費(fèi)預(yù)測應(yīng)用方面,張金鎖[5]構(gòu)建的趨勢外推組合模型、楊英明[13]構(gòu)建的ARIMA-GM-ANN組合模型、顏筱紅[14]構(gòu)建的時間序列和IOWGA算子的組合模型、呂占海[15]構(gòu)建的多元回歸和GM(1,1)的組合模型等均能夠較準(zhǔn)確的擬合和預(yù)測全國煤炭消費(fèi)量。綜上,組合預(yù)測模型在全國煤炭消費(fèi)量預(yù)測應(yīng)用較多,但對于不同耗煤行業(yè)煤炭消費(fèi)的預(yù)測研究較少,已有組合預(yù)測模型在各分行業(yè)的適用性有待深入研究。
為此,本文以灰色(GM)、差分自回歸移動平均(ARIMA)、邏輯斯蒂(LOGISTIC)和人工神經(jīng)網(wǎng)絡(luò)(ANN)模型為基礎(chǔ)構(gòu)建最優(yōu)加權(quán)組合模型,通過模型檢驗和精度分析,篩選不同行業(yè)煤炭消費(fèi)量預(yù)測的最優(yōu)預(yù)測模型,在此基礎(chǔ)上對我國煤炭消費(fèi)總量以及火電、冶金、建材和化工行業(yè)煤炭消費(fèi)量進(jìn)行預(yù)測,并分析未來煤炭消費(fèi)結(jié)構(gòu)的變化趨勢。
ARIMA(p,d,q)模型是時間序列的預(yù)測分析方法,其原理是利用差分思想對非平穩(wěn)時間序列進(jìn)行平穩(wěn)化處理,將因變量僅對它的滯后值以及隨機(jī)誤差項的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型,其中p是自回歸項,q是移動平均項數(shù);d是差分次數(shù)[16]。模型數(shù)學(xué)表達(dá)式為:
Φ(B)dxt=Θ(B)εt
式中,xt(t=1,2,…,n)是數(shù)據(jù)時間序列;εt(t=1,2,…,n)是殘差;B是延遲算子,Bnxt=xt-n;Φ(B)為自回歸系數(shù)多項式;d為差分運(yùn)算,d=(1-B)d;Θ(B)為移動平均系數(shù)多項式。
邏輯斯蒂模型(Logistic)是主要的S形函數(shù),適合解決研究變量在開始階段大致成指數(shù)增,后期變量增速逐漸放緩,并逐漸逼近一個極限值的問題。模型數(shù)學(xué)表達(dá)式為:
式中,t是時間變量;r是增長率;K是環(huán)境容量;yt0是原始數(shù)據(jù)序列初始值。
帶入原始數(shù)據(jù),求得邏輯斯蒂方程的解:
式(1)中K和r是影響邏輯斯蒂曲線擬合效果的關(guān)鍵參數(shù),通過Marquardt非線性函數(shù)確定最優(yōu)匹配的K、r值。
神經(jīng)網(wǎng)絡(luò)由輸入層、輸出層和隱含層構(gòu)成,輸入層和輸出層與外界相連,隱含層承擔(dān)計算功能,其本質(zhì)是通過信號向前傳播和誤差翻轉(zhuǎn)調(diào)整學(xué)習(xí)機(jī)制,沿梯度最速下降方向訓(xùn)練和調(diào)整不同層神經(jīng)元之間的權(quán)重和閾值,使實際輸出值和期望輸出值的誤差均方差為最小。
對式(2)用拉格朗日乘子法求解:
最優(yōu)加權(quán)組合模型誤差平方和為:
為對比各單項模型和組合模型的擬合效果,選擇相關(guān)系數(shù)(R2)進(jìn)行模型的相關(guān)性檢驗;選擇平均絕對誤差(MAE)、平均相對誤差(MAPE)和均方根誤差(RMSE)進(jìn)行模型的誤差檢驗。
選用2005—2018全國煤炭消費(fèi)總量及火電、冶金、建材和化工行業(yè)煤炭消費(fèi)量為研究對象,全國煤炭消費(fèi)總量數(shù)據(jù)采用《中國統(tǒng)計年鑒》,四大行業(yè)煤炭消費(fèi)數(shù)據(jù)由各行業(yè)產(chǎn)品產(chǎn)量核算獲得,如圖1所示。
圖1 我國歷年全國及主要行業(yè)煤炭消費(fèi)量(2005—2018)
根據(jù)2005—2018年全國和四大行業(yè)煤炭消費(fèi)數(shù)據(jù),各消費(fèi)量ARIMA模型參數(shù)均為p=1,q=2,d=1;各消費(fèi)量神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)均為1×12×1;邏輯斯蒂函數(shù)K總量=40.73,r總量=-0.38;K電力=20.14,r電力=-0.34;K鋼鐵=6.39,r鋼鐵=-0.37;K建材=5.38,r建材=-0.37;K化工=6.93,r化工=-0.10。
根據(jù)組合預(yù)測法,利用ARIMA、GM、ANN和LOGISTIC 4個單項模型組合構(gòu)建全國和四大行業(yè)煤炭消費(fèi)量預(yù)測模型時,理論上各消費(fèi)量均可構(gòu)建11個組合模型,包括6個2維組合模型、4個3維組合模型和1個4維組合模型。基于最優(yōu)加權(quán)組合原理,首先利用MATLAB對各類煤炭消費(fèi)量的11個組合模型進(jìn)行最優(yōu)權(quán)重規(guī)劃求解;然后用檢驗指標(biāo)R2、MAE、MAPE和RMSE對各組合模型預(yù)測精度進(jìn)行檢驗,篩選獲得最適合各類煤炭消費(fèi)預(yù)測的最優(yōu)組合模型。
2.2.1 全國煤炭消費(fèi)量
對全國煤炭消費(fèi)量的11個組合模型進(jìn)行規(guī)劃求解,組合模型最優(yōu)權(quán)重系數(shù)存在單項模型系數(shù)為0的現(xiàn)象,致使11個組合模型中存在重復(fù)。排除重復(fù)模型后共構(gòu)建GM-ANN、GM-ARIMA、GM-LOGISTIC、ANN-LOGISTIC、LOGISTIC-ARIMA 5種組合模型。
單項模型、組合模型與原始數(shù)據(jù)擬合效果如圖2所示,模型檢驗結(jié)果見表1。單項模型中ARIMA模型R2值最高,達(dá)到0.97,同時MEA、MAPE和RMSE值最低,圖2(a)中ARIMA模型變化趨勢與實測值最接近,說明ARIMA模型用于預(yù)測全國煤炭消費(fèi)變化趨勢的單項模型最為合理。由圖2(b)可知,5種組合模型擬合效果差異明顯,包含ARIMA模型的組合模型擬合效果明顯優(yōu)于其他組合模型,說明單項模型的選取對于組合模型的影響顯著;表1數(shù)據(jù)顯示組合模型與實測值相關(guān)性均較好,GM-ARIMA、ANN-ARIMA和LOGISTIC-ARIMA模型R2值達(dá)到0.97,與ARIMA模型相同,但MEA、MAPE和RMSE值均小于ARIMA模型,說明組合模型擬合效果顯著優(yōu)于單項模型。GM-ARIMA模型較其他模型誤差評價指標(biāo)最低,因此選擇GM-ARIMA為全國煤炭消費(fèi)量最優(yōu)加權(quán)組合模型。與楊英明等[13]得出最優(yōu)組合模型相比擬合R2由0.90增加到0.97,MAE由3.6降低到1.2,RMSE由4.1降低到1.5,而MAPE由1.8%增加到3.1%,對于煤炭消費(fèi)總量來說,MAPE為3.1%是合理的,因此綜合判斷得出本文所建立的組合模型具有先進(jìn)性。
圖2 全國煤炭消費(fèi)單項模型和最優(yōu)加權(quán)模型擬合效果
表1 煤炭消費(fèi)單項預(yù)測模型與組合預(yù)測模型精度比較
2.2.2 火電行業(yè)煤炭消費(fèi)量
對火電行業(yè)煤炭消費(fèi)量的11個組合模型進(jìn)行規(guī)劃求解,共構(gòu)建2維組合模型5個,三維組合模型2個。
單項模型、組合模型與原始數(shù)據(jù)擬合效果如圖3所示,模型檢驗結(jié)果見表2。單項模型中ARIMA模型R2值最高,達(dá)到0.96,同時MEA、MAPE和RMSE值最低,說明ARIMA模型作為擬合火電行業(yè)煤炭消費(fèi)變化趨勢的單項模型最為合理。由圖3(b)和表2可知,7種組合模型大致分為兩類,GM-LOGISTIC和ANN-LOGISTIC的相關(guān)性和誤差指標(biāo)略差于ARIMA模型,剩余組合模型均優(yōu)于ARIMA模型。綜合來看,GM-LOGISTIC-ARIMA的R2值最高,達(dá)到0.97,MEA、MAPE和RMSE值均最小,分別為0.56、3.00%和0.82,因此選擇該模型為火電行業(yè)煤炭消費(fèi)量最優(yōu)加權(quán)組合模型。
圖3 火電行業(yè)煤炭消費(fèi)單項模型和最優(yōu)加權(quán)模型擬合效果
表2 火電行業(yè)煤炭消費(fèi)單項模型與組合模型擬合精度比較
2.2.3 冶金行業(yè)煤炭消費(fèi)量
對冶金行業(yè)煤炭消費(fèi)量的11個組合模型進(jìn)行規(guī)劃求解,共構(gòu)建GM-LOGISTIC、GM-ARIMA、ANN-LOGISTIC和ANN-ARIMA4種組合模型。
單項模型、組合模型與原始數(shù)據(jù)擬合效果如圖4所示,模型檢驗結(jié)果見表3。單項模型中LOGISTIC模型R2值最高,達(dá)到0.95,同時MEA、MAPE和RMSE值最低,說明LOGISTIC模型作為擬合冶金用煤變化趨勢的單項模型最為合理。由圖4(a)和表3可知,4種組合模型中GM-LOGISTIC和ANN-LOGISTIC的相關(guān)性和誤差指標(biāo)均優(yōu)于ARIMA模型,對比來看,GM-LOGISTIC的R2值最高,達(dá)到0.96,MEA、MAPE和RMSE值均最小,分別為0.23、4.01%和0.28,因此選擇該模型為冶金行業(yè)煤炭消費(fèi)量最優(yōu)加權(quán)組合模型。
圖4 冶金行業(yè)煤炭消費(fèi)單項模型和最優(yōu)加權(quán)模型擬合效果
表3 冶金行業(yè)煤炭消費(fèi)單項模型與組合模型精度比較
2.2.4 建材行業(yè)煤炭消費(fèi)量
對建材行業(yè)煤炭消費(fèi)量的11個組合模型進(jìn)行規(guī)劃求解,共構(gòu)建GM-LOGISTIC、GM-ARIMA、ANN-LOGISTIC和ANN-ARIMA 4種組合模型。
單項模型、組合模型與原始數(shù)據(jù)擬合效果如圖5所示,模型檢驗結(jié)果見表4。單項模型中ARIMA模型R2值最高,達(dá)到0.93,同時MEA、MAPE和RMSE值最低,說明ARIMA模型作為擬合建材用煤變化趨勢的單項模型最為合理。由圖5(b)和表4可知,4種組合模型中GM-ARIMA和ANN-ARIMA的相關(guān)性和誤差指標(biāo)均優(yōu)于ARIMA模型,其中ANN-ARIMA的R2值最高,達(dá)到0.96,MEA、MAPE和RMSE值均最小,分別為0.19、3.68%和0.23,因此選擇該模型為建材行業(yè)煤炭消費(fèi)量最優(yōu)加權(quán)組合模型。
圖5 建材行業(yè)煤炭消費(fèi)單項模型和最優(yōu)加權(quán)模型擬合效果
表4 建材行業(yè)煤炭消費(fèi)單項模型與組合模型擬合精度比較
2.2.5 化工行業(yè)煤炭消費(fèi)量
對化工行業(yè)煤炭消費(fèi)量的11個組合模型進(jìn)行規(guī)劃求解,共構(gòu)建GM-LOGISTIC、GM-ARIMA、ANN-ARIMA、LOGISTIC-ARIMA和GM-LOGISTIC-ARIMA 5種組合模型。
單項模型、組合模型與原始數(shù)據(jù)擬合效果如圖6所示,模型檢驗結(jié)果見表5。
表5 化工行業(yè)煤炭消費(fèi)單項模型與組合模型擬合精度比較
4種單項模型R2值均達(dá)到0.99,說明各單項模型均具有較好的擬合效果,這可能與化工用煤變化趨勢波動較弱有關(guān);對比來看ANN模型誤差值最低,因此ANN模型作為擬合化工用煤變化趨勢的單項模型最為合理。由圖6(b)和表5可知,受單項模型擬合程度較高影響,5種組合模型R2值均達(dá)到0.99,對比誤差評價指標(biāo)分析,ANN-ARIMA模型MEA、MAPE和RMSE值均最小,分別為0.03、1.67%和0.04,因此選擇該模型為化工行業(yè)煤炭消費(fèi)量最優(yōu)加權(quán)組合模型。
圖6 化工行業(yè)煤炭消費(fèi)單項模型和最優(yōu)加權(quán)模型擬合效果
利用各類煤炭消費(fèi)最優(yōu)加權(quán)組合模型預(yù)測煤炭消費(fèi)量見表6,各類煤炭消費(fèi)變化趨勢如圖7所示。可以看出,2020—2030年我國煤炭消費(fèi)總量和四大行業(yè)煤炭消費(fèi)量變化趨勢差異明顯。其中,全國煤炭消費(fèi)總量總體呈增長趨勢,但受國家能源戰(zhàn)略規(guī)劃影響,加之環(huán)境污染和碳減排等條件制約,未來全國煤炭消費(fèi)總量增幅有限,預(yù)計2020年為40.51億t,2030年達(dá)到41.67億t;火電耗煤總量總體呈增長趨勢,但因光伏、風(fēng)能等新能源對傳統(tǒng)火電替代效應(yīng)逐漸凸顯,限制了火電煤耗的增長,預(yù)計2020年為21.06億t,2030年達(dá)到22.10億t;冶金和建材耗煤總量總體呈穩(wěn)定趨勢,2020年分別為6.5億t和5.11億t,2030年分別達(dá)到6.60和5.04;化工行業(yè)煤炭消費(fèi)呈較快增長趨勢,受煤炭清潔轉(zhuǎn)化技術(shù)日益成熟和地方煤炭就地轉(zhuǎn)化政策的影響,未來10年化工行業(yè)煤炭消耗將保持較高速增長,預(yù)計2020年為3.06億t,2030年達(dá)到3.78億t。
圖7 煤炭消費(fèi)預(yù)測變化趨勢圖
表6 2019—2030年全國和四大行業(yè)煤炭消費(fèi)預(yù)測億t
1)最優(yōu)加權(quán)組合模型充分利用單項模型所反映的有效信息,彌補(bǔ)單項模型的缺陷,相關(guān)系數(shù)、平均絕對誤差、平均相對誤差和均方根誤差等檢驗指標(biāo)均優(yōu)于單項模型,適合我國煤炭消費(fèi)總量和主要行業(yè)煤炭消費(fèi)量的預(yù)測分析。
2)根據(jù)2005—2018年煤炭消費(fèi)數(shù)據(jù),分別構(gòu)建了權(quán)重為(0.32,0.68)的我國煤炭消費(fèi)總量預(yù)測模型GM-ARIMA;權(quán)重為(0.28,0.14,0.58)的火電行業(yè)預(yù)測模型GM-LOGISTIC-ARIMA;權(quán)重為(0.40,0.60)的冶金行業(yè)預(yù)測模型GM-LOGISTIC;權(quán)重為(0.32,0.68)的建材行業(yè)預(yù)測模型ANN-ARIMA;權(quán)重為(0.79,0.21)的化工行業(yè)預(yù)測模型ANN-ARIMA。
3)基于最優(yōu)加權(quán)組合模型,預(yù)測未來我國煤炭消費(fèi)總量和火電行業(yè)消費(fèi)量呈小幅增長趨勢,2030年分別達(dá)到41.67億t和22.10億t;冶金和建材行業(yè)消費(fèi)量呈穩(wěn)定趨勢,2030年分別達(dá)到6.60億t和5.04億t;化工行業(yè)消費(fèi)量呈快速增長趨勢,2030年達(dá)到3.78億t。