許 佳,張開幸,李子辰,張 園
(兗州煤業(yè)股份有限公司營銷中心,山東省鄒城市,273500)
山東省是煤炭生產(chǎn)和消費大省,煤炭資源分布廣,據(jù)公開資料顯示,山東省已探明煤炭儲量中,煙煤占比超過80%,其中又以氣煤、肥煤為主[1]。準確把握山東氣煤價格的變動規(guī)律,可以為相關(guān)政府部門及省內(nèi)煤炭生產(chǎn)和經(jīng)營企業(yè)提供決策依據(jù)。
就現(xiàn)有的煤炭價格預測模型而言,國內(nèi)針對煤炭價格進行預測的研究日益增多,歸納起來主要有兩大類,分別是影響因素分析法和技術(shù)分析法。影響因素分析法是建立基于供求框架的數(shù)學模型,通過分析供給與需求的變動來預測價格[2-3],但隨著市場信息的發(fā)展,為了在理論構(gòu)造和解釋精度上趨于完善,模式往往很復雜,同時由于市場的不完全性,往往無法有效分離不同時間段內(nèi)對價格產(chǎn)生影響的具體因素,也不能確定各類因素對價格變化的作用。技術(shù)分析法是利用煤炭價格的歷史數(shù)據(jù)進行趨勢分析來預測市場價格的變化方向,其中應用最廣泛的是時間序列分析[4-5]。技術(shù)分析法對市場短期變化反應快,在宏觀經(jīng)濟較為穩(wěn)定的環(huán)境中,短期預測精度較高,雖然無法估計政策及市場突然因素的影響,但這些因素發(fā)生頻率低,筆者認為使用時間序列分析把握煤炭價格規(guī)律具有很好的適用性和可靠性。
數(shù)據(jù)集上,筆者選取了2015年1月-2020年8月的山東省氣煤價格,見圖1,數(shù)據(jù)來源為CCTD中國煤炭市場網(wǎng)煤炭數(shù)據(jù)庫。考慮到此類價格往往是非平穩(wěn)的,因此選擇ARIMA模型進行建模。
圖1 2015-2020年山東氣煤價格
自回歸滑動平均模型(ARMA),可以表述為式(1),簡記為ARMA(p,q)模型。
(1)
式中:Yt——需要預測的本期值;
Yt-1到Y(jié)t-p——往期觀測值;
et到et-p——一組獨立同分布的隨機變量序列;
t——觀測序列的一系列時刻;
p——自回歸項的階數(shù);
q——移動平均項的階數(shù);
φ1到φp——自回歸項的待估參數(shù);
θ1到θq——移動平均項的待估參數(shù)。
如果一個時間序列{Yt}的d次差分是平穩(wěn)的ARMA過程,則稱{Yt}是ARIMA(p,d,q)過程[6]。
筆者使用2015-2019年山東省氣煤周度價格為訓練數(shù)據(jù)集構(gòu)建模型,模型的建立與預測都在Python中完成。
由于煤炭價格具有一定的周期性和季節(jié)性,同時對山東氣煤價格序列的單位根分析也表明其不是平穩(wěn)的。為獲得平穩(wěn)序列,筆者對原始序列進行差分處理,一階差分序列見圖2,二階差分序列見圖3??梢钥吹剑浑A差分序列已經(jīng)接近平穩(wěn)序列,為避免過度差分,在后面的過程中選擇一階差分序列進行建模。
一般地,我們可以通過觀察自相關(guān)函數(shù)ACF和偏自相關(guān)函數(shù)PACF觀察其拖尾和截尾特征來確定p和q的階數(shù),但通過拖尾和截尾對模型進行定階的方法往往具有很強的主觀性。對混合時間序列而言,采用最小BIC信息準則來定階更合適,結(jié)果見表1。從分析結(jié)果看(AR(3),MA(1))的BIC信息準則最小,因此可以認為階數(shù)p=3,q=1的模型是最好的,后面的章節(jié)采用ARIMA(3,1,1)模型對山東氣煤價格進行模擬。
圖2 山東氣煤價格的一階差分序列
圖3 山東氣煤價格的二階差分序列
表1 山東氣煤價格的BIC信息準則分析結(jié)果
在定階確定模型架構(gòu)后,下一步需要對模型進行參數(shù)估計,結(jié)果如表2所示。模型的AR和MA項系數(shù)的P值均小于0.05,模型參數(shù)估計結(jié)果顯著。
表2 模型參數(shù)估計結(jié)果
為了評價模型的效果及準確性,還需要判斷模型殘差是否存在明顯的自相關(guān)。模型的殘差序列見圖4,可以看出其殘差序列在0附近上下波動。
然后基于模型殘差的自相關(guān)函數(shù)ACF和偏自相關(guān)函數(shù)PACF進行殘差分析,見圖5??梢钥闯鯝CF和PACF都在置信區(qū)間內(nèi),說明殘差具有隨機性??梢越邮軞埐顭o自相關(guān)的原假設(shè),ARIMA(3,1,1)模型通過檢驗。
圖4 ARIMA(3,1,1)模型的殘差序列
圖5 殘差的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)
為了檢驗模型在樣本外的預測效果,筆者使用前面建立的模型對2020年山東氣煤價格進行預測,并與實際結(jié)果進行比較,見圖6。整體上,預測價格與山東氣煤實際價格走勢保持一致,但整體上預測值偏高,1月份受春節(jié)因素影響預測誤差偏大,這也是特殊因素對時間序列模型預測帶來的干擾。在實際運用中,考慮到時間序列模型預測的時效性,應以最近日期數(shù)據(jù)為預測起點,減少預測偏差。
圖6 2020年1-8月山東氣煤價格與模型預測價格比較
筆者根據(jù)山東氣煤價格的歷史數(shù)據(jù),經(jīng)過平穩(wěn)性檢驗、差分處理后,采用最小BIC信息準則,選擇了ARIMA(3,1,1)模型對價格進行預測。結(jié)果表明,ARIMA(3,1,1)模型的預測結(jié)果是有效的,且中短期來看預測精度也達到較高水準,其結(jié)果對山東氣煤市場參與者把握市場形勢有一定借鑒意義。在穩(wěn)定的市場環(huán)境中,ARIMA模型能夠取得較好的預測效果。然而煤炭市場在特殊階段受極個別或突發(fā)因素影響較大,會降低預測模型的有效性和穩(wěn)定性。