裴 欽,雷 昭
(1.皖江工學院 財經學院,安徽 馬鞍山 243031;2.安徽工業(yè)大學 化工學院,安徽 馬鞍山 243032)
隨著經濟發(fā)展越來越快,我國在很短的周期內實現(xiàn)了工業(yè)大國的發(fā)展進程,而甲醇一直是我國工業(yè)發(fā)展進程中不可或缺的重要角色[1]。隨時間的變化,受月度產量、季節(jié)、國家宏觀經濟等因素影響,甲醇產品價格具有波動性、不穩(wěn)定性[2]。對于傳統(tǒng)預測方法來說,其預測過程的主要依據(jù)為專家經驗與統(tǒng)計學相關信息,對價格波動的預測準確性可能會存在誤差[3]。由于甲醇是我國工業(yè)發(fā)展進程中不可或缺的一部分,而大宗商品又與經濟興衰直接相關,因此很多研究人員對預測甲醇產品價格投入極大精力[4]。甲醇價格在原材料價格、市場供求關系和其他系列相關產品影響下,會出現(xiàn)比較明顯的波動[5]。在關乎國家戰(zhàn)略意義的大宗商品當中,甲醇會對農業(yè)發(fā)展起到關鍵的推動作用,因此其重要性可見一斑[6]。對甲醇價格進行精確預測面臨巨大挑戰(zhàn)性,大宗商品的數(shù)據(jù)正在飛速累積,與此同時網(wǎng)絡技術也正在迅速發(fā)展,如果有效利用網(wǎng)絡技術篩選有用信息,對預測過程非常重要[7]。
甲醇和很多商品價格走勢預測是我們國內外很多學者關心熱點話題[8-10],李康琪等采用MA(3)-GARCH(1,1)模型專業(yè)地分析了BRENT原油期貨收盤價波動性的相關數(shù)據(jù)[11];董振宇等多人搭建了國際原油價格預測的雙層隨機整數(shù)規(guī)劃模型[12];陳羽瑱采用Copula及小波分析法,研究了原油期貨價格的波動與人民幣匯率變動[13];王新宇等提出CPAAVS-CAViaR原油市場的風險預測模型[14]。基于這些,本文基于甲醇價格影響因素的專業(yè)分析,提出甲醇價格的短期與長期預測等問題,構建短期和長期預測的模型。
神經系統(tǒng)網(wǎng)絡的迅猛發(fā)展,為深層前饋神經系統(tǒng)網(wǎng)絡帶來機遇,受眾范圍也越來越廣[15],極端學習機(Extreme Learning Machine,ELM)為這一類單隱層前饋神經網(wǎng)絡(Single-hidden Layer Feed forward Network,SLFN)的學習方法,與單隱層前饋神經系統(tǒng)網(wǎng)絡學習算法相比,其不同之處就是當其處于訓練狀態(tài)時,輸入權值的多選性可隨機進行指令,即將輸入層和隱層權值連接,權值輸出后將會對輸出層與隱層權值進行連接,并基于分析方法確定。
極端學習機單隱層前饋神經網(wǎng)絡神經元有三層,然而輸入層不執(zhí)行計算,但提供數(shù)據(jù)特征,隱層為非線性神經元,輸出層是線性的,無偏置或轉換函數(shù)。在ELM方法中隨機設置輸入層權重w和偏差b。固定輸入權重后,輸出權重β是相對獨立的,不需迭代處理算法學習。線性輸出層計算速度非???,且最終可得到線性解。隨機輸入層權重產生幾乎正交隱含層特征,可提高線性輸出層解的泛化性質。因系數(shù)較小,在輸出時線性系統(tǒng)不增加輸入誤差,則權重小使系統(tǒng)抗噪性更強、更穩(wěn)定。給定一組N個不同訓練樣本(xi,ti),i∈[1,N],且xi∈Rn,ti∈Rm。帶有隱層神經元L個的輸出方程如式(1)所示。
(1)
在公式(1)當中,βi、bi分別表示輸出權重與偏差。網(wǎng)絡的輸入與輸入權重分別為xi、wi,激活函數(shù)用φ表示,而ti則表示期望輸出,公式(2)所示為估計輸出yi關系。
(2)
其中,ε表示噪聲。隨機噪聲與輸入中未顯示的變量關系都屬于噪聲的一部分。輸入數(shù)據(jù)通過隱層神經元進行轉換后,會轉變?yōu)椴煌谋憩F(xiàn)形式?;谳斎雽悠?、權重實現(xiàn)隱層數(shù)據(jù)的投影。轉換投影數(shù)據(jù)后,非線性轉換函數(shù)可將ELM學習能力極大提高,轉換后,隱層數(shù)據(jù)尋找輸出權重用H表示。圖1為極端學習機的輸出示意圖。
圖1 極端學習機的輸出示意圖
在神經元中,隱層變換函數(shù)不受函數(shù)類型限制,可運用曲正切函數(shù)、sigmoid函數(shù)、閾值函數(shù)等。一般情況下,神經數(shù)量與線性數(shù)據(jù)特征數(shù)量存在相等的關系,且神經元的特征都會被其復制,即一個w和零個b。對于ELM來說,徑向基神經元比較常見,其隱層輸入為到原心距離,基于非線性投影函數(shù)進行操作。當ELM當中存在RBF神經元時,發(fā)揮原心、樣本間的任何距離函數(shù)的作用,預測主要基于相似訓練數(shù)據(jù)樣本進行,從而推動解決目標、數(shù)據(jù)特征間復雜依賴關系。當基于矩陣表示ELM,此時會輸出并聚集隱層神經元,表示形式如式(3)、式(4)所示。
(3)
(4)
在隨機初始化SLFN輸入偏差、權重條件下,激活函數(shù)無限可微,對隱層輸出矩陣進行確定,并提供一個估計值,該值是帶有任意小噪聲目標值估計。
設{(xi,ti)|xi∈Rn,ti∈Rm,i=1,2,…,N}為算法參數(shù)學習樣本集合,給定隱層神經元個數(shù)、激活函數(shù)類型后,第一步是連接輸入層、隱層間突觸權值wi及隱層神經元偏差,隨機生成bi,i=1,2,…,L;第二步是對隱層神經元的輸出H進行計算;第三步是利用隱層輸出的廣義逆,對隱層和輸出間的連接突觸權值β進行計算,β=H+T,T=[t1,t2,…,tN]T。
要提高甲醇價格預測精度,需將影響甲醇價格的主要因素找出來,影響甲醇價格因素眾多,在預測甲醇產品價格前,需對相關評價指標進行確定。
(1)影響甲醇價格的因素
甲醇市場供需是影響甲醇價格的諸多元素中的一項,該因素包括甲醇的進出口量、產量等,如果在某個階段國外甲醇產品的價格較低,而產量和進口量又較高時,國內市場將出現(xiàn)供大于需的情況,產品價格自然下降;而如果某個階段國外甲醇產品價格較高,出口量較大時,此時國內將會出現(xiàn)供小于需的情況,產品價格自然提高。需求量也是對甲醇價格產生很大影響的關鍵因素,然而統(tǒng)計參數(shù)過程復雜,且很難統(tǒng)計完全。因此,本文將需求量作為定量,選取甲醇價格產量、進口量、出口量作為自變量,衡量甲醇價格波動的情況。
(2)甲醇的歷史價格及成本因素
歷史價格、供需都會對甲醇未來價格產生影響,也就是說過去的價格是決定甲醇未來價格的重要因素。因此,要參考甲醇歷史價格才能更客觀地預測甲醇未來價格。煤炭成本是甲醇價格成本的重要支出,這是由于其生產流程中煤炭作為主要消耗品決定的,這就意味著煤炭價格因素會對甲醇價格產生直接影響。
影響甲醇價格的因素并不只有一個,而是多個因素同時對其產生協(xié)同作用,預測甲醇產品價格評價指標的相關性分析非常必要。本文采用關聯(lián)分析對相關因素進行確定,所選取的方法為比較常見的回歸關聯(lián)分析法和皮爾遜(Pearson)相關系數(shù)法。
(1)皮爾遜(Pearson)相關系數(shù)
皮爾遜相關系數(shù)指的是兩變量相近程度的統(tǒng)計值,可對其特性和類別之間的相似值進一步核算,以此可對其提取出的特性和種類的程度進行一一判斷核驗。可以此方法來判斷兩個變量之間的相關方位,將X設為一定變量,Y為可變量,皮爾遜相關系數(shù)為ρX,Y為因變量,皮爾遜相關系數(shù)為ρX,Y,增大自變量后因變量隨之增大時,ρX,Y>0;反之,ρX,Y<0;ρX,Y=0表示兩者間無關系。通常ρX,Y∈[1,1],可得到更大絕對值的相關系數(shù),此時有更高的相關(正、負)關系;如果得到較小絕對值的相關系數(shù),此時有更小的相關(正、負)程度,1、-1分別表示完全正相關與完全負相關,式(5)所示為Pearson相關系數(shù)公式。
(5)
表1 Pearson算法計算的相關系數(shù)表
根據(jù)表1,分析甲醇價格影響因素之間的關聯(lián)性,由此得出甲醇價格與出口量、進口均價、出口均價呈線性相關,與甲醇進口量呈負相關,與其他影響因素相比,與月產量、煤炭價格相關性相對較低。
(2)回歸關聯(lián)分析
回歸關聯(lián)分析方法是確定兩組或兩組以上變量間的關系,本文通過線性回歸的方式處理變量,將甲醇價格作為研究過程的因變量,其價格影響因素則分別作為自變量。相關性分析結果如表2所示。
表2 相關性分析結果表
分析表2可以看出,甲醇價格與煤炭價格、進口量、進口均價、出口量、出口均價月產量存在如式(6)所示的關聯(lián)。
y=1.810x1-2.592x2+6.418x3+19.885x4+
(6)
其中,煤炭價格為x1,進口量為x2,進口均價為x3,出口量為x4,出口均價為x5,月產量為x6,甲醇價格為y。分析式(6)可以看出,甲醇價格的影響因素中,煤炭價格與月產量的相關性較低,進出口均價、出口量與甲醇價格為線性相關,同時與進口量負相關,所以能夠準確分析得出不同變量與甲醇價格之間的關聯(lián)。
為提高預測甲醇價格的準確度,劃分輸入變量,基于甲醇價格間影響關系重構甲醇價格空間,在預測甲醇價格時,要結合其價格變化趨勢動態(tài)進行。建立ELM模型并用2011—2020年甲醇價格構成時間序列進行訓練,對相應模型中參數(shù)進行確定,利用2020年5月中30天實際價格數(shù)據(jù)與預測值進行比較,對模型的有效性進行確認。
(1)數(shù)據(jù)的預處理
使用ELM極端學習機構建甲醇價格預測模型時,需輸入神經網(wǎng)絡變量,即煤炭價格、甲醇價格、進口均價、表觀消費量、出口均價進行相空間重構,對輸入變量的延遲時間τ、嵌入維數(shù)m進行確定。在甲醇價格短期預測中,通過算法仿真有τ=1,選取嵌入維數(shù)m=10。分析甲醇數(shù)據(jù),針對短期預測,本文通過相空間重構的方式處理甲醇價格時間序列,選取2011—2020年甲醇價格作為時間序列,使用ELM模型展開訓練,確定模型參數(shù),在確定τ=1、m=10后,對原時間序列空間重構獲得式(7)所示的相空間矢量式。
p(ti)=F(P(ti-1),P(ti-2),…,P(ti-10))
(7)
其中,預測的產品價格為p(ti),P(tk),i-1≤k≤i-10表示甲醇價格。將自變量輸入極端學習機,維數(shù)為10,同時確定10個輸入層神經元;甲醇實際價格為自變量,維變量和輸出層神經元均為1。
(2)短期結果預測分析
本文在MATLAB7.1環(huán)境下,計算CPU為3.2GHz的奔騰四機器上進行,驗證算法有效性,采用Sigmoid函數(shù)為ELM學習算法激活函數(shù),激活函數(shù)個數(shù)為20個。以2011—2020年每天甲醇價格為數(shù)據(jù)進行訓練,并進行數(shù)據(jù)相空間重構,對樣本點進行篩選,最終選取2885個訓練樣本,單個樣本為10維數(shù),測試樣本為2020年5月樣本點數(shù)據(jù),共有樣本點30個。如圖2所示。
圖2 甲醇價格真實值與預測值間的絕對誤差
本文給出2020年5月份30個數(shù)據(jù)為甲醇價格實際值和預測值間絕對誤差。由圖2可知,絕對誤差在44元左右,相比于甲醇的平均價格2750元/噸,預測精度較好。
圖3 甲醇價格的實際值與預測值比較
圖3為2020年5月甲醇價格的實際值與預測值比較曲線,由圖3可知,基于2011—2020年11月數(shù)據(jù),12月份預測值可跟蹤擬合甲醇實際值,且預測精度較高,能夠在一定程度上指導甲醇真實的價格。
(1)數(shù)據(jù)的預處理
針對長期預測,本文選取2011—2020年期間煤炭價格、甲醇價格、進口均價、表觀消費量、出口均價等數(shù)據(jù),構建神經網(wǎng)絡預測模型非線性時間序列,輸出變量則為甲醇預測價格。這與短期預測模式相似,把不同的數(shù)據(jù)分別作為混沌時間序列,并進行相空間重構,從而將不同影響因素的特征提取出來,可將甲醇價格預測精度提高。計算機仿真選擇τ=1,嵌入維數(shù)m=2,確定τ=1,m=2,從而可得到新空間矢量式如式(8)所示。
(8)
其中,p(ti)表示要預測的產品價格,Q(tk)為表觀消費量、P(tk)為甲醇價格、I(tk)為進口均價、O(tk)為出口均價、C(tk)為煤炭價格(i-1≤k≤i-2),均為輸入變量,在極端學習機中變量取2維,確定10個神經網(wǎng)絡輸入層神經元。
(2)長期結果預測分析
本文搜集并分析每個月甲醇價格的平均值以及不同影響因素的相關數(shù)據(jù),進行甲醇價格長期預測,選取2011年1月至2020年12月份期間內的數(shù)據(jù),展開相空間重構,確定10維輸入數(shù)據(jù),每個影響因素2維,從而對甲醇的價格進行預測。利用2020年5-12月份實際值與預測值進行對比,說明本文方法有效性,表3為基于長期預測方法的甲醇實際值與預測值比較。
表3 基于長期預測方法的甲醇實際值與預測值比較
由表3知,利用本文方法獲得的甲醇實際值與預測值間的相對誤差最小值為0.67%,最大為3.78%,預測精度較好。
圖4 基于長期預測方法甲醇價格預測值及真實值比較曲線
圖4為基于長期預測方法甲醇價格預測值及真實值比較曲線,由圖4可知,預測值能跟蹤真實值變化,市場指導價值較好。
甲醇價格與我國國民經濟發(fā)展直接相關,但其影響因子較多,想要準確預測難度較大,為將甲醇價格預測精度提高,本文基于甲醇價格影響因素的分析,采用極端學習機算法,提出甲醇價格的短期與長期預測等問題,構建短期和長期預測模型,得出如下結論。
(1) 甲醇價格與甲醇進出口均價、出口量為線性相關,與甲醇進口量負相關,而月產量及煤炭價格與甲醇的相關性比較低。
(2)短期預測表明,甲醇價格實際值和預測值間絕對誤差在44元左右,相比于甲醇的平均價格2750元/噸,預測精度較好。長期預測表明,甲醇實際值與預測值間的相對誤差最小值為0.67%,最大為3.78%,預測精度較好。
(3)本文預測結果雖然精確度有一定提高,但還存在誤差,在今后的研究中,重點是進一步提高甲醇產品價格預測精度、減少預測誤差。