崔金鑫, 鄒輝文
(福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院, 福州 350116)
(福州大學(xué) 投資與風(fēng)險管理研究所, 福州 350116)
原油期貨作為一種非常關(guān)鍵的能源金融衍生品,其價格變化幅度較大, 且具有較高的時變特征, 原油期貨價格的變化對全球經(jīng)濟(jì)都產(chǎn)生著顯著的影響[1].因此, 對其價格作出準(zhǔn)確的預(yù)測, 不僅可以為期貨投資者以及市場監(jiān)管者提供決策參考, 同時也利于原油期貨市場的長期健康發(fā)展.然而, 與其他金融價格序列相類似, 原油期貨價格序列具有非平穩(wěn)、非線性、多頻率等典型特征, 因此, 對其價格作出精準(zhǔn)預(yù)測較為困難.即便如此, 國內(nèi)外依然有學(xué)者對其展開了預(yù)測研究.
傳統(tǒng)的金融時間序列預(yù)測方法主要包括ARMA(AutoRegressive Moving Average)模型、ARIMA(AutoRegressive Integrated Moving Average)模型和GARCH (Generalized AutoRegressive Conditional Heteroskedasticity)模型, 然而它們無法完全挖掘出金融時間序列的非線性特征, 預(yù)測效果往往不佳.隨著數(shù)據(jù)統(tǒng)計科學(xué)以及計算機(jī)技術(shù)的發(fā)展, 神經(jīng)網(wǎng)絡(luò)模型受到了學(xué)者們的青睞, 并在金融時間序列預(yù)測領(lǐng)域得到了大量的應(yīng)用, 例如: ANN (Artificial Neural Network)人工神經(jīng)網(wǎng)絡(luò)模型[2]、SVR (Support Vector Regression)支持向量機(jī)回歸模型[3]、BPNN (Back-Propagation Neural Network)神經(jīng)網(wǎng)絡(luò)模型[4]、ELM(Extreme Learning Machine)極限學(xué)習(xí)機(jī)模型[5]、ANFIS (Adaptive Network-based Fuzzy Inference System)自適應(yīng)模糊推理系統(tǒng)[6]、LSTM (Long Short-Term Memory)長短記憶神經(jīng)網(wǎng)絡(luò)模型[7]等.隨著預(yù)測研究的不斷深入, 學(xué)者們發(fā)現(xiàn)單一機(jī)器學(xué)習(xí)預(yù)測模型的預(yù)測性能仍有提升的空間, 因此學(xué)者們探尋出了一種更加有效的預(yù)測模型: 數(shù)據(jù)分解技術(shù)與機(jī)器學(xué)習(xí)算法相結(jié)合的預(yù)測模型.遵循著“分解”、“預(yù)測”、“集成”的整體建模架構(gòu), 國內(nèi)外學(xué)者們針對金融價格時間序列展開了大量的預(yù)測研究, 例如: 將經(jīng)驗?zāi)B(tài)分解算法與前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合的EMD-FNN (Empirical Mode Decomposition-Feed forward Neural Network)模型[8];將集合經(jīng)驗?zāi)B(tài)分解算法與粒子群算法優(yōu)化的最小二乘支持向量機(jī)進(jìn)行結(jié)合的EEMD-PSO-LSSVM(Ensemble Empirical Mode Decomposition Particle Swarm Optimization Least Square Support Vector Machine)模型[9]、將集合經(jīng)驗?zāi)B(tài)分解方法、長短期記憶模型和Adaboost 算法相結(jié)合的EEMD-LSTMAdaboost 模型[10]、將互補(bǔ)集合經(jīng)驗?zāi)B(tài)分解與改進(jìn)的極限學(xué)習(xí)機(jī)相結(jié)合的CEEMD-EELM (Complete Ensemble Empirical Mode Decomposition-Extended Extreme Learning Machine)模型[11]等.
CEEMDAN 完全自適應(yīng)集合經(jīng)驗?zāi)B(tài)分解是由Colominas 等[12]提出的, 利用一種自適應(yīng)的噪聲生成算法對EEMD 集合經(jīng)驗?zāi)B(tài)分解算法進(jìn)行改進(jìn), 由于CEEMDAN (Complete Ensemble Empirical Mode Decomposition with Adaptive Noise)分解算法所具備的優(yōu)異性能, 因而近些年來被大量學(xué)者所采用, 并且將其與機(jī)器學(xué)習(xí)預(yù)測模型相結(jié)合并應(yīng)用到各個領(lǐng)域, 例如: 股市預(yù)測[13]、風(fēng)速預(yù)測[14]、交通流預(yù)測[15]、電力負(fù)荷預(yù)測[16].然而, 目前尚未有學(xué)者將其運用于原油期貨價格預(yù)測.基于此, 本文采用CEEMDAN 分解算法對原始的原油期貨價格序列進(jìn)行分解, 以期更好地挖掘出原始價格序列的內(nèi)在特征.
PSO-ELM 基于粒子群優(yōu)化的極限學(xué)習(xí)機(jī)模型目前在二氧化碳排放量預(yù)測[17]、太陽能光伏發(fā)電量預(yù)測[18]、交通流量預(yù)測[19]、碳排放權(quán)交易價格預(yù)測[20]等領(lǐng)域均已顯示出其優(yōu)異的預(yù)測性能.然而, 還未曾見到將PSOELM 模型用于原油期貨價格預(yù)測的文獻(xiàn).因此, 本文將PSO-ELM 模型作為基礎(chǔ)預(yù)測模型, 探究其是否可以提升原油期貨價格預(yù)測的精準(zhǔn)性.
綜合已有文獻(xiàn), 多數(shù)學(xué)者針對石油現(xiàn)貨價格展開預(yù)測研究.然而, 隨著商品金融化程度的不斷加深和商品期貨市場規(guī)模的不斷擴(kuò)大, 商品現(xiàn)貨價格逐漸參照期貨進(jìn)行定價, 尤其是石油現(xiàn)貨價格的定價完全參照期貨價格[21].因此, 對原油期貨價格序列展開預(yù)測研究將更具現(xiàn)實意義.基于以上認(rèn)識, 將CEEMDAN 數(shù)據(jù)分解算法和PSO-ELM 粒子群優(yōu)化的極限學(xué)習(xí)機(jī)模型進(jìn)行組合, 本文構(gòu)建出了一種CEEMDAN-PSO-ELM預(yù)測模型, 以期進(jìn)一步提升原油期貨價格預(yù)測的精準(zhǔn)性和穩(wěn)健性.
在經(jīng)典的集合經(jīng)驗?zāi)B(tài)分解過程中, 一定次數(shù)的平均并不能完全抵消所添加的白噪聲序列, 并且重構(gòu)誤差的大小與集成的次數(shù)有關(guān).盡管重構(gòu)誤差會隨著平均次數(shù)的增多而逐漸地減小, 但是所耗費的時間也會增加[16].而在本文采用的CEEMDAN 分解流程中,在每個階段添加有限次數(shù)的自適應(yīng)白噪聲序列, 即可使得重構(gòu)誤差在較少的平均次數(shù)逼近于零.
將原始的原油期貨價格序列記為 x(n ), 則第t(1,2,···,T)次 所添加的白噪聲序列記為λt( n), 因此, 第t次分解的原油期貨價格序列可以被表示為xt(n)=x(n)+λt(n) .將第i 個由EMD 分解算法和CEEMDAN分解算法產(chǎn)生的模態(tài)分量記為: Ei(·)和.參照已有研究[15,16], CEEMDAN 分解步驟如下:
第1 步: 先通過EMD 分解算法對原始原油期貨價格序列進(jìn)行分解, 從而得到第一個模態(tài)分量:
第2 步: 在第一個階段 ( i=1)計算第一個唯一的余量信號:
第3 步: 將實驗重復(fù) t(1 ,2,···,T)次, 在每次實驗過程中, 對信號 r1( n)+ε1E1(λt(n))進(jìn)行分解, 當(dāng)?shù)玫降谝粋€EMD 模態(tài)分量時停止.此時得到第二個模態(tài)分量:
第4 步: 在剩下的每個階段中 (i= 2,3,···,I), 計算第i 個余量信號, 其計算方法與第三步相同.此時, 就可以得到第 i+1個模態(tài)分量:
第5 步: 判斷余量信號的極值點個數(shù)是否至多不超過兩個, 如果是, 則算法停止, 也即此時的余量序列無法繼續(xù)進(jìn)行分解, 則一共得到 I個模態(tài)分量.最終的余量信號可以表示為:
因而, 原始的原油期貨價格序列 x(n) 最終可以被分解成為式(7):
極限學(xué)習(xí)機(jī) (Extreme Learning Machine, ELM)是Huang 等[22]構(gòu)建的一個只含有單個隱含層的前饋神經(jīng)網(wǎng)絡(luò), 對其輸入權(quán)重以及偏置進(jìn)行隨機(jī)的初始化, 并且得到相應(yīng)的權(quán)值.另外, 在訓(xùn)練流程中并不需要對參數(shù)進(jìn)行調(diào)整, 僅需對隱含層的神經(jīng)元個數(shù)進(jìn)行設(shè)置, 就可以得到唯一的最優(yōu)解.具有簡潔高效, 無需調(diào)整參數(shù),學(xué)習(xí)速度快的優(yōu)點[23], ELM 極限學(xué)習(xí)機(jī)的基本網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示.
圖1 ELM 模型結(jié)構(gòu)圖[23]
極限學(xué)習(xí)機(jī)模型由輸入層、隱含層和輸出層構(gòu)成.輸入層有n 個 神經(jīng)元, 分別對應(yīng)著n 個輸入變量; 隱含層有 l 個神經(jīng)元; 輸出層有 m個 神經(jīng)元, 分別對應(yīng)著 m個輸出變量.
PSO 參數(shù)優(yōu)化算法主要是對ELM 模型第i 個輸入層神經(jīng)元與第 j個隱層神經(jīng)元之間的連接權(quán)值 ω以及第j層隱層神經(jīng)元的閾值b 進(jìn)行尋優(yōu), PSO-ELM 模型的主要步驟包括[24]: 第1 步, 初始化粒子群算法的參數(shù)以及ELM 模型的參數(shù), 其中第i個粒子的位置可以被表示為Xi=[ω11,···,ωh1,···,ω1n,···,ωhn,b1,···,bn]; 第2 步,尋找初始極值, 基于粒子的初始位置以及訓(xùn)練集數(shù)據(jù)對ELM 模型進(jìn)行訓(xùn)練, 從而獲取ELM 的輸出值, 進(jìn)一步算出粒子的適應(yīng)度值.另外, 還需搜尋到個體及群體極值, 并且記錄它們的位置及適應(yīng)度值; 第3 步, 選取慣性權(quán)重, 在經(jīng)歷一定次數(shù)的迭代后, 粒子位置逐步趨于最佳, 此時慣性權(quán)重隨著迭代次數(shù)的增加而不斷減小; 第4 步, 進(jìn)行迭代尋優(yōu)操作, 在每一個迭代流程中,粒子依據(jù)個體和群體極值對自己的速度及所處的位置進(jìn)行更新.不斷地重復(fù)迭代流程, 最后即可獲得最優(yōu)個體的粒子位置及適應(yīng)度值; 第5 步, 最優(yōu)個體所對應(yīng)的粒子位置即為ELM 模型的權(quán)值以及隱含層閾值.
Lempel-Ziv 復(fù)雜度指數(shù)是由Lempel 和Ziv[25]通過構(gòu)建算法程序?qū)崿F(xiàn)的, 由于其良好的性能在非線性科學(xué)中得到了廣泛的應(yīng)用[26-28], 其主要被用來衡量序列的復(fù)雜性特征, 序列的Lempel-Ziv 數(shù)值越大, 表明序列的復(fù)雜度越高, 其所包含的周期成分越少, 規(guī)律性越弱,隱含的頻率信息越豐富; 反之, 序列的復(fù)雜度越低, 呈現(xiàn)出一種規(guī)律性特征, 序列會按照一定周期波動, 頻率相應(yīng)較低.本文依據(jù)各個分量的Lempel-Ziv 數(shù)值來進(jìn)行分量的重構(gòu)操作, 以期提高分量重構(gòu)的合理性.由于Lempel-Ziv算法流程較為復(fù)雜和冗長, 鑒于篇幅限制,此處不再贅述, 詳細(xì)流程可見文獻(xiàn)[25].
本文的CEEMDAN-PSO-ELM 原油期貨價格預(yù)測模型構(gòu)建流程如圖2 所示.
圖2 CEEMDAN-PSO-ELM 預(yù)測模型構(gòu)建
遵循已有的“分解”、“重構(gòu)”、“預(yù)測”和“集成”的整體構(gòu)建流程.第1 步, 數(shù)據(jù)分解階段, 先采用魯棒性更優(yōu)的CEEMDAN 分解算法對原油期貨原始價格序列進(jìn)行分解, 進(jìn)而得到若干個IMF (Intrinsic Mode Function)本征模態(tài)分量和一個殘余項; 第二步, 分量重構(gòu)階段, 先計算各個分量的Lempel-Ziv復(fù)雜度指數(shù), 然后按復(fù)雜度數(shù)值的高低進(jìn)行歸類, 從而將分解出的分量進(jìn)行重構(gòu), 最終得到高頻、中頻和低頻分量; 第3 步,重構(gòu)分量預(yù)測階段, 利用PSO-ELM 粒子群優(yōu)化的極限學(xué)習(xí)機(jī)模型對高頻、中頻和低頻分量分別建立相應(yīng)預(yù)測模型, 采用PACF (Partial Auto Correlation Function)偏自相關(guān)系數(shù)選擇預(yù)測模型的輸入變量, 進(jìn)而得到3 個重構(gòu)分量的預(yù)測結(jié)果; 第四步, 預(yù)測結(jié)果集成階段, 也即將高頻、中頻和低頻分量的預(yù)測結(jié)果進(jìn)行加總集成, 進(jìn)而得到最終的原油期貨價格預(yù)測結(jié)果.
本文的預(yù)測模型在理論上具備以下3 點優(yōu)勢: (1) 本文采用了更為穩(wěn)健有效的CEEMDAN 分解算法, 它在分解流程的每一個步驟增添自適應(yīng)噪聲, 然后計算單一的余量信號從而獲取各個模態(tài)分量, 可以有效解決EMD 模態(tài)混疊及EEMD 分解不徹底的問題[16]; (2) 本文選取ELM 極限學(xué)習(xí)機(jī)作為基準(zhǔn)預(yù)測模型, 在其訓(xùn)練過程無需調(diào)整參數(shù), 運行效率較高, 預(yù)測性能較優(yōu).并且, 采用PSO 粒子群優(yōu)化算法對輸入層權(quán)值及隱含層閾值進(jìn)行參數(shù)尋優(yōu), 進(jìn)一步提升ELM 預(yù)測模型的性能.(3) 本文預(yù)測模型遵照已有的“先分解后集成”的經(jīng)典預(yù)測模型建模思路, 將智能分解算法及機(jī)器學(xué)習(xí)預(yù)測模型進(jìn)行組合, 以期充分利用二者的優(yōu)勢, 較經(jīng)典的計量模型及單一智能預(yù)測模型, 本文的預(yù)測模型在理論上更具穩(wěn)健性和有效性.
本文參照龔旭和林伯強(qiáng)[1]的研究設(shè)定, 選取世界上交易量最大, 影響最廣泛的原油期貨合約之一的WTI西德克薩斯中質(zhì)原油月連續(xù)期貨交易合約.樣本區(qū)間跨度從2015 年3 月24 日至2019 年1 月31 日, 共包含1000 個交易日; 參照已有研究[29,30]的區(qū)間劃分方法,將總樣本的前80% (2015-3-24 至2018-4-24, 800 個交易日)作為模型的訓(xùn)練集, 用于訓(xùn)練PSO-ELM 預(yù)測模型, 將剩余的20% (2018-4-25 至2019-1-31, 200 個交易日)作為模型的測試集, 用來測試模型的預(yù)測性能.本文的數(shù)據(jù)均來自WIND 萬德數(shù)據(jù)庫, 文章的實證過程均基于Eviews10 和Matlab 2014 (a)完成.
圖3 給出了WTI 原油期貨價格序列圖, 可以明顯看出, 原油期貨價格序列呈現(xiàn)出明顯的波動性和非平穩(wěn)性.表1 為原油期貨價格序列描述性統(tǒng)計, 其結(jié)果也說明, 原油期貨價格序列較離散, ADF (Augmented Dickey-Fuller)統(tǒng)計值P 值為0.4271, 表明原油期貨價格序列非平穩(wěn).
為了進(jìn)一步檢驗原油期貨價格序列是否存在非線性特征, 本文對其進(jìn)行了BDS (Brock-Decher-Scheikman)檢驗, 從表2 的檢驗結(jié)果可以看出, 嵌入維數(shù)從2 增加到10, P 值均為0, 表明原油期貨價格序列呈現(xiàn)出典型的非線性特征.
圖3 原油期貨日度價格序列圖
表1 原油期貨價格序列描述性統(tǒng)計
樣本的描述性統(tǒng)計和BDS 檢驗表明原始的原油期貨價格序列呈現(xiàn)出典型的波動性、非平穩(wěn)性和非線性特征.為了進(jìn)一步挖掘價格序列的內(nèi)在特征, 本文采用CEEMDAN 分解算法對原油期貨價格序列進(jìn)行分解, 共得到9 個IMF 本征模態(tài)分量和1 個殘余項, 如圖4 所示.
表2 原油期貨價格序列非線性檢驗結(jié)果
圖4 原油期貨價格序列CEEMDAN 分解結(jié)果
為了使分量重構(gòu)過程更加科學(xué), 此處依據(jù)Lempel-Ziv 復(fù)雜度指數(shù)的數(shù)值來對分量進(jìn)行重構(gòu), 從表3 的復(fù)雜度計算結(jié)果可以看出, IMF1~I(xiàn)MF4 的復(fù)雜度數(shù)值較大, 說明前4 個分量所包含的周期成分較少, 變化規(guī)律性低, 序列趨于一種隨機(jī)狀態(tài); IMF5~I(xiàn)MF7的復(fù)雜度數(shù)值處于中等水平, 表明中間3 個分量存在一定的規(guī)律性,包含的頻率成分相對較少; IMF8、IMF9和殘余項的復(fù)雜度數(shù)值均小于0.1, 表明這3 個分量的周期性和規(guī)律性較強(qiáng), 序列復(fù)雜度較低.因此, 本文將前4 個分量IMF1~I(xiàn)MF4 重組為高頻分量, 中間3 個分量IMF5~I(xiàn)MF7 重組為中頻分量, 剩余的兩個分量以及殘余項重組為低頻分量, 分量重構(gòu)結(jié)果如圖5 所示.
表3 Lempel-Ziv 復(fù)雜度指數(shù)計算結(jié)果
圖5 原油期貨價格序列分量重構(gòu)結(jié)果
圖5 所給出的分量重構(gòu)結(jié)果同樣具備一定的經(jīng)濟(jì)含義[10], 高頻分量呈現(xiàn)出十分復(fù)雜的序列特征, 代表著短期的市場波動因素, 這種短期因素所引起的原油期貨價格序列的波動是不可持續(xù)的, 且方向不定, 頻率較高; 中頻分量的波動特征相對平緩, 代表著重大事件對原油期貨價格序列的影響, 這種因素使得原油期貨價格發(fā)生大幅度變化, 且持續(xù)時間較長, 但是最終會恢復(fù)到長期趨勢線上; 低頻分量呈現(xiàn)出非常平緩的趨勢特征, 代表著原油期貨價格的長期走向, 不易受到市場及外部環(huán)境因素的沖擊, 可以通過低頻分量預(yù)測未來的原油期貨價格的大致走勢.
在完成了分量重構(gòu)以后, 便可以對高頻、中頻和低頻重構(gòu)分量分別建立PSO-ELM 預(yù)測模型, 而在機(jī)器學(xué)習(xí)模型初始訓(xùn)練階段, 參數(shù)的設(shè)定以及模型輸入變量的選取都會對模型的預(yù)測效果造成顯著影響,在參考了大量研究后, 本文的預(yù)測模型參數(shù)設(shè)定如下: PSO參數(shù)尋優(yōu)算法的初始種群大小為25, 最大迭代次數(shù)為200, 慣性權(quán)重 wmin=0.8,wmax=1.2 ,加速因子c1=c2=2.0.利用PSO 對ELM 極限學(xué)習(xí)機(jī)模型進(jìn)行參數(shù)尋優(yōu)操作; ELM 模型的隱含節(jié)點設(shè)定為30, 隱含層節(jié)點輸出權(quán)值范圍為[-1, 1], 隱含層節(jié)點閾值取值范圍為[0, 1], 輸入層個數(shù)即為輸入變量的個數(shù) (需根據(jù)具體的預(yù)測分量而定).在預(yù)測模型的參數(shù)設(shè)定好了以后, 還需要確定高頻、中頻和低頻分量預(yù)測模型的輸入變量,本文采用PACF 偏自相關(guān)系數(shù)[29,31]來進(jìn)行判定.本文最終的輸入變量選擇結(jié)果如表4 所示.
表4 輸入變量選擇結(jié)果
圖6-圖8 分別給出了高頻、中頻和低頻分量的預(yù)測結(jié)果.
從圖6-圖8 可以明顯地看出, 中頻分量和低頻分量的預(yù)測效果顯著優(yōu)于高頻分量.原因可能是高頻分量的序列復(fù)雜度較高, 序列中所包含的規(guī)律性特征較少, 因而利用極限學(xué)習(xí)機(jī)模型對高頻分量進(jìn)行預(yù)測仍然存在一定的誤差.將高頻、中頻和低頻分量各自的預(yù)測結(jié)果進(jìn)行加總集成, 便得到了最終的原油期貨價格預(yù)測結(jié)果.
圖9 顯示CEEMDAN-PSO-ELM 模型的預(yù)測結(jié)果.
從圖9 可以清晰地看出, CEEMDAN-PSO-ELM 模型的預(yù)測值與真實值高度接近.為了更加科學(xué)穩(wěn)健體現(xiàn)本文所構(gòu)建模型的優(yōu)異預(yù)測性能, 還需與本文所選取的基準(zhǔn)預(yù)測模型進(jìn)行預(yù)測效果的對比分析.
圖6 高頻分量預(yù)測結(jié)果
圖7 中頻分量預(yù)測結(jié)果
圖8 低頻分量預(yù)測結(jié)果
圖9 CEEMDAN-PSO-ELM 預(yù)測結(jié)果
為了科學(xué)穩(wěn)健地體現(xiàn)出本文所構(gòu)建的CEEMDANPSO-ELM 模型的優(yōu)越性, 本文另外選取了15 個基準(zhǔn)對比預(yù)測模型.在對比模型的選取上, 本文主要基于以下3 個方面的考量: (1)選取BPNN、SVR、ANFIS 和ELM 4 種單一的機(jī)器學(xué)習(xí)預(yù)測模型, 利用模型自身內(nèi)部算法學(xué)習(xí)能力對原油期貨價格進(jìn)行預(yù)測; (2)采用PSO 粒子群參數(shù)優(yōu)化算法對4 種單一預(yù)測模型的參數(shù)進(jìn)行尋優(yōu), 以期提升它們的預(yù)測性能; (3)分別將EEMD 和CEEMDAN 兩種分解算法與經(jīng)過PSO 參數(shù)優(yōu)化的4 種預(yù)測模型相結(jié)合.
通過分組對比, 可證明本文構(gòu)建的預(yù)測模型性能的優(yōu)越性, 也可體現(xiàn)出CEEMDAN 分解算法及PSO 粒子群參數(shù)優(yōu)化算法的有效性, 還能體現(xiàn)出組合預(yù)測較單一預(yù)測模型的優(yōu)勢.另外, 此處采用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)、Theil 不等系數(shù)(TIC)以及平均方向精準(zhǔn)度(MDA)作為各模型預(yù)測效果評價指標(biāo), 本文相關(guān)計算公式如式(8)-式(12).其中, T 表示預(yù)測樣本數(shù), Yt代表t 時刻的原油期貨價格真實值, Pt代表t時刻的原油期貨價格預(yù)測值.RMSE、MAE、MAPE 和TIC 都是預(yù)測誤差衡量指標(biāo), 值越小表明模型的預(yù)測效果越好;MDA 是衡量原油期貨價格預(yù)測結(jié)果趨勢與真實原油期貨價格趨勢一致程度的指標(biāo), 值越大說明模型預(yù)測結(jié)果方向精準(zhǔn)度越高.
圖10 和表5 給出了本文16 種預(yù)測模型的預(yù)測效果對比.
圖10 模型預(yù)測結(jié)果對比圖
從圖10 和表5 中可以清晰地看出: 各個機(jī)器學(xué)習(xí)預(yù)測模型均具備一定的預(yù)測性能; PSO 粒子群優(yōu)化算法提升了BPNN、ANFIS、SVR 和ELM 等4 種單一預(yù)測模型的預(yù)測性能; 將機(jī)器學(xué)習(xí)預(yù)測模型與數(shù)據(jù)分解算法相結(jié)合可以顯著地提升單一預(yù)測模型的預(yù)測性能; 本文所采用的CEEMDAN 數(shù)據(jù)分解算法的表現(xiàn),在一定程度上優(yōu)于常用的EEMD 數(shù)據(jù)分解算法; 而ELM 極限學(xué)習(xí)機(jī)模型在單一預(yù)測模型中的預(yù)測性能最佳, 表明本文選取ELM 模型作為基礎(chǔ)預(yù)測模型具備一定的合理性; 本文構(gòu)建的CEEMDAN-PSO-ELM 預(yù)測模型不僅預(yù)測誤差指標(biāo)數(shù)值最低, 且方向精準(zhǔn)性指標(biāo)數(shù)值最高, 表明其預(yù)測性能最佳.為了保證本文實證結(jié)果的穩(wěn)健性, 還需要進(jìn)一步進(jìn)行MCS (Model Confidence Set)以及DM (Diebold-Mariano)預(yù)測性能穩(wěn)健性檢驗.
MCS 檢驗是由Hansen 等[32]提出的衡量模型預(yù)測性能的一種方法, 相較SPA (Superior Predictive Ability)更穩(wěn)健.由于篇幅限制, MCS 檢驗的理論框架及流程詳見Hansen 等[32]、Zhang 等[33].為了得到MCS 檢驗中的各統(tǒng)計量以及 p值, 本文參照雷立坤等[34]的做法,將MCS 檢驗的參數(shù)設(shè)置如下: d=2 (block length), 模擬次數(shù)B=10 000 次作為Bootstrap 過程的控制參數(shù),MCS 檢驗的顯著性水平 α取值為0.1, 也即 p值大于0.1 的模型將幸存下來.
DM 檢驗是由Diebold 和Mariano[35]提出一種衡量模型預(yù)測效果的方法, DM 檢驗的原假設(shè)是目標(biāo)模型A 的預(yù)期預(yù)測精準(zhǔn)性與基準(zhǔn)模型B 的預(yù)測精準(zhǔn)性一致, 因此原假設(shè)可以表示為:
式中,
表6 和表7 分別給出了模型預(yù)測結(jié)果的MCS 穩(wěn)健性檢驗和DM 穩(wěn)健性檢驗結(jié)果, 從中可以看出, 本文所構(gòu)建的CEEMDAN-PSO-ELM 原油期貨價格預(yù)測模型相較于其他15 種基準(zhǔn)模型預(yù)測性能最佳, EEMDPSO-ELM 模型的預(yù)測性能僅次于CEEMDAN-PSOELM 模型, 其余結(jié)論與3.4 節(jié)一致, 此處不再贅述.
表5 模型預(yù)測效果對比表
原油期貨價格序列具有典型的非平穩(wěn)、非線性以及多頻率特征, 鑒于原油期貨價格序列預(yù)測的復(fù)雜性,本文構(gòu)建了一種CEEMDAN-PSO-ELM 預(yù)測模型, 在本文的樣本區(qū)間內(nèi), 得出以下實證結(jié)論: (1) 利用PSO粒子群參數(shù)優(yōu)化算法對SVR、ANFIS、BPNN 和ELM等4 種單一預(yù)測模型參數(shù)進(jìn)行優(yōu)化, 可以顯著提升單一預(yù)測模型的預(yù)測性能; (2) ELM 極限學(xué)習(xí)機(jī)的預(yù)測性能優(yōu)于SVR、ANFIS 和BPNN 等3 種單一預(yù)測模型;(3) 將數(shù)據(jù)分解算法與機(jī)器學(xué)習(xí)預(yù)測模型相結(jié)合可以顯著提升其預(yù)測性能; (4) 本文所構(gòu)建的CEEMDANPSO-ELM 原油期貨價格預(yù)測模型與其余基準(zhǔn)預(yù)測模型相比預(yù)測性能最佳, 并且具備一定穩(wěn)健性.本文的研究成果可以為期貨市場投資者及監(jiān)管者提供有力的決策參考, 同時為原油期貨價格預(yù)測領(lǐng)域提供一種的新的視角和方法.
不可否認(rèn)的是, 本文的預(yù)測模型也存在一定的不足之處: 第一, PSO 粒子群參數(shù)優(yōu)化算法在運行過程中可能會陷入局部極值, 導(dǎo)致參數(shù)尋優(yōu)效果不佳; 第二,在輸入變量的選取上, 本文沒有考慮到現(xiàn)實中影響原油期貨價格變動的因素.因而, 可以從以下兩方面改進(jìn)預(yù)測模型: 第一, 將粒子群算法與其他的參數(shù)優(yōu)化算法相結(jié)合 (例如粒子群算法與引力搜索算法結(jié)合-PSOGSA算法)對機(jī)器學(xué)習(xí)預(yù)測模型進(jìn)行參數(shù)尋優(yōu); 第二, 優(yōu)化預(yù)測模型輸入變量的選取方法, 可以在模型輸入變量選取上考慮更多的現(xiàn)實影響因素.
表6 MCS 檢驗結(jié)果
表7 DM 檢驗結(jié)果