張冰心
摘 要 國(guó)際原油一直是影響世界經(jīng)濟(jì)發(fā)展的重要指標(biāo)。原油價(jià)格的走勢(shì)深深地影響了其他資產(chǎn)的變動(dòng),因此對(duì)原油價(jià)格的分析十分重要。本文使用SVM模型對(duì)國(guó)際原油價(jià)格進(jìn)行預(yù)測(cè),對(duì)WTI的歷史價(jià)格數(shù)據(jù)進(jìn)行建模,得到的預(yù)測(cè)誤差的MAE為2.98%,對(duì)比時(shí)間序列算法有較大提升。
關(guān)鍵詞 原油價(jià)格 SVM模型 參數(shù)優(yōu)化
一、緒論
石油深深地影響了世界經(jīng)濟(jì)的發(fā)展,帶來(lái)了能源的革命。作為基礎(chǔ)的工業(yè)生產(chǎn)原料,原油價(jià)格的變動(dòng)會(huì)給世界經(jīng)濟(jì)帶來(lái)重要的影響。很多經(jīng)濟(jì)指標(biāo)都同原油的價(jià)格有密切聯(lián)系,比如美元、黃金等資產(chǎn)的價(jià)格走勢(shì),同原油價(jià)格都有一定的關(guān)系。因此,對(duì)原油價(jià)格的預(yù)測(cè)是金融界以及學(xué)術(shù)界關(guān)注的熱點(diǎn)。
傳統(tǒng)的金融學(xué)者一般用時(shí)間序列等傳統(tǒng)的計(jì)量模型對(duì)原油價(jià)格進(jìn)行分析,但是這些模型的假設(shè)較強(qiáng),效果較差。近年來(lái)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘技術(shù)發(fā)展迅猛,在不同領(lǐng)域得到了很好的應(yīng)用,同時(shí),隨著計(jì)算機(jī)技術(shù)的發(fā)展,獲取海量數(shù)據(jù)并計(jì)算海量數(shù)據(jù)變得較為容易,其中,支持向量機(jī)(SVM)模型是一種效果較好、應(yīng)用較多的模型。因此,本文嘗試使用支持向量機(jī)(SVM)模型對(duì)WTI原油價(jià)格進(jìn)行建模,預(yù)測(cè)價(jià)格的走勢(shì)。
二、模型介紹
支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱SVM)是一種分類算法,將低維空間數(shù)據(jù)映射到高維空間,從而找到劃分邊界來(lái)對(duì)樣本進(jìn)行劃分。在求解該問(wèn)題時(shí),對(duì)于線性不可分的數(shù)據(jù),SVM使用了核函數(shù)來(lái)處理。核函數(shù)可以在高維空間對(duì)數(shù)據(jù)進(jìn)行劃分,從而將非線性最優(yōu)化問(wèn)題轉(zhuǎn)變?yōu)榫€性可分問(wèn)題,本文使用的是高斯核函數(shù)。
實(shí)證分析:
本文使用的WTI原油價(jià)格數(shù)據(jù)范圍為2004年1月1日到2017年12月31日,時(shí)間頻率為每日。為了分析預(yù)測(cè)效果,本文采用2004年1月1日到2016年12月31日的數(shù)據(jù)作為訓(xùn)練樣本,2017年的數(shù)據(jù)作為測(cè)試樣本。
為了建立模型,本文選擇美元指數(shù)(Usdx)、黃金現(xiàn)貨價(jià)格(Gldx)、MSCI全球指數(shù)(Msci)、彭博大宗商品指數(shù)(Bcom)、原油庫(kù)存指數(shù)(Oilstock)為維度,進(jìn)行相關(guān)性分析后,Msci的統(tǒng)計(jì)相關(guān)性較弱,因此過(guò)濾該指標(biāo),其余指標(biāo)的統(tǒng)計(jì)檢驗(yàn)具有顯著性,因此納入建模的維度之中。對(duì)于模型的評(píng)價(jià)使用絕對(duì)誤差(MAE),該值越小,預(yù)測(cè)精度越高。
本文使用Python的Sklearn包中的SVM函數(shù)進(jìn)行建模,Sklearn是機(jī)器學(xué)習(xí)包,實(shí)現(xiàn)了若干的機(jī)器學(xué)習(xí)算法。SVM函數(shù)有一些參數(shù)需要優(yōu)化,本文采用遺傳算法進(jìn)行優(yōu)化,得到W(權(quán)重參數(shù))=(0.47,0.53)、C(懲罰參數(shù))=2.0、Gamma(核函數(shù)參數(shù))=1.65。
本文在測(cè)試時(shí)使用模型的最優(yōu)參數(shù)進(jìn)行樣本外測(cè)試,同時(shí)為了對(duì)比效果,使用ARIMA算法進(jìn)行對(duì)比分析。最終SVM的MSE為2.98%,ARIMA的MSE為7.23%。從樣本測(cè)試結(jié)果中可以得出,SVM算法的表現(xiàn)遠(yuǎn)遠(yuǎn)好于傳統(tǒng)的時(shí)間序列預(yù)測(cè)ARIMA 算法。SVM算法在MAE上提高了4.25%,算法在樣本外數(shù)據(jù)測(cè)試如圖1所示。
三、結(jié)語(yǔ)
本文使用支持向量機(jī)SVM模型對(duì)WTI價(jià)格數(shù)據(jù)進(jìn)行了建模分析,建模語(yǔ)言采用Python。通過(guò)分析實(shí)證數(shù)據(jù),可以看到SVM算法對(duì)比傳統(tǒng)的時(shí)間序列ARIMA算法,在正則均方誤差(NMSE)上提高了4.25%,準(zhǔn)確率有了較大提升,驗(yàn)證了該算法的有效性。
(作者單位為西南財(cái)經(jīng)大學(xué))
參考文獻(xiàn)
[1] Dechow P,Sloan R . Returns to contrarian investment strategies:Tests of naive expectations hypotheses[J]. Journal of Financial Economics,1997,43(1):3-27.
[2] 鄒運(yùn).基于遺傳算法的風(fēng)格選股模型研究[D].東北財(cái)經(jīng)大學(xué),2012.
[3] 蔣漢橋.基于支持向量機(jī)的證券投資決策研究[D].武漢大學(xué),2005.