駱 樺,陳艷飛
(浙江理工大學(xué)理學(xué)院,杭州 310018)
?
基于小波與動(dòng)態(tài)GM(1,1)-ARIMA模型的股價(jià)預(yù)測(cè)研究
駱 樺,陳艷飛
(浙江理工大學(xué)理學(xué)院,杭州 310018)
針對(duì)傳統(tǒng)時(shí)間序列股價(jià)預(yù)測(cè)模型的時(shí)間滯后性,提出一種基于小波與動(dòng)態(tài)GM(1,1)-ARIMA的股價(jià)預(yù)測(cè)模型。運(yùn)用小波分析對(duì)股價(jià)數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)小波重構(gòu)序列建立ARIMA模型,考慮預(yù)測(cè)過(guò)程中未來(lái)因素對(duì)系統(tǒng)的影響,建立動(dòng)態(tài)GM(1,1)模型。選取滬深300指數(shù)進(jìn)行實(shí)證分析,結(jié)果表明所提出的小波與動(dòng)態(tài)GM(1,1)-ARIMA模型與傳統(tǒng)股價(jià)預(yù)測(cè)模型相比,其預(yù)測(cè)精度最高。
股價(jià);小波分析;動(dòng)態(tài)GM(1,1);ARIMA模型
目前,預(yù)測(cè)股價(jià)的方法很多,其中基于簡(jiǎn)單統(tǒng)計(jì)和傳統(tǒng)股價(jià)技術(shù)分析的預(yù)測(cè)方法大都存在滯后性且預(yù)測(cè)效果不理想。采用小波分析、神經(jīng)網(wǎng)絡(luò)、灰色預(yù)測(cè)等進(jìn)行股價(jià)預(yù)測(cè)的方法是對(duì)傳統(tǒng)預(yù)測(cè)方法的優(yōu)化,國(guó)內(nèi)外學(xué)者做了大量實(shí)證研究。劉向麗等[1]通過(guò)小波分析建立ARMA模型對(duì)股指期貨進(jìn)行分析預(yù)測(cè),發(fā)現(xiàn)該模型在高頻預(yù)測(cè)方面優(yōu)于傳統(tǒng)ARMA模型;肖燕君等[2]運(yùn)用小波對(duì)股價(jià)序列進(jìn)行分解,對(duì)不同尺度信號(hào)進(jìn)行預(yù)測(cè),預(yù)測(cè)的精度比傳統(tǒng)模型高;Lahmiri[3]和Jammazi等[4]采用小波變換對(duì)金融時(shí)間序列進(jìn)行預(yù)測(cè),Hsieh等[5]采用小波分析對(duì)道瓊斯工業(yè)平均指數(shù)、倫敦富時(shí)100指數(shù)和臺(tái)灣證交所市值加權(quán)指數(shù)進(jìn)行研究和預(yù)測(cè),發(fā)現(xiàn)基于小波分析的預(yù)測(cè)模型精度更高。然而,小波分析在分解和重構(gòu)時(shí)均會(huì)產(chǎn)生誤差,單一的小波分析在預(yù)測(cè)時(shí)會(huì)造成一定的誤差。孫冰潔等[6]運(yùn)用小波與神經(jīng)網(wǎng)絡(luò)的組合模型對(duì)股價(jià)進(jìn)行預(yù)測(cè),石鴻雁等[7]采用小波分解與重構(gòu)的ARIMA模型對(duì)股價(jià)預(yù)測(cè)。以上研究表明,運(yùn)用小波分析對(duì)原始數(shù)據(jù)序列進(jìn)行分解重構(gòu),對(duì)重構(gòu)后的序列建立ARIMA模型,能進(jìn)一步提高模型的預(yù)測(cè)精度,但由于ARIMA模型是線性模型,預(yù)測(cè)時(shí)會(huì)造成時(shí)間滯后性,而灰色模型在短期預(yù)測(cè)能不斷更新調(diào)整,從而使得預(yù)測(cè)結(jié)果更為準(zhǔn)確。張宇敬等[8]運(yùn)用灰色預(yù)測(cè)模型對(duì)股價(jià)進(jìn)行預(yù)測(cè),駱樺等[9]、Kara等[10]運(yùn)用神經(jīng)網(wǎng)絡(luò)對(duì)期權(quán)價(jià)格進(jìn)行預(yù)測(cè),發(fā)現(xiàn)灰色系統(tǒng)和神經(jīng)網(wǎng)絡(luò)對(duì)于短期價(jià)格預(yù)測(cè)具有較高精度,但對(duì)于長(zhǎng)時(shí)期預(yù)測(cè),模型的預(yù)測(cè)精度將降低。
考慮到各種股價(jià)預(yù)測(cè)模型的優(yōu)缺點(diǎn),本文提出一種基于小波與動(dòng)態(tài)GM(1,1)-ARIMA模型的股價(jià)預(yù)測(cè)方法。采用小波分析對(duì)原始金融時(shí)間序列進(jìn)行分解重構(gòu),得到高頻數(shù)據(jù)和低頻數(shù)據(jù),分別運(yùn)用動(dòng)態(tài)GM(1,1)模型對(duì)高頻數(shù)據(jù)和ARIMA模型對(duì)低頻數(shù)據(jù)進(jìn)行擬合建模并預(yù)測(cè),二者預(yù)測(cè)值之和為模型最終預(yù)測(cè)結(jié)果。本文以滬深300指數(shù)為實(shí)證分析驗(yàn)證所提出模型的可行性,同時(shí)比較單一的灰色模型、單一的ARIMA模型與本文所提出的模型對(duì)滬深300指數(shù)的預(yù)測(cè)精度,以驗(yàn)證本文所提出模型的有效性。
滬深300指數(shù)是由滬深兩個(gè)證券市場(chǎng)中具有代表性的股票編制,能反映滬深兩個(gè)市場(chǎng)的整體走勢(shì)和市場(chǎng)主流投資的收益情況。本文選取滬深300指數(shù)作為研究對(duì)象,從同花順證券交易軟件下載滬深300指數(shù)2016年1月4日至2017年1月19日共257個(gè)交易日的收盤(pán)價(jià)作為實(shí)證分析的原始數(shù)據(jù)。其中2016年1月4日至2016年12月28日共242個(gè)交易日的收盤(pán)價(jià)數(shù)據(jù)為樣本內(nèi)數(shù)據(jù),其余15個(gè)交易日的收盤(pán)價(jià)數(shù)據(jù)為樣本外數(shù)據(jù)。滬深300指數(shù)的收盤(pán)價(jià)序列如圖1所示。
圖1 滬深300指數(shù)收盤(pán)價(jià)原始數(shù)據(jù)
2.1 小波與動(dòng)態(tài)GM(1,1)-ARIMA模型理論
2.1.1 小波分析理論
(1)
2.1.2 動(dòng)態(tài)GM(1,1)模型理論
對(duì)微分方程進(jìn)行求解,得到{x(1)}的時(shí)間響應(yīng)方程:
(2)
將{x(1)}序列進(jìn)行累減運(yùn)算,得到原始數(shù)據(jù)序列x(0)的預(yù)測(cè)方程:
(3)
2.1.3ARIMA模型理論
對(duì)于隨機(jī)序列{xt}定義模型ARIMA(p,d,q),該模型的結(jié)構(gòu)為:
Φ(B)=1-φ1B-φ2B2-…-φpBp,
Θ(B)=1-θ1B-θ2B2-…-θqBq.
該模型稱為求和自回歸移動(dòng)平均模型,記為ARIMA(p,d,q),其中:p為自回歸階數(shù);d為差分階數(shù);q為移動(dòng)平均階數(shù)。
2.2 滬深300指數(shù)的實(shí)證分析
2.2.1 滬深300指數(shù)的小波分析
對(duì)數(shù)據(jù)進(jìn)行小波分析時(shí),選取不同的小波基函數(shù),其信號(hào)的時(shí)頻域局部化能力不同,因此需選取合適的小波基函數(shù)。對(duì)滬深300指數(shù)數(shù)據(jù)采用多種小波基函數(shù)進(jìn)行實(shí)驗(yàn),對(duì)比分析后本文選取實(shí)驗(yàn)結(jié)果最佳的coif3小波基函數(shù)進(jìn)行尺度為3層的小波分解與重構(gòu)。滬深300指數(shù)的高頻重構(gòu)系數(shù)與低頻重構(gòu)系數(shù)重構(gòu)圖,如圖2所示。設(shè)第三層的低頻重構(gòu)系數(shù)為A3;第一層到第三層的高頻重構(gòu)系數(shù)分別為D1、D2和D3。
圖2 滬深300指數(shù)的小波重構(gòu)系數(shù)
從圖2中可以看出,與滬深300指數(shù)的原始價(jià)格序列圖相比,小波重構(gòu)數(shù)據(jù)的日歷效應(yīng)減弱,重構(gòu)信號(hào)表現(xiàn)出低頻數(shù)據(jù)趨勢(shì)性明顯,高頻數(shù)據(jù)周期性突出。重構(gòu)后的信號(hào)對(duì)原始數(shù)據(jù)起到平滑去噪的作用。
2.2.2 建立高頻數(shù)據(jù)的動(dòng)態(tài)GM(1,1)模型
對(duì)小波重構(gòu)后的細(xì)節(jié)序列(高頻重構(gòu)系數(shù))D1、D2、D3分別建立動(dòng)態(tài)GM(1,1)模型。首先對(duì)序列的非負(fù)性進(jìn)行檢驗(yàn),如果序列存在負(fù)數(shù)值,則對(duì)序列加上一個(gè)合適的常數(shù)C進(jìn)行修正使其變成非負(fù)的時(shí)間序列,再基于傳統(tǒng)靜態(tài)灰色GM(1,1)模型,不斷更新建模的原始序列{x(0)},最后建立動(dòng)態(tài)GM(1,1)模型,并將其初始預(yù)測(cè)值減去常數(shù)C,得到最終的預(yù)測(cè)值X(t+i)1,X(t+i)2,X(t+i)3。由于動(dòng)態(tài)GM(1,1)模型會(huì)對(duì)原始序列進(jìn)行不斷更新,每一個(gè)預(yù)測(cè)值對(duì)應(yīng)的方程都會(huì)不同,則在此列出每個(gè)預(yù)測(cè)值對(duì)應(yīng)的發(fā)展灰數(shù)a與內(nèi)生控制灰數(shù)u意義不大,運(yùn)用Matlab軟件可得出三個(gè)細(xì)節(jié)序列動(dòng)態(tài)灰色GM(1,1)模型未來(lái)i期的預(yù)測(cè)值X(t+i)1,X(t+i)2,X(t+i)3。
2.2.3 建立低頻數(shù)據(jù)的ARIMA模型
將小波重構(gòu)后的近似序列作為ARIMA模型建模的原始時(shí)間序列,首先根據(jù)序列的平穩(wěn)性、序列的自相關(guān)和偏自相關(guān)系數(shù)圖的特征,建立合適的ARIMA模型,再經(jīng)過(guò)反復(fù)篩選,選取最佳的模型,最后確定為ARIMA(2,1,1),模型的系數(shù)見(jiàn)表1。
表1 近似序列ARIMA(2,1,1)模型參數(shù)
由表1可知,ARIMA(2,1,1)模型的回歸系數(shù)檢驗(yàn)值p均小于模型系數(shù)顯著性檢驗(yàn)時(shí)給定的顯著性水平值0.05,說(shuō)明模型的系數(shù)顯著不為0。進(jìn)一步檢驗(yàn)?zāi)P偷挠行裕唧w結(jié)果如圖3所示。圖3中殘差序列的ACF值在0附近,殘差序列白噪聲檢驗(yàn)的LB統(tǒng)計(jì)量概率檢驗(yàn)p值為0,則拒絕殘差序列不是白噪聲的原假設(shè),得到ARIMA(2,1,1)模型的殘差序列為白噪聲序列,說(shuō)明該模型可行。
圖3 ARIMA(2,1,1)模型的檢驗(yàn)
2.2.4 滬深300指數(shù)的預(yù)測(cè)與模型的比較
滬深300指數(shù)未來(lái)i期的收盤(pán)價(jià)C(t+i)可表示為:
C(t+i)=X(t+i)1+X(t+i)2+X(t+i)3+Yt+i,i=1,2,…,15.
將2016年1月4日至2016年12月28日滬深300指數(shù)242個(gè)交易日的收盤(pán)價(jià)數(shù)據(jù)用于建模,2016年12月29日至2017年1月19日的15個(gè)數(shù)據(jù)作為模型預(yù)測(cè)結(jié)果的檢驗(yàn)數(shù)據(jù)。為驗(yàn)證基于小波與動(dòng)態(tài)GM(1,1)-ARIMA模型在股價(jià)預(yù)測(cè)中的可行性,將其與其它模型的預(yù)測(cè)結(jié)果進(jìn)行比較,各個(gè)模型的預(yù)測(cè)結(jié)果見(jiàn)表2。
表2 各個(gè)模型預(yù)測(cè)值
由表2可知,與傳統(tǒng)灰色GM(1,1)、ARIMA和單一的動(dòng)態(tài)灰色GM(1,1)模型相比,小波與動(dòng)態(tài)GM(1,1)-ARIMA模型的預(yù)測(cè)值更接近滬深300指數(shù)的實(shí)際值,可見(jiàn)小波與動(dòng)態(tài)GM(1,1)-ARIMA模型對(duì)股價(jià)預(yù)測(cè)的準(zhǔn)確性最高。
選用平均預(yù)測(cè)誤差(MFE)、平均絕對(duì)百分誤差(MAPE)和平均絕對(duì)誤差(MAD)三個(gè)指標(biāo)度量各模型的預(yù)測(cè)精度。MFE能很好地衡量模型無(wú)偏性,MFE趨近于0,說(shuō)明預(yù)測(cè)模型無(wú)偏;MAPE的值小于10,說(shuō)明模型的預(yù)測(cè)精度高;MAD能較好地反應(yīng)預(yù)測(cè)精度。各誤差的計(jì)算公式如下:
各個(gè)模型的精度比較結(jié)果見(jiàn)表3。
表3 模型預(yù)測(cè)誤差
由表3可知,小波與動(dòng)態(tài)GM(1,1)-ARIMA模型的平均絕對(duì)誤差(MAD)值為18.23,平均絕對(duì)百分誤差(MAPE)值為0.08,平均預(yù)測(cè)誤差(MFE)值為-0.39。在四個(gè)模型中,基于小波與動(dòng)態(tài)GM(1,1)-ARIMA模型的三個(gè)誤差值最小,說(shuō)明該模型預(yù)測(cè)精度最高。
針對(duì)傳統(tǒng)ARIMA模型和灰色GM(1,1)對(duì)股價(jià)預(yù)測(cè)精度較低的問(wèn)題,提出基于小波與動(dòng)態(tài)GM(1,1)-ARIMA模型的股價(jià)預(yù)測(cè)模型。運(yùn)用小波對(duì)建模數(shù)據(jù)進(jìn)行預(yù)處理,有利于提高預(yù)測(cè)模型的精度。選取具有代表性的滬深300指數(shù)進(jìn)行實(shí)證分析,得出本文所提出的預(yù)測(cè)模型的精度高于單一灰色GM(1,1)模型、ARIMA模型,且其預(yù)測(cè)結(jié)果與實(shí)際值吻合程度高,能為投資者投資、決策提供實(shí)際參考價(jià)值。
[1] 劉向麗,王旭朋.基于小波分析的股指期貨高頻預(yù)測(cè)研究[J].系統(tǒng)工程理論與實(shí)踐,2015,35(6):1425-1432.
[2] 肖燕君,張華,任若恩.基于小波多尺度分析的股票價(jià)格組合預(yù)測(cè)方法[J].工業(yè)工程,2011,14(6):133-137.
[3] LAHMIRI S. Wavelet low- and high-frequency components as features for predicting stock prices with backpropagation neural networks[J]. Journal of King Saud University-Computer and Information Sciences,2013,26(2):218-227.
[4] JAMMAZI R, ALOUI C. Crude oil price forecasting: Experimental evidence from wavelet decomposition and neural network modeling[J]. Energy Economics,2012,34(3):828-841.
[5] HSIEH T J, HSIAO H F, YEH W C. Forecasting stock markets using wavelet transforms and recurrent neural networks: An integrated system based on artificial bee colony algorithm[J]. Applied Soft Computing,2011,11(2):2510-2525.
[6] 孫冰潔,唐瑞,左毅.小波分析下的神經(jīng)網(wǎng)絡(luò)股票預(yù)測(cè)研究[J].計(jì)算機(jī)與數(shù)字工程,2016,44(6):1031-1034.
[7] 石鴻雁,尤作軍,陳忠菊.基于小波分析的ARIMA模型對(duì)上證指數(shù)的分析與預(yù)測(cè)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2014,44(23):66-72.
[8] 張宇敬,李倩,蔡虎.基于灰色預(yù)測(cè)模型的股價(jià)預(yù)測(cè)研究[J].金融教學(xué)與研究,2013(6):50-52.
[9] 駱樺,劉興.基于主成分分析的神經(jīng)網(wǎng)絡(luò)算法對(duì)期權(quán)價(jià)格預(yù)測(cè)研究[J].浙江理工大學(xué)學(xué)報(bào),2017,37(1):122-126.
[10] KARA Y, MELEK A B, BAYKANC?K. Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul Stock Exchange[J]. Expert Systems with Applications,2011,38(5):5311-5319.
(責(zé)任編輯: 康 鋒)
The Research of Stock Price Prediction Based on the Wavelet Dynamic GM (1,1)-ARIMA Model
LUOHua,CHENYanfei
(School of Sciences, Zhejiang Sci-Tech University, Hangzhou 310018, China)
Aiming at the time lag of the traditional time series stock price forecasting model, a stock price forecasting model based on wavelet and dynamic GM (1,1)-ARIMA model is proposed. The data were pretreated by wavelet analysis. Based on wavelet reconstruction sequences, the ARIMA model was established and the dynamic GM(1,1) modelconsidering the influence of future factors on the system was established. We do the empirical analysis on Shanghai and shenzhen 300 index, the results show that compared with the traditional stock price forecasting model, the proposed GM (1,1)-ARIMA model has the highest prediction accuracy.
stock price; wavelet analysis; dynamic GM (1,1); ARIMA model
10.3969/j.issn.1673-3851.2017.07.018
2017-03-16 網(wǎng)絡(luò)出版日期: 2017-05-24
國(guó)家自然科學(xué)基金項(xiàng)目(11671358)
駱 樺(1962-),男,浙江諸暨人,副教授,碩士,主要從事金融數(shù)學(xué)和數(shù)理統(tǒng)計(jì)方面的研究。
F830.91
A
1673- 3851 (2017) 04- 0575- 05