[摘 要]本文旨在以時(shí)間序列模型為基礎(chǔ),選擇紫金礦業(yè)日收盤(pán)價(jià)、萬(wàn)科A日收盤(pán)價(jià)為研究對(duì)象,對(duì)上證指數(shù)在2008年~2011年的672個(gè)日收盤(pán)價(jià)數(shù)據(jù)采用SPSS和Eviews兩種軟件進(jìn)行研究分析。在此,本文采用時(shí)間序列分析中的一種常見(jiàn)的模型: ARIMA模型進(jìn)行相關(guān)的分析和預(yù)測(cè),并對(duì)未來(lái)10天的日收盤(pán)價(jià)做短期預(yù)測(cè)。通過(guò)研究分析可知計(jì)算所得的平均相對(duì)誤差范圍均達(dá)到要求,則采用ARIMA模型做股票價(jià)格預(yù)測(cè)是可行的。
[關(guān)鍵詞]股票 時(shí)間序列 ARIMA模型
一、引言
股票是金融市場(chǎng)最主要的金融工具之一,股票價(jià)格往往隨時(shí)間變化而波動(dòng), 股票的價(jià)格走勢(shì)直接影響著投資者的經(jīng)濟(jì)利益,以及不同行業(yè)的景氣狀況, 也影響和反映著國(guó)家的宏觀經(jīng)濟(jì)政策。因此,股票價(jià)格能否預(yù)測(cè)及如何預(yù)測(cè)有著其重大的研究意義。
應(yīng)用時(shí)間序列模型進(jìn)行預(yù)測(cè)是較為常見(jiàn)的預(yù)測(cè)方法,正確的通過(guò)時(shí)間序列建立相關(guān)的模型進(jìn)行股票價(jià)格預(yù)測(cè)有著重大意義,它在一定程度上能為國(guó)家的政策提供一個(gè)參考,給人們一個(gè)參考有利于公司的發(fā)展,有利于國(guó)家經(jīng)濟(jì)發(fā)展。
本文選擇紫金礦業(yè)日收盤(pán)價(jià)、萬(wàn)科A日收盤(pán)價(jià),采用ARIMA模型做短期預(yù)測(cè)。
二、數(shù)據(jù)
本文所采用的股票歷史價(jià)格數(shù)據(jù)均來(lái)源于中證網(wǎng)http://www.cs.com.cn/,選取紫金礦業(yè)日收盤(pán)價(jià)、萬(wàn)科A日收盤(pán)價(jià)上證指數(shù)近3年的672個(gè)日收盤(pán)價(jià)的數(shù)據(jù)進(jìn)行研究分析。
三、模型描述
Box- Jenkins 方法(博克思-詹金斯法)--ARIMA模型
Box- Jenkins 方法用變量 自身的滯后項(xiàng),以及隨機(jī)誤差來(lái)解釋該變量, 具體形式可表達(dá)成ARIMA(p,d,q)。其中p 表示自回歸過(guò)程階數(shù), d 表示差分的階數(shù), q 表示移動(dòng)平均過(guò)程的階數(shù)。ARIMA是自回歸移動(dòng)平均結(jié)合(Auto Regressive Integrated Moving Average)模型的簡(jiǎn)寫(xiě)形式,用于平穩(wěn)序列通過(guò)差分而平穩(wěn)的序列分析,簡(jiǎn)記為ARIMA(p,d,q)
若時(shí)間序列是平穩(wěn)的, 可直接運(yùn)用ARIMA 模型:
若時(shí)間序列是非平穩(wěn)的, 則需要經(jīng)過(guò)d 階差分, 將非平穩(wěn)時(shí)間序列轉(zhuǎn)換成平穩(wěn)時(shí)間序列。平穩(wěn)時(shí)間序列可表示成:
對(duì)于下文出現(xiàn)的符號(hào)做簡(jiǎn)短說(shuō)明:
:從2008年4月25日算起的第t個(gè)交易日的收盤(pán)價(jià)(t=1,...,672)
: 原始的萬(wàn)科A的日收盤(pán)價(jià)數(shù)據(jù)
: 原始的萬(wàn)科A的日收盤(pán)價(jià)數(shù)據(jù)通過(guò)一階差分處理后的時(shí)間序列
:原始的萬(wàn)科A的日收盤(pán)價(jià)數(shù)據(jù)通過(guò)二階差分處理后的時(shí)間序列
: 原始的紫金礦業(yè)的日收盤(pán)價(jià)數(shù)據(jù)
: 原始的紫金礦業(yè)的日收盤(pán)價(jià)數(shù)據(jù)通過(guò)一階差分處理后的時(shí)間序列
:原始的紫金礦業(yè)的日收盤(pán)價(jià)數(shù)據(jù)通過(guò)二階差分處理后的時(shí)間序列
四、實(shí)證分析
(一)紫金礦業(yè)的日收盤(pán)價(jià)的分析及預(yù)測(cè)
1.采用SPSS軟件做預(yù)測(cè)分析
(1)模型識(shí)別
首先根據(jù)ARIMA 序列自相關(guān)函數(shù)及偏自相關(guān)函數(shù)的截尾、拖尾性質(zhì)作模型識(shí)別(Identification or tentative specification)。
①上證指數(shù)紫金礦業(yè)的日收盤(pán)價(jià)的序列的特性通過(guò)繪制序列圖(見(jiàn)圖1)
從圖1中可以看出: { }序列沒(méi)有明顯的周期性, 可以初步斷定該序列是非平穩(wěn)的。因此, 可對(duì)原始數(shù)據(jù)作一階差分: ,時(shí), 時(shí)間序列達(dá)到平穩(wěn)。
②繪制的 自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖。
根據(jù)圖2、圖3所給的圖形,一階差分后的ACF呈一階后截尾,PACF呈一階后截尾,可初步判斷 適合ARIMA(1,1,1)模型。
(2)模型確定
據(jù)圖4所示,不難發(fā)現(xiàn)殘差序列接近于白噪聲序列, 是隨機(jī)分布的,因此模型ARIMA(1,1,1)是合理的。
(3) 對(duì)ARIMA(1,1,1)模型進(jìn)行條件期望預(yù)測(cè)
根據(jù)所建立的ARIMA(1,1,1)模型對(duì)2011年2月25日至2011年3月11日的紫金礦業(yè)的日收盤(pán)價(jià)利用SPSS進(jìn)行預(yù)測(cè),可得到如下表所示的預(yù)測(cè)結(jié)果:
絕對(duì)誤差=預(yù)測(cè)值-實(shí)際值,相對(duì)誤差=絕對(duì)誤差/實(shí)際值
對(duì)于以上11個(gè)數(shù)據(jù),根據(jù)平均相對(duì)誤差的計(jì)算公式
代入計(jì)算可得紫金礦業(yè)的日收盤(pán)價(jià)的相對(duì)誤差為-0.0266=-2.66%,可見(jiàn)預(yù)測(cè)效果較好,這主要是所取的數(shù)據(jù)個(gè)數(shù)少,若預(yù)測(cè)的數(shù)據(jù)過(guò)多,則平均誤差增大,預(yù)測(cè)效果會(huì)不那么理想。
2.利用Eviews軟件做預(yù)測(cè)分析
(1) 模型判斷
①序列的平穩(wěn)性判定
上證指數(shù)紫金礦業(yè)的日收盤(pán)價(jià)的序列的特性通過(guò)繪制時(shí)間序列圖(見(jiàn)圖5)
從圖5可以看出:{Zt}序列有明顯的較大的波動(dòng),沒(méi)有明顯的周期性,因此{(lán) }是一個(gè)非平穩(wěn)時(shí)間序列。對(duì)于非平穩(wěn)時(shí)間序列我們可以通過(guò)差分或者去趨勢(shì)來(lái)得到平穩(wěn)時(shí)間序列,在這里我們對(duì){ }序列做二階差分序列{ }。
如圖6所示,我們可以認(rèn)為二階差分后的時(shí)間序列是平穩(wěn)的。
②繪制二階差分序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖來(lái)確定序列{ }的 ARMA模型階數(shù)如圖7
由圖7我們得到ARMA模型階數(shù)p=2,q=5。
(2)模型預(yù)測(cè)
因本文所取的數(shù)據(jù)較小,故采用Eview軟件的靜態(tài)預(yù)測(cè),如此所得結(jié)果比動(dòng)態(tài)預(yù)測(cè)更加準(zhǔn)確。靜態(tài)預(yù)測(cè)是采用滯后因子變量的實(shí)際值而不是預(yù)測(cè)值來(lái)計(jì)算一步向前的結(jié)果。經(jīng)過(guò)預(yù)測(cè)得到如下圖形和數(shù)據(jù)(見(jiàn)圖8)
根據(jù)所建立的ARIMA(2,2,5)模型對(duì)2011年2月25日至2011年3月11日的紫金礦業(yè)的日收盤(pán)價(jià)進(jìn)行預(yù)測(cè),對(duì)所得到的預(yù)測(cè)結(jié)果進(jìn)行平均相對(duì)誤差的計(jì)算:平均相對(duì)誤差=-0.001594112499
(二)萬(wàn)科A的日收盤(pán)價(jià)的分析及預(yù)測(cè)
1.采用SPSS軟件做預(yù)測(cè)分析
(1)模型識(shí)別
①上證指數(shù)萬(wàn)科A的日收盤(pán)價(jià)的序列的特性通過(guò)繪制序列圖(見(jiàn)圖9)
可以看出: { }序列沒(méi)有明顯的周期性, 可以初步斷定序列是非平穩(wěn)的。 因此, 可對(duì)原始數(shù)據(jù)作一階差分: ,此時(shí), 時(shí)間序列達(dá)到平穩(wěn)。
②繪制 的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖。
根據(jù)圖10所給的圖形,一階差分后的ACF呈一階后截尾,PACF呈一階后截尾,可初步判斷 適合ARIMA(1,1,1)模型。
(2)模型確定
根據(jù)圖11,不難發(fā)現(xiàn)殘差序列接近于白噪聲序列, 是隨機(jī)分布的,因此模型ARIMA(1,1,1)是合理的。
(3)對(duì)ARIMA(1,1,1) 模型進(jìn)行條件期望預(yù)測(cè)
根據(jù)所建立的ARIMA(1,1,1)模型對(duì)2011年2月25日至2011年3月11日的紫金礦業(yè)的日收盤(pán)價(jià)利用SPSS進(jìn)行預(yù)測(cè),可得到如下表所示的預(yù)測(cè)結(jié)果:
絕對(duì)誤差=預(yù)測(cè)值-實(shí)際值,相對(duì)誤差=絕對(duì)誤差/實(shí)際值
對(duì)于以上11個(gè)數(shù)據(jù),根據(jù)平均相對(duì)誤差的計(jì)算公式
入計(jì)算可得萬(wàn)科A日收盤(pán)價(jià)的相對(duì)誤差為1.33%,可見(jiàn)預(yù)測(cè)效果較好,主要是所取的數(shù)據(jù)個(gè)數(shù)少,若預(yù)測(cè)的數(shù)據(jù)過(guò)多,平均誤差增大,預(yù)測(cè)效果會(huì)不那么理想。
2.利用Eviews軟件做預(yù)測(cè)分析
(1) 模型判斷
①序列的平穩(wěn)性判定
上證指數(shù)萬(wàn)科A的日收盤(pán)價(jià)的序列的特性通過(guò)繪制時(shí)間序列圖(見(jiàn)圖12)
從圖12可以看出:{ }序列有明顯的較大的波動(dòng),沒(méi)有明顯的周期性,因此{(lán) }是一個(gè)非平穩(wěn)時(shí)間序列。對(duì)于非平穩(wěn)時(shí)間序列我們可以通過(guò)差分或者去趨勢(shì)來(lái)得到平穩(wěn)時(shí)間序列,在這里我們對(duì)
{ }序列做二階差分序列{ }。
如圖13,我們可以認(rèn)為二階差分后的時(shí)間序列是平穩(wěn)的。
②繪制二階差分序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖來(lái)確定序列{ }的 ARMA模型階數(shù)如下:
從圖14判斷得ARIMA模型階數(shù)p=1,q=5.
(2)模型預(yù)測(cè)
因本文所取的數(shù)據(jù)較小,故采用Eview軟件的靜態(tài)預(yù)測(cè),如此所得結(jié)果比動(dòng)態(tài)預(yù)測(cè)更加準(zhǔn)確。靜態(tài)預(yù)測(cè)是采用滯后因子變量的實(shí)際值而不是預(yù)測(cè)值來(lái)計(jì)算一步向前的結(jié)果。經(jīng)過(guò)預(yù)測(cè)得到如下圖形和數(shù)據(jù):
根據(jù)所建立的ARIMA(1,1,1)模型對(duì)2011年2月25日至2011年3月11日的萬(wàn)科A的日收盤(pán)價(jià)進(jìn)行預(yù)測(cè),對(duì)所得到的預(yù)測(cè)結(jié)果進(jìn)行平均相對(duì)誤差的計(jì)算:平均相對(duì)誤差=0.0000168557
四、結(jié)論
本文利用ARIMA模型,采用SPSS和Eviews兩種軟件對(duì)兩種股票的日收盤(pán)價(jià)進(jìn)行預(yù)測(cè)分析,從結(jié)果可知, 對(duì)于短期預(yù)測(cè)來(lái)說(shuō),ARIMA模型具有一定的可行性,但其只限短期預(yù)測(cè),對(duì)于長(zhǎng)期趨勢(shì)或者突發(fā)情形,就會(huì)表現(xiàn)出局限性,預(yù)測(cè)的偏差會(huì)比較大,因?yàn)橛绊懝善眱r(jià)格波動(dòng)的因素很復(fù)雜,有些也很難量化,包括如宏觀經(jīng)濟(jì)政策因素、政府政策、國(guó)際環(huán)境影響等。這些因素在ARIMA模型中只能以隨機(jī)擾動(dòng)項(xiàng)表示, 而在預(yù)期的期望值中卻無(wú)法表現(xiàn)出來(lái)。另外, 這種傳統(tǒng)的多元回歸模型均為齊方差性模型, 且假定模型殘差的均值為零、方差為常數(shù), 但實(shí)際上我國(guó)股價(jià)指數(shù)序列往往存在異方差現(xiàn)象。
鑒于此,我們可以采用其他用途更加廣泛的模型,例如ARCH模型、GARCH模型、EGARCH模型等,這些模型考慮的綜合因素更多更全面,從而得到的相關(guān)的預(yù)測(cè)結(jié)果更加貼近實(shí)際,能給人以更好的參考。
參考文獻(xiàn):
[1]薛薇.Spss統(tǒng)計(jì)分析方法及應(yīng)用.電子工業(yè)出版社,2004年9月
[2]何書(shū)元.應(yīng)用時(shí)間序列分析.北京大學(xué)出版社,2009年10月
[3]童光榮,何耀.計(jì)量經(jīng)濟(jì)學(xué)實(shí)驗(yàn)教程.武漢大學(xué)出版社,2008年6月
[4]賀本嵐.股票價(jià)格預(yù)測(cè)的最優(yōu)選擇模型.財(cái)經(jīng)論壇,1002- 6487( 2008) 06- 0135- 02