侯甜甜,馬福強(qiáng),王英賢
股票價(jià)格預(yù)測(cè)對(duì)投資者具有重要的現(xiàn)實(shí)意義,同時(shí)也受到了國(guó)家政府的高度關(guān)注.通過對(duì)股票價(jià)格的預(yù)測(cè),判斷我國(guó)股票發(fā)展情況,從而根據(jù)現(xiàn)實(shí)需要,制定相關(guān)的政府政策,以此來推進(jìn)我國(guó)經(jīng)濟(jì)的進(jìn)一步發(fā)展.
時(shí)間序列是指定量揭示某種現(xiàn)象的客觀規(guī)律.特別是近年來,它已被廣泛應(yīng)用于金融領(lǐng)域,尤其是股票價(jià)格的預(yù)測(cè).2008年,劉紅梅[1]以鞍鋼股票價(jià)格序列為研究對(duì)象,通過一階差分平穩(wěn)化數(shù)據(jù),建立了ARMA(2,1)模型,對(duì)股票價(jià)格的預(yù)測(cè)取得了較好的結(jié)果,但是精確度依舊不太理想.2016年,劉成義[2]從研究滬深300指數(shù)股指期貨的背景和必要性出發(fā),采用馬爾科夫鏈模型對(duì)滬深300 指數(shù)股指期貨進(jìn)行短期預(yù)測(cè),模擬指數(shù)變化規(guī)律,并輔助以Matlab 軟件計(jì)算轉(zhuǎn)移概率矩陣,得出對(duì)滬深300 指數(shù)股指期貨的短期走勢(shì)較好的預(yù)測(cè)結(jié)果.使投資者在面對(duì)錯(cuò)綜復(fù)雜的股指期貨交易時(shí),能避免盲目的投資行為.采取科學(xué)的投資方法.在實(shí)際中具有很強(qiáng)的參考和應(yīng)用價(jià)值.2017年,李嘉松[3]利用ARIMA模型對(duì)滬深300 指數(shù)進(jìn)行預(yù)測(cè),并指出造成滬深300 指數(shù)的實(shí)際值和模型預(yù)測(cè)值之間有差別的原因,為廣大投資者提供了滬深300指數(shù)的預(yù)測(cè)方法.
馬爾可夫鏈模型是一個(gè)離散的隨機(jī)時(shí)間序列,其特征是沒有后效性,即如果系統(tǒng)的當(dāng)前狀態(tài)已知,則可以確定系統(tǒng)的未來狀態(tài)規(guī)律,而不管過去的狀態(tài)如何.如果有一種事物或某種現(xiàn)象的各種狀態(tài)的時(shí)間序列是馬爾可夫鏈,那么就可以根據(jù)轉(zhuǎn)移概率,n時(shí)間的狀態(tài)預(yù)測(cè)n+1 時(shí)間的狀態(tài).依據(jù)馬爾可夫鏈的這一特點(diǎn),可以將其應(yīng)用于股票的研究.
1970年,BOX和JENKINS提出ARIMA模型[4],又稱差分整合移動(dòng)平均自回歸模型.ARIMA模型對(duì)擾動(dòng)項(xiàng)進(jìn)行建模分析后,綜合考慮預(yù)測(cè)變量的過去值、當(dāng)前值和誤差值,以此提高模型的預(yù)測(cè)精度.具有如下結(jié)構(gòu)的模型稱為求和自回歸移動(dòng)平均模型,簡(jiǎn)記為ARIMA(p,d,q)模型[1]
通過差分觀察值序列平穩(wěn)后,需要判斷序列是否有分析價(jià)值,因此在建立之前需要進(jìn)行純隨機(jī)性檢驗(yàn),即白噪聲檢驗(yàn).檢驗(yàn)結(jié)果顯示是白噪聲序列,則該序列沒有分析價(jià)值.如果是非白噪聲序列,則可以進(jìn)行模型擬合.
再根據(jù)時(shí)間序列的自相關(guān)函數(shù)和偏自相關(guān)圖,對(duì)序列的平穩(wěn)性及周期性進(jìn)行模型識(shí)別.對(duì)平穩(wěn)序列的模型進(jìn)行識(shí)別,若平穩(wěn)序列的偏相關(guān)函數(shù)是截尾的,而自相關(guān)函數(shù)是拖尾的,可斷定序列適合AR 模型;若平穩(wěn)序列的偏相關(guān)函數(shù)是拖尾的,而自相關(guān)函數(shù)是截尾的,則可斷定序列適合MA模型;若平穩(wěn)序列的偏相關(guān)函數(shù)和自相關(guān)函數(shù)均是拖尾的,則序列適合ARMA模型.
設(shè)隨機(jī)過程Xn的狀態(tài)空間I={1,2,…,N} ,絕對(duì)概率分布為其中:當(dāng)n=0 時(shí),為初始分布.馬氏鏈在時(shí)刻n處于狀態(tài)i的條件下,到時(shí)刻n+1 轉(zhuǎn)移到狀態(tài)j的條件概率稱為一步轉(zhuǎn)移概率,由其為元素構(gòu)成的矩陣P1為一步轉(zhuǎn)移矩陣.狀態(tài)i經(jīng)過n步轉(zhuǎn)移后處于狀態(tài)j的概率稱為n步轉(zhuǎn)移概率,由其為元素組成的矩陣為n步轉(zhuǎn)移矩陣.設(shè)為一個(gè)齊次馬氏鏈,其狀態(tài)空間為I,n步轉(zhuǎn)移概率為則有其矩陣形式為方程為方程的矩陣形式為Pm+n=Pm?Pn,進(jìn)而有由此可得馬氏鏈預(yù)測(cè)模型[5]為
經(jīng)過一段時(shí)間后,馬氏鏈的狀態(tài)將趨于這樣的一種狀態(tài),它與初始狀態(tài)無關(guān),并且前后兩期的狀態(tài)概率相等,即稱為馬氏鏈的穩(wěn)定狀態(tài),此時(shí)的分布即為平穩(wěn)分布.
本文所用數(shù)據(jù)選取的是上證綜合指數(shù)的收盤價(jià)的日度數(shù)據(jù),2018年1月2日到2019年2月25日的日度收盤價(jià)數(shù)據(jù),數(shù)據(jù)來源為新浪財(cái)經(jīng)網(wǎng),收集數(shù)據(jù)276 個(gè),2018-01-02 至2019-02-25上證指數(shù)日收盤價(jià)如圖1所示.
圖1 2018-01-02至2019-02-25上證指數(shù)日收盤價(jià)
利用Eviews 軟件對(duì)數(shù)據(jù)進(jìn)行多項(xiàng)式模型擬合,模型的擬合結(jié)果如下:
模型的擬合圖像如圖2所示.
圖2 多項(xiàng)式模型擬合圖
其中上方曲線為原始序列,下方曲線為擬合的數(shù)據(jù)序列.
由多項(xiàng)式模型擬合的五個(gè)交易日的預(yù)測(cè)值如表1所示.
表1 多項(xiàng)式模型擬合結(jié)果
從表1 可以看出,誤差相對(duì)較大,所以繼續(xù)利用ARIMA模型來進(jìn)行預(yù)測(cè).
利用R 軟件[6-8],得到數(shù)據(jù)的序列圖.由于數(shù)據(jù)的波動(dòng)比較大,需要對(duì)數(shù)據(jù)進(jìn)行差分處理,變得平穩(wěn).首先對(duì)數(shù)據(jù)進(jìn)行一階差分,經(jīng)檢驗(yàn),發(fā)現(xiàn)需要對(duì)數(shù)據(jù)進(jìn)行二階差分.
對(duì)二階差分后序列進(jìn)行白噪聲檢驗(yàn),判斷出該數(shù)據(jù)序列屬于非白噪聲序列.對(duì)二階差分后的數(shù)列的純隨機(jī)性檢驗(yàn),序列為非白噪聲序列.利用Eviews 軟件對(duì)二階差分后數(shù)據(jù)進(jìn)行ADF 檢驗(yàn),首先對(duì)有常數(shù)項(xiàng)和有趨勢(shì)項(xiàng)進(jìn)行檢驗(yàn),然后對(duì)有常數(shù)項(xiàng)無趨勢(shì)項(xiàng)進(jìn)行檢驗(yàn),最后對(duì)無常數(shù)項(xiàng)無趨勢(shì)項(xiàng)進(jìn)行檢驗(yàn),檢驗(yàn)的結(jié)果為統(tǒng)計(jì)量均小于在1%、5%、10%顯著性水平下的統(tǒng)計(jì)量的臨界值.所以我們有充足的依據(jù)來判斷出二階差分后的序列是一個(gè)平穩(wěn)的序列,同時(shí),它也是一個(gè)非白噪聲序列,而平穩(wěn)非白噪聲序列,顯然是有利于接下來的研究的.通過觀察差分序列的自相關(guān)圖和偏自相關(guān)圖,來確定滯后項(xiàng)的階數(shù).二階差分后時(shí)序圖如圖3所示.
圖3 二階差分后時(shí)序圖
從圖3可以看出,自相關(guān)系數(shù)衰減到趨于小值的波動(dòng)過程連續(xù),可以大致判定為自相關(guān)系數(shù)截尾,也可以大致判定偏自相關(guān)系數(shù)截尾.可以對(duì)數(shù)據(jù)建立ARIMA 模型進(jìn)行預(yù)測(cè),在這里建立ARIMA(1,2,1)模型、ARIMA(2,2,1)模型、ARIMA(1,2,2)模型、ARIMA(2,2,2)模型并進(jìn)行擬合檢驗(yàn),可以看出ARIMA(2,2,2)模型的AIC值最小,根據(jù)AIC準(zhǔn)測(cè),選擇ARIMA(2,2,2)模型來進(jìn)行擬合.模型方程如下:
進(jìn)行顯著性檢驗(yàn).模型的顯著性檢驗(yàn)是檢驗(yàn)?zāi)P偷挠行?,只有通過模型顯著有效,模型結(jié)果才能進(jìn)行模型預(yù)測(cè),得到的結(jié)果才具有說服力、可靠性與價(jià)值性.模型的檢驗(yàn)也就是對(duì)殘差序列進(jìn)行檢驗(yàn).
在各階延遲下LB 檢驗(yàn)統(tǒng)計(jì)量的P值均大于0.05,接受原假設(shè),可以認(rèn)為這個(gè)擬合模型的殘差序列屬于白噪聲序列,即該擬合模型顯著有效.進(jìn)行預(yù)測(cè).繼續(xù)對(duì)模型進(jìn)行預(yù)測(cè),五期的預(yù)測(cè)值如表2所示.
表2 ARIMA(2,2,2)預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比
從表2可以看出,模型最大誤差為1.70%,說明模型的預(yù)測(cè)是比較準(zhǔn)確的.該模型的序列預(yù)測(cè)圖像如圖4所示,模型的模型置信區(qū)間預(yù)測(cè)圖如圖5所示.
圖4 模型預(yù)測(cè)圖
圖5 模型置信區(qū)間預(yù)測(cè)圖
從圖4和圖5可以看出,擬合程度比較好,上證指數(shù)在短期內(nèi)將會(huì)繼續(xù)增長(zhǎng).
在馬氏鏈模型建模中[9-11]主要運(yùn)用馬氏鏈中的轉(zhuǎn)移概率矩陣?yán)碚摚@里選取的是上證綜合指數(shù)2019年1月2日到2019年2月1日每個(gè)交易日的收盤價(jià).將2 500以下看為狀態(tài)1,2 500~2 530為狀態(tài)2,2 530~2 560為狀態(tài)3,2 560及以后為狀態(tài)4,狀態(tài)劃分?jǐn)?shù)據(jù)如表3所示,轉(zhuǎn)移頻數(shù)如表4所示.
運(yùn)用轉(zhuǎn)移頻數(shù)可以得到轉(zhuǎn)移概率矩陣如下:
此矩陣即為一步轉(zhuǎn)移概率矩陣P.
預(yù)測(cè)未來五個(gè)交易日的收盤價(jià),因?yàn)樽詈笠惶斓氖毡P價(jià)為2 618.232,處于狀態(tài)4,所以可以取初始狀態(tài)P0=[0,0,0,1].則未來第一個(gè)到第五個(gè)交易日預(yù)測(cè)值如下:
第一個(gè)交易日的收盤價(jià)狀態(tài)概率分布的預(yù)測(cè)值為P1=P0P=[0,0,0.083,0.917].
可以看出接下來的五個(gè)交易日的狀態(tài)預(yù)測(cè)值均為第4 狀態(tài).除此之外還可以求出馬氏鏈平穩(wěn)時(shí)的概率分布為
表3 馬氏鏈模型狀態(tài)劃分
表4 轉(zhuǎn)移頻數(shù)表
已知轉(zhuǎn)移概率矩陣,可以根據(jù)轉(zhuǎn)移概率矩陣寫出以下方程:
通過化簡(jiǎn)計(jì)算,可以得到如下方程組:
最終計(jì)算的結(jié)果為x1=0 ,x2=0.032 2 ,x3=0.193 1,x4=0.774 7.
未來五個(gè)交易日的收盤價(jià)如表5所示.
表5 馬氏鏈模型預(yù)測(cè)結(jié)果
從表5可以看出,2019年2月11日到2019年2月15日的收盤價(jià)所處的狀態(tài)與預(yù)測(cè)結(jié)果完全一致.
可以看出如果沒有其它因素影響,日收盤數(shù)據(jù)處于4 狀態(tài)的概率大約在80%左右.因?yàn)楣善钡膬r(jià)格除了受市場(chǎng)的影響以外,還受到很多其他因素的影響,因此也只能做短期預(yù)測(cè),對(duì)股票的投資提供一個(gè)參考.
本文運(yùn)用時(shí)間序列中的ARIMA 模型,利用R語言軟件建立了模型,還有馬氏鏈模型.對(duì)上證日度收盤價(jià)指數(shù)做出了短期預(yù)測(cè),可以看出短期內(nèi)股票的價(jià)格趨勢(shì).而根據(jù)兩個(gè)模型的預(yù)測(cè)數(shù)據(jù)和真實(shí)值的對(duì)比可以看出,所建立的模型具有一定的可行度,準(zhǔn)確度有了一定的保證.
但是我們?cè)趯⑵溥\(yùn)用到實(shí)際的預(yù)測(cè)中,還需要考慮很多影響股票價(jià)格的因素.例如宏觀經(jīng)濟(jì)指標(biāo)、利率水平、行業(yè)發(fā)展?fàn)顩r、國(guó)家發(fā)布的政策、投資者心理的變化等.這些因素都會(huì)影響到股票的價(jià)格,甚至還包括一些節(jié)假日,節(jié)日的前后股票價(jià)格都會(huì)發(fā)生較大的波動(dòng).本文所研究的內(nèi)容,和所做出的模型預(yù)測(cè)是希望可以給投資人的短期投資提供參考意見.
還應(yīng)該考慮到文章中所做出的研究具有一定的局限性,因?yàn)楣善眱r(jià)格的時(shí)間序列非常復(fù)雜.而研究的主要目的是為了對(duì)股票的價(jià)格做出更精準(zhǔn)的預(yù)測(cè),今后將會(huì)從以下幾個(gè)方面進(jìn)行改進(jìn).
(1)本文選取的指標(biāo),只選取了上證指數(shù)日度收盤價(jià)作為變量來預(yù)測(cè),但是實(shí)際情況是,對(duì)于股票影響的因素有很多,如開盤價(jià)、交易量、最高價(jià)和最低價(jià),而這些情況都會(huì)對(duì)股票價(jià)格產(chǎn)生一定的影響,需要考慮如何將這些影響因素也加入到所建立的模型中.
(2)所選取的只有上證指數(shù)日度收盤價(jià),應(yīng)該選取其他股票的價(jià)格樣本,這樣預(yù)測(cè)效果會(huì)更好.
(3)本文只選擇了ARIMA 模型和馬氏鏈模型做了對(duì)比,還應(yīng)該考慮時(shí)間序列中其他的模型,將它們分別進(jìn)行對(duì)比.