熊 政,車文剛
(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院, 云南 昆明 650500)
股票投資是人們主要的投資手段之一,近年來,越來越多的人開始關(guān)注股票市場并加入到股民這一行列。然而,對(duì)于股民來說,在面對(duì)上千支股票時(shí),選擇哪一支股票可以降低虧損風(fēng)險(xiǎn)帶來不錯(cuò)的收益就需要一些輔助手段了。金融時(shí)間序列模型是股票預(yù)測中最常用的方法,也被認(rèn)為是預(yù)測股市變化最好的工具之一,準(zhǔn)確的股票預(yù)測能夠幫助投資者做出正確的判斷。而對(duì)于個(gè)人投資者來說,高速、簡易、預(yù)測準(zhǔn)確的輕量型時(shí)間序列模型更加適合個(gè)人投資者在日常生活中的應(yīng)用,也是眾多科研工作者研究的目標(biāo)。
張穎超等[1]通過建立ARIMA模型對(duì)股票未來的上證指數(shù)進(jìn)行預(yù)測和分析,發(fā)現(xiàn)該模型在未來4個(gè)交易日里的預(yù)測效果較好。劉松等[2]通過建立ARIMA模型對(duì)選取的金融市場股票的歷史收盤價(jià)數(shù)據(jù)進(jìn)行檢驗(yàn)和預(yù)測,得出對(duì)未來三天的預(yù)測值與真實(shí)值的最大誤差不超過0.04。Murat等[3]在對(duì)市場壓力下的股票市場波動(dòng)的MIDAS回歸預(yù)測實(shí)驗(yàn)中發(fā)現(xiàn),在采用高頻率的數(shù)據(jù)來估計(jì)模型時(shí),GARCH模型具有較好的預(yù)測性能,并提出了遞推方案可以提高GARCH模型性能的可能性。MIAH等[4]在實(shí)驗(yàn)中測試不同滯后階的GARCH模型,利用Akaike信息準(zhǔn)則和貝葉斯準(zhǔn)則證明了GARCH(1,1)模型比其他GARCH(p,q)模型對(duì)DSE日收益序列的波動(dòng)性建模效果要好。印凡成等[5]利用GARCH-M模型擬合上證A股指數(shù)波動(dòng)率的變化趨勢并進(jìn)行預(yù)測,而后將其應(yīng)用于Black-Scholes模型中,克服了以往假定有效期內(nèi)波動(dòng)率為常數(shù)的不合理假設(shè),使預(yù)測值進(jìn)一步趨近實(shí)際值。方燕等[6]利用ARIMA-GARCH模型對(duì)傳媒股價(jià)進(jìn)行研究發(fā)現(xiàn),該模型對(duì)具有“尖峰肥尾”分布特征的個(gè)股預(yù)測相比于傳統(tǒng)ARIMA模型和GARCH模型要更加精確。而楊琦等[7]的研究進(jìn)一步說明了ARIMA-GARCH模型的預(yù)測誤差會(huì)隨著預(yù)測步數(shù)的增加而增大,精度也會(huì)越來越低。許舒雅等[8]通過建立ARIMA-GARCH模型對(duì)宇通客車的收盤價(jià)序列進(jìn)行擬合并通過實(shí)證進(jìn)行誤差分析,得到最小誤差為-0.001 272 647 2,證明了該模型可以應(yīng)用于股票收盤價(jià)格的預(yù)測。本文在此基礎(chǔ)上將波動(dòng)率代入ARIMA-GARCH中,嘗試克服傳統(tǒng)股票預(yù)測中方差不變的假設(shè),希望將預(yù)測精度進(jìn)一步提高。在實(shí)驗(yàn)中發(fā)現(xiàn),該模型對(duì)“尖峰肥尾”分布不明顯的個(gè)股多步數(shù)的預(yù)測相對(duì)較差,但是在下一天的預(yù)測與真實(shí)值更加接近,因此,利用遞歸的思想,將第1天的預(yù)測值放原始數(shù)據(jù)中,再重復(fù)進(jìn)行第2天的預(yù)測。
ARIMA模型即差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model),是由Box和Jenkins于20世紀(jì)70年代初提出的著名時(shí)間序列預(yù)測方法,又被稱為Box-Jenkins模型。ARIMA模型本質(zhì)上是通過自相關(guān)和部分自相關(guān)函數(shù)來模擬數(shù)據(jù)的隨機(jī)性變化,從而達(dá)到預(yù)測數(shù)據(jù)未來變化趨勢的目的。ARIMA(p,d,q)模型用公式可以表示為
其中p、d、q分別為自回歸階數(shù)、差分階數(shù)和滑動(dòng)平均階數(shù),Xt是時(shí)間t的時(shí)間序列,φi、θj分別是p階和q階的平穩(wěn)多項(xiàng)式算子,εt為一個(gè)隨機(jī)誤差項(xiàng)。
GARCH-M模型是對(duì)GARCH模型的擴(kuò)展,將波動(dòng)率作為解釋變量代入到時(shí)間序列的均值方程中,可以較好地描述收盤價(jià)與股價(jià)波動(dòng)的相關(guān)性[9],其一般形式可以表示為
ARIMA-GARCH混合模型是ARIMA模型和GARCH模型結(jié)合,可以表示為
ARIMA-GARCH-M混合模型是ARIMA模型和GARCH-M模型結(jié)合,能夠更有效地捕捉時(shí)間序列的“尖尾”特征,并改善預(yù)測結(jié)果[10]。該模型表示如下:
其中B為滯后計(jì)算。
(1)對(duì)股票數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),檢驗(yàn)數(shù)據(jù)之間是否存在自相關(guān);
(2)ADF檢驗(yàn)完成對(duì)股票價(jià)格平穩(wěn)性檢驗(yàn);
(3)若股票序列為非平穩(wěn)序列,則對(duì)該序列作差分處理,將其轉(zhuǎn)換為平穩(wěn)序列;
(4)對(duì)ARIMA模型作ARCH檢驗(yàn),確定是否存在異方差性;
(5)對(duì)ARIMA-GARCH-M模型進(jìn)行殘差檢驗(yàn),檢驗(yàn)殘差是否符合白噪聲,若不符,則需對(duì)模型作進(jìn)一步優(yōu)化;
(6)在確定ARIMA-GARCH-M模型參數(shù)之后,對(duì)目標(biāo)股票進(jìn)行收盤價(jià)單步預(yù)測并將預(yù)測結(jié)果添加到原始數(shù)據(jù)的下一條數(shù)據(jù)中;
(7)重復(fù)以上步驟,并建立ARIMA模型、GARCH模型、GARCH-M模型、ARIMA-GARCH模型與ARIMA-GARCH-M模型做實(shí)驗(yàn)對(duì)比。
隨機(jī)選取了2018年1月2日—2021年4月2日“平安銀行”的790條股票收盤價(jià)數(shù)據(jù)來建立要分析的時(shí)間序列模型,部分?jǐn)?shù)據(jù)見表1。
首先對(duì)股票數(shù)據(jù)進(jìn)行DW(Durbin-Watson)檢驗(yàn),DW檢驗(yàn)統(tǒng)計(jì)量為0.009 336,P為0.000 0。從檢驗(yàn)結(jié)果看,P<0.005,說明數(shù)據(jù)之間存在自相關(guān)性,因此,可以作時(shí)間序列分析。
在進(jìn)行ADF檢驗(yàn)前,假設(shè)該時(shí)間序列為非平穩(wěn)序列,通過表2的ADF檢驗(yàn)結(jié)果可以看出,在未進(jìn)行差分的情況下,P>0.05,不能拒絕原假設(shè),則該序列為非平穩(wěn)序列。在將該序列一階差分后,再次進(jìn)行ADF檢驗(yàn),從表中可看出,差分后P<0.01,則拒絕原假設(shè),該時(shí)間序列為平穩(wěn)時(shí)間序列,符合實(shí)驗(yàn)要求。
表2 ADF檢驗(yàn)結(jié)果
從一階差分后的自相關(guān)和偏自相關(guān)信息中可以大致確定p和q的取值都為(3,4)中的值,為了具體確認(rèn)p和q的值,結(jié)合AIC信息準(zhǔn)則,建立多個(gè)ARIMA(p,d,q)模型,由ADF檢驗(yàn)得d=1,p和q的取值分別從1到4,篩選AIC值最小的一個(gè),最終選出最佳模型ARIMA(4,1,3),輸出結(jié)果見表3。
表3 不同階數(shù)模型的AIC值
對(duì)于得到的ARIMA(4,1,3)模型,對(duì)其進(jìn)行ARCH檢驗(yàn)。檢驗(yàn)結(jié)果0.262 2,小于F-statistic的1.258 724,因此,該模型存在異方差性,可以建立GARCH-M模型。根據(jù)MIAH等[4]的研究結(jié)果,這里選取GARCH(1,1)-M。
由于在該實(shí)驗(yàn)中引入了遞歸的方式,因此每次生成的ARIMA-GARCH-M模型參數(shù)是不同的,這里列出第一次預(yù)測的模型參數(shù),對(duì)后面多次的參數(shù)不再列出。
利用ARIMA(4,1,3)-GARCH-M(1,1)-M模型對(duì)股票數(shù)據(jù)擬合,估計(jì)模型參數(shù),結(jié)果見表4。
表4 ARIMA(4,1,3)-GARCH(1,1)-M模型參數(shù)估計(jì)結(jié)果
由表4擬合參數(shù)可以得到第一次預(yù)測的ARIMA-GARCH-M模型:
通過建立的ARIMA-GARCH-M時(shí)間序列模型,預(yù)測“平安銀行”股票4天收盤價(jià),結(jié)果見表5。
由表5的預(yù)測結(jié)果可知ARIMA-GARCH-M模型對(duì)“平安銀行”股票預(yù)測的最大相對(duì)誤差和最小相對(duì)誤差分別為-0.260 368 937、0.029 351 052。
為了對(duì)比ARIMA-GARCH模型和加入波動(dòng)率之后的ARIMA-GARCH-M模型的預(yù)測效果,使用擬合圖像和殘差圖像來作對(duì)比分析,如圖1、圖2所示。
表5 ARIMA(4,1,3)-GARCH(1,1)-M模型預(yù)測股票4天收盤價(jià)結(jié)果
圖1 ARIMA-GARCH擬合殘差圖 圖2 ARIMA-GARCH-M擬合殘差圖
由于使用的數(shù)據(jù)量相對(duì)較大,從擬合圖像和殘差圖像上難以觀察到兩者之間的差別,因此,采用方差圖像來進(jìn)一步對(duì)比兩者的區(qū)別,如圖3、圖4所示。
圖3 ARIMA-GARCH方差圖 圖4 ARIMA-GARCH-M方差圖
通過方差圖像可以明顯看出ARIMA-GARCH-M模型比ARIMA-GARCH模型的偏差程度更小。因此ARIMA-GARCH-M模型的預(yù)測效果會(huì)更優(yōu)于ARIMA-GARCH模型。
為了檢驗(yàn)預(yù)測的準(zhǔn)確性,采用平均絕對(duì)誤差MAPE、均方根誤差RMSE和等系數(shù)EC對(duì)模型結(jié)果進(jìn)行檢驗(yàn),在實(shí)驗(yàn)中發(fā)現(xiàn)ARIMA模型在預(yù)測出第5天時(shí)會(huì)出現(xiàn)較大的波動(dòng),因此在做實(shí)驗(yàn)結(jié)果對(duì)比時(shí),將預(yù)測4期股票收盤價(jià)誤差檢驗(yàn)結(jié)果分別對(duì)比:
其中N為預(yù)測數(shù)據(jù)天數(shù),ai和ei分別為第i天的實(shí)際收盤價(jià)和預(yù)測收盤價(jià)。結(jié)果見表6。
根據(jù)檢驗(yàn)結(jié)果,在對(duì)股票4天的預(yù)測中,ARIMA-GARCH-M模型的平均絕對(duì)誤差為0.63%,均方根誤差為16.09%,等系數(shù)為99.63%。傳統(tǒng)的ARIMA模型的平均絕對(duì)誤差為0.72%,均方根誤差為17.09%,等系數(shù)為99.60%。GARCH模型的平均絕對(duì)誤差為0.64%,均方根誤差為16.20%,等系數(shù)為99.62%。GARCH-M模型的平均絕對(duì)誤差為0.64%,均方根誤差為16.08%,等系數(shù)為99.63%。ARIMA-GARCH模型的平均絕對(duì)誤差為0.68%,均方根誤差為17.07%,等系數(shù)為99.60%。由此可見,在對(duì)平安銀行股票收盤價(jià)的預(yù)測中,ARIMA-GARCH-M模型預(yù)測結(jié)果是優(yōu)于表6中的其他模型的。
表6 對(duì)“平安銀行”4天收盤價(jià)的預(yù)測誤差檢驗(yàn)結(jié)果
通過以上實(shí)驗(yàn),可以得到ARIMA-GARCH-M模型在擬合和預(yù)測短期股票市場價(jià)格上比ARIMA模型、GARCH模型、GARCH-M模型和ARIMA-GARCH模型要更精確一些。對(duì)于個(gè)人投資者來說,該方法簡單有效,可以在日常生活中應(yīng)用。而對(duì)于有更高需求的投資者,想要更加精確地預(yù)測出股票的價(jià)格,則可以結(jié)合龐大的數(shù)據(jù)量、運(yùn)用更復(fù)雜的模型進(jìn)行分析,盡可能將更多影響股市價(jià)格的因素代入研究中,比如新聞導(dǎo)向、國內(nèi)政策、投資者購買欲望等。