程瀚哲 首都經(jīng)濟貿(mào)易大學(xué)
股票是現(xiàn)代金融市場中最常見、最重要的金融工具。股票市場在市場經(jīng)濟活動中起到了至關(guān)重要的作用。股票市場可以讓企業(yè)發(fā)行股票籌集生產(chǎn)資本。企業(yè)可以通過股市傳播企業(yè)信息以起到宣傳作用、能夠反映企業(yè)自身的真實運營狀況及優(yōu)化經(jīng)濟市場資源配置。對于投資者來說,股票市場有了更多的投資原則,擴大了投資的選擇范圍,股票市場上可以隨時進行股票交易也降低了投資者投資所需要承擔(dān)的風(fēng)險。對于國家來說,股票市場一直都是市場經(jīng)濟的晴雨表,此外很重要的是能使社會的閑散資金合理流動。而沒有股票市場,常規(guī)的商品交易很難像股市一樣集成全國乃至全球范圍的,因為其虛擬資本運作的形式而擺脫了地域的限制來統(tǒng)合整體的經(jīng)濟活動[1]。
股票市場的研究和預(yù)測難度很大,因為影響股票市場的因素眾多,國家政策、企業(yè)發(fā)展、投資情緒以及普遍存在大量的隨機事件導(dǎo)致股票市場變幻莫測,從因素上對股市進行分析很難有準(zhǔn)確的預(yù)測。因此時間序列模型往往是用來進行股票價格預(yù)測的普遍選項。時間序列分析是通過數(shù)據(jù)本身的變化來反應(yīng)數(shù)據(jù)走向規(guī)律的一種數(shù)據(jù)分析模型,常用的模型包括自回歸AR模型、移動平均MA模型、自回歸移動平均ARMA模型、差分自回歸移動平均ARIMA模型、自回歸條件異方差A(yù)RCH模型、廣義自回歸條件異方差GARCH模型等。應(yīng)用合適的模型是時間序列分析的重要步驟之一,將股票數(shù)據(jù)擬合為恰當(dāng)?shù)哪P湍軌蚪o股票價格帶來有價值的預(yù)測結(jié)果。
本文所使用的數(shù)據(jù)集是來源于Kaggle平臺的公開數(shù)據(jù)集:https://www.kaggle.com/rpaguirre/tesla-stockprice。該數(shù)據(jù)集記錄了T公司從2010年6月29日到2017年3月17日每天的股票價格數(shù)據(jù)。本文選取其中的收盤價序列(Close)進行分析,計算其更具研究意義的對數(shù)收益率,并對此對數(shù)收益率序列進行時間序列建模和預(yù)測。
首先,繪制出每日收盤價序列的時序圖(見圖1)。
從收盤價序列時序圖中可以看出,數(shù)據(jù)總體呈現(xiàn)出上升趨勢,并且具有隨著股價增加波動幅度更大的跡象,該序列的標(biāo)準(zhǔn)差近似與其水平值成正比。因此,本文根據(jù)此特征,需對此收盤價序列進行對數(shù)變換,以調(diào)整該序列的方差至近似一致。
然后,繪制出對數(shù)收盤價序列的時序圖及其延遲100階的樣本自相關(guān)圖(見圖2)。
圖2 對數(shù)收盤價序列時序圖
經(jīng)觀察,對數(shù)變換后的收盤價序列在方差一致性方面確實有了顯著的改善。此外,對數(shù)收盤價序列仍具有明顯的上升趨勢,且不具有短期相關(guān)性。因此,本文認(rèn)為此序列非平穩(wěn),對于其是否為差分非平穩(wěn),還需做單位根檢驗來進行進一步的探究。
圖3:對數(shù)收盤價序列ACF圖
對上述對數(shù)收盤價序列做一階差分,記差分后的數(shù)據(jù)為對數(shù)收益率,接下來,根據(jù)對數(shù)收益率序列的樣本偏自相關(guān)函數(shù)圖和R語言中的ar函數(shù)選擇ADF檢驗時自回歸模型的階數(shù),對數(shù)收益率序列擬合自回歸模型時AR項階數(shù)選擇為0,于是ADF檢驗就退化為DF檢驗,對數(shù)收盤價序列DF檢驗結(jié)果如下:
表1 ar函數(shù)對對數(shù)收益率序列的估計結(jié)果
由于p值大于0.05,于是在0.05的顯著性水平下不拒絕原假設(shè),即認(rèn)為對數(shù)收盤價序列單位根非平穩(wěn)。
進而需要檢驗對數(shù)收益率序列是否單位根非平穩(wěn)(步驟同上述DF檢驗):
表2 ar函數(shù)對對數(shù)收益率一次差分序列的估計結(jié)果
由于p值小于0.05,于是在0.05的顯著性水平下拒絕原假設(shè),即認(rèn)為對數(shù)收益率序列平穩(wěn),因此不需要對對數(shù)收盤價序列做二次差分。
綜上,對數(shù)收盤價序列非平穩(wěn)。若想實現(xiàn)平穩(wěn),則應(yīng)對此序列進行一次差分處理,形成對數(shù)收益率序列。
首先,計算對數(shù)收益率序列的描述統(tǒng)計量。
表3 對數(shù)收益率序列的描述統(tǒng)計量
由樣本均值的t檢驗結(jié)果知:對數(shù)收益率序列的總體均值并沒有顯著地不同于0;正態(tài)性檢驗的結(jié)果顯示此序列并不服從于正態(tài)分布;樣本偏度為正,說明此序列右偏。
繪制對數(shù)收益率序列的樣本自相關(guān)函數(shù)圖,結(jié)合對數(shù)收益率序列的樣本ACF圖和PACF圖,以及其總體均值不顯著的特征,初步認(rèn)定此序列為白噪聲序列,接下來需進一步做Box檢驗,檢驗結(jié)果p為0.4198。
由于p值顯著大于顯著性水平0.05,所以該序列不能拒絕白噪聲的原假設(shè)。
ARCH模型是自回歸條件異方差模型,解決了傳統(tǒng)計量經(jīng)濟學(xué)時間序列變量的第二個假設(shè)方差恒定所引起的問題,應(yīng)用于波動性有關(guān)的廣泛的研究領(lǐng)域,可以用來預(yù)測股票的波動率,來對風(fēng)險進行控制,等等。不同于大部分預(yù)測被解釋變量期望著的模型,ARCH模型能預(yù)測被解釋變量的方差,準(zhǔn)確地模擬時間序列變量波動性的變化。ARCH模型主要解釋序列中明顯的變化是否具有規(guī)律,說明這種變化依存的是內(nèi)在傳導(dǎo)而不是外生性結(jié)構(gòu)變化,能夠提高預(yù)測精度[2]。
繪制對數(shù)收益率絕對值序列的樣本自相關(guān)圖,并對其進行白噪聲檢驗。檢驗結(jié)論為對數(shù)收益率絕對值序列存在序列自相關(guān)。白噪聲檢驗結(jié)果也表明絕對值變換后的序列為非白噪聲序列。
繪制對數(shù)收益率平方序列的樣本自相關(guān)圖,并對其進行白噪聲檢驗。
對數(shù)收益率平方序列存在序列自相關(guān),白噪聲檢驗結(jié)果也表明平方變換后的序列為非白噪聲序列。
非線性變換后不是獨立的,說明原序列也是非獨立的,因此,對數(shù)收益率序列具有某種自相關(guān)性,而且這種自相關(guān)性會造成序列的條件異方差性。基于此觀點,需對對數(shù)收益率序列進一步做ARCH效應(yīng)檢驗。
對此對數(shù)收益率序列做McLeod-Li檢驗,McLeod-Li檢驗在5%的顯著性水平下都顯著,給數(shù)據(jù)具有ARCH特征提供了強有力的證據(jù)。
對對數(shù)收益率序列做拉格朗日乘子檢驗,LM檢驗在5%的顯著性水平下都顯著,給數(shù)據(jù)具有ARCH特征提供了強有力的證據(jù)。
Bollerslve在Engle的基礎(chǔ)上,借助自回歸移動平均ARMA模型的建立,建立了廣義自回歸條件異方差GARCH模型。他彌補了ARCH(q)模型中階數(shù)q過大時需要過多的參數(shù)的缺陷。這是一種允許異方差中同時存在自回歸項和滑動平均項的模型,GARCH(p,q)模型。顯然,如果p=0時,GARCH(0,q)模型就是ARCH(q)模型,可以將GARCH模型看成是ARCH模型的推廣,或者將ARCH模型看作是GARCH模型的特殊情形。
由于對數(shù)收益率序列ARCH效應(yīng)的存在,所以應(yīng)對此序列擬合ARCH模型或GARCH模型,首先需確定模型的階數(shù)。
根據(jù)ARCH模型定階應(yīng)用平方序列的樣本偏自相關(guān)函數(shù)圖和GARCH模型定階應(yīng)用平方序列的樣本EACF圖所示結(jié)果,建議設(shè)定ARCH(2)模型或GARCH(1,1)模型。
對數(shù)收益率應(yīng)用正態(tài)分布的新息建立ARCH(2)模型,記作m1,對m1模型進行參數(shù)估計。
此模型的各參數(shù)估計值都顯著,模型表達式為:
檢驗結(jié)果顯示:均值方程和波動率方程都充分?jǐn)M合了數(shù)據(jù),模型AIC為-4.05562,但標(biāo)準(zhǔn)化殘差并不滿足正態(tài)性假定。
對數(shù)收益率應(yīng)用學(xué)生t分布的新息建立ARCH(2)模型,記作m2,對m2模型進行參數(shù)估計。
此模型的各參數(shù)估計值都顯著,模型表達式為:
檢驗結(jié)果顯示:均值方程和波動率方程都充分?jǐn)M合了數(shù)據(jù),模型AIC為-4.232647。
對數(shù)收益率應(yīng)用正態(tài)分布的新息建立GARCH(1,1)模型,記作m3,對m3模型進行參數(shù)估計。
此模型的各參數(shù)估計值都顯著,模型表達式為:
檢驗結(jié)果顯示:均值方程和波動率方程都充分?jǐn)M合了數(shù)據(jù),模型AIC為-4.061315,但標(biāo)準(zhǔn)化殘差并不滿足正態(tài)性假定。
對數(shù)收益率應(yīng)用正態(tài)分布的新息建立GARCH(1,1)模型,記作m4,對m4模型進行參數(shù)估計。
此模型的各參數(shù)估計值除omega外都顯著,但考慮到條件方差的長期水平不能為0,于是參數(shù)omega不予剔除。模型表達式為:
檢驗結(jié)果顯示:均值方程和波動率方程都充分?jǐn)M合了數(shù)據(jù),模型AIC為-4.254761。
匯總上述通過檢驗的模型的AIC值,并進行樣本內(nèi)比較:
表4 模型AIC值匯總
m4模型的AIC值最小,因此,認(rèn)為m4模型為相對最優(yōu)模型。
畫出對數(shù)收益率m4模型的波動率圖像(見圖4)。
圖4 m4模型的波動率圖像
畫出對數(shù)收益率m4模型的標(biāo)準(zhǔn)化殘差時序圖(見圖5)。
圖5 m4模型的標(biāo)準(zhǔn)化殘差時序圖
由上圖可見,標(biāo)準(zhǔn)化殘差序列基本在水平線0的上下波動,且波動幅度近似一致。
畫出對數(shù)收益率的m4模型的標(biāo)準(zhǔn)化殘差樣本自相關(guān)圖(見圖6)。
圖6 m4模型的標(biāo)準(zhǔn)化殘差樣本ACF圖
畫出對數(shù)收益率m4模型的標(biāo)準(zhǔn)化殘差平方樣本自相關(guān)圖(見圖7)。
圖7 m4模型的標(biāo)準(zhǔn)化殘差平方樣本ACF圖
圖6不表明標(biāo)準(zhǔn)化殘差過程中有顯著的序列相關(guān)性,圖7不表明標(biāo)準(zhǔn)化殘差過程中有顯著的條件異方差性,因此,m4模型通過了診斷,可以用作預(yù)測。
應(yīng)用m4模型對T公司的對數(shù)收益率序列進行了10期外推預(yù)測,預(yù)測結(jié)果如下:
表5 對數(shù)收益率的m4模型的預(yù)測結(jié)果
保留原對數(shù)收益率序列的后50條數(shù)據(jù),并結(jié)合上述m4模型的預(yù)測結(jié)果,繪制出如下預(yù)測圖像(見圖8)。
圖8 對數(shù)收益率的m4模型的預(yù)測圖像