胡 倩,錢星曌
(安徽大學(xué) 經(jīng)濟學(xué)院,合肥 230031)
中共十一屆三中全會以來,社會主義市場經(jīng)濟的廣度與深度不斷提升,中國經(jīng)濟高速發(fā)展,社會對資本的探索不斷加大。上交所、深交所的成立標(biāo)志著證券市場時代已然到來,然而證券市場作為金融市場,會受到來自各方的干擾產(chǎn)生波動。對投資者來說,波動情況與資產(chǎn)價格直接相關(guān),是其進(jìn)行投資的依據(jù)。同時,對于股市的劇烈波動如果不加以防范,必然會使市場不穩(wěn)定,對社會經(jīng)濟的發(fā)展造成危害。鑒于此,金融資產(chǎn)的波動性研究就成為眾多學(xué)者的研究熱點。
由于金融產(chǎn)品收益率序列具有異方差性和波動聚集效應(yīng),Engle提出了自回歸條件異方差(ARCH)模型[1]。Bollerslev對ARCH模型作出改進(jìn),提出了廣義自回歸條件異方差(GARCH)模型[2],該模型被廣泛應(yīng)用。徐立霞將GARCH族模型用于中國股市波動性的研究,運用GARCH、TGRCH和EGARCH模型擬合中國股市的波動性,結(jié)果表明,股票收益率序列存在尖峰厚尾、波動聚類的特性,GARCH族模型能很好地擬合股市波動性0。但是,上述模型大多使用低頻數(shù)據(jù),屬于低頻波動率模型。隨著科學(xué)技術(shù)的發(fā)展,獲取數(shù)據(jù)的技術(shù)越來越成熟,高頻數(shù)據(jù)的收集呈現(xiàn)爆炸性發(fā)展,眾多學(xué)者開始研究高頻波動率模型。
Andersen和Bollerslev最早提出了已實現(xiàn)波動率(Realized Volatility,簡記為RV)的概念,并首次明確了高頻數(shù)據(jù)波動率的測度指標(biāo)[4]。Torben和Andersen將RV和條件協(xié)方差矩陣聯(lián)系起來,并用美元、日元等匯率的高頻數(shù)據(jù)進(jìn)行擬合,發(fā)現(xiàn)擬合效果很好[5]。此后學(xué)者們在此基礎(chǔ)上提出了各種已實現(xiàn)測度,如Martens和van Dijk根據(jù)金融資產(chǎn)價格極值理論提出了已實現(xiàn)極差波動率(RRV)[6];Ole和Barndorff構(gòu)造RV的核密度估計表達(dá)式,提出了已實現(xiàn)核波動(RK)[7];Christensen、Oomen和Podolskij基于分位數(shù)提出了新的已實現(xiàn)測度[8]。同時,如何把波動率和已實現(xiàn)測度有效結(jié)合且具有良好的預(yù)測效果成為學(xué)者們探究的重要問題。Hansen、Zhuo和Shek提出了Realized GARCH模型[9],添加已實現(xiàn)測度到GARCH模型中,并通過測量方程將條件方差與已實現(xiàn)測度聯(lián)系起來。此后,王天一和黃卓擴展了在數(shù)據(jù)分布形態(tài)呈厚尾分布的情況下已實現(xiàn)GARCH模型,并發(fā)現(xiàn)t分布下擬合的模型具有更高的預(yù)測精度[10]。黃友珀、唐振鵬和周熙雯研究了Realized GARCH模型在偏t分布下的擬合效果[11]。玄海燕等發(fā)現(xiàn)Realized EGARCH模型在t分布和偏t分布下的擬合效果顯著優(yōu)于正態(tài)分布[12]。Louzis、Xanthopoulos和Refenes將改進(jìn)的已實現(xiàn)測度引入Realized GARCH類模型中進(jìn)行分析[13]。于孝建和王秀花提出了針對混頻數(shù)據(jù)的Realized GARCH模型,發(fā)現(xiàn)預(yù)測效果很好[14]。蔣偉和顧研引入廣義已實現(xiàn)測度,數(shù)據(jù)選取上證綜指和滬深300指數(shù),發(fā)現(xiàn)廣義已實現(xiàn)波動率能夠提高Realized GARCH模型對市場風(fēng)險的預(yù)測能力[15]。
在已實現(xiàn)GARCH類模型中,已實現(xiàn)測度的選擇十分重要。目前大多數(shù)文獻(xiàn)使用RV作為已實現(xiàn)測度。受上述文獻(xiàn)啟發(fā),基于滬深300指數(shù)的5分鐘高頻數(shù)據(jù),建立Realized GARCH模型,基于已實現(xiàn)測度RV和改進(jìn)后的RMV的模型分別在正態(tài)分布、t分布、GED分布下展示其擬合效果。結(jié)果表明:不論是基于RV還是改進(jìn)后的RMV,似然函數(shù)值都在t分布下最大,模型擬合效果最優(yōu),正態(tài)分布下效果最差;而且基于RMV擬合的模型相比基于RV在估計精度上有所提高,風(fēng)險價值VaR的預(yù)測效果也表現(xiàn)更好。
本文所使用的Realized GARCH模型是在GARCH模型的基礎(chǔ)上進(jìn)行拓展的,所以下面先給出GARCH模型的一般形式:
式(1)(2)統(tǒng)稱為均值方程,式(3)稱為方差方程。GARCH模型中過多的對于參數(shù)的限制條件使得實際估計起來可能達(dá)不到理想效果,而且用GARCH模型來擬合高頻數(shù)據(jù),可能無法擬合出數(shù)據(jù)的真實波動情況。
為此,選擇Realized GARCH模型,其具體形式如下:
由Andersen和Bollerslev提出的已實現(xiàn)波動率(RV)[4],將波動率的研究對象從低頻數(shù)據(jù)轉(zhuǎn)向高頻數(shù)據(jù)。本文在已實現(xiàn)測度的形式上結(jié)合方差的思想,納入平均水平,基于RV,得到改進(jìn)后的已實現(xiàn)波動率(Realized Mean Volatility,簡記為RMV),具體計算步驟如下:
(7)
第二步,計算金融資產(chǎn)第t個交易日的收益率,rt,i表示第t個交易日內(nèi)金融資產(chǎn)在第i個區(qū)間的對數(shù)收益率,見式(8)。與已實現(xiàn)波動率RV相比,其區(qū)別就在于用日內(nèi)平均收盤價代替前一間隔區(qū)間的收盤價。
(8)
第三步,將第二步中計算得到的t個交易日的收益率進(jìn)行平方后加總,如式(9)所示:
(9)
為了檢驗Realized GARCH模型對滬深300指數(shù)的波動率預(yù)測效果,本文使用滾動時間窗口方法以獲得樣本外預(yù)測值,具體步驟如下:
(1)將滬深300指數(shù)的收益率序列按照4∶1的比例劃分為估計樣本和預(yù)測樣本。
(2)用估計樣本對Realized GARCH模型進(jìn)行估計,預(yù)測次日波動率,滾動周期為一天。
(3)重復(fù)(2)中的操作,依次重復(fù)滾動預(yù)測,得到與預(yù)測樣本同樣數(shù)量的波動率預(yù)測值,將得到的預(yù)測值與真實值進(jìn)行比較,采用均方誤差MSE和平均絕對誤差MAE這兩個預(yù)測評價標(biāo)準(zhǔn)來反映預(yù)測效果如何。
MSE和MAE的具體形式分別如式(10)和式(11)所示:
(10)
(11)
VaR(Value at Risk)作為衡量金融市場風(fēng)險的指標(biāo),表示在給定的置信水平下,金融資產(chǎn)在某一時期可能遭受的最大損失:
Prob=(ΔP>VαR)=1-α
(12)
其中,ΔP表示金融資產(chǎn)在時間區(qū)間△t內(nèi)的損失額,α為給定的置信水平。
Kupiec提出了一種針對VaR模型的失敗率檢驗方法,其基本思想是:假設(shè)VaR序列彼此相互獨立,若VaR估計值小于實際損失額,記為失敗,反之記為成功[16]。該檢驗通過檢驗實際失敗次數(shù)和預(yù)期失敗次數(shù)的接近程度,來避免過于低估或者高估風(fēng)險。檢驗原假設(shè)為H0:P=P*,提出檢驗統(tǒng)計量表達(dá)式(13):
(13)
其中,P=N/T,N為失敗天數(shù),T為總檢驗天數(shù),置信水平為1-α,期望失敗率P*=α。而且LR值越小,模型估計越準(zhǔn)確,效果越好。
本文選取2014年1月3日—2020年12月30日共1 705個交易日的滬深300指數(shù)5分鐘高頻數(shù)據(jù)。數(shù)據(jù)來源于JoinQuant聚寬量化交易平臺。股市每日交易時間為4小時,即每日Ln1n有48個高頻數(shù)據(jù),總共81 840個高頻數(shù)據(jù)。收益率采用“收盤價-收盤價”的方式并且通過對數(shù)計算,形式如式(14)所示:
rt=lnPt-lnPt-1
(14)
其中,Pt為當(dāng)前時刻收盤價,Pt-1為前一時刻收盤價。
圖1-a5分鐘收盤價的時序圖顯示滬深300指數(shù)的價格波動幅度較大,尤其在2014年—2015年這兩年的波動程度非常劇烈;圖1-b、c、d日收益率序列、RV序列和改進(jìn)的RMV序列的時序圖則顯示每個序列都有明顯的波動聚集效應(yīng)。通過圖2滬深300指數(shù)日收益率序列的頻率分布圖顯示其分布的大致形態(tài),其結(jié)果顯示,與標(biāo)準(zhǔn)正態(tài)分布相比,滬深300指數(shù)的日收益率序列分布具有尖峰厚尾特征,說明該序列并不符合傳統(tǒng)的正態(tài)分布假設(shè)。
圖1-a
圖2 日收益率頻率分布圖
表1給出了日收益率r、RV、改進(jìn)后的RMV的基本描述統(tǒng)計量的信息。從均值看,三者的均值都接近0,可以忽略不計;從偏度上看,日收益率r分布左偏但是偏度較小,RV和RMV都呈右偏分布且偏度較大;從峰度上看,三者都呈尖峰分布,與圖2尖峰厚尾分布形態(tài)也是吻合的;從J-B統(tǒng)計量和P值上看,這三個序列都顯著拒絕了正態(tài)分布的假設(shè),表明各序列都不服從正態(tài)分布。從ADF檢驗的結(jié)果看,日收益率r、RV和改進(jìn)后的RMV都顯著拒絕了原假設(shè),即三者都是平穩(wěn)序列。而且使用Ljung-Box檢驗驗證收益率序列是否適合用GARCH族模型建模,發(fā)現(xiàn)給定5%的顯著性水平,在從1到10的滯后階數(shù)下,不存在ARCH效應(yīng)的原假設(shè)都被顯著拒絕。因此更加明顯地驗證了日收益率具有顯著的ARCH效應(yīng),可以進(jìn)行下一步的建模。
表1 日收益率r、RV、RMV的基本統(tǒng)計量
前面已經(jīng)檢驗ARCH效應(yīng)的存在,但由于滯后階數(shù)過多會導(dǎo)致模型不穩(wěn)定,因此本文選擇Realized GARCH(1,1)模型進(jìn)行實證研究。表3顯示了基于RV和改進(jìn)后的RMV的Realized GARCH(1,1)在三種不同分布下的參數(shù)估計結(jié)果。
表3 基于RV和RMV的Realized GARCH(1,1)模型參數(shù)估計
從結(jié)果來看,發(fā)現(xiàn)不論是改進(jìn)前還是改進(jìn)后,每種情況下三種分布的各參數(shù)估計結(jié)果都比較接近,這說明建立的Realized GARCH模型具有穩(wěn)健性;基于RV下的模型估計參數(shù)在正態(tài)分布、t分布和GED分布下的標(biāo)準(zhǔn)誤差幾乎都大于基于RMV下的模型參數(shù)的估計標(biāo)準(zhǔn)誤差,基于RMV的參數(shù)估計誤差普遍較小,例如,基于RV的模型估計標(biāo)準(zhǔn)誤差在各分布下都在0.16左右,而基于RMV的模型估計標(biāo)準(zhǔn)誤差在各分布下則在0.05左右,GED分布下甚至只有0.005,標(biāo)準(zhǔn)誤差顯著降低。通常似然函數(shù)值可以體現(xiàn)模型的擬合效果,不論是基于RMV還是RV的似然函數(shù)值,都在t分布下取得最大值,表現(xiàn)最好,其次是GED分布,且遠(yuǎn)勝于正態(tài)分布下的擬合效果。這表明收益率序列具有尖峰厚尾特征,確實不符合正態(tài)分布的假設(shè),用t分布擬合可以得到更好的擬合效果。
采用滾動時間窗口方法進(jìn)行樣本外預(yù)測,將2014年1月3日至2020年12月30日共1 705個滬深300指數(shù)收益率數(shù)據(jù)按照4∶1的比例劃分。估計樣本長度為1 364,預(yù)測樣本長度為341。其中,i表示滾動周期,當(dāng)i=0時,則使用序列對Realized GARCH模型進(jìn)行估計,預(yù)測次日波動率。本文選擇滾動周期為一天,即i=1,依此重復(fù)滾動預(yù)測,得到341個波動率預(yù)測值。將得到的341個波動率預(yù)測值與真實值進(jìn)行比較,采用均方誤差MSE和平均絕對誤差MAE這兩個預(yù)測評價標(biāo)準(zhǔn)來反映預(yù)測效果如何。從表2的結(jié)果來看,基于RV的估計結(jié)果中MSE顯示正態(tài)分布最好,這可能與收益率序列偏度不大有關(guān),MAE則顯示GED分布最好;基于RMV的估計結(jié)果中不論是MSE還是MAE,都選擇了GED分布,其次是t分布,正態(tài)分布最差。另外,改進(jìn)后的RMV在三種分布下的估計殘差基本都略小于RV下的模型估計殘差。
表2 預(yù)測殘差
模型擬合完成之后,投資者往往會關(guān)心模型對風(fēng)險度量的效果如何。為此選擇Kupiec失敗率檢驗法來比較每個模型在不同置信水平下的VaR預(yù)測效果。其中,LR值越小,P值越大,模型越精確,可信度越高。
從表4可以看出,在顯著性水平α=0.05時,基于RV的Realized GARCH模型在三種不同分布下LR值都較大,且檢驗的P值均小于0.05,拒絕原假設(shè),說明得到的失敗率與給定置信水平下的失敗率相差較大,風(fēng)險度量效果較差;而基于RMV的模型在三種分布下LR值明顯減小,且P值都大于0.05,說明風(fēng)險度量效果較好。在顯著性水平α=0.01時,基于RV下的Realized GARCH模型只有在t分布下的P值較大,大于0.01,可以認(rèn)為t分布下的風(fēng)險度量效果稍好一些,在正態(tài)分布和GED分布下的P值都小于0.01;而基于RMV下的模型在三種分布下的LR值都很小,且P值遠(yuǎn)大于0.01,風(fēng)險度量效果較好。
表4 預(yù)測樣本上Kupiec失敗率檢驗結(jié)果
圖3(a)-(f)展示了在99%的置信水平下三種不同分布下RV和RMV的VaR擬合效果??梢钥闯霾煌植枷禄赗V的收益小于VaR的部分都要少于基于RMV下的部分,說明基于RV的模型與基于RMV的模型相比更低估了風(fēng)險價值,這和Kupiec失敗率檢驗結(jié)果也是一致的。
圖3-a 正態(tài)分布下基于RV的VaR預(yù)測
已實現(xiàn)波動率是高頻波動率模型中體現(xiàn)數(shù)據(jù)波動的重要測度,本文在RV的基礎(chǔ)上做出改進(jìn),得到改進(jìn)后RMV,以滬深300指數(shù)為例,利用Realized GARCH模型對其波動率進(jìn)行預(yù)測研究,得到以下結(jié)論。滬深300指數(shù)的收益率序列具有明顯的波動聚集特征,且基于正態(tài)分布、t分布和GED分布的參數(shù)估計結(jié)果具有穩(wěn)健性;由于收益率序列并不符合正態(tài)分布假設(shè),兩者都是在t分布下似然函數(shù)值最大,模型擬合效果最優(yōu),正態(tài)分布下效果最差;改進(jìn)后的已實現(xiàn)波動率相比之前的已實現(xiàn)波動率在殘差上要有所降低,估計精度提高,并且在VaR的預(yù)測效果上更好。針對股市高頻數(shù)據(jù)的波動率的建模,對投資者掌握市場動向具有重要意義,對已實現(xiàn)波動率進(jìn)行改進(jìn)并且取得較好的預(yù)測效果意味著對已實現(xiàn)測度的選擇仍可以拓展思路,可以通過改進(jìn)其形式不斷提高模型的擬合效果。