玄海燕,戴天驕,李鴻漸,郭長青
(蘭州理工大學 經(jīng)濟管理學院,蘭州 730050)
如何合理地擬合波動率在金融領(lǐng)域一直是研究的重點。在金融時間序列的條件異方差模型擬合方面,以Engle(1982)[1]提出的自回歸條件異方差(ARCH)模型和Bollerslev(1986)[2]提出的廣義自回歸條件異方差(GARCH)模型為主,這也是最早且得到廣泛應(yīng)用的條件異方差模型。
GARCH類模型存在的主要問題是研究樣本只能為低頻數(shù)據(jù)(在證券市場中主要為日數(shù)據(jù)),而信息化技術(shù)的進步增強了數(shù)據(jù)采集能力,高頻數(shù)據(jù)越來越多的在應(yīng)用研究中出現(xiàn),向主要在低頻數(shù)據(jù)層面應(yīng)用的GARCH類模型提出了新的需求。高頻數(shù)據(jù)的不規(guī)則交易間隔、離散取值、強自相關(guān)性、日內(nèi)模式的特征讓傳統(tǒng)的計量模型在實際應(yīng)用中表現(xiàn)不佳,因此學者們開始研究用于高頻數(shù)據(jù)層面的GARCH類相關(guān)模型。Andersen等(2008)[3]提出專用于高頻數(shù)據(jù)的“已實現(xiàn)測度”。此后將已實現(xiàn)測度和傳統(tǒng)的GARCH模型結(jié)合用于高頻數(shù)據(jù)的波動率建模成為了一個研究熱點。最初,研究主要集中在GARCH-X模型上,這類模型直接將已實現(xiàn)測度作為外生變量納入,模型形式較為簡單,但是在預(yù)測方面存在缺陷。因此,建立把波動率和已實現(xiàn)測度聯(lián)合、具有優(yōu)良預(yù)測能力的模型成了后續(xù)的研究方向。Hansen等(2012)[4]提出的Realized GARCH模型就是其中之一,在傳統(tǒng)的GARCH模型中加了已實現(xiàn)測度,并利用已實現(xiàn)測度的方程(測量方程)將條件方差和已實現(xiàn)測度聯(lián)系起來。王天一和黃卓(2012)[5]將Realized GARCH模型推廣到厚尾分布的情形,認為Skewed-t分布可以較好的反映收益率的尖峰厚尾的特征,同時使用t分布的預(yù)測精度最高。黃雯等(2012)[6]認為基于Skewed-t分布Realized GARCH模型擬合情況和尾部風險描述能力明顯優(yōu)于正態(tài)分布和t分布下的Realized GARCH模型。王天一等(2014)[7]使用多種頻率的已實現(xiàn)波動率及實現(xiàn)核估計作為已實現(xiàn)測度進行分析,采用t分布和正態(tài)分布并和GARCH、EGARCH模型進行對比,認為數(shù)據(jù)頻率、分布設(shè)定以及不同已實現(xiàn)測度對其預(yù)測能力有影響。魏正元等(2015)[8]研究認為誤差項服從Skewed-t分布的Realized GARCH(1,2)模型對于上證380的擬合能力較好,并且能夠精確地測量其收益風險。Hansen和Huang(2012)[9]基于Realized GARCH模型進行拓展,提出了Realized EGARCH模型,對Realized GARCH模型中的GARCH方程進行修改,使得Realized EGARCH模型能夠更好地反映當前市場上存在的非對稱性特征。Banulescu等(2016)[10]將Realized EGARCH模型進一步推廣,考慮了robust結(jié)構(gòu)的杠桿函數(shù)并與Realize GARCH模型對比。
Hansen和Huang(2012)[9]對于Realized EGARCH模型的研究主要基于正態(tài)分布,對于t分布及Skewed-t分布下的模型情況并沒有進行研究。因此,本文針對上證指數(shù)的5分鐘高頻數(shù)據(jù),探討基于t分布及Skewed-t分布下Realized EGARCH模型的擬合情況,并與正態(tài)分布下的擬合情況進行對比。結(jié)果表明,基于t分布及Skewed-t分布下Realized EGARCH模型的擬合效果明顯優(yōu)于正態(tài)分布下的情況,但是二者之間差異不大。
Hansen和Huang(2012)[9]提出的Realized EGARCH模型如下所示:這三個式子中,式(1)被稱作是回歸方程,式(2)是GARCH方程,式(3)則被稱為測量方程。其中μ通常設(shè)定為0,但是會根據(jù)數(shù)據(jù)出現(xiàn)擬合結(jié)果不為0的情況。zt、ut獨立同分布且 zt~iid(0,1) ,ut~iid(0,) ,ut=u1,t,u2,t,…,uK,t,k=1,2,…,K ,xt是由高頻數(shù)據(jù)計算出的已實現(xiàn)測度。GARCH方程和測量方程中的杠桿函數(shù)的形式如下所示:
這兩個杠桿函數(shù)在整個模型中起著相當重要的作用,通常扮演著在現(xiàn)實中使zt、ut具有獨立性的因素的角色,同對回歸沖擊和波動率沖擊的非獨立性關(guān)系建模,波動率沖擊由 νt=τ(zt-1)+γut-1得出,其繪圖后即為 Realized GARCH模型的信息沖擊曲線,形式為νt=E(loght+1|Ft)-E(loght+1|Ft-1)。
Realized EGARCH模型中的三個方程與Hansen等(2012)提出的Realized GARCH模型中的三個方程有所區(qū)別。Realized GARCH模型的前兩個方程的基于GARCH-X模型,采用了與Engle(2002)、Barndorff-Nielsen和Shephard(2007)、Visser(2011)相似的形式,而測量方程則是Realized GARCH框架相比于其他模型的特色所在,加入了杠桿函數(shù)來描述波動率對于收益率沖擊的非對稱反應(yīng)。兩個模型的差異主要體現(xiàn)在GARCH方程上,Realized EGARCH模型并沒有將logxt直接納入計算,而是替換為一個杠桿函數(shù)logxt方程中ut的滯后項的和的形式。因此τ(zt-1)+γut-1被稱為條件波動率的創(chuàng)新。
測度方程中可以使用的已實現(xiàn)測度種類較為豐富,較為常用的有以下四種:已實現(xiàn)波動率(realized variance,RV),已實現(xiàn)核估計(realized kernel,RK),已實現(xiàn)二次冪變差(realized bipower variation,RBV),已實現(xiàn)極差(realized range,RR)。已實現(xiàn)波動率是通過計算日內(nèi)收益率的平方和來估計波動率,并且是積分波動IR的一致估計量。因而雖然后續(xù)提出了諸多已實現(xiàn)測度,但已實現(xiàn)波動率仍然是其中應(yīng)用較為廣泛的一種。在這里本文使用RV作為測量方程中的xt。已實現(xiàn)波動率的表達式如下:
其中m為一天的樣本數(shù),i為第t天的第i個樣本。m的值取決于采樣頻率,頻率越高,每日數(shù)據(jù)量越大。這里采用5分鐘高頻數(shù)據(jù),所以本文取m=48。由于市場微觀噪聲的存在,采樣頻率過高會使RV值嚴重偏離,過低則信息量有損失,因此必須尋找最優(yōu)的采樣頻率。
Realized EGARCH模型的似然函數(shù)由兩部分組成:
其中,L(r|x)+L(x|r)為似然函數(shù)中對應(yīng)ut和zt的部分,在進行模型間分布擬合和預(yù)測能力的比較前必須確保使用相同的數(shù)據(jù),但是由于在與不同模型比較時L(x|r)不一定都存在,因此只使用似然函數(shù)中L(r|x)的部分,即半似然函數(shù)。試用半似然函數(shù)值進行比較的方式在王天一等、黃雯等的研究中均有試用。由于本文進行的對比研究是基于相同模型,單獨計算L(r|x)要更加麻煩,為簡化計算,直接使用L(r,x)進行比較,形式如下:
本文采用的t分布為Bollerslev(1987)提出的標準化t分布,形式為:
Hansen(1994)提出的Skewed-t形式為:
其中ν為自由度,ε體現(xiàn)了分布函數(shù)的偏斜情況,當ε>0時,分布右偏;當ε<0時,分布左偏;ε=0時,整個分布退化為標準化t分布。
雖然從分布的特征上來說,Skewed-t分布比t分布更能體現(xiàn)金融時間序列尖峰厚尾、有偏的性質(zhì),在對Realized GARCH模型分布擬合的相關(guān)研究中被認為Skewed-t分布的擬合效果明顯優(yōu)于其他分布,但是Realized EGARCH模型的結(jié)構(gòu)與Realized GARCH模型的結(jié)構(gòu)相比,更加強調(diào)了杠桿函數(shù)的部分,對于不對稱性的反應(yīng)相比Realized GARCH模型來說已經(jīng)有了增強。與t分布相比Skewed-t分布也只是多考慮了偏度的影響,因此不確定基于Skewed-t分布的擬合結(jié)果一定優(yōu)于t分布下的擬合結(jié)果。由于目前還沒有相關(guān)文獻證明基于t分布下的Realized EGARCH模型已經(jīng)足夠反應(yīng)金融時間序列本身的特征,因此基于多種分布對于Realized EGARCH模型的擬合情況的影響進行研究是有必要的。
本文使用的數(shù)據(jù)為2016年1月8日到2017年3月24日共294個交易日的5分鐘高頻數(shù)據(jù),每日交易時間為4小時,共48個數(shù)據(jù)點。收益率采用“收盤價—收盤價”的形式計算。對數(shù)收益率的表達式為:
其中pt為當前時刻收盤價,pt-1為前一時刻收盤價。5分鐘收益率序列和已實現(xiàn)波動率序列如圖1所示??梢钥闯鲞@兩個序列都存在明顯的波動率集聚現(xiàn)象。而且由于數(shù)據(jù)選擇區(qū)間包括了極端區(qū)間,數(shù)據(jù)左側(cè)波動十分劇烈。
圖1 上證指數(shù)收益率序列及已實現(xiàn)波動率序列
表1計算了兩個序列的基本統(tǒng)計量。從中可以看出收益率序列rt與對數(shù)已實現(xiàn)波動率RV5存在著顯著的尖峰特征。在正態(tài)性檢驗上采用了K-S檢驗,Z值分別為14.360和7.610,括號內(nèi)為p值,p值<0.05,顯著地拒絕了正態(tài)分布假設(shè)。從偏度來看,rt與logRV5序列的偏度都在0附近,說明數(shù)據(jù)偏斜不強,這可能會對Skewed-t分布下的擬合效果產(chǎn)生一定的影響。因此從描述性統(tǒng)計的結(jié)果來說,t分布可能與Skewed-t分布的擬合情況相似。
表1 描述性統(tǒng)計
使用上述數(shù)據(jù)進行模型參數(shù)估計結(jié)果如表2所示。其中,RE為Realized EGARCH模型的簡寫,N為正態(tài)分布,t為t分布,S-t為Skewed-t分布。括號內(nèi)為參數(shù)的標準誤差(std.error)。估計方式為QMLE(Quasi-maximum Likelihood Estimate),即準極大似然估計。
表2 Realized EGARCH模型的參數(shù)估計
從參數(shù)估計結(jié)果來看,由于ε<0,說明殘差分布存在一定的偏斜,且為左偏,但是偏斜較為微弱,這可能是由于RV5和rt序列的偏度不強的結(jié)果。三種分布下估計出的τ1、τ2和δ1、δ2的值均為一負一正,體現(xiàn)出了模型的非對稱性,并且t分布和Skewed-t分布下杠桿函數(shù)的參數(shù)τ1、τ2和δ1、δ2的值基本相同,說明二者在對數(shù)據(jù)非對稱性的反應(yīng)上基本相同。從標準誤差來看,正態(tài)分布下參數(shù)的標準誤差、t分布下的參數(shù)標準誤差和Skewed-t分布下的標準誤差各有大小,無法從參數(shù)估計的標準誤差上來準確評定模型的參數(shù)擬合情況。但是從參數(shù)估計的結(jié)果來看,t分布下的參數(shù)估計結(jié)果應(yīng)當是最優(yōu)的,這種最優(yōu)可能與模型選擇的已實現(xiàn)測度的種類、數(shù)據(jù)的時間區(qū)間有關(guān),如果偏度相反或者都接近0,則使用t分布要更為簡單。
圖2為三種分布情況下Realized EGARCH模型的信息沖擊曲線??梢钥闯鰐分布和Skewed-t分布下的信息沖擊曲線比正態(tài)分布的曲線形狀更加分明,且對稱軸偏離0較多,說明這兩種分布體現(xiàn)了更強的不對稱性,更能夠體現(xiàn)Realized EGARCH模型的強非對稱性的性質(zhì)。
圖2 信息沖擊曲線
對于模型的擬合能力進行評估時,使用似然函數(shù)進行比較。表3中l(wèi)ogL(Log likelihood function)為對數(shù)似然函數(shù)值,其數(shù)值越大說明在相應(yīng)參數(shù)下獲得所用數(shù)據(jù)的可能性越高。
表3 三種分布的擬合能力評估指標
從對數(shù)似然函數(shù)的值來看,仍然是Skewed-t分布下的擬合結(jié)果的對數(shù)似然函數(shù)值最大,但與t分布下的擬合結(jié)果差異不大。正態(tài)分布下擬合結(jié)果的對數(shù)似然函數(shù)值最小,與其他兩個分布相比顯得擬合結(jié)果不夠優(yōu)良。
本文主要研究基于高頻數(shù)據(jù)的波動率模型——Realized EGARCH模型在殘差服從三種不同分布下時模型的擬合情況,并使用上證指數(shù)進行了實證研究。上證指數(shù)的收益率明顯地表現(xiàn)出尖峰厚尾、有偏的特征,這也是金融時間序列數(shù)據(jù)的所特有的。Realized EGARCH模型與Realized GARCH模型相比,在模型形式上加強了對非對稱性的反映,其結(jié)構(gòu)本身可以產(chǎn)生一定的峰度和偏度,但是這種偏度和峰度仍然不足以擬合數(shù)據(jù),在正態(tài)分布下擬合上證指數(shù)數(shù)據(jù)產(chǎn)生的較大的標準誤差可以說明這一點。
另外,不同的已實現(xiàn)測度可能對模型結(jié)果會產(chǎn)生不同的影響,本文只使用已實現(xiàn)波動率作為已實現(xiàn)測度,諸多相關(guān)研究表明已實現(xiàn)波動率相比其他已實現(xiàn)測度可能存在一定的誤差,進而影響模型的擬合情況,這是下一步研究的范疇。
最后,在對于上證指數(shù)數(shù)據(jù)的殘差服從正態(tài)分布、t分布、Skewed-t分布下Realized EGARCH模型進行的擬合研究結(jié)果表明,這三種分布中的Skewed-t分布在擬合模型時具有較為良好的性質(zhì),但是其擬合效果與t分布的擬合效果差異不大,這可能與數(shù)據(jù)的選擇及已實現(xiàn)測度的選擇有關(guān)。總體來說,對上證指數(shù)使用以上三種不同的分布進行Realized EGARCH模型的擬合時,Skewed-t分布的擬合效果最好。