王天一,劉 浩,黃 卓
(1.對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)金融學(xué)院,北京100029;2.北京大學(xué)國(guó)家發(fā)展研究院,北京100871)
資產(chǎn)收益的波動(dòng)率在資產(chǎn)定價(jià),風(fēng)險(xiǎn)管理,資產(chǎn)配置等領(lǐng)域占有重要地位.由于波動(dòng)率本身有很強(qiáng)的時(shí)變性,其建模和預(yù)測(cè)問(wèn)題一直是金融計(jì)量領(lǐng)域的核心問(wèn)題之一.自ARCH和GARCH模型以來(lái)[1,2],有大量文獻(xiàn)開(kāi)始對(duì)其進(jìn)行研究,并拓展出適應(yīng)諸如杠桿效應(yīng),厚尾以及長(zhǎng)記憶等收益率和波動(dòng)率的常見(jiàn)特征的GARCH類(lèi)模型[3].隨著資產(chǎn)價(jià)格高頻數(shù)據(jù)獲取難度的降低,利用高頻數(shù)據(jù)估計(jì)波動(dòng)率的研究開(kāi)始大量出現(xiàn).其中,傳統(tǒng)的GARCH模型和新出現(xiàn)的已實(shí)現(xiàn)測(cè)度如何結(jié)合成為一個(gè)研究熱點(diǎn).Engle等[4],Shephard等[5],Hansen等[6]的研究分別提出了三種不同的利用已實(shí)現(xiàn)測(cè)度對(duì)收益率和波動(dòng)率進(jìn)行聯(lián)合建模的方法.這三類(lèi)方法中,以已實(shí)現(xiàn)GARCH模型的結(jié)構(gòu)最為簡(jiǎn)潔.實(shí)證結(jié)果表明,已實(shí)現(xiàn)GARCH模型在波動(dòng)率預(yù)測(cè)方面可以顯著地超越傳統(tǒng)的GARCH模型[6].
文獻(xiàn)中對(duì)已實(shí)現(xiàn)GARCH模型進(jìn)行的研究主要有分布拓展和模型結(jié)構(gòu)拓展等方面.分布拓展方面,Watanabe[7]研究了有偏分布的已實(shí)現(xiàn)GARCH模型對(duì)于SP500指數(shù)的在險(xiǎn)價(jià)值和預(yù)期損失的預(yù)測(cè)能力.模型結(jié)構(gòu)拓展方面,Hansen等[8]提出了能夠引入多個(gè)已實(shí)現(xiàn)測(cè)度的已實(shí)現(xiàn)E GARCH模型,該模型能夠更加靈活地對(duì)收益率和波動(dòng)率之間的關(guān)系進(jìn)行建模.Lunde等[9]對(duì)比了已實(shí)現(xiàn)E GARCH模型同EGARCH模型在預(yù)測(cè)NOMXC遠(yuǎn)期合約波動(dòng)率上的表現(xiàn).國(guó)內(nèi)相關(guān)研究也已經(jīng)起步(如文獻(xiàn)[10—12]).
相比之下,既有研究對(duì)已實(shí)現(xiàn)GARCH模型在長(zhǎng)記憶性建模方面的討論相當(dāng)缺乏.所謂長(zhǎng)記憶性,是指波動(dòng)率序列的自相關(guān)系數(shù)下降緩慢,顯示出很強(qiáng)的持續(xù)性[13].實(shí)證研究表明,波動(dòng)率的長(zhǎng)記憶性對(duì)于其在多步預(yù)測(cè)[14],衍生品定價(jià)[15],風(fēng)險(xiǎn)管理[16]等問(wèn)題上的表現(xiàn)有關(guān)鍵性的影響.國(guó)內(nèi)亦有針對(duì)股票市場(chǎng)和期貨市場(chǎng)長(zhǎng)記憶性的研究[17,18].然而,已實(shí)現(xiàn)GARCH模型的約簡(jiǎn)形式比較簡(jiǎn)單,對(duì)波動(dòng)率相關(guān)性的刻畫(huà)存在限制.以文獻(xiàn)中最常用的已實(shí)現(xiàn)GARCH(1,1)模型為例,其針對(duì)條件方差的約簡(jiǎn)形式基本上是ARMA(1,1)結(jié)構(gòu),而該結(jié)構(gòu)本身并不能產(chǎn)生足夠的記憶性.本文的實(shí)證結(jié)果指出,已實(shí)現(xiàn)GARCH模型參數(shù)隱含的“條件方差的理論自相關(guān)函數(shù)”與模型估計(jì)出來(lái)的“條件方差的樣本自相關(guān)函數(shù)”之間有巨大的差異,說(shuō)明在建模長(zhǎng)記憶性上現(xiàn)有模型設(shè)定存在不足,有必要討論如何改進(jìn).
現(xiàn)有的關(guān)于波動(dòng)率長(zhǎng)記憶性的模型基本上分成兩大類(lèi):一類(lèi)是GARCH類(lèi)模型中的基于分?jǐn)?shù)階差分的FIGARCH模型[19],基于長(zhǎng)短期成分建模的成分GARCH模型[20]等.另一類(lèi)是直接使用已實(shí)現(xiàn)測(cè)度,忽略GARCH結(jié)構(gòu)的ARFIMA模型[21],基于混頻數(shù)據(jù)抽樣的MIDAS模型[22],基于波動(dòng)率瀑布效應(yīng)(volatility cascade)的異質(zhì)性自回歸模型(HAR)模型[23]等.國(guó)內(nèi)也有相關(guān)文獻(xiàn)對(duì)這兩類(lèi)模型進(jìn)行研究(如文獻(xiàn)[24,25]等).
已實(shí)現(xiàn)GARCH模型作為GARCH族模型中的一員,最直接的提升記憶性的辦法就是引入FI GARCH或者成分GARCH結(jié)構(gòu).但FI GARCH結(jié)構(gòu)估計(jì)過(guò)程復(fù)雜,數(shù)據(jù)需求量大,經(jīng)濟(jì)意義不明顯[23].成分GARCH模型的長(zhǎng)短期效應(yīng)并不能直接被觀測(cè),不容易在已實(shí)現(xiàn)測(cè)度的層面找到對(duì)應(yīng)的可觀測(cè)量.相比之下,引入混頻數(shù)據(jù)抽樣結(jié)構(gòu)改進(jìn)已實(shí)現(xiàn)GARCH模型是一種更為有效的方法.首先,混頻數(shù)據(jù)抽樣結(jié)構(gòu)使用的是一個(gè)已實(shí)現(xiàn)測(cè)度的多期歷史數(shù)據(jù),而不是多個(gè)已實(shí)現(xiàn)測(cè)度的歷史數(shù)據(jù),因此改進(jìn)后的已實(shí)現(xiàn)GARCH模型并不需要多個(gè)測(cè)量方程,模型結(jié)構(gòu)簡(jiǎn)單,經(jīng)濟(jì)意義清晰.其次,混頻數(shù)據(jù)抽樣結(jié)構(gòu)作為一種參數(shù)節(jié)約的設(shè)定,使用少量形狀參數(shù)配合權(quán)重函數(shù)就可以給出對(duì)歷史較長(zhǎng)時(shí)間內(nèi)已實(shí)現(xiàn)測(cè)度的加權(quán)系數(shù).由于權(quán)重函數(shù)形式較HAR模型更加靈活,且形狀參數(shù)本身也是待優(yōu)化系數(shù)之一,這種方式可以有效地抽取數(shù)據(jù)中的長(zhǎng)期波動(dòng)信息.而這一成分是對(duì)傳統(tǒng)已實(shí)現(xiàn)GARCH模型短期波動(dòng)成分的重要補(bǔ)充.
基于以上觀察,本文將混頻數(shù)據(jù)抽樣結(jié)構(gòu)引入已實(shí)現(xiàn)GARCH模型中,構(gòu)造出同時(shí)包含長(zhǎng)短期已實(shí)現(xiàn)測(cè)度信息,能對(duì)波動(dòng)率長(zhǎng)記憶性進(jìn)行建模的已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型.對(duì)于指數(shù)和個(gè)股的實(shí)證結(jié)果表明,相比于已實(shí)現(xiàn)GARCH模型,新模型能夠:1)顯著提升模型擬合優(yōu)度以及對(duì)波動(dòng)率長(zhǎng)記憶性的捕捉能力;2)顯著提升波動(dòng)率多步預(yù)測(cè)的精度.
令rt表示資產(chǎn)在t期的收益率,xt表示t期已實(shí)現(xiàn)測(cè)度,ht表示rt的條件方差,Hansen等[6]提出的已實(shí)現(xiàn)GARCH模型可以寫(xiě)成如下形式
其中zt~N(0,1),,兩者獨(dú)立.
式(1)和式(2)分別對(duì)應(yīng)傳統(tǒng)GARCH模型中的均值方程和方差方程,式(2)中的波動(dòng)率更新項(xiàng)由傳統(tǒng)的“收益率平方”改成了信息更為豐富和準(zhǔn)確的“已實(shí)現(xiàn)測(cè)度”.已實(shí)現(xiàn)GARCH關(guān)鍵特點(diǎn)是在均值方程和方差方程外,加入了“測(cè)量方程”(式(3)).其主要作用是連接已實(shí)現(xiàn)測(cè)度和條件方差,從而實(shí)現(xiàn)對(duì)收益率和已實(shí)現(xiàn)測(cè)度的聯(lián)合建模.
相比GARCH—X模型,已實(shí)現(xiàn)GARCH模型可以實(shí)現(xiàn)波動(dòng)率的多步預(yù)測(cè).一般稱(chēng)τ(zt)為杠桿函數(shù),用來(lái)刻畫(huà)金融市場(chǎng)中普遍存在的收益率與波動(dòng)率的非對(duì)稱(chēng)關(guān)系,
Ghysels等[22]提出的混頻數(shù)據(jù)抽樣方法可以利用較少的參數(shù)來(lái)賦權(quán)歷史信息,基于前K期的已實(shí)現(xiàn)測(cè)度預(yù)測(cè)本期的已實(shí)現(xiàn)測(cè)度的混頻數(shù)據(jù)抽樣回歸如下
其中ψk(ω1)為各期已實(shí)現(xiàn)測(cè)度的賦權(quán)函數(shù),其設(shè)定依賴于具體的抽樣方法.
在波動(dòng)率建模和預(yù)測(cè)的文獻(xiàn)中常用的函數(shù)形式有指數(shù)型函數(shù),Beta型函數(shù)等.本文使用21階單參數(shù)Beta函數(shù)來(lái)對(duì)數(shù)據(jù)進(jìn)行賦權(quán)1雖然雙參數(shù)Beta函數(shù)有更豐富的函數(shù)結(jié)構(gòu),但其參數(shù)估計(jì)穩(wěn)定性較差,而且實(shí)證結(jié)果上與單參數(shù)Beta函數(shù)幾乎沒(méi)有差別,因此采用單參數(shù)Beta函數(shù)進(jìn)行建模.,其具體形式如下
向方差方程式(2)中加入經(jīng)過(guò)ψk(ω1)賦權(quán)的長(zhǎng)期波動(dòng)信息后,已實(shí)現(xiàn)GARCH模型的方差方程式變?yōu)?/p>
該模型稱(chēng)為已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型.
與傳統(tǒng)的已實(shí)現(xiàn)GARCH模型相比,新模型引入了過(guò)去22天(約合一個(gè)月的交易時(shí)間)的已實(shí)現(xiàn)測(cè)度信息,并且這種引入不以大量增加模型參數(shù)為代價(jià).由于只使用了一個(gè)已實(shí)現(xiàn)測(cè)度,測(cè)量方程(3)不需要做任何調(diào)整.權(quán)重函數(shù)的定義保證各階滯后項(xiàng)權(quán)重和為1,因此模型的穩(wěn)定性條件為
將測(cè)量方程(3)代入方差方程(6)可得
式(8)表明對(duì)數(shù)波動(dòng)率服從帶參數(shù)約束的類(lèi)ARMA(22,22)結(jié)構(gòu),式(9)表明對(duì)數(shù)已實(shí)現(xiàn)測(cè)度服從帶參數(shù)約束的ARMA(22,1)結(jié)構(gòu).這個(gè)結(jié)果說(shuō)明在描述以實(shí)現(xiàn)測(cè)度動(dòng)態(tài)的問(wèn)題上,已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型和傳統(tǒng)的混頻數(shù)據(jù)抽樣回歸本質(zhì)上不一樣2相同滯后階的混頻數(shù)據(jù)抽樣回歸實(shí)際上對(duì)應(yīng)的是已實(shí)現(xiàn)測(cè)度的帶參數(shù)約束的AR(22)模型..在后文實(shí)證部分可以看到,得益于上述更加豐富的結(jié)構(gòu),新模型相比已實(shí)現(xiàn)GARCH模型可以更好地描述ln(ht)和ln(xt)的動(dòng)態(tài).
由于加入混頻數(shù)據(jù)抽樣項(xiàng)并沒(méi)有改變誤差項(xiàng)(z,u)可以觀測(cè)的事實(shí),已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型仍然可以沿用最大似然估計(jì)法(MLE)進(jìn)行估計(jì)[6].在(z,u)相互獨(dú)立的假設(shè)下,聯(lián)合似然函數(shù)l(r,x)可以分成兩部分:對(duì)應(yīng)收益率殘差z的部分記為l(r);對(duì)應(yīng)已實(shí)現(xiàn)測(cè)度殘差u的部分記為l(x|r),即
其中l(wèi)(r)部分在后文中被稱(chēng)為半似然函數(shù),可以顯示出模型對(duì)于收益率分布擬合的情況.初始條件波動(dòng)率h0作為參數(shù)一并進(jìn)行估計(jì).
本文使用的數(shù)據(jù)包括五只個(gè)股(IBM,INTC,MSFT,WMT,XOM)以及SP500指數(shù)ETF(SPY)的日度數(shù)據(jù)3其中SPY是對(duì)應(yīng)SP500指數(shù)的ETF,對(duì)整個(gè)市場(chǎng)有代表性.XOM為成分股中的大市值股票.IBM為成分股中的大權(quán)重股票.INTC,MSFT屬于科技類(lèi)股票.WMT代表的零售業(yè)相對(duì)周期性較弱.,時(shí)間跨度為2002—01—02~2013—12—31.收益率為使用對(duì)數(shù)收益率計(jì)算的“收盤(pán)價(jià)—收盤(pán)價(jià)”收益率4作者同樣試驗(yàn)過(guò)基于“開(kāi)盤(pán)價(jià)-開(kāi)盤(pán)價(jià)”收益率和5 min已實(shí)現(xiàn)方差(RV)的實(shí)證結(jié)果,結(jié)果并無(wú)明顯差異.,數(shù)據(jù)來(lái)源為Yahoo Finance網(wǎng)站.已實(shí)現(xiàn)測(cè)度采用已實(shí)現(xiàn)核估計(jì)(realized kernel,RK)進(jìn)行估計(jì)[26],數(shù)據(jù)由Asger Lunde提供.其計(jì)算方法如下
其中K(·)是核函數(shù),H是核函數(shù)的帶寬,m是每天取樣的個(gè)數(shù),ri,t是第t日的第i個(gè)日內(nèi)收益率.
由于顯式地考慮了日內(nèi)收益之間的相關(guān)性問(wèn)題,RK對(duì)于高頻數(shù)據(jù)中存在的市場(chǎng)微觀噪音有很強(qiáng)的免疫能力.表1給出了本文使用數(shù)據(jù)的描述性統(tǒng)計(jì)量5收益率的單位為百分之一,已實(shí)現(xiàn)測(cè)度亦做相應(yīng)的調(diào)整..其中SPY,INTC和XOM呈現(xiàn)負(fù)偏度,其余呈現(xiàn)正偏度,超額峰度均大于0,說(shuō)明各個(gè)序列均有一定的厚尾現(xiàn)象.
表1 描述性統(tǒng)計(jì)Table 1 Descriptive statistics
表2給出了已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型的全樣本估計(jì)結(jié)果,括號(hào)中是穩(wěn)健性標(biāo)準(zhǔn)誤.為了進(jìn)行對(duì)比,對(duì)應(yīng)已實(shí)現(xiàn)GARCH模型的全樣本估計(jì)結(jié)果一并給出.下文為簡(jiǎn)潔起見(jiàn),將已實(shí)現(xiàn)GARCH模型記為RG,已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型記為RMG.
從表2中可以看出,相比于RG模型,RMG模型β系數(shù)的數(shù)值顯著減小.這說(shuō)明加入長(zhǎng)期波動(dòng)信息以后,條件方差一階滯后項(xiàng)蘊(yùn)含的長(zhǎng)期波動(dòng)信息被混合數(shù)據(jù)抽樣項(xiàng)提供的信息替代了,因此其重要性相對(duì)下降.相比之下γ1變化不大,說(shuō)明以滯后一期已實(shí)現(xiàn)測(cè)度衡量的短期信息并沒(méi)有受到顯著的影響.測(cè)量方程中系數(shù)?的數(shù)值集中在1附近,說(shuō)明對(duì)數(shù)RK(ln(xt))可以近似作為對(duì)數(shù)條件波動(dòng)率(ln(ht))的一個(gè)無(wú)偏估計(jì)量6由于本文使用的是日間收益率,因此估計(jì)得到的條件波動(dòng)率為日間波動(dòng)率.因其包含了隔夜收益率變化,理論上該條件波動(dòng)率會(huì)比已實(shí)現(xiàn)核測(cè)度更大一點(diǎn)..另外τ1<0,τ2>0說(shuō)明全部序列都存在顯著的杠桿效應(yīng).RG模型的β+γ?以及RMG模型的的數(shù)值均接近于1,說(shuō)明對(duì)數(shù)條件波動(dòng)率以及對(duì)數(shù)已實(shí)現(xiàn)核估計(jì)都具有很強(qiáng)的持續(xù)性.半似然函數(shù)取值方面,RMG顯著大于RG,說(shuō)明加入長(zhǎng)期波動(dòng)信息使得標(biāo)準(zhǔn)化收益率更接近正態(tài)分布的狀況.
表 2 全樣本參數(shù)估計(jì)結(jié)果Table 2 Full sample parameter estimates
借助全樣本估計(jì)結(jié)果,可以計(jì)算各個(gè)序列對(duì)應(yīng)的單參數(shù)Beta函數(shù)權(quán)重.如圖1所示,不同模型的權(quán)重分布雖然都呈現(xiàn)下降的趨勢(shì),但是其下降速度和形狀各不相同.這說(shuō)明ψk(ω1)雖然只有一個(gè)參數(shù),但是其能體現(xiàn)的權(quán)重形式并不單一.
由于RG模型內(nèi)嵌于RMG模型,因此長(zhǎng)期波動(dòng)信息的顯著性檢驗(yàn)可以直接借助表2中匯報(bào)的似然函數(shù)值進(jìn)行計(jì)算.具體的,針對(duì)“長(zhǎng)期波動(dòng)信息對(duì)波動(dòng)率估計(jì)沒(méi)有貢獻(xiàn)”的零假設(shè)γ2=0,構(gòu)造如下統(tǒng)計(jì)量
表3 對(duì)數(shù)似然函數(shù)值以及似然比檢驗(yàn)結(jié)果Table 3 Log-likelihood and the results of likelihood ratio test
波動(dòng)率長(zhǎng)記憶性的一個(gè)表現(xiàn)就是波動(dòng)率的自相關(guān)函數(shù)(ACF)下降速度緩慢.圖2給出了不同模型擬合的對(duì)數(shù)條件方差的ACF(實(shí)線)與模型估計(jì)系數(shù)下計(jì)算的理論ACF(虛線)之間的比較7理論ACF的計(jì)算方式基于式(8)和式(9),使用ARMA模型ACF計(jì)算公式計(jì)算.對(duì)于lnh而言,由于其沒(méi)有當(dāng)期沖擊,計(jì)算公式做了相應(yīng)調(diào)整.為節(jié)約空間這里僅給出指數(shù)ETF序列SPY的結(jié)果,其他序列的結(jié)果類(lèi)似,如需要可向作者索取..左邊的圖對(duì)應(yīng)RG模型,右邊的圖對(duì)應(yīng)RMG模型.如果模型有較好的內(nèi)部一致性,兩條ACF曲線的差距應(yīng)該較小.從結(jié)果中可以看出,RG模型系數(shù)隱含的ACF顯著地偏離了其條件方差擬合值的ACF.相比之下,RMG模型對(duì)RG模型有明顯的改善,模型系數(shù)隱含的ACF序列下降速度的比RG對(duì)應(yīng)序列慢,而且和模型條件方差擬合值的ACF更接近.
圖1 全樣本估計(jì)的混合頻率抽樣項(xiàng)權(quán)重圖Fig.1 Full sample MIDAS weights
圖3給出了模型系數(shù)隱含的對(duì)數(shù)已實(shí)現(xiàn)測(cè)度的ACF(虛線)與真實(shí)對(duì)數(shù)已實(shí)現(xiàn)測(cè)度ACF(實(shí)線)之間的比較.其中短點(diǎn)虛線對(duì)應(yīng)RMG模型,長(zhǎng)點(diǎn)虛線對(duì)應(yīng)RG模型.如果模型隱含的ACF能貼近真實(shí)的ACF,模型捕捉長(zhǎng)記憶性的能力就更強(qiáng).從結(jié)果上看,RMG模型至少可以擬合20期的真實(shí)ACF,而RG模型在10期左右就開(kāi)始出現(xiàn)偏差了.
測(cè)量方程的引入使得已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH能夠進(jìn)行多步預(yù)測(cè).為了表述的方便,令t=ln(ht),t=ln(xt).將方差方程代入到測(cè)量方程中,可以得到如下等式
即Pt=APt-1+Ct,對(duì)應(yīng)已實(shí)現(xiàn)GARCH模型的類(lèi)似結(jié)構(gòu)可以參見(jiàn)Hansen等[6].Pt的k步的預(yù)測(cè)為
條件方差ht的一步預(yù)測(cè)直接使用式(6)就可以獲得,多步預(yù)測(cè)相對(duì)復(fù)雜.由于模型使用的是對(duì)數(shù)線性模型設(shè)定,式(15)可以給出的是對(duì)數(shù)條件方差的預(yù)測(cè)值E[ln(ht+k)],簡(jiǎn)單取指數(shù)之后并不等于條件方差的期望E[ht+k].因此在進(jìn)行多步測(cè)時(shí),不能借助式(15)直接求取期望,而是需要前計(jì)算式(15)指數(shù)值再計(jì)算結(jié)果的期望值,而這需要用到zt和ut的分布信息.考慮到直接根據(jù)(zt,ut)的分布來(lái)推導(dǎo)ht的計(jì)算復(fù)雜性較高.
圖2 已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH和已實(shí)現(xiàn)GARCH對(duì)于SPY日波動(dòng)率的ACF擬合Fig.2 The fitted ACF of SPY’s daily volatility for realized MIDAS GARCH and realized GARCH
圖3 已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH和已實(shí)現(xiàn)GARCH對(duì)于SPY已實(shí)現(xiàn)測(cè)度的ACF擬合Fig.3 The fitted ACF of SPY’s realized volatility for realized MIDAS GARCH and realized GARCH
本文采用更加簡(jiǎn)便的蒙特卡洛模擬方法來(lái)獲得預(yù)測(cè)值.關(guān)于隨機(jī)數(shù)的生成方式,本文沿襲Lunde等[9],采取bootstrap的方法從樣本內(nèi)估計(jì)出殘差中抽樣,進(jìn)而模擬出ht+k的分布.這樣的做法較直接從正態(tài)分布里面抽樣更貼近實(shí)際數(shù)據(jù).
樣本外預(yù)測(cè)采用滾動(dòng)窗口方式進(jìn)行,以最后的500個(gè)交易日為樣本外數(shù)據(jù),最大樣本外預(yù)測(cè)步長(zhǎng)為20步,考慮到數(shù)據(jù)集的總長(zhǎng)度,估計(jì)窗口設(shè)定為2 400個(gè)交易日.對(duì)于每個(gè)交易日而言,本文模擬M=5 000條未來(lái)20日的收益率/已實(shí)現(xiàn)測(cè)度序列,使用的Ct+j+1(記為t+j+1)從估計(jì)窗口中的2 400組殘差中有放回抽樣計(jì)算得到.對(duì)于給定的時(shí)刻t的k步樣本外預(yù)測(cè),直接使用平均值來(lái)模擬期望值,即
其中22維向量eT=(1,0,...,0).
需要指出的是,這里的多步預(yù)測(cè)是指未來(lái)“第k天”的波動(dòng)率水平,而不是未來(lái)“k天累計(jì)”的波動(dòng)率水平8“k天累計(jì)”存在高估低估相互抵消的狀況,并不如直接考察“第k天”更準(zhǔn)確..
關(guān)于波動(dòng)率代理變量的選擇,傳統(tǒng)文獻(xiàn)中通常選用的是收益率平方.但這種代理變量本身噪音很大,Andersen等[27]建議使用已實(shí)現(xiàn)測(cè)度作為真實(shí)波動(dòng)率的代理變量9由于比較的兩個(gè)模型都使用了該已實(shí)現(xiàn)測(cè)度,因此這樣的選擇并不偏向于某一個(gè)模型.使用5 min RV并不改變結(jié)果..本文為簡(jiǎn)便起見(jiàn),選擇已實(shí)現(xiàn)核估計(jì)作為代理變量.由于本文使用的收益率數(shù)據(jù)為基于“收盤(pán)價(jià)-收盤(pán)價(jià)”收益率,而已實(shí)現(xiàn)核估計(jì)覆蓋的是“開(kāi)盤(pán)價(jià)—收盤(pán)價(jià)”收益率,故需要對(duì)其進(jìn)行比例變換,將其均值調(diào)節(jié)到和“收盤(pán)價(jià)-收盤(pán)價(jià)”收益率的方差一致10關(guān)于類(lèi)似調(diào)節(jié)的更多信息,可以參見(jiàn)文獻(xiàn)[28]..
遵循Patton[29]的建議,使用穩(wěn)健損失函數(shù)(robust loss function)的進(jìn)行評(píng)價(jià),這種損失函數(shù)結(jié)合已實(shí)現(xiàn)測(cè)度,可以給出預(yù)測(cè)能力的一致排序.在穩(wěn)健損失函數(shù)族中,選取均方根誤差11文獻(xiàn)[29]指出的是穩(wěn)健損失函數(shù)是MSE,由于RMSE更常用且是MSE的保序變換,本文匯報(bào)結(jié)果時(shí)使用的RMSE,計(jì)算統(tǒng)計(jì)顯著性時(shí)基于MSE.常見(jiàn)的平均絕對(duì)誤差(MAE)指標(biāo)并不是穩(wěn)健損失函數(shù).因篇幅所限,本文僅選取了代表性的對(duì)稱(chēng)和非對(duì)稱(chēng)損失函數(shù)作為標(biāo)準(zhǔn).(RMSE)和準(zhǔn)似然函數(shù)(QLIKE)兩個(gè)損失函數(shù)作為評(píng)價(jià)指標(biāo).其中RMSE是對(duì)稱(chēng)損失函數(shù),QLIKE是非對(duì)稱(chēng)損失函數(shù),前者對(duì)波動(dòng)率高估和低估懲罰力度相同,后者對(duì)波動(dòng)率低估有著更大的懲罰力度.本文使用Diebold-Mariano(DM)統(tǒng)計(jì)量來(lái)刻畫(huà)不同模型損失函數(shù)差別的顯著性.
表4和表5分別給出了模型在以RMSE和QLIKE為評(píng)價(jià)指標(biāo)下的多步預(yù)測(cè)的結(jié)果.其中包括波動(dòng)率多步預(yù)測(cè)的損失函數(shù)值,差距值以及DM統(tǒng)計(jì)量數(shù)值和顯著性.
表4 以RMSE為損失函數(shù)的多步預(yù)測(cè)結(jié)果Table 4 Loss of multi-steps forecasts based on RMSE
表5 以QLIKE為損失函數(shù)的多步預(yù)測(cè)結(jié)果Table 5 Loss of multi-steps forecasts based on QLIKE
為了直觀的定義RG模型以及RMG模型在波動(dòng)率預(yù)測(cè)上的差距,給定損失函數(shù)的值,定義差距為
可以看出,RMG模型除了對(duì)MSFT在QLIKE指標(biāo)下一步預(yù)測(cè)損失函數(shù)較RG高0.2%以外(該差距對(duì)應(yīng)的DM統(tǒng)計(jì)量?jī)H為0.088,并不顯著),對(duì)于其余所有預(yù)測(cè)期,所有序列的兩種損失函數(shù)下,RG的損失函數(shù)都比RMG大.并且這種差距隨著預(yù)測(cè)期的拉長(zhǎng)而進(jìn)一步加大.DM檢驗(yàn)的結(jié)果顯示,在絕大多數(shù)情況下,兩個(gè)模型波動(dòng)率預(yù)測(cè)能力的差距至少在5%水平上是顯著的.
多步預(yù)測(cè)的差異的一個(gè)重要原因是RMG模型的長(zhǎng)期波動(dòng)信息加權(quán)的系數(shù)經(jīng)過(guò)歷史數(shù)據(jù)的訓(xùn)練,能夠更好的捕捉波動(dòng)率序列的相關(guān)性.加入長(zhǎng)期波動(dòng)信息還有另外的一個(gè)好處:由于本質(zhì)上是已實(shí)現(xiàn)測(cè)度的加權(quán)平均,其變動(dòng)較原始波動(dòng)率更為平緩,在波動(dòng)率劇烈變化的時(shí)候可以提供更穩(wěn)定的信息,防止條件方差的預(yù)測(cè)對(duì)短期異常波動(dòng)反應(yīng)過(guò)度.
本文在Hansen等[6]提出的已實(shí)現(xiàn)GARCH模型的基礎(chǔ)上,提出了在波動(dòng)率長(zhǎng)記憶性建模和多步預(yù)測(cè)上更具有優(yōu)勢(shì)的已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型,模型在僅增加兩個(gè)系數(shù)的情況下可以容納更豐富的自相關(guān)結(jié)構(gòu).基于指數(shù)和個(gè)股的實(shí)證結(jié)果表明,相比于已實(shí)現(xiàn)GARCH模型,已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型對(duì)數(shù)據(jù)的擬合能力更強(qiáng),模型的內(nèi)部一致性更好,能夠更好的描述實(shí)際數(shù)據(jù)中波動(dòng)率相關(guān)性緩慢下降的現(xiàn)象.在常用的穩(wěn)健損失函數(shù)下,已實(shí)現(xiàn)混頻數(shù)據(jù)抽樣GARCH模型的樣本外多步預(yù)測(cè)能力優(yōu)于已實(shí)現(xiàn)GARCH模型,并且這種優(yōu)勢(shì)在統(tǒng)計(jì)上顯著,改進(jìn)幅度隨著預(yù)測(cè)天數(shù)的增加而增大.