鄧亞東,王波
摘 要:商品期貨收益率序列存在明顯的厚尾現(xiàn)象,將擾動項設(shè)定為厚尾分布的波動率模型要優(yōu)于普通Gaussian分布以及t分布模型。以7種損失函數(shù)作為評價準則,在擾動項分別服從偏t分布以及廣義雙曲線偏t分布時比較了波動率RV、二次冪變差BV以及medRV3種不同已實現(xiàn)測度下Realized GARCH模型對商品期貨的波動性預測能力。最后得到擾動項服從ghst分布的Realized GARCH模型具有更優(yōu)的預測能力。
關(guān)鍵詞:Realized GARCH模型;medRV已實現(xiàn)測度;廣義雙曲線偏t分布;波動率預測
中圖分類號:F 830 文獻標識碼:A 文章編號:1672-7312(2018)04-0415-06Empirical Study on the Fluctuation of Commodity
Futures with High Frequency Data
——Based on Different Realized Measures and Error DistributionsDENG Yadong,WANG Bo
(School of Management,University of Shanghai for Science and Technology,Shanghai 200093,China)
Abstract:There is obvious fat tail phenomenon in the yield series of commodity futures,and the volatility model with the fat tailed distribution is better than the ordinary Gaussian distribution and the T distribution model.This paper,using seven kinds of loss function as the evaluation criterion,compared the predictive ability of three realized measures of realized variance,bipower variation and medRV based on skewed T distribution and ghst distribution.Finally,under the three different realized measures,the Realized GARCH model with disturbance subject to the ghst distribution has better prediction ability than skewed T distribution.
Key words:Realized GARCH model;medRV realized measure;generalized hyperbolic skewed t distribution;fluctuation prediction
0 引 言
商品期貨市場上的T+0交易制度決定了商品期貨市場適合使用高頻數(shù)據(jù)進行波動性建模。隨著程序化交易以及高頻交易的發(fā)展,基于高頻數(shù)據(jù)的商品期貨計量模型的研究已經(jīng)成為備受關(guān)注的研究方向之一。
Hansen和Huang基于GARCH模型族提出了Realized GARCH模型對國際不同市場的指數(shù)以及各股的高頻數(shù)據(jù)進行波動性建模[1]。Realized GARCH模型既保留了GARCH模型具有的自回歸移動平均ARMA結(jié)構(gòu),而且通過一個測度方程實現(xiàn)了潛在波動率和已實現(xiàn)波動率之間的聯(lián)系。目前為止,國內(nèi)外學者針對Realized GARCH模型進行了豐富的后續(xù)研究。國外方面,Tian和Hamori使用Realized GARCH模型構(gòu)建匯率日波動模型并與其他模型比較,得出Realized GARCH模型在預測匯率上更加準確[2]。Louzis等人[3]在Realized GARCH模型誤差項服從偏t分布的前提下,驗證了該模型在預測VaR上具有更好的效果。TakeuchiNogimor[4]基于已實現(xiàn)核測度的Realized GARCH模型,證明了該模型可實際應(yīng)用于指數(shù)期權(quán)的定價。國內(nèi)方面,黃友珀和唐振鵬等人[5]將高頻信息納入Realized GARCH模型并與tcopula函數(shù)結(jié)合起來度量資產(chǎn)組合市場風險,認為該模型能夠獲得更可靠更高效的VaR估計以及更準確的ES估計。劉若萌和郭名媛[6]基于3種不同的誤差分布,證明了厚尾分布下的Realized GARCH模型能夠更加準確地描述股票波動性。
Realized GARCH模型依然處于發(fā)展和完善之中。Hansen和Huang 2位學者的研究只考慮了干擾項新息服從Gaussian分布,并且只分析了單一的已實現(xiàn)核測度RK.魏正元等人[7]將經(jīng)典的已實現(xiàn)GARCH模型的殘差分布拓展到服從廣義誤差分布的形式。田鳳平和楊科[8]基于TVSHAR模型對農(nóng)產(chǎn)品期貨市場已實現(xiàn)波動率進行了研究。Brandt和Jones[9],Engle和Gallo[10]的研究表明將每日極差、已實現(xiàn)波動率的滯后值等變量同時引入預測模型能進一步提高波動率的樣本外預測精度。Ghysels等[11]和Ghysels等[12]的研究表明,除已實現(xiàn)波動率自身的滯后值外,BarndorffNielsen和Shephard[13]的1階已實現(xiàn)多冪次變差也是已實現(xiàn)波動率的預測因子。
由于實際金融時間序列存在厚尾性和偏度,王天一和黃卓[14]研究了厚尾分布下的Realized GARCH模型對s&p500指數(shù)以及相關(guān)各股的預測效果,得到基于厚尾分布的Realized GARCH模型的向前一步預測能力優(yōu)于標準Realized GARCH模型,但僅僅考慮了一種厚尾分布,并且也只分析了單一的已實現(xiàn)核測度RK.
研究發(fā)現(xiàn)期貨日內(nèi)高頻收益率序列不僅僅存在厚尾性和偏度,還存在跳躍現(xiàn)象。跳躍現(xiàn)象的出現(xiàn)有可能會引起相應(yīng)的市場風險。Corsi等[15]的研究表明由C-Tz統(tǒng)計量檢驗得到的跳躍成分同樣對已實現(xiàn)波動率具有一定的預測能力。BarndorffNielsen和Shephard[16]介紹了一種考慮了跳躍現(xiàn)象的積分波動率估計量,即二次冪變差BV估計量。
Andersen和Dobrev[17]認為二次冪變差BV存在缺陷,因此提出了新的對跳躍穩(wěn)健的medRV估計量作為二次冪變差BV估計量的替代,獲得了更好的估計效果。
因此,文中從以下角度來展開論述:①使用并對比了經(jīng)過逆尺度因子變換后的偏t分布和廣義雙曲線偏t分布,上述2種分布都可以同時容納厚尾性和偏度,對比了干擾項服從上述2種分布時Realized GARCH模型的預測效果;②考慮了商品期貨收益率序列存在跳躍現(xiàn)象。除了使用已實現(xiàn)波動率RV作為潛在波動率的替代變量以外,文中分析比較了把二次冪變差BV和medRV作為潛在波動率的替代變量時Realized GARCH模型的預測效果;③為了全面地分析Realized GARCH模型對中國商品期波動性的預測能力,文中分別從中國3大商品期貨交易所上市期貨中選取了交易活躍的3種商品期貨合約。
1 研究方法
1.1 波動模型構(gòu)建
自從Hansen和Huang提出Realized GARCH模型,該模型就被廣泛地應(yīng)用,文中采用改進的Realized GARCH模型,對波動率模型取對數(shù),即對數(shù)Realized GARCH模型
yt=μt+σtzt,zt~i.i.d(0,1)
(1)
logσ2t=ω+qi=1αilogrt-i+qi=1βilogσ2t-i
(2)
logrt=ξ+δlogσ2t+τ(zt)+μt,μt~N(0,λ)
(3)
我們把yt定義為日收益率,把σ2t定義為對數(shù)收益率,把rt定義為已實現(xiàn)測度,同時也可作為實際波動的代理變量。對市場沖擊的非對稱反映通過τ(·)杠桿函數(shù)來體現(xiàn),該杠桿函數(shù)是Hermite多項式,并且文中使用的是二次多項式的形式
τ(zt)=ηtzt+η2(z2t-1)
(4)
該Hermite二次多項式的一個優(yōu)良的特性是Eτ(zt)=0.同時該多項式也能夠給出信息沖擊v(z)的定義
v(z)=E(logσt|zt-1=z)-E(logσt)=δt(z)
(5)
因此,100×v(z)為標準化新息函數(shù),體現(xiàn)波動率的變化。Realized GARCH模型的一大特點是保留了標準GARCH模型具有的自回歸移動平均ARMA結(jié)構(gòu)。
1.2 干擾項分布函數(shù)
Hansen和Huang提出的Realized GARCH模型假定干擾項zt服從標準正態(tài)分布zt~N(0,1),但是實際金融時間序列擾動項存在厚尾性和偏度,zt服從標準正態(tài)分布假設(shè)不能合理地貼近實際,因此,文中從干擾項分布函數(shù)角度出發(fā),考慮了能夠容納厚尾性與偏度的偏t分布與ghst分布,并綜合分析了在干擾項分別服從偏t分布與ghst分布2個不同分布的情況下Realized GARCH模型的預測效果。
1.2.1 偏t分布
實際金融序列新息存在厚尾性與偏度,為了應(yīng)對新息的這種特性,Bollerslev[18](1987)首次提出GARCHStudent模型來替代新息服從標準正態(tài)分布的假設(shè)。學生t分布的概率密度函數(shù)如下式所示。
f(x)=Γ(v+12)βvπΓv21+(x-α)2βv-(v+12)
(6)
其中v為自由度參數(shù);Γ(·)為gamma函數(shù)。學生t分布的概率密度函數(shù)具有對稱性,形狀類似于標準正態(tài)分布的鐘行,且均值為0,方差為1,與標準正態(tài)分布不同的地方是:學生t分布的峰度小尾部厚。
1.2.2 逆尺度因子變換
實際金融時間序列干擾項新息不僅僅存在厚尾性,而且具有偏度,但學生t分布和廣義誤差分布只能夠包容厚尾性,這是不夠的,還不能完全體現(xiàn)出實際新息的分布特征。Fernandez與Steel(1998)提出通過在正負實半軸引入逆尺度因子,使得原本單峰對稱的分布具有了偏度[19]。通過給定一個偏度系數(shù)ξ,一個隨機變量的概率密度函數(shù)可以表示為
f(z|ξ)=2ξ+ξ-1[f(ξz)H(-z)+f(ξ-1z)H(z)]
(7)
其中ξ∈R,并且H(·)是Heaviside函數(shù)。絕對矩是獲得中心距的前提條件,絕對矩可以通過以下公式產(chǎn)生
Mr=2∫∞0zrf(z)dz
(8)
因此,經(jīng)過變換后的有偏分布下的均值和方差可表示為
E(z)=M1(ξ-ξ-1)
(9)
Var(z)=(M2-M21)(ξ2+ξ-2)+2M21-M2
(10)
通過對學生t分布進行逆尺度因子變換,文中將上述不具有偏度的分布變換成為了具有偏度的偏t分布,從而使得新息分布更加符合實際,文中實證部分分別讓干擾項分布服從經(jīng)過逆尺度因子變換后的偏t分布以及ghst分布。
1.2.3 廣義雙曲線偏t分布ghst
廣義雙曲線偏t分布ghst由Aas和Haff(2006)普及,ghst分布一邊尾部具有多項式分布特性,而另一邊尾部具有指數(shù)分布特性,廣義雙曲線偏t分布的數(shù)學形式?jīng)Q定了其可以同時容納新息變量的厚尾性和偏度,ghst分布概率密度函數(shù)如下。
f(x)=
2(1+v)/2δv|β|(1+v)/2K(v+1)/2(β2(δ2+(x-μ)2))exp(β(x-μ))Γ(v2)π(σ2+(x-μ)2)(1+v)/2
(11)
ghst分布是當α→|β|且λ=-v/2時廣義雙曲線分布的特殊形式。其中,v為形狀參數(shù)且v>0,為了保證波動為正 v>4,β∈R,同時為了能夠容納偏度和峰度v>8.
1.3 已實現(xiàn)測度
Hansen等人提出的Realized GARCH模型的獨特之處在于通過一個測量方程把可觀察到的已實現(xiàn)測度與潛在波動聯(lián)系起來,Hansen以及后來的學者很多都沿用了已實現(xiàn)波動率(Realized Variance,RV)來對國內(nèi)的股票市場以及股指期貨進行了分析研究,但已實現(xiàn)波動RV的缺點在于沒有把價格跳變以及市場微觀結(jié)構(gòu)噪聲考慮在內(nèi)[20-21]??紤]到金融市場時間序列有可能存在收益率跳躍,并且受到微觀結(jié)構(gòu)噪聲的影響,所以文中在選擇已實現(xiàn)測度上不僅僅考慮了被普遍使用的RV,而且還進一步重點構(gòu)建并對比了二次冪變差(Bipower Variation,BV)與medRV.2種已實現(xiàn)測度的使用主要是為了應(yīng)對收益率序列的跳變情況。
1.3.1 已實現(xiàn)波動率
已實現(xiàn)波動率定義為
RV=Ni=1|ΔYi|2,i=1,…,M
(12)
其中ΔYi為日內(nèi)第i個收益率;M為日內(nèi)收益率的個數(shù)。
1.3.2 二次冪變差
由于RV受到日價格跳變干擾嚴重,所以很多學者轉(zhuǎn)向其他已實現(xiàn)測度,到目前為止,存在資產(chǎn)收益率跳躍的情況下使用最廣泛的積分波動率的估計量為BarndorfNielsen和Shephard提出的二次冪變差波動BV,二次冪變差的定義為
BV=π2NN-1N-1i=1|ΔYi||ΔYi+1|
(13)
二次冪變差估計量的一致性和對跳躍穩(wěn)健性體現(xiàn)在:如果ΔYi,ΔYi+1~i.i.d.N(0,σ2),那么E[|ΔYi||ΔYi+1|]=π2σ2,并且NN-1是一個有限樣本修正因子,因此二次冪變差波動率估計值獲得的是潛在波動率的一個無偏估計量,二次冪變差通過對相鄰2個收益率做乘法,減少了跳躍的影響。
1.3.3 medRV測度
Andersen,Dobrev(2008)等提出了新的對資產(chǎn)收益率序列穩(wěn)定的已實現(xiàn)測度medRV,medRV定義為
medRV=π6-43+πNN-2N-1i=2med(|ΔYi-1|,|ΔYi|.|ΔYi+1|)2
(14)
medRV測度也是積分波動率的一致估計量,通過對相鄰3個資產(chǎn)收益率取中值的操作,可以消除資產(chǎn)收益率發(fā)生跳躍的影響。
1.4 模型預測準確性標準
目前有多種可以對模型預測能力做出評價的方法,文中采用其中一種使用非常普遍的損失函數(shù)的方法來檢驗不同波動模型的預測能力。根據(jù)損失函數(shù)的定義可以知道損失函數(shù)的值越小,所構(gòu)建模型的預測能力越強,誤差就越小,構(gòu)建模型的預測精確程度越高。單獨使用某一種損失函數(shù)來衡量會有失偏頗。因此,文中計算了上述所有Realized GARCH模型的7種損失函數(shù)值來給出他們的預測能力大小。
2 實證研究
2.1 研究數(shù)據(jù)及步驟
為了全面地分析基于已實現(xiàn)波動率RV,二次冪變差BV以及medRV 3種不同測度下Realized GARCH模型對商品期貨的波動性擬合能力,文中根據(jù)2011年至2014年的商品期貨成交量信息,分別選取了上海期貨交易所、鄭州商品期貨交易所、大連商品期貨交易所平均成交量較高的3個商品期貨品種,分別是:螺紋鋼期貨、PTA期貨、豆油期貨。螺紋鋼期貨和豆油期貨的總樣本數(shù)據(jù)選取的是2011.01.05至2014.12.25期間的5 min收益率數(shù)據(jù),其中,把2011.01.05至2014.01.02期間的收益率數(shù)據(jù)作為樣本內(nèi)訓練數(shù)據(jù)集,把2014.01.03至2014.12.25期間的收益率數(shù)據(jù)作為樣本外滾動預測數(shù)據(jù)集,以725期數(shù)據(jù)為窗口進行滾動預測后240期的波動率。PTA期貨的總樣本數(shù)據(jù)選取的是2011.01.05至2014.12.11期間的5 min收益率數(shù)據(jù),其中,把2011.01.05至2014.01.02期間的收益率數(shù)據(jù)作為樣本內(nèi)訓練數(shù)據(jù)集,把2014.01.03至2014.12.11期間的收益率數(shù)據(jù)作為樣本外滾動預測數(shù)據(jù)集,以725期數(shù)據(jù)為窗口進行滾動預測后230期的波動率。
研究表明選取5 min商品期貨交易數(shù)據(jù)可以減少高頻數(shù)據(jù)微觀結(jié)構(gòu)噪聲的影響,因此文中在此基礎(chǔ)上使用了上述3種商品期貨的5 min高頻交易數(shù)據(jù),并且以此來構(gòu)建高頻波動模型。由于收益率以及3種已實現(xiàn)測度的數(shù)量級非常小,因此,在文中統(tǒng)一都放大了100倍。
2.2 實證結(jié)果分析
如圖1所示,為新息服從廣義雙曲線偏t分布時,3種已實現(xiàn)測度下螺紋鋼期貨預測波動率。如圖2所示,為新息服從廣義雙曲線偏t分布時,3種已實現(xiàn)測度下PTA期貨預測波動率。如圖3所示,為新息服從廣義雙曲線偏t分布時,3種已實現(xiàn)測度下豆油期貨預測波動率。通過上述圖可以說明,在新息服從廣義雙曲線偏t分布時,波動率的預測效
果比較好,預測波動率與潛在波動率的波動曲線趨勢非常的接近。
進一步對比了不同測度方式下的損失函數(shù)值。表1中描述了螺紋鋼期貨不同已實現(xiàn)測度下的損失函數(shù)值,分析可知,服從ghst分布下的損失函數(shù)值都比sstd分布下的損失函數(shù)值小。表2中描述了PTA期貨不同已實現(xiàn)測度下的損失函數(shù)值,其中的ghst分布下的損失函數(shù)值更優(yōu)。表3中描述了豆油期貨不同已實現(xiàn)測度下的損失函數(shù)值,說明了ghst分布下的損失函數(shù)值也小于sstd分布下的損失函數(shù)值。這同時說明了ghst分布下的損失函數(shù)值更小,擬合預測效果更優(yōu)。
3 結(jié) 論
文中使用的偏t分布與Hansen提出的Skewedt分布不同,這里使用的偏t分布是對學生t分布進行了逆尺度因子變換而來,使得學生t分布同時具備了厚尾性和偏度。還考慮了商品期貨收益率序列存在大幅非連續(xù)變動,即跳躍,因此文中除了使用已實現(xiàn)波動率RV和二次冪變差BV外,還使用了對價格跳躍穩(wěn)健的已實現(xiàn)測度medRV.
通過實證分析證明了一種可以與偏t分布相媲美的廣義雙曲線偏t分布,與偏t分布的特性類似,該分布不僅具有良好的厚尾特性,而且可以非常好地容納商品期貨收益率序列偏斜特征,文中的這一分析結(jié)果對構(gòu)建以及完善我國商品期貨基于高頻數(shù)據(jù)的波動率模型提供了有意義的參考。
因此,在使用基于高頻數(shù)據(jù)的Realized GARCH模型構(gòu)建并分析中國商品期貨收益率波動時,文中建議使用干擾項服從廣義雙曲線偏t分布,可以獲得比其他厚尾分布更好的預測效果,并且可以從多個角度對文中闡述的模型展開進一步研究。
參考文獻:
[1] Hansen P R,Huang Z,Shek H H.Realized GARCH:a joint model for returns and realized measures of volatility[J].Journal of Applied Econometrics,2012,27(06):877906.
[2]Tian S,Hamori S.Modeling interest rate volatility:a realized GARCH approach[J].Journal of Banking and Finance,2015,61:158171.
[3]Louzis D P,XanthopoulosSisinis S,Refenes A P.Realized volatility models and alternative value at risk prediction strategies[J].Economic Modelling,2014,40:101116.
[4]Takeuchinogimori A.An empirical analysis of the Nikkei 225 put options using realized GARCH models[J].Studies in Health Technology and Informatics,2012,180(01):143147.
[5]黃友珀,唐振鵬,周熙雯.基于偏t分布realized GARCH模型的尾部風險估計[J].系統(tǒng)工程理論與實踐,2015,35(09):22002208.
[6]劉若萌,郭名媛.基于厚尾分布下Realized GARCH模型的中國股票市場波動研究[J].天津理工大學學報,2017,33(05):4650.
[7]魏正元,余徳英,李素平.已實現(xiàn)GARCHGED模型的研究及應(yīng)用[J].重慶理工大學學報,2018(3):273278.
[8]田鳳平,楊 科.基于TVSHAR模型的農(nóng)產(chǎn)品期貨市場已實現(xiàn)波動率的預測研究[J].系統(tǒng)工程理論與實踐,2016,36(12):30033016.
[9]Brandt M W, Jones C S, Volatility forecasting with rangebased EGARCH models[J].Journal of Business and Economic Statistics,2006,24(4):470486.
[10]Engle R F,Gallo G M.A multiple indicators model for volatility using intra-daily data[J].Journal of Econometrics,2006,131(1):327.
[11]Ghysels E,SantaClara P,Valkanov R.Predicting volatility:Getting the most out of return data sampled at different frequencies[J].Econometric Reviews, 2007, 26(1):5390.
[12]Ghysels E,Sinko A,Valkanov R.MIDAS regressions:Further results and new directions[J].Journal of Econometrics,2006,131(1):5995.
[13]BarndorffNielsen O E,Shephard N.Power and bipower variation with stochastic volatility and jumps[J].Journal of Financial Econometrics,2004, 2(1):137.
[14]王天一,黃卓.高頻數(shù)據(jù)波動率建模:基于厚尾分布的Realized GARCH模型[J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2012(05):149160.
[15]Corsi F,Pirino D,Reno R.Threshold bipower variation and the impact of jumps on volatility forecasting[J].Journal of Econometrics,2010,159(2):276288.
[16]Barndorffnielsen O E,Shephard N,Power and bipower variation with stochastic volatility and jumps[J].Econometric Papers,2003,2(2003W17):137.
[17]Andersen T G,Dobrev D,Schaumburg E.Jumprobust volatility estimation using nearest neighbor truncation[J].Journal of Econometrics,2012,169(01):7593.
[18]Bollerslev T P.A conditional heteroskedastic time series model for speculative price and rates of return[J].Review of Economics and Statistics,1987,69(03):542547.
[19]Fernandez C,Steel M F J.On Bayesian modeling of fat tails and skewness[J].Journal of the American Statistical Association,1998,93(441):359371.
[20]Aas K,Haff I H.The generalized hyperbolic skew students tdistribution[J].Social Science Electronic Publishing,2006,4(02):275309.
[21]Hansen B E.Autoregressive conditional density estimation[J].International Economic Review,1994,35(03):705730.
(責任編輯:王 強)
收稿日期:2017-10-23
作者簡介:鄧亞東(1991-),男,江西撫州人,碩士研究生,主要從事金融定量分析、機器學習方向研究.