王蘇生, 李光路, 王俊博
(哈爾濱工業(yè)大學(xué)(深圳) 經(jīng)濟(jì)與管理院,廣東 深圳 518055)
波動(dòng)率是金融資產(chǎn)的核心指標(biāo),是金融衍生品定價(jià)的基礎(chǔ),因此,金融資產(chǎn)尤其是金融衍生品的波動(dòng)率研究一直是學(xué)術(shù)界研究的重點(diǎn)。研究波動(dòng)率的模型有很多,最常用的模型主要有已實(shí)現(xiàn)波動(dòng)率模型和條件異方差模型兩大類,這兩類模型根據(jù)不同的數(shù)據(jù)樣本特征發(fā)展出各種不同的波動(dòng)率研究模型,用來刻畫金融資產(chǎn)波動(dòng)率的特征。GARCH類模型因?yàn)槟軌蚝芎玫乜坍嫴▌?dòng)率的聚集效應(yīng)、不對(duì)稱性、長記憶性等特征,得到了極大地發(fā)展,被認(rèn)為是最為成熟的波動(dòng)率研究模型之一。不同的GARCH類模型根據(jù)其模型的特點(diǎn)都可以從不同的角度來夠刻畫金融資產(chǎn)波動(dòng)率的動(dòng)態(tài)變化過程,但如何制定一個(gè)準(zhǔn)確的波動(dòng)率評(píng)價(jià)標(biāo)準(zhǔn),選擇合適的波動(dòng)率研究模型,成為了眾多研究者探討的主要問題。
前期研究,我們利用GARCH模型(王蘇生等[6])、ARMA模型(王蘇生等[14])、eGARCH模型(WANG等[15]),RealGARCH模型擬合了滬深300股指期貨日內(nèi)波動(dòng)過程,取得的效果較好。在GARCH類模型被用來進(jìn)行日內(nèi)波動(dòng)預(yù)測時(shí),選擇哪個(gè)模型最合適?這是接下來我們要重點(diǎn)解決的難題。綜合以上分析,文章在前期研究的基礎(chǔ)上擬采用不同的損失函數(shù)評(píng)估GARCH模型、eGARCH模型以及RealGARCH模型對(duì)滬深300股指期貨日內(nèi)多種抽樣頻率的波動(dòng)率的預(yù)測精度,以期能夠在抽樣頻率固定的前提下,找到滬深300股指期貨最優(yōu)的波動(dòng)率預(yù)測模型,基于三種模型均屬于GARCH類模型,我們認(rèn)為具有較強(qiáng)的可比性。文章后面的結(jié)構(gòu)安排如下:第二部分重點(diǎn)介紹波動(dòng)率預(yù)測的評(píng)估框架、各種不同的損失函數(shù)結(jié)構(gòu)以及三種GARCH模型;第三部分使用三種不同的GARCH模型對(duì)滬深300股指期貨日內(nèi)不同頻率的波動(dòng)率做實(shí)證估計(jì)并預(yù)測,并對(duì)實(shí)證結(jié)果做細(xì)致分析;第四部分則利用不同的損失函數(shù)對(duì)三種模型的評(píng)價(jià)精度做評(píng)估,并分析產(chǎn)生這種結(jié)果的內(nèi)在邏輯;最后是結(jié)論。
(1)
(2)
(3)
這樣就得到一個(gè)預(yù)測評(píng)價(jià)的回歸方程,如公式(4)所示:
(4)
(5)
也可以把公式(5)寫成公式(6):
(6)
顯然,由于事前預(yù)測并不能解釋事后的預(yù)測誤差,因此在公式(6)里,如果系數(shù)b為負(fù),則預(yù)測值比實(shí)際值要大,因而需要減小預(yù)測值。
(7)
(8)
因?yàn)槭找媛实钠椒桨溯^大噪聲,因此,并不是真實(shí)波動(dòng)率的無偏估計(jì),而且因?yàn)橹皇褂靡粋€(gè)觀測值來估計(jì)每個(gè)周期的方差,即使波動(dòng)率的預(yù)測是準(zhǔn)確的,得到的相應(yīng)擬合回歸程度必然也很低??梢?準(zhǔn)確評(píng)估一個(gè)不可預(yù)測變量的難度非常大。幸好在很多金融應(yīng)用中,觀測樣本的頻率一般都非常高。即使只是預(yù)測日波動(dòng)率或者更長周期的波動(dòng)率,其觀測樣本常常是基于日內(nèi)高頻數(shù)據(jù)來展開研究的。長周期的波動(dòng)率可以使用短周期收益率的平方來估計(jì),如公式(9)所示:
(9)
因此,預(yù)測精度的估計(jì)方程可以如公式(10):
(10)
所以,應(yīng)用已實(shí)現(xiàn)波動(dòng)率也可以作為波動(dòng)率模型預(yù)測精度的檢驗(yàn)標(biāo)準(zhǔn)。
在波動(dòng)率預(yù)測中,除了M-Z回歸函數(shù)之外,HYNDMAN和KOEHLER[18]提出了一些最常用的預(yù)測評(píng)估指標(biāo)如:平均誤差(ME)、平均百分比誤差(MPE)、均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)以及平均絕對(duì)百分比誤差(MAPE)等。
平均誤差(ME)是指單項(xiàng)測定值與平均值的偏差之和,除以測定次數(shù)。用于衡量總體偏離程度,如式(11)所示:
(11)
平均百分比誤差(MPE)是計(jì)算觀測值與真實(shí)值之間平均誤差的百分比。如公式(12):
(12)
均方根誤差(RMSE)是均方誤差的平方根,表示預(yù)測值與真實(shí)值的平均偏離程度。該值越小越好,其廣泛應(yīng)用于預(yù)測評(píng)估指標(biāo),如公式(13)所示:
(13)
平均絕對(duì)誤差(MAE)是對(duì)平均誤差取絕對(duì)值,避開了正負(fù)誤差不能相加的問題。對(duì)于所有預(yù)測值與真實(shí)值之間的誤差,取絕對(duì)值求平均后對(duì)預(yù)測效果的評(píng)估更具有代表性,如公式(14)所示:
(14)
平均絕對(duì)百分比誤差(MAPE)是平均誤差的絕對(duì)值之和的平均值,與單純的相對(duì)誤差相比,它避開了正負(fù)相對(duì)誤差不能相加的問題,同時(shí)通過求平均值,反映了預(yù)測相對(duì)誤差的平均水平,因而經(jīng)常用于預(yù)測評(píng)估指標(biāo),如公式(15)所示:
(15)
使用單一損失函數(shù)作為波動(dòng)率模型預(yù)測精度評(píng)價(jià)的唯一標(biāo)準(zhǔn),會(huì)存在衡量標(biāo)準(zhǔn)過于片面的問題,難以獲得認(rèn)可[19],因此,合理的策略是使用更多的損失函數(shù)以多角度衡量波動(dòng)率模型的預(yù)測精度。
在確定了研究模型和損失函數(shù)之后,要比較不同GARCH模型的預(yù)測精度,我們還需要確定預(yù)測精度的參照標(biāo)準(zhǔn)并統(tǒng)一研究樣本的抽樣頻率,確保在同一條件下對(duì)比不同模型的預(yù)測精度。在前述內(nèi)容中提到,對(duì)波動(dòng)率預(yù)測精度進(jìn)行評(píng)價(jià),必須知道資產(chǎn)序列的真實(shí)波動(dòng)率,而一般情況下真實(shí)波動(dòng)率是不可能被直接觀測到的,因而,找到真實(shí)波動(dòng)率的替代量就非常重要,并且這個(gè)替代量還必須是真實(shí)波動(dòng)率的無偏估計(jì)?,F(xiàn)實(shí)中,在不存在市場摩擦的條件下,已實(shí)現(xiàn)波動(dòng)是真實(shí)波動(dòng)率的無偏估計(jì)量。在市場摩擦存在的條件下,已實(shí)現(xiàn)波動(dòng)率將不再是真實(shí)波動(dòng)率的無偏估計(jì)量。在前期的眾多文獻(xiàn)中,高頻出現(xiàn)的是用已實(shí)現(xiàn)波動(dòng)率來替代真實(shí)波動(dòng)率。本文結(jié)合前期研究成果,針對(duì)三個(gè)研究樣本,分別使用1s,2s和15s最優(yōu)擬合間隔合成的股指期貨一分鐘已實(shí)現(xiàn)波動(dòng)率作為研究樣本真實(shí)波動(dòng)率的無偏估計(jì)。由于在股指期貨日內(nèi)高頻交易中,一分鐘間隔的交易策略應(yīng)用最為廣泛,因此,我們選擇對(duì)三個(gè)GARCH模型的滬深300股指期貨日內(nèi)一分鐘波動(dòng)率做預(yù)測精度的評(píng)價(jià)就顯得非常有意義了。
考慮到滬深300股指期貨自2010年上市,2015年后被交易所制定了嚴(yán)格的限制交易措施,而選擇具有代表性的研究樣本對(duì)此項(xiàng)研究來說非常關(guān)鍵,既要兼顧市場平穩(wěn)運(yùn)行時(shí)間段,又要具有足夠的代表性,能夠反映股指期貨的波動(dòng)規(guī)律。鑒于此,我們決定在2012年1月到2013年5月股指期貨全部合約內(nèi)選擇研究樣本,這也是我們目前能獲得的抽樣頻率足夠高的樣本數(shù)據(jù)。前期研究中,我們選擇2012年5個(gè)連續(xù)交易日的高頻數(shù)據(jù)和2013年5個(gè)隨機(jī)抽取的高頻數(shù)據(jù)作為研究樣本。其中,5個(gè)連續(xù)的抽樣樣本采用滬深300股指期貨合約IF1207和IF1208于2012年7月2日至2012年7月6日共5個(gè)交易日的股指期貨交易數(shù)據(jù)作為研究樣本,該樣本選取每秒2筆的超高頻數(shù)據(jù)來刻畫股指期貨日內(nèi)模式的變化。針對(duì)同一時(shí)間不同合約同時(shí)進(jìn)行交易的情況,按照交易量最活躍的主力合約來構(gòu)造連續(xù)的期貨合約。之所以選擇七月份數(shù)據(jù)是把節(jié)假日效應(yīng)對(duì)日內(nèi)波動(dòng)率的影響降到最小。另外五個(gè)隨機(jī)抽取的樣本為2013年2月19日、3月5日,3月12日,4月1日,4月12日這五天的交易樣本。但十個(gè)研究樣本對(duì)于三個(gè)GARCH模型來說還是太多了。為了研究的便利性,我們只選擇2012年7月2日、7月3日和2013年2月19日三個(gè)研究樣本的日內(nèi)高頻數(shù)據(jù)作為研究樣本,分別表示為Sample1,Sample2和Sample5。
數(shù)據(jù)剔除成交量為零的記錄,并且已實(shí)現(xiàn)GARCH模型所需的樣本則根據(jù)1秒、2秒、5秒以及15秒間隔的樣本,根據(jù)已實(shí)現(xiàn)波動(dòng)率的模型合成1分鐘間隔的樣本收益率分別記為RV1,RV2,RV5和RV15,一分鐘間隔樣本收益率則記為r,按照前期研究的結(jié)論,選擇擬合最好的三個(gè)間隔作為已實(shí)現(xiàn)GARCH模型的研究對(duì)象,其樣本數(shù)據(jù)的穩(wěn)定性檢驗(yàn)結(jié)果如下:
全部研究樣本的ADF檢驗(yàn)中,P值都是顯著的,結(jié)果都是穩(wěn)定,如表1所示。檢驗(yàn)結(jié)果表明所選序列直接應(yīng)用GARCH模型進(jìn)行波動(dòng)率研究是可行的。
表1 樣本穩(wěn)定性ADF檢驗(yàn)結(jié)果
在檢驗(yàn)了研究樣本的平穩(wěn)性后,GARCH模型實(shí)證檢驗(yàn)還需要確定均值方程和方差方程的參數(shù),即定階。一般來說,GARCH模型均值方程的階數(shù)是通過自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)來確定的,而GARCH模型方差方程的階數(shù)一般選取GARCH(1,1)來研究時(shí)間序列的樣本。在前期的研究(王蘇生等[6])中,我們有詳細(xì)介紹GARCH模型均值方程詳細(xì)的定階過程,這里我們就不再贅述。依據(jù)ACF與PACF準(zhǔn)則,將GARCH模型三個(gè)樣本的均值方程的ARMA的階數(shù)分別確定為ARMA(0,1)、ARMA(0,1)以及ARMA(1,1)。
從三個(gè)GARCH模型的實(shí)證結(jié)果來看,相同研究樣本條件下,帶有杠桿效應(yīng)的GARCH模型的系數(shù)顯著性要明顯優(yōu)于標(biāo)準(zhǔn)的GARCH模型;RealGARCH模型的回歸系數(shù)要比eGARCH模型的系數(shù)顯著。在不同研究樣本的eGARCH模型的杠桿系數(shù)顯著不為零,這驗(yàn)證了股指期貨日內(nèi)波動(dòng)具有明顯的杠桿效應(yīng)。從回歸系數(shù)來看,除1s間隔合成的RealGARCH模型外,其他GARCH模型的alpha和beta系數(shù)之和均小于1,且alpha與beta之和非常接近1,表明GARCH類模型擬合穩(wěn)定收斂,一分鐘股指期貨的波動(dòng)受到?jīng)_擊具有非常強(qiáng)的持續(xù)性;beta系數(shù)接近于1,表明了股指期貨日內(nèi)高頻收益率波動(dòng)具有較強(qiáng)的長記憶性;1s間隔樣本的alpha與beta之和明顯小于1,不具有長記憶性和對(duì)信息的沖擊性,這可能是由于樣本抽樣頻率過高,造成較大的市場噪音,從而導(dǎo)致股指期貨日內(nèi)波動(dòng)出現(xiàn)較大的隨機(jī)性?;貧w模型常數(shù)項(xiàng)均不顯著,這與樣本均值為零的統(tǒng)計(jì)描述結(jié)果一致。另外,在全部三個(gè)研究樣本中,我們發(fā)現(xiàn)GARCH和eGARCH模型回歸系數(shù)的大小基本一致,而RealGARCH模型的回歸系數(shù)與前面兩者相比有明顯的不同,已實(shí)現(xiàn)GARCH模型實(shí)現(xiàn)了使用高抽樣頻率研究樣本,研究低抽樣頻率波動(dòng)率的先例,相比以往的GARCH研究模型,其模型往往包含了更多的市場波動(dòng)信息,可以看作是GARCH模型一次質(zhì)的飛躍,因此其模型的樣本與日歷收盤價(jià)樣本的實(shí)證結(jié)果有較大的出入,模型的回歸系數(shù)也出現(xiàn)較大的不同。
很多GARCH模型都能對(duì)波動(dòng)率的做出預(yù)測,但是預(yù)測結(jié)果好的是哪一種波動(dòng)率?衡量波動(dòng)率模型的預(yù)測精度,我們一般選擇損失函數(shù)。不失一般性,對(duì)已經(jīng)建立的GARCH模型、eGARCH和RealGARCH模型進(jìn)行一分鐘滬深300股指期貨日內(nèi)波動(dòng)率的預(yù)測精度評(píng)價(jià),我們利用了多種損失函數(shù)。正如前文所述,根據(jù)以往的研究結(jié)論,我們以最優(yōu)抽樣頻率一分鐘股指期貨日內(nèi)已實(shí)現(xiàn)波動(dòng)率作為衡量的標(biāo)準(zhǔn)。表2是根據(jù)不同GARCH模型對(duì)全部三個(gè)研究樣本的預(yù)測精度的評(píng)價(jià)結(jié)果。
從損失函數(shù)計(jì)算的預(yù)測精度結(jié)果來看,不同樣本的精度評(píng)估結(jié)果基本上一致:以損失函數(shù)最小為目標(biāo),Sample1樣本已實(shí)現(xiàn)GARCH模型的預(yù)測效果最好,而Sample2樣本與Sample3樣本的eGARCH模型預(yù)測效果則最佳;以H-Z回歸函數(shù)為目標(biāo),可見Sample1樣本和Sample2樣本的RealGARCH模型對(duì)滬深300股指期貨日內(nèi)一分鐘波動(dòng)率預(yù)測效果是最好的,而Sample5樣本中,eGARCH預(yù)測效果則是最好的。整體來說,滬深300股指期貨1分鐘收益率波動(dòng)性具有明顯的不對(duì)稱性,具有能夠反映不對(duì)稱性的GARCH模型的樣本內(nèi)預(yù)測精度更高。
本文主要目的是在以往股指期貨日內(nèi)波動(dòng)率研究的基礎(chǔ)上,評(píng)價(jià)不同GARCH模型對(duì)滬深300股指期貨日內(nèi)波動(dòng)率的預(yù)測效果。文章選擇了三個(gè)不同的滬深300股指期貨一分鐘日內(nèi)收益率研究樣本為研究對(duì)象,通過GARCH、eGARCH模型以及RealGARCH三個(gè)模型來刻畫滬深300一分鐘股指期貨日內(nèi)波動(dòng)率的動(dòng)態(tài)變化過程。本文將已實(shí)現(xiàn)波動(dòng)率作為真實(shí)波動(dòng)率的評(píng)價(jià)標(biāo)準(zhǔn),運(yùn)用多種損失函數(shù)來評(píng)價(jià)三個(gè)GARCH模型對(duì)滬深300股指期貨一分鐘日內(nèi)波動(dòng)率的預(yù)測精度。研究結(jié)果表明:(1)從三個(gè)研究樣本波動(dòng)率擬合結(jié)果來看,能夠反映非對(duì)稱波動(dòng)的GARCH模型對(duì)樣本的擬合系數(shù)更為顯著,其損失函數(shù)更小,說明其擬合效果更好。這表明一分鐘股指期貨日內(nèi)波動(dòng)率具有明顯的杠桿效應(yīng),針對(duì)同樣大小的正負(fù)外部沖擊,市場的波動(dòng)反映是不同的;(2)針對(duì)此次特定的研究對(duì)象,eGARCH和RealGARCH模型的預(yù)測精度要明顯優(yōu)于標(biāo)準(zhǔn)GARCH模型,Sample1和Sample2中RealGARCH模型的預(yù)測精度要優(yōu)于eGARCH模型;樣本Sample3中eGARCH模型的預(yù)測精度較高。因此,我們在對(duì)滬深300股指期貨日內(nèi)波動(dòng)率展開研究時(shí),應(yīng)根據(jù)其樣本特征,優(yōu)先選擇具有能夠反映非對(duì)稱特征的波動(dòng)率模型來刻畫波動(dòng)過程,對(duì)未來波動(dòng)率進(jìn)行預(yù)測。