【摘要】基于高頻數(shù)據(jù)的金融分析與建模研究目前已成為金融工程研究領(lǐng)域的一大熱點(diǎn)。在金融資產(chǎn)價(jià)格波動(dòng)率的刻畫上,金融高頻波動(dòng)率有著低頻波動(dòng)率無法比擬的信息優(yōu)勢,能夠較為準(zhǔn)確地刻畫金融市場波動(dòng)率的相關(guān)特征,并對(duì)金融市場波動(dòng)率的變化做出較為精確的預(yù)測。本文選擇基于高頻數(shù)據(jù)的滬深300指數(shù)為樣本,通過構(gòu)建已實(shí)現(xiàn)波動(dòng)率和已實(shí)現(xiàn)極差的長記憶性模型去研究高頻數(shù)據(jù)建模預(yù)測中的方法,以對(duì)比研究的形式分析了已實(shí)現(xiàn)波動(dòng)率和已實(shí)現(xiàn)極差在波動(dòng)率預(yù)測中的能力大小,為高頻數(shù)據(jù)波動(dòng)率預(yù)測研究提供了參考和借鑒。
【關(guān)鍵詞】高頻數(shù)據(jù) 已實(shí)現(xiàn)波動(dòng)率 已實(shí)現(xiàn)極差 波動(dòng)率預(yù)測
一、引言
隨著科技進(jìn)步尤其是電子計(jì)算機(jī)技術(shù)的發(fā)展,對(duì)高頻數(shù)據(jù)的記錄、收集、存儲(chǔ)和操作的時(shí)間和金錢成本都大大下降,20實(shí)際90年代以來,高頻數(shù)據(jù)的分析與建模得到了迅速的發(fā)展,并廣泛運(yùn)用與金融市場微觀結(jié)構(gòu)理論的實(shí)證研究中。高頻數(shù)據(jù)能精確到交易日日內(nèi)分時(shí)收盤價(jià),充分保證重要的市場信息不被丟失,使得基于高頻數(shù)據(jù)估計(jì)的波動(dòng)率包含更加豐富的波動(dòng)信息。高頻波動(dòng)率與低頻波動(dòng)率的特點(diǎn)不同,呈現(xiàn)出時(shí)間序列的負(fù)相關(guān)性、周期性U型日歷效應(yīng)和長記憶性等,而現(xiàn)有的基于低頻數(shù)據(jù)的ARCH類或SV類模型并不能很好的描述這些統(tǒng)計(jì)特征。對(duì)高頻波動(dòng)率的研究已經(jīng)成為計(jì)量經(jīng)濟(jì)學(xué)領(lǐng)域的一個(gè)熱點(diǎn)。深入研究日內(nèi)高頻數(shù)據(jù)波動(dòng)率的性質(zhì),選擇合適的波動(dòng)率預(yù)測模型和金融資產(chǎn)收益率分布來度量中國股票市場的風(fēng)險(xiǎn),分析市場微觀結(jié)構(gòu)對(duì)高頻波動(dòng)率的影響,從而為金融機(jī)構(gòu)和監(jiān)管當(dāng)局的風(fēng)險(xiǎn)監(jiān)控提供一種有效的理論方法參考和政策建議具有重大意義。
本文通過選取滬深300指數(shù)5分鐘交易數(shù)據(jù),通過構(gòu)建目前廣泛用于高頻數(shù)據(jù)分析的已實(shí)現(xiàn)波動(dòng)率和已實(shí)現(xiàn)極差兩個(gè)序列,通過R/S法計(jì)算Hurst指數(shù),確定兩個(gè)序列的長記憶性,進(jìn)而對(duì)兩者構(gòu)建了長記憶性的ARFIMA模型,并用這一模型進(jìn)行了波動(dòng)率估計(jì),再采用均方根誤差和絕對(duì)平均誤差兩個(gè)指標(biāo)對(duì)兩個(gè)模型的預(yù)測結(jié)果進(jìn)行了評(píng)價(jià)。
二、文獻(xiàn)綜述
Engle(2000)為超高頻數(shù)據(jù)或交易的建模應(yīng)用提供了新的思路。通過選取的52144條IBM股票的交易數(shù)據(jù)去為交易的時(shí)機(jī)建模并測量分析它對(duì)價(jià)格波動(dòng)的影響,將ACD模型引入去估計(jì)到達(dá)比率的相關(guān)點(diǎn)過程,同時(shí)采用了半?yún)?shù)法去估計(jì)調(diào)和均數(shù)。實(shí)證結(jié)果說明對(duì)于更長的持續(xù)期和更長的預(yù)期持續(xù)期,其波動(dòng)會(huì)相應(yīng)的更小。Andersen(2001)等采用道瓊斯工業(yè)指數(shù)中獲取的日內(nèi)高頻交易數(shù)據(jù)對(duì)從已實(shí)現(xiàn)日股票收益波動(dòng)率和相關(guān)系數(shù)進(jìn)行研究,他們發(fā)現(xiàn)實(shí)現(xiàn)方差和協(xié)方差的非條件分布是高度右偏,然而實(shí)現(xiàn)對(duì)數(shù)標(biāo)準(zhǔn)差和相關(guān)系數(shù)卻近似于高斯分布,已實(shí)現(xiàn)波動(dòng)率與相關(guān)系數(shù)表現(xiàn)出了較強(qiáng)的短暫相關(guān)性,即所謂的長記憶性。Andersen(2003)等構(gòu)建了一個(gè)集高頻日內(nèi)數(shù)據(jù)測量、建模和每日預(yù)測和低頻收益波動(dòng)與收益分布的體系,大部分有關(guān)金融資產(chǎn)收益波動(dòng)率、相關(guān)性和分布的建模與預(yù)測是基于多元ARCH或者隨機(jī)波動(dòng)率模型的潛在限制性和復(fù)雜的參數(shù),相比之下,使用由高頻日內(nèi)收益所計(jì)算得出的已實(shí)現(xiàn)波動(dòng)率使得建模與預(yù)測允許采用傳統(tǒng)時(shí)間序列方法。在構(gòu)造連續(xù)時(shí)間無套利價(jià)格理論與二次方差理論的基礎(chǔ)上,他們提出了已實(shí)現(xiàn)波動(dòng)率與條件協(xié)方差矩陣的關(guān)系。通過德國馬克兌美元和日元兌美元的10年以上的匯率數(shù)據(jù)的實(shí)證分析,他們發(fā)現(xiàn)簡單的長記憶高斯向量回歸對(duì)數(shù)日已實(shí)現(xiàn)波動(dòng)率在預(yù)測上的表現(xiàn)優(yōu)于許多ARCH類模型與更復(fù)雜的高頻數(shù)據(jù)模型。近年來,許多學(xué)者開拓了新的研究高頻數(shù)據(jù)的思路,成果也不斷涌現(xiàn)。唐勇和張世英(2006)通過選取深圳成指的高頻數(shù)據(jù)進(jìn)行實(shí)證分析,通過對(duì)比已實(shí)現(xiàn)極差與已實(shí)現(xiàn)波動(dòng)率這兩個(gè)波動(dòng)估計(jì)量,證明了實(shí)現(xiàn)極差在波動(dòng)估計(jì)上優(yōu)于已實(shí)現(xiàn)波動(dòng)率。此外,在高頻數(shù)據(jù)的“日歷效應(yīng)”問題上,提出了加權(quán)已實(shí)現(xiàn)極差,并與實(shí)現(xiàn)極差作比較,證實(shí)了加權(quán)已實(shí)現(xiàn)極差在估計(jì)波動(dòng)方面更為優(yōu)秀,為在高頻數(shù)據(jù)中將極差應(yīng)用于估計(jì)波動(dòng)率拓展了一個(gè)新的思路。Sun(2009)等采用ARMA(1,1)-GARCH(1,1)模型這一參數(shù)模型,選取了德國DAX指數(shù)的高頻數(shù)據(jù)并融入于列維過程去計(jì)算風(fēng)險(xiǎn)價(jià)值,并將運(yùn)用這一方法計(jì)算所得的VaR和標(biāo)準(zhǔn)的非參數(shù)法計(jì)算所得的VaR進(jìn)行對(duì)比,結(jié)果顯示這一參數(shù)法獲得了更好的結(jié)果。Lu(2010)等分析了當(dāng)2005年7月21日人民幣再調(diào)整時(shí)相關(guān)貨幣兌美元的1分鐘高頻數(shù)據(jù)的變動(dòng),數(shù)據(jù)分析顯示人民幣再調(diào)整時(shí)匯率數(shù)據(jù)中存在一個(gè)大的跳躍,在這一跳躍之后,匯率的收益率存在著大的波動(dòng)率,此外,外匯數(shù)據(jù)中一些大的跳躍伴隨著這一跳躍發(fā)生。Thanos和Owain(2010)提出了一種處理超高頻金融市場數(shù)據(jù)中樣本外預(yù)測的多維算法。在數(shù)據(jù)統(tǒng)計(jì)分析中,對(duì)金融時(shí)間序列的統(tǒng)計(jì)特征采用穩(wěn)健的平均絕對(duì)偏差法去分析,并提出將價(jià)位,價(jià)格波動(dòng)和收益分布同時(shí)考慮進(jìn)市場微觀結(jié)構(gòu)算法的原理中。唐勇和劉微(2013)推導(dǎo)出了已實(shí)現(xiàn)極差多冪次變差族中最優(yōu)的波動(dòng)估計(jì)量,根據(jù)無偏性和有效性原則作了相應(yīng)的加權(quán)處理,得出了加權(quán)估計(jì)量,將這些估計(jì)量與已實(shí)現(xiàn)GARCH相結(jié)合,并對(duì)此模型進(jìn)行了拓展。通過實(shí)證分析說明已實(shí)現(xiàn)極差四冪次變差是已實(shí)現(xiàn)極差多冪次變差族中最優(yōu)的波動(dòng)估計(jì)量,加權(quán)已實(shí)現(xiàn)極差四冪次變差能消除高頻數(shù)據(jù)中的日內(nèi)效應(yīng)。雷井生和林莎(2013)改進(jìn)了統(tǒng)計(jì)套利策略,設(shè)計(jì)了一個(gè)新的統(tǒng)計(jì)套利策略并進(jìn)行了實(shí)證分析,在新的策略下,運(yùn)用不同頻率數(shù)據(jù)進(jìn)行套利統(tǒng)計(jì),分析并得出了新的策略在套利統(tǒng)計(jì)上具有良好的績效,并且樣本內(nèi)的盈利對(duì)于樣本外的盈利預(yù)測性明顯增強(qiáng)。隨著對(duì)金融高頻數(shù)據(jù)研究的發(fā)展,由于高頻數(shù)據(jù)本身所具有的特性如日歷效應(yīng)等,以及使得GARCH模型很難用于高頻數(shù)據(jù)的分析,不同的學(xué)者提出與發(fā)展了新的適用于高頻數(shù)據(jù)研究的成果,其中比較突出的成果要屬已實(shí)現(xiàn)波動(dòng)率和已實(shí)現(xiàn)極差這兩個(gè)被廣泛用于高頻數(shù)據(jù)分析的研究成果。
三、方法簡述
已實(shí)現(xiàn)波動(dòng)率(Realized volatility,簡記為RV)由于其計(jì)算簡便,無需進(jìn)行模型參數(shù)估計(jì)(model-free),有助于研究多變量時(shí)間序列的波動(dòng)特征。同已實(shí)現(xiàn)波動(dòng)率RV一樣,已實(shí)現(xiàn)極差波動(dòng)(Realized Range volatility,簡記為RRV)也是具有無需模型(model free)和計(jì)算簡便的波動(dòng)率估計(jì)量,Parkinson(1980)提出了構(gòu)造極差的表達(dá)式,在此基礎(chǔ)上Christensen(2005)提出了已實(shí)現(xiàn)極差波動(dòng)。不同學(xué)者和研究人員經(jīng)過理論和實(shí)證上的對(duì)比,認(rèn)為已實(shí)現(xiàn)極差是比已實(shí)現(xiàn)波動(dòng)率更為有效的波動(dòng)率估計(jì)量。下面分別對(duì)兩者進(jìn)行定義。
令Pclose(t,i)為日內(nèi)觀測的收盤價(jià),R(t,i)=In(Pclose(t,i)-Pclose(t,i-1))
Ht,i=■lnp■,L■=■lnp■,
Sp■=H■-L■(t=1,2,,,T,i=1,2,,,N,j=1,2,,,N)
上式中,T為研究天數(shù),N為在[t-1,t]內(nèi)等時(shí)間間隔的觀測次數(shù),Δ=■,為將[t-1,t]等分為N個(gè)時(shí)間段的某個(gè)小時(shí)間段的時(shí)間間隔,N取整數(shù)
則已實(shí)現(xiàn)波動(dòng)率定義為:RV=■R2(t,i),為日內(nèi)對(duì)數(shù)收益率平方和的累加。
已實(shí)現(xiàn)極差定義為:RRVt=■■Sptj2,為日內(nèi)最高價(jià)和最低價(jià)對(duì)數(shù)平方和的累加。
判定波動(dòng)率序列是否具有長記憶性的方法主要有時(shí)域和頻域兩個(gè)兩個(gè)方法,本文選擇時(shí)域角度,以重標(biāo)極差法(R/S)計(jì)算的Hurst指數(shù)來度量波動(dòng)率序列的長記憶性。當(dāng)H≤0.5時(shí),序列{Xt}呈現(xiàn)短記憶性;當(dāng)H>0.5時(shí),序列{Xt}呈現(xiàn)長記憶性。
針對(duì)已實(shí)現(xiàn)波動(dòng)序列{Xt}所具有的長記憶性,本文采用分整自回歸移動(dòng)平均模型(Autoregressive fractionally moving average model,簡稱為ARFIMA(p,d,q)模型)對(duì)已實(shí)現(xiàn)類波動(dòng)率序列進(jìn)行建模分析。
ARFIMA(p,d,q)模型的具體形式為:φ(L)(1-L)d(Xt-μ)= θ(L)εt
其中,μ為序列{Xt}的均值,εt~i.i.d(0,σ2s),φ(L)為P階平穩(wěn)回歸算子,θ(L)為q階可逆移動(dòng)平均算子,它們的根都在單位圓外。d為分?jǐn)?shù)維滯后階數(shù),反映的是序列{Xt}的長記憶性。ARFIMA(p,d,q)的特征主要在于用p+q個(gè)參數(shù)來刻畫序列{Xt}的短記憶特性,用參數(shù)d來刻畫{Xt}的長記憶特征。
對(duì)于ARFIMA(p,d,q)模型的參數(shù)估計(jì),可以采用兩步參數(shù)法:
首先估計(jì)ARFIMA(p,d,q)模型中的分?jǐn)?shù)維滯后階數(shù)d,并對(duì)原序列取分?jǐn)?shù)維差分,得到新的可用于估計(jì)的時(shí)間序列。d確定好以后,ARFIMA模型可以當(dāng)作ARMA模型進(jìn)行估計(jì),確定剩下的參數(shù)p和q。
由于參數(shù)d和Hurst指數(shù)滿足:d=H-0.5,因此可以通過R/S法計(jì)算所得的Hurst指數(shù)確定參數(shù)d,再將模型當(dāng)作ARMA模型,進(jìn)行剩下的參數(shù)估計(jì)。
四、實(shí)證過程
本文選擇滬深300指數(shù)作為研究樣本,樣本選取的區(qū)間為2011年4月1日至2014年3月5日,選取的高頻數(shù)據(jù)頻率為5分鐘的高頻數(shù)據(jù),數(shù)據(jù)來源于Wind資訊金融終端,在計(jì)算得到的已實(shí)現(xiàn)波動(dòng)率RV和已實(shí)現(xiàn)極差RRV后,開始進(jìn)行實(shí)證分析。實(shí)證部分主要用matlab軟件進(jìn)行。下表為已實(shí)現(xiàn)波動(dòng)率RRV和已實(shí)現(xiàn)極差的描述性統(tǒng)計(jì):
描述性統(tǒng)計(jì)結(jié)果
從上表可以看出,無論是已實(shí)現(xiàn)波動(dòng)率RV還是已實(shí)現(xiàn)極差RRV,都呈現(xiàn)出尖峰厚尾的特征,相應(yīng)的JB統(tǒng)計(jì)量和括號(hào)內(nèi)的P值都表明上述序列不服從正態(tài)分布,且根據(jù)偏度和峰度值來看,都呈現(xiàn)出右偏厚尾的特性。下面對(duì)兩個(gè)序列進(jìn)行單位根檢驗(yàn),結(jié)果如下:
單位根檢驗(yàn)結(jié)果
從上表的結(jié)果來看,RV和RRV兩個(gè)序列檢驗(yàn)的t統(tǒng)計(jì)量在99%的置信水平上都拒絕了原假設(shè),其P值都是足夠小的值,因此RV序列和RV序列都通過了檢驗(yàn),這兩個(gè)序列都是平穩(wěn)的。下面對(duì)兩個(gè)序列進(jìn)行長記憶性檢驗(yàn),結(jié)果如下
RV和RRV的長記憶性檢驗(yàn)
從上表可以看出,RV和RRV的Hurst指數(shù)0.5 RV序列的估計(jì)過程中,通過AIC和SC準(zhǔn)則確定的(p,q)為(1,1),則所得到的RV-ARFIMA(1,0.264,1)的具體形式為: (1-0.064L)(1-L)0.264(RV-μ)=(1-0.95L)εt (1.466) (-66.643) RRV序列通過AIC和SC準(zhǔn)則確定模型的(p,q)選擇為(1,2),則得到的RRV-ARFIMA(1,0.467,2)的具體形式為: (1-0.62L)(1-L)0.467(RRV-μ)=(1-1.362L+0.4L2)εt (7.689) (-12.71609)(5.1173) 括號(hào)內(nèi)為相應(yīng)參數(shù)的t統(tǒng)計(jì)量。 在構(gòu)建完所有的模型后,我們對(duì)各模型進(jìn)行波動(dòng)率預(yù)測能力上的比較,比較的標(biāo)準(zhǔn)選擇均方根誤差(RMSE)和絕對(duì)平均誤差(MAE)兩個(gè)指標(biāo): RMSE=■■(MV-FV)■■ MAE=■■(MV-FV)■ 其中,MV表示實(shí)際的波動(dòng)率,F(xiàn)V表示模型預(yù)測的波動(dòng)率。設(shè)定預(yù)測期為100,就可以得到向前預(yù)測100期的預(yù)測值,再采用上述兩個(gè)方法對(duì)波動(dòng)率預(yù)測的結(jié)果進(jìn)行評(píng)價(jià),兩個(gè)模型預(yù)測的評(píng)價(jià)結(jié)果如下: 波動(dòng)率預(yù)測評(píng)價(jià) 對(duì)比RRV和RV序列構(gòu)建的ARFIMA模型在波動(dòng)率預(yù)測上的結(jié)果,我們可以發(fā)現(xiàn)無論從均方根誤差還是絕對(duì)平均誤差的角度,RRV序列的預(yù)測誤差都小于RV序列的預(yù)測誤差,這也從實(shí)證上印證了本文在理論上分析RV和RRV在波動(dòng)率估計(jì)上的優(yōu)劣區(qū)別。 五、結(jié)論 本文通過選取滬深300指數(shù)的高頻交易數(shù)據(jù),分別構(gòu)建了目前高頻數(shù)據(jù)研究中流行的已實(shí)現(xiàn)波動(dòng)率和已實(shí)現(xiàn)極差兩個(gè)方法變量,并對(duì)兩個(gè)序列采用R/S法計(jì)算了序列的Hurst,結(jié)果表明兩個(gè)序列都呈現(xiàn)長記憶性。在隨后構(gòu)建長記憶性模型并進(jìn)行波動(dòng)率估計(jì)的對(duì)比研究中,通過RMSE和MAE兩個(gè)指標(biāo)的判定,表明已實(shí)現(xiàn)極差是優(yōu)于已實(shí)現(xiàn)波動(dòng)的波動(dòng)率估計(jì)量,這主要是因?yàn)橐褜?shí)現(xiàn)極差是基于日內(nèi)價(jià)格的最高價(jià)和最低價(jià)而構(gòu)建的,包含的市場信息較多,而已實(shí)現(xiàn)波動(dòng)率是基于日內(nèi)收盤價(jià)而構(gòu)建的波動(dòng)率估計(jì)量,會(huì)在一定程度上遺漏市場信息。
從本文的研究可以發(fā)現(xiàn),金融市場的交易連續(xù)不斷,其日內(nèi)高頻數(shù)據(jù)包含的信息也有一定的差別,除了考慮收盤價(jià)這一要素外,日內(nèi)觀測到的最高價(jià)、最低價(jià)、成交量等因素也要納入對(duì)金融市場的分析中,這樣可以獲得比單獨(dú)采用收盤價(jià)這一因素進(jìn)行波動(dòng)率研究更準(zhǔn)確的研究結(jié)果。
參考文獻(xiàn)
[1]Torben G.Andersen,Tim Bollerslev,F(xiàn)rancis X.Diebold,Heiko Ebens.The distribution of realized stock return volatility[J].Journal of Financial Economics,2001,61,43-67.
[2]Robert F.Engle.The Econometrics of Ultra- high-frequency data[J].Econometrica,2000,68(1):1-22.
[3]Torben G.Andersen,Tim Bollerslev,F(xiàn)rancis X.Diebold,Paul Labys.Modeling and Forecasting Realized Volatility[J].Econometrica,2003,71,529-626.
[4]Wei Sun,Svetlozar Rachev,F(xiàn)rank J.Fabozzi. A New Approach for Using Levy Processes for Determining High-Frequency Value-at-Risk Predictions[J].European Financial Management,2009,15(2):340-361.
[5]XinHong Lu,Ken-Ichi Kawai,Koichi Maekawa. Estimating Bivariate GARCH-Jump model Based on High Frequency Data:The Case of Revaluation of The Chinese Yuan in July 2005[J].Journal of Operational Research,2010,27(2):287-300.
[6]Thanos Verousis,Owain ap Gwilym.An improved algorithm for cleaning Ultra High-Frequency data[J].Journal of Derivatives & Hedge Fundes,2010,15(4):323-340.
[7]Christian M.Hafner.Cross-correlating wavelet coefficients with applications to high-frequency financial time series[J].Journal of Applied Statistics,2012,39(6):1363-1381.
[8]雷井生,林莎.基于高頻數(shù)據(jù)的套利統(tǒng)計(jì)策略及實(shí)證研究[J].科研管理,2013,6(34):138-146.
[9]唐勇,張世英.已實(shí)現(xiàn)波動(dòng)和已實(shí)現(xiàn)極差波動(dòng)的比較研究[J].系統(tǒng)工程學(xué)報(bào),2007,22(4):437-443.
[10]邵錫棟,殷煉乾.基于實(shí)現(xiàn)極差和實(shí)現(xiàn)波動(dòng)率的中國金融市場風(fēng)險(xiǎn)測度研究[J].金融研究,2008,336(6):109-121.
[11]唐勇,張世英.高頻數(shù)據(jù)的加權(quán)已實(shí)現(xiàn)極差波動(dòng)及其實(shí)證分析[J].系統(tǒng)工程,2006,24(8):52-60.
[12]唐勇,劉微.加權(quán)已實(shí)現(xiàn)極差四次冪變差分析及其應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2013,33(11):2766-2776.
[13]張瑞鋒,汪同三.基于高頻數(shù)據(jù)的金融市場波動(dòng)溢出分析[J].財(cái)經(jīng)理論與實(shí)踐(雙月刊),2013,34,21-26.
作者簡介:陳杰(1990-),男,漢族,浙江財(cái)經(jīng)大學(xué)金融學(xué)院研究生,研究方向:金融工程。