潘水洋,王一鳴
(北京大學(xué) 經(jīng)濟(jì)學(xué)院,北京 100871)
基于滬深300股指期貨高頻數(shù)據(jù)趨勢持續(xù)期模型的構(gòu)建與檢驗(yàn)
潘水洋,王一鳴
(北京大學(xué) 經(jīng)濟(jì)學(xué)院,北京 100871)
文章針對我國滬深300股指期貨高頻數(shù)據(jù)時間序列具有趨勢運(yùn)動特性,提出了趨勢持續(xù)期模型。首先采用泊松過程對趨勢持續(xù)期的市場微觀結(jié)構(gòu)進(jìn)行建模,得出了趨勢持續(xù)期在理論上服從Gamma分布;基于經(jīng)驗(yàn)?zāi)B(tài)分解算法提取股指期貨日內(nèi)高頻交易數(shù)據(jù)的趨勢持續(xù)期,采用最大似然估計(jì)法,估計(jì)趨勢持續(xù)期的Gamma分布參數(shù),同時通過Kolmogorov-Smirnov檢驗(yàn)驗(yàn)證了模型的有效性;最后對不同采樣間隔下的趨勢持續(xù)期進(jìn)行標(biāo)準(zhǔn)化處理,趨勢持續(xù)期模型具有很好的穩(wěn)健性。
趨勢持續(xù)期;經(jīng)驗(yàn)?zāi)B(tài)分解;泊松過程;伽馬分布
在分析高頻時間序列過程中,資產(chǎn)價格高頻時間序列往往存在短期趨勢,許多高頻數(shù)據(jù)量化模型嘗試去預(yù)測價格運(yùn)動趨勢,如Zhang等[1]采用非線性自回歸條件持續(xù)期模型對高頻交易數(shù)據(jù)進(jìn)行預(yù)測、Paresh等[2]在隱馬爾科夫模型框架下對商品期貨價格高頻時間序列進(jìn)行了較為成功的預(yù)測。與此同時,大量交易者通過量化模型預(yù)測短期趨勢戰(zhàn)勝市場獲取超額收益的事實(shí)表明:趨勢預(yù)測在實(shí)際的交易活動中起著至關(guān)重要的作用。正因如此,對趨勢形成背后的市場微觀結(jié)構(gòu)的研究顯得尤為重要。
在日內(nèi)高頻交易數(shù)據(jù)下,一個令人感興趣的研究點(diǎn)是趨勢持續(xù)期是如何形成的?它的統(tǒng)計(jì)分布具有哪些特性?深刻了解趨勢持續(xù)期的背后形成機(jī)制和統(tǒng)計(jì)分布規(guī)律對基于時間尺度構(gòu)建高頻交易策略起著至關(guān)重要的作用。國內(nèi)外目前還沒有文獻(xiàn)對高頻數(shù)據(jù)趨勢持續(xù)期進(jìn)行研究。本文的創(chuàng)新之處在于首次提出了趨勢持續(xù)期這一基本概念,通過使用泊松過程對市場微觀結(jié)構(gòu)進(jìn)行統(tǒng)計(jì)建模,得出了趨勢持續(xù)期服從Gamma分布,基于Massey[3]提出的Kolmogorov-Smirnov單樣本檢驗(yàn)方法,采用滬深300股指期貨2011年1月1日到2015年12月31日高頻交易數(shù)據(jù)對趨勢持續(xù)期統(tǒng)計(jì)分布進(jìn)行檢驗(yàn),驗(yàn)證了本文所提出模型的正確性。
本文將趨勢持續(xù)期定義為成交價格連續(xù)上漲或連續(xù)下跌的持續(xù)時間。成交價格連續(xù)上漲形成的趨勢稱之為上漲趨勢持續(xù)期;成交價格連續(xù)下跌形成的趨勢稱之為下跌趨勢持續(xù)期。為了探討趨勢形成機(jī)理,先研究市場微觀機(jī)制特性,主要體現(xiàn)在以下幾個方面:
(1)市場存在兩類異質(zhì)交易者,一類是買方多頭,主動買入股票,引起股票價格上漲;另一類為賣方空頭,主動賣出股票,引起股票價格下跌;
(2)股票具有最小價格變動單位ΔS,價格變化是離散的;
(3)交易市場為指令驅(qū)動型市場,買賣雙方不斷將下單指令提交至指令??;
(4)指令成交事件為泊松過程。O’Hara[4]、Scalas[5]和Weber[6]對此假設(shè)分別給出了理論推導(dǎo)和實(shí)證檢驗(yàn)。
假定觀測到的資產(chǎn)市場價格Pt滿足:
P*表示資產(chǎn)的基本價值,在高頻交易數(shù)據(jù)中P*保持不變。It可以解釋為一個指令型的指示變量,1代表買方發(fā)動的交易;-1代表賣方發(fā)動的交易。ΔS表示最小報價單位。由式(1)可知,當(dāng)買方連續(xù)發(fā)出交易指令時,價格連續(xù)上漲,形成上漲趨勢;當(dāng)賣方連續(xù)發(fā)出交易指令時,價格連續(xù)下跌,形成下跌趨勢。
本文將買方和賣方發(fā)起的交易指令作為事件集中的元素,并按照交易發(fā)生的先后順序建立事件時間軸。買方和賣方主動發(fā)起指令按照強(qiáng)度為λ的Poisson過程到達(dá),如下頁圖1所示。
在圖1中,t0時刻買方多頭占主導(dǎo)地位,資產(chǎn)價格產(chǎn)生上漲趨勢,買方多頭力量連續(xù)發(fā)出交易指令,在t1時刻,交易指令引起價格上漲Δp1。t2時刻,交易指令引起價格上漲Δp2。一直到tk時刻,交易指令引起價格上漲Δpk,此后多空力量發(fā)生反轉(zhuǎn),賣方空頭開始處于主導(dǎo)地位,資產(chǎn)價格由上漲趨勢轉(zhuǎn)變?yōu)橄碌厔?。根?jù)Sheldom[7]提出的Poisson過程的性質(zhì):第i-1次交易發(fā)生與第i次交易發(fā)生的時間間隔Δti相互獨(dú)立,且都服從參數(shù)為λ的指數(shù)分布,其分布密度函數(shù)為:
圖1 趨勢持續(xù)期模型
圖1中第一個趨勢持續(xù)期為:
記τn為市場上第n個趨勢的持續(xù)期。根據(jù)Poisson過程的性質(zhì),趨勢持續(xù)期τ服從Gamma分布,其分布密度函數(shù)為:
本文采用泊松過程對交易指令進(jìn)行建模,從理論上得出了趨勢持續(xù)期服從Gamma分布,模型的具體行為可參考圖1。
為檢驗(yàn)?zāi)P偷挠行?,采用滬?00指數(shù)股指期貨2011年1月1日到2015年12月31日高頻交易數(shù)據(jù)對趨勢持續(xù)期統(tǒng)計(jì)分布進(jìn)行檢驗(yàn)。首先基于Huang[8]提出的經(jīng)驗(yàn)?zāi)B(tài)分解算法提取出股指期貨日內(nèi)高頻交易數(shù)據(jù)的趨勢持續(xù)期。然后采用最大似然估計(jì)法,估計(jì)趨勢持續(xù)期的Gamma分布參數(shù),最后通過Kolmogorov-Smirnov檢驗(yàn)驗(yàn)證模型的有效性。為檢驗(yàn)?zāi)P偷姆€(wěn)健性選取的數(shù)據(jù)為股指期貨當(dāng)月主力合約1秒間隔高頻數(shù)據(jù)、5秒間隔高頻數(shù)據(jù)、10秒間隔高頻數(shù)據(jù)、20秒間隔高頻數(shù)據(jù)、30秒間隔高頻數(shù)據(jù)、60秒間隔高頻數(shù)據(jù)作為樣本。
本文采用如下方法提取趨勢持續(xù)期:
(1)對原始高頻數(shù)據(jù)采用Boudraa[9]提出的經(jīng)驗(yàn)?zāi)B(tài)分解濾波算法,濾除噪聲干擾。
(2)對濾波后的數(shù)據(jù)提取波峰與波谷的位置。
(3)波峰與波谷之間的距離為趨勢持續(xù)期。
濾波的原因在于高頻交易時間序列存在噪聲,趨勢之上會疊加干擾,需要采用濾波技術(shù)濾除這些干擾,得到干凈的趨勢成分。
本文采用經(jīng)驗(yàn)?zāi)B(tài)分解對原始高頻數(shù)據(jù)濾波主要基于如下考慮:經(jīng)驗(yàn)?zāi)B(tài)分解是一種非線性時間序列分析方法,而高頻時間序列具有非線性,非平穩(wěn)特性,普通的濾波方法如移動平均、指數(shù)平均濾波方法本質(zhì)上屬于線性處理方法,這些濾波方法作用在高頻時間序列時會產(chǎn)生嚴(yán)重滯后效應(yīng),不能正確提取波峰波谷位置,這將導(dǎo)致提取的趨勢持續(xù)期產(chǎn)生誤差。
經(jīng)驗(yàn)?zāi)B(tài)分解濾波計(jì)算方法如下所示:
給定時間序列x(t),經(jīng)驗(yàn)?zāi)B(tài)分解算法通過篩選過程將其分解成多個特征時間尺度的固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF),稱這些函數(shù)為IMF。每一個IMF分量必須滿足兩個條件:①極值點(diǎn)(包括極大值和極小值)的個數(shù)與過零點(diǎn)的個數(shù)相等或至多相差一個;②由局部極大值點(diǎn)構(gòu)成的上包絡(luò)和局部極小值點(diǎn)構(gòu)成的下包絡(luò)的均值為零。篩選過程如下:
(1)確定?的取值(0.2-0.3),j←1
(2)cj?1(t)←x(t)
(3)提取第j個IMF分量,過程如下:
①i← 1,hj,i?1(t)←cj?1(t)
②提取hj,i?1(t)的所有極值點(diǎn)
③分別對極大值點(diǎn)和極小值點(diǎn)采用三次樣條插值得到hj,i?1(t)的上包絡(luò)Uj,i-1(t)和下包絡(luò)Lj,i-1(t)
④計(jì)算包絡(luò)的平均值:mj,i-1(t)←[Uj,i-1(t)+Lj,i-1(t)]/2
⑤更新:hj,i(t)←hj,i-1(t)-mj,i-1(t),i←i+1
⑥計(jì)算停止迭代準(zhǔn)則:
⑦重復(fù)步驟②至步驟⑥,當(dāng)SD(i)<?時,IMFj(t)←hj,i(t)
(4)更新剩余分量:cj(t)←cj?1(t)-IMFj(t)
(5)重復(fù)步驟(3),j← j+1,當(dāng)cj(t)的極值點(diǎn)小于2時,結(jié)束整個過程。
經(jīng)過經(jīng)驗(yàn)?zāi)B(tài)分解算法篩選,時間序列x(t)被分解成N個IMFj(t),j=1,…,N和一個剩余分量s(t),選取合適的IMF分量就可以濾除噪聲,完成對x(t)濾波。即:
通過經(jīng)驗(yàn)?zāi)B(tài)分解對高頻數(shù)據(jù)濾波,獲得趨勢持續(xù)期時間序列τ1,τ2,…,τn,接下來采用極大似然估計(jì)對趨勢持續(xù)期的Gamma分布進(jìn)行估計(jì)檢驗(yàn)。首先得到似然函數(shù):
兩邊取自然對數(shù):
對數(shù)似然函數(shù)分別對α,β求一階倒數(shù),并令其一階倒數(shù)為0,即可求出最大似然估計(jì)值,。表1為采用最大似然估計(jì)對Gamma分布各個參數(shù)的估計(jì)結(jié)果。
表1 趨勢持續(xù)期Gamma分布參數(shù)估計(jì)結(jié)果
從表1可以看出,不同的采樣時間間隔下趨勢持續(xù)期均較好的服從Gamma分布,不同采樣時間間隔下α的估計(jì)值非常接近,β估計(jì)值隨著采樣時間間隔的增大而增加。在Gamma分布中參數(shù)α為形狀參數(shù),α的變化主要引起分布曲線形狀的改變,α的值越小,分布的拖尾越明顯。β為尺度參數(shù),反應(yīng)了分布的尺度信息,隨著β的增大,分布曲線的跨度增加且峰值降低,因此采樣時間間隔越大,β的估計(jì)值必然會增大。
本文采用Massey[3]提出的Kolmogorov-Smirnov單樣本檢驗(yàn)來驗(yàn)證分布的擬合優(yōu)度。KS檢驗(yàn)是一個非參數(shù)檢驗(yàn),對由極大似然估計(jì)得到的Gamma分布進(jìn)行擬合優(yōu)度的檢驗(yàn),采用了單樣本KS檢驗(yàn)的方法,KS檢驗(yàn)的基本原理是通過檢驗(yàn)經(jīng)驗(yàn)累積分布與假設(shè)累積分布之間的距離來進(jìn)行判斷,具體描述如下:
對n個獨(dú)立同分布的樣本{τi,i=1,2…,n},F(xiàn)n(τ)是τi的經(jīng)驗(yàn)累積分布函數(shù)。給定如下假設(shè)H0:{τi,i=1,2…,n}服從通過極大似然法擬合得到的Gamma分布函數(shù)F(τ),計(jì)算{τi,i=1,2…,n}的經(jīng)驗(yàn)累計(jì)分布Fn(τ)與理論累計(jì)分布F(τ)的最大差距,記為統(tǒng)計(jì)量Dn:
由 Kolmogorov定理可知,若Fn(τ)與F(τ)為同一分布,則Dn服從Kolmogorov分布,即:
給定顯著性系數(shù)a,通過計(jì)算可以得到相應(yīng)的分位數(shù)Ka,使得:
當(dāng)Dn>Ka時,在顯著性水平a下拒絕原假設(shè)H0。表2給出了不同采樣時間間隔下KS檢驗(yàn)結(jié)果。表中KS檢驗(yàn)的顯著性水平為0.05,表2的結(jié)果支持了趨勢持續(xù)期服從Gamma分布。
表2 KS檢驗(yàn)結(jié)果
由于在不同的采樣時間間隔下,持續(xù)期分布均服從Gamma分布,而且α的估計(jì)值非常接近,說明模型是有效的。為進(jìn)一步檢驗(yàn)?zāi)P头€(wěn)定性,對不同采樣時間間隔下的趨勢持續(xù)期進(jìn)行標(biāo)準(zhǔn)化處理,進(jìn)一步檢驗(yàn)其統(tǒng)計(jì)分布特性:
其中τ是趨勢持續(xù)期隨機(jī)變量,σ是趨勢持續(xù)期τ的標(biāo)準(zhǔn)差。f(τ)是未經(jīng)過標(biāo)準(zhǔn)化處理的趨勢持續(xù)期τ的概率密度分布函數(shù)。f′(τ/σ)是經(jīng)過標(biāo)準(zhǔn)化處理后隨機(jī)變量τ/σ的概率密度分布函數(shù)。再次利用Gamma分布對標(biāo)準(zhǔn)化后的趨勢持續(xù)期進(jìn)行建模,同樣使用極大似然估計(jì)法估計(jì)各個參數(shù)得到估計(jì)結(jié)果如表3所示。觀察表3中列出的不同采樣間隔下各參數(shù)的估計(jì)值,α,β的估計(jì)值都非常接近,結(jié)果進(jìn)一步表明了本文所提出模型的穩(wěn)健性。
表3 標(biāo)準(zhǔn)化后趨勢持續(xù)期Gamma分布參數(shù)估計(jì)結(jié)果
通過對市場微觀結(jié)構(gòu)描述,基于泊松過程對趨勢持續(xù)期形成過程進(jìn)行建模,從理論上推導(dǎo)趨勢持續(xù)期服從Gamma分布。采用最大似然估計(jì)和KS檢驗(yàn)對趨勢持續(xù)期的分布參數(shù)進(jìn)行了估計(jì)和推斷,結(jié)果表明了該模型的正確性。對不同采樣時間間隔下的趨勢持續(xù)期進(jìn)行標(biāo)準(zhǔn)化后,趨勢持續(xù)期的分布展現(xiàn)了比較一致的分布特性,趨勢持續(xù)期模型具有很強(qiáng)的穩(wěn)健性。
高頻數(shù)據(jù)下,上漲趨勢與下跌趨勢交替進(jìn)行,其形成的原因可能是隨著時間推移,趨勢持續(xù)一段時間后,價格朝著不利于處在主導(dǎo)地位交易者的方向變動,致使交易者重新選擇買賣點(diǎn),并由此形成趨勢反轉(zhuǎn),由此往復(fù)就形成了上漲趨勢與下跌趨勢的交替進(jìn)行。
[1]Zhang Y J,Russell J R,Tsay R S.A Nonlinear Autoregressive Conditional Duration Model With Applications to Financial Transaction Data[J].Journal of Econometrics,2000,9(3).
[2]Paresh D,Mamon M,Tenyakov A.Filtering and Forecasting Commodity Futures Prices under an HMM Framework[J].Energy Economics,2013,23(3).
[3]Massey F J.The Kolmogorrnov-Smirnov Test for Goodness of Fit[J].Journal of the American Statistical Association,1951,2(12).
[4]O’Hara M.Market Microstructure Theory[M].New York.Blackwell Press,1995.
[5]Scalas E,Gorenflo R,Lucklock R.Anomalous Waiting Times in High-frequency Financial Data[J].Quantitative Finance,2004,16(4).[6]Weber P,Rose B.Order Book Approach to Price Impact[J].Quantitative Finance,2005,17(7).
[7]Sheldom M R.Stochastic Processes[M].New York:John Wiley Sons Press,1981.
[8]Huang N E,Shen Z,Long S R.The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and non-stationary Time Series Analysis[J].Proceedings of the Royal Society,1998,98(12).
[9]Boudraa A O,Cexus J C.EMD-Based Signal Filtering[J].IEEE Transactions on Instrumentation and Measurement,2007,56(6).
F830.9
A
1002-6487(2017)20-0090-03
潘水洋(1986—),男,湖南岳陽人,博士研究生,研究方向:資產(chǎn)定價。
王一鳴(1967—),男,江西臨川人,教授,博士生導(dǎo)師,研究方向:資產(chǎn)定價與風(fēng)險管理。
(責(zé)任編輯/易永生)