彭闖
摘要:本文主要介紹了統(tǒng)計(jì)套利的基本含義和基于協(xié)整的交易策略,之后選取了國(guó)內(nèi)期貨市場(chǎng)中具有代表性的滬銅1907和滬銅1908的的5分鐘的高頻交易數(shù)據(jù)來(lái)進(jìn)行實(shí)證研究,其中包括相關(guān)系數(shù)檢驗(yàn)、平穩(wěn)性檢驗(yàn)及協(xié)整檢驗(yàn)等方法,最后根據(jù)檢驗(yàn)的結(jié)果建立了誤差修正模型并制定了套利策略,并依據(jù)建立的套利策略對(duì)歷史數(shù)據(jù)進(jìn)行了回測(cè),根據(jù)回測(cè)結(jié)果對(duì)套利策略及模型的有效性給與了評(píng)估。
關(guān)鍵詞:統(tǒng)計(jì)套利;協(xié)整檢驗(yàn);誤差修正模型;高頻數(shù)據(jù)
中圖分類(lèi)號(hào):F820 ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1005-913X(2019)09-0051-03
一、研究背景
國(guó)內(nèi)對(duì)于股指期貨的統(tǒng)計(jì)套利大多停留在日間數(shù)據(jù),而對(duì)于分鐘數(shù)據(jù)等高頻數(shù)據(jù)的研究較少,而高頻數(shù)據(jù)具有交易次數(shù)多,換手頻率快等特點(diǎn)。相比于人為的投資操作,計(jì)算機(jī)的自動(dòng)化操作具有風(fēng)險(xiǎn)小、套利機(jī)會(huì)多等特點(diǎn)?;诖吮尘?,本文選取了上海期貨市場(chǎng)滬銅期貨1907與滬銅1908的5分鐘數(shù)據(jù),希望再期貨合約的高頻交易中使用協(xié)整檢驗(yàn)和誤差修正模型,獲得協(xié)整檢驗(yàn)、誤差修正模型在高頻數(shù)據(jù)的自動(dòng)交易策略。
二、模型及交易策略介紹
(一)建模步驟及模型介紹
1.相關(guān)性檢驗(yàn)。進(jìn)行協(xié)整統(tǒng)計(jì)套利的投資標(biāo)的物之間必須是有相互關(guān)系,要先進(jìn)行相關(guān)性分析,這里選用pearson簡(jiǎn)單相關(guān)系數(shù)。
設(shè)X,Y是兩個(gè)變量,則
其中ρxy為x,y的相關(guān)系數(shù),cov(x,y)為兩者的協(xié)方差,σx,σy為x和y的方差,μX,μY為x,y的均值。
2.平穩(wěn)性檢驗(yàn)。在進(jìn)行時(shí)間序列建模時(shí)必須要求數(shù)據(jù)的時(shí)間序列數(shù)據(jù)平穩(wěn),必須先進(jìn)行平穩(wěn)性檢驗(yàn),單位根檢驗(yàn)是判斷時(shí)間序列平穩(wěn)的重要方法,本文采用ADF檢驗(yàn),ADF檢驗(yàn)為判斷時(shí)間序列是否存在單位根的重要統(tǒng)計(jì)方法之一,如果序列平穩(wěn)則不存在單位根,反之存在單位根。
設(shè)時(shí)間序列的p階滯后項(xiàng)回歸方程為
原假設(shè)H0:=0,存在一個(gè)單位根,對(duì)公式1進(jìn)行OLS回歸可得估計(jì)量及相應(yīng)的t統(tǒng)計(jì)量,t統(tǒng)計(jì)量又被稱(chēng)為ADF統(tǒng)計(jì)量,如果的ADF值小于其ADF統(tǒng)計(jì)量的臨界值,則拒絕原假設(shè),證明原時(shí)間序列存在單位根。
3.單整。如果時(shí)間序列Xt平穩(wěn),則稱(chēng)Xt為零階單整,記為Xt-I(0),如時(shí)間序列前d-1階差分不平穩(wěn),第t階差分為平穩(wěn)序列,則稱(chēng)Xt為t階單整,記為Xt-I(t)。
4.協(xié)整。如果兩個(gè)時(shí)間序列{Xt}和{Yt}是兩個(gè)不平穩(wěn)的時(shí)間序列,但兩個(gè)時(shí)間序列是同階單整的,即:Xt-I(t),Yt-I(t),并且這兩個(gè)序列的線性組合β1Xt+β2Yt是t-j階單整的,記為β1Xt+β2Yt-I(k-j),則稱(chēng){Xt}和{Yt}為(k,j)階協(xié)整。
協(xié)整檢驗(yàn)鐘最常見(jiàn)的方法便是EG兩步法,假設(shè)存在兩個(gè)變量X1t和X2t,需要確定兩個(gè)變量是否具有協(xié)整關(guān)系簡(jiǎn)要步驟可以表示為:
第一步:確定兩個(gè)變量的單整階數(shù)是否一致;
第二步:估計(jì)長(zhǎng)期均衡關(guān)系。假設(shè)兩個(gè)變量X1t、X2t都為1階單整序列,則建立回歸方程:
X1t=β0+β1X2t+εt估計(jì)長(zhǎng)期均衡關(guān)系。估計(jì)的殘差為εt=X1t-β0-β1X2t
第三步:檢驗(yàn)序列是否平穩(wěn),是偏離長(zhǎng)期均衡關(guān)系的利差估計(jì)值,如果這些利差估計(jì)值是平穩(wěn)的則稱(chēng)X1t,X2t是(1,1)階協(xié)整。
5.誤差修正模型。如果兩個(gè)變量是協(xié)整的,那么兩個(gè)變量之間必然存在長(zhǎng)期均衡關(guān)系,但由于市場(chǎng)波動(dòng)及信息不對(duì)稱(chēng)等因素長(zhǎng)期均衡中往往存在著短期偏差,這兩個(gè)變量短期偏離的不均衡現(xiàn)象可以用誤差修正模型描述。誤差修正模型的常用方法有E-G兩步法和直接估計(jì)法:
其中E-G兩步法有:
第一步:根據(jù)協(xié)整檢驗(yàn)的結(jié)果得到{Xt}和{Yt}的協(xié)整方程:
Yt=α0+α1xt+εt ?(1)
則其殘差序列為:
εt =Yt-α0-α1xt (2)
第二步:設(shè){Xt}和{Yt}的短期不均衡關(guān)系為:
△yt=β1△xt+β2ecmt-1+ut (3)
將(2)得到的εt-1替代(3)中的ecmt-1,得到誤差修正方程
△yt=β1△xt+β2(Yt-1-α0-α1xt-1)+ut
之后根據(jù)OLS估計(jì)求出β1、β2的值,β1其中被稱(chēng)為誤差修正系數(shù)。
直接估計(jì)法:
通過(guò)以△yt為因變量,△xt,yt-1,xt-1為自變量直接建立回歸方程構(gòu)建誤差修正模型。
(二)交易策略分析
根據(jù)誤差修正模型可以得出交易時(shí)兩個(gè)期貨商品的對(duì)沖比例。計(jì)算出兩種投資標(biāo)的物價(jià)差的時(shí)間序列記為spread,根據(jù)時(shí)間序列算出spread的均值μ和σ標(biāo)準(zhǔn)差,根據(jù)價(jià)差序列的分布,確定無(wú)套利區(qū)間、套利區(qū)間和止損區(qū)間來(lái)指導(dǎo)交易。這三個(gè)區(qū)間用均值加方差的波動(dòng)來(lái)進(jìn)行劃分。
基本劃分標(biāo)準(zhǔn)為:
第一步:設(shè)閥值:0<φ1<φ2<φ3
第二步:設(shè)立區(qū)間,其中(μ-φ1σ,μ+φ1σ)為無(wú)套利區(qū)間(-∞,μ-φ3σ)及(μ+φ3σ,+∞)為止損區(qū)間,在這兩個(gè)區(qū)間中不持有頭寸。μ±φ2σ為建倉(cāng)點(diǎn)。
第三步:設(shè)立交易步驟,當(dāng)樣本價(jià)差序列向上突破μ+φ2σ,或者從止損區(qū)域(μ+φ3σ,+∞)向下?lián)舸│?φ3σ做多價(jià)差,帶spread價(jià)差序列回歸至μ+φ1σ時(shí)獲利止盈離場(chǎng)或者spread擴(kuò)大至μ+φ3σ時(shí)止損離場(chǎng)。當(dāng)樣本價(jià)差序列spread向下突破μ-φ2σ,或者從止損區(qū)域(-∞,μ-φ3σ)向上突破μ+φ3σ做多價(jià)差,待spread價(jià)差序列回歸至μ-φ1σ時(shí)獲利止盈離場(chǎng),或者spread擴(kuò)大至μ-φ3σ時(shí)止損離場(chǎng)。
其中φ1、φ2、φ3是以歷史最大化收益為原則求出的。
三、實(shí)證分析
本文選取了從2018年5月1號(hào)到2019年5月1號(hào)滬銅1907和滬銅1908的一年的5分鐘交易數(shù)據(jù),其中包括交易時(shí)間、交易量、買(mǎi)賣(mài)價(jià)格等變量。并以交易價(jià)格作為時(shí)間序列進(jìn)行分析,共計(jì)19547個(gè)樣本。本文抽取了所有樣本數(shù)據(jù)的前70%的數(shù)據(jù)進(jìn)行建模,并用后30%的數(shù)據(jù)進(jìn)行回測(cè)。
對(duì)期貨進(jìn)行統(tǒng)計(jì)套利的前提是這兩種期貨商品擁有較強(qiáng)的相關(guān)性,本文先選取滬銅1907與滬銅1908都為銅期貨的兩個(gè)不同的品種,本文希望先通過(guò)兩種數(shù)據(jù)的折現(xiàn)圖和散點(diǎn)圖的分布去探究下兩者的相關(guān)程度,由于高頻數(shù)據(jù)的數(shù)據(jù)量較大,故選取了前200個(gè)點(diǎn)進(jìn)行描述性分析。滬銅1907與1908的折線圖與散點(diǎn)分布圖分別如圖1、圖2所示。
從兩者的散點(diǎn)圖和折現(xiàn)圖可以看出兩種期貨商品之間存在一定的均衡關(guān)系,接著對(duì)兩種期貨商品進(jìn)行相關(guān)性分析:
從相關(guān)分析的表中也可以看出兩種期貨商品的相關(guān)系數(shù)達(dá)到了0.92,具有高度正相關(guān)。
接著對(duì)原序列做平穩(wěn)性檢驗(yàn),并找出兩種商品的單整系數(shù)。具體的ADF檢驗(yàn)結(jié)果如表2所示
從表中可以看出兩者的ADF統(tǒng)計(jì)量分別為-2.22和-2.23,均大于1%、5%、10%的臨界值,在進(jìn)行一階差分以后,兩者的ADF統(tǒng)計(jì)量分別變?yōu)?19.53和-19.55小于1%的臨界值,說(shuō)明滬銅1907與滬銅1908均為一階單整序列。接下來(lái)采用E-G兩步法進(jìn)行協(xié)整檢驗(yàn),先建立回歸方程,回歸方程結(jié)果如表3所示:
由表得出的回歸方程為cu1807=443.9+0.988cu
1808,接著對(duì)回歸方程的殘差進(jìn)行單位根檢驗(yàn),具體結(jié)果如表4所示:
通過(guò)協(xié)整檢驗(yàn)可以知道滬銅1907與滬銅1908具有協(xié)整關(guān)系。接著用直接估計(jì)法建立兩者的誤差修正模型,其中以滬銅1907為因變量,具體結(jié)果如表5所示:
得出的誤差修正模型為:
△cu.1907=237.35+0.95△cu.1908-0.533△cu.1907t-1+0.527△cu.1908t-1+εt
=237.35+0.95△cu.1908-0.533(cu.1907t-1-0.988cu.1908t-1)+εt
error.ecm=cu.1907t-1-0.988cu.1908t-1
其中error.ecm為誤差修正項(xiàng),表明在兩種期貨商品的長(zhǎng)期協(xié)整關(guān)系中,當(dāng)滬銅1907偏離均衡值時(shí)下一期的波動(dòng)值不僅和cu.1908的變動(dòng)值有關(guān)還和兩者的誤差修正項(xiàng)有關(guān),其修正的速度為-0.53,基于此得出的協(xié)整向量位(1,-0.988),表明進(jìn)行修正時(shí)兩種產(chǎn)品的對(duì)沖比例為1:0.98,表明在進(jìn)行統(tǒng)計(jì)套利時(shí)做多一手滬銅1907時(shí)也要做空0.98手滬銅1908,同理做空一手滬銅1907,也要做多0.988手滬銅1908。
從而可以建立兩個(gè)期貨品種的樣本內(nèi)對(duì)沖價(jià)差時(shí)間序列spreadt=cu.1907-0.988cu.1908。
根據(jù)樣本內(nèi)的價(jià)差序列,得出樣本內(nèi)價(jià)差時(shí)間序列的均值為0.105,方差為1.33×10-7,根據(jù)樣本內(nèi)價(jià)差的均值和方差,按照上面所寫(xiě)的投資策略制定無(wú)套利、套利和止損區(qū)間。抽取了歷史數(shù)據(jù)的后三個(gè)月六千樣本作為測(cè)試數(shù)據(jù),用r語(yǔ)言自己編寫(xiě)回測(cè)函數(shù),以歷史數(shù)據(jù)的收益最大化為約束條件求出三個(gè)區(qū)間的閾值φ1=0.4、φ2=1.5、φ3=3.3,每次交易的交易費(fèi)用按10元計(jì)算,初始資金以滬銅1907與滬銅1908的一手的資金總和計(jì)算,前500個(gè)數(shù)據(jù)的價(jià)差走勢(shì)圖及回測(cè)總體累計(jì)收益數(shù)分別如圖3與圖4所示。
可以看出基于誤差修正模型得出的套利策略在前3000時(shí)套機(jī)機(jī)會(huì)較多,隨著時(shí)間的推移大約在4000期以后套利的機(jī)會(huì)開(kāi)始逐漸降低。最后根據(jù)模型得出的收益數(shù)按照全年240個(gè)交易日,得出年化收益率、最大回撤、最長(zhǎng)持倉(cāng)時(shí)間等模型回測(cè)指標(biāo),具體結(jié)果見(jiàn)回測(cè)結(jié)果匯總表。
根據(jù)回測(cè)結(jié)果匯總表可以看出基于誤差修正模型得出的套利策略在測(cè)試數(shù)據(jù)中得到了29.67%的年收益率,期間共套利360次。
四、結(jié)論與建議
通過(guò)本文的實(shí)踐證明,在期貨市場(chǎng)上運(yùn)用誤差修正模型去進(jìn)行統(tǒng)計(jì)套利是可行的,并且相比于股票市場(chǎng)中日交易數(shù)據(jù),統(tǒng)計(jì)套利更適用于基于高頻交易數(shù)據(jù)去實(shí)現(xiàn)程序化、自動(dòng)化交易,但是也可以看出高頻數(shù)據(jù)也具有交易次數(shù)頻繁,波動(dòng)劇烈等特點(diǎn),并且期貨市場(chǎng)上需要的入市資金過(guò)高,更適用于大額資金的投資者。
參考文獻(xiàn):
[1] Engle R F,Granger C W J.Cointegration and error correction:reprensenation,estimation and testing[J].Econometvica, 1987(2).
[2] Burgess A N,Refense A N.1996a.Modelling non-linear cointegration in intenational equity index futrues[C].Netural Networks in Financial Engineering.World Scientific,Singapore,1996:50-63.
[3] 仇中群.基于協(xié)整的股指期貨套利研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2009.
[4] 蔡志成.基于協(xié)整分析的統(tǒng)計(jì)套利策略研究[D].杭州:杭州電子科技大學(xué),2014.
[5] 趙 華.時(shí)間序列數(shù)據(jù)分析——R軟件應(yīng)用[M].北京:清華大學(xué)出版社,2016.
[責(zé)任編輯:譚志遠(yuǎn)]