閆中義, 李新民
(青島大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 山東 青島 266071)
?
Copula函數(shù)的選擇及股票市場(chǎng)的相關(guān)性研究
閆中義, 李新民
(青島大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 山東 青島 266071)
摘要:Copula函數(shù)能夠完整地刻畫變量間的相關(guān)關(guān)系,在股票市場(chǎng)中用Copula函數(shù)來(lái)描述股票之間的相關(guān)性被廣泛應(yīng)用.本文從6種Copula模型入手,對(duì)基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法和基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)方法進(jìn)行了對(duì)比分析,研究其在模型選擇上的準(zhǔn)確性,并將其應(yīng)用到平安銀行和交通銀行兩支股票中,發(fā)現(xiàn)與模擬結(jié)果相一致.
關(guān)鍵詞:股票; Copula函數(shù); 擬合優(yōu)度檢驗(yàn); 似然準(zhǔn)則; 參數(shù)自助
在金融市場(chǎng)中,股票的收益率關(guān)系日趨復(fù)雜,其相關(guān)性研究是研究金融市場(chǎng)關(guān)聯(lián)性的重要內(nèi)容.利用Copula函數(shù)作為工具對(duì)股票進(jìn)行相關(guān)性分析有其特有的優(yōu)勢(shì),因?yàn)镃opula函數(shù)能夠?qū)⑦吘壏植寂c聯(lián)合分布分開(kāi)來(lái)研究,并且在隨機(jī)變量作單調(diào)變換后保持變量間的相關(guān)性不變.Bouye[1],Durrleman和Nikeghbali[2]等人系統(tǒng)地介紹了Copula在金融市場(chǎng)中的一些應(yīng)用.
Copula是一個(gè)函數(shù),它主要用來(lái)描述隨機(jī)變量之間的相關(guān)性.Sklar[3]于1959 年首次提出 Sklar 定理并建立Copula函數(shù)理論.根據(jù)Sklar定理,利用Copula理論建立模型的關(guān)鍵有兩步:首先要確定好邊緣分布;其次找一個(gè)能很好地描述邊緣分布的相關(guān)結(jié)構(gòu)的Copula函數(shù).目前Copula函數(shù)在實(shí)際應(yīng)用中的一個(gè)主要問(wèn)題是函數(shù)形式的選擇.Embrechts[4]對(duì)不同的Copula函數(shù)模型進(jìn)行了比較研究,發(fā)現(xiàn)采用不同形式的Copula模型可能導(dǎo)致不同的分析結(jié)果. 因此在描述股票間的相互關(guān)系時(shí)選擇合理的Copula函數(shù)模型尤為重要.
目前主要根據(jù)以下幾種思路來(lái)選擇合理的Copula函數(shù):(1)從金融市場(chǎng)相關(guān)性角度出發(fā),通過(guò)分析常用Copula函數(shù)的特點(diǎn)來(lái)進(jìn)行選擇;(2)根據(jù)各種信息準(zhǔn)則,從給定的集合中選取較為合適的Copula;(3)通過(guò)Copula的擬合優(yōu)度檢驗(yàn)選擇最優(yōu)的Copula來(lái)描述變量間的相關(guān)模式[5];(4)利用似然函數(shù)準(zhǔn)則,提出的基于參數(shù)bootstrap的模型選擇方法[6].
對(duì)于上述方法,已有文獻(xiàn)對(duì)前2種方法進(jìn)行了對(duì)比分析,但尚未見(jiàn)到對(duì)后2種方法的對(duì)比分析.本文通過(guò)對(duì)比基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)和基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)兩種Copula函數(shù)的選擇方法進(jìn)行分析和模擬研究,選出最優(yōu)的Copula來(lái)描述它們之間的相關(guān)關(guān)系.平安銀行(000001.SZ)和交通銀行(601328.SS)的股票收益率具有較強(qiáng)的相關(guān)性,本文選擇這兩種股票的Copula函數(shù)對(duì)這兩種股票從2014年4月4日到2015年5月29日共301對(duì)交易日的原始數(shù)據(jù)進(jìn)行分析研究,從而使購(gòu)買者能夠根據(jù)其關(guān)聯(lián)性,優(yōu)化投資決策,也希望為相關(guān)部門提高股票市場(chǎng)的運(yùn)行效率及監(jiān)管提供重要的現(xiàn)實(shí)參考依據(jù).
1Copula理論
根據(jù)Sklar定理,設(shè)隨機(jī)變量(X1,X2)的聯(lián)合分布函數(shù)為
F(x1,x2)=C(F1(x1),F2(x2))
F1(x1),F2(x2)是(0,1)上的均勻分布函數(shù).這樣是為了避免計(jì)算上的復(fù)雜,因?yàn)槠渌倪吘壏植嫉倪x擇在本質(zhì)上不會(huì)改變結(jié)論.
聯(lián)合對(duì)數(shù)似然函數(shù)的具體形式為
式中c為Copula函數(shù)的密度函數(shù),ui,vi,i=1,…,n為樣本值.最佳的Copula就是能使聯(lián)合對(duì)數(shù)似然函數(shù)達(dá)到最大時(shí)所對(duì)應(yīng)的Copula.
Kendall’s tau 是隨機(jī)變量關(guān)于Copula的一個(gè)非參度量.它表示兩個(gè)相互獨(dú)立的向量的同向?qū)彤愊驅(qū)Ω怕首霾?,即如?X1,Y1)和(X2,Y2)是獨(dú)立同分布的隨機(jī)向量,那有
Pr[(X1-X2)(Y1-Y2)<0]
Kendall’s tau同樣可以表示成Copula函數(shù)的形式
隨機(jī)變量u,v在(0,1)上均勻分布,C是它的連接分布函數(shù).對(duì)于阿基米德Copula,Kendall’s tau 能夠?qū)懗?/p>
2基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法
參數(shù)自助的方法[7]是當(dāng)樣本總體的分布函數(shù)形式已知時(shí),可以通過(guò)極大似然或Kendall’s tau 等方法來(lái)得到參數(shù)的估計(jì)值,然后重復(fù)抽樣.基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法的基本做法是利用已知的Copula產(chǎn)生隨機(jī)樣本,即“原始數(shù)據(jù)”,然后用待選的Copula去擬合,并重復(fù)抽樣,計(jì)算每次的最大似然函數(shù)值.最后,利用原始數(shù)據(jù)的似然值與擬合的似然平均值構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.那么能夠提供最接近樣本值的似然函數(shù)值所對(duì)應(yīng)的Copula函數(shù)就是所要找的最佳Copula函數(shù).具體做法如下:
(1)選定一個(gè)Copula函數(shù),產(chǎn)生n組隨機(jī)數(shù),構(gòu)成原始數(shù)據(jù)(U1,U2,…,Un).
3基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)方法
Copula的擬合優(yōu)度檢驗(yàn)[9]的執(zhí)行都是基于經(jīng)驗(yàn)Copula的過(guò)程:
(1)
Cn是經(jīng)驗(yàn)Copula
(2)
Cθn是在假設(shè)H0:C∈{Cθ}成立的條件下C的一個(gè)估計(jì).式(1)中的θn是θ基于秩的估計(jì).檢驗(yàn)統(tǒng)計(jì)量為
Sn=∫[0,1]dn(u)2dCn(u)=
(3)
基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)的近似p值可以用如下過(guò)程得到:
(3)用每一個(gè)Copula模型去計(jì)算式(3)中檢驗(yàn)統(tǒng)計(jì)量Snj,j=1,…,m.
(4)重復(fù)如下步驟,對(duì)每個(gè)k∈{1,…,B},
(c)計(jì)算Snj,j=1,…,m的一個(gè)漸近獨(dú)立實(shí)現(xiàn):
4模擬比較
下面選取6種常用的Copula模型(見(jiàn)表1),用R軟件進(jìn)行模擬實(shí)驗(yàn)來(lái)比較這兩種方法的檢驗(yàn)?zāi)芰?
表1不同Copula模型的τ和θ
Copula類型C(u,v)τθGumbelexp{-[(-lnu)1/θ+(-lnv)1/θ]θ}1-θ[1,?)Frank-1θlog{1+(e-θu-1)(e-θv-1)e-θ-1}1-4θ+4D1θ()θ-?,?()/0{}Clayton(u-θ+v-θ-1)-1/θθθ+2[0,?)NormalΦθ(Φ-1(u),Φ-1(v);ρ)2πarcsinθ[-1,1]Plackett[1+(θ-1)(u+v)]2(θ-1)-[1+(θ-1)(u+v)]2-4uvθ(θ-1)2(θ-1)無(wú)具體表達(dá)式(0,+?)/{1}tT2(T-1ν(u1),T-1ν(u2);ρ,ν)2πarcsinθ(-1,1)
對(duì)原始數(shù)據(jù)的樣本值,考慮4種秩相關(guān)系數(shù),τ=0.2,τ=0.4,τ=0.6,τ=0.8,重復(fù)B=1 000次,產(chǎn)生樣本容量為n=300的模擬數(shù)據(jù).為了簡(jiǎn)單起見(jiàn),把Gumbel,F(xiàn)rank,Clayton,Normal,Plackett,t(v=4)簡(jiǎn)寫為G,F(xiàn),C,N,P,t.原假設(shè)為“當(dāng)數(shù)據(jù)來(lái)自其它的Copula函數(shù)時(shí),待檢驗(yàn)的Copula函數(shù)能夠擬合這些數(shù)據(jù)”.當(dāng)p值≥0.05時(shí),說(shuō)明接受原假設(shè),即所對(duì)應(yīng)的Copula函數(shù)就是我們所要找的Copula.
從表2中可以得出,對(duì)于檢驗(yàn)水平為0.05,當(dāng)相關(guān)系數(shù)非常小即0.2時(shí),兩種方法都無(wú)法識(shí)別出原始數(shù)據(jù)所來(lái)源的Copula,但當(dāng)相關(guān)系數(shù)為0.6,0.8的時(shí)候,基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法的優(yōu)勢(shì)就顯現(xiàn)出來(lái)了,除了Normal在0.6的時(shí)候沒(méi)識(shí)別出來(lái)外,其他Copula均能準(zhǔn)確識(shí)別.而基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)方法在這種情況下只能識(shí)別出Clayton來(lái),其他Copula都無(wú)法準(zhǔn)確識(shí)別.
表2不同Copula函數(shù)結(jié)構(gòu)下兩種方法的平均p值
真Copula備選Copula似然準(zhǔn)則方法所對(duì)的τ擬合優(yōu)度檢驗(yàn)所對(duì)的τ0.20.40.60.80.20.40.60.8GumbelG0.2550.5260.6720.5850.2010.4230.4460.441F0.0150000.1380.0490.0140.008C0.0300000.0150.0050.0050.005N0.0340.0130.00100.1060.0990.0490.068P0.0120.001000.0830.0450.0300.027t0.1120.0890.01900.1230.1340.0650.082FrankG0.1410.008000.1240.1220.0300.032F0.4430.6140.6770.5570.5830.7350.4760.393C0.1130000.1200.0050.0050.005N0.2140.235000.3470.4080.0720.035P0.4780.3820.02800.3990.5720.2550.129t0.1680.010000.2110.2020.0270.021ClaytonG0.0170000.0140.0050.0050.005F0.0870000.2360.0080.0050.005C0.5540.4920.3210.4510.3880.4310.3500.496N0.0840000.1200.0110.0060.006P0.1110000.1170.0060.0060.006t0.0710000.0920.0080.0070.005NormalG0.1810.1440.00600.1870.2240.1620.185F0.2090.0460.00300.3500.3710.0970.042C0.0680000.0250.0050.0050.005N0.2760.5550.4250.2990.3150.6040.6240.301P0.1830.0430.0040.0010.2500.3680.2950.164t0.1000.1340.0710.0390.3010.4880.5580.284PlackettG0.3370.009000.2290.0560.0580.066F0.6520.4840.00200.7620.5160.2560.100C0.0920000.1310.0070.0050.005N0.4510.124000.4140.2680.2050.131P0.6260.7260.7420.5710.5440.4500.4150.403t0.1180.0420.00300.3030.2230.2140.140tG0.0010.006000.0450.1710.1200.173F00000.1040.1620.0590.018C00000.0230.0060.0050.005N00.0200.0030.0010.0700.1520.4010.370P0.0010.0080.0040.0010.0380.1790.2200.259t0.1280.5280.5620.5560.1500.2900.4810.409
5實(shí)例論證
選取了平安銀行(000001.SZ)和交通銀行(601328.SS)從2014年4月4日到2015年5月29日,共301對(duì)交易日的原始數(shù)據(jù)(見(jiàn)圖1),對(duì)這301對(duì)交易日的收盤數(shù)據(jù)取對(duì)數(shù)收益率,然后利用經(jīng)驗(yàn)分布得到300對(duì)在(0,1)上的數(shù)據(jù),構(gòu)成我們的數(shù)據(jù)(見(jiàn)圖2).利用G,F(xiàn),C,N,P,t6種Copula來(lái)擬合,經(jīng)計(jì)算,這兩只股票對(duì)數(shù)收益率的相關(guān)系數(shù)τ=0.59,整體上具有較強(qiáng)的相關(guān)性.
圖1301對(duì)交易日的收盤數(shù)據(jù)
圖2300對(duì)(0,1)上的數(shù)據(jù)
設(shè)Ct表示第t日的收盤價(jià),并令πt表示相應(yīng)的日對(duì)數(shù)收益率,有
πt=100(lnCt-lnCt-1)
表3兩種方法的平均p值
GFCNPt似然準(zhǔn)則00000.0210.202擬合優(yōu)度0.0050.0050.0050.0050.0050.005
從表3可以看出,基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法表明平安銀行和交通銀行這兩支股票的關(guān)系用自由度為4的tCopula來(lái)描述非常合適.而基于參數(shù)自助擬合優(yōu)度檢驗(yàn)的方法無(wú)法識(shí)別.又由表2的模擬和分析結(jié)果可知,當(dāng)相關(guān)系數(shù)為0.6時(shí),基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法能夠很好識(shí)別除Normal外的其他Copula;而基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)方法在這種情況下只能識(shí)別出Clayton來(lái),其他Copula都無(wú)法準(zhǔn)確識(shí)別.因此,平安銀行和交通銀行這兩支股票的對(duì)數(shù)收益率可用自由度為4的tCopula來(lái)描述.
所以當(dāng)兩支股票相關(guān)性較強(qiáng)時(shí),對(duì)Copula函數(shù)的選擇用基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法比較好.
6結(jié)束語(yǔ)
本文通過(guò)模擬比較和實(shí)例論證,對(duì)比了基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法和基于參數(shù)自助的擬合優(yōu)度檢驗(yàn)方法,發(fā)現(xiàn)基于參數(shù)自助的似然準(zhǔn)則檢驗(yàn)方法在數(shù)據(jù)之間相關(guān)性較強(qiáng)的情形下,檢驗(yàn)結(jié)果很穩(wěn)定并且識(shí)別率高,這樣我們就可以根據(jù)一支股票的走勢(shì)而推斷出另一支股票的走勢(shì)來(lái),是一個(gè)非常好的Copula模型的選擇方法.用這個(gè)方法做參考,股票投資者就可以合理地搭配自己所購(gòu)買的股種,進(jìn)行優(yōu)化投資.
參考文獻(xiàn):
[1]BouyéE,DurrlemanV,NikeghbaliA,etal.Copulasforfinance:Areadingguideandsomeapplications[J].SsrnElectronicJournal, 2000.
[2]DurrlemanV,NikeghbaliA,RoncalliT.Whichcopulaistherightone?[J].SsrnElectronicJournal, 2000.
[3]SklarM.Fonctionsderépartitionàndimensionsetleursmarges[J].Publ.inst.statist.univ.paris, 1959, 8(1):229-231.
[4]EmbrechtsP,LindskogF,McneilEJ.Modellingdependencewithcopulasandapplicationstoriskmanagement[J].HandbookofHeavyTailedDistributionsinFinance, 2003,1(8):329-384.
[5]FermanianJD.Goodness-of-fittestsforcopulas[J].JournalofMultivariateAnalysis, 2005, 95(1):119-152.
[6]NikoloulopoulosAK,KarlisD.Copulamodelevaluationbasedonparametricbootstrap[J].ComputationalStatistics&DataAnalysis, 2008, 52(7):3 342-3 353.
[7] 吳建華, 王新軍, 張穎. 相關(guān)性分析中Copula函數(shù)的選擇[J]. 統(tǒng)計(jì)研究, 2014 , 31(10):99-107.
[8]MardiaK,KentJ,BibbyJ.Multivariateanalysis[M].London:AcademicPress, 1979.
[9]KojadinovicI,YanJ.ModelingmultivariatedistributionswithcontinuousmarginsusingthecopulaRpackage[J].JournalofStatisticalSoftware, 2010, 34(9):1 346-1 352.
(編輯:郝秀清)
The selection of Copula model and the correlation analysis in stock market
YAN Zhong-yi, LI Xin-min
(College of Mathematics, Qingdao University, Qingdao 266071, China)
Abstract:The copula function could describe the correlation between several variables, so the model selection of copulas is particularly important. In this article, we select six kinds of copulas. The method of likelihood criterion based on parametric bootstrap and the method of goodness-of-fit test based on parametric bootstrap are used to compare the accuracy of model selection. We also use the two methods to test the relationship of PingAn stock and JiaoTong stock, and find that the result is same as results of simulation.
Key words:stock; Copula; goodness of fit tests; likelihood criterion; parametric bootstrap
中圖分類號(hào):O212
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1672-6197(2016)03-0042-04
作者簡(jiǎn)介:閆中義,女,447468203@qq.com; 通信作者:李新民,男,xmli@qdu.edu.cn
基金項(xiàng)目:山東省自然科學(xué)基金項(xiàng)目(ZR2014AM019)
收稿日期:2015-07-07