鄭 列,鄭倫濤,徐 斌 (湖北工業(yè)大學理學院, 湖北 武漢 430068)
基于Copula函數(shù)的滬深綜指相關(guān)性分析
鄭 列,鄭倫濤,徐 斌 (湖北工業(yè)大學理學院, 湖北 武漢 430068)
將Copula理論與t-GARCH模型結(jié)合在一起,利用各種統(tǒng)計軟件作參數(shù)估計和檢驗,通過計算機模擬和計算, 對滬深綜指的相關(guān)性進行了分析。研究結(jié)果表明,滬深綜指之間存在很強的正向風險關(guān)聯(lián)性,滬深收益率走勢具有相同的方向。
Copula函數(shù);t-GARCH模型;Kendall秩相關(guān)系數(shù); Spearman秩相關(guān)系數(shù)
在對金融資產(chǎn)收益率進行研究時,一個重要的問題是當收益率非正態(tài)時,怎么測度股市之間的相關(guān)性。在GARCH模型的框架中,一些最新研究都集中在具有厚尾非對稱多元分布,比如多遠偏態(tài)分布,特別是偏態(tài)Student-t分布[1]。對于大多數(shù)的單變量分布來說,在需要考慮描述相關(guān)結(jié)構(gòu)時不可能精確擴展到多變量情形。而且,現(xiàn)在廣泛使用的大多數(shù)風險管理模型都有這樣或那樣的缺陷。如很多模型假設多個資產(chǎn)收益序列或風險因子的聯(lián)合分布服從多元正態(tài)分布,但這種假設經(jīng)常與金融市場的實際情況不相符,故在正態(tài)分布假設下進行的資產(chǎn)組合的風險分析和對風險價值VaR(Value at Risk,VaR)的計算與實際情況的誤差比較大[2]。為此,筆者引入Copula函數(shù)來測度GARCH背景下的條件依賴。Copula函數(shù)提供了一種在僅僅已知邊際分布時對多元分布建模的有用方法,這種方法在多元分布不是正態(tài)分布的情形時特別有用。
定義1[3]對所有的t,t∈I=[0,1],如果一個二元函數(shù)C:I2→I,滿足:①C(t,0)=C(0,t)=0,C(t,1)=C(1,t)=t;②對任意的u1,u2,v1,v2∈I(u1≤u2,v1≤v2)有:
C(u2,v2)-C(u2,v1)-C(u1,v2)+C(u1,v1)≥0
則稱C為(二元)Copula函數(shù)。Copula函數(shù)是一個邊緣在[0,1]上均勻分布的二元分布函數(shù)在I2上的限制。
定義2[3]對所有的(u1,u2,…,un)∈In=[0,1]n,如果一個n元函數(shù)C:In→I,滿足:①C對它的每一個變量都是遞增的;②C的邊緣分布Ci滿足:Ci(ui)=C(1,…,1,ui,1,…,1)=ui,其中ui∈[0,1],i=1,…,n;則稱C為n元Copula函數(shù)。
考慮隨機變量X1和X2,其邊際累積分布函數(shù)和聯(lián)合累積分布函數(shù)分別為:
Fi(xi)=P(Xi≤xi)i=1,2H(x1,x2)=P(X1≤x1,X2≤x2)
所有的累積分布函數(shù)取值區(qū)間為[0,1],在一些情形下,存在多元分布函數(shù),所以函數(shù)H(x1,x2)能夠得到精確的表達式,像多元正態(tài)分布就是如此。然而在很多情況下,邊際分布函數(shù)Fi(xi)相對來說比較容易求得,它們的聯(lián)合分布函數(shù)H(x1,x2)的精確表達式很難獲得。
引理1(Sklar定理[4]) 設隨機變量x1,x2,…,xN的聯(lián)合分布函數(shù)是H(x1,x2,…,xN),邊緣分布函數(shù)分別是F1(x1),F2(x2),…,FN(xN),則存在Copula函數(shù)C,對任意實數(shù)x1,x2,…,xN,有:
H(x1,x2,…,xN)=C(F1(x1),F2(x2),…,FN(xN))
如果Fi(xi)(i=1,2,…,N)是連續(xù)函數(shù),則C唯一。
由Sklar定理知道,任何一個n維的分布函數(shù)可以被它們的邊際分布函數(shù)和一個相應的Copula函數(shù)唯一確定。
通過Copula函數(shù)C的密度函數(shù)c和邊緣分布F1(x1),F2(x2),…,FN(xN),可以很容易地求出N元聯(lián)合分布函數(shù)H(x1,x2,…,xN)的密度函數(shù):
應用Copula函數(shù)來對金融數(shù)據(jù)建模,一般分2步進行:首先要確定邊際分布,然后是選擇一個合適的Copula函數(shù)來測度邊際分布的相關(guān)性。其中確定邊際分布是構(gòu)建Copula模型的前提。
圖1 樣本密度函數(shù)
筆者所使用上海證券交易所的上證綜指和深圳證券交易所的深證綜指每日收益率數(shù)據(jù)取自RESSET金融研究數(shù)據(jù)庫(銳思數(shù)據(jù)),時間范圍是1995-12-08到2011-09-30共17年 (3839個交易日) 的日收益率數(shù)據(jù),所用的分析工具是Matlab R2009a。利用Matlab畫出樣本密度函數(shù),如圖1所示。
一般GARCH(1,1)模型就能夠滿足建模要求,但從圖1中可看出分布有厚尾的特性,而t-GARCH過程可以更好的描述時間序列的高峰、厚尾等分布特性,因此在這里選用t-GARCH模型來描述金融收益序列的條件邊緣分布。采用極大似然估計法對各收益率序列的邊緣分布進行估計,結(jié)果如表1所示(表1中各個變量含義見參考文獻[3])。
表1 邊緣分布模型的參數(shù)估計及檢驗結(jié)果
表1中的K-S統(tǒng)計量及其概率值表明,對各序列都不能拒絕零假設:“變換后的收益率序列服從U(0,1)分布”。對變換后的2個序列做自相關(guān)檢驗,可以知道變換后的2個序列均不存在自相關(guān),因而可以將變換后的序列均看成是獨立的。K-S統(tǒng)計量和自相關(guān)檢驗表明[3],根據(jù)t- GARCH(1,1)模型估計得到的邊緣分布,對原序列做概率積分變換后得到的序列均服從獨立同分布U(0,1)。說明t- GARCH(1,1)模型可以比較好地擬合2個序列的邊緣分布,用它來描述它們的收益率序列的邊緣分布是恰當?shù)摹?/p>
另外,對于t分布來說,t分布尾部的形狀取決于分布自由度v的值,自由度v的值越大,分布的尾部就越薄。由表1中自由度v的估計值可以看出,2個樣本的自由度不相等, 但已知的二元分布一般都要求隨機變量具有相同的邊緣分布,所以很難應用現(xiàn)有的二元分布來擬合2個具有不同自由度的樣本,因而不能簡單的假定2個樣本的聯(lián)合分布服從一個特定的二元分布。
圖2 聯(lián)合分布散點圖 圖3 化為[0,1]區(qū)間上的聯(lián)合分布散點圖
利用Matlab的核密度估計工具箱做二維核密度估計。筆者選用二元Copula函數(shù)來作擬合,計算步驟如下:
步1 取上證綜指的1990~2010年的日收益率樣本為{Xi},深證綜指的1990~2010年的日收益率樣本為{Yi},利用Matlab的scatterhist命令作出序列的散點圖(見圖2)。
步2 將步1得到的散點圖進一步轉(zhuǎn)化為[0,1]區(qū)間上的概率分布值(聯(lián)合分布散點圖見圖3):
u = ksdensity(x,x,’function’,’cdf’);
v = ksdensity(y,y,’function’,’cdf’);
scatterhist(u,v)
xlabel(’u’)
ylabel(’v’)
步3 利用Matlab中copulafit和copulacdf命令分別得到將概率分布值用選定的Copula函數(shù)連接得到的Copula分布函數(shù)值和t-Copula函數(shù)的參數(shù)及Kendall秩相關(guān)系數(shù)τ值(0.8475)。程序代碼片段如下:
[RHOHAT,nuhat,nuci] = copulafit(’t’,[u v])
R = copulastat(’t’,rho,NU)
圖4 t-Copula函數(shù)模擬得到的散點圖 圖5 t-Copula函數(shù)聯(lián)接得到的分布函數(shù)圖
步4 利用Matlab中copularnd命令得到聯(lián)合分布的隨機模擬數(shù)據(jù)(見圖4)。程序代碼片段如下:
t:r = copularnd(’t’,RHOHAT,nuhat,1000);
u1= r(:,1);
v1= r(:,2);
scatterhist(u1,v1)
xlabel(’u’)
ylabel(’v’)
x1=ksdensity(u,u1,’function’,’icdf’);
y1=ksdensity(v,v1,’function’,’icdf’);
scatterhist(x1,y1)
畫出二元t-Copula函數(shù)連接得到的分布函數(shù)(見圖5)。
由前面的計算結(jié)果可知,Kendall秩相關(guān)系數(shù)為0.8475.表明t-Copula擬合滬深兩市的綜合指數(shù)是合適的。
由二元t-Copula的Kendall秩相關(guān)系數(shù)公式和Spearman秩相關(guān)系數(shù)公式:
計算得出如下結(jié)果:Spearman秩相關(guān)系數(shù)ρ(0.8767)和Kendall秩相關(guān)系數(shù)τ(0.8475)的值均大于0.4,表明滬深綜指之間存在很強的正向風險關(guān)聯(lián)性,滬深收益率走勢具有相同的方向[4]。ρ值顯著大于0說明條件方差所表現(xiàn)出的風險立即在預期收益率中得到反映,表明了我國股市的風險傳遞機制在不斷地發(fā)揮作用。同時,正的ρ值也意味著我國股市投資者的風險意識在不斷增強,對風險的增加則要求有相應的風險補償,股價波動不僅僅給投資者帶來了風險,同時它所補償?shù)娘L險溢價是重要的收益來源。
[1]Hansen B E. Autoregressive conditional density estimation[J]. International Economic Review,1994,35(3):705-730.
[2]韋艷華,張世英,郭焱.金融市場相關(guān)程度與相關(guān)模式的研究[J].系統(tǒng)工程學報,2004,19(4):361-368.
[3] Nelsen R B.An Introduction to Copulas,Lectures Notes in Statistics[M].New York:Springer- Verlag Berlin Heidelberg,1998:49-158.
[4]Andersen T G, Bollerslev T, Francis X, et al. Modeling and forecasting realized volatility[J]. Econometrica,2003, 71(2):579-625.
2012-11-25
湖北省自然科學基金項目(2011CDB081)。
鄭列(1963-),男,碩士,教授,現(xiàn)主要從事應用數(shù)學方面的教學與研究工作。
O211.67
A
1673-1409(2013)04-0021-04
[編輯] 洪云飛