李述山
(山東科技大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,山東 青島 266590)
時間序列分析在自然科學(xué)、管理科學(xué)和社會、經(jīng)濟(jì)、金融等領(lǐng)域具有廣泛應(yīng)用,針對平穩(wěn)時間序列,經(jīng)典的線性模型是自回歸滑動平均模型(ARMA),這些線性模型的最大優(yōu)點是簡單并且只要不多的參數(shù)就能很好地擬合平穩(wěn)時間序列。但是這些模型只能部分地利用時間序列不同期間的線性相關(guān)性信息,而不能利用非線性相關(guān)性信息,也無法解釋金融統(tǒng)計及一般經(jīng)濟(jì)學(xué)中觀察到的“波動集聚性”、分布的“厚尾”等現(xiàn)象,不能刻畫條件異方差性,為此恩格爾等發(fā)展了條件異方差類模型[1]以解釋上述現(xiàn)象,然而,這些模型同樣無法充分地利用時間序列中蘊(yùn)含的非線性相關(guān)信息。
Copula理論[2,3]在非線性相依性分析[4]、金融風(fēng)險管理[5-7]、資產(chǎn)組合優(yōu)化[8,9]、非線性回歸預(yù)測[10]等方面具有廣泛的應(yīng)用。本文通過對嚴(yán)平穩(wěn)序列有限維分布族的相關(guān)結(jié)構(gòu)的研究提出了Copula相依序列的概念,對Copula相依序列的性質(zhì)進(jìn)行了探討,研究了Copula相依序列與嚴(yán)平穩(wěn)序列之間的關(guān)系。針對Copula相依序列,以Copula與Pair-Copula為工具建立了一類新的非線性模型——Copula自回歸模型,該模型能夠更充分地利用序列中的非線性相關(guān)信息。探討了模型的參數(shù)估計方法、相依階數(shù)的確定方法,給出基于Copula自回歸模型的點預(yù)測、區(qū)間預(yù)測方法以及時變風(fēng)險估計方法。并以實際算例說明Copula自回歸模型的有效性。
首先由嚴(yán)平穩(wěn)序列的定義及Copula理論可知引理1及引理2。
引理1:設(shè){Xt,t∈N}為一嚴(yán)平穩(wěn)序列,具有相同的一維分布密度 f(x)及一維分布函數(shù)F(x),則:
(1)對任意正整數(shù)m,存在唯一的m+1元Copula函數(shù) Cm,1(相應(yīng)的 Copula密度函數(shù)為 cm,1),使得 (Xt-m,Xt-m+1,···,Xt)的聯(lián)合分布函數(shù)與聯(lián)合密度函數(shù)不依賴于t,分別為:
(2)對 任 意 正 整 數(shù) k<m ,Cm,1(1, ···1,u1,···,
(3)在 (Xt-m,···,Xt-1)=(x1,···,xm)條件下,Xt的條件密度函數(shù)不依賴于t,且為:
(4)在 (Xt-m,···,Xt-1)=(x1,···,xm)條件下,Xt-m-1的條件密度函數(shù)不依賴于t,且為:
引理2:設(shè){Xt,t∈N}為一嚴(yán)平穩(wěn)序列,具有相同的一維分布密度 f(x)及一維分布函數(shù)F(x),則:
(1)對任意正整數(shù)m及l(fā),存在唯一的m+1元Copula函數(shù) Cm,-l( cm,-l為相應(yīng)的 Copula 密度函數(shù))使得(Xt-m-l,Xt-m,Xt-m+1,···,Xt-1)的聯(lián)合分布函數(shù)與聯(lián)合密度函數(shù)不依賴于t,分別為:
(2)在 (Xt-m,···,Xt-1)=(x1,···,xm)條件下,Xt-m-l的條件密度函數(shù)不依賴于t,且為:
在時間序列的建模中,如何充分地利用時間序列以前(t-1及其以前)的信息對將來(t及以后)進(jìn)行點預(yù)測、區(qū)間預(yù)測等統(tǒng)計推斷是建立時間序列模型的關(guān)鍵,如果在已知Xt的若干個滯后期的取值信息的條件下,Xt與其他滯后期無關(guān),那么,這些滯后期包含了所有滯后期中包含的關(guān)于Xt的信息,從而利用這些滯后期的信息可以對Xt進(jìn)行優(yōu)良的統(tǒng)計推斷,為此本文提出如下Copula相依序列的概念。
定義1:設(shè){Xt,t∈N}為一隨機(jī)序列,具有相同的一維分布密度 f(x),若存在正整數(shù)k使得:
(1)對任意的 t>k,t∈N ,(Xt-k,Xt-k+1,···,Xt)具有相同的Copula函數(shù);
(2)在 (Xt-k+1,···,Xt-1)已知條件下,Xt與 Xt-k不條件獨立;
(3)對任意的 l>0,在 (Xt-k,···,Xt-1)已知條件下,Xt與Xt-k-l條件獨立,
則稱{Xt,t∈N}為 k 階Copula相依序列(CDS(k)),正整數(shù)k稱為相依階數(shù)。所有k(k≥1)階Copula相依序列統(tǒng)稱為Copula相依序列(CDS)。
由定義1可以看出,若{Xt,t∈N}為 k階Copula相依序列(CDS),則有:
(4)對任意的 t>k,t∈N ,(Xt-k,Xt-k+1,···,Xt)具有相同分布,且不依賴t;
(5)對任意的 l>0,在 (Xt-k,···,Xt-1)已知條件下,Xt與 (Xt-k-1,···,Xt-k-l)條件獨立。
由定義1、引理1、引理2及數(shù)學(xué)歸納法易知定理1及定理2。
定理1:若{Xt,t∈N}為嚴(yán)平穩(wěn)隨機(jī)序列,且滿足定義1中的條件(2)及條件(3),則{Xt,t∈N}為 k階Copula相依序列。
定理2 :{Xt,t∈N}為Copula相依序列,則{Xt,t∈N}為嚴(yán)平穩(wěn)序列。
推論1:{Xt,t∈N}為Copula相依序列,引理1及引理2中的結(jié)論全部成立。
推論2 :{Xt,t∈N}為 k階Copula相依序列,則對任意的l≥1,在 (Xt-k-l,···,Xt-k,···,Xt-1)=(y1,···,yl,x1,···,xk)條件下與 (Xt-k,···,Xt-1)=(x1,···,xk)條件下 Xt的條件密度函數(shù)相同且不依賴于 t,且為 gk,1(y|x1,x2,···,xk)。
推論3:{Xt,t∈N}為k階Copula相依序列,且二階矩存在,則在 (Xt-k,···,Xt-1)條件下 Xt的條件數(shù)學(xué)期望及條件方差分別為:
推論3表明,Copula相依序列可以刻畫分布的條件異方差性。
根據(jù)定義1,一個Copula相依序列為k階Copula相依序列的充要條件為:在 (Xt-k+1,···,Xt-1)已知條件下,Xt與 Xt-k不條件獨立,而對任意的 l>0 ,在 (Xt-k,···,Xt-1)已知條件下,Xt與Xt-k-l條件獨立。要解決這一問題,首先要確定相應(yīng)的聯(lián)合分布及條件分布,為此根據(jù)Pair-Copula理論給出引理3。
引理3:{Xt,t∈N}為 k 階Copula相依序列,具有相同的一維分布密度 f(x)及一維分布函數(shù)F(x),{xt,t∈N}為序列的一個實現(xiàn),記分別為在條件下(Xi,Xj)的條件Copula密度函數(shù)與條件Copula分布函數(shù)條件下 Xi的條件分布函數(shù),則對任意的t>k,t∈N 有:
(1)(Xt-k,Xt-k+1,···,Xt)的聯(lián)合分布不依賴 t,具有相同的Pair-Copula分解
其中等式右端的xk+1=y。
(2)對任意的 t,在 (Xt-k,···,Xt-1)=(x1,···,xk)條件下,Xt的條件密度函數(shù)不依賴t,且為:
(3)對任意的 t,在 (Xt-k,···,Xt-1)=(x1,···,xk)條件下,Xt-k-l的條件密度函數(shù)不依賴t,且為:
其中等式右端的xk+1=y。
引理4:(Xt-k,···,Xt-1)已知條件下 Xt與 Xt-k-l條件獨 立 的 充 要 條 件 為 Gk,1(Xt|Xt-k,···,Xt-1) 與Gk,-l(Xt-k-l|Xt-k,···,Xt-1) 獨立。其中 Gk,1與 Gk,-l分別為 gk,1與 gk,-l相應(yīng)的條件分布函數(shù),可由條件Copula公式獲得[3]。
因此階數(shù)是否為k的檢驗問題可以轉(zhuǎn)化為如下的假設(shè)H01與H02同時為真的檢驗問題:
H01∶ Gk-1,1(Xt|Xt-k+1, ···,Xt-1) 與 Gk-1,-1(Xt-k|Xt-k+1,···,Xt-1)不獨立;
H02∶ Gk,1(Xt|Xt-k,···,Xt-1) 與 Gk,-l(Xt-k-l|Xt-k,···,Xt-1)獨立,l≥1;
引理 5:設(shè) (X,Y)為二維連續(xù)型隨機(jī)變量,(xi,yi),i=1,2,···n 為樣本觀察值,記(yi-yj),則在原假設(shè)“H0∶ X與Y獨立”成立時有:
由引理5,對于Copula相依序列{xt,t=1,2,···,T},針對假設(shè) H01的檢驗問題 ,可 以以 (Gk-1,1(xt|xt-k+1,···,xt-1),Gk-1,-1(xt-k|xt-k+1,···,xt-1)),t=k+1,···,T 為樣本對其 進(jìn) 行 檢 驗 ,而 以 (Gk,1(Xt|Xt-k, ···,Xt-1),Gk,-l(Xt-k-l|Xt-k,···,Xt-1)),l≥1,t=k+l+1,···,T 為樣本對假設(shè) H02進(jìn)行檢驗。
設(shè) {Xt,t∈N}為 k 階 Copula相依序列(CDS(k)),{xt,t=1,2,···,T}是長度為 T 的時間,由定理2可知,在t-1及其以前的信息已知的條件下,xt僅與 xt-1···xt-k相關(guān),而與 xt-k+1,xt-k+2···無關(guān),因此,如果僅僅利用時間序列t-1及其以前的信息對序列t時刻的取值進(jìn)行預(yù)測,那么通過建立以xt為因變量,以xt-1···xt-k為自變量的回歸模型就可以達(dá)到最優(yōu)預(yù)測,相應(yīng)的回歸函數(shù):
其中 gk,1(xt|xt-k,xt-k+1,···,xt-1)由式(9)給出。
于是建立如下k階自回歸模型:
由于回歸函數(shù)通過Copula理論獲得,故稱模型(13)為k階Copula自回歸模型(CAR(k)模型)。
Copula自回歸模型(13)包括兩部分參數(shù),一部分為相關(guān)結(jié)構(gòu)參數(shù),即Copula函數(shù)及條件Copula函數(shù)參數(shù),另一部分為一維分布參數(shù),因此,其參數(shù)估計可以借鑒Pair-Copula的參數(shù)估計方法,比如極大似然估計法、擬極大似然估計法、分步估計(IFM估計)、參數(shù)法以及半?yún)?shù)法等[1,2]。其中極大似然估計的似然函數(shù)為:
其中θ為式(2)涉及的所有參數(shù)組成的參數(shù)向量。
本文采用兩步法。第一步估計邊緣分布的參數(shù);第二步確定相關(guān)的Copula參數(shù),采用極大似然估計法,其似然函數(shù)為:
由于點預(yù)測值為Copula自回歸模型相應(yīng)的回歸函數(shù),是分布 gk(xt|xt-k,xt-k+1,···,xt-1)的數(shù)學(xué)期望,因此可采用數(shù)值積分法或隨機(jī)模擬法進(jìn)行估計。本文借鑒文獻(xiàn)[10]的思想建立下列不用產(chǎn)生隨機(jī)數(shù)的隨機(jī)模擬法。
由于 xi,i=1,2,···,T 可以視為隨機(jī)變量 xt的樣本,由大數(shù)定律知在t時刻序列的預(yù)測值Eh(Xt|xt-k,xt-k+1,···,xt-1)近似為:
同結(jié)論 1,以 h(xj|xt-k,xt-k+1,···,xt-1),j=1,2,···,T為樣本,記mα2與m1-α/2分別為該組樣本的α 2與1-α/2樣本(下)分位數(shù),則t(t>k)時刻變量均值的置信度為1-α的區(qū)間預(yù)測近似為式(17),可以作為t(t>k)時刻變量取值的置信度為1-α的近似置信區(qū)間。
若序列{Xt,t=1,2,···,T}為 k 階Copula相依序列,且在t時刻的值Xt表示某金融資產(chǎn)在t時刻的收益,則-Xt為對應(yīng)的損失??梢砸詷颖?h(xj|xt-k,xt-k+1,···,xt-1),j=1,2,···,T 的α(下)分位點mα作為t(t>k)時刻變量均值的置信度為1-α的單側(cè)置信下限的估計,其負(fù)值-mα作為t(t>k)時刻置信水平1-α下的時變風(fēng)險價值VaRt(1-α)的估計。即:
本例選取1996年1月2日至2016年6月15日共4955個交易日上證綜指的每日收盤數(shù)據(jù) pt,t=0,1,···,4954 ,以對數(shù)收益率序列 xt=lnpt-lnpt-1,t=1,2, ···,4954為研究對象。數(shù)據(jù)處理采用Matlab軟件。
首先,由ADF檢驗法易知序列為平穩(wěn)序列。
其次,經(jīng)計算序列的偏度與峰度分別為-0.0453及7.6851,因此邊際分布為有偏的,且具有顯著的尖峰厚尾特征。鑒于帶位置參數(shù)及尺度參數(shù)的有偏t-分布與帶位置參數(shù)及尺度參數(shù)的有偏廣義誤差分布都能在一定程度上刻畫上述特征,因此本文采用這兩種分布的混合分布來擬合邊際分布。
采用EM算法進(jìn)行估計得到:帶位置參數(shù)及尺度參數(shù)的有偏t-分布、帶位置參數(shù)及尺度參數(shù)的有偏廣義誤差分布的權(quán)重分別為0.5415與0.4585,兩個分布的分布參數(shù)分別為(0.0001,0.0070,4.1132,0.9591),(0.0001,0.0041,1.2487)。(注:第1、2、4分量分別為位置參數(shù)、尺度參數(shù)及偏度系數(shù),第3分量為t-分布的自由度或廣義誤差分布參數(shù))
4.3.1 Copula函數(shù)形式的確定
由于所涉及的變量間的非線性相關(guān)性較弱,而BB1 Copula[1]能夠較好地刻畫非對稱的尾部相關(guān)性,因此本文統(tǒng)一選用獨立Copula[1]與BB1 Copula[1]的混合Copula對涉及的Copula及條件Copula進(jìn)行擬合。由于該混合Copula只能刻畫正相關(guān)性,因此采用結(jié)論2進(jìn)行轉(zhuǎn)換,其參數(shù)估計采用EM算法。
結(jié)論2:CX,Y(u,v)=u-CX,-Y(u,1-v),其中CX,Y(u,v)與CX,-Y(u,v)分別為(X,Y)與(X,-Y)的Copula函數(shù)。4.3.2 相依階數(shù)的確定及Copula參數(shù)估計
采用上文給出的方法,在檢驗水平0.05下,結(jié)合上文給出的參數(shù)估計方法確定相依階數(shù)為k=12,同時得到式(9)所涉及混合Copula的權(quán)重及BB1 Copula中參數(shù),結(jié)果列于表1(為方便遞推,變量順序為(12,11,10,9,8,7,6,5,4,3,2,1,13)。
表1 Copula參數(shù)估計表
由于相依階數(shù)為12,故建立12階Copula自回歸模型(CAR(12)),采用式(16)對序列在時刻13及以后的點預(yù)測值,圖1給出了最后500個時刻點上預(yù)測值與實際值的散點圖。為了顯示點預(yù)測的效果,本文將點預(yù)測結(jié)果與12階平穩(wěn)自回歸模型的點預(yù)測結(jié)果進(jìn)行對比,比較指標(biāo)為平均絕對誤差與最大絕對誤差,結(jié)果如表2所示。
圖1 預(yù)測值與實際值的散點圖
表2 基于Copula自回歸模型與基于平穩(wěn)自回歸模型的點預(yù)測比較
由式(17)給出時刻13及以后的序列的置信度為95%區(qū)間估計與置信度為90%的區(qū)間估計,圖2給出了最后500個時刻點上95%區(qū)間估計曲線及序列值散點的圖形。
圖2 95%置信區(qū)間曲線圖及實際值的散點圖
同樣為了顯示點預(yù)測的效果,將所得區(qū)間估計結(jié)果與12階平穩(wěn)自回歸相應(yīng)結(jié)果進(jìn)行對比,比較指標(biāo)為置信區(qū)間的平均長度與序列值落入置信區(qū)間的比例,比較結(jié)果列于表3。
表3 基于Copula自回歸模型與基于平穩(wěn)自回歸模型的區(qū)間估計比較
從表2與表3可以看出,基于Copula自回歸模型的點預(yù)測比平穩(wěn)自回歸模型的點預(yù)測效果好,表現(xiàn)在平均絕對誤差小,最大絕對誤差基本相當(dāng);區(qū)間預(yù)測比平穩(wěn)自回歸模型的區(qū)間預(yù)測顯著優(yōu),表現(xiàn)在置信度90%的平均預(yù)測區(qū)間長度顯著小,且預(yù)測區(qū)間包含實際值的頻率更接近置信水平,而置信度95%的平均預(yù)測區(qū)間長度雖然稍大,但預(yù)測區(qū)間包含實際值的頻率更接近置信水平。從圖1與圖2可以看出,基于Copula自回歸模型的點預(yù)測與區(qū)間預(yù)測顯示出了顯著的時變性。
由式(18)分別給出置信水平分別為0.99、0.975、0.95及0.90的時變VaR的估計,散點圖見下頁圖3。并采用Kupic檢驗法進(jìn)行檢驗,表4列出了在4個置信水平下突破時變VaR的比率及Kupic檢驗統(tǒng)計量的值。
圖3 99%、97,5%、95%、90%的時變VaR曲線及實際損失的散點圖
表4 時變VaR估計及Kupic檢驗統(tǒng)計量值
從表4及圖3可以看出,VaR估計具有顯著的時變性,且在4種不同置信水平下的時變VaR估計的Kupic檢驗統(tǒng)計量值非常小,說明基于Copula自回歸模型的時變VaR估計具有很高的準(zhǔn)確性,顯示了基于Copula自回歸模型的時變VaR估計方法的有效性。
(1)本文通過對嚴(yán)平穩(wěn)序列及其相依性質(zhì)的研究提出了Copula相依序列(CDS)的概念,探討了Copula相依序列的部分性質(zhì)以及與嚴(yán)平穩(wěn)序列之間的關(guān)系;給出了Copula相依序列的條件分布,在此基礎(chǔ)上,給出了Copula相依序列相依階數(shù)的確定方法、條件均值及條件方差的表達(dá)式,說明了Copula相依序列具有一定的刻畫條件異方差性的能力。
(2)基于Copula相依序列建立了非線性自回歸模型——Copula自回歸模型(CAR),給出了相應(yīng)的參數(shù)估計方法。基于Copula自回歸模型,給出了一種不用產(chǎn)生隨機(jī)數(shù)的隨機(jī)模擬點預(yù)測方法、區(qū)間預(yù)測方法以及時變VaR的估計方法。
(3)采用1996年1月4日至2016年6月15日共4954個對數(shù)收益率數(shù)據(jù)構(gòu)成的序列建立了Copula自回歸模型,進(jìn)行了點預(yù)測、區(qū)間預(yù)測及時變VaR估計,實際計算結(jié)果說明了Copula自回歸模型及相關(guān)方法是有效的。并且通過采用更適合的邊際分布及更適合的混合Copula函數(shù)還可以提高預(yù)測及估計得精確度。
(4)Copula自回歸模型是平穩(wěn)時間序列的一種特殊的非線性模型,模型通過變量與其若干個滯后期變量間的相關(guān)結(jié)構(gòu)確定,構(gòu)造簡單、直觀;Copula自回歸模型相比傳統(tǒng)的時間序列模型(線性及非線性模型),具有嚴(yán)格的理論依據(jù),以Copula相依序列為理論基礎(chǔ),能夠充分利用相關(guān)信息;但Copula自回歸模型需要較大的序列長度,且計算量大。
對于Copula自回歸模型尚有一些值得探討的問題:
(1)在理論上,任一個嚴(yán)平穩(wěn)序列是否一定是一個Copula相依序列?或者是否任一嚴(yán)平穩(wěn)序列可以由一個Copula相依序列進(jìn)行近似?
(2)探索Copula相依序列相依階數(shù)的簡易判別方法;
(3)基于Copula回歸模型與Copula自回歸模型,解決其他問題,比如研究時間序列變量間的非線性因果關(guān)系等問題。