杜 懿,麻榮永
(1.廣西大學土木建筑工程學院,廣西 南寧 530004;2.廣西防災減災與工程安全重點實驗室,廣西 南寧 530004)
洪水、暴雨等水文極值事件一般都具有總量、強度和歷時等多屬性特點,且各屬性之間均存在著一定的相依關系[1]。傳統(tǒng)的單變量分析法已無法滿足應用要求,為了讓水文事件得到全面描述,進行多變量分析就顯得尤為必要。關于多變量分析的計算,目前概括起來主要有多元正態(tài)分布、非參數(shù)法、將多維聯(lián)合分布轉換成一維分布等方法[2]。但上述方法均存在一定問題。Copula函數(shù)的引入,有效地解決了這一問題。Copula函數(shù)是構建多變量聯(lián)合分布的一種高效方法,能夠構造出邊緣分布為任意分布的多變量聯(lián)合分布函數(shù),具有極強的靈活性與適應性[3]。但Copula函數(shù)類型的選擇是個難題,不同的Copula函數(shù)具有不同的分布特性,對水文變量的描述也存在差異。對此,國內(nèi)外很多學者也做了大量研究,大體上均認為Archimedean Copula函數(shù)族更適合于多數(shù)水文變量的描述[4]。隨著更多Copula函數(shù)的不斷涌現(xiàn),這一經(jīng)驗逐漸受到越來越多的挑戰(zhàn)?;诖?,本文以郁江南寧水文站歷年最大洪峰、洪量為研究對象,通過建立不同Copula函數(shù)下兩變量的聯(lián)合分布來推求最佳函數(shù)選擇,以期為未來區(qū)域水利工程規(guī)劃和防洪減災工作提供一定指導。
Copula函數(shù)是定義在[0,1]區(qū)間上均勻分布的多維聯(lián)合分布函數(shù),其理論最早可追溯到1959年Sklar提出的Sklar定理。該定理認為可以將一個N維聯(lián)合分布函數(shù)分解成N個邊緣分布函數(shù)和一個Copula連接函數(shù)。Nelsen于1999年給出了Copula函數(shù)的嚴格定義,即Copula函數(shù)是把隨機變量X1,X2,…,XN的聯(lián)合分布函數(shù)F(x1,x2,…,xN)與各自的邊緣分布函數(shù)FX1(x1),FX2(x2),…FXN(xN)相連接的連接函數(shù)。即函數(shù)C(u1,u2,…,uN),使得
F(x1,x2,…,xN)=C[FX1(x1),
FX2(x2),…FXN(xN)]
(1)
Copula函數(shù)具有橢圓型、二次型和Archimedean型三大類。其中,Archimedean Copula函數(shù)族又包括G-H、Clayton和Frank 等多種Copula函數(shù)[5]。本文選用的5種Copula函數(shù)的分布函數(shù)分別如下:
(1)正態(tài)(高斯)Copula
(2)
式中,u、v;ρ為變量間的線性相關系數(shù);φ-1為標準正態(tài)分布的分布函數(shù)的逆函數(shù);其他變量為函數(shù)中的參數(shù)。
(2)t-Copula函數(shù)
(3)
(3)G-H、Clayton、Frank Copula函數(shù)
C(u,v)=e-[(-lnu)θ+(-lnv)θ]1/θ
(4)
C(u,v)=(u-θ+v-θ-1)-1/θ
(5)
(6)
式中,θ為各Copula連接函數(shù)的參數(shù)值。
以上Copula函數(shù)具有不同的特點,無明顯的優(yōu)劣之別??傮w來說,正態(tài)Copula函數(shù)和Frank Copula函數(shù)適合于尾部對稱且漸近獨立的二維隨機變量; t-Copula函數(shù)適合于尾部對稱且尾部相關的二維隨機變量;G-H Copula函數(shù)和Clayton Copula函數(shù)均適合于具有非對稱尾部的二維隨機變量,前者上尾相關、下尾漸近獨立,后者相反。
本文根據(jù)郁江南寧水文站1942年~2002共61a洪水資料,整理出歷年最大洪水所對應的洪峰流量與洪水總量(具體數(shù)據(jù)略)。從推求兩變量各自最佳的邊緣分布、選取Copula連接函數(shù)、參數(shù)估計、模型評價4個過程來進行郁江南寧水文站洪水峰量聯(lián)合分布Copula函數(shù)選取問題的研究。
在我國,一般認為,P-Ⅲ型曲線可以很好地擬合水文變量的頻率分布。基于此,本文初選P-Ⅲ型分布對洪峰、洪量兩序列進行擬合,二者累積概率密度函數(shù)如圖1、2所示。
圖1 洪峰的P-Ⅲ型分布擬合結果
圖2 洪量的P-Ⅲ型分布擬合結果
從圖1、2中可以看出,P-Ⅲ型曲線對洪峰、洪量兩序列的擬合結果均不理想,誤差較大。為準確快速地推求出兩變量的邊緣分布,筆者采用非參數(shù)核密度估計法來對兩變量的分布形態(tài)進行研究。利用MATLAB軟件編程得到兩變量的核分布估計與經(jīng)驗分布函數(shù)的擬合結果(見圖3、4)。
圖3 洪峰的核分布估計與經(jīng)驗分布函數(shù)
圖4 洪量的核分布估計與經(jīng)驗分布函數(shù)
從圖3、4可看出,洪峰和洪量的經(jīng)驗分布函數(shù)與核分布估計幾乎重合,擬合效果優(yōu)秀,誤差較小;從而說明本次利用非參數(shù)核密度估計法求得的兩個變量的邊緣分布較為準確,很好地反映出了兩序列的分布特性。
G-H、Clayton、Frank 3個Copula函數(shù)的參數(shù)取值分別為θ1=3.117 415,θ2=3.660 801,θ3=9.997 817。
將計算得到的經(jīng)驗聯(lián)合分布值與用5種Copula函數(shù)計算得到的理論聯(lián)合分布值點繪作圖,結果如下。
圖5 經(jīng)驗聯(lián)合分布與理論聯(lián)合分布的擬合
由圖5可以看出,以上5種Copula函數(shù)的擬合效果都較好,點據(jù)均分布在45°直線附近。為了更精確地評價每個Copula函數(shù)的擬合效果,分別以擬合趨勢線斜率(k)、相關系數(shù)平方(R2)、平方歐式距離(d)為標準進行判別。其中,k和R2值越接近于1或d值越小,擬合效果越好。比較結果見表1。
表1 五種Copula函數(shù)比較結果
比較發(fā)現(xiàn),5種Copula連接函數(shù)中以二元t-Copula函數(shù)的擬合效果最好,F(xiàn)rank Copula函數(shù)最差(與經(jīng)驗結論相悖)。故在郁江南寧水文站洪水峰量聯(lián)合分布研究中,推薦使用二元t-Copula連接函數(shù)。函數(shù)的聯(lián)合概率密度見圖6。其中,U表示洪峰,V表示洪量。
圖6 二元t-Copula概率密度
仔細觀察圖6可知,二元t-Copula函數(shù)具有對稱的尾部,且尾部較厚。該函數(shù)對變量之間的尾部相關變化較為敏感,可以很好地捕捉到變量的對稱的尾部相關關系。
本文以郁江南寧站61a洪水資料為基礎,采用5種不同的Copula函數(shù)來建立洪峰與洪量的聯(lián)合分布。在洪峰、洪量的邊緣分布推求中,由于傳統(tǒng)的P-Ⅲ型分布擬合較差,遂采用了非參數(shù)核密度估計法來描述兩個變量各自的邊緣分布,擬合誤差較小,結果有了很大提高;通過點繪5種Copula函數(shù)的理論聯(lián)合分布與經(jīng)驗聯(lián)合分布的相關圖發(fā)現(xiàn),5種Copula函數(shù)均適用于本次峰量聯(lián)合分布研究;以擬合趨勢線斜率、相關系數(shù)平方、平方歐式距離作為評價指標,比較得出適用于本次研究的最優(yōu)Copula連接函數(shù),即二元t-Copula函數(shù)。