丁詠梅,劉麗珺,雷 晴
(武漢科技大學(xué) 理學(xué)院,湖北 武漢 430080)
自然界中的各種非人為災(zāi)害通常會采用極值理論去探討.極值理論的核心就是根據(jù)極端事件的極值分布的尾部來建立模型并分析事件的變動特征和預(yù)測事件的風(fēng)險.
極值理論最早追溯到了20世紀(jì)早期,馮·博特凱維茲于1922年通過對正態(tài)分布的樣本極差的研究提出極值問題.此后,Dodd等陸續(xù)地展開了極值理論研究.1928年,F(xiàn)isher提出極值分布的三大類型.1958年,Gumbel出版了著作《Statistics of Extremes》,奠定極值理論的基礎(chǔ)[1].近年來,Gumbel分布廣泛應(yīng)用于氣象等領(lǐng)域,可有效預(yù)測最大降雨量等未知信息.再現(xiàn)期預(yù)測的精準(zhǔn)度則取決于其參數(shù)估計方法的優(yōu)劣,于是Ahsanullah在1990年和1991年基于記錄數(shù)據(jù)導(dǎo)出了Gumbel分布中位置參數(shù)和尺度參數(shù)的最大似然估計量和最小方差無偏估計量[2-3].Hong等[4]研究了大樣本量時的廣義最小二乘法擬合方法及其與其他擬合方法的相比性能在效率、偏差和均方根誤差方面的評估.國內(nèi),利用Gumbel分布對極端情況變換特征進(jìn)行研究并運用了PWM,結(jié)果表現(xiàn)出較高的擬合優(yōu)度[5-6].曹兵等[7]在研究設(shè)計波高的時候也得出了相似的結(jié)論.翟宇梅等[8]運用蒙特卡洛方法選出估計誤差最小的經(jīng)驗分布函數(shù)從而提出了最優(yōu)線性矩估計法,認(rèn)為選擇合適的經(jīng)驗分布函數(shù)可以提高參數(shù)估計的精度.對Gumbel分布進(jìn)行參數(shù)估計時,分別對比不同的估計方法后認(rèn)為極大似然估計具有較優(yōu)的穩(wěn)定表現(xiàn)[9-12].針對我國極端降水量擬合Gumbel分布,發(fā)現(xiàn)相比其他參數(shù)估計方法,采用L-矩估計法對極端降水量進(jìn)行擬合優(yōu)度有著顯著的提高[13-15].張延年等[16]采用Gumbel分布對國內(nèi)最大風(fēng)速值進(jìn)行分析和參數(shù)估計,發(fā)現(xiàn)耿貝爾法比矩法擬合效果好.肖翔等[17]運用比較法和微分法對最小二乘估計量的有效性進(jìn)行了證明.
基于已有的國內(nèi)外關(guān)于Gumbel分布的參數(shù)的估計問題,比較了當(dāng)前的3種參數(shù)估計方法,認(rèn)為當(dāng)樣本容量較大時,采用MLE能得到更優(yōu)的結(jié)果.考慮到數(shù)據(jù)的可得性,選擇“SpatialExtreme”包中的“rainfall”數(shù)據(jù)集,對瑞士3個站點的47年極值數(shù)據(jù),選擇最大似然估計(MLE)、矩法估計(ME)、最小二乘估計(OLS)進(jìn)行估計分析,并使用優(yōu)化指標(biāo)對樣本估計值的結(jié)果進(jìn)行比較評價.
Gumbel分布函數(shù)
(1)
式中:μ是位置參數(shù),β>0是尺度參數(shù).不同的位置參數(shù)和尺度參數(shù)下的Gumbel概率密度函數(shù)圖像如圖1所示.
圖1 不同位置參數(shù)和尺度參數(shù)下的Gumbel概率密度
Gumbel分布參數(shù)的矩估計為:
(2)
(3)
且估計量的方差
(4)
式中:γ為歐拉常數(shù),ρs=1.139 6,ρk=5.4分別是Gumbel分布的偏度和峰度系數(shù).化簡后有
(5)
(6)
以殘差平方和最小為標(biāo)準(zhǔn),求u和β的參數(shù)估計即實際上即求y與x的回歸直線,所以Gumbel分布參數(shù)的最小二乘估計量為
(7)
且有
(8)
(9)
由文獻(xiàn)[17]可知,該估計具有有效性.易知Gumbel的最小二乘估計具有線性、無偏性及有效性.
Gumbel分布對應(yīng)的概率密度函數(shù)
(10)
其中δ>0,-∞ (11) 得似然方程 (12) 由?lnL/?θi=0(θ1=β,θ2=u)確定的θi即為極大似然法的估計量.為加快收斂,在設(shè)置合適初值的情況下用牛頓迭代法求解. 考慮到數(shù)據(jù)的可獲取性,基于R軟件,選擇程序包“SpatialExtremes”中數(shù)據(jù)集“rainfall”中名稱為rain的數(shù)據(jù),該數(shù)據(jù)是瑞士的79個不同站點的連續(xù)47年的降雨量資料.基于該研究對象,選取了前3個站點連續(xù)47的降雨量數(shù)據(jù)進(jìn)行分析,簡單的統(tǒng)計特征如表1所示. 由站點1的連續(xù)47年降雨量數(shù)據(jù),基于R語言,得到站點1降雨量所相應(yīng)的Gumbel分布的3種估計下的結(jié)果,如表2所示. 表1 3個站點的統(tǒng)計特征 表2 站點1在3種參數(shù)估計方法下的估計結(jié)果 類似地,基于R語言,得到站點2降雨量所相應(yīng)的Gumbel分布的3種參數(shù)估計下的結(jié)果,如表3所示. 表3 站點2在3種參數(shù)估計方法下的估計結(jié)果 對于站點2的降雨量分布,得到類似于站點1的統(tǒng)計結(jié)果.為了證實在極值分布中,最大似然估計和矩法估計優(yōu)于最小二乘,選擇了站點3作為驗證.得到站點3降雨量所相應(yīng)的Gumbel分布的3種估計辦法下的參數(shù)估計,如表4所示. 表4 站點3在3種參數(shù)估計方法下的估計結(jié)果 分位數(shù)-分位數(shù)圖(QQ圖)是用于檢驗數(shù)據(jù)集的分布假設(shè)的有效性的探索性工具,其基本思想是基于所討論的分布來計算每個數(shù)據(jù)點的理論預(yù)期值,并將變量的有序值與特定理論分布的分位數(shù)進(jìn)行比較,如果數(shù)據(jù)確實遵循假設(shè)分布,即數(shù)據(jù)確實來自于理論分布,則QQ圖上的點將大致落在一條直線上. 本研究分別作出了3站點的降雨量數(shù)據(jù)在3種參數(shù)估計方法下的殘差QQ圖(圖2~圖10). 圖2 站點1的MLE估計下的殘差QQ圖 圖3 站點1的OLS估計下的殘差QQ圖 圖4 站點1的ME估計下的殘差QQ圖 圖5 站點2的MLE估計下的殘差QQ圖 圖6 站點2的OLS估計下的殘差QQ圖 圖7 站點2的ME估計下的殘差QQ圖 圖8 站點3的MLE估計下的殘差QQ圖 圖9 站點3的OLS估計下的殘差QQ圖 圖10 站點3的ME估計下的殘差QQ圖 由QQ圖可知,OLS對Gumbel分布的估計并不盡如人意.相比之下,ME和MLE下的殘差QQ圖上的點基本分布在直線附近,效果比較好,特別是ME下的殘差QQ圖的前一部分的點基本與直線處于重合的狀態(tài),顯示了非常良好的效果.綜合這3個站點的分析結(jié)果,在對Gumbel參數(shù)的估計中,可以說矩估計和極大似然估計的效果是比較好的,且ME是最優(yōu)的.而OLS的估計效果可能會因為樣本的不同而表現(xiàn)出差異,相比較之下OLS不是最優(yōu)選擇. 作為三大極值分布之一的Gumbel分布,其參數(shù)估計在實際應(yīng)用中具有重要意義.研究通過對Gumbel分布及其參數(shù)估計方法的理論分析以及結(jié)合了R軟件中程序包“SpatialExtremes”中數(shù)據(jù)集“rainfall”中名稱為rain的數(shù)據(jù)的實證研究,比較了3個站點的適應(yīng)值函數(shù)大小和殘差QQ圖,不論是從適應(yīng)值函數(shù)的角度,還是從殘差QQ圖的角度,較最小二乘法,極大似然估計法和矩估計都表現(xiàn)良好.另外,其他還有例如概率加權(quán)法、分位數(shù)法等參數(shù)估計法有待進(jìn)一步的研究,因此不排除對于Gumbel分布的參數(shù)估計還有更加有效的方法的可能性.2 數(shù)據(jù)來源及其特征分析
3 模型診斷
4 結(jié)語