杜海波,王洪波,侯緒麗
(鶴崗市氣象局,黑龍江 鶴崗 154100)
隨著全球變暖的進(jìn)一步加劇,在很多方面將導(dǎo)致某些極端天氣、氣候事件更加頻發(fā),由此產(chǎn)生的災(zāi)害損失也必然會(huì)越來越嚴(yán)重。近年來,鶴崗地區(qū)極端天氣災(zāi)害頻繁發(fā)生,2009年,鶴崗地區(qū)出現(xiàn)了春末夏初百年一遇的大旱。而2005年7月28-29日鶴崗暴雨降水量達(dá)116.7 mm,導(dǎo)致鶴崗出現(xiàn)嚴(yán)重的洪澇災(zāi)害,梧桐河流域超過警戒水位,達(dá)到鶴崗建站以來極值。
本文利用GPD模式,借助L-矩估計(jì)方法對(duì)模型參數(shù)進(jìn)行估計(jì),模擬鶴崗暴雨的分布概率,并對(duì)這一概率分布進(jìn)行統(tǒng)計(jì)檢驗(yàn)。為進(jìn)一步模擬和預(yù)測(cè)鶴崗的強(qiáng)降水奠定理論基礎(chǔ)。根據(jù)該模型估計(jì)一定重現(xiàn)期的分位數(shù),在該地區(qū)橋梁、防洪堤壩、水庫等建設(shè)中加以考慮,從而提高防御自然災(zāi)害的能力,爭(zhēng)取最大程度的降低損失。
本文利用鶴崗50 a(1961-2010年)的逐日降水量資料,應(yīng)用基于超門限峰值(POT)抽樣法的廣義帕雷托分布模型,再用L-矩參數(shù)估計(jì)法,模擬鶴崗地區(qū)的強(qiáng)降水。模擬結(jié)果表明:(1)GPD不但計(jì)算簡(jiǎn)便,而且基本不受原始序列樣本量的影響;(2)POT抽樣法增加了極值的樣本量,L-矩估計(jì)得到的參數(shù)穩(wěn)定度高;(3)在一定門限值條件下的逐日降水量所擬合的降水極值分布符合GPD模型。GPD模型對(duì)模擬和預(yù)測(cè)鶴崗的強(qiáng)降水過程有一定的應(yīng)用價(jià)值。
選取鶴崗本站50 a(1961-2010年)的逐日降水量作為研究對(duì)象。
2.2.1 POT抽樣
廣義帕雷托分布(GPD)最大優(yōu)點(diǎn)在于,它的抽樣不只是每年抽取一個(gè),而是從原始資料中抽取出超某一門限值的數(shù)據(jù),即所謂的“超門限峰值POT”抽樣方法。顯然,在抽取的值中,每年可能會(huì)出現(xiàn)不只1個(gè)超過門限值的情況。由于POT抽樣方法直接由原始分布抽取極值,從而使所需樣本大大節(jié)省,或者說大大增加了樣本量,也更加的符合實(shí)際情況。
2.2.2 門限的選擇
門限值的選擇是考慮其用途及在實(shí)際工作中的意義,要根據(jù)不同情況來取門限值。既不能低,也不能太高,如果門限值選低了會(huì)使選出的數(shù)據(jù)與GPD分布擬合的不太好;如果選高了,不一定有足夠的樣本數(shù)據(jù)能估計(jì)出合理的分布參數(shù)。本文采用年平均交叉率接近于1的方法,也就是用1 a度量降水?dāng)?shù)據(jù)超過門限值的次數(shù),這樣比較恰當(dāng)。
2.2.3 GPD模型
廣義帕雷托分布 (Generalized Pareto Distribution)(簡(jiǎn)稱GPD)是用來表達(dá)概率分布特征的,比如,大于某臨界值(β)的降水量、風(fēng)速等的概率分布特征,其分布函數(shù)為
上式中,分布參數(shù)β為門限值;α為尺度參數(shù);k為線性參數(shù)。
2.2.4 L-矩參數(shù)估計(jì)
L-矩法是由前R個(gè)L-矩和前R個(gè)PWM的線性組合而成的,其起源于“概率權(quán)重矩”(PWM),L-矩法與經(jīng)典矩法相比,有許多優(yōu)點(diǎn),應(yīng)用也越來越廣泛。它的統(tǒng)計(jì)方法較簡(jiǎn)單,其參數(shù)估計(jì)精度與極大似然法估計(jì)精度相當(dāng),估計(jì)值的穩(wěn)定性較高。計(jì)算方法如下:首先將所有大于門限值的極值按從大到小的順序排列,x1≥x2≥…≥xn-1≥xn,由此得到一組超門限值統(tǒng)計(jì)量xj,對(duì)其作PWM估計(jì),考慮PWM的定義為:
式中,Br表示隨機(jī)變量x的第r階概率加權(quán)矩,其無偏估計(jì)通式可寫為:
一般情況下,r取相當(dāng)?shù)臄?shù)量就可以了,很少用更高階矩,如,要計(jì)算概率密度曲線的峰度,只需要取4階矩,本文中只需計(jì)算b0和b1,根據(jù)概率加權(quán)矩與L矩的關(guān)系,有
這里λi分別表示第i階L矩,b0和b1則分別表示0階和1階PWM估計(jì)量,根據(jù)(4)式可推出下列關(guān)系式:
由(9)(10)兩式可最終得到GPD的參數(shù) α和k估計(jì)式:
式中,β是門限值,也就是臨界值。例如,要研究降水量,可事先根據(jù)需要定出門限值或臨界值是多少,也可按標(biāo)準(zhǔn)差的倍數(shù)作為各種試驗(yàn)的臨界值。
2.2.5 重現(xiàn)期與對(duì)應(yīng)分位數(shù)的計(jì)算
研究重現(xiàn)期(return period),就是要對(duì)極值進(jìn)行統(tǒng)計(jì),找出分布規(guī)律。對(duì)于強(qiáng)降水的研究,要考慮的是超過某定值x的概率,稱為右側(cè)概率,可用下式表示:
根據(jù)重現(xiàn)期T的含義,可以認(rèn)為出現(xiàn)極值的概率的倒數(shù)即為重現(xiàn)期,對(duì)于最大值的重現(xiàn)期可表示為:
值得注意的是,所謂重現(xiàn)期,并非指經(jīng)過T時(shí)間就一定會(huì)出現(xiàn),它只是概率意義上的回轉(zhuǎn)周期。T反應(yīng)了事件發(fā)生概率的大小,重現(xiàn)期T越大,代表的概率就越小,越是稀有事件。
在確定重現(xiàn)期后,就可得到與T對(duì)應(yīng)的極值分位數(shù),極值的分位數(shù)就是對(duì)應(yīng)著氣候稀有事件概率的極值變量的某種可能取值。由(14)式和pareto分布模型-(1)式,可推出極值分位數(shù)的表達(dá)式,k不為0時(shí)有:
式中,λ為年交叉率,即每年極值超過門限值的次數(shù)。也就是從原始資料中找出超門限值的數(shù),記為n,用它除以數(shù)據(jù)資料的總年數(shù)N即可,λ=n/N。
2.2.6 柯爾莫哥洛夫--斯米爾諾夫檢驗(yàn)(K-S檢驗(yàn))
所謂K-S檢驗(yàn),是在20世紀(jì)初提出的關(guān)于順序統(tǒng)計(jì)量極限分布的定理發(fā)展而來的,用于檢驗(yàn)樣本是否來自某一特定分布的方法。其檢驗(yàn)方法是將樣本數(shù)據(jù)的累積頻率分布與特定理論分布比較 (即將經(jīng)驗(yàn)分布函數(shù)與理論分布函數(shù)比較),若F0(x)表示理論分布函數(shù),本文中為GPD模型,F(xiàn)n(x)樣本的累計(jì)頻率函數(shù),累計(jì)頻率=累計(jì)次數(shù)/總次數(shù),D為F0(x)與Fn(x)的最大差值,即 D=max|F0(x)-Fn(x)|。 再根據(jù)置信水平1-a或信度a判斷其是否通過K-S檢驗(yàn)。
2.2.7 相關(guān)系數(shù)檢驗(yàn)
由經(jīng)驗(yàn)分布函數(shù)和理論分布函數(shù)可以分別確定一個(gè)與降水量相對(duì)應(yīng)的概率值,若取多個(gè)不同的降水量,則可以得到兩組表示概率數(shù)據(jù),分別記為x(i)和y(i),可由如下公式計(jì)算它們的相關(guān)系數(shù):
鶴崗市位于中國(guó)東北邊陲,座落在小興安嶺與三江平原交匯地帶,屬丘陵地形,高低起伏,鶴崗屬高緯度地區(qū),130°16′E,47°20′N, 由于西太平洋副熱帶高壓在夏季達(dá)到最北位置,副熱帶西風(fēng)急流和東亞季風(fēng)的水汽輸送也達(dá)到最北,給黑龍江東北部帶來了充沛的水汽,暖濕空氣與西風(fēng)帶中的冷空氣交綏,易出現(xiàn)暴雨。故降水主要集中在7、8月,其他月份相對(duì)較少。加之特殊的地理?xiàng)l件致使鶴崗地區(qū)極易發(fā)生局地暴雨等災(zāi)害性天氣,近兩年鶴崗出現(xiàn)的暴雨量等級(jí)均超過歷史極值。
對(duì)鶴崗1961-2010年(50 a)的降水資料按給定的門限值做 POT 抽樣,根據(jù)(3)-(12)式,對(duì)選取的數(shù)據(jù)采用L矩估計(jì),由GPD模型中可得出一定重現(xiàn)期對(duì)應(yīng)的分位數(shù),再求出此極值在實(shí)測(cè)數(shù)據(jù)中出現(xiàn)的概率,即比較理論分布函數(shù)和經(jīng)驗(yàn)分布函數(shù),做柯爾莫哥洛夫——斯米爾諾夫檢驗(yàn)(K-S檢驗(yàn))和相關(guān)系數(shù)的檢驗(yàn)。表1給出了門限值為50mm的GPD模型參數(shù)及擬合效果檢驗(yàn)。
由表1可以看出,GPD模型參數(shù)估計(jì)的效果比較好,K-S統(tǒng)計(jì)量為0.06,通過檢驗(yàn),且其實(shí)測(cè)頻率和理論頻率的相關(guān)系數(shù)在0.9973,說明相關(guān)性較好。
表1 鶴崗市50 mm門限取值的GPD模型參數(shù)估計(jì)及其效果檢驗(yàn)
表2 鶴崗GPD模型重現(xiàn)期表
重現(xiàn)期代表了極值出現(xiàn)的概率,這是研究極值分布模型最關(guān)心的問題,表2得出了鶴崗GPD模型的重現(xiàn)期。但重現(xiàn)期的取值與樣本的容量有關(guān),本文的樣本容量?jī)H為50 a,故50 a以下,甚至70 a以下的擬合效果比較好,時(shí)間較長(zhǎng)擬合效果不一定很好。
pareto模擬曲線的擬合效果很好,與實(shí)測(cè)曲線的走勢(shì)基本一致,理論頻數(shù)與實(shí)測(cè)頻數(shù)的吻合程度比較高。由此可見,鶴崗的逐日極端降水量基本上符合GPD模式。對(duì)于鶴崗地區(qū)極端降水量采用廣義帕雷托模型(GPD)擬合是完全可行的,有很高的實(shí)用價(jià)值。
本文利用廣義帕雷托分布模型 (GPD),借助于L-矩參數(shù)估計(jì)法,對(duì)鶴崗的極端降水進(jìn)行模擬,取鶴崗的降水資料為樣本作POT抽樣,再分別估算其參數(shù),建立GPD模型,推算一定重現(xiàn)期的極端降水量分位數(shù),并檢驗(yàn)其擬合效果,結(jié)果表明:
(1)利用廣義帕雷托分布模型能較好的擬合鶴崗的暴雨分布概率,且GPD模型計(jì)算簡(jiǎn)便,穩(wěn)定性好,基本不受原始序列樣本量的影響。
(2)POT抽樣法增加了極值的樣本量,L-矩估計(jì)得到的參數(shù)穩(wěn)定度高。
(3)在實(shí)際工作中,利用GPD模型推算出五十年一遇或百年一遇的極端強(qiáng)降水量,可為預(yù)防強(qiáng)降水引發(fā)的洪澇災(zāi)害工作提供參考數(shù)據(jù)。