吳 迪
(遼寧省沈陽水文局,遼寧 沈陽 110094)
隨機(jī)性和確定性方法為工程水文分析計(jì)算的兩種主要方法,采用數(shù)理統(tǒng)計(jì)外推法并依據(jù)實(shí)測(cè)或水文歷史數(shù)據(jù)可對(duì)重現(xiàn)期的洪水量值進(jìn)行求解的方法為隨機(jī)性方法;而確定性方法主要是對(duì)洪水災(zāi)害利用物理模型與數(shù)學(xué)工具進(jìn)行反演模擬的方法。AMS年最大值法因其具有的理論系統(tǒng)成熟、計(jì)算概念清晰等特點(diǎn)被廣泛引用于國(guó)內(nèi)的水文統(tǒng)計(jì)計(jì)算中,而在實(shí)際工程應(yīng)用中該方法仍存在諸多的問題和限制。數(shù)據(jù)觀測(cè)年限的選擇是確保計(jì)算結(jié)果可靠性的主要影響因素,通常情況下數(shù)據(jù)觀測(cè)年限應(yīng)不低于30年并因此造成該方法在資料匱乏區(qū)域的應(yīng)用存在一定局限,即使可依據(jù)有關(guān)技術(shù)規(guī)范采用延拓或插補(bǔ)的方法對(duì)缺失數(shù)據(jù)資料進(jìn)行補(bǔ)充,但依舊可對(duì)洪水的預(yù)測(cè)分析帶來較多的不確定性。而且,對(duì)于有效水文信息或豐水年有價(jià)值的洪水?dāng)?shù)據(jù)利用年最大值法也存在丟失的現(xiàn)象,盡可能的獲取樣本值信息基本原則與采用年最大值法具有的特征現(xiàn)象明顯不符。
國(guó)內(nèi)外水文學(xué)者經(jīng)過多年的努力和研究,分別利用多種理論和方法從各個(gè)角度提出了擴(kuò)充樣本法,而POT超閾值模型為水文研究最為常用的方法。對(duì)于水文事件POT模型將其認(rèn)為是一個(gè)離散隨機(jī)發(fā)生的過程,模型對(duì)統(tǒng)計(jì)分析的有效樣本選取為超過某一洪水閾值的極值數(shù)據(jù)。對(duì)于實(shí)測(cè)數(shù)據(jù)中的有價(jià)值的數(shù)據(jù)該方法可最大程度的提取和挖掘,對(duì)其頻率計(jì)算結(jié)果的精度POT模型可利用增大統(tǒng)計(jì)分析樣本數(shù)量進(jìn)行提高。Pickands等[1]研究表明,超出閾值的樣本序列在閾值選取足夠大的條件下滿足GP廣義帕累托穩(wěn)定分布。Lang等[2]對(duì)POT模型擬合優(yōu)度檢驗(yàn)及其可靠性進(jìn)行研究分析,并對(duì)POT模型采用GP分布時(shí)的頻率與閾值之間的作用關(guān)系以及典型問題進(jìn)行了探討和分析,指出數(shù)據(jù)年限長(zhǎng)度的2~3倍為合適閾值選擇的適用范圍;王建峰等[3]為提高計(jì)算精度提出了改進(jìn)的線性矩法,并認(rèn)為相對(duì)于傳統(tǒng)的Pearson-Ⅲ型分布三參數(shù)GP分布的經(jīng)驗(yàn)頻率點(diǎn)與理論頻率曲線在重現(xiàn)期較大時(shí)的擬合結(jié)果更優(yōu);張麗娟等[4]對(duì)POT模型計(jì)算結(jié)果受歷史洪水?dāng)?shù)據(jù)的作用影響進(jìn)行了探討,并指出相對(duì)于AMS方法利用POT方法的擬合優(yōu)度更佳。
多種復(fù)雜環(huán)境因素的共同作用形成的洪澇災(zāi)害其頻率計(jì)算不僅與參數(shù)估計(jì)方法、統(tǒng)計(jì)分布函數(shù)等因素相關(guān),而且受自然環(huán)境的變化、觀測(cè)時(shí)間以及數(shù)據(jù)量的多少等客觀因素的作用影響,超越預(yù)期的極端洪水事件在目前人類活動(dòng)影響顯著、全球氣候變化劇烈的大背景下而經(jīng)常出現(xiàn),因此對(duì)計(jì)算成果的不確定性進(jìn)行合理考量,在保證設(shè)計(jì)成果處于一定的安全狀態(tài)并預(yù)留充足的裕度空間方面具有重要作用[5- 8]。據(jù)此,國(guó)內(nèi)外學(xué)者對(duì)多種理論方法分別從不同的角度進(jìn)行了研究,其主要集中在對(duì)模型參數(shù)的不確定性估計(jì)方面即通過設(shè)定合理的置信區(qū)間對(duì)參數(shù)估計(jì)的誤差進(jìn)行不確定程度的表征。本文以遼河流域?yàn)槔⒁罁?jù)流域出口斷面流量數(shù)據(jù)資料,利用GP分布理論構(gòu)建POT模型并對(duì)模型的置信區(qū)間范圍及似然函數(shù)進(jìn)行求解,對(duì)水文頻率計(jì)算結(jié)果與不同觀測(cè)年限樣本數(shù)據(jù)之間的作用關(guān)系和影響規(guī)律進(jìn)行探討分析,并在此過程中對(duì)適線結(jié)果的擬合優(yōu)度和樣本的一致性檢驗(yàn)、POT模型閾值選擇原則加以探討。
樣本序列{Xi}符合獨(dú)立同分布基本特征,若固定值u滿足Xi>u條件,則稱x-u、u分別為超閾值和閾值,可采用下述公式代表樣本序列平均超出量函數(shù):
(1)
可利用下述函數(shù)代表三參數(shù)GP分布函數(shù):
(2)
式中,F(xiàn)(x)—不超越概率分布函數(shù);μ、σ、ξ—分別代表位置參數(shù)、尺度參數(shù)和形狀參數(shù)。
依據(jù)上述計(jì)算公式,當(dāng)樣本數(shù)量足夠大時(shí)采用POT抽樣法獲取的樣本其GP分布函數(shù)可進(jìn)一步簡(jiǎn)化為:
(3)
在時(shí)間段w內(nèi)樣本序列可利用POT模型進(jìn)行篩選和證明,不難發(fā)現(xiàn)樣本符合典型的HPP齊次泊松過程并且其速率為λw,而且在相鄰時(shí)間間隔內(nèi)的洪水發(fā)生時(shí)間符合指數(shù)分布特征。洪水實(shí)測(cè)數(shù)據(jù)在實(shí)際應(yīng)用中往往可劃分為多個(gè)固定時(shí)段,若超過閾值的洪水年平均次數(shù)為λ且洪水重現(xiàn)期為T年,則1/(λT)即可代表洪水的發(fā)生頻率??刹捎孟率龉竭M(jìn)行POT模型的洪水重現(xiàn)期的計(jì)算和求解:
T=1/λ(1-F(x))
(4)
式中,F(xiàn)(x)—代表GP的分布函數(shù);T、λ—分別代表重現(xiàn)期和超越閾值速率。
可采用修正后的期望值公式對(duì)符合超閾值相似經(jīng)驗(yàn)頻率進(jìn)行求解,其表達(dá)式如下:
Pc≈i·λ/(N+1)
(5)
式中,Pc—超閾值樣本經(jīng)驗(yàn)頻率;i—按照降序排列的超閾值樣本的序號(hào)。
對(duì)模型參數(shù)利用極大似然原理進(jìn)行統(tǒng)計(jì)估計(jì)的方法即為最大似然法,其常用的枉法為點(diǎn)估計(jì)法,其基本內(nèi)涵為對(duì)模型最優(yōu)參數(shù)利用目標(biāo)函數(shù)的求解進(jìn)行估計(jì)和提取。依據(jù)公式(4)可知,對(duì)重現(xiàn)期水平利用GP分布進(jìn)行求解時(shí)不僅要對(duì)形狀ξ和尺度σ參數(shù)進(jìn)行估計(jì),而且需對(duì)超閾值速率λ進(jìn)行統(tǒng)計(jì)估計(jì)。結(jié)合文中所述,齊次泊松過程為洪水超閾值發(fā)生次數(shù)的分布特征,所以不僅要采用密度函數(shù)乘積基本方式而且對(duì)最大似然目標(biāo)函數(shù)還需要考慮泊松分布函數(shù)基本理論,因此所建立的似然方程其表達(dá)式如下:
(6)
依據(jù)上述公式基本形式可對(duì)其進(jìn)行推導(dǎo),并且固定時(shí)段選取自然年長(zhǎng)度其函數(shù)表達(dá)式如下,當(dāng)ξ不為0時(shí):
(7)
當(dāng)ξ不為0時(shí):
(8)
式中,N、w—分別代表超閾值樣本總數(shù)和時(shí)段長(zhǎng)度,其他各參數(shù)同上。
(9)
(10)
依據(jù)待估計(jì)量的漸進(jìn)正態(tài)性基本假設(shè)對(duì)置信度利用Delta法進(jìn)行計(jì)算,即對(duì)分布函數(shù)相關(guān)參數(shù)置信區(qū)間采用Taylor展開式進(jìn)行計(jì)算獲取,可采用下述公式表征GP分布置信區(qū)間邊界條件:
(11)
遼河流域位于我國(guó)東北地區(qū)西南部,屬于溫帶、寒溫帶大陸性季風(fēng)氣候,冬冷干燥漫長(zhǎng),夏季多雨炎熱,全年降雨量和流經(jīng)量分布不均勻,其中西部徑流面積較大,每年的7~8月為降雨旺季。流域內(nèi)地勢(shì)結(jié)構(gòu)由東南向西北方向逐漸降低,海拔最高處為1800m最低處約200m。流域內(nèi)工業(yè)發(fā)展充分、畜牧業(yè)和農(nóng)林業(yè)發(fā)展迅速,不僅是我國(guó)的糧食基地也是工業(yè)發(fā)展中心[9]。遼河流域上游保存有較為原始的自然生態(tài)環(huán)境,所以對(duì)該流域所提取的實(shí)測(cè)水文數(shù)據(jù)資料具有一定的合理性和代表性[10]。本文統(tǒng)計(jì)整理了遼河流域1960—2010年出口水文站的實(shí)測(cè)日流量數(shù)據(jù)并將其劃分為30、35、40、45、50年5種不同時(shí)長(zhǎng)序列數(shù)據(jù),對(duì)不同時(shí)長(zhǎng)數(shù)據(jù)的選取對(duì)計(jì)算結(jié)果的不確定性影響利用模型進(jìn)行探討和分析。
利用模型進(jìn)行極值統(tǒng)計(jì)分析時(shí)不僅要避免所提取的數(shù)據(jù)的自相關(guān)性,而且還要需保證各樣本的獨(dú)立性和數(shù)值的大小。針對(duì)上述問題國(guó)內(nèi)外學(xué)者分別提出了多種判別標(biāo)準(zhǔn)并可獨(dú)立次洪過程進(jìn)行分割判別,限值法即對(duì)流量限值依據(jù)實(shí)測(cè)洪水?dāng)?shù)據(jù)變化狀況進(jìn)行估計(jì),并對(duì)超過該限值的洪峰流量進(jìn)行提取,該方法較為簡(jiǎn)便但可出現(xiàn)對(duì)前后相繼的次洪過程進(jìn)行階段和忽略一部分小洪水事件等現(xiàn)象,據(jù)此本研究為獲取獨(dú)立洪峰數(shù)據(jù)值可利用該方法進(jìn)行求解和提取[11]。
設(shè)定一個(gè)恰當(dāng)?shù)拈撝祏為POT模型統(tǒng)計(jì)計(jì)算極值洪水樣本的核心和關(guān)鍵內(nèi)容,如閾值選取的過大或過低將直接影響到有效樣本數(shù)量的多少,閾值過低則對(duì)極值分布的基本含義相偏離,并可造成抽樣數(shù)量的增大。相關(guān)學(xué)者針對(duì)樣本選取方法開展了大量的研究,然而國(guó)內(nèi)并未形成較為系統(tǒng)成熟的標(biāo)準(zhǔn),其中年均超閾值發(fā)生次數(shù)法、分散指數(shù)法以及超閾值樣本均值法等為較為常用的方法,其中超閾值樣本法應(yīng)用較為廣泛并取得了很好的效果。Coles等[12]依據(jù)相關(guān)研究成果認(rèn)為形狀及尺度參數(shù)、尺寸區(qū)間應(yīng)在合適的閾值作用下呈現(xiàn)出穩(wěn)定線性狀態(tài),盡量選擇穩(wěn)定區(qū)間內(nèi)較大的閾值并以此對(duì)極值樣本進(jìn)行篩選。本文依據(jù)上述過程和方法進(jìn)行閾值變化與GP分布狀態(tài)及其評(píng)價(jià)剩余壽命、尺度參數(shù)值之間的作用關(guān)系進(jìn)行分析,其變化曲線如圖1所示。
圖1 閾值變化與GP分布尺度、剩余壽命值、形狀參數(shù)的作用曲線
由圖1可知,形狀及尺度參數(shù)、平均壽命三種指標(biāo)在閾值為160~250m3/s時(shí)處于穩(wěn)定狀態(tài),即在此區(qū)間范圍內(nèi)三種指標(biāo)參數(shù)隨閾值的變化而不發(fā)生明顯的改變,并且在該范圍內(nèi)三種指標(biāo)的置信區(qū)間變化幅度較低,因此可認(rèn)為在此區(qū)間取值時(shí)POT模型具有較高的確定度。綜上所述,POT模型的最佳閾值為190m3/s,各時(shí)段閾值的樣本極值數(shù)量計(jì)算結(jié)果如表1所示。然后對(duì)超閾值樣本分別利用三種非參數(shù)檢驗(yàn)法進(jìn)行相關(guān)假設(shè)檢驗(yàn),檢驗(yàn)結(jié)果見表1。由表1可知,三種雙側(cè)檢驗(yàn)P在閾值為190m3/s時(shí)均高于0.05,即在95%置信區(qū)間內(nèi)不能被原假設(shè)拒絕,即POT模型獨(dú)立同分布的相關(guān)要求符合所篩選的超閾值樣本結(jié)果。
表1 樣本獨(dú)立性檢驗(yàn)結(jié)果
對(duì)GP分布函數(shù)中的各參數(shù)利用最大似然法進(jìn)行估計(jì),因此可確定70%雙側(cè)置信區(qū)間范圍以及不同重現(xiàn)期洪量大小。考慮到5個(gè)時(shí)段數(shù)據(jù)GP分布適線圖變化趨勢(shì)的一致性以及文章篇幅原因,本文僅對(duì)50a時(shí)段數(shù)據(jù)的GP分布適線圖進(jìn)行分析和討論。研究表明,理論分布曲線以及樣本點(diǎn)經(jīng)驗(yàn)累積整體沿對(duì)角線分布,由此表明GP分布的前提假設(shè)基本符合相關(guān)參數(shù)設(shè)定要求,其他時(shí)段的變化趨勢(shì)及驗(yàn)證結(jié)果與該時(shí)段基本相同。對(duì)理論曲線與各時(shí)段樣本經(jīng)驗(yàn)點(diǎn)據(jù)的吻合程度采用較為常用的統(tǒng)計(jì)檢驗(yàn)法進(jìn)行擬合優(yōu)度檢驗(yàn),檢驗(yàn)結(jié)果見表2。結(jié)果表明:擬合檢驗(yàn)P值除了個(gè)別時(shí)段如30年時(shí)段外均高于0.05,依據(jù)卡方檢驗(yàn)結(jié)果和置信水平為95%的K-S檢驗(yàn)結(jié)果可知樣本與理論頻率曲線的表現(xiàn)出良好的適線效果。
表2 擬合優(yōu)度檢驗(yàn)結(jié)果
為了對(duì)計(jì)算結(jié)果不確定性受時(shí)間長(zhǎng)度、數(shù)據(jù)數(shù)量多少的作用影響進(jìn)行研究,本文依據(jù)表3有關(guān)數(shù)據(jù)和上述基本過程對(duì)5種時(shí)段數(shù)據(jù)上的不同重現(xiàn)期水平值以折現(xiàn)的形式進(jìn)行描述,其繪制結(jié)果如圖2所示。
圖2 各時(shí)段流量資料的重現(xiàn)期水平
由圖2可知,遼河流域在1000a、500a、200a和100a日平均洪峰流量重現(xiàn)期水平分別在5100~8500m3/s、4000~5000m3/s、3600~4600m3/s、2200~3100m3/s范圍之內(nèi)。根據(jù)縱向變化可知,各重現(xiàn)期計(jì)算結(jié)果差異范圍隨所用數(shù)據(jù)時(shí)間程度的增大熱表現(xiàn)出增大的趨勢(shì),而所用數(shù)據(jù)的時(shí)段長(zhǎng)度在同一重現(xiàn)期上的洪水流量大小并未呈現(xiàn)出明顯的線性關(guān)系。例如各重現(xiàn)期上最大、最小流量值分別可在45年和50年時(shí)段上進(jìn)行求得,重現(xiàn)期計(jì)算結(jié)果在其他時(shí)段樣本的處于二者之間。由此表明,重現(xiàn)期計(jì)算結(jié)果與樣本數(shù)量的大小以及觀測(cè)年限長(zhǎng)度密切相關(guān),并且樣本數(shù)量可利用實(shí)測(cè)數(shù)據(jù)長(zhǎng)度的延長(zhǎng)而逐漸增大,環(huán)境條件仍然可對(duì)新補(bǔ)充的水文條件產(chǎn)生作用影響,對(duì)于豐水年份所補(bǔ)充的觀測(cè)年份可得到離散值偏高的樣本,具有代表性的樣本可由于長(zhǎng)時(shí)間枯水實(shí)測(cè)數(shù)據(jù)的增大而逐漸不足,雖然采用改進(jìn)的方法即POT模型仍不能消除此過程的作用影響。研究表明,在實(shí)際工程設(shè)計(jì)中數(shù)據(jù)資料年限的長(zhǎng)短所引起的不確定性可通過設(shè)定上側(cè)設(shè)計(jì)值以及恰當(dāng)?shù)闹眯艆^(qū)間進(jìn)行消除或降低,并因此提高設(shè)計(jì)成果的準(zhǔn)確性與可靠性[12]。
本文利用遼河流域出口流量數(shù)據(jù)資料對(duì)GP分布的POT模型進(jìn)行洪水重現(xiàn)期計(jì)算和分析,并對(duì)研究區(qū)域響應(yīng)置信區(qū)間范圍和各重現(xiàn)期流量大小進(jìn)行研究,理論分布曲線以及經(jīng)驗(yàn)分布點(diǎn)據(jù)分別利用卡方檢驗(yàn)、K-S檢驗(yàn)進(jìn)行擬合優(yōu)度檢驗(yàn),對(duì)5種時(shí)段流量數(shù)據(jù)重現(xiàn)期進(jìn)行計(jì)算,得出的主要結(jié)論如下:
(1)相對(duì)于年最大值取樣方法POT模型抽樣法可使得數(shù)據(jù)提高約1~2倍,為符合大樣本量對(duì)統(tǒng)計(jì)分析的有關(guān)需求該方法可擴(kuò)大樣本數(shù)量。
(2)洪水流量數(shù)據(jù)擬合優(yōu)度檢驗(yàn)結(jié)果顯示,GP分布能較好的進(jìn)行適線并且相對(duì)于傳統(tǒng)的水文統(tǒng)計(jì)分析POT模型能較好的對(duì)洪水統(tǒng)計(jì)分析。
(3)在實(shí)際工程設(shè)計(jì)中數(shù)據(jù)資料年限的長(zhǎng)短所引起的不確定性可通過設(shè)定上側(cè)設(shè)計(jì)值以及恰當(dāng)?shù)闹眯艆^(qū)間進(jìn)行消除或降低,并因此提高設(shè)計(jì)成果的準(zhǔn)確性與可靠性。