賈一凡,宋松柏
(1.西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,陜西 楊凌 712100; 2.西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,陜西 楊凌 712100)
洪水是最常見的自然災(zāi)害之一,利用有限的水文觀測(cè)資料發(fā)掘洪水規(guī)律,并據(jù)此制定相應(yīng)的預(yù)防措施可以避免或減少不必要的損失[1]。洪水頻率分析通過選定的頻率分布來估計(jì)洪水特征值,預(yù)測(cè)未來事件的發(fā)生概率。洪水頻率分布參數(shù)的合理估計(jì),直接影響洪水設(shè)計(jì)值計(jì)算的合理性。由于氣候變化及人類活動(dòng)的影響,洪水的驅(qū)動(dòng)機(jī)制及發(fā)生規(guī)律等出現(xiàn)了顯著的變化,針對(duì)這些變化,近年來國(guó)內(nèi)外學(xué)者不斷開展洪水頻率分析的不確定性研究,以提高洪水預(yù)報(bào)精度[2-5]。
洪水頻率分析的關(guān)鍵步驟為頻率分布線型及參數(shù)估計(jì)方法的選擇,它們決定了擬合的效果[6]。目前較為廣泛使用的頻率分布有P-Ⅲ分布、對(duì)數(shù)P-Ⅲ分布、廣義Pareto分布(GPA)、廣義極值分布(GEV)、廣義Logistic分布(GLO)和Gamma分布等。常用的參數(shù)估計(jì)方法有矩法(MOM)、線性矩法(LM)、極大似然法(MLE)、適線法及概率權(quán)重矩法(PWMM)等[7],這些方法各有優(yōu)缺點(diǎn),在不同實(shí)例中應(yīng)用時(shí)會(huì)產(chǎn)生較大差異[8]。極大似然法估計(jì)的參數(shù)是漸近有效和無偏的,因此優(yōu)于矩法[9],但它求解過程煩瑣。傳統(tǒng)矩法采用樣本矩代替總體矩,原理簡(jiǎn)單,實(shí)際應(yīng)用方便,但是偏態(tài)系數(shù)會(huì)產(chǎn)生較大誤差,導(dǎo)致該方法不能輕易作為單獨(dú)的估計(jì)方法來使用[10],通常與其他方法參照應(yīng)用[11]。相比傳統(tǒng)矩法,線性矩法受樣本變異性的影響較小,具有良好的不偏性。同時(shí),對(duì)于數(shù)據(jù)中的異常值,線性矩法比傳統(tǒng)矩法更加穩(wěn)健,并且能從小樣本中推斷可能的概率分布[12],但該方法的缺點(diǎn)是對(duì)水文極值序列中極大值和極小值反應(yīng)不敏感。
在線性矩法的基礎(chǔ)上,進(jìn)行大幅度修改的TL矩法(TLM)[13]于2003年被提出,該方法對(duì)極端觀測(cè)值分配零權(quán)重,消除了小樣本序列中零值產(chǎn)生的不利影響。從總體線性矩的意義上來說,在TL矩中,概念樣本次序統(tǒng)計(jì)量的期望被較大樣本次序統(tǒng)計(jì)量的期望所代替,其增加的樣本數(shù)量等于修正的總量,所以TL矩相比線性矩和傳統(tǒng)矩具有一定的優(yōu)勢(shì)[14]。從TL矩法提出至今,國(guó)外學(xué)者解決了該方法的實(shí)際應(yīng)用問題。Ahmad等[15]對(duì)GPA、GEV、GLO分布的TL矩法(修正量t1=1,t2=0)參數(shù)估計(jì)式進(jìn)行了推導(dǎo)。Mat等[16]整理計(jì)算出了三參數(shù)對(duì)數(shù)正態(tài)分布和P-Ⅲ分布的TL矩,其中修正量t1=1,2,3,4。TL矩法在實(shí)際應(yīng)用中存在修正量的選擇問題,Ahmad等[17]研究表明,與TL矩法和線性矩法相比,僅調(diào)整最小值的TL矩法(修正量t1=1,t2=0)在估計(jì)高流量分位數(shù)方面具有更高的精度,它能夠減少小樣本值的不利影響。由于TL矩法的優(yōu)越性,TL矩法逐漸應(yīng)用于洪水頻率分布參數(shù)估計(jì)[18-25]。
線性矩法是使用較為成熟的一種參數(shù)估計(jì)方法,在洪水頻率分析中應(yīng)用廣泛,而基于線性矩法發(fā)展起來的TL矩法在一些研究中表現(xiàn)出較好的擬合效果。目前,我國(guó)還缺乏該方法的普適性研究。本文以陜北地區(qū)神木、綏德、杏河、劉家河、黃陵和志丹6個(gè)水文站的年最大洪峰流量序列為例,選取常用的3個(gè)三參數(shù)分布(GPA、GEV、GLO),分別用極大似然法、線性矩法及TL矩法進(jìn)行參數(shù)估計(jì),采用確定性系數(shù)(R2)和均方根誤差(RMSE)進(jìn)行分布線型及參數(shù)估計(jì)方法優(yōu)選[26]。
Hosking[12]將線性矩定義為概率權(quán)重矩的線性組合。假設(shè)隨機(jī)變量X是樣本容量為r的樣本,X1:r≤X2:r≤…≤Xr:r表示相應(yīng)的次序統(tǒng)計(jì)量,其定義的線性矩為
(1)
式中E(Xr-k:r)為容量為r的樣本中第r-k位的次序統(tǒng)計(jì)量的期望值。
L-偏態(tài)系數(shù)和L-峰度系數(shù)為
(2)
從樣本次序統(tǒng)計(jì)量X1:n≤X2:n≤…≤Xn:n中估算樣本線性矩[18]:
(3)
式中n為樣本容量。
Elamir等[13]提出的TL矩法在線性矩法的基礎(chǔ)上進(jìn)行了大幅度的修改,將樣本容量r替換為r+t1+t2,其中增加的樣本數(shù)量為t1個(gè)概念樣本中的最小值與t2個(gè)概念樣本中的最大值個(gè)數(shù)之和。因此,式(1)中的E(Xr-k:r)替換為E(Xr+t1-k:r+t1+t2)。在TL矩法的研究中,主要問題是修正量t1和t2的選擇,經(jīng)過經(jīng)驗(yàn)及理論驗(yàn)證,樣本中較小的值會(huì)影響高分位數(shù)估計(jì)時(shí)的準(zhǔn)確性,因此僅修正最小值即t2=0時(shí)就可以得到準(zhǔn)確的結(jié)果。研究[15,27-28]表明,修正量t1=1、t2=0時(shí)TL矩法能得到更好的參數(shù)估計(jì)結(jié)果,因此本文取t1=1,t2=0。
將r階的TL矩定義為
(4)
取t1=1,t2=0,得到前4階TL矩:
(5)
(6)
(7)
(8)
(9)
從樣本次序統(tǒng)計(jì)量X1:n≤X2:n≤…≤Xn:n中估算樣本TL矩:
(10)
樣本TL-偏態(tài)系數(shù)與樣本TL-峰度系數(shù)計(jì)算公式為
(11)
a.GPA分布參數(shù)的TL矩法估計(jì)。GPA分布的分位數(shù)函數(shù)為
(12)
對(duì)應(yīng)TL矩法參數(shù)估計(jì)式[29]為
(13)
(14)
(15)
b.GEV分布參數(shù)的TL矩法估計(jì)。GEV分布的分位數(shù)函數(shù)為
(16)
對(duì)應(yīng)TL矩法參數(shù)估計(jì)式[15]為
(17)
(18)
(19)
c.GLO分布參數(shù)的TL矩法估計(jì)。GLO分布的分位數(shù)函數(shù)為
(20)
對(duì)應(yīng)TL矩法參數(shù)估計(jì)式[17]為
(21)
(22)
(23)
選取陜北地區(qū)神木、綏德、杏河、劉家河、黃陵和志丹6個(gè)水文站的年最大洪峰流量資料,開展基于極大似然法、線性矩法和TL矩法的參數(shù)估計(jì)方法對(duì)比研究,進(jìn)行GPA、GEV、GLO 3種三參數(shù)分布的曲線擬合,選用確定性系數(shù)和RMSE準(zhǔn)則分析不同頻率分布及不同參數(shù)估計(jì)方法下的擬合效果。經(jīng)審查,選用資料滿足一致性、可靠性及代表性要求,可用于計(jì)算。具體資料系列長(zhǎng)度如表1所示。
表1 洪水資料系列長(zhǎng)度
利用Matlab編程,將GPA、GEV、GLO 3種三參數(shù)分布通過極大似然法、線性矩法及TL矩法計(jì)算得到α、ξ和k3個(gè)參數(shù)值,參數(shù)估計(jì)結(jié)果如表2所示。
分析3種參數(shù)估計(jì)方法下的3種分布線型對(duì)經(jīng)驗(yàn)點(diǎn)據(jù)的擬合情況,繪制頻率曲線,以GPA分布線型為例,結(jié)果如圖1所示。
從圖1可以看出,整體上線性矩法與TL矩法的擬合效果優(yōu)于極大似然法,能兼顧到經(jīng)驗(yàn)點(diǎn)據(jù)各部分。神木站和綏德站上尾部分TL矩法擬合效果更好,下尾部分?jǐn)M合效果不及極大似然法與線性矩法;劉家河、黃陵和志丹站線性矩法與TL矩法擬合效果相當(dāng)且優(yōu)于極大似然法。結(jié)合實(shí)際來看,洪水頻率分析中更為注重上尾部分的擬合,因此TL矩法在上尾部分較優(yōu)的擬合效果更有利于洪水設(shè)計(jì)值的選定。
確定性系數(shù)通常用于判斷觀測(cè)值與設(shè)計(jì)值的擬合程度,它是頻率分布優(yōu)選的常用指標(biāo)之一。確定性系數(shù)值越接近于1,表明設(shè)計(jì)值越接近于實(shí)際觀測(cè)值,即擬合效果越好。各站年最大洪峰流量序列不同參數(shù)估計(jì)方法確定性系數(shù)計(jì)算結(jié)果如表3所示。
從表3結(jié)果來看,除杏河站之外的其他5個(gè)水文站GPA分布確定性系數(shù)值均大于GEV分布以及GLO分布,依據(jù)數(shù)值接近1的原則,得出神木、綏德、劉家河、黃陵和志丹5個(gè)水文站選用GPA分布來描述更合適,GEV分布次之。而杏河站GEV分布的確定性系數(shù)值相比GPA分布與GLO分布要更接近于1,選用GEV分布擬合效果最優(yōu),GLO分布次之。由于杏河站年最大洪峰流量序列長(zhǎng)度遠(yuǎn)小于其他5個(gè)水文站,小樣本量可能會(huì)影響頻率分布線型的選擇而產(chǎn)生誤導(dǎo)性結(jié)果,因此認(rèn)為該區(qū)域用GPA分布擬合年最大洪峰流量序列較為準(zhǔn)確。
表2 各水文站年最大洪峰流量序列分布參數(shù)估計(jì)結(jié)果
(a) 神木
(b) 綏德
(c) 杏河
(d) 劉家河
(e) 黃陵
(f) 志丹
選取RMSE來定量評(píng)價(jià)參數(shù)估計(jì)方法,并進(jìn)行參數(shù)估計(jì)方法優(yōu)選。RMSE能衡量觀測(cè)值與設(shè)計(jì)值之間的偏差,RMSE值越小擬合效果越好。各水文站對(duì)應(yīng)RMSE值如表4所示。
表3 各水文站年最大洪峰流量序列不同參數(shù)估計(jì)方法確定性系數(shù)
表4 各水文站年最大洪峰流量序列不同參數(shù)估計(jì)方法RMSE值
由表4結(jié)果可知,對(duì)6個(gè)水文站進(jìn)行頻率分析后,極大似然法對(duì)應(yīng)的RMSE值均大于線性矩法與TL矩法的RMSE值,表明極大似然法的擬合效果劣于線性矩法及TL矩法。同時(shí),線性矩法與TL矩法相比,作為基于線性矩法擴(kuò)展而來的TL矩法,其對(duì)應(yīng)RMSE值更小,因此兩者相比,TL矩法優(yōu)于線性矩法。
a.選取的3種三參數(shù)分布中,杏河站用廣義極值分布描述更為合理,而廣義Pareto分布能較好地?cái)M合神木、綏德、劉家河、黃陵和志丹5個(gè)水文站年最大洪峰流量序列。
b.線性矩法和TL矩法擬合效果優(yōu)于極大似然法,而線性矩法與TL矩法兩者相比,TL矩法表現(xiàn)更優(yōu)。在對(duì)陜北地區(qū)的洪水頻率分析中,TL矩法是一種可取的、擬合效果合理的參數(shù)估計(jì)方法。