任趙飛,王科華,張 軍,李偉儀
(中交第四航務(wù)工程勘察設(shè)計(jì)院有限公司,廣東廣州 510290)
目前,水文極值分析中常采用適線(xiàn)法[1-2]進(jìn)行概率分布的選型和極值的擬合計(jì)算,這種方法優(yōu)點(diǎn)在于比較靈活的考慮多種因素對(duì)分布曲線(xiàn)的影響,缺點(diǎn)在于人的主觀任意性較強(qiáng),不同的人即使采用同一種分布函數(shù),得出的結(jié)果差異也可能較大。2015 年,孟彩俠等[3]分析比較了excel、頻率計(jì)算軟件和集對(duì)分析三種擬合方法的優(yōu)缺點(diǎn),認(rèn)為集對(duì)分析法在一定程度上克服了常規(guī)目估適線(xiàn)法的主觀任意性。隨著商業(yè)軟件的廣泛應(yīng)用,基于R 軟件[4]、MIKE 軟件等進(jìn)行的水文頻率計(jì)算和適線(xiàn)繪制極大的提高了工作效率,但他們也是基于目估的適線(xiàn)法。杜懿等[5]應(yīng)用K-S 檢驗(yàn)和A-D 檢驗(yàn)分析6 種分布理論函數(shù)在降雨極值分析中的優(yōu)劣。倪世偉等[6]提出基于Cs和Ck相對(duì)關(guān)系進(jìn)行徑流量分布函數(shù)的初步選型,但僅涉及4 種分布函數(shù)。
本文結(jié)合菲律賓馬尼拉灣某項(xiàng)目極值風(fēng)速設(shè)計(jì),在對(duì)比國(guó)內(nèi)外規(guī)范的基礎(chǔ)上,分別采用兩種理論分布快速選型方法選出的理論分布進(jìn)行極值風(fēng)速擬合,并對(duì)所得結(jié)果進(jìn)行分析對(duì)比。所得成果可為類(lèi)似工程設(shè)計(jì)提供參考。
K-S和A-D是兩種統(tǒng)計(jì)學(xué)中常用的擬合優(yōu)度檢驗(yàn)方法,主要用來(lái)檢驗(yàn)給定樣本是否服從指定的分布函數(shù),屬于非參數(shù)檢驗(yàn)方法[5]。
K-S 檢驗(yàn)是以?xún)晌惶K聯(lián)數(shù)學(xué)家Kolmogorov 和Smirnov[6]的名字命名的,它是一個(gè)擬合優(yōu)度檢驗(yàn)。K-S 檢驗(yàn)通過(guò)對(duì)兩個(gè)分布之間的差異的分析,判斷樣本的觀察結(jié)果是否來(lái)自制定分布的總體。A-D(Anderson-Darling)檢驗(yàn)是對(duì)K-S 檢驗(yàn)的一種修正[5],相比K-S 檢驗(yàn)它加重了對(duì)尾部數(shù)據(jù)的考量,K-S 檢驗(yàn)具有分布無(wú)關(guān)性,它的臨界值并不依賴(lài)被測(cè)的特定分布,而A-D 檢驗(yàn)使用特定分布去計(jì)算臨界值,這使得A-D 檢驗(yàn)具有更靈敏的優(yōu)勢(shì)。
其中,K-S和A-D檢驗(yàn)的統(tǒng)計(jì)量定義分別如下:
其中:D為K-S 檢驗(yàn)的統(tǒng)計(jì)量;A2為A-D 檢驗(yàn)的統(tǒng)計(jì)量;n為樣本序列的長(zhǎng)度;Fn(x)表示指定樣本序列的經(jīng)驗(yàn)分布;F0(x) 表示指定樣本序列的理論分布。統(tǒng)計(jì)量值越小,說(shuō)明指定分布函數(shù)的擬合效果越好,表現(xiàn)越優(yōu)。詳細(xì)計(jì)算原理與步驟見(jiàn)文獻(xiàn)[7]。
偏度系數(shù)Cs主要用于反映樣本概率密度曲線(xiàn)的對(duì)稱(chēng)特征[1],即衡量樣本在均值兩側(cè)分布的對(duì)稱(chēng)程度的參數(shù)。水文現(xiàn)象大多屬于正偏,Cs>0。峰度系數(shù)Ck主要用于反映樣本概率密度曲線(xiàn)在眾數(shù)附近的“峰”的尖峭程度,正態(tài)分布的Ck=0。樣本偏度系數(shù)Cs和峰度系數(shù)Ck的計(jì)算式如下:
式中:n為樣本數(shù);為樣本均值,σ為樣本方差。
水文分布函數(shù)的Cs和Ck匯總?cè)绫?。
表1 不同理論分布函數(shù)的Cs和Ck
采用Matlab 編程,將上文提及的頻率分布函數(shù)的Cs和Ck相對(duì)關(guān)系集中顯示對(duì)比,如圖1 所示。
圖1 Cs和Ck相對(duì)關(guān)系
概率分布初步選型的主要步驟為:首先,根據(jù)表1 公式計(jì)算并繪制不同分布函數(shù)的Cs~Ck相對(duì)關(guān)系曲線(xiàn);然后計(jì)算選取樣本的Cs與Ck值,并將其繪制到上述Cs~Ck曲線(xiàn)中;最后選擇與樣本點(diǎn)距離最近的理論分布作為初步推薦的概率分布。上述方法的核心原理在于,當(dāng)樣本的Cs~Ck點(diǎn)越靠近理論分布的Cs~Ck曲線(xiàn)或點(diǎn),則該理論分布越能較好的擬合出樣本的對(duì)稱(chēng)性和扁平度。
以菲律賓馬尼拉灣某項(xiàng)目為例。采用近海NOAA 1979~2016 年共37 年風(fēng)后報(bào)數(shù)據(jù)為基礎(chǔ)風(fēng)場(chǎng)數(shù)據(jù),如圖2 所示。
圖2 菲律賓馬尼拉灣近海風(fēng)速時(shí)間過(guò)程
由于工程區(qū)域受臺(tái)風(fēng)影響明顯,臺(tái)風(fēng)期NOAA風(fēng)的后報(bào)數(shù)據(jù)極值風(fēng)速偏低,選取1977~2015 年工程位置200 km范圍內(nèi)的35場(chǎng)典型臺(tái)風(fēng),采用Young&Sobey 臺(tái)風(fēng)場(chǎng)模型,利用JTWC 臺(tái)風(fēng)資料(其中包括時(shí)間、路徑、臺(tái)風(fēng)中心最大風(fēng)速和臺(tái)風(fēng)中心氣壓等)生成局部大范圍海域臺(tái)風(fēng)典型風(fēng)場(chǎng),其中1995 年臺(tái)風(fēng)ANGELA 典型風(fēng)場(chǎng)見(jiàn)圖3。
圖3 臺(tái)風(fēng)ANGELA 典型風(fēng)場(chǎng)(1995.11)
以NOAA 后報(bào)風(fēng)數(shù)據(jù)和JTWC 臺(tái)風(fēng)場(chǎng)數(shù)據(jù)為基礎(chǔ),共同合成工程位置37 年風(fēng)數(shù)據(jù)時(shí)間序列。合成過(guò)程中采用典型臺(tái)風(fēng)風(fēng)場(chǎng)模擬數(shù)據(jù)替換同期NOAA 后報(bào)風(fēng)數(shù)據(jù)。
關(guān)于極值風(fēng)速統(tǒng)計(jì)分析所采用的理論分布,中國(guó)規(guī)范《海堤工程設(shè)計(jì)規(guī)范》[9](GB/T 51015-2014)和《建筑結(jié)構(gòu)荷載規(guī)范》[10](GB 50009-2012)推薦采用極值I型,美國(guó)海岸工程手冊(cè)[11](CEM)推薦采用FT-I、FT-II 和威布爾(Weibull)分布,中國(guó)規(guī)范《港口與航道水文規(guī)范》[12](JTS 145-2015)、英國(guó)規(guī)范(BS 6349)[13]、西班牙規(guī)范(ROM 0.4-95)提供了多種理論分布,并表明要以擬合最佳為原則選配。各國(guó)標(biāo)準(zhǔn)中,英國(guó)規(guī)范(BS 6349)明確指出極值統(tǒng)計(jì)分析中要確定外推值的置信區(qū)間,并明確數(shù)據(jù)樣本必須確保各自相互獨(dú)立,一場(chǎng)風(fēng)暴最多只能選擇一個(gè)樣本參與極值統(tǒng)計(jì)。
總體而言,理論分布的選取,應(yīng)以擬合最佳為原則進(jìn)行選配,同時(shí)要確定外推值的置信區(qū)間。下文將基于2種樣本篩選方法得到的典型樣本進(jìn)行理論分布的快速選型。
分別采用年極值法(Annual Maximum Method)和閾值法(Peak Over Threshold Method)從37 年合成風(fēng)速時(shí)間序列中篩選出不分方向的極值風(fēng)速樣本系列。
1)利用Cs~Ck相對(duì)關(guān)系進(jìn)行理論分布快速選型
分別計(jì)算年極值法樣本和閾值法樣本的偏度系數(shù)Cs和峰度系數(shù)Ck,并結(jié)合圖1 中不同分布的Cs和Ck,見(jiàn)圖4。
圖4 兩類(lèi)樣本和不同理論分布的Cs和Ck關(guān)系曲線(xiàn)
從圖4 可以直觀看出,對(duì)于篩選的樣本,年極值法樣本系列Cs~Ck點(diǎn)與G-Pareto 和Weibull 理論分布的Cs~Ck曲線(xiàn)相對(duì)更近,閾值法樣本系列Cs~Ck點(diǎn)與G-Pareto、Pearson-III 和Weibull 理論分布的Cs~Ck曲線(xiàn)相對(duì)更近。
2)利用K-S 檢驗(yàn)和A-D 檢驗(yàn)進(jìn)行理論分布快速選型
當(dāng)K-S/A-D 檢驗(yàn)的統(tǒng)計(jì)量小于對(duì)應(yīng)于顯著性水平ɑ=0.05 時(shí)的臨界值(Critical Value)時(shí),認(rèn)為樣本來(lái)自具有理論分布的總體,即符合理論分布,反之亦然。
從表2 可以看出,年極值法序列檢驗(yàn)中,G-Pareto 和Pearson-III 均表現(xiàn)良好,F(xiàn)rechet 表現(xiàn)稍差,但均滿(mǎn)足顯著性水平;閾值法序列檢驗(yàn)中,Weibull 表現(xiàn)最好,其次G-Pareto 和Frechet 表現(xiàn)稍差,但也均滿(mǎn)足顯著性水平。Gumbel、指數(shù)分布以及瑞利分布在K-S 檢驗(yàn)/A-D 檢驗(yàn)中均表現(xiàn)較差,選取的樣本不滿(mǎn)足相應(yīng)頻率分布的顯著性檢驗(yàn)水平。Log-Normal 分布對(duì)于年極值法序列,K-S/A-D檢驗(yàn)均良好,滿(mǎn)足顯著性水平,但對(duì)閾值法序列的檢驗(yàn)較差,不滿(mǎn)足顯著性水平。
表2 兩類(lèi)樣本點(diǎn)的K-S 和A-D 檢驗(yàn)結(jié)果
基于3.3 節(jié)初步結(jié)論,對(duì)于年極值法樣本系列,本案例采用G-Pareto、Pearson-III、Frechet 以及Weibull 理論分布進(jìn)行適線(xiàn)擬合,對(duì)于閾值法樣本系列,采用Weibull 和G-Pareto 理論分布進(jìn)行擬合,并給出95 %置信度的限值。
分布的選擇上,從3.3 節(jié)初步對(duì)比:
1)兩種方法優(yōu)選推薦的理論分布函數(shù)基本一致,即年極值法序列推薦G-Pareto 和Pearson-III 理論分布;閾值法序列推薦Weibull 和G-Pareto 理論分布。
2)兩類(lèi)樣本的基于Frechet 分布的K-S/A-D 檢驗(yàn)均滿(mǎn)足顯著性水平,而樣本的Cs~Ck分布點(diǎn)卻距離Frechet 理論分布Cs~Ck曲線(xiàn)較遠(yuǎn)。
3)閾值法樣本Cs~Ck分布點(diǎn)距Pearson-III 理論分布Cs~Ck曲線(xiàn)較近,A-D 檢驗(yàn)也滿(mǎn)足顯著性水平,但K-S 檢驗(yàn)的統(tǒng)計(jì)量略大于臨界值??傮w而言,兩類(lèi)方法各有其特點(diǎn),實(shí)際應(yīng)用中建議結(jié)合使用,雙向驗(yàn)證,從而選出最適宜所選樣本的理論分布。
極值分析上,對(duì)比表3:
表3 極值風(fēng)速分析結(jié)果(m/s)
1)以上分布對(duì)極值風(fēng)速的擬合結(jié)果均較好,且采用不同分布得到的同一重現(xiàn)期設(shè)計(jì)風(fēng)速偏差在10 %以?xún)?nèi)。
2)閾值法樣本擬合得到的重現(xiàn)期風(fēng)速總體略大于年極值樣本擬合的結(jié)果,且頭部大樣本均位于估計(jì)均值的下方,表明可能存在重現(xiàn)期風(fēng)速總體估計(jì)偏小的風(fēng)險(xiǎn)。
3)為了最大程度的減小設(shè)計(jì)風(fēng)速估計(jì)偏小的風(fēng)險(xiǎn),確定外推值的置信區(qū)間是非常必要的。本文給出設(shè)計(jì)極值95 %置信區(qū)間上下限值,所有樣本均處于95 %置信區(qū)間范圍內(nèi)。
本文結(jié)合菲律賓馬尼拉灣某項(xiàng)目極值風(fēng)速分析,通過(guò)比較對(duì)理論分布兩種快速選型方法,初步表明:兩種方法優(yōu)選推薦的理論分布函數(shù)高度一致,但對(duì)于個(gè)別理論分布存在差異,建議實(shí)際應(yīng)用中應(yīng)雙向驗(yàn)證,從而選出最適宜所選樣本的理論分布?;趦深?lèi)方法推薦的理論分布,進(jìn)行極值風(fēng)速估計(jì),初步表明:
1)推薦分布對(duì)極值風(fēng)速的擬合結(jié)果均較好,且同一重現(xiàn)期設(shè)計(jì)風(fēng)速偏差在10 %以?xún)?nèi)。
2)閾值法樣本擬合得到的重現(xiàn)期風(fēng)速總體略大于年極值樣本擬合的結(jié)果,且頭部大樣本均位于估計(jì)均值的下方,表明可能存在重現(xiàn)期風(fēng)速總體估計(jì)偏小的風(fēng)險(xiǎn)。
3)為了最大程度的減小設(shè)計(jì)風(fēng)速估計(jì)偏小的風(fēng)險(xiǎn),確定外推值的置信區(qū)間是非常必要的。本文給出設(shè)計(jì)極值95 %置信區(qū)間上下限值,所有樣本均處于95 %置信區(qū)間包絡(luò)線(xiàn)內(nèi)。