沈鐵元,劉靜,向怡衡,祁海霞,殷志遠,王俊超
(1.中國氣象局武漢暴雨研究所,暴雨監(jiān)測預警湖北省重點實驗室,武漢 430205;2.湖北省氣象服務中心,武漢 430205)
降雨的概率密度(Probability density,簡記為PD)函數能反映降雨的氣候與區(qū)域特征以及實況降水中較少觀測到的強降水發(fā)生的可能性與分布,為此20世紀一些學者基于日降雨觀測開展了研究。張耀存和丁裕國(1991)建立了降雨量概率分布的通用模式;丁裕國(1994)等利用日降雨觀測資料驗證了氣候降水量頻數分布的最佳模式,并理論證明了降雨量頻數(時間域、空間域)的最可幾分布為Γ分布,由此構建了較完備的降雨概率密度理論體系,擬合函數普適性強,擬合參數物理意義明晰,并由此帶來計算與分析上的便利,但是這種采用極大似然估計法的優(yōu)勢并不在于擬合精度。丁裕國等(2009)介紹了氣候概率分布理論及其應用研究增加的新內涵與進展;魏鋒等(2005)基于概率加權、Ding等(2008)采用廣義帕雷托分布(GPD)和廣義極值分布(GEV)對極端降水時空分布進行模擬。類似研究工作的進展推進了其應用領域的拓展,使其在分析與預報極端強降雨與洪水、計算設計暴雨雨型與暴雨強度公式、分析自動雨量站觀測數據質量等方面成為了一種重要工具。另外,Dijkvan等(2004)應用其來建立徑流與土壤侵蝕模型;向小龍等(2020)將其應用于建立滑坡失穩(wěn)概率模型;周建中等(2020)建立的水文預報方法及系統中使用了強降雨和弱降雨下的后驗概率密度函數;Zou等(2014)利用其來檢驗區(qū)域氣候模式中積云參數化方案的優(yōu)化效果;Ogarekpe等(2020)利用其來檢驗了16個全球環(huán)流模式的月降雨模擬結果;陳愛軍等(2018)將其應用于評估衛(wèi)星降水估計精度;沈艷等(2013)將其應用于評估降水量融合產品質量檢驗。近年來一些研究使用概率密度匹配法來改進定量降雨估算結果,如宇婧婧等(2013)改進的衛(wèi)星估算降水方法、Seppo等(2016)建立的雷達估算降雨模型、潘旸等(2018)介紹的高分辨率三源融合降水產品業(yè)務系統。
PD應用的拓展又對其研究工作提出了更高的需求,當前降雨觀測時空分辨率得到了大幅提高,以日降雨資料得出的研究結果需要以新的海量資料來發(fā)展完善。隨著我國自動氣象站逐步增加,利用逐時降雨有了大量研究,其中涉及概率密度或(和)概率分布的相對較少,姚莉等(2009)基于我國485站14 a逐時降雨分析了六個雨強級別的年均發(fā)生頻率、日變化和極端降水等,指出百年一遇的逐時降雨量達100~150 mm,高值區(qū)主要在東南沿海一帶。其中研究對象雖是降雨發(fā)生頻率(頻次),但分別針對六個雨強級別來分析,已具備逐時降雨概率密度的雛形。田付友等(2014)用518個站點18年暖季的小時降水資料,用Γ函數估算概率密度分布,給出了超過閾值的降水累積概率分布,認為極端小時降水的閾值自西北向東南增大,華南沿海和海南島西北部為短時強降水最容易出現的區(qū)域。趙琳娜等(2017)用中國東南818個國家站33 a夏季小時降水資料以及臺風路徑觀測數據分離出臺風降水后擬合Gamma概率密度函數分布參數,得到臺風小時降水總的降水概率分布特征以及不同臺風影響距離和臺風強度影響下超過給定閾值的降水累積概率分布與極端降水閾值。王彬雁等(2018)用皮爾遜Ⅲ型概率分布模型對四川省測站降水進行擬合,根據降水累積概率空間分布的擬合函數,計算了最大小時降水量的概率分布及其重現期極值。這些研究承襲了極大似然估計法使用Gamma函數(或其變形)來擬合,均未給出擬合優(yōu)度(或確定系數)、均方差之類的擬合統計量。
對于逐時降雨的概率密度(或分布),極端強降雨的發(fā)生是小概率事件,樣本數量非常有限,降雨概率密度的研究勢必受到觀測資料年限的限制,相關研究較難深入開展,致使目前降雨概率密度尚難以得到精細化的結果,其函數擬合精度仍需提高、降雨等級需要細化,特別是對強降雨段(或小概率降雨段、長重現期降雨段)有待提高。當前降雨觀測條件的改善,同時先進的數學擬合技術也大為改觀,為提高擬合精度提供了有力支撐,勢必推動降雨概率密度研究向精細化方向發(fā)展,并為相關應用奠定更科學的數理基礎。精細化研究包括七個發(fā)展方向:細化分類;提高擬合精度;增強擬合函數與方法普適性;細分降雨等級;延展至更強降雨;結合地理地形篩選降雨結構特征參數及其時空分布的影響因子分析;研究聯合概率密度分布,聯合的對象諸如雷達回波、云反射因子、各高度層溫壓濕風等氣象要素與降雨。其中“細化分類”這一方向便牽出了降雨的類條件概率密度(CCPD),參考邊肇祺(2000)關于類條件概率密度的概念,定義降雨的類條件概率密度為在某降雨定條件或類別狀態(tài)下的概率密度,是概率密度下的次級“小”概念,其定義域是降雨概率密度定義域的子域,其在定義域內的積分為1。定條件是指有雨、連續(xù)性降雨這樣的條件(另外還可設定為強降雨、夏雨、夜雨、臺風降雨、暖季降雨等);類別狀態(tài)指降雨歷時、無降雨歷時這樣的類別。降雨的類條件概率密度在其函數定義域內與降雨概率密度存在倍率關系。引入這一概念是為了對特定條件或類別開展分析研究,從而能夠更深入細致地去探討降雨結構特征及地域差異。以往也曾有過相關研究,但均使用概率分布(或概率密度)來表述,致使大小概念混用,該概念的引入能梳理相關概念并分類歸納,建議逐步規(guī)范以避免大小概念混用。
本文在我國洪澇災害主要發(fā)生區(qū)內以空間開窗口方式選擇六個分區(qū),細分四十二個降雨等級,統計逐時降雨量、逐時連續(xù)降雨過程雨量、逐時連續(xù)降雨歷時等三類類條件概率密度進行分區(qū)比較,選擇一種與以往研究不同的擬合方法和擬合函數開展擬合研究,從而得到高精度的降雨類條件概率密度算法,以期為定量降雨估算中概率密度匹配法等提供新的、更細致可靠的數據來源。
為了更好地了解我國長江梅雨鋒地帶上的降雨特征,沿30°N選取四個經緯度長方形區(qū)域為研究對象,同時在其南北各選取了一個區(qū)域來與之進行比較分析。圖1給出了六個分區(qū)及所處地理位置示意圖。圖中分區(qū)編號I、II、III、IV、V、VI按降雨頻率降序排列,前五個分區(qū)年均降水量大于1 000 mm,VI區(qū)最小、不足800 mm。I、II、III、IV區(qū)同在30°N線上。I區(qū)位于四川雅安附近,由于其周邊地形坡降大,為避免代表性的減弱而選取了1°×0.6°相對較小的范圍;V區(qū)范圍2.6°×2.3°,包含海南全島;II區(qū)位于杭州灣以西,III區(qū)位于鄂西南山區(qū),IV區(qū)位于江漢平原南部,VI區(qū)位于華北平原、黃河流域內,這四個分區(qū)經緯度范圍均為2°×1°。
圖1 研究選定的六個分區(qū)(紅色方框內是分區(qū)編號)方框內及所處地理位置示意圖Fig.1 The research selected six sub-regions(red boxes with division number in the boxes)and schematic diagram of their geographical location.
本文使用了六個分區(qū)內近1700個自動降雨觀測站(含國家站和區(qū)域站)近年的逐時降雨觀測資料(以下簡稱HR),其中V區(qū)使用了海南島內21個國家站的降雨資料,為保障統計樣本數量,故選取的范圍比其它五個分區(qū)大;其余五個分區(qū)使用了國家站和區(qū)域站資料。表1給出了六個分區(qū)降雨資料的基本情況及逐時降雨頻率,從中可見,各分區(qū)降雨統計資料平均年限并不相同,其原因是為了更充分地利用現有數據資料。選取2020年10月29日00時(北京時,下同)為所有資料的截止時間,而資料的起始年份根據站點資料入庫時間來定,起始時間與截止時間的月、日、時相同,使資料時間長度保持為整年,且盡可能保障使用的資料年限最長,在資料年限短于4 a時觀測站資料全被棄用,故表1中參與統計的測站數要小于區(qū)域內測站數。從表中還可見,所有資料的缺測率均低于40‰,保障了資料的完整性及統計結果的可信度。
表1中還給出了逐時降雨頻率。為了避免與天氣預報中公眾已普遍接受的“降雨概率”概念上沖突或混淆,本文選用“降雨頻率”這一概念,而對于概率密度中“概率”一詞仍按慣例沿用不隨之調整。從表1可見,排名前四位均在30°N線上。雅安由于受到特定地形影響而最大,海南島即使處于低緯且受海洋性氣候影響也包含一些山地,而其降雨頻率居然比30°N線上各分區(qū)小。六個分區(qū)逐時降雨頻率差別大,I區(qū)近乎VI區(qū)的4倍,即使同在30°N線上,I區(qū)是IV區(qū)的1.74倍。
表1 研究選定的六個分區(qū)降雨資料基本情況及逐時降雨頻率Table 1 Basic information of rainfall data in research selected six sub-regions and frequency of hourly rainfall.
雖然自動雨量站觀測年限有限,但如果以空間換取時間,改變原來單站進行統計的方法,在相對較小的分區(qū)內多站并合來開展統計,能使樣本數量得到大幅提升,才有可能實現細分降雨等級,提高在強降雨區(qū)段概率密度擬合精度,契合PD研究精細化的發(fā)展方向。這種以空間換取時間的方式必須滿足在分區(qū)內地理、氣候特征相同,臨近站降雨特征相近。
針對上述六個分區(qū),統計逐時降雨、逐時連續(xù)降雨的頻率;同時細分降雨等級,對各降雨等級分別統計三類(逐時降雨量、逐時連續(xù)降雨過程雨量、逐時連續(xù)降雨歷時)類條件概率密度。通過六個分區(qū)之間的比較,可以分析降雨與降雨結構的地域性差異,有利于明晰類條件概率密度與概率密度的共性與差異性。以下簡要介紹降雨等級的劃分以及統計特征量、計算特征量。
1.3.1 降雨等級的劃分
依據降雨數據的樣本量根據經驗自行細分了四十二個降雨等級進行統計,原則是盡量使相鄰等級間統計值變化有序、經驗函數上下起伏跳躍小、盡量避免統計頻次為0的區(qū)間。表2分別給出了這四十二個降雨等級的區(qū)間中值、區(qū)間長度、區(qū)間上限,前二十四等級以降雨觀測的分辨率0.1 mm為間隔來劃分,區(qū)間長度也為0.1 mm,后十八個降雨等級由于發(fā)生頻次越來越小,隨降雨強度變強區(qū)間長度逐步加大,其中對于短時強降雨(Rain≥20 mm)僅分了七個等級。
表2 四十二個降雨等級的劃分表2 Classification of 42 rainfall grades.
1.3.2 各分區(qū)各等級下降雨發(fā)生頻次統計
針對六個分區(qū)統計各區(qū)內觀測次數、缺測次數、降雨頻次、逐時連續(xù)降雨場頻次。逐時連續(xù)降雨(HCR)是與孤立逐時降雨相對的,孤立逐時降雨指前后時次均無降雨的單獨小時降雨,HCR指在逐時降雨觀測中連續(xù)多個小時中降雨量均不為0的降雨過程。再針對各分區(qū)(公式中用M代替,分別取I、II、III、IV、V、VI)分別統計降雨量落在各降雨等級(N)下的次數;然后對各分區(qū)分別統計HCR過程雨量落在各降雨等級N下的次數,統計中先按各站點計數,后對分區(qū)內所有站點累計;最后對各分區(qū)分別統計逐時連續(xù)降雨歷時(HoCR)在2~42 h內各整數時數上的場次數,歷時在42 h以上降雨頻率太小而沒參與統計。
1.3.3 降雨頻率、類概率密度、類條件概率密度經驗函數的計算
根據上面統計的頻次便可以計算頻率、概率密度、類條件概率密度。頻率分兩類,PD、CCPD分別分三類,通過計算分別得出PD、CCPD在各分區(qū)M等級N(或連續(xù)歷時)下的概率質量,便可得到三類PD、CCPD的經驗函數。下面需要進行簡單計算的物理量僅列示了概念,公式略。
(1)逐時降雨頻率、逐時連續(xù)降雨頻率
通過上面統計頻次就可以得到各分區(qū)降雨頻率、逐時連續(xù)降雨頻率。用PHR(M)表示各分區(qū)逐時降雨頻率,用PCR(M)表示各分區(qū)逐時連續(xù)降雨頻率。連續(xù)降雨頻率可以按場次數、時數兩種方法來統計,由于兩者可以依據平均歷時相互轉化,故在第二、三類CCPD計算分析中選擇按場次來統計,而非時數。
分區(qū)內各降雨等級下的降雨頻次與總的降雨頻次比值再除以降雨等級的區(qū)間長度得到HR類的CCPD,是在各降雨等級中值附近CCPD的近似值,于是便有了第一類CCPD的經驗函數,在CCPD定義域類該CCPD與PHR(M)的乘積是HR類PD。第二類CCPD與之類似,第三類CCPD由于自變量是降雨歷時,間隔為1 h,所以根據各歷時下的降雨場次數除以總的逐時連續(xù)降雨頻次而得到。
(2)類條件概率密度(CCPD)
第一類:逐時雨量類的類條件概率密度HRCCPD(以下簡稱CCPD1),定義域是[0.1,∞);
第二類:逐時連續(xù)降雨過程雨量類的類條件概率密度HCRCCPD(以下簡稱CCPD2),定義域是[0.2,∞);
第三類:逐時連續(xù)降雨歷時類的類條件概率密度HoCRCCPD(以下簡稱CCPD3),定義域是[2,∞)。
下文中CCPD1、CCPD2單位為mm-1,CCPD3單位為h-1。
(3)類概率密度
與上面三類CCPD對應的PD,分別記為HRPD、HCRPD、HoCRPD,類似簡記為PD1、PD2、PD3。
PD1是CCPD1的PHR倍率關系,當然兩者間定義域是有差別的,前者是[0,∞),后者是[0.1,∞)。第一類概率密度PD1自變量是雨量,以前的研究中均以“降雨概率密度”稱之,為了便于區(qū)分,建議分類,讓相關大小概念規(guī)范化。
PD2是指HCR過程雨量落在某一單位降雨區(qū)間的發(fā)生頻率,CCPD2是僅針對有HCR發(fā)生(定義域縮小為[0.2,∞))才進行統計的過程雨量落在某一單位降雨區(qū)間的發(fā)生頻率,因此,PD2是CCPD2的PCR倍率關系。
PD3指HCR歷時在某個小時數下的發(fā)生頻率,CCPD3是僅針對HCR進行統計的降雨歷時在某個小時數下的發(fā)生頻率,其分布圖中橫坐標與CCPD2不同,由逐時連續(xù)降雨量變成了連續(xù)歷時(即持續(xù)時數),PD3是CCPD3的PCR倍率關系。
圖2給出了六個分區(qū)中的第一類概率密度PD1與第一類類條件概率密度CCPD1。為了便于識別強降雨段曲線結構與趨勢及分辨各曲線間微小差別,圖中采用了雙y軸坐標“一線兩畫”方式,對每個分區(qū)在同一張圖上同時給出y及l(fā)n(y)隨x坐標變化的兩條曲線;x坐標是降雨等級中值Rain的對數ln(Rain),x=0、1、2、3、4、5時分別對應Rain≈1、2.7、7.5、20、55、150 mm。在x>0時,CCPD1六條曲線黏合在一起,需要從右邊曲線簇才能區(qū)分辨認,在x<1時,ln(CCPD1)六條曲線黏合在一起,需要從左邊曲線簇才能區(qū)分辨認。圖中為了方便辨識區(qū)分,以曲線的方式給出,而沒有采用在四十二個降雨等級上給出離散數據點的繪圖方式。從圖2可見,CCPD1、PD1曲線均是單調凸(斜率遞增)減函數,弱降雨段遞減快,強降雨段遞減較慢;在雙對數圖上曲線均是單調凹減函數,弱降雨段遞減慢,強降雨段遞減較快。六根PD1曲線排列稀疏,而六根CCPD1曲線排列變得密集,并存在相互穿插黏合的現象。ln(PD1)、ln(CCPD1)曲線也是如此。原因在于PD1與降雨頻率成正比,而CCPD1是用來表示在有雨條件下不同量級降雨發(fā)生可能性的分布情況,即強、弱降雨出現多少的配置關系,與降雨頻率無關。六個分區(qū)降雨頻率的差別大(參見表1),降雨的地域間差異性會通過降雨頻率傳遞給PD1,導致圖2a中PD1曲線間差距大,V、VI兩區(qū)差別最大時能超8倍;CCPD1統計計算中拋開了無降雨的時間,不受降雨頻率影響,部分削弱了地理地形影響降雨結構的主要功效,更利于表征降雨的固有結構特征,故在圖2b中六根曲線較PD1差距小。由此可以說明:雖然對同一地域PD1、CCPD1均有反映降雨結構的能力,但在地域差異性分析時兩者相比較,PD1受地理地形影響大,受降雨頻率多少所左右,其能力將被削弱,更側重于用來表征指定降雨出現的可能性;CCPD1受地理地形影響相對小,反映強、弱降雨出現的配比情況更直截了當,更側重于用來反映降雨結構性特征,以及降雨結構性地域差異比較,尤其在表征強降雨出現難易程度的地域差異性上比PD1效果會更明顯。
在圖2b中V分區(qū)的ln(CCPD1)曲線與其他區(qū)表現出明顯的差異性,即橫坐標1.1~4.7區(qū)間內(Rain在3~100 mm區(qū)間)PD1、CCPD1明顯大于其他各區(qū),表明了V分區(qū)與其它區(qū)降雨結構性差異。海南島由于屬熱帶季風氣候,四面環(huán)海,水汽充沛、熱動力過程強烈等諸多降雨有利條件,是導致其CCPD1分布獨特的原因。V分區(qū)的這種持有降雨結構在圖2a中表現并不很突出,是由于受到海南島降雨頻率不高因素的干擾。
圖2 研究選定的六個分區(qū)中的第一類概率密度PD1(a)和第一類類條件概率密度CCPD1(b)(a:左邊曲線簇對應左邊y軸PD1,右邊曲線簇對應右邊y軸ln(PD1);b:左邊曲線簇對應左邊y軸CCPD1,右邊曲線簇對應右邊y軸ln(CCPD1))Fig.2 The first class(a)PD1 and(b)first CCPD1 in research selected six sub-regions(a:The left curve cluster corresponds to the left y-axis PD1,and the right curve cluster corresponds to the right y-axis ln(PD1).b:Left curve cluster corresponds to left y-axis CCPD1,right curve cluster corresponds to right y-axis ln(CCPD1)).
圖2a中藍色線代表分區(qū)I(雅安),在橫坐標大于3時(Rain>20 mm)PD1明顯大于30°N線上的其他三區(qū);圖2b中其CCPD1相比30°N其他區(qū)呈現兩端大、中間小的分布特征:起點高(指弱降雨等級下CCPD1高)但遞減快,在橫坐標0.3~2.5區(qū)間(1.3 mm
圖3 PD1、CCPD1 III與IV分區(qū)的差倍比Fig.3 Difference ratio of PD1 and CCPD1 comparing III with IV sub-regions.
表3給出了六個分區(qū)HCR的有關頻率統計值,從中可見,I、II分區(qū)接近且最大,VI分區(qū)位置偏北最??;III、IV分區(qū)處于中間位置但差距仍較大,III分區(qū)HCR頻率是IV分區(qū)的1.45倍;HCR海南島最小為4.29 h,其他五個區(qū)接近,II分區(qū)最大,為6 h。如果以場次記,孤立降雨與逐時連續(xù)降雨近乎各占一半,而按降雨時數記,孤立降雨占總降雨時數不足2成,逐時連續(xù)降雨占比超8成,I分區(qū)(雅安)逐時連續(xù)降雨占比最大,為87%;海南島孤立性降雨占比最大,逐時連續(xù)降雨占比最小,逐時連續(xù)降雨歷時最短。
表3 逐時連續(xù)降雨有關頻率統計值Table 3 Frequency statistical values of HCR.
圖4a、b分別給出了六個分區(qū)的PD2、CCPD2,也采用了雙y軸一線兩畫方式。從中可見,PD2、CCPD2曲線是單調凸減函數,在雙對數圖上曲線是單調凹減函數;I分區(qū)CCPD2相對其它區(qū)走勢類似其CCPD1,存在兩端大、中間小的分布特征;III、IV兩區(qū)HCR頻率差別較大(按時數記分別是0.107和0.076),兩區(qū)HCR頻率比值與HR頻率的比值(1.43)相當,山區(qū)比平原大1.45倍;PD2山區(qū)總體大于平原,且隨降雨等級加大差距縮小至趨同,并沒出現類似PD1平原反超山區(qū)的現象;V分區(qū)海南島CCPD2起點最低,但10 mm以上降雨CCPD2比其它區(qū)大,其PD2在強降雨段較大,但由于受到HCR頻率干擾而沒有CCPD2表現突出;VI分區(qū)由于地理位置偏北,PD1、PD2比其它區(qū)小,與其他五個分區(qū)差別大,但CCPD1、CCPD2與30°N線上四個分區(qū)差別小。
圖4 研究選定的六個分區(qū)的第二類概率密度PD2(a)和第二類類條件概率密度CCPD2(b)(a:左邊曲線簇對應左y軸PD2,右邊曲線簇對應右y軸ln(PD2);b:左邊曲線簇對應左y軸CCPD2,右邊曲線簇對應右y軸ln(CCPD2))Fig.4 The 2nd class(a)PD2 and(b)CCPD2 of research selected six sub-regions(a:The left curve cluster corresponds to the left y-axis PD2,and the right curve cluster corresponds to the right y-axis ln(PD2).b:Left curve cluster corresponds to left y-axis CCPD2,right curve cluster corresponds to right y-axis ln(CCPD2)).
圖5給出I、V分區(qū)的第三類條件概率密度。除V分區(qū)外的其他五個分區(qū)曲線較接近、曲線高度疊合,所以圖中把I分區(qū)選作代表。各分區(qū)CCPD3也是單調凸減函數;海南島CCPD3偏態(tài)性強,即起點高、遞減率大,HCR歷時為2 h的CCPD3比其它區(qū)高出1/3強,歷時為4 h及其后CCPD3便低于其他區(qū)了,歷時為13 h的相對差別最大(低1.6倍)。海南島CCPD3偏態(tài)性強的降雨歷時分布結構,是造成表3中海南島孤立降雨時數占比大、連續(xù)降雨歷時短這種降雨特征的原因。
圖5 I、V分區(qū)的第三類條件概率密度CCPD3(淺藍色橫線代表0軸)Fig.5 The 3rd class conditional probability density of I and V subregions(The light blue horizontal line is the 0 axis).
通過上面三類CCPD、PD的分區(qū)比較可知:三類CCPD、PD曲線均是單調凸減函數,在雙對數圖上曲線均是單調凹減函數;逐時降雨頻率各分區(qū)間差別大,導致PD差別也大,而三類CCPD分區(qū)間差別小,在曲線圖上難以分辨;對同一地域PD、CCPD均有反映降雨結構的能力,對不同地域,PD受降雨頻率影響致其能力被削弱,更側重于用來表征指定降雨出現的可能性,而CCPD1反映強、弱降雨出現的配比情況更直截了當,更側重于用來反映降雨結構性特征,以及降雨結構性地域差異性比較,尤其在表征強降雨出現難易程度的地域差異性上比PD1效果會更明顯。
雅安降雨頻率是30°N線上四個分區(qū)中最大的,其CCPD1、CCPD2相對其它分區(qū)呈現兩端大、中間小的格局,特別是極端短時強降雨CCPD1比其他區(qū)高。位置臨近的III、IV分區(qū),由于山地與平原的地理差別,導致降雨頻率兩區(qū)差距大,山區(qū)地形致降雨頻率增加,且主要是弱降雨的增加,強降雨反倒有所減少,對于非特殊地形結構下的山地,由于地面摩阻力的增大,對強降水的發(fā)生總體上卻是不利因素。海南島屬熱帶海洋性季風氣候,與其他分區(qū)不同有著獨特的降雨結構特征,表現在:降雨頻率偏低、孤立性降雨占比多、連續(xù)降雨歷時短、CCPD3遞減快偏態(tài)性強,這些是降雨的不利因素,但是由于強降雨區(qū)段CCPD1、CCPD2比其他分區(qū)大的有利因素,而致年均降雨偏多。地理位置偏北的VI區(qū),降雨頻率小,PD1、PD2明顯比其它區(qū)小,但三類CCPD均與30°N線上分區(qū)相近。
現有研究多以Gamma函數來進行降雨概率密度擬合,所以最初在Matlab軟件平臺下用Curve Fitting Tool進行Gamma函數擬合試驗,由于對降雨區(qū)間進行了細分,曲線尾部(最后的幾個降雨等級)的擬合相對誤差超3個數量級幾乎是常態(tài),即使擬合的決定系數(R-Square)高達0.9999,相對誤差依然會很大;改用Weibull、(對數)正態(tài)、Gumbel、Pareto、Beta、Cauchy、泊松、皮爾遜III型等多種分布函數也存在類似問題。為此放棄該擬合方法,改用基因遺傳算法來搜索這些函數的最優(yōu)擬合參數,擬合時如果想兼顧到強降雨區(qū)段的相對誤差時,弱降雨的擬合效果就變差,總是難以首尾兼顧。最后,放棄這些常用的概率密度函數,改用三參數冪函數的指數函數(1)式作為經驗公式來擬合能收到很好的擬合效果,該函數形式簡單,并且適用所有分區(qū)、三類CCPD,唯一的缺憾是不能嚴格保證定義域內函數的積分為1。其中自變量x對應取為HR、HCR、HoCR,y是這三類CCPD的擬合值,n、a、b是擬合參數;為了公式的簡潔,式中關于分區(qū)標號M、類別的下標予以略去。
采用多目標遺傳基因算法來搜索三個擬合參數的最優(yōu)解,目標函數綜合了加性誤差模型與乘性誤差模型,采用權重系數WP來均衡兩類誤差,設定公式為
(2)式中下標*是通配符,PD*在此小節(jié)代表CCPD1,y*是其擬合值;1-WP是PD*乘性誤差對目標函數Obj貢獻的權重系數,SSE為帶權重系數的協方差算子。WP是PD*加性誤差對目標函數貢獻的權重系數,設定為
擬合時各降雨等級下權重系數選?。簩λ蟹謪^(qū)統一設定一套權重系數。對頭部第1降雨等級權重系數取0.85;對尾部第40、41、42三個降雨等級,由于統計時區(qū)間長度長,樣本量又有限,其概率密度結果數值上存疑,參考價值不大,把其權重系數分別取0.85、0.60、0.15,以降低其對擬合結果的不利影響;其余38個降雨等級取1。然后對該序列進行平滑運算,再做均值為1的中心化處理,得到最終權重系數序列。圖6給出了CCPD1擬合目標函數中權重系數Weight(N)隨降雨等級的分布,從中可見,中間主體區(qū)域略大于1,頭部1個降雨等級下取值小于1,尾部4個與頭部1個降雨等級下取值小于1。這種立足于38個中間等級按經驗取值的益處在于,能讓擬合函數去充分適應經驗函數的主體,同時又兼顧到頭、尾部數據所包含的部分信息量。
圖6 CCPD1擬合目標函數中各降雨等級下的權重系數Fig.6 The weight coefficient of 42 rainfall grades in the fitting objective function.
表4給出了六個分區(qū)CCPD1擬合參數與擬合統計量,擬合參數供讀者核算與參考,從擬合統計值中看出:CCPD1及l(fā)n(CCPD1)的標準化后的擬合均方差均是很小的量,V區(qū)最大為0.013 5及0.050 4;CCPD1決定系數均大于0.99,ln(CCPD1)決定系數除V區(qū)的0.920 8外均大于0.977;ln(CCPD1)的皮爾遜相關系數除V區(qū)的0.972 6外均大于0.99。
表4 各分區(qū)CCPD1擬合參數與擬合統計量Table 4 Fitting parameters and statistical values of CCPD1 in six sub-regions.
圖7以III、V分區(qū)為例給出了第一類條件概率密度及其擬合函數,藍色線主要反映弱降雨量級擬合函數(實線)與經驗函數(*離散點)匹配情況,紅色線反映整體及強降雨區(qū)段兩者匹配情況。其它四個分區(qū)圖略,擬合函數與經驗函數均吻合度好,包括CCPD1及l(fā)n(CCPD1)曲線,并且曲線頭尾均得到了兼顧,具有很高的擬合精度。由表4可知,III、V分區(qū)是擬合目標函數最大的兩個區(qū),從圖7中仍可看出有較好的擬合效果。
圖7 III(a)、V(b)分區(qū)的第一類條件概率密度CCPD1及其擬合函數(藍色對應左邊y軸,*離散點代表CCPD1,藍實線代表其擬合函數;紅色對應右邊y軸,+離散點代表ln(CCPD1),紅點化線代表其擬合函數)Fig.7 The first class conditional probability density of(a)III,(b)V sub-regions and its fitting function(Blue corresponds to the left y-axis,the*discrete point is CCPD1,and the blue solid line represents its fitting function.Red corresponds to the right y-axis,the+discrete point is ln(CCPD1),and the red dotted line represents its fitting function).
綜合表4及圖7來看,用(1)式和上述擬合方法對各分區(qū)CCPD1整體擬合情況好,擬合目標函數考慮到了CCPD的協方差及Ln(CCPD)的協方差兩項因素,即綜合考慮了擬合誤差與擬合相對誤差,用多因子基因遺傳算法來尋優(yōu),能使曲線頭尾得到兼顧,提高了強降雨段CCPD的擬合精度。
根據概率密度函數可以計算概率分布,有了高精度的CCPD擬合函數,就可以估算某重現期降雨量、年均降雨量、各降雨級別下雨量貢獻率與發(fā)生頻率等,此略。
由于函數定義域與CCPD1有了變化,降雨起點是0.2 mm,第1降雨等級0.1 mm不存在了,各降雨等級下權重系數類似圖6,但有所改變:第2、41、42降雨等級下權重系數分別取0.85、0.85、0.70,其余取1后平滑,再做均值為1的中心化處理。
表5給出了六個分區(qū)CCPD2擬合參數與尋優(yōu)目標函數值,CCPD2目標函數比表4中CCPD1目標函數整體要小。由于擬合統計量與表4中比較RMSE更小,R2、RP更接近1,比如六個分區(qū)ln(CCPD2)擬合確定系數均值為0.9937,比ln(CCPD1)擬合確定系數均值0.9770高,故表5中擬合統計量略。V、VI兩分區(qū)是目標函數最大的兩個區(qū)。
表5 研究選定的六個分區(qū)CCPD2擬合參數與尋優(yōu)目標函數值Table5 FittingparametersandobjectivefunctionofCCPD2inresearchselectedsixsub-regions.
從擬合效果來看,同CCPD1擬合時相比有提高,擬合函數與經驗函數均吻合度更高。圖8以一線兩畫方式給出了V、VI兩分區(qū)的CCPD2及其擬合函數,這是六個區(qū)中擬合效果最差的兩個區(qū),但與圖7相比效果更好。
圖8 V(a)、VI(b)兩分區(qū)的第二類條件概率密度CCPD2及其擬合函數(說明同圖7)Fig.8 The 2nd conditional probability density of(a)V,(b)VI sub-regions and its fitting function(The description is the same as Fig.7).
擬合函數沿用(1)式,擬合方法與前面兩者有所不同,采用了一種簡便方法:指數n由人為經驗選取1/n得到,然后對ln(CCPD3)與xn進行一次多項式擬合得出參數a、b,這種簡便方法雖然會降低擬合精度,但仍能得到好的擬合效果。表6給出了六個分區(qū)ln(CCPD3)擬合參數與擬合統計量,從表中擬合統計量看出,該簡便方法由于采用了(1)式對六個分區(qū)均能給出很好的擬合。
表6 研究選定的六個分區(qū)ln(CCPD3)擬合參數與擬合統計量Table 6 Fitting parameters and statistical values of ln(CCPD3)in research selected six sub-regions.
圖9以VI分區(qū)為例給出了CCPD3隨HCR歷時的變化情況及其擬合函數曲線,也是一線兩畫,擬合效果也很好,即使VI分區(qū)的擬合協方差最大、確定系數最小。
圖9 VI分區(qū)第三類條件概率密度CCPD3及其擬合函數(說明同圖7)Fig.9 The 3rd class conditional probability density of VI subregion and its fitting function(The description is the same as Fig.7).
遞減率指數是由三個擬合參數組合而來,與exp(a)、b、n均成正比,反映CCPD曲線整體遞減率情況。海南島CCPD3遞減率指數為40.04,高出其他區(qū)17倍以上,故表7中排除了海南,給出了余下的五個分區(qū)三類CCPD遞減率指數與統計量,從表中可見:CCPD1遞減率指數雅安最大。雖然圖2b中難以區(qū)分不同分區(qū)的CCPD1曲線,但遞減率指數各分區(qū)之間差別大,最大與最小之間有一個量級上的差別,五個分區(qū)CCPD1的離差系數為0.476,利于從數據上整體反映各分區(qū)之間的差別。CCPD2遞減率指數鄂西南山地最大,雅安次之;CCPD3遞減率指數均值1.684,雅安最大,II區(qū)最??;比較三類CCPD遞減率指數五個區(qū)的平均值,CCPD1比CCPD2大一個數量級,CCPD2比CCPD3又大一個數量級,三類CCPD遞減率指數五個區(qū)的離差與均方差也存在類似的量級差別;比較三類CCPD遞減率指數的離差系數,CCPD1分區(qū)間的差異性最大,CCPD3分區(qū)間的差異性最小。該離差系數可以代表降雨特征的地域差別大小,CCPD1中包含中小尺度降雨成分更重,地域差別大,離差系數便大;CCPD2由于過濾掉孤立逐時降雨而次之,CCPD3在降雨歷時大于3后的曲線走勢反映大范圍天氣系統性降雨的成分更濃,地域差別小,離差系數最小。三類CCPD包含中小尺度、大尺度降雨成分多寡的這種差別也是導致三類CCPD平均值、離差與均方差在類間量級上的差別。
表7 各分區(qū)CCPD遞減率指數b·n·ea與統計值Table 7 Decline rate index of CCPD in subregions.
(1)三類PD、CCPD曲線均是單調凸減函數、在雙對數圖上曲線均是單調凹減函數,逐時降雨頻率各分區(qū)間差別大,導致PD差別也大,而三類CCPD分區(qū)間差別小,在曲線圖上難以分辯;三類CCPD遞減率指數分區(qū)之間差距明顯,能反映CCPD地域差異性。
(2)用三參數冪函數的指數函數作為經驗公式來擬合,目標函數考慮了CCPD的偏方差及CCPD對數的偏方差兩項因素,便綜合考慮了擬合誤差與擬合相對誤差,用多因子基因遺傳算法來尋優(yōu),能使曲線首尾得到了兼顧,提高了強降雨段類概率密度的擬合精度。該函數及擬合方法適用全部所選分區(qū)、三類CCPD。
(3)對同一地域PD、CCPD均有反映降雨結構的能力,對不同地域PD受降雨頻率影響致其能力被削弱,更側重于用來表征指定降雨出現的可能性,而CCPD1反映強、弱降雨出現的配比情況更直截,更側重于用來反映降雨結構性特征,在表征強降雨出現的難易程度上比PD1效果會更好。
(4)雅安降雨頻率是30°N線上四個分區(qū)中最大的,其CCPD1、CCPD2相對其它分區(qū)呈現兩端大、中間小的格局,特別是極端短時強降雨CCPD1比其他區(qū)高。
(5)海南島屬熱帶海洋性季風氣候,與其他分區(qū)不同有著獨特的降雨結構特征,表現在強降雨區(qū)段CCPD1、CCPD2比其他區(qū)大,縱然其包含降雨頻率偏低、孤立性降雨占比多、逐時連續(xù)降雨歷時短、CCPD3遞減快偏態(tài)性強等降雨量不利因素,仍致年均降雨量偏大。
(6)位置臨近的III、IV分區(qū),由于山地與平原的地理差別,導致降雨頻率兩區(qū)差距大,山區(qū)地形致降雨頻率增加,且主要是弱降雨的增加,強降雨反倒有所減少。對于非特殊地形結構下的山地,由于地面摩阻力的增大,對強降水的發(fā)生總體上卻是不利因素,與雅安附近特殊的地形影響迥異。