谷洪欽,劉開磊,劉玉環(huán),馬亞楠
(1. 國核電力規(guī)劃設計研究院有限公司,北京 100095;2. 淮河水利委員會水文局(信息中心),安徽 蚌埠 233000;3. 河海大學水文水資源學院,江蘇 南京 210098)
在源遠流長的水文水資源學科發(fā)展歷史中,人們在分水源機制、坡面產(chǎn)匯流機理方面已經(jīng)形成了較多的經(jīng)驗與知識儲備。然而,洪水預報的精準程度受降雨輸入、土壤水文初始條件、參數(shù)概化能力、模型結構等來源不確定性的影響顯著,導致傳統(tǒng)水文預報技術不能準確反映流域產(chǎn)匯流物理機制,洪水預報結果往往明顯偏離實際,給實時洪水預報以及防洪減災工作帶來極大的限制。
自19世紀40年代起,水文水資源學科便已出現(xiàn)有關誤差或水文不確定性對洪水預報的影響研究,尤其近年來針對來自降雨輸入、模型參數(shù)及模型結構等來源不確定性影響的研究,取得了較多代表性成果。其中,對降雨、參數(shù)不確定性影響的研究多偏重于對誤差概率分布特征定量刻畫;對模型結構不確定性的研究涉及對模型結構本身的改進以及最優(yōu)預報模型篩選策略、組合預報等方面。葉愛中等[1]于2007年提出由日降雨資料時間降尺度生成逐時降雨資料的方法,認為所提出方法在保證逐日降水量總量一致的前提下,能在更細致的時間分辨率上提供可靠的降雨成果,對于降雨輸入誤差控制具有良好的借鑒價值;2016年梁忠民等[2]提出考慮降雨輸入不確定性的洪水概率預報方法,基于抽站法原理反推降雨輸入的概率分布,結合Monte-Carlo抽樣法驅動確定性水文模型,實現(xiàn)對預報流量概率分布的估計;梁忠民等[3]利用貝葉斯理論對TOPMODEL模型的參數(shù)及預報不確定性問題進行探討,確認了隨機抽樣方法對描述參數(shù)概率分布特征的有效性;賀新月等[4]針對水文模型的預報殘差序列的數(shù)值特征進行分析,據(jù)此改進傳統(tǒng)預報模型結構,提高了融雪徑流的預報精度。
然而,現(xiàn)有研究往往將各種來源的不確定性割裂開來,分別考慮對洪水預報結構的影響,具有很大的理論與應用局限性。實際上,降雨觀測與預報誤差、預報模型選擇、參數(shù)優(yōu)化等各方面的不確定性往往伴隨著一次洪水預報的整個過程,正是由于水文不確定性的客觀存在,導致人們不能夠完全精細掌握水文物理過程。本研究綜合考慮降雨輸入、參數(shù)、模型結構3類典型的不確定性來源,在定量描述各要素不確定性程度的基礎上,融合各類型不確定性來源,實現(xiàn)洪水概率預報。
本研究是對近年來淮河流域降雨誤差分析、參數(shù)規(guī)律、多模型集合預報領域最新研究成果的集成,在綜合考慮降雨輸入、參數(shù)、模型結構3個方面不確定性的前提下實現(xiàn)洪水概率預報,并結合歷史洪水,尤其是2020年大洪水驗證概率預報方法及預報結果的可靠性。
TIGGE(THORPEX interactive grand global ensemble)等降雨預報產(chǎn)品在實時洪水預報應用中的輸入誤差較為顯著,且不同的產(chǎn)品、不同預見期數(shù)據(jù)的輸入誤差較大。本研究擬采用GBM(generalized Bayesian model)法分析降雨預報的不確定性。在已知預報降水量x的前提下,降雨預報誤差的廣義概率密度函數(shù)如下:
(1)
式中:x——預報降水量;y——降水量預報誤差值;δ——均方根誤差值;βx,0——降雨真值為0的概率,可根據(jù)樣本估計;fy(y|Y>0,X=x)——X=x時的降水量預報誤差,可用截尾正態(tài)分布等統(tǒng)計描述。
Cai等[5-6]于2018年、2019年在大別山區(qū)進行降雨誤差分析,將Weibull分布函數(shù)用于降雨的先驗概率密度估計,采用截斷型正態(tài)分布密度函數(shù)估計降雨預報誤差隨機變量相對于降雨預報值的條件概率密度函數(shù)。研究中以Weibull分布函數(shù)描述βx,0的特征參數(shù),同時給出了降雨預報誤差的概率密度函數(shù)表達式:
(2)
式中:c——常數(shù)項;μ、σ——Weibull分布函數(shù)的特征參數(shù);Φ——標準正態(tài)分布函數(shù)。
參考陳竹青等[7]于2019年所提出的水文模型參數(shù)概率分布特征描述方法,利用s場洪水資料,分別以每一場洪水資料獨立的率定水文模型i的參數(shù)xi,得到參數(shù)xi的次優(yōu)解集,據(jù)此估計xi所服從的概率分布。在本研究中,采用Beta分布函數(shù)描述[7]水文模型參數(shù)的概率分布特征。
本研究借助于BMA(Bayesian model averaging)評估多個模型相對最優(yōu)的概率,用于表征不同模型結構上的不確定性程度相對大小,模型相對最優(yōu)概率記為ωj(j=1,2,…,J)
(3)
式中:j——最優(yōu)模型序列號;ωj=p(M=j|Tobs)——在給定數(shù)據(jù)集Tobs的條件下,模型j為最優(yōu)的后驗概率。ωj數(shù)值的估算需要基于歷史實測、預報流量序列,構建高斯混合模型、利用期望最大化等算法求解,介紹具體求解方法的文獻[8-9]較多,此處不再贅述。
史灌河是淮河南岸最大的支流,流經(jīng)河南省和安徽省,主要涉及河南省信陽市、固始縣和安徽省六安市[10]。史灌河由上游的史河、灌河匯流而成,河流全長261 km,流域面積6 889 km2。史灌河流域地形南高北低,南部最高峰太白峰海拔1 140 m,北部至淮河地面海拔一般為23 m左右。流域屬北亞熱帶向暖溫帶過渡的季風濕潤區(qū),多年平均降水量1 240 mm,多年平均水面蒸發(fā)量874 mm,多年平均水資源總量41.2億m3,其中地表水資源量36.1億m3。研究流域方位見圖1。
圖1 研究流域概況Fig.1 Conceptualization of experimental basin
史灌河流域蔣家集站2003年1月1日至2020年12月1日流量過程見圖2, 歷場洪水資料的時間步長均為6 h。根據(jù)水文資料代表性的要求, 從現(xiàn)有資料中篩選出共16場大、中、小洪水;除2013年、2017年汛期流量、洪量均較小,且無典型洪水過程外,其余各年份均可篩選出一場洪水過程。具體的洪水場次信息見表1。其中,在2020年7月15—29日,史灌河流域產(chǎn)生特大暴雨,史灌河發(fā)生超保證水位洪水,下游支流白露河、淠河發(fā)生接近保證水位洪水。圖2中,各年度不同場次的洪水首尾相連繪制在同一張圖上,相鄰兩場洪水之間以藍色實線進行分隔。
圖2 蔣家集站歷史洪水過程示意圖Fig.2 Schematic map of historical flood process in Jiangjiaji station
綜合多源不確定性的洪水概率預報方法流程見圖3,其共分為6個步驟。
圖3 算法流程Fig.3 Flow chart of algorithm
步驟1:獲取面雨量預報誤差概率分布。一般要求流域內降雨、蒸發(fā)、流量、水位數(shù)據(jù)資料條件較好,有至少10場典型洪水數(shù)據(jù)。
使用泰森多邊形法分別采用流域內雨量站監(jiān)測數(shù)據(jù)和TIGGE氣象產(chǎn)品計算流域面雨量值[11-12]。其中,地面監(jiān)測相應的面雨量作為真值,氣象產(chǎn)品預報降水量的面雨量數(shù)據(jù)為含誤差的序列,可參照式(1)(2)獲取預報誤差概率分布。
步驟2:構建各模型參數(shù)的次優(yōu)解集,獲取水文模型參數(shù)的概率分布。分別選擇新安江模型[13]、BP神經(jīng)網(wǎng)絡模型作為預報模型,其中新安江模型以河網(wǎng)消退系數(shù)CS作為敏感參數(shù)率定獲得其次優(yōu)解集、最優(yōu)解;BP神經(jīng)網(wǎng)絡的參數(shù)即為其網(wǎng)絡結構,直接利用全部場次洪水資料率定得到最優(yōu)的BP模型參數(shù)。參數(shù)優(yōu)選方面有眾多方法可供選擇,如SCE-UA、單純形法、客觀優(yōu)選法等。
表1 歷史洪水特征及預報精度指標統(tǒng)計
本步驟推薦采用SCE-UA算法進行參數(shù)率定,優(yōu)化目標函數(shù)采用確定性系數(shù)指標。SCE-UA算法、確定性系數(shù)指標NSE的詳細內容可參考文獻[14-15]。當所優(yōu)化的參數(shù)值能夠使目標函數(shù)確定性系數(shù)指標最大時,認為參數(shù)優(yōu)化完畢,當前參數(shù)值即為所求。
步驟3:隨機生成面雨量、水文模型參數(shù),驅動各水文模型產(chǎn)生L1組初始預報流量過程,一般取L1大于50。確定各模型參數(shù)最優(yōu)解以及各模型為相對最優(yōu)的先驗概率。將所有場次洪水資料劃分為率定期和驗證期,以分別用于各水文模型的率定與驗證,得到各水文模型參數(shù)應用于所有場次的洪水預報時的綜合最優(yōu)參數(shù);將已率定完畢的綜合最優(yōu)參數(shù)分別代入各水文模型,并利用BMA算法求解各模型為相對最優(yōu)的概率ω1、ω2、…、ωI。
步驟1~3分別用于獲取模型輸入、參數(shù)、結構3種不同來源的概率分布特征,是對3種不確定性來源的不確定性程度的先驗估計。綜合各模型在歷史洪水中表現(xiàn)的相對優(yōu)劣程度,估計模型為相對最優(yōu)的概率,并以BMA算法的結構參數(shù)ω去表征概率值,體現(xiàn)了對模型結構(模型選擇)不確定性的考量。
將上述所選16場洪水中2003—2010年作為率定期,其8場洪水用于TIGGE降雨誤差分布特征參數(shù)估計,以及新安江模型、BP神經(jīng)網(wǎng)絡模型參數(shù)率定及兩模型相對最優(yōu)的權重的率定;2011—2020年作為驗證期,其8場洪水用于驗證降雨誤差分布特征參數(shù)準確性,新安江模型、BP神經(jīng)網(wǎng)絡模型參數(shù)率定結果及相對權重值的合理性,以及檢驗本研究所構建洪水概率預報算法性能。其中,TIGGE產(chǎn)品中的中國氣象局CMA預報模式2008—2020年數(shù)據(jù),時間分辨率6 h,空間分辨率0.5°×0.5°;對2008年之前以及2014年4月TIGGE降雨預報數(shù)據(jù)缺失的年份,以實測降水量替代。降雨預報誤差概率分布函數(shù)的特征參數(shù)沿用Cai等[6]在本流域前期的研究成果,即Weibull分布函數(shù)的參數(shù)值,分別為μ=11.537 3,σ2=295.635 3;率定得到新安江模型、BP神經(jīng)網(wǎng)絡模型相對最優(yōu)的概率分別為0.637和0.363。
把蔣家集站實測流量以及5%~95%概率預報結果的置信區(qū)間同時繪制在圖2上,用于展示2003—2020年期間的概率預報結果。橫坐標上的紅色點用于分隔率定期與驗證期。從圖2概率預報試驗的流量過程可以看到,率定期、驗證期洪水概率預報結果與實測結果的數(shù)量級、變化趨勢基本保持一致;且相對于率定期,概率預報結果的置信區(qū)間寬度在驗證期并未有嚴重的發(fā)散現(xiàn)象。從圖2還可以看到,對于2003年、2016年、2020年汛期的預報洪水過程,其置信區(qū)間相對其他場次洪水的置信區(qū)間略有增寬,這在一定程度上表明概率預報對于較大量級洪水的不確定性程度會略有增大。上述研究結果證明,概率預報結果較為穩(wěn)定,且研究中所采用的降雨誤差分布特征參數(shù)、新安江模型及BP神經(jīng)網(wǎng)絡模型參數(shù)、模型相對最優(yōu)概率等參數(shù)相對合理。進一步以表格形式統(tǒng)計概率預報結果的覆蓋率指標CR(cover rate)及評估均值預報精度的確定性系數(shù)NSE(Nash-Sutcliffe efficiency coefficient)指標,見表1。
從表1可以看到,2003—2020年,2020年、2003年兩場洪水的洪峰流量最大,分別為4 350 m3/s和3 380 m3/s;相對地,2006年、2011年的洪峰流量僅分別達到336 m3/s和308 m3/s。從新安江模型、BP神經(jīng)網(wǎng)絡模型的預報精度來看,模型預報結果的NSE指標在驗證期、率定期的均值分別為0.88、0.86和0.79、0.77,預報精度略有降低,降低幅度不大,證明了所采用降雨預報、模型參數(shù)的合理性。從概率預報結果的精度評價指標分析,概率預報結果在2011年、2019年兩場較小量級的洪水中,90%置信區(qū)間預報結果的覆蓋率指標CR僅分別達到67%、73%,同時也可以發(fā)現(xiàn)新安江模型、BP神經(jīng)網(wǎng)絡模型兩類單一模型的預報精度也均低于0.81,確定性模型、概率預報精度均較低,對于量級較小的洪水水文模型或概率預報模型的預報精度相對會有降低。但是從總體上來看,CR的均值達到了93%,即從2003—2020年的多場洪水過程綜合分析,概率預報結果的90%區(qū)間能夠覆蓋93%以上的實測洪水過程,所提供概率預報的可靠性程度相對較高,可以有效地避免偏大誤報或偏小漏報的可能性,提高洪水預報信息的參考價值。
從NSE指標分析,率定期概率預報結果的NSE指標均值為0.88,驗證期的NSE指標均值為0.87,洪水概率預報的均值預報結果在驗證期預報精度與率定期相比變化更小,概率預報模型的預報結果相對更為穩(wěn)定。分析預報NSE的最大最小值可以看到,概率預報結果的NSE值變幅在0.75~0.92,而新安江、BP神經(jīng)網(wǎng)絡模型的NSE值變幅在0.66~0.95、0.69~0.91,概率預報的均值預報結果精度變化區(qū)間更小、且變化區(qū)間的下限比兩個單一模型的下限值更高,進一步證明了概率預報結果所提供均值預報的可靠性較高。
本文提出了綜合考慮降雨、模型參數(shù)、模型結構3類不確定因素的洪水概率預報方法。通過對預報洪水過程的對照,以及對預報結果覆蓋率CR、確定性系數(shù)NSE指標的分析,可以發(fā)現(xiàn),概率預報結果一定程度上依賴于其所采用的水文模型精度,如當水文模型在2011年、2019年這樣的小水年預報精度較低時,概率預報的CR、NSE指標相應也處于較低水平。
從CR指標上來看,概率預報結果所提供的90%置信區(qū)間預報結果能夠覆蓋93%的實測洪水過程,實測洪水過程基本上都落在90%置信區(qū)間之內,根據(jù)洪水概率預報結果做出的防汛決策能夠充分考慮洪水可能的量級,對于準確評估洪水發(fā)展情勢具有重要參考價值。概率預報結果相對新安江模型、BP神經(jīng)網(wǎng)絡模型的確定性預報結果,能以可靠的概率分布描述洪水可能的發(fā)展趨勢,降低洪水預報調度的誤判風險。從NSE指標來看,洪水概率預報所提供均值預報結果,雖然并不能夠在每一場洪水中都達到預報精度高于單一模型,但是其預報精度總是高于預報精度相對較低的水文模型,NSE指標更接近于水文模型中預報精度相對較高者,所提供均值預報結果的可靠性程度也較高。
考慮到不同的流域之間產(chǎn)匯流規(guī)律的巨大差異性,以及降雨數(shù)據(jù)產(chǎn)品、水文模型在流域的適應性不同,不同來源不確定性因素的顯著性程度在流域間也存在較大差異,綜合多源不確定性的洪水概率預報應當根據(jù)洪水預報輸入數(shù)據(jù)、流域特征等因素來定制研究。除此之外,如何科學描述不確定性在輸入、模型運算到結果展示過程的傳遞與變化,描述不同來源不確定性因素之間相互加強或削弱作用,并量化評估不同來源的不確定性因素對最終預報結果不確定性的貢獻程度,仍有待進一步研究,這也是通過本研究可以推進洪水預報技術發(fā)展的有價值的研究方向。