鐘逸軒,廖小龍,全栩劍,易 靈,陳 艷,李媛媛,薛 嬌
(中水珠江規(guī)劃勘測(cè)設(shè)計(jì)有限公司,廣東 廣州 510610)
月徑流模擬計(jì)算對(duì)于流域中長(zhǎng)期水文預(yù)報(bào)、水資源優(yōu)化配置、流域防汛抗旱、水電站發(fā)電計(jì)劃制定等工作具有重要作用?,F(xiàn)有月徑流模型主要可分為統(tǒng)計(jì)模型、水量平衡模型、人工智能模型等。統(tǒng)計(jì)模型以季節(jié)性自回歸模型(Seasonal Auto-Regressive model,SAR)為代表,通過(guò)建立降水量、蒸散發(fā)量以及前期月徑流與當(dāng)月徑流之間的統(tǒng)計(jì)關(guān)系開(kāi)展模擬計(jì)算[1]。水量平衡模型[2]以水量平衡原理為理論基礎(chǔ),將水文循環(huán)的各變量間的關(guān)系概化為經(jīng)驗(yàn)公式,以實(shí)現(xiàn)流域月徑流模擬計(jì)算,這類模型以熊立華等[3]提出的兩參數(shù)月水量平衡模型(Two-Parameter Monthly Water Balance model,TPMWB)為代表,取得了廣泛應(yīng)用驗(yàn)證。人工智能模型主要基于人工神經(jīng)網(wǎng)絡(luò) (Artificial Neural Network,ANN)[4-5]來(lái)模擬水文氣象變量與月徑流之間的關(guān)系,從而模擬月徑流過(guò)程,近年來(lái)隨著深度學(xué)習(xí)技術(shù)的推廣普及,人工智能模型也越來(lái)越多地應(yīng)用在月徑流模擬計(jì)算問(wèn)題上,獲得了良好的應(yīng)用效果。同時(shí),研究表明[6-7],由于水文預(yù)報(bào)過(guò)程中始終存在著各種不確定性來(lái)源,尚無(wú)任何單個(gè)模型能夠始終具有最佳計(jì)算精度,通過(guò)對(duì)多個(gè)模型結(jié)果進(jìn)行集成,能夠?qū)Ω黝A(yù)報(bào)方案揚(yáng)長(zhǎng)避短,有效提高預(yù)報(bào)精度。
北江發(fā)源于江西省信豐縣石溪灣[8],是珠江水系的第二大支流,流域面積46 710 km2。北江干流自北向南貫穿廣東省中北部地區(qū),全長(zhǎng)約468 km,平均坡降約為0.26‰。北江流域地處亞熱帶季風(fēng)氣候,高溫多雨濕潤(rùn),多年平均降水量約為1 736 mm,水資源較為豐富,但流域降水的年內(nèi)分配較不均勻,導(dǎo)致徑流年內(nèi)變化較大,不利于水資源開(kāi)發(fā)利用。流域內(nèi)主要水利樞紐工程有飛來(lái)峽水利樞紐、孟洲壩水電站、蒙里水電站、白石窯水電站、西牛水利樞紐、南水水庫(kù)、錦江水庫(kù)等,且社會(huì)經(jīng)濟(jì)較為活躍,因此準(zhǔn)確可靠的月徑流模擬計(jì)算結(jié)果對(duì)于北江流域的社會(huì)經(jīng)濟(jì)發(fā)展與保障社會(huì)安定具有積極意義。然而,現(xiàn)有文獻(xiàn)針對(duì)北江流域開(kāi)展的月徑流模型研究較少,缺乏對(duì)不同月徑流模型在北江流域的應(yīng)用效果的分析驗(yàn)證,不利于充分發(fā)揮北江流域水利工程體系的興利除害功能,亟需開(kāi)展相關(guān)研究為北江水資源開(kāi)發(fā)利用工作提供有效決策支持,為實(shí)現(xiàn)數(shù)字孿生流域建設(shè)提供幫助。
為獲取準(zhǔn)確可靠的北江流域月徑流預(yù)報(bào)結(jié)果,本文選取北江流域坪石站、犁市站、橫石站和石角站的月徑流過(guò)程為研究對(duì)象(圖1),綜合分析對(duì)比了不同的月徑流模型的應(yīng)用效果,并基于BMA方法給出了多模型集成方案。采用數(shù)據(jù)包括北江流域降水量、潛在蒸發(fā)量以及相關(guān)站點(diǎn)月徑流數(shù)據(jù),時(shí)間范圍為1970—2010年,研究成果可為北江流域的月徑流模擬計(jì)算及中長(zhǎng)期水文預(yù)報(bào)工作提供參考。
圖1 研究區(qū)域示意
季節(jié)性自回歸模型在水文預(yù)報(bào)和隨機(jī)徑流模擬中有廣泛的應(yīng)用,具有模型結(jié)構(gòu)簡(jiǎn)單,計(jì)算效果良好,廣泛適用于年均降水量、月徑流量、日均流量等具有周期變化特點(diǎn)的非平穩(wěn)隨機(jī)變量的模擬計(jì)算問(wèn)題。武蘭婷等[1]利用金沙江仁里水文站的實(shí)測(cè)月徑流序列,通過(guò)建立混合SAR模型,取得了良好的模擬預(yù)報(bào)精度。孟明星等[9]基于SAR模型開(kāi)展了葛洲壩水庫(kù)入庫(kù)月徑流預(yù)報(bào),并對(duì)模型應(yīng)用問(wèn)題展開(kāi)了討論。ZHONG等[10]基于一階SAR模型獲取了三峽水庫(kù)入庫(kù)流量隨機(jī)序列,結(jié)果表明隨機(jī)序列具有與樣本數(shù)據(jù)基本一致的統(tǒng)計(jì)特性。用于月徑流模擬預(yù)報(bào)的SAR模型用公式表示如下:
Qt,η=φ0,η+φ1,ηQt,η-1+…+φp,ηQt,η-p+εt,η
(1)
式中φi,η——第η月的第i個(gè)自回歸參數(shù);Qt,η——第t年中第η月的模擬月流量;εt,η——誤差項(xiàng)。
已有研究結(jié)果顯示,采用一階季節(jié)性自回歸模型通??扇〉昧己玫脑聫搅髂M預(yù)報(bào)效果。
兩參數(shù)月水量平衡模型由熊立華等[3]提出,該模型的輸入為降水量和蒸發(fā)皿觀測(cè)值,輸出為實(shí)際蒸發(fā)量、徑流深等[11]。TPMWB模型具有參數(shù)少且容易優(yōu)化、模擬精度高等優(yōu)點(diǎn)[12],現(xiàn)已廣泛應(yīng)用于不同流域,如樂(lè)通潮等[11]運(yùn)用兩參數(shù)月水量平衡模型對(duì)漢江流域上游地區(qū)進(jìn)行了模擬驗(yàn)證,計(jì)算結(jié)果具有較高的納什效率系數(shù);陳吉琴等[13]利用模型在西漢水流域上進(jìn)行模擬,模擬結(jié)果相比實(shí)測(cè)值具有較小預(yù)報(bào)誤差。兩參數(shù)月水量平衡模型的計(jì)算流程如下。
a)推算實(shí)際蒸發(fā)量E。已知月降雨量P(t)、月蒸發(fā)皿觀測(cè)值Ep的條件下,則流域?qū)嶋H的蒸發(fā)量由式(2)計(jì)算:
E(t)=C·Ep(t)·tanh(P(t)/Ep(t))
(2)
式中E(t)——第t個(gè)月的實(shí)際蒸發(fā)量;Ep(t)——第t個(gè)月蒸發(fā)皿觀測(cè)值;P(t)——第t個(gè)月的降雨量;C——第一個(gè)模型參數(shù)。
b)扣除蒸散發(fā)以后的土壤含水量為:
W(t)=S(t-1)+P(t)-E(t)
(3)
式中S(t)——第t個(gè)月的土壤凈含水量。
模型計(jì)算開(kāi)始時(shí)需要任意給定S初值,并給定合適的模型預(yù)熱期。
c)計(jì)算月徑流量Q(t):
Q(t)=S(t)·tanh(S(t)/SC)
(4)
式中 SC——第二個(gè)模型參數(shù)。
d)更新土壤凈含水量S(t):
S(t)=S(t-1)+P(t)-E(t)-Q(t)
(5)
本研究為提升參數(shù)優(yōu)化效率,基于GPU技術(shù)運(yùn)行遺傳算法開(kāi)展了參數(shù)優(yōu)化,獲取了北江流域各水文站對(duì)應(yīng)的最優(yōu)模型參數(shù)C和SC。
人工神經(jīng)網(wǎng)絡(luò),是一種模仿生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計(jì)算模型,可有效應(yīng)對(duì)各類具有高度非線性、模糊性和不確定性的問(wèn)題,近年來(lái)被廣泛應(yīng)用于中長(zhǎng)期水文預(yù)報(bào)領(lǐng)域。李克飛等[14]針對(duì)三峽水庫(kù)采用ANN等模型開(kāi)展了逐月入庫(kù)徑流預(yù)報(bào),為三峽水庫(kù)中長(zhǎng)期調(diào)度提供決策支持。趙鵬雁等[15]分析對(duì)比了不同月徑流模型在瀾滄江流域中長(zhǎng)期預(yù)報(bào)的應(yīng)用效果,結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)模型具有較好的預(yù)報(bào)表現(xiàn)。
ANN模型通常由輸入層、隱含層和輸出層3部分組成,對(duì)于水文預(yù)報(bào)問(wèn)題,通??刹捎胢-1-1形式的ANN模型,即模型包含m個(gè)輸入變量,1個(gè)隱含層和1個(gè)輸出變量。模型結(jié)構(gòu)見(jiàn)圖2。本研究中,選取北江流域各水文站的上月徑流量、多年平均月蒸發(fā)能力、月降水量作為預(yù)報(bào)輸入量,則ANN模型可表示為:
Q(t) =f(Q(t-1),P(t),ET(t))
(6)
式中P(t)——第t月降水量;ET(t)——第t月對(duì)應(yīng)的多年平均月蒸發(fā)能力;f(·)——ANN函數(shù),其中隱含層響應(yīng)函數(shù)采用Sigmoid函數(shù)的形式。
圖2 月徑流預(yù)報(bào)ANN模型結(jié)構(gòu)示意
水文預(yù)報(bào)過(guò)程中廣泛存在著各種不確定性,由此導(dǎo)致預(yù)報(bào)結(jié)果與實(shí)際值之間不可避免地存在誤差,為此學(xué)者們提出采用多模型集成的方法予以解決,現(xiàn)有研究常采用的多模型集成方法有貝葉斯模型平均法[16-17](BMA)、集合模型輸出統(tǒng)計(jì)法[18-19](Ensemble Model Output Statistics,EMOS)、深度學(xué)習(xí)算法[20-21](Deep Learning,DL)等。董磊華等[22]基于BMA方法開(kāi)展了水文模型不確定性分析,結(jié)果表明BMA法能夠有效降低模型不確定性,獲取更為準(zhǔn)確的預(yù)報(bào)結(jié)果。李宏亮[23]分別采用加權(quán)平均法、神經(jīng)網(wǎng)絡(luò)和多元線性回歸模型對(duì)漓江桂林?jǐn)嗝娴?組中長(zhǎng)期預(yù)報(bào)結(jié)果進(jìn)行了集成,相比原預(yù)報(bào)結(jié)果精度顯著提升。趙澤謙等[24]通過(guò)NSGA-II算法對(duì)6種模型計(jì)算的漢江黃金峽水庫(kù)中長(zhǎng)期預(yù)報(bào)結(jié)果開(kāi)展集成,有效提升了預(yù)報(bào)準(zhǔn)確性。
考慮到BMA法不僅可獲取多模型集成預(yù)報(bào),同時(shí)可為后期開(kāi)展不確定性概率預(yù)報(bào)提供支撐,本研究最終選擇BMA法獲取了上述3種月徑流預(yù)報(bào)結(jié)果的優(yōu)化權(quán)重值。BMA法的本質(zhì)是對(duì)實(shí)測(cè)值與各集合預(yù)報(bào)成員的條件概率分布進(jìn)行加權(quán)平均,以此推求實(shí)測(cè)值的后驗(yàn)分布。本文僅對(duì)其簡(jiǎn)要介紹,具體可參考文獻(xiàn)[25-26]。令Q(t)代表t時(shí)刻的實(shí)測(cè)值,F(xiàn)i(t)代表第i個(gè)模型第t時(shí)刻的預(yù)報(bào)值,則基于集合預(yù)報(bào)Fi(t)(i=1,2,…,m)的實(shí)測(cè)值BMA后驗(yàn)分布可表示為:
(7)
特別地,當(dāng)Q和Fi的邊緣分布均為正態(tài)分布時(shí),上述條件概率分布也為正態(tài)分布,此時(shí)式(8)可改為:
(8)
式(8)即為基于正態(tài)分布的BMA概率預(yù)報(bào)的分布函數(shù)形式,其參數(shù)可通過(guò)期望最大值算法(Expection-Maximization)獲取[26]。
對(duì)于邊緣分布不服從正態(tài)分布的Q和F序列,常采用Box-Cox變換將其轉(zhuǎn)換至正態(tài)空間再進(jìn)行計(jì)算[27]:
(9)
式中X——原始不服從正態(tài)分布的序列;λ——Box-Cox變換系數(shù),可通過(guò)極大似然法確定;XN——變換后的數(shù)據(jù)序列。
在獲取BMA優(yōu)化權(quán)重值的基礎(chǔ)上,對(duì)各模型預(yù)報(bào)結(jié)果加權(quán)平均得到多模型集成預(yù)報(bào):
Qens(t)=∑ωi·Qi(t)
(10)
式中Qens——多模型集成預(yù)報(bào);Qi——第i個(gè)模型的預(yù)報(bào)結(jié)果;ωi——第i個(gè)模型的優(yōu)化權(quán)重值。
采用水文情報(bào)預(yù)報(bào)規(guī)范[28]中推薦的確定性系數(shù)(DC)和水文預(yù)報(bào)廣泛采用的平均相對(duì)誤差絕對(duì)值[29](MAPE)作為評(píng)價(jià)各預(yù)報(bào)模型精度的指標(biāo)。DC取值越接近1,MAPE取值越接近0,表示模型預(yù)報(bào)精度越好。
DC計(jì)算方法如下:
(11)
MAPE的計(jì)算方法如下:
(12)
式中各項(xiàng)同前。
對(duì)北江流域坪石站、犁市站、橫石站和石角站采用不同方法開(kāi)展了月徑流預(yù)報(bào),選取1970—1997共計(jì)28年作為模型率定期,1998—2010共計(jì)13年作為模型檢驗(yàn)期。表1列出了3種模型的輸入數(shù)據(jù)結(jié)構(gòu),其中,TPMWB模型考慮了流域水文循環(huán)原理,其輸入量?jī)H需當(dāng)月降水量P和蒸發(fā)量E;SAR和ANN屬于數(shù)據(jù)驅(qū)動(dòng)模型,為增加模型獲取的信息量,以提高計(jì)算精度,輸入額外引入了前一個(gè)月的徑流量Q。
表1 模型輸入數(shù)據(jù)及參數(shù)優(yōu)化方法
表2給出了3種月徑流預(yù)報(bào)模型在北江不同水文站率定期和檢驗(yàn)期的預(yù)報(bào)精度評(píng)價(jià)結(jié)果。結(jié)果表明,本次采用的3種月徑流預(yù)報(bào)模型在北江流域各站點(diǎn)均具有較好的表現(xiàn),率定期DC值位于0.86~0.91之間,檢驗(yàn)期DC值除橫石站TPMWB模型外,均位于0.81~0.90之間,且各站不同模型預(yù)報(bào)結(jié)果均具有較小的相對(duì)水量誤差。率定期內(nèi),SAR模型和ANN模型具有相較TPMWB模型更優(yōu)的DC值,其可能原因是前面2種數(shù)據(jù)驅(qū)動(dòng)型模型額外使用了上一個(gè)月徑流量作為輸入,增加了預(yù)報(bào)信息量,同時(shí)相比TPMWB模型具有更多模型參數(shù),因此率定期取得了更好的預(yù)報(bào)效果。檢驗(yàn)期結(jié)果則相反,TPMWB模型在大多數(shù)站點(diǎn)具有更優(yōu)的DC值,表明具有物理機(jī)制的水量平衡模型具有更強(qiáng)的泛化能力,模型穩(wěn)定性更好。同時(shí)由表2結(jié)果可看出,北江流域各水文站在不同評(píng)價(jià)指標(biāo)或不同模型計(jì)算時(shí)期條件下,對(duì)應(yīng)的最優(yōu)模型也不完全相同,充分說(shuō)明北江月徑流預(yù)報(bào)存在明顯的模型不確定性,有必要采用多模型集成方法削弱模型不確定性對(duì)預(yù)報(bào)結(jié)果的影響,提高預(yù)報(bào)精度。
表2 3種月徑流預(yù)報(bào)模型精度評(píng)價(jià)結(jié)果
采用BMA法通過(guò)計(jì)算實(shí)測(cè)流量的先驗(yàn)概率,并基于前述3種模型的月徑流預(yù)報(bào)結(jié)果獲取了預(yù)報(bào)值的后驗(yàn)分布,進(jìn)而通過(guò)似然函數(shù)得到3種模型的優(yōu)化權(quán)重值。表3給出了北江流域各水文站多模型集成預(yù)報(bào)各模型的權(quán)重值。表4給出了多模型集成預(yù)報(bào)精度評(píng)價(jià)指標(biāo)與單模型預(yù)報(bào)指標(biāo)最佳結(jié)果對(duì)比。
表3 北江各水文站月徑流預(yù)報(bào)模型優(yōu)化權(quán)重值
由表3可知,SAR模型對(duì)于坪石站、橫石站和石角站有最大權(quán)重,ANN模型對(duì)于犁市站有最大權(quán)重。由于權(quán)重越大表明該模型在率定期具有越好的預(yù)報(bào)效果,表3中的結(jié)果與表2結(jié)果基本一致,即DC值較大且MAPE較小的模型能夠獲得較大權(quán)重值。同時(shí),通過(guò)對(duì)比表4中多模型集成預(yù)報(bào)效果與單模型最優(yōu)指標(biāo)可知,基于BMA法獲取優(yōu)化權(quán)重對(duì)原始預(yù)報(bào)結(jié)果進(jìn)行加權(quán)平均后,北江各水文站的月徑流預(yù)報(bào)確定性系數(shù)和水量誤差均有所提升,以犁市站為例,多模型集成預(yù)報(bào)的DC值不僅優(yōu)于任意單一模型結(jié)果,還有效降低了預(yù)報(bào)水量誤差,率定期和檢驗(yàn)期的MAPE值分別下降2.65%和4.16%。對(duì)于中長(zhǎng)期預(yù)報(bào)而言,水量誤差大幅降低能夠顯著提升預(yù)報(bào)應(yīng)用效果,因此基于BMA法加權(quán)平均的多模型集成預(yù)報(bào)能更好地為北江流域興利除害提供決策支持。
表4 北江各水文站多模型集成預(yù)報(bào)與單模型最優(yōu)結(jié)果對(duì)比
為直觀展示不同模型在率定期和檢驗(yàn)期的預(yù)報(bào)精度,圖3、4分別給出了率定期和檢驗(yàn)期各北江流域各水文站實(shí)測(cè)月徑流與預(yù)報(bào)結(jié)果的散點(diǎn)圖,同時(shí)計(jì)算了二者的相關(guān)系數(shù),限于篇幅,圖中僅展示了橫石站計(jì)算結(jié)果。由圖3、4可知,橫石站月徑流預(yù)報(bào)結(jié)果散點(diǎn)圖基本接近1∶1線,預(yù)報(bào)值與實(shí)測(cè)值之間相關(guān)系數(shù)ρ均位于0.9以上,具有較好的預(yù)報(bào)效果。同時(shí),多模型集成預(yù)報(bào)在率定期和檢驗(yàn)期均具有最高的相關(guān)系數(shù),表明該方法可獲取與實(shí)測(cè)值最接近的預(yù)報(bào)結(jié)果。綜上所述,推薦將多模型集成方法用于北江流域各站點(diǎn)的月徑流預(yù)報(bào)。
a)SAR
a)SAR
本文以北江流域坪石站、犁市站、石角站、橫石站為研究對(duì)象開(kāi)展了月徑流預(yù)報(bào)研究,分析對(duì)比了3種常用月徑流預(yù)報(bào)模型在研究區(qū)域的應(yīng)用效果,并構(gòu)建了基于BMA法的多模型集成方案,下面是主要研究結(jié)論和展望。
a)3種月徑流模型在研究區(qū)域均具有較好的預(yù)報(bào)精度,率定期DC值位于0.86~0.91,檢驗(yàn)期基本位于0.81~0.90,同時(shí)具有較小MAPE值,表明月徑流預(yù)報(bào)具有較好的擬合精度和較小的水量誤差。其中SAR模型和ANN模型具有更優(yōu)DC值,表明增加輸入信息一定程度上能夠提升預(yù)報(bào)精度,而具有物理機(jī)制的水量平衡模型TPMWB則具有較小的水量誤差和更好的泛化能力。
b)采用各站3組月徑流預(yù)報(bào)率定期成果進(jìn)行BMA權(quán)重優(yōu)化,結(jié)果顯示坪石站、橫石站和石角站均為SAR模型權(quán)重值最大,而犁市站ANN模型具有最大權(quán)重,充分說(shuō)明BMA法對(duì)于擬合精度較高的預(yù)報(bào)方案通常能夠給出更高的優(yōu)化權(quán)重值,并兼顧了不同模型的優(yōu)勢(shì)互補(bǔ)。
c)北江流域各站多模型集成后的月徑流預(yù)報(bào)具有相較任一單模型方案更優(yōu)的DC值,還能有效降低預(yù)報(bào)水量誤差,顯著降低了MAPE值,能夠?yàn)楸苯饔蚺d利除害提供更為準(zhǔn)確的中長(zhǎng)期預(yù)報(bào)信息;同時(shí)在實(shí)際應(yīng)用中,應(yīng)逐步積累經(jīng)驗(yàn),分析多模型集成預(yù)報(bào)精度提升的效益相比其時(shí)間和經(jīng)濟(jì)成本是否具有明顯優(yōu)勢(shì),探索如何令多模型集成更好服務(wù)實(shí)際。
d)后續(xù)研究工作中,可在本文考慮模型不確定性的基礎(chǔ)上,進(jìn)一步探討輸入不確定性和參數(shù)不確定性對(duì)北江流域月徑流預(yù)報(bào)的影響,將多模型集成方案擴(kuò)充為月徑流不確定性概率預(yù)報(bào)方案,并研究中長(zhǎng)期水文預(yù)報(bào)信息對(duì)城市防洪排澇的作用[30],以期為流域管理部門制定調(diào)度決策方案提供更加準(zhǔn)確和全面的中長(zhǎng)期預(yù)報(bào)支撐。