闞光遠,李致家,劉志雨,李巧玲,胡友兵
(1.河海大學(xué)水文水資源學(xué)院,江蘇 南京 210098;2.水利部水文局,北京 100053)
水文模擬常用的模型有2種,一種是概念性模型 ,另一種是數(shù)據(jù)驅(qū)動模型。BP神經(jīng)網(wǎng)絡(luò)模型(以下簡稱BP模型)是數(shù)據(jù)驅(qū)動模型,具有強大的非線性擬合能力[6],取得了良好的應(yīng)用效果[7-8]。BP模型在應(yīng)用中還存在一些難題。Minns等[9]發(fā)現(xiàn)僅將降雨作為輸入無法計算出流,這是由于土壤濕度對產(chǎn)流有重要影響,故以往大多數(shù)研究都將前期實測流量作為網(wǎng)絡(luò)輸入來表征土壤濕度[10],無法進行連續(xù)模擬。BP模型還存在率定期模擬效果好但檢驗期嚴重變差,即泛化能力差的現(xiàn)象,這是由于網(wǎng)絡(luò)拓撲結(jié)構(gòu)選擇不當(dāng)及訓(xùn)練不當(dāng)造成的。新安江模型是趙人?。?1]于20世紀(jì)80年代初提出的概念性模型,在中國得到廣泛應(yīng)用和不斷完善。以往文獻中關(guān)于BP模型、K-最近鄰算法和新安江模型的報道多為單獨應(yīng)用,三者的耦合應(yīng)用不多見。筆者將BP模型與K-最近鄰算法耦合起來,建立BK模型,將新安江模型的產(chǎn)流、產(chǎn)流分水源計算模塊與BK模型相耦合建立XBK模型及XSBK模型,以提高模擬精度和降低模型使用難度為目的,在呈村等3個不同類型流域?qū)K模型、XBK模型及XSBK模型與新安江模型進行對比應(yīng)用。
水文模擬中BP模型的通常形式如下:
式中:t——計算時刻;QBP,t——BP模型模擬的t時刻出口斷面流量;Qt-i——實測的t-i時刻出口斷面流量,即前期實測流量;n0——出口斷面流量自回歸階數(shù);Pt-j-τ——實測的t-j-τ時刻流域面平均雨量(j=0,1,…,n1-1;n1為降雨階數(shù),τ為降雨滯后時段數(shù));EM,t-k——實測的t-k時刻流域蒸散發(fā)能力(k=0,1,…,n2-1;n2——蒸散發(fā)能力階數(shù));FBP——BP神經(jīng)網(wǎng)絡(luò)函數(shù)。
傳統(tǒng)的BP模型需用預(yù)報時刻前若干時刻的實測流量(即前期實測流量)來表征土壤濕度,實際預(yù)報時由于無法獲得前期實測流量,式(1)無法進行連續(xù)模擬,難以充分利用降雨預(yù)報信息提高預(yù)見期。K-最近鄰算法[12]是一種簡潔有效的機器學(xué)習(xí)算法,可用于回歸預(yù)測。筆者將K-最近鄰算法與BP神經(jīng)網(wǎng)絡(luò)耦合起來,建立BK(BP-KNN)模型,在保證較高模擬精度的前提下實現(xiàn)不需前期實測流量的連續(xù)模擬,使改進的BP模型具有充分利用降雨預(yù)報信息的能力。BK模型的通用建模方式見式(2)~(4)。式(2)為BP神經(jīng)網(wǎng)絡(luò)連續(xù)模擬,式(3)、式(4)為K-最近鄰算法誤差修正。
式中:QBP,t——BP神經(jīng)網(wǎng)絡(luò)模擬的(未經(jīng)K-最近鄰算法修正的)t時刻出口斷面流量;FBP和FKNN——BP神經(jīng)網(wǎng)絡(luò)函數(shù)和K-最近鄰算法函數(shù);Qsim,t,Qsim,t-i——BP神經(jīng)網(wǎng)絡(luò)模擬的(并經(jīng)K-最近鄰算法修正的)t及t-i時刻出口斷面流量,即前期模擬流量;Il,t-jl-τl——t-jl-τl時刻與出口斷面流量相關(guān)的l個影響因素,一般為實測的面平均降雨、蒸散發(fā)能力等(l≥0);jl——影響因素階數(shù);τl——影響因素滯后時段數(shù);Et——QBP,t與Qsim,t間的差值。
式(2)、式(3)均未用到實測流量,式(3)根據(jù)歷史樣本的模擬誤差對輸出進行修正,不需要實時信息,故BK模型不是實時校正模式。為加快訓(xùn)練速度,將輸入輸出歸一化到[-1,1]后進行計算[13]。BK模型的參數(shù)為nj,τj,以及BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元個數(shù)、BP神經(jīng)網(wǎng)絡(luò)權(quán)值偏置和最近鄰數(shù)K。依計算流程將參數(shù)分為3個層次,各層次使用NSGA-Ⅱ算法進行參數(shù)優(yōu)選,第1層次優(yōu)選階數(shù)、滯后時段數(shù);第2層次優(yōu)選BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元個數(shù)和權(quán)值偏置;第3層次優(yōu)選最近鄰數(shù)。NSGA-Ⅱ[14]是非支配排序遺傳算法,由Deb在2000年提出,有較快的收斂速度,優(yōu)化結(jié)果有良好的分布性,是最流行的多目標(biāo)優(yōu)化算法[15]。
建立分單元式BK模型進行流域產(chǎn)匯流計算,建模方式見式(5)~(7)。
其中
式中:Ps,t-i+1-τs——實測的t-i+1- τs時刻第s個子流域的降雨(i=1,2,…,n1,τs為第s個子流域的降雨滯后時段數(shù));ns——子流域個數(shù);EM,t-k——實測的t-k時刻流域蒸散發(fā)能力。
BK匯流模塊是BK模型用于匯流計算的形式,有兩種,與新安江產(chǎn)流模塊相耦合的命名為BK2,表示兩水源匯流,與新安江產(chǎn)流分水源模塊相耦合的命名為BK3,表示三水源匯流。
為保證在相同條件下與新安江模型進行匯流計算精度對比,新安江產(chǎn)流(或產(chǎn)流分水源)模塊的參數(shù)與新安江模型的對應(yīng)參數(shù)取相同值。BK模型、XBK模型和XSBK模型統(tǒng)稱為改進模型,參數(shù)τ表示各子流域各影響因素滯后時段數(shù),反映各子流域降雨或徑流向出口斷面匯集過程中所受滯后作用的大小,改進模型為多滯時模型,各子流域分別使用一個滯時值。為考察參數(shù)τ的效果,建立單滯時改進模型,模型中各子流域滯后時段數(shù)取相同值。改進模型采用分單元處理方式考慮降雨分布不均產(chǎn)生的影響,為考察分單元處理方式的效果,建立不分單元改進模型,各影響因素使用面平均值,不分單元改進模型使用單滯時形式。故本文涉及的模型包括以下10種:不分單元新安江模型、分單元新安江模型;不分單元XBK模型、XSBK模型;分單元單滯時BK模型、XBK模型、XSBK模型;分單元多滯時BK模型、XBK模型、XSBK模型。選擇呈村、東灣和大閣3個不同類型的流域進行比較,各流域水系和泰森多邊形分塊見圖1。各流域概況如下:(a)呈村流域年平均降水量1600 mm,屬典型濕潤地區(qū),流域面積290 km2,選用1989—1999共11 a的日資料系列進行日狀態(tài)變量計算,1989—1999年間20場次洪水資料的前14場次洪水進行模型率定,后6場次洪水進行模型檢驗;(b)東灣流域?qū)侔霛駶櫫饔?,流域面積2856 km2,選用1970—2000共31 a的日資料系列進行日狀態(tài)變量計算,1970—2000年間18場次洪水資料的前12場次洪水進行模型率定,后6場次洪水進行模型檢驗;(c)大閣流域面積1850 km2,選用1964—1999共36 a的日資料系列進行日狀態(tài)變量的計算,1964—1999年間的14場次洪水資料的前9場次洪水進行模型率定,后5場次洪水進行模型檢驗。
新安江模型采用客觀優(yōu)選法先后進行日、次模人工率定[15];BK模型只進行次模計算,使用分層次多目標(biāo)優(yōu)化方法率定;XBK模型和XSBK模型中新安江產(chǎn)流(或產(chǎn)流分水源)模塊日時段長和次洪時段長的參數(shù)使用新安江模型優(yōu)選值,BK匯流模塊由分層次多目標(biāo)優(yōu)化方法率定,新安江模型、XBK模型和XSBK模型次模初值從相應(yīng)時刻各自日模計算結(jié)果中讀取[16]。使用MATLAB軟件進行計算,NSGA-Ⅱ算法的種群數(shù)取100,進化代數(shù)取500,算法其他參數(shù)取值見前文或取MATLAB軟件默認值[17]。
圖1 流域水系圖和泰森多邊形分塊Fig.1 Water systems in watersheds and Thiessen polygons
表1 誤差統(tǒng)計(各場次洪水確定性系數(shù)的算術(shù)平均值)Table 1 Error statistics(arithmetic mean of coefficient of determination for various flood events)
用各場次洪水確定性系數(shù)的算術(shù)平均值作為評價準(zhǔn)則進行模型預(yù)報能力比較,各模型誤差統(tǒng)計結(jié)果見表1。K-最近鄰算法進行修正時需要在訓(xùn)練樣本集中挑選K個最近鄰,率定期計算時需要預(yù)報的樣本存在于訓(xùn)練樣本集中,挑選的K個最近鄰中必然包含預(yù)報樣本本身,其距離為零,權(quán)重?zé)o窮大,取算術(shù)平均值進行預(yù)測時其他K-1個最近鄰的權(quán)重相對很小,幾乎不發(fā)揮作用,故率定期誤差修正結(jié)果精度較高,平均確定性系數(shù)Dc基本為0.99,因此各模型只進行檢驗期Dc的比較。
a.不分單元新安江模型與不分單元XBK模型、XSBK模型的比較。呈村流域是典型的濕潤流域,適用新安江模型進行模擬,3個模型的Dc分別達到0.87,0.98和0.96,XBK模型和XSBK模型Dc均高于新安江模型;東灣流域是半濕潤流域,會發(fā)生超滲產(chǎn)流現(xiàn)象,與新安江模型的產(chǎn)流機制不完全一致,3個模型的Dc均比呈村流域有所下降,但XBK模型和XSBK模型Dc仍比新安江模型高;大閣流域是干旱半干旱流域,以超滲產(chǎn)流為主,3個模型的Dc均較低,但XBK模型和XSBK模型仍比新安江模型高。以上結(jié)果說明不分單元情況下,各流域XBK模型和XSBK模型的精度均較新安江模型有所提高。
b.分單元新安江模型與分單元多滯時BK模型、XBK模型和XSBK模型的比較。4個模型在呈村流域均取得很好的模擬效果,改進模型Dc均高于新安江模型;BK模型在東灣流域的Dc為0.53,稍低于新安江模型的Dc(0.63),該流域XBK模型和XSBK模型的Dc均高于新安江模型,并且XSBK模型Dc達0.77;BK模型在大閣流域的Dc為0.21,稍低于新安江模型的Dc(0.28),XBK模型和XSBK模型的Dc均稍高于新安江模型。以上結(jié)果說明分單元情況下,除BK模型在東灣流域和大閣流域精度稍低于新安江模型外,改進模型的精度均高于新安江模型。原因如下:首先,改進模型使用分層次、多目標(biāo)優(yōu)化算法,得到的參數(shù)接近最優(yōu)值,使改進模型具有更強的預(yù)報能力;其次,BK模型是BP模型的改進版,同時具有連續(xù)模擬能力和非線性逼近能力,配合使用分層次多目標(biāo)優(yōu)化方法,能在不損失預(yù)見期的前提下取得更高的模擬精度。
c.不分單元XBK模型和XSBK模型與分單元單滯時XBK模型和XSBK模型的比較。呈村流域分單元單滯時XBK模型與不分單元XBK模型的Dc相等(均為0.98),分單元單滯時XSBK模型的Dc(0.98)高于不分單元XSBK模型的Dc(0.96);東灣流域分單元單滯時XBK模型的Dc為0.63,稍高于不分單元XBK模型的Dc(0.62),分單元單滯時XSBK與不分單元XSBK模型的Dc相等(均為0.64);大閣流域分單元單滯時XBK模型和XSBK模型的Dc均高于不分單元XBK模型和XSBK模型。以上結(jié)果說明分單元處理方式能提高改進模型的精度。
d.分單元單滯時BK模型、XBK模型和XSBK模型與分單元多滯時BK模型、XBK模型和XSBK模型的比較。呈村流域多滯時改進模型的Dc分別為0.94,0.97和0.97,單滯時改進模型的Dc分別為0.93,0.98和0.98,2種處理方式精度相差不大;東灣流域多滯時改進模型的Dc分別為0.53,0.73和0.77,單滯時改進模型的Dc分別為0.43,0.63和0.64,多滯時處理方式精度高于單滯時處理方式;大閣流域多滯時改進模型的Dc分別為0.21,0.34和0.32,單滯時改進模型的Dc分別為0.12,0.17和0.24,多滯時處理方式精度高于單滯時處理方式。這些結(jié)果說明多滯時處理方式能提高改進模型的精度。以上分析說明分單元和多滯時處理方式均能提高改進模型的模擬精度,分單元考慮了降雨空間分布不均產(chǎn)生的影響,多滯時反映了各子流域的徑流匯入出口斷面前所受滯后推移作用的影響,間接反映了各子流域與出口斷面間距離的遠近以及各徑流在該距離上受到調(diào)蓄作用的影響。
e.不分單元情況、分單元單滯時情況、分單元多滯時情況下XBK模型和XSBK模型的比較。3種情況下各流域XBK模型和XSBK模型的Dc,不分單元情況下:呈村流域為0.98和0.96,東灣流域為0.62和0.64,大閣流域為0.11和0.21,XSBK模型的Dc總體略高于XBK模型;分單元單滯時情況下:呈村流域為0.98和0.98,東灣流域為0.63和0.64,大閣流域為0.17和0.24,XSBK模型的Dc略高于XBK模型;分單元多滯時情況下:呈村流域為0.97和0.97,東灣流域為0.73和0.77,大閣流域為0.34和0.32,XSBK模型的Dc總體略高于XBK模型。以上結(jié)果說明分水源處理方式能提高改進模型的精度。原因如下:由于各徑流成分的匯流速度不同,需要給各徑流成分配以不同的匯流階數(shù),分水源對各徑流成分的描述比不分水源更加接近自然流域的實際狀況,因此能取得更高的精度。
f.分單元單滯時情況、分單元多滯時情況下的BK模型、XBK模型和XSBK模型的比較。分單元單滯時情況下BK模型、XBK模型、XSBK模型的Dc,呈村流域為0.93,0.98和0.98,東灣流域為0.43,0.63和0.64,大閣流域為0.12,0.17和0.24,精度關(guān)系為BK模型<XBK模型<XSBK模型;分單元多滯時情況下BK模型、XBK模型、XSBK模型的Dc,呈村流域為0.94,0.97和0.97,東灣流域為0.53,0.73和0.77,大閣流域為0.21,0.34和0.32,精度關(guān)系總體上滿足BK模型<XBK模型<XSBK模型。以上結(jié)果說明BK模型的精度不如XBK模型和XSBK模型,這是由于XBK模型和XSBK模型中,產(chǎn)流過程的非線性體現(xiàn)在產(chǎn)流模塊中,BK模型匯流模塊僅對匯流過程的非線性進行擬合,這種耦合的處理方式降低了BK模塊處理數(shù)據(jù)的非線性程度。此外,由于加入了分水源處理,XSBK模型的精度高于XBK模型。
g.新安江模型與分單元多滯時XSBK模型比較。新安江模型與分單元多滯時XSBK模型的Dc,呈村流域為0.89和0.97,東灣流域為0.63和0.77,大閣流域為0.28和0.32,XSBK模型的Dc均高于新安江模型,Dc提高百分比為呈村流域0.09%、東灣流域0.22%、大閣流域0.14%。新安江模型與分單元多滯時XSBK模型相比,Dc提高率東灣流域最高,大閣流域次之,呈村流域最低。原因如下:呈村流域?qū)贊駶櫟貐^(qū),以蓄滿產(chǎn)流為主,新安江模型的精度高,提高的空間相對不大;東灣流域?qū)侔霛駶檯^(qū),蓄滿產(chǎn)流模式占主導(dǎo)地位,但仍含較多超滲產(chǎn)流因素,BK匯流模型的優(yōu)勢得以體現(xiàn),能夠取得比新安江模型更高的精度;大閣流域位于半干旱半濕潤過渡區(qū),密云水庫流域上游,地形坡度大,植被覆蓋率低,有巖石裸露,流域洪水的發(fā)生多為山區(qū)性的集中暴雨,雨強大,降雨歷時相對較短,以超滲產(chǎn)流為主,常出現(xiàn)洪峰漲不起來的現(xiàn)象,新安江模型在該流域的計算精度比東灣流域下降許多,總體模擬結(jié)果不好,XSBK模型的改進程度也不如東灣流域大。
a.改進模型的模擬結(jié)果總體上好于新安江模型,分單元、多滯時和分水源處理方法均能提高改進模型的模擬精度,使其具有更強的非線性模擬能力。分單元多滯時XSBK模型取得了最高的模擬精度。將概念性模型與改進的BP模型耦合起來建立的耦合型模型比單一改進的BP模型取得更高的模擬精度。隨著流域干旱程度的增大,超滲產(chǎn)流成分增加,模擬精度下降。
b.改進模型使用分層次多目標(biāo)優(yōu)化算法進行參數(shù)優(yōu)選,提高了優(yōu)化效率,解決了同時優(yōu)化網(wǎng)絡(luò)拓撲結(jié)構(gòu)和權(quán)值偏置的難題,提高了BP模型的泛化能力。改進模型的參數(shù)優(yōu)化不依賴于人工試算,降低了使用難度,可以找到更合理的模型參數(shù)并取得更高的模擬精度。
c.改進模型繼承了新安江模型產(chǎn)流計算精度高和黑箱子模型非線性模擬能力強的優(yōu)勢,同時還解決了常見BP模型在無前期實測流量時不能進行連續(xù)模擬和損失精度的問題,改善了BP模型檢驗期預(yù)報能力下降的現(xiàn)象,充分發(fā)揮了概念性模型和黑箱子模型的優(yōu)勢并克服了各自的不足,探索出一條將兩類模型耦合起來使用的途徑。
[1]LI Zhijia,BAO Hongjun,XUE Cangsheng,et al.Real-time flood forecasting of Huai River with flood diversion and retarding areas[J].Water Science and Engineering,2008,1(2):10-24.
[2]DENGPeng,LIZhijia,XIEFan.Application of TOPMODEL in Buliu River Basin and comparison with Xin’anjiang model[J].Water Science and Engineering,2008,1(2):25-32.
[3]LI Zhijia,WANG Lili,BAO Hongjun,et al.Rainfall-runoff simulation and flood forecasting for Huaihe Basin[J].Water Science and Engineering,2008,1(3):24-35.
[4]DENG Peng,LI Zhijia,LIU Zhiyu.Numerical algorithm of distributed TOPKAPI model and its application[J].Water Science and Engineering,2008,1(4):14-21.
[5]BAO Hongjun,WANG Lili,LI Zhijia,et al.Hydrological daily rainfall-runoff simulation with BTOPMC model and comparison with Xin’anjiang model[J].Water Science and Engineering,2010,3(2):121-131.
[6]LESHNO M,LIN V Y,PINKUS A,et al.Multilayer feed forward networks with a no polynomial activation function can approximate any function[J].Neural networks,1993,6(6):861-867.
[7]許銀山,呂孫云,梅亞東,等.維新息徑向基神經(jīng)網(wǎng)絡(luò)模型在需水預(yù)測中的應(yīng)用[J].水資源保護,2012,28(2):8-11.(XU Yinshan,LYU Sunyun,MEI Yadong,et al.New information RBF neural networKand its applilcation in forecasting of water demand[J].Water Resources Protection,2012,28(2):8-11.(in Chinese))
[8]袁偉,閆小虎.基于SPA-BP的河流水質(zhì)評價模型[J].水利水電科技進展,2011,31(增刊1):11-13.(YUAN Wei,YAN Xiaohu.River water quality assessment model based on SPA-BP[J].Advances in Science and Technology of Water Resources,2011,31(Sup1):11-13.(in Chinese))
[9]MINNSA W,HALL M J.Artificial neural networks as rainfall runoff models[J].Hydrol Sci J,1996,41(3):399-417.
[10]RAJURKAR M P,KOTHYARI U C,CHAUBE U C.Modeling of the daily rainfall-runoff relationship with artificial neural network[J].Journal of Hydrology,2004,285:96-113.
[11]趙人俊.流域水文模擬:新安江模型與陜北模型[M].北京:水利電力出版社,1984:107.
[12]SHAMSELDIN A Y,O’CONNOR KM,A nearest neighbor linear perturbation model for river flow forecasting[J].Journal of Hydrology,1996,179(1/2/3/4):353-375.
[13]劉勇,王銀堂,陳元芳,等.丹江口水庫秋汛期長期徑流預(yù)報[J].水科學(xué)進展,2010,21(6):771-778.(LIU Yong,WANG Yintang,CHEN Yuanfang,et al.Long-term runoff forecasting for autumn flooding seasons in Danjiangkou reservoir based on analyzing the physical causes[J].Advances in Water Science,2010,21(6):771-778.(in Chinese))
[14]DEB K,PRATAP A,AGARWAL S,et al.A fast and elitist multiobjective genetic algorithm:NSGA-II[J].IEEE Transactions on Evolutionary Computation,2002,6(2):182-197.
[15]張棟,蔡開元.基于遺傳算法的神經(jīng)網(wǎng)絡(luò)兩階段學(xué)習(xí)方案[J].系統(tǒng)仿真學(xué)報,2003,15(8):1088-1090.(ZHANG Dong,CAI Kaiyuan.A genetic-algorithm-based two-stage learning scheme for neural networks[J].Journal of System Simulation,2003,15(8):1088-1090.(in Chinese))
[16]芮孝芳.水文學(xué)原理[M].北京:中國水利水電出版社,2004:53.
[17]蘇金明,張蓮花,劉波,等.MATLAB工具箱應(yīng)用[M].北京:電子工業(yè)出版社,2004:122.