李慶昕
(遼寧省沈陽水文局,遼寧 沈陽 110094)
降雨徑流模型經(jīng)過多年的研究與發(fā)展已日趨成熟,其中數(shù)據(jù)驅(qū)動模型和概念性模型為目前應(yīng)用較為廣泛且發(fā)展較為成熟的預(yù)測模型,尤其是數(shù)據(jù)驅(qū)動模型,因其具有明顯的計算簡潔、運(yùn)行效率較高等優(yōu)點(diǎn),在降雨徑流模擬中應(yīng)用最為廣泛,并在實(shí)際工程中取得了良好的效果[1]。其中最近鄰模型、神經(jīng)網(wǎng)絡(luò)模型以及時間序列模型等為較常見數(shù)據(jù)驅(qū)動模型。然而在降雨徑流模擬中數(shù)據(jù)驅(qū)動模型仍存在一定的問題,如輸入變量和建模方式的確定[2]。實(shí)時校正模式即模型輸入對出流量利用實(shí)測前期流量和降雨量進(jìn)行預(yù)測,該模式為傳統(tǒng)驅(qū)動模型的基本理論,且通常只能對單步外推進(jìn)行預(yù)報,因此具有預(yù)見期短等缺陷[3]。另外,該模式通常利用大量離散單時間降雨量作為模型的降雨量最優(yōu)輸入向量,而在實(shí)際降雨過程中一定歷時的積累降雨量往往與實(shí)際出流量密切相關(guān),而不僅僅是單時刻非離散降雨量的疊加集合,由此降低了降雨徑流模擬效果[4]。神經(jīng)網(wǎng)絡(luò)模型作為數(shù)據(jù)驅(qū)動模型在水文模擬中應(yīng)用較為廣泛,然而該模型具有網(wǎng)絡(luò)集成方法與參數(shù)優(yōu)化、模型構(gòu)建方式與拓?fù)浣Y(jié)構(gòu)、輸入變量選擇等幾方面不足。
為提高降雨徑流模型的非實(shí)時校正精度,本文針對上述問題進(jìn)行了基于數(shù)據(jù)驅(qū)動模型的次洪降雨徑流模擬分析,并構(gòu)建了新型耦合數(shù)據(jù)驅(qū)動模型PEK。研究表明,PEK模型實(shí)現(xiàn)高精度連續(xù)的降雨徑流模擬,通過多步外推預(yù)報明顯提高了模型的預(yù)見期;PEK模型利用初始出流量即可完成高精度的出流量連續(xù)模擬而無需進(jìn)行流域狀態(tài)變量的分析,并表現(xiàn)出較好的適用性與簡便性[5]。研究成果可作為常用水平模擬的補(bǔ)充和輔助,也可為降雨徑流模擬預(yù)測、防洪規(guī)劃決策、洪水預(yù)報以及水資源評價管理提供一定的決策依據(jù)。
輸入變量選擇法是指在候選變量中進(jìn)行輸入變量挑選的方法,其中統(tǒng)計分析法、啟發(fā)式算法、試算法以及先驗(yàn)知識等為常見的輸入變量選擇法[6]。對于統(tǒng)計分析法具有結(jié)果穩(wěn)定可靠、應(yīng)用性較廣且效率較高等優(yōu)點(diǎn),在數(shù)據(jù)驅(qū)動模型中比較適合應(yīng)用。所以,本文對于模型的輸入變量選擇采用偏互信息處理的方法,該方法屬于目前在選擇方法中應(yīng)用最好且較為廣泛的統(tǒng)計分析法[7]。
為避免降雨有效信息的丟失,本文在考慮實(shí)測前期流量、降雨量與出流量之間關(guān)聯(lián)性作用的基礎(chǔ)上,經(jīng)過不同的輸入變量選擇過程對降雨量與實(shí)測前期流量進(jìn)行選入,即利用分離式選擇策略對候選輸入流量進(jìn)行選取,其表達(dá)式如下:
(1)
(2)
(3)
(4)
由于公式(3)是利用不連續(xù)的、離散的單時刻降雨量作為降雨量輸出變量,而在實(shí)際應(yīng)用中一定歷時和延時的積累降雨量與出流量具有密切的關(guān)聯(lián)性,因此本文針對降雨量候選輸入向量選取滑窗積累雨量進(jìn)行輸入并可利用下式進(jìn)行求解:
(5)
本研究提出了一種個體網(wǎng)絡(luò)采用三次反向傳播的新型集成神經(jīng)網(wǎng)絡(luò)模型,并對輸入數(shù)據(jù)和各自的輸出可采用個體網(wǎng)絡(luò)進(jìn)行求解,對集成輸出網(wǎng)絡(luò)的輸出采用加權(quán)平均法進(jìn)行求解,其中AIC信息準(zhǔn)則的加權(quán)平均法是個體集成網(wǎng)絡(luò)輸出計算的基本理論和基礎(chǔ)[8]。
個體網(wǎng)絡(luò)權(quán)重生成和新型個體網(wǎng)絡(luò)生成方法為EBPNN模型的兩大主要特征,對于個體網(wǎng)絡(luò)一般由早停止LM算法與NSGA-Ⅱ算法的個體網(wǎng)絡(luò)進(jìn)行生成,此方法可對網(wǎng)絡(luò)參數(shù)、最優(yōu)拓?fù)浣Y(jié)構(gòu)以及個體網(wǎng)絡(luò)的個數(shù)進(jìn)行一次性的自動確定,在確保模擬精度的前提下所生成的個體網(wǎng)絡(luò)具有良好的多樣性,可顯著提高神經(jīng)網(wǎng)絡(luò)的泛化能力。
新型集成神經(jīng)網(wǎng)絡(luò)模型是以有限個體網(wǎng)絡(luò)組合而集成的基于個體網(wǎng)絡(luò)的優(yōu)化和編碼等過程,該模型可對決策變量的上限進(jìn)行確定,并以此減少搜索空間提高優(yōu)化網(wǎng)絡(luò)效率。NSGA-Ⅱ算法在優(yōu)化過程中有兩個目標(biāo)函數(shù)即保證拓?fù)浣Y(jié)構(gòu)復(fù)雜度最小和訓(xùn)練誤差最小化。本研究中訓(xùn)練集采用3/4率定期樣本,而早停止算法的測試集選取其他率定期樣本。在生成個體網(wǎng)絡(luò)后,利用加權(quán)平均法對每個個體網(wǎng)絡(luò)權(quán)重進(jìn)行集成總輸出分析,本文結(jié)合相關(guān)文獻(xiàn)利用AIC信息準(zhǔn)則法進(jìn)行個體網(wǎng)絡(luò)權(quán)重的生成。
PEK模型是對出流量誤差利用K最近鄰算法進(jìn)行求解、對出流量利用新型集成網(wǎng)絡(luò)計算、對輸入變量采用偏互信息進(jìn)行選擇的一種降雨徑流模擬預(yù)測方法。通過利用模擬前期流量替代實(shí)測前期流量,PEK模型實(shí)現(xiàn)了高精度連續(xù)非實(shí)時校正模式下的降雨徑流模擬[9]。PEK模型通過利用EBPNN,可采用輸入向量進(jìn)行求解預(yù)報輸出,對預(yù)報預(yù)測利用K最近鄰算法進(jìn)行求解,并通過對預(yù)報誤差與輸出疊加得到網(wǎng)絡(luò)模擬輸出,其建模方式分別為:
(6)
(7)
(8)
(9)
(10)
(11)
(12)
PEK模型主要是對4個映射關(guān)系進(jìn)行確定和率定,即利用偏互信息對前期流量候選輸入向量IVSQ_SIM進(jìn)行選擇;采用偏互信息對滑窗積累雨量候選輸入向量IVSSWCR進(jìn)行輸入變量的選擇;對出流量利用EPBNN進(jìn)行預(yù)測;對出流量誤差利用KNN進(jìn)行預(yù)測。PEK模型各參數(shù)的率定方法及詳細(xì)過程參照相關(guān)文獻(xiàn)。
CLS模型是由Todini與Natale所提出的基于總徑流響應(yīng)TLR模型的約束線性系統(tǒng),該模型是在TLR模型的基礎(chǔ)上添加了兩個約束條件即水量平衡與非負(fù)響應(yīng)。并且,CLS模型將降雨量按照不同的閥值進(jìn)行劃分并以此作為雨強(qiáng)對產(chǎn)匯流過程的影響的判別依據(jù),其產(chǎn)匯流計算分別利用不同的響應(yīng)函數(shù)進(jìn)行求解,結(jié)合研究區(qū)域?qū)嶋H狀況,本研究中共有兩個CLS模型閥值[10]。
渾河流域面積約為11481km2,全長415km,河寬約2~5km,年平均降水量約718.3mm,年蒸發(fā)量約1805.4mm,年平均徑流量為30.52億m3。流域東面屬于富水區(qū),西面處于少水區(qū),徑流洪水受降雨影響顯著,降雨集中,短期暴雨是造成該流域洪水的主要原因,汛期主要集中在7—8月。研究區(qū)域?qū)儆跍貛Т箨懶约撅L(fēng)氣候,冬季干燥寒冷,夏季炎熱多雨,溫差變化較大,降水時空分布不均勻,東部降水較多,西部較少,自東至西逐級遞減。該流域東至清原,流經(jīng)撫順、沈陽等市縣,為不對稱水系,主要有大伙房水庫站、沈陽水文站、邢家窩棚水文站等8個水文站,區(qū)域內(nèi)支流主要細(xì)河、萬泉河、蒲河等10個子流域。本研究的次洪模型計算選取了2000—2009年間的20場次洪資料,其中模型率定和驗(yàn)證場次分別為14和6場次,其中降雨蒸發(fā)站選取邢家窩棚水文站[11]。
次洪歷時最小值在邢家窩棚流域?yàn)?0h,所以本研究首選設(shè)定邢家窩棚流域的階數(shù)nP=nQ=24進(jìn)行驗(yàn)證,并以此確保輸入變量能更好地包含較多輸入信息,對輸入變量利用偏互信息進(jìn)行輸入變量的選擇。結(jié)果發(fā)現(xiàn),生成最優(yōu)滑窗積累雨量以及模擬前期流量和最優(yōu)預(yù)報前期流量分別介于Pt~Pt-23、t-1~t-24范圍。選擇結(jié)果顯示出選擇nP=nQ=24可以滿足邢家窩棚流域降雨徑流相關(guān)研究,此選擇結(jié)果表現(xiàn)出良好的適用性與合理性。
通過合理設(shè)定NSGA-Ⅱ相關(guān)參數(shù)可有效提高模型的效率和優(yōu)化效果,本研究種群數(shù)與總進(jìn)化代數(shù)分別為100個和1000次,交叉與變異概率分別為0.9和0.1;LM算法的參數(shù)設(shè)定為:模型最小梯度為1~10,初始值與減少因子分別為0.001和0.1,增加因子和最大值分別為10和1E- 10。訓(xùn)練集選取3/4的率定樣本作為早停止策略,測試集為其他各率定樣本,其中失敗次數(shù)為5次。權(quán)重系數(shù)和最優(yōu)拓?fù)浣Y(jié)構(gòu)見表1。
表1 PEK模型個體網(wǎng)絡(luò)權(quán)重與最優(yōu)拓?fù)浣Y(jié)構(gòu)
表1中權(quán)重最大的拓?fù)浣Y(jié)構(gòu)為8- 4- 1,由此可在一定程度上表明最優(yōu)的拓?fù)浣Y(jié)構(gòu)包含于帕累托最優(yōu)集。隱含層神經(jīng)元個數(shù)往往不超過輸入層神經(jīng)元個數(shù)且大部分處于較小水平。研究表明,在滿足模擬精度的條件下優(yōu)化出的個體網(wǎng)絡(luò)規(guī)模往往較低且具有較好的泛化能力。
結(jié)合文中有關(guān)雨量閥值的設(shè)定,CLS模型共有兩個閥值和三個子響應(yīng)函數(shù),并且利用試算法對各子響應(yīng)函數(shù)的寬度進(jìn)行優(yōu)化。其寬度值結(jié)合研究流域洪水歷時的最小值可預(yù)先設(shè)定區(qū)間為[1,24]。本研究針對預(yù)先設(shè)定區(qū)間的合理性利用優(yōu)化結(jié)果進(jìn)行對比分析,對CLS模型利用二次規(guī)劃算法和后選值進(jìn)行率定并對模擬誤差進(jìn)行記錄。當(dāng)各寬度的候選值試算結(jié)束后選取誤差最小的寬度作為最優(yōu)解。研究表明對于邢家窩棚流域的各子響應(yīng)函數(shù)寬度整體上小于區(qū)間的上限值24,表明所設(shè)定的函數(shù)寬度24是合理可行的。
本研究分別采用MAE(平均絕對值誤差)、RMSE(均方根誤差)以及CE(納須效率系數(shù))3個準(zhǔn)則對次洪模擬結(jié)果進(jìn)行評價和分析。
結(jié)合文中公式和相關(guān)理論對降雨徑流分別利用CLS與PEK模型進(jìn)行模擬分析,其誤差結(jié)果見表2。結(jié)果表明,利用PEM模型在模擬驗(yàn)證期與率定期的邢家窩棚小流域降雨徑流均顯著優(yōu)于CLS模型。針對傳統(tǒng)數(shù)據(jù)驅(qū)動模型的不足,對PEK模型進(jìn)行了多項(xiàng)改進(jìn)和分析,主要是對輸入變量進(jìn)行了選擇優(yōu)化、訓(xùn)練并涉及了集成神經(jīng)網(wǎng)絡(luò)、添加了出流量誤差預(yù)測與模擬前期流量的新建模式,通過優(yōu)化改進(jìn)PEK模型取得了滿意的模擬結(jié)果。而CLS模型由于其具有的線性模擬特征,針對非線性問題未能取得理想的模擬結(jié)果,因此該模型不適于對非線性問題的模擬分析。
表2 各模擬方法的誤差統(tǒng)計結(jié)果表
(1)在本研究中訓(xùn)練集采用3/4率定期樣本,而早停止算法的測試集選取其他率定期樣本。在生成個體網(wǎng)絡(luò)后,利用加權(quán)平均法對每個個體網(wǎng)絡(luò)的權(quán)重進(jìn)行集成總輸出分析,本文利用AIC信息準(zhǔn)則法進(jìn)行個體網(wǎng)絡(luò)權(quán)重的生成。
(2)在滿足模擬精度的條件下優(yōu)化出的個體網(wǎng)絡(luò),其網(wǎng)絡(luò)規(guī)模往往較低且具有較好的泛化能力。