常新雨,周建中,方 威,王彧蓉,黃靖瑋
(華中科技大學(xué)土木與水利工程學(xué)院,湖北 武漢 430074)
中長(zhǎng)期徑流預(yù)報(bào)是根據(jù)前期水文氣象資料,利用成因分析或數(shù)理統(tǒng)計(jì)分析等方法,對(duì)未來較長(zhǎng)時(shí)間的水文要素進(jìn)行科學(xué)預(yù)測(cè)[1],其遇見期一般超過3天或者1年以內(nèi)。流域中長(zhǎng)期徑流預(yù)報(bào)對(duì)水庫群聯(lián)合優(yōu)化調(diào)度、水資源優(yōu)化配置、跨流域調(diào)水等方面具有重要的指導(dǎo)性作用[2]。但是,受制于氣候變化、河道演進(jìn)和人類活動(dòng)等眾多因素的影響。流域中長(zhǎng)期徑流預(yù)報(bào)面臨著許多挑戰(zhàn);因此,如何提高預(yù)報(bào)的精度和穩(wěn)定性一直是研究的熱點(diǎn)。國內(nèi)外研究學(xué)者對(duì)于流域中長(zhǎng)期徑流預(yù)報(bào)做了大量的研究工作,提出了許多徑流預(yù)報(bào)新的方法和理論,對(duì)提高流域預(yù)報(bào)精度起到了一定的積極作用。目前,中長(zhǎng)期徑流預(yù)報(bào)常用的方法有季節(jié)自回歸法、神經(jīng)網(wǎng)絡(luò)算法、支持向量機(jī)算法等[3-4]。朱雙等[5]利用了基于灰色關(guān)聯(lián)分析的模糊支持向量機(jī)方法對(duì)金沙江上游石鼓站月徑流進(jìn)行預(yù)測(cè),取得了較高的預(yù)測(cè)精度。王佳等[6]建立了基于經(jīng)驗(yàn)?zāi)B(tài)分解和人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,發(fā)現(xiàn)該模型連續(xù)滾動(dòng)預(yù)報(bào)徑流針對(duì)汛期預(yù)報(bào)的效果較好;而同期預(yù)報(bào)更有利于枯水期的預(yù)報(bào)。
預(yù)報(bào)因子篩選也是影響中長(zhǎng)期徑流預(yù)報(bào)的關(guān)鍵因素之一,對(duì)于提高預(yù)報(bào)精度具有十分重要的意義。國內(nèi)外眾多學(xué)者在篩選預(yù)報(bào)因子時(shí),常將歷史徑流、降雨數(shù)據(jù)、氣象因子等這些與流域徑流密切相關(guān)的因素考慮在內(nèi)。預(yù)報(bào)因子的篩選處理方法有互信息、灰色關(guān)聯(lián)分析、主成分分析等。麥紫君等[7]通過偏互信息方法遴選與逐月徑流具有顯著相關(guān)性的氣候因子,并采用多元回歸方法建模進(jìn)行中長(zhǎng)期徑流預(yù)報(bào)。農(nóng)振學(xué)等[8]通過構(gòu)建基于相關(guān)系數(shù)、逐步回歸、主成分分析3種因子篩選方法,將降雨、徑流等常規(guī)因子和130項(xiàng)大氣環(huán)流指數(shù)等相關(guān)因子作為預(yù)報(bào)因子,構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的中長(zhǎng)期徑流預(yù)報(bào)模型。
堵河流域位于鄂西北漢江右岸,地跨陜西、湖北兩省,流域內(nèi)堵河為漢江第一大支流。堵河干流全長(zhǎng)約330 km,流域面積約12 430 km2,平均坡降0.481%,流域平均海拔為467 m。流域全境皆山,西源大巴山逶迤東向,南源神農(nóng)架聳立插天,普陀、武當(dāng)環(huán)抱東北,地勢(shì)高亢。其流域內(nèi)的黃龍灘水庫控制流域面積為11 140 km2,其正常高水位為247.00 m,庫容為7.99億m3。流域內(nèi)主要河流及水庫分布見圖1。
圖1 研究區(qū)域及站點(diǎn)示意
堵河系山溪性河流,徑流主要來自降雨。據(jù)黃龍灘水文站1950年~1973年實(shí)測(cè)徑流資料統(tǒng)計(jì),多年平均流量191 m3/s,年徑流總量60.2億m3。徑流年內(nèi)分配不均,每年4月~10月為汛期,年最大洪水在汛期各月均可出現(xiàn),尤以7月、9月兩月出現(xiàn)機(jī)會(huì)為最多,汛期徑流量占年徑流量占年徑流總量的83%左右。實(shí)測(cè)年內(nèi)最大流量為10 600 m3/s,出現(xiàn)于1937年9月26日。調(diào)查最大流量12 300 m3/s,出現(xiàn)于1867年。一次洪水多由一次暴雨所形成,洪水過程多呈單峰,歷時(shí)一般為3~5 d,復(fù)式洪水歷時(shí)達(dá)5~7 d。
根據(jù)黃龍灘水庫2012年~2018年和潘口水庫2010年~2012年的徑流和降水?dāng)?shù)據(jù),采用灰色關(guān)聯(lián)分析法篩選預(yù)報(bào)因子,建立深度神經(jīng)網(wǎng)絡(luò)(DNN)、Elman神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)徑流3種預(yù)測(cè)模型。
灰色關(guān)聯(lián)分析是對(duì)一個(gè)系統(tǒng)發(fā)展變化態(tài)勢(shì)的定量描述和比較的方法。其基本思想是通過確定參考數(shù)據(jù)列和若干個(gè)比較數(shù)據(jù)列間的幾何形狀相似程度來判斷其聯(lián)系是否緊密,反映變量間的關(guān)聯(lián)程度[9]。在進(jìn)行灰色關(guān)聯(lián)分析計(jì)算時(shí),首先需要確定參考數(shù)列X0和比較數(shù)列X1,X2,…,Xn。即[10]
(1)
其次計(jì)算關(guān)聯(lián)系數(shù)ξ(k),分別計(jì)算每個(gè)比較序列與參考序列對(duì)應(yīng)元素的關(guān)聯(lián)系數(shù)
k=1,2,…,m
(2)
式中,ρ為分辨系數(shù),通常ρ取0.5。若ρ越小,關(guān)聯(lián)系數(shù)間差異越大,區(qū)分能力越強(qiáng)。
最后計(jì)算得到關(guān)聯(lián)度r,以反映參考數(shù)列與各比較數(shù)列的關(guān)聯(lián)關(guān)系,計(jì)算公式為
(3)
深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)是在經(jīng)典的三層神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,通過加深網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)建具有多隱含層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù)。相比于其他的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),DNN可以發(fā)揮其自身多層隱含層結(jié)構(gòu)的優(yōu)勢(shì)(見圖2),具有優(yōu)秀的非線性處理能力,在處理數(shù)據(jù)集合較多,特征較為復(fù)雜的數(shù)學(xué)及物理問題面前具有較好的處理效果[11]。
圖2 DNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
由圖2可知,深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可分為3類。即,第一層為輸入層,中間為隱含層,最后一層為輸出層。層與層之間采用全連接,不同神經(jīng)元之間采用權(quán)重進(jìn)行前向傳播,從輸入層開始,一層層地向后計(jì)算,一直運(yùn)算到輸出層,得到輸出結(jié)果。
Elman神經(jīng)網(wǎng)絡(luò)模型的基本思想與BP算法一樣,不同之處是Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)除了輸入層,隱藏層和輸出層外,還多了一個(gè)關(guān)聯(lián)層[12]。關(guān)聯(lián)層的每個(gè)神經(jīng)元都與一個(gè)隱藏層神經(jīng)元連接,其主要作用是保留對(duì)應(yīng)的隱藏層神經(jīng)元前一時(shí)刻的信號(hào),并在當(dāng)前時(shí)刻將其傳入隱藏層,完成狀態(tài)反饋過程,提高模型的學(xué)習(xí)效率和模擬準(zhǔn)確度。Elman神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖3所示。
圖3 Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
支持向量機(jī)(Support Vector Machine,SVM)是結(jié)合統(tǒng)計(jì)學(xué)的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化的機(jī)器學(xué)習(xí)方法(Cortes C & Vapnik 1995),最早用于解決模式識(shí)別問題[13]。它在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),可以分析數(shù)據(jù),識(shí)別模式,用于分類和回歸分析。這也使得其在中長(zhǎng)期徑流預(yù)報(bào)中占有重要地位,且發(fā)展前景廣闊,其計(jì)算公式如下[14]
(4)
最終回歸函數(shù)為
(5)
影響模型預(yù)報(bào)效果的一個(gè)重要因素是預(yù)報(bào)因子,研究工作所選用的三個(gè)預(yù)報(bào)模型均需要提供相應(yīng)的預(yù)報(bào)因子作為模型輸入。在對(duì)預(yù)報(bào)因子進(jìn)行選擇時(shí),首先需要對(duì)預(yù)報(bào)對(duì)象的物理成因進(jìn)行分析,鎖定與之有緊密聯(lián)系的對(duì)象作為候選因子;其次灰色關(guān)聯(lián)分析法進(jìn)行分析,挑選最終的預(yù)報(bào)因子。
在篩選黃龍灘水庫中長(zhǎng)期徑流預(yù)報(bào)因子時(shí),首先需要將歷史徑流和歷史降雨作為主要的因子來考慮,由于潘口水庫位于黃龍灘水庫上游,其水庫出流對(duì)于下游水庫的入流影響較大,因此在進(jìn)行因子分析時(shí)也需將潘口出庫作為篩選因子之一。選取黃龍灘水庫2012年~2019年的12個(gè)歷史平均流量(T-1Q~T-12Q)、3個(gè)歷史同期流量(YEAR-1Q~YEAR-3Q)、12個(gè)歷史面降雨量(T-1Q~T-12Q)、3個(gè)歷史同期面降雨量(YEAR-1P~YEAR-3P)、1個(gè)潘口水庫同期出庫流量(T-PQ)和3個(gè)潘口水庫歷史平均流量(T-1PQ~T-3PQ)作為預(yù)報(bào)因子,以當(dāng)前黃龍灘平均流量作為參考序列(T-Q),通過灰色關(guān)聯(lián)分析法計(jì)算其關(guān)聯(lián)度,得到的旬、月尺度下關(guān)聯(lián)度較高的7個(gè)預(yù)報(bào)因子(見表1)。
由表1可知,與黃龍灘入庫徑流關(guān)聯(lián)度最高的預(yù)報(bào)因子為潘口同時(shí)期出庫流量。由此可知,上游水庫出庫流量與下游水庫入庫流量密切相關(guān),將上游水庫出庫流量作為主要的預(yù)報(bào)因子考慮在內(nèi)顯得十分重要。
表1 預(yù)報(bào)因子篩選結(jié)果
在進(jìn)行中長(zhǎng)期徑流預(yù)報(bào)過程時(shí),首先需要率定出預(yù)報(bào)模型的最優(yōu)參數(shù),才能為實(shí)時(shí)預(yù)報(bào)提供實(shí)際參考價(jià)值,率定參數(shù)時(shí)訓(xùn)練期與檢驗(yàn)期徑流數(shù)據(jù)比一般符合3∶1左右的原則,因此本文將2013年~2016年徑流數(shù)據(jù)作為訓(xùn)練期,2017年~2018年徑流數(shù)據(jù)作為檢驗(yàn)期。
3.2.1 旬流量預(yù)測(cè)模擬結(jié)果對(duì)比分析
在進(jìn)行旬流量預(yù)測(cè)時(shí),深度神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為7個(gè),隱藏層節(jié)點(diǎn)為13個(gè),輸出層節(jié)點(diǎn)為1個(gè),截止誤差為0.000 01,訓(xùn)練次數(shù)為10 000。Elman神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為7個(gè),兩層隱藏層節(jié)點(diǎn)數(shù)均為13個(gè),輸出層節(jié)點(diǎn)為1個(gè),截止誤差為0.001,最大學(xué)習(xí)率為0.3,截止誤差為0.001,訓(xùn)練次數(shù)為10 000。支持向量機(jī)截止誤差為0.000 01,訓(xùn)練次數(shù)為10 000。
黃龍灘水庫所屬堵河流域?qū)儆跍貛Ъ撅L(fēng)氣候,旬尺度平均流量受到氣候、季風(fēng)、水庫調(diào)蓄等多方面影響,實(shí)際進(jìn)行預(yù)測(cè)時(shí)很難提高預(yù)報(bào)精度。通過對(duì)以上3種模型進(jìn)行參數(shù)率定,得到旬尺度下黃龍灘水庫入庫流量模擬結(jié)果。下表給出了旬尺度下深度神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)3種預(yù)報(bào)模型最優(yōu)參數(shù)下的訓(xùn)練期與檢驗(yàn)期的確定性系數(shù)、洪峰合格率、均方差和平均相對(duì)誤差(見表2)。
表2 旬尺度下黃龍灘水庫徑流預(yù)報(bào)結(jié)果
基于率定得到的3種模型最優(yōu)參數(shù),計(jì)算得到訓(xùn)練期和檢驗(yàn)期的黃龍灘入庫徑流預(yù)測(cè)值,圖4~6給出了3種不同模型參數(shù)下,黃龍灘水庫入庫2013年~2018年訓(xùn)練期與檢驗(yàn)期的實(shí)測(cè)值與模擬值擬合曲線。
由圖4~6可以看出,3種預(yù)測(cè)模型模擬效果較好,訓(xùn)練期與檢驗(yàn)期實(shí)測(cè)值與模擬值誤差較小,預(yù)報(bào)精度較高。但是在檢驗(yàn)期內(nèi),支持向量機(jī)相比于深度神經(jīng)網(wǎng)絡(luò)與Elman神經(jīng)網(wǎng)絡(luò),對(duì)洪峰具有較好的擬合效果,其洪峰合格率明顯優(yōu)于另外2種預(yù)測(cè)模型。
圖4 旬尺度下深度神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)模擬效果
圖5 旬尺度下Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模擬效果
圖6 旬尺度下支持向量機(jī)預(yù)測(cè)模擬效果
3.2.2 月流量預(yù)測(cè)模擬結(jié)果對(duì)比分析
在進(jìn)行月流量預(yù)測(cè)時(shí),深度神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為7個(gè),隱藏層節(jié)點(diǎn)為13個(gè),輸出層節(jié)點(diǎn)為1個(gè),截止誤差為0.000 01,訓(xùn)練次數(shù)為10 000。Elman神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為7個(gè),兩層隱藏層節(jié)點(diǎn)數(shù)均為13個(gè),輸出層節(jié)點(diǎn)為1個(gè),截止誤差為0.001,最大學(xué)習(xí)率為0.2,截止誤差為0.001,訓(xùn)練次數(shù)為10 000。支持向量機(jī)截止誤差為0.000 01,訓(xùn)練次數(shù)為10 000。
由于黃龍灘水庫歷史入流數(shù)據(jù)序列較短,直接導(dǎo)致月平均流量數(shù)據(jù)序列較少,因此流量的預(yù)測(cè)效果并不理想。表3給出了月尺度下黃龍灘水庫DNN深度神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)、SVM支持向量機(jī)3種預(yù)報(bào)模型最優(yōu)參數(shù)下的訓(xùn)練期與檢驗(yàn)期的確定性系數(shù)、洪峰合格率、均方差和平均相對(duì)誤差。
表3 月尺度下黃龍灘水庫徑流預(yù)報(bào)結(jié)果
基于率定得到的3種模型最優(yōu)參數(shù),計(jì)算得到訓(xùn)練期和檢驗(yàn)期的黃龍灘入庫徑流預(yù)測(cè)值,圖7~9給出了3種不同模型參數(shù)下,黃龍灘水庫入庫2013年~2018年訓(xùn)練期與檢驗(yàn)期的實(shí)測(cè)值與模擬值擬合曲線。
圖7 月尺度下深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模擬效果
圖8 月尺度下Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模擬效果
圖9 月尺度下SVM支持向量機(jī)預(yù)測(cè)模擬效果
由圖7~9可以看出,月尺度下3種預(yù)測(cè)模型模擬效果均較好,實(shí)測(cè)值與模擬值誤差較小,預(yù)報(bào)精度較高。檢驗(yàn)期內(nèi)支持向量機(jī)在洪峰擬合程度上要優(yōu)于深度神經(jīng)網(wǎng)絡(luò)與Elman神經(jīng)網(wǎng)絡(luò),且具有更高的預(yù)測(cè)精度。
在對(duì)黃龍灘水庫進(jìn)行旬、月尺度徑流預(yù)測(cè)時(shí),本文采用灰色關(guān)聯(lián)分析法篩選預(yù)報(bào)因子,最終篩選出7個(gè)與徑流關(guān)聯(lián)度較高的因子作為最終的預(yù)報(bào)因子;建立了基于數(shù)據(jù)驅(qū)動(dòng)的深度神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)3種徑流預(yù)報(bào)模型,分別基于旬、月尺度下水庫歷史徑流數(shù)據(jù)進(jìn)行預(yù)測(cè),得到了其不同預(yù)報(bào)模型下的確定性系數(shù)、洪峰合格率、均方差和平均相對(duì)誤差參數(shù)?,F(xiàn)對(duì)以上3種模型進(jìn)行對(duì)比分析得到:
(1)預(yù)報(bào)因子的篩選對(duì)于中長(zhǎng)期徑流預(yù)報(bào)精度具有較大的影響,由于梯級(jí)水庫上游調(diào)蓄直接影響下游水庫入庫徑流,因此本文在采用灰色關(guān)聯(lián)分析法篩選預(yù)報(bào)因子時(shí),將潘口水庫出庫流量考慮在內(nèi),最終得到了與黃龍灘水庫入庫徑流關(guān)聯(lián)度較高的七個(gè)預(yù)報(bào)因子。
(2)本文建立的3種中長(zhǎng)期徑流預(yù)測(cè)模型均能較好地預(yù)測(cè)旬月尺度下黃龍灘水庫的入庫徑流,訓(xùn)練期和檢驗(yàn)期內(nèi)預(yù)測(cè)值與實(shí)測(cè)值之間的誤差較小,各個(gè)模型的確定性系數(shù)均達(dá)到了0.9以上,洪峰合格率在0.8左右,具有較好的預(yù)測(cè)效果。
(3)對(duì)比3種中長(zhǎng)期徑流預(yù)測(cè)模型,無論是旬尺度下還是月尺度下各個(gè)模型的擬合效果均較好。其中,深度神經(jīng)網(wǎng)絡(luò)與Elman神經(jīng)網(wǎng)絡(luò)在洪峰預(yù)測(cè)上誤差較大,支持向量機(jī)實(shí)測(cè)值與模擬值誤差較小,且具有較高的模擬精度。