劉 昱,閆寶偉,劉金華,穆 冉,王 浩
(1.華中科技大學(xué)土木與水利工程學(xué)院,武漢 430074;2.中國電建集團(tuán)華東勘測(cè)設(shè)計(jì)研究院有限公司,杭州 311122)
高精度徑流預(yù)報(bào)對(duì)防洪減災(zāi)、水庫群梯級(jí)聯(lián)合調(diào)度、水資源優(yōu)化配置等具有重要指導(dǎo)意義[1]。一直以來,水文預(yù)報(bào)領(lǐng)域的學(xué)者們都在嘗試使用參數(shù)化方法描述流域降雨徑流過程的邊界條件、時(shí)空分布和物理過程,即傳統(tǒng)意義上的水文模型[2]。受氣象、自然地理?xiàng)l件、流域特性等眾多因素的綜合影響,徑流過程呈現(xiàn)出強(qiáng)非線性、非平穩(wěn)性和隨機(jī)性等多種特性,使得傳統(tǒng)水文模型的預(yù)報(bào)精度受到制約[3,4]。
人工智能和機(jī)器學(xué)習(xí)的興起,逐漸改變著人類生產(chǎn)生活方式和思維方式,對(duì)經(jīng)濟(jì)發(fā)展、社會(huì)進(jìn)步等方面產(chǎn)生重大而深遠(yuǎn)的影響?,F(xiàn)有水文預(yù)報(bào)方法眾多,基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)徑流預(yù)報(bào)模型因不需要深入了解水文過程的物理機(jī)理而備受關(guān)注[5]。其中,循環(huán)神經(jīng)網(wǎng)絡(luò)RNN 及其變體時(shí)間長短記憶模型LSTM 應(yīng)用較為廣泛[6,7]。這類神經(jīng)網(wǎng)絡(luò)模型都會(huì)生成一組具有固定體系的結(jié)構(gòu)單元,這些單元隨著時(shí)間的推移而被不斷復(fù)制,為時(shí)不變模型。在多步預(yù)測(cè)中時(shí)間不變性會(huì)降低模型學(xué)習(xí)跨多個(gè)時(shí)間步長的能力,使得多步預(yù)測(cè)的精度逐漸降低。為此,引入時(shí)變的ForecastNet神經(jīng)網(wǎng)絡(luò)模型[8],分析其在徑流模擬和預(yù)報(bào)中的適用性,研究其多步預(yù)測(cè)效果,以期為徑流的實(shí)時(shí)預(yù)報(bào)提供依據(jù)。
RNN 是深度學(xué)習(xí)中常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),主要用于處理和預(yù)測(cè)時(shí)間序列數(shù)據(jù)。與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)不同的是,RNN 是有記憶功能的,如圖1所示,其網(wǎng)絡(luò)結(jié)構(gòu)每層之間的節(jié)點(diǎn)是有連接的,其中隱藏層的輸入不僅包含輸入層的輸出,還包含上一時(shí)刻隱藏層的輸出。RNN的一般結(jié)構(gòu)可表示為:
圖1 RNN一般結(jié)構(gòu)示意圖Fig.1 General structure of RNN
式中:xt和yt分別為t時(shí)刻的輸入層和輸出層;ht和ht-1分別為t時(shí)刻和t- 1 時(shí)刻的隱藏層;gs和fo分別為隱藏層和輸出層的激活函數(shù)。
RNN 具有一組隨時(shí)間保持不變的鏈?zhǔn)浇Y(jié)構(gòu)單元,這種結(jié)構(gòu)單元具有參數(shù)共享的優(yōu)點(diǎn)[8],但同時(shí)一方面會(huì)削弱其學(xué)習(xí)復(fù)雜時(shí)間依賴關(guān)系的能力,另一方面會(huì)存在梯度消失的難題。為了解決RNN中梯度消失的問題,LSTM 通過引入門控結(jié)構(gòu),一定程度緩解了RNN梯度消失的問題,但其結(jié)構(gòu)單元仍是隨時(shí)間保持不變的。RNN和LSTM 結(jié)構(gòu)單元的時(shí)不變性會(huì)減弱模型在多步學(xué)習(xí)中的能力,降低多步預(yù)測(cè)的精度[9]。為更好學(xué)習(xí)時(shí)間序列的多步動(dòng)態(tài)變化過程,如圖2 所示,在RNN 基礎(chǔ)上發(fā)展而來的ForecastNet 通過建立交錯(cuò)輸出的深度前饋架構(gòu),使其結(jié)構(gòu)單元隨時(shí)間變化,從而有效降低梯度消失的問題。ForecastNet 的一般結(jié)構(gòu)可表示為:
圖2 ForecastNet一般結(jié)構(gòu)示意圖Fig.2 General structure of ForecastNet
式中:gt和ft分別為隱藏層和輸出層在t時(shí)刻的激活函數(shù)。
ForecastNet 是一種循環(huán)神經(jīng)網(wǎng)絡(luò),其隱藏單元可以是某種形式的前饋神經(jīng)網(wǎng)絡(luò),如多層感知器(Multi Pleperceptron,MLP)、卷積神經(jīng)網(wǎng)絡(luò)(Conudutional Neural Netuerk,CNN)或自注意力機(jī)制。作為一個(gè)前饋網(wǎng)絡(luò),即使每個(gè)隱藏單元的結(jié)構(gòu)都是相同的,每個(gè)單元都有自己獨(dú)特的參數(shù),因此,它是一個(gè)時(shí)變結(jié)構(gòu)。ForecastNet 通過引入快捷鏈接結(jié)構(gòu)[10]和輸出層結(jié)果,使得隱藏層之間交錯(cuò)輸出,其網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)隨時(shí)間而變,梯度反向傳播中的連乘形式也變?yōu)榧臃ㄐ问?,而這種加法形式相比連乘形式更加穩(wěn)定,從而可以減輕梯度消失問題,適用于模擬時(shí)間序列的長期動(dòng)態(tài)過程。
雅礱江流域水量豐沛、落差大,干支流蘊(yùn)藏了豐富的水力資源。根據(jù)雅礱江流域水能開發(fā)規(guī)劃,到2025年以前,全流域水電項(xiàng)目開發(fā)將全面完成。因此高精度的徑流模擬和預(yù)報(bào)可以為雅礱江流域梯級(jí)水庫開發(fā)和運(yùn)行提供科學(xué)依據(jù)。本研究以雅礱江雅江站以上流域作為研究區(qū)域(簡稱雅江流域),流域總面積6.5萬km2,氣象、水文站點(diǎn)和水系分布如圖3所示。
圖3 雅江流域水系圖Fig.3 The drainage system of Yajiang river basin
2.2.1 數(shù)據(jù)準(zhǔn)備
選取雅江站1984-1997年的歷史日徑流數(shù)據(jù)作為模型的數(shù)據(jù)集,其中,1984-1994年共11年的數(shù)據(jù)用于模型率定,1995-1997年共3年的數(shù)據(jù)用于模型驗(yàn)證,數(shù)據(jù)分布如圖4所示。
圖4 雅江站徑流數(shù)據(jù)集Fig.4 The runoff dataset of Yajiang station
2.2.2 模型準(zhǔn)備
為了驗(yàn)證ForecastNet 模型在雅江流域的日徑流模擬效果,建立傳統(tǒng)分布式水文模型SWAT 與其進(jìn)行比較。SWAT 模型是基于GIS 的分布式水文模型,可模擬流域中多種不同的水文物理化學(xué)過程,常用來模擬和預(yù)測(cè)下墊面及氣候變化下流域水文循環(huán)的響應(yīng)。本研究以Cao等[11]建立的雅礱江SWAT模型為基礎(chǔ),得出了雅江站率定期和驗(yàn)證期的模擬徑流。其中,SWAT模型所需的氣象數(shù)據(jù)包括日降水量、最高、最低氣溫、太陽輻射、風(fēng)速和相對(duì)濕度。為了保證兩類模型輸入的一致性,從上述氣象數(shù)據(jù)中選取與雅江站徑流相關(guān)性較高的預(yù)報(bào)因子作為ForecastNet 模型輸入,選取的預(yù)報(bào)因子包括圖5 中6 個(gè)雨量站(清水河、石渠、色達(dá)、甘孜、新龍、道孚)的降雨數(shù)據(jù)、面平均最高氣溫、面平均最低氣溫和月份,共9 項(xiàng),輸出即為雅江站的模擬徑流。
為確保數(shù)據(jù)保持相同規(guī)模,F(xiàn)orecastNet 的輸入數(shù)據(jù)需要進(jìn)行標(biāo)準(zhǔn)化處理。因此,采用最大最小歸一化將上述氣象和水文數(shù)據(jù)及其所對(duì)應(yīng)的月份進(jìn)行標(biāo)準(zhǔn)化,計(jì)算公式如下:
式中:z為標(biāo)準(zhǔn)化之后的數(shù)據(jù);x為原始數(shù)據(jù);xmin和xmax分別為原始數(shù)據(jù)系列的最小值和最大值。
神經(jīng)網(wǎng)絡(luò)通常包含許多超參數(shù),其值在ForecastNet 模型建立開始之前需設(shè)定,無需從模型訓(xùn)練過程中獲得。超參數(shù)優(yōu)化或調(diào)整是找到超參數(shù)元組的過程,使得給定數(shù)據(jù)的損失函數(shù)最?。?2]。ForecastNet 模型的超參數(shù)及參數(shù)范圍如表1 所示,使用網(wǎng)格搜索方法[12,13]尋求最優(yōu)參數(shù),結(jié)果如表1所示。
表1 ForecastNet模型最優(yōu)參數(shù)表Tab.1 Optimal parameters of ForecastNet
為了檢驗(yàn)ForecastNet 模型在多步實(shí)時(shí)預(yù)測(cè)中的預(yù)測(cè)性能,本研究進(jìn)一步考慮當(dāng)前徑流,將其加入模型的輸入,分別建立雅江流域不同預(yù)見期(3、5、7 d)的ForecastNet 模型,并與RNN神經(jīng)網(wǎng)絡(luò),LSTM 神經(jīng)網(wǎng)絡(luò)和RNN-LSTM 組合神經(jīng)網(wǎng)絡(luò)[14]3 種時(shí)不變循環(huán)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比分析。選取Nash-Suthcliffe系數(shù)(NSE)、均方根誤差(RMSE)和百分比偏差(PBIAS)3 個(gè)指標(biāo)進(jìn)行模型優(yōu)劣的評(píng)價(jià)。
2.3.1 ForecastNet與SWAT模擬結(jié)果對(duì)比分析
表2 給出了SWAT 和ForecastNet 在率定期和驗(yàn)證期的模擬精度評(píng)價(jià)結(jié)果??梢钥闯?,SWAT 在率定期和驗(yàn)證期的NSE均低于0.8,而ForecastNet 的模擬精度明顯高于SWAT,NSE 分別達(dá)到0.88 和0.82。圖5 和圖6 分別給出了雅江站在驗(yàn)證期的徑流模擬過程和實(shí)測(cè)-模擬徑流相關(guān)圖,可以看出,SWAT 對(duì)于9月份汛期的洪水模擬明顯偏大,而ForecastNet 則能夠較好地模擬該部分洪水過程。圖6 也顯示出SWAT 的模擬結(jié)果更加發(fā)散,而ForecastNet 的模擬結(jié)果更加集中,與實(shí)測(cè)值更加接近。雅江流域位于雅礱江流域的上游,區(qū)域內(nèi)降水站點(diǎn)稀少,且大部分分布于流域邊界處,模型輸入的雨量信息不能全面反映雅江流域降水空間分布的異質(zhì)性,使得SWAT 水文模型徑流模擬結(jié)果偏差,而ForecastNet 神經(jīng)網(wǎng)絡(luò)模型能夠較好地提取預(yù)報(bào)因子相關(guān)信息,進(jìn)一步挖掘時(shí)間序列的組成特性,有效提高徑流模擬的精度。
圖5 驗(yàn)證期徑流模擬結(jié)果Fig.5 Runoff simulation results in the validation period
圖6 實(shí)測(cè)-模擬徑流相關(guān)圖Fig.6 Correlation between observed and simulated runoff
表2 徑流模擬評(píng)價(jià)指標(biāo)統(tǒng)計(jì)表Tab.2 The statistical table of runoff simulation evaluation index
2.3.2 ForecastNet多步預(yù)測(cè)結(jié)果分析
進(jìn)一步將當(dāng)前實(shí)測(cè)徑流作為輸入加入模型,分別建立RNN、LSTM、RNN-LSTM 和ForecastNet 在不同預(yù)見期下(3、5、7 d)的實(shí)時(shí)預(yù)測(cè)模型,預(yù)見期的預(yù)測(cè)結(jié)果如表3 所示。在預(yù)見期為3 d 時(shí),RNN、LSTM、RNN-LSTM 的NSE還可以達(dá)到0.8 以上,隨著預(yù)見期的增加,這些模型的NSE下降較快,預(yù)見期為5 d時(shí),NSE下降到0.75以下,預(yù)見期為7 d時(shí),NSE下降到0.7以下。而ForecastNet 表現(xiàn)更優(yōu),在3 d 和5 d 預(yù)見期的NSE分別高達(dá)0.88 和0.82,預(yù)見期為7 d 時(shí),NSE仍能保持在0.75 以上。圖7給出了4種模型在不同預(yù)見期的預(yù)測(cè)值和實(shí)測(cè)值的相關(guān)圖,同樣,與RNN、LSTM 和RNN-LSTM 等時(shí)不變模型相比,F(xiàn)orecast-Net的時(shí)變結(jié)構(gòu),使得其預(yù)測(cè)結(jié)果與實(shí)測(cè)值更為接近,且隨著預(yù)見期的增長,F(xiàn)orecastNet預(yù)測(cè)精度降低地也較慢。
表3 4種模型預(yù)測(cè)結(jié)果對(duì)比Tab.3 Comparison of forecasting results of four models
圖7 預(yù)見期為3、5和7 d時(shí)的預(yù)測(cè)徑流與實(shí)測(cè)值相關(guān)圖Fig.7 Correlation between observed and predicted runoff for 3,5 and 7 d-ahead forecasts
針對(duì)傳統(tǒng)水文模型及神經(jīng)網(wǎng)絡(luò)模型多步預(yù)測(cè)精度降低的問題,基于具有時(shí)變結(jié)構(gòu)的ForecastNet 模型,建立了雅江流域不同預(yù)見期的日尺度預(yù)測(cè)模型。與傳統(tǒng)的水文模型SWAT 相比,F(xiàn)orecastNet模型能夠較好地提取預(yù)報(bào)因子相關(guān)信息,進(jìn)一步挖掘時(shí)間序列的組成特性,有效提高徑流模擬的精度;與RNN、LSTM及其組合神經(jīng)網(wǎng)絡(luò)模型相比,F(xiàn)orecastNet模型能夠利用其時(shí)變特性提高長預(yù)見期的預(yù)測(cè)精度和穩(wěn)定性。ForecastNet模型的這些優(yōu)異表現(xiàn),使得其更適合于徑流的長預(yù)見期實(shí)時(shí)預(yù)測(cè),為水庫的實(shí)時(shí)運(yùn)行和流域水資源管理提供決策依據(jù)。