摘要:
江河控制性水文站在流域防汛抗旱減災(zāi)體系占據(jù)重要位置。準(zhǔn)確預(yù)測(cè)江河控制站流量對(duì)洪澇災(zāi)害防御、水資源管理、應(yīng)急調(diào)度、航道安全等具有重要意義。以長(zhǎng)江中游漢口水文站為例,基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)方法,以上游螺山站、仙桃站及其自身流量序列為輸入,構(gòu)建了漢口水文站未來1 d,3 d和7 d流量預(yù)測(cè)模型。結(jié)果表明:基于LSTM模型的漢口水文站未來1 d,3 d和7d流量預(yù)測(cè)取得很好的效果,納什效率系數(shù)分別可達(dá)0.999 3,0.989 5和0.914 9。該方法實(shí)用性和可移植性強(qiáng),可為江河控制站流量預(yù)測(cè)提供一種簡(jiǎn)單、高效的工具。
關(guān)鍵詞:
流量預(yù)測(cè); 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM); 漢口水文站
中圖法分類號(hào):P338
文獻(xiàn)標(biāo)志碼:A
DOI:10.15974/j.cnki.slsdkb.2025.02.005
文章編號(hào):1006-0081(2025)02-0026-05
0 引 言
中國(guó)是世界上水旱災(zāi)害頻發(fā)嚴(yán)重的國(guó)家之一。近年來,在氣候變化和人類活動(dòng)雙重影響下,中國(guó)水旱災(zāi)害防御、水資源高效利用面臨更嚴(yán)峻的挑戰(zhàn)[1]。江河控制性水文站作為監(jiān)測(cè)江河重要防洪控制斷面、重要支流入?yún)R斷面、大型天然湖泊或蓄滯洪區(qū)水文情勢(shì)的重要水文站點(diǎn),承擔(dān)著水文情報(bào)監(jiān)測(cè)預(yù)報(bào)工作,是防汛抗旱工作的重要支撐。控制性水文站斷面流量的高精度模擬與預(yù)測(cè)對(duì)流域水旱災(zāi)害防御、水資源高效利用、水環(huán)境水生態(tài)保護(hù)和水工程運(yùn)行管理均具有重要的現(xiàn)實(shí)意義[2]。
流量模擬預(yù)測(cè)方法可分為基于物理過程驅(qū)動(dòng)模型方法和數(shù)據(jù)驅(qū)動(dòng)方法[3-4]。物理過程驅(qū)動(dòng)模型以流域各類水文、氣象信息作為輸入,驅(qū)動(dòng)基于流域產(chǎn)匯流過程建立的物理模型,進(jìn)行徑流模擬預(yù)測(cè)。以新安江模型、VIC模型為代表的過程驅(qū)動(dòng)模型已廣泛應(yīng)用于水文領(lǐng)域,在許多流域均有較好的應(yīng)用效果,但也存在模型結(jié)構(gòu)復(fù)雜、所需輸入數(shù)據(jù)較多、建模困難等問題,在一定程度上限制了過程驅(qū)動(dòng)模型的應(yīng)用[3]。數(shù)據(jù)驅(qū)動(dòng)模型不考慮流域產(chǎn)匯流機(jī)制,基于統(tǒng)計(jì)分析從輸入、輸出樣本數(shù)據(jù)中“學(xué)習(xí)”流域產(chǎn)匯流過程的復(fù)雜關(guān)系,是對(duì)傳統(tǒng)基于物理驅(qū)動(dòng)模型的有益補(bǔ)充[4]。不少研究表明:數(shù)據(jù)驅(qū)動(dòng)模型基于歷史徑流時(shí)間序列數(shù)據(jù)可以習(xí)得復(fù)雜的非線性水文過程,能夠獲得較高質(zhì)量的徑流模擬預(yù)測(cè)結(jié)果[5-8]。
實(shí)踐中基本采用基于物理過程的水文模型進(jìn)行流量預(yù)報(bào)預(yù)測(cè),一般根據(jù)上游站點(diǎn)流量通過洪水演進(jìn)方法進(jìn)行流量預(yù)報(bào)。與控制性水文站相關(guān)的研究也多集中于河道匯流及洪水研究方法方面。本文針對(duì)控制性水文站流量預(yù)測(cè),以長(zhǎng)江干流控制性水文站漢口(武漢關(guān))水文站(以下簡(jiǎn)稱“漢口站”)為例,應(yīng)用機(jī)器學(xué)習(xí)方法長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)[9],構(gòu)建漢口站基于數(shù)據(jù)驅(qū)動(dòng)的流量預(yù)測(cè)模型,對(duì)該站未來1 d、3 d和7 d的日均流量進(jìn)行預(yù)測(cè)。研究成果可驗(yàn)證數(shù)據(jù)驅(qū)動(dòng)方法在漢口站流量預(yù)測(cè)中的適應(yīng)性,同時(shí)也可為漢口站流量預(yù)測(cè)提供一種簡(jiǎn)單、高效的方法工具,作為常規(guī)水文模型方法的補(bǔ)充。
1 研究方法
1.1 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)作為機(jī)器學(xué)習(xí)算法的代表,得益于其特殊的結(jié)構(gòu)設(shè)計(jì),能夠很好地表征時(shí)間序列間的相關(guān)性和依存性,廣泛應(yīng)用于時(shí)間序列預(yù)測(cè)問題,在水文序列預(yù)測(cè)方面亦有相應(yīng)的應(yīng)用。在水庫(kù)入庫(kù)流量預(yù)測(cè)[7]、湖泊水位預(yù)測(cè)[10]等取得了較好的效果。LSTM模型是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體,能夠有效解決RNN存在的長(zhǎng)期依賴記憶丟失、梯度消失或爆炸等問題。LSTM模型通過遺忘門(f)、輸入門(i)、輸出門(o)分別控制信息的丟失、記憶和傳遞,細(xì)胞狀態(tài)(Ct)和隱藏狀態(tài)(ht)分別捕捉緩慢和快速的演變過程[11]。LSTM模型結(jié)構(gòu)如圖1所示,相關(guān)計(jì)算公式見式(1)。
(1)
式中:ft,it,ot,Ct分別為遺忘門、輸入門、輸出門和記
憶細(xì)胞狀態(tài);
W,b分別為相應(yīng)的權(quán)重矩陣和偏移變量;
ht,~Ct分別為隱含層狀態(tài)和記憶更新變量;
σ,tanh分別
為sigmod函數(shù)和雙曲正切函數(shù);
⊙為矩陣元素點(diǎn)乘。
1.2 模型構(gòu)建與預(yù)測(cè)方案設(shè)置
本文使用LSTM模型對(duì)控制性水文站流量進(jìn)行預(yù)測(cè),可以作為傳統(tǒng)模型的有益補(bǔ)充。同時(shí),LSTM挖掘徑流時(shí)間序列內(nèi)在復(fù)雜響應(yīng)關(guān)系,可對(duì)較長(zhǎng)預(yù)見期流量進(jìn)行預(yù)測(cè),彌補(bǔ)傳統(tǒng)物理模型對(duì)較長(zhǎng)預(yù)見期預(yù)報(bào)能力薄弱問題。模型構(gòu)建流程如下。
(1) 數(shù)據(jù)準(zhǔn)備。收集控制性水文站及其上游斷面流量或水位時(shí)間序列用于建模。數(shù)據(jù)前70%作為訓(xùn)練集,后30%作為測(cè)試集。同時(shí),將數(shù)據(jù)進(jìn)行0均值,1標(biāo)準(zhǔn)差形式的標(biāo)準(zhǔn)化,以消除數(shù)據(jù)量級(jí)帶來的影響。
(2) 輸入、輸出集構(gòu)建。模型以收集到控制站斷面流量及上游斷面流量時(shí)間序列的前n d流量序列作為輸入,預(yù)報(bào)未來k d的流量。本文以漢口站流量站(Qhk)為預(yù)測(cè)對(duì)象,收集到上游斷面螺山站(Qls)、上游支流控制站仙桃站(Qxt)流量序列。以n=2,k=1為例,說明輸入、輸出數(shù)據(jù)形式(表1)。
(3) LSTM參數(shù)設(shè)置?;谠囼?yàn)及已有相關(guān)文獻(xiàn)的參數(shù)設(shè)置經(jīng)驗(yàn),主要LSTM參數(shù)設(shè)置如下:LSTM層數(shù)為2,隱含層數(shù)目為80,丟棄率為0.2,模型損失函數(shù)為mse,優(yōu)化器采用Adam。模型批量大小為64,迭代輪次為100。模型構(gòu)建訓(xùn)練與預(yù)測(cè)程序均在Windows 10系統(tǒng)(CPU:IntelCore i7-7700HQ@2.8 GHz)基于TensorFlow(2.7.0)和Keras(2.7.0)框架進(jìn)行。
(4) 結(jié)果評(píng)價(jià)。依據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。
1.3 評(píng)價(jià)指標(biāo)
為了評(píng)價(jià)模型預(yù)測(cè)結(jié)果的可靠性和準(zhǔn)確性,依據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》,選取均方根誤差(RMSE)和納什效率系數(shù)(NSE)對(duì)模型性能和預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。各指標(biāo)計(jì)算公式如下:
RMSE= ∑ni=1(yi-xi)2n(2)
NSE=1-∑ni=1(yi-xi)2∑ni=1(xi-x)2(3)
式中:xi,yi分別為觀測(cè)值和模擬預(yù)測(cè)值;
x為觀測(cè)值均值;
n為樣本個(gè)數(shù)。
RMSE越小、NSE(-∞~1]越大表示模擬效果越好。
2 研究區(qū)域及數(shù)據(jù)
2.1 研究區(qū)域
漢口站站址位于湖北省武漢市江漢區(qū)花樓街道苗家碼頭,是監(jiān)測(cè)長(zhǎng)江中游干流在漢江匯入后水情的基本水文站,控制面積148.80萬km2,屬于國(guó)家重要水文站和國(guó)家一類精度站。螺山水文站是漢口站上游重要流量控制站,距離漢口站150 km,位于湖北省洪湖市螺山鎮(zhèn)螺山社區(qū),主要監(jiān)測(cè)長(zhǎng)江荊江河段與洞庭湖出流匯合后的水情,控制面積129.49萬km2,占漢口站控制面積的87.02%,屬于國(guó)家重要水文站和國(guó)家一類精度站。仙桃水文站位于湖北省潛江市,是漢江匯入長(zhǎng)江前最后一個(gè)全年測(cè)流的控制站,距漢口站90 km,控制面積14.47 km2。螺山—漢口區(qū)間入流主要有左岸的漢江和右岸的陸水。其中,漢江流域面積15.9萬km2,占漢口站控制面積的10.69%,陸水流域面積0.4萬km2,占漢口站控制面積的0.27%。故漢口站流量主要由上游長(zhǎng)江干流來水與支流漢江來水構(gòu)成。本文將漢口站上游螺山水文站和漢江仙桃水文站納入研究范圍,對(duì)漢口站流量預(yù)測(cè)問題進(jìn)行研究。漢口、螺山及仙桃水文站位置關(guān)系如圖2所示。
2.2 數(shù)據(jù)來源
本文采用漢口、螺山和仙桃水文站2010年1月1日至2019年12月31日10 a的日平均流量數(shù)據(jù)。構(gòu)建LSTM模型時(shí),以2017年1月1日為界,將數(shù)據(jù)分為訓(xùn)練集(70%)和驗(yàn)證集(30%)。為了避免數(shù)據(jù)差異過大影響模型性能,模型訓(xùn)練前將數(shù)據(jù)進(jìn)行0均值(均值為0,方差為1)標(biāo)準(zhǔn)化處理。
3 結(jié)果與討論
3.1 最佳前期輸入序列長(zhǎng)度確定
分別以n=1,3,5,7將螺山、仙桃以及漢口自身序列的前n項(xiàng)作為模型輸入,構(gòu)建輸入輸出集,并建立相應(yīng)的LSTM模型,進(jìn)行訓(xùn)練并預(yù)測(cè)漢口站流量。預(yù)測(cè)模型預(yù)見期長(zhǎng)度分別設(shè)定為1 d,3 d和7 d。各模型訓(xùn)練期(2010~2016年)和驗(yàn)證期(2017~2020年)的納什效率系數(shù)(NSE)和均方根誤差(RMSE)見表2。從表2可以看出,針對(duì)不同預(yù)見期的預(yù)報(bào)預(yù)測(cè)需求,各模型在訓(xùn)練期和驗(yàn)證期均表現(xiàn)出良好的性能指標(biāo)。1 d預(yù)見期模型最佳輸入序列長(zhǎng)度為3,即使用螺山、仙桃和漢口站前3 d的流量預(yù)報(bào)漢口站未來1 d的流量可以達(dá)到最優(yōu)效果,相應(yīng)的NSE在訓(xùn)練期和驗(yàn)證期均為0.999 3。3 d預(yù)見期模型的最佳輸入序列長(zhǎng)度為5,但與輸入序列長(zhǎng)度為3時(shí)的模型性能差別不大,模型應(yīng)用時(shí)使用前3 d流量和前5 d流量均可,使用各站前3 d 流量作為輸入對(duì)應(yīng)模型復(fù)雜度更小。7 d預(yù)見期模型的輸入序列長(zhǎng)度為7時(shí),在訓(xùn)練期呈現(xiàn)最優(yōu)性能,但驗(yàn)證期性能指標(biāo)下降較為明顯。輸入序列長(zhǎng)度為3時(shí),在驗(yàn)證期性能指標(biāo)最優(yōu),達(dá)到0.914 9,在訓(xùn)練期模型性能也較為良好,故確定7 d預(yù)見期模型的最佳輸入序列長(zhǎng)度為3。
進(jìn)一步對(duì)比驗(yàn)證期不同模型性能,由圖3可以看出,對(duì)于不同預(yù)見期,不同前期輸入序列長(zhǎng)度,LSTM流量預(yù)測(cè)模型均表現(xiàn)出良好的性能。在驗(yàn)證期,1 d預(yù)見期模型NSE可達(dá)0.99以上,3 d預(yù)見期模型NSE可達(dá)0.98以上,7 d預(yù)見期模型NSE可達(dá)0.91以上。說明基于LSTM的流量預(yù)測(cè)模型能夠?yàn)闈h口站流量預(yù)測(cè)提供高質(zhì)量的成果。由于隨預(yù)見期延長(zhǎng),流量預(yù)測(cè)難度增大,因此隨預(yù)見期增長(zhǎng),NSE呈現(xiàn)下降、RMSE呈現(xiàn)上升趨勢(shì),符合一般預(yù)報(bào)預(yù)測(cè)規(guī)律。
3.2 漢口站不同預(yù)見期流量預(yù)測(cè)結(jié)果
基于上述確定的最佳輸入序列長(zhǎng)度,對(duì)漢口站未來1 d,3 d和7 d日均流量進(jìn)行預(yù)測(cè),結(jié)果如圖4~6所示。由圖4可以看出,1 d預(yù)見期模型預(yù)測(cè)值與實(shí)測(cè)值幾乎一致,對(duì)洪峰、洪水走勢(shì)都能很好地預(yù)測(cè),NSE也相應(yīng)達(dá)到0.999。雖然上游螺山站、仙桃站距離漢口站均不遠(yuǎn),洪水演進(jìn)時(shí)間一般不超過1 d,但1 d模型的最優(yōu)輸入序列長(zhǎng)度為3,即模型輸入數(shù)據(jù)為螺山、仙桃和漢口站前3 d的流量數(shù)據(jù),說明相較基于物理過程的洪水演進(jìn)模型,LSTM預(yù)測(cè)模型也辨識(shí)到了漢口站未來1 d流量與其自身及上游來水流量序列的內(nèi)在關(guān)系,因此基于數(shù)據(jù)驅(qū)動(dòng)的徑流預(yù)測(cè)模型可以作為傳統(tǒng)基于物理過程模型的有益補(bǔ)充。
從圖5可以看出,3 d預(yù)見期模型也表現(xiàn)出優(yōu)良的性能,能很好地預(yù)測(cè)汛期大洪水的洪峰和過程,預(yù)測(cè)偏差主要集中在汛前和汛后期的中型規(guī)模洪水洪峰位置,但偏差一般不大。從圖6中可以看出,7 d預(yù)見期模型能夠很好地預(yù)報(bào)洪水走勢(shì)和形狀,汛期大洪水的預(yù)測(cè)性能也較為良好,預(yù)測(cè)偏差也主要集中在汛前汛后中型規(guī)模洪峰位置,偏差也較3 d模型大。這是因?yàn)?,汛前汛后時(shí)期,實(shí)測(cè)徑流表現(xiàn)出較為頻繁的波動(dòng),這可能是由于長(zhǎng)江上游控制性水庫(kù)群每年在汛前消落水位、汛后期進(jìn)行集中蓄水,特別是汛前消落時(shí)會(huì)伴隨人造洪峰形式的生態(tài)調(diào)度過程,造成這兩個(gè)時(shí)期徑流波動(dòng)頻繁,預(yù)測(cè)難度大。
4 結(jié) 論
本文針對(duì)江河控制性水文站流量預(yù)測(cè)問題進(jìn)行研究,以長(zhǎng)江中游漢口站為研究實(shí)例,基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)方法,以上游螺山站、仙桃站及其自身流量序列為輸入,構(gòu)建漢口水文站未來1,3 d和7 d流量預(yù)測(cè)模型,并確定了各預(yù)見期前期輸入序列時(shí)間長(zhǎng)度。結(jié)果表明:基于LSTM模型的漢口站流量預(yù)測(cè)模型能夠?qū)ξ磥?,3 d和7 d的流量進(jìn)行高效、高精度預(yù)測(cè),NSE分別可達(dá)0.999 3,0.989 5和0.914 9。本文構(gòu)建的基于深度學(xué)習(xí)數(shù)據(jù)驅(qū)動(dòng)流量預(yù)測(cè)模型,能夠很好地辨識(shí)控制性水文站與其上游流量序列和自身流量序列間的復(fù)雜非線性關(guān)系,對(duì)控制性水文站流量預(yù)測(cè)問題具有良好的適應(yīng)性和魯棒性。
參考文獻(xiàn):
[1] 劉志雨.我國(guó)水文監(jiān)測(cè)預(yù)報(bào)預(yù)警體系建設(shè)與成就[J].中國(guó)防汛抗旱,2019,29(10):25-29.
[2] 梁家志,劉志雨.中國(guó)水文情報(bào)預(yù)報(bào)的現(xiàn)狀及展望[J].水文,2006(3):57-59,80.
[3] 雷曉輝,王浩,廖衛(wèi)紅,等.變化環(huán)境下氣象水文預(yù)報(bào)研究進(jìn)展[J].水利學(xué)報(bào),2018,49(1):9-18.
[4] 劉攀,鄭雅蓮,謝康,等.水文水資源領(lǐng)域深度學(xué)習(xí)研究進(jìn)展綜述[J].人民長(zhǎng)江,2021,52(10):76-83.
[5] 胡慶芳,曹士圯,楊輝斌,等.漢江流域安康站日徑流預(yù)測(cè)的LSTM模型初步研究[J].地理科學(xué)進(jìn)展,2020,39(4):636-642.
[6] 王鏡淋,王敬,沈來銀,等.基于人工神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期徑流預(yù)報(bào)模型研究[J].水利水電快報(bào),2023,44(9):6-10,28.
[7] 潘志浩,陳森林,梁斌,等.基于EMD-LSTM模型的右江水庫(kù)日入庫(kù)流量預(yù)測(cè)[J].水資源研究,2022,11(1):20-29.
[8] 朱豪,胡圓昭,尹明財(cái),等.基于優(yōu)化算法的CNN-BiLSTM-attention的月徑流量預(yù)測(cè)[J].人民長(zhǎng)江,2023,54(12):96-104.
[9] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[10] LI G,LIU Z,ZHANG J,et al.Bayesian model averaging by combining deep learning models to improve lake water level prediction[J].Science of the Total Environment,2024,906:167718.
[11] 李步,田富強(qiáng),李鈺坤,等.融合氣象要素時(shí)空特征的深度學(xué)習(xí)水文模型[J].水科學(xué)進(jìn)展,2022,33(6):904-913.
(編輯:李 慧)
Research on flow forecast of Hankou Hydrological Station based on LSTM
SUN Yating1,YANG Yang1,LUO Qian1,LIANG Bin2
(1.Middle Changjiang River Bureau of Hydrology and Water Resources Survey,Changjiang Water Resources Commission,Wuhan 430014,China;
2.School of Water Resources and Hydropower Engineering,Wuhan University,Wuhan 430072,China)
Abstract: Controlling hydrological stations of rivers play a critical role in flood control,drought relief,and disaster mitigation within a river basin.Accurately forecasting the flow at controlling stations is of great significance for flood disaster prevention,water resource management,emergency scheduling,and navigation safety.Taking the Hankou Hydrological Station in the middle reaches of Changjiang River as a case study,a flow prediction model for 1-day,3-day,and 7-day forecasts at the Hankou Station was developed based on the Long Short-Term Memory (LSTM) neural network method.The model used flow sequences from upstream Luoshan Station,Xiantao Station,and Hankou Station itself as inputs.The results showed that the LSTM-based model achieved excellent performance for 1-day,3-day,and 7-day flow predictions at Hankou Station,with Nash-Sutcliffe Efficiency coefficients of 0.999 3,0.989 5 and 0.914 9,respectively.This method has strong practicality and transferability,and can provide a simple and efficient supplementary tool for flow prediction at controlling stations.
Key words:
flow forecast; Long Short-Term Memory (LSTM); Hankou Hydrological Station