摘要:
長短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡深度學習方法具有顯著的時序分析能力,在徑流預報方面有其獨特的優(yōu)勢,但該模型預報的最優(yōu)輸入輸出長度組合尚不太明確,探析不同輸入輸出長度對LSTM日徑流預報效率的影響對相關應用具有實際意義。以四川省西部大渡河、雅礱江、岷江支流以及嘉陵江上游等流域為研究區(qū),選取了20個子/區(qū)間流域,試驗不同長度的前期輸入資料預報不同預見期下的徑流,研究了不同資料長度下LSTM模型的日徑流預報效率,分析了該方法在不同流域的適用性與最優(yōu)輸入輸出長度的特征。結果表明:①以前期降水、氣溫以及徑流作為輸入,前期資料長度對預報結果影響不太明顯,但預報準確性會隨預見期延長而下降,采用該種輸入方案的預見期不宜超過7 d;②僅以前期降水、氣溫資料作為輸入,預報準確性會隨前期資料長度增加而提高,也會隨預見期的延長而下降,建議該種方案的資料長度大于7 d、預見期最好為1 d,不宜超過3 d;③徑流變異性是顯著影響預報效率和最優(yōu)輸入輸出長度組合的重要因子,變異性強,則預報效果較差,對輸入輸出長度的敏感性偏弱。研究成果可為提高深度學習徑流預報效率提供參考,有助于結合流域特性確定適用的輸入輸出長度組合方案。
關 鍵 詞:
徑流預報; 資料長度; 預見期長度; LSTM; 深度學習
中圖法分類號: TV124
文獻標志碼: A
DOI:10.16232/j.cnki.1001-4179.2023.03.013
0 引 言
徑流預報是水文水資源分析的重要內容,也是洪澇預警、流域調度的關鍵環(huán)節(jié)。神經(jīng)網(wǎng)絡為徑流預報提供了一類基于統(tǒng)計的簡單靈活方法[1-4]。其中,長短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡模型,在序列數(shù)據(jù)擬合上有其獨特的優(yōu)勢,已經(jīng)被廣泛應用于徑流預報和模擬中,展現(xiàn)了良好的預報性能[5-8]。
LSTM模型能夠學習信息之間的長期依賴關系,在融雪徑流和匯流時間較長的流域,預報效果比較理想,但在氣候條件極端的流域,預報效果不太理想[9-13]。Kratzert等[12]采用241個流域檢測了LSTM的預報潛力,其中只有半數(shù)流域納什效率系數(shù)(NSE)達到0.65,其余流域大多位于干旱區(qū)域,預報效果不太理想,低估了徑流峰值。Boulmaiz等[13]采用20個流域來測試訓練數(shù)據(jù)長度對預報效果的影響,表明了日尺度徑流預報需要9~12 a的訓練數(shù)據(jù)才能保證預報效果。而在其多次測試的結果中,有3個流域的預報效果始終不太理想,這是由于輸入數(shù)據(jù)中存在極端事件,使得LSTM模型難以從稀少的極端事件中捕捉到準確的時序信息。可見,模型的預報性能可能會受到流域的地理、氣候等自然特征影響;在模型中拓展體現(xiàn)流域特征的物理模塊或參數(shù),可以提高模型的預報性能[14-15]。但也有學者指出,LSTM模型從根本上無法嚴謹?shù)貙W習水量平衡的規(guī)律,因而不太可能模擬完備的實際物理規(guī)律[16]。
作為數(shù)據(jù)驅動模型,LSTM模型的預報效果與輸入數(shù)據(jù)息息相關。不同長度的前期資料輸入得到的預報結果存在差異[17],要使預報準確率達到最優(yōu),需要一定長度的資料來確保模型能夠提取到足夠的信息,如王萌[7]的研究中資料長度為75 d。同時,預見期也是影響模型預報效果的重要因子。一般地,預見期增加,模型預報效果會下降[5-6,18-19],陶思銘等[18]初步探索了預見期的影響,表明預見期在18 d內,模型預報的相對誤差絕對值的平均值可維持在20%以下。
可見,LSTM模型的徑流預報效率同輸入輸出長度有直接的內在聯(lián)系,探究其規(guī)律有助于確定適用的資料輸入方案。為此,本文以大渡河及臨近流域為研究區(qū),探究不同長度前期輸入的日徑流預報效率及其同預見期的關系,分析不同資料組合方案對LSTM模型輸入輸出長度的敏感性,并研究該敏感性的影響因子。
1 數(shù)據(jù)及研究方法
1.1 研究區(qū)及資料選取
本文選取了位于四川省西部的大渡河、雅礱江、岷江的支流,以及嘉陵江上游區(qū)域為研究區(qū),經(jīng)緯度在26.6°N~34.7°N,96.8°E~107.1°E之間(見圖1)。研究區(qū)屬于山區(qū)流域,海拔變化大(1 000~5 000 m),以亞熱帶季風氣候為主。徑流主要由降雨形成,部分由融雪、地下水補給;年際變化不大,年內變化曲線多呈雙峰,峰值出現(xiàn)在7月和9月。大渡河下游及青衣江流域位于暴雨區(qū),徑流隨暴雨發(fā)生而陡漲陡落;所選嘉陵江上游區(qū)域狀似扇形,汛期徑流陡漲,洪水峰高歷時短。
本文所用數(shù)據(jù)來自水文站點和氣象站日尺度的實測數(shù)據(jù)。對水文站點的徑流數(shù)據(jù)進行篩選整理,剔除缺漏嚴重或異常較多的站點和年份,最終挑選了20個水文站點中較為可靠的數(shù)據(jù)序列,并依據(jù)站點位置劃分了20 個子流域(流域按站名命名)。所選流域包括典型山區(qū)流域、暴雨山區(qū)流域、亞高山山區(qū)流域幾個類型。站點的具體情況如表1所列。
氣象數(shù)據(jù)采用了研究區(qū)及其周邊的54個氣象站點的降水和氣溫資料,并以算術平均法計算子流域日尺度的面平均降水和面平均氣溫。
此外,為降低不同類數(shù)據(jù)對模型計算權重的影響,加快模型的收斂速度,還預先對數(shù)據(jù)進行了歸一化處理。
1.2 模型方法
長短時記憶網(wǎng)絡(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)的變體,通過增加的3個“門”,化解了RNN對長序列模擬乏力的問題。在日尺度徑流預報中,12 a的數(shù)據(jù)訓練長度才能保證模型達到最優(yōu)[13]。本文試驗中各站的數(shù)據(jù)長度雖不同,但基本滿足訓練和驗證的數(shù)據(jù)長度要求。
本文設計了兩種輸入因子組合方案(見圖2):僅輸入前期面平均降水(P)和面平均氣溫(T)的PT方案,以及在PT方案基礎加上前期徑流(R)的PTR方案。以1,3,5,7,9,12,15,20,25,30 d作為輸入資料長度,預見期則按1~30 d進行取值,得到300個資料長度和預見期長度組合。對各流域不同輸入因子方案的不同長度組合進行訓練、模擬,以檢驗LSTM模型在不同流域的適用性,探究資料長度對預報的影響,并找出不同資料長度下合適的預見期長度。
參考其他研究[20-21]以及多次調試驗證,本文模型超參數(shù)設定方案如下:隱藏層輸出單元數(shù)(units)為64、批處理量(batch_size)為64、數(shù)據(jù)遍歷次數(shù)(epochs)為100。以均方誤差(MSE)作為模型訓練過程中的損失函數(shù)。
對輸出結果,本文采用納什效率系數(shù)(NSE)作為評價指標:
NSE=1-ni=1(yobs,i-ymod,i)2ni=1(yobs,i-obs)2(1)
式中:yobs,i為i時刻的觀測值;ymod,i為相應的模型預報值;obs為觀測序列的平均值;n為預報序列長度。
為降低由網(wǎng)絡隨機性帶來的誤差,對每一組合都獨立重復100次,以100次結果的均值作為該組合的最終評價指標。
2 結果與討論
2.1 模擬結果
不同輸入因子的組合方案在不同資料長度與預見期條件下得到的統(tǒng)計結果如圖3所示。
對于PTR方案,前期資料長度對模型預報效率的影響微弱,以預見期1 d的情況為例,20個流域中有11個的NSE大于0.800,7個處于0.600~0.800區(qū)間,2個小于0.600,站點的NSE分布情況不受前期資料長度影響;20個站點的NSE平均值隨前期資料長度的延長而輕微下降,從1 d延長至30 d,NSE均值由0.823逐漸下降至0.809。
相比PTR方案,PT方案下模型的預報效率整體下降,NSE均值在各輸入輸出長度組合下都更低。在該方案下,預報效率受資料長度的影響明顯,同樣以預見期1 d為例,隨著前期資料長度從1 d延長至30 d,20個流域的NSE分布情況逐漸右移,即NSE大于0.600的流域從0個逐漸增加至15個,NSE均值也由0.460逐漸升高至0.713。
兩種方案,模型受預見期的影響都十分顯著。對圖3的統(tǒng)計結果進行橫向比較,以前期資料長度30 d為例,預見期逐漸延長,NSE分布逐漸左移,NSE均值迅速下降,即預見期從1 d變?yōu)?,7,15,30 d,PTR方案下NSE均值由0.809下降至0.460,PT方案下由0.713 下降至0.458。
并且,20個流域的預報效率差異顯著,受輸入輸出長度的影響程度不一。PTR方案,相同的輸入輸出長度條件下,NSE最大的流域與最小的相差值均超過0.5。以輸入資料長度7 d、預見期1 d的情況為例,NSE最大的是雅江流域為0.982,最小的是馬邊流域為0.460,相差0.522。
綜合來看,為保證較好的預報效果,對于PT方案,前期資料長度應大于7 d,預見期最好在3 d以內;對于PTR方案,預見期在7 d以內仍可以使得的NSE均值在0.600以上。
2.2 前期資料長度對預報效率的影響
模型對不同類型的資料依賴程度不同,使得前期輸入長度對模型的影響因輸入方案而異。
從產(chǎn)匯流來說,由于流域的調蓄作用,當前時刻的降水在一段時間之后才能匯入河道而形成徑流。因此,某日降水可能會影響未來幾日的徑流;反之,某日的徑流量也會與前一時段的降水相關。所以,PT方案下,模型需要足夠長度的前期降水資料,才能較為準確預報流域徑流,即模型預報效率會隨前期資料長度的延長而提高,并趨于穩(wěn)定(見圖4(a))。需注意的是,圖4中展示的是20個流域的均值,就單個流域而言,部分流域對前期資料長度的依賴會稍弱,NSE能更容易達到0.600,也能更快趨于穩(wěn)定。整體而言,PT方案,前期資料長度達到7 d,才能保證大部分流域的NSE能達到0.600。
輸入因子方案中加入徑流后(PTR方案),由于徑流序列的自相關性強,且包含的時序信息更豐富,前期徑流取代降水成為影響預報的主導因子。一般地,大部分流域除了洪水期,日徑流量變化不會太大,所以,僅僅前期1 d的徑流資料,就包含了前期及未來一定時段的水文過程信息(該時段的長短同流域產(chǎn)匯流響應時長相關),繼續(xù)增加前期的徑流數(shù)據(jù),增加的新信息已十分有限。因此,該種方案下前期輸入長度對模型的影響被極大地削弱。如圖3和圖4所示,前期輸入的變化,對NSE的分布和均值的影響十分微弱。
與預期結果不同,PTR方案下,延長前期輸入的長度,還可能會帶來負效益,如圖4(b)所示:預見期為1 d,前期輸入延長了29 d的情況下,NSE均值并未提升,反而略有下降(降了0.014)。這種情況的可能原因是:延長前期資料長度,增加的新信息可能有限,同時可能出現(xiàn)過多冗余信息。在深度學習方法中,冗余會導致信息權重的失真;被冗余“強調”的信息會得到更大權重,相應地導致“其他信息”的權重在一定程度上降低。如果“其他信息”是有效信息,顯然冗余會給預報帶來負效益;反之,若“其他信息”是噪聲,則這種輸入的增加能抑制噪聲[22]。比如,圖4(b)中預見期為30 d的情況,NSE呈上升趨勢,由0.426升至0.460,輸入的增加對預報起了正效應。一般地,利用相關系數(shù)、梯度提升決策樹、主成分分析法等方法,進行數(shù)據(jù)降維處理和特征選擇,可以解決數(shù)據(jù)冗余的問題,提高運算速度[23-25]。
整體而言,PTR方案下資料長度對預報效果的影響不大(對NSE的提升/降低不超0.05),但結合模型運算速度來看,應限制前期輸入長度。
2.3 預見期的選擇
預見期越長,輸入的數(shù)據(jù)資料與要預報的徑流之間的相關性越弱,模型也就越難捕捉到時序的有效信息??傮w而言,延長預見期,預報難度加大,預報準確性下降。
PT方案下,LSTM模型獲得的信息偏少,對前期資料長度高度依賴。不同的前期資料長度下,模型的表現(xiàn)差異明顯,不同資料長度下合適的預見期長度不同,如圖5及表2所示。
PTR方案下,模型受前期資料長度的制約極小。預報徑流的NSE與預見期之間大體滿足對數(shù)關系:
NSE=-0.103ln(x)+0.806(2)
式中:NSE為20個流域納什系數(shù)的平均值;x為預見期長度。
綜合考慮下,為保證預報結果的準確性,采用PT方案時,前期資料長度為15 d以內,預見期長度不宜超過3 d;30 d以內不宜超過4 d。采用PTR方案時,預見期7 d以內都能得到較為準確的預報結果。
2.4 徑流變異性對預報效率的影響
PTR方案下,20個流域中有2個流域的NSE始終無法達到0.600,分別為馬邊和流沙河;有6個流域的NSE系數(shù)僅在預見期1 d的情況下,可以達到0.600,分別為紅旗、三磊壩、涪江橋、多營坪、夾江、略陽。
圖6 展示了PTR方案資料長度7 d、預見期1 d下,流沙河流域徑流過程的預報。模型對徑流峰值部分存在嚴重的低估;放大圖還顯示,預報峰值要比實測值滯后1 d。
流沙河流域徑流陡漲陡落,徑流的日間變化大,變異性強。如圖6所示,流沙河流域實測降水與徑流位相是幾乎同步的,這說明流域產(chǎn)匯流速度較快,大部分降水水量在當日即可達到出口斷面,匯流時間小于1 d;而對于日徑流預報來說,最小預見期為1 d。與林康聆等的研究結果類似,當預見期大于匯流時間時,LSTM模型預報能力顯著變差[19]。
對一場典型降水-徑流過程,一般地,流量過程線相對降水過程線有一定位相滯后,假設為1 d,那么LSTM模型學習到降水-流量時序規(guī)律后,能根據(jù)前一日的降水峰值,在次日預報出徑流峰值,得到較為準確的徑流預報。但是,在日尺度的粗略時間分辨率下,暴雨小流域流沙河的降水-流量過程位相關系被掩蓋了,LSTM難以有效提取學習降水-徑流時序規(guī)律,導致暴雨洪水期預報效果不理想。
可見,這種局限是由于資料的時間分辨率對流域徑流過程刻畫能力不足所致,流沙河日尺度的降雨、徑流資料無法體現(xiàn)流域徑流匯流過程的時序關聯(lián)規(guī)律,采用更詳盡的時序資料,則可能提高預報效果。
不同流域受資料時間分辨率的限制程度不同,與流域徑流相鄰時段變化程度(徑流變異性)相關。為更好地刻畫流域的徑流變異特征,采用1 d時滯相關系數(shù)的倒數(shù)Vrunoff進行量化:由原始徑流序列(R1,R2,R3,…,Rn)按1 d時滯生成兩列新的序列{R1,R2,R3,…,Rn-1}和{R2,R3,R4,…,Rn};兩個序列相關系數(shù)的絕對值越接近0,兩個序列的差異越大,Vrunoff也越大。
Vrunoff=1R2delay,1=n-ji=1(Ri+1-1)2·n-ji=1(Ri-2)2n-ji=1(Ri+1-1)·(Ri-2)2(3)
式中:Ri為第i時段的徑流量;Ri+1為第i+1時段的徑流量;n為數(shù)據(jù)的總時段數(shù);1為第1天到第n-1天的徑流平均值;2為第2天到第n天的徑流平均值。
如圖7所示,日徑流預報的NSE同Vrunoff具有很強的相關性,PTR和PT兩種輸入方案的相關系數(shù)(R)分別為-0.858(plt;0.05)和-0.746(plt;0.05),徑流變異性在很大程度上決定了LSTM的模擬難度和效率。
結合模擬結果,可將本文流域按照Vrunoff 分為3類:Vrunoff lt;1.05時,流域變異弱,徑流因子時序自相關性強,LSTM模型對輸入輸出長度高度敏感,最優(yōu)方案時NSE可達0.80以上;1.05≤Vrunofflt; 1.40時,流域徑流變異性較強,模型在此類流域的適用性一般,輸入輸出長度的變化會影響模擬效率,NSE可以達到0.60以上,甚至接近0.80,代表流域為巖潤、三磊壩、略陽、涪江橋、多營坪、紅旗、夾江;Vrunoff≥1.40時,流域徑流變異性強,模型在此類流域的適用性弱,對輸入輸出維度敏感性弱,NSE很難達到0.60,代表流域為流沙河、馬邊。
大體上,徑流變異性與流域的匯流速度直接相關。一般地,流域面積大,匯流時間長,徑流變異性弱,Vrunoff小于1.05的11個流域中,除雜谷腦流域外,其余流域面積不小于10 000 km2;相應地,馬邊、流沙河、紅旗3個流域的面積在2 000 km2以下,Vrunoff分別為1.54,1.46,1.34。同時,還受降雨條件影響,處于暴雨區(qū)的流域,徑流變異性更強:青衣江暴雨區(qū)的多營坪、夾江斷面以上雖然面積較大(約為10 000 km2),但變異性不弱,Vrunoff分別為1.29,1.38,大于巖潤流域(面積3 300 km2)的1.15。
全球氣候的變化以及人類活動對流域的改造,如河流改道、水庫修建等,使得流域的特征發(fā)生變化,影響流域徑流變異性。利用部分站點2007~2013年數(shù)據(jù)對訓練好的模型進行測試。預見期5 d以內,除個別站點外,預報效果與原來無明顯差異;預見期大于5 d,預報效果略有下降,PTR方案NSE下降幅度集中在0.034~0.112,PT方案下集中在0.045~0.154。整體的變化趨勢不變,仍符合前文得到的輸入輸出長度影響LSTM日徑流預報效率的規(guī)律。
3 結 論
本文采用LSTM深度學習模型,由不同長度的前期降水、氣溫以及徑流資料,預報未來一定時期的日徑流。研究表明:以前期降水、氣溫和徑流作為輸入時,預報效率幾乎不受前期資料長度的影響,但會隨著預見期的延長而下降,最后趨于穩(wěn)定;預見期小于7 d,能夠滿足NSE達到0.60以上的要求。僅以前期降水、氣溫作為輸入時,預報效率隨前期輸入延長而提高,隨預見期延長而降低;前期輸入長度大于7 d、預見期小于3 d,能保證一半以上流域NSE達到0.60。
采用LSTM模型進行的日徑流預報效率及輸入輸出長度特征具有明顯的流域差異,主要影響因素為徑流變異性(Vrunoff),流域的徑流變異性越弱,模型預報效果越好。以Vrunoff為衡量指標,可大致將流域類型分為3類:Vrunofflt; 1.05,徑流變異性弱,模型模擬效果好,NSE能達0.60以上;Vrunoff≥1.40,徑流變異性強,模型模擬效果差,NSE難達0.60;在兩者之間,模型模擬效果一般,在合適的輸入輸出長度條件下,可以達到0.60以上。因此,制定徑流輸入輸出方案時,應考慮徑流過程的變異性特征,以充分利用模型和資料的有效性。
參考文獻:
[1] 劉攀,鄭雅蓮,謝康,等.水文水資源領域深度學習研究進展綜述[J].人民長江,2021,52(10):76-83.
[2] 陳劍飛,李勇,劉俊江,等.耦合陸面水文模型和機器學習方法的水庫徑流量預報及應用[J].氣象研究與應用,2022,43(1):1-7.
[3] 李瑤.基于機器學習的黃河源區(qū)月徑流模擬與中長期預報研究[D].北京:中國地質大學,2021.
[4] 謝智峰.基于深度學習的螢火蟲算法研究及在中長期徑流預報中的應用[D].南昌:南昌工程學院,2019.
[5] 徐源浩,鄔強,李常青,等.基于長短時記憶(LSTM)神經(jīng)網(wǎng)絡的黃河中游洪水過程模擬及預報[J].北京師范大學學報(自然科學版),2020,56(3):387-393.
[6] 殷兆凱,廖衛(wèi)紅,王若佳,等.基于長短時記憶神經(jīng)網(wǎng)絡(LSTM)的降雨徑流模擬及預報[J].南水北調與水利科技,2019,17(6):1-9,27.
[7] 王萌.神經(jīng)網(wǎng)絡算法在徑流模擬中的開發(fā)與應用[D].哈爾濱:哈爾濱工業(yè)大學,2019.
[8] 巫義銳,郭鴻飛,錢程,等.基于特征增強與時序感知的洪水預報模型[J].人民長江,2021,52(增2):21-26,44.
[9] HAN H,CHOI C,JUNG J,et al.Deep learning with Long Short Term Memory based sequence-to-sequence model for rainfall-runoff simulation[J].Water,2021,13(4):437.
[10] HU C,WU Q,LI H,et al.Deep learning with a Long Short-Term Memory networks approach for rainfall-runoff simulation[J].Water,2018,10(11):1543.
[11] 黃克威,王根緒,宋春林,等.基于LSTM的青藏高原凍土區(qū)典型小流域徑流模擬及預測[J].冰川凍土,2021,43(4):1144-1156.
[12] KRATZERT F,KLOTZ D,BRENNER C,et al.Rainfall-runoff modelling using Long Short-Term Memory(LSTM)networks[J].Hydrology and Earth System Sciences,2018,22:6005-6022.
[13] BOULMAIZ T,GUERMOUI M,BOUTAGHANE H.Impact of training data size on the LSTM performances for rainfall-runoff modeling[J].Modeling Earth Systems and Environment,2020,6:2153-2164.
[14] KRATZERT F,KLOTZ D,SHALEV G,et al.Towards learning universal,regional,and local hydrological behaviors via machine learning applied to large-sample datasets[J].Hydrology and Earth System Sciences,2019,23(12):5089-5110.
[15] KHANDELWAL A,XU S M,LI X,et al.Physics guided machine learning methods for hydrology[J].arXiv,2020,2012:02854v1.
[16] YOKOO K,ISHIDA K,ERCAN A,et al.Capabilities of deep learning models on learning physical relationships:case of rainfall-runoff modeling with LSTM[J].Science of the Total Environment,2022,802:149876.
[17] 方威,周建中,周超,等.基于G-LSTM 模型的短期徑流預報:以長江上游寸灘斷面-三峽入庫斷面為例[J].人民長江,2021,52(2):66-71.
[18] 陶思銘,梁忠民,陳在妮,等.長短期記憶網(wǎng)絡在中長期徑流預報中的應用[J].武漢大學學報(工學版),2021,54(1):21-27.
[19] 林康聆,陳華,陳清勇,等.耦合Encoder-Decoder的LSTM徑流預報模型研究[J].武漢大學學報(工學版),2022,55(8):755-761.
[20] 黃文峰.長短期記憶模型的超級參數(shù)調節(jié)在徑流預測中的效果研究[J].西華大學學報(自然科學版),2020,39(1):23-29.
[21] XIANG Z,YAN J,DEMIR I.A rainfall-runoff model with LSTM-Based Sequence-to-Sequence Learning[J].Water Resources Research,2020,56(1):e2019WR025326.
[22] 成軍.同義反復話語的信息冗余性及其交際功能[J].外國語文,2018,34(6):70-76.
[23] 何志鵬.基于改進CNN-LSTM的光伏發(fā)電功率預測及仿真研究[D].天津:天津理工大學,2022.
[24] 李澤文,胡讓,劉湘,等.基于PCA-DBILSTM的多因素短期負荷預測模型[J].電力系統(tǒng)及其自動化學報,2020,32(12):32-39.
[25] 戴健非,楊鵬,諸利一,等.集成PCA和LSTM神經(jīng)網(wǎng)絡的浸潤線預測方法[J].中國安全科學學報,2020,30(3):94-101.
(編輯:謝玲嫻)
Influences of data length on efficiency of daily runoff forecast by deep learning method
YANG Kun,ZHANG Wenjiang,SONG Kechao
(College of Water Resources and Hydropower,Sichuan University,Chengdu 610065,China)
Abstract:
Long Short-Term Memory(LSTM) neural network model,a deep learning method with strong capability of temporal series analysis,has unique advantages in runoff prediction.However,the optimal scheme of input and output lengths in this model is still not clear,so it is of practical significance to explore the influence of different input and output lengths on daily runoff prediction efficiency by LSTM.Taking Dadu River,Yalong River,tributaries of Minjiang River and upper reaches of Jialing River in western Sichuan Province as the study area,20 sub-catchments were selected to test the daily runoff in different forecast periods with input data of different lengths and the daily runoff prediction efficiency of LSTM model under different data lengths was studied.The applicability of this method in different river basins and the characteristics of optimal input and output length were analyzed.The results show that:① When the previous precipitation,temperature and runoff are taken as inputs,the input length has little effect on daily runoff prediction,but the accuracy will decrease with the extension of forecast period.Therefore,the forecast period should be set within 7 days to guarantee forecast accuracy.② When only previous precipitation and temperature are taken as inputs,the forecasting accuracy will increase with the extension of previous data and decrease with the extension of forecast period.Therefore,the length of preliminary data should be beyond 7 days,and the forecast period is preferably 1 day,and should not exceed 3 days.③ Runoff variability is an important indicator affecting the prediction efficiency and the optimal combination of input and output lengths.The prediction results in catchments with strong variability show low accuracy and weak sensitivity to input and output lengths.The research results can provide a reference for improving the runoff prediction efficiency by deep learning method,and help to determine the suitable input and output length combination scheme in consideration of watershed characteristics.
Key words:
runoff forecast;data length;length of forecast period;LSTM;deep learning