陳 暢 王 帆 張大偉 向立云 蘆昌興
(1.中國水利水電科學(xué)研究院,北京 100038;2.水利部防洪抗旱減災(zāi)工程技術(shù)研究中心(水旱災(zāi)害防御中心),北京 100038;3.水發(fā)規(guī)劃設(shè)計(jì)有限公司,濟(jì)南 250000)
在氣候變化和城市化快速擴(kuò)張的背景下,我國城市洪澇問題日益凸顯[1],如濟(jì)南市2007 年“7·18”特大暴雨、北京市2012 年“7·21”特大暴雨、西安市2016 年“7·24”暴雨和鄭州市2021年“7·20”特大暴雨,均造成了嚴(yán)重的洪澇災(zāi)害[2]。城市化建設(shè)改變了流域自然面貌和排水格局,增加了不透水面積,侵占了河湖水系,對(duì)流域的自然水循環(huán)過程產(chǎn)生了極大的影響[3]。城市化的水文效應(yīng)主要表現(xiàn)在:①硬化的地表取代了原有的裸露土壤和植被覆蓋,削弱了地表截留、蒸散發(fā)和下滲能力,改變了自然的產(chǎn)流特性[4];②城市路面、地下排水管網(wǎng)和下凹式立交橋、涵洞等構(gòu)筑物的建設(shè),改變了原有的坡面和地下匯流特性[5-6];③渠化的河道及水閘、橡膠壩、堰等水工建筑物的建設(shè),改變了原有的河道匯流特性[7];④城區(qū)內(nèi)大量的混凝土建筑的高熱量排放,引起了局地小氣候的改變,產(chǎn)生“熱島”“雨島”效應(yīng),增加了極端暴雨發(fā)生的頻率[8]。
相較于自然流域,城市的產(chǎn)匯流過程更為復(fù)雜,尤其是城市管網(wǎng)、河道和地表洪水演進(jìn)等水流運(yùn)動(dòng)過程具有明顯的水動(dòng)力學(xué)特征,面向自然流域的傳統(tǒng)水文模型難以滿足城市水文模擬和洪水預(yù)報(bào)的需求[9-10]。針對(duì)我國平原型城市,徐向陽[11]構(gòu)建了包含產(chǎn)流、坡面匯流、管網(wǎng)匯流和河網(wǎng)匯流4個(gè)子模型的城市雨洪模型。劉家宏等[12]基于下墊面條件將城市區(qū)域劃分為不透水單元、透水單元和半透水單元等6類基本單元,并通過城市管網(wǎng)和河湖水系將各單元連接至城市水文模型系統(tǒng),彌補(bǔ)了城市洪澇模擬在水文學(xué)機(jī)理方面的不足。在城市洪澇模擬軟件方面,自20世紀(jì)70年后,形成了一系列較為成熟的產(chǎn)品,包括國外的SWMM、Info-Works ICM、STORM 和IUHM 等[8],以及我國的GAST[13]、HydroInfo[14]、FASFLOOD[15-16]和IFMS/Urban[17]等,為城市洪澇模擬與預(yù)報(bào)提供了有力支撐。朱呈浩等[18]基于SWMM 構(gòu)建了西安灃西新城區(qū)洪澇模型,計(jì)算了該區(qū)域在不同重現(xiàn)期暴雨中的洪澇過程。曾鵬等[19]基于IFMS/Urban 構(gòu)建了成都市中心城區(qū)內(nèi)澇模型,實(shí)現(xiàn)了對(duì)不同設(shè)計(jì)降雨下的城區(qū)暴雨內(nèi)澇特征的分析。此外,還有很多新技術(shù)新方法也被應(yīng)用于城市洪澇模擬。潘鑫鑫等[20]建立了耦合物理過程模型和機(jī)器學(xué)習(xí)算法的模擬,規(guī)避了復(fù)雜方程組求解問題,實(shí)現(xiàn)了對(duì)城市調(diào)蓄池控制節(jié)點(diǎn)水位的高速高效高精度預(yù)測。韓浩等[21]提出了一種基于多GPU并行的新型流域雨洪過程模擬方法,實(shí)現(xiàn)了大尺度流域雨洪過程的高性能模擬。
近年來,循環(huán)神經(jīng)網(wǎng)絡(luò)憑借其優(yōu)異的性能在洪水預(yù)報(bào)領(lǐng)域受到了廣泛的關(guān)注[22],在城市河道洪水預(yù)報(bào)方面也有了一定的應(yīng)用研究。Gude 等[23]基于長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)構(gòu)建了美國密蘇里州Meramec河St.Louis 區(qū)的水位預(yù)測模型。Ahmed 等[24]利用基于Boruta 算法的隨機(jī)森林模型(Boruta-Random Forest,BRF)對(duì)輸入變量進(jìn)行特征提取,然后結(jié)合LSTM 和門控循環(huán)單元(Gated Recurrent Unit,GRU)網(wǎng)絡(luò)構(gòu)建了中長期預(yù)測模型,利用該方法在澳大利亞Murray Darling 流域進(jìn)行了月尺度的水位預(yù)測。Liu 等[25]基于LSTM 網(wǎng)絡(luò)構(gòu)建了福建福州市城市內(nèi)河和外河水位的實(shí)時(shí)滾動(dòng)預(yù)報(bào)模型。LSTM 和GRU 等具有門控機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò),對(duì)于處理水文序列中的長期依賴問題(long-term dependencies problem)非常有效,成為流域和城市洪水預(yù)報(bào)的新方法,但在山前平原型城市河道洪水預(yù)報(bào)方面尚未進(jìn)行深入研究。
山前平原型城市擁有特殊的淺碟狀地勢,發(fā)生強(qiáng)降雨時(shí)山洪快速下泄至城區(qū),容易進(jìn)一步加重城區(qū)的洪澇災(zāi)害[5,26],其洪水兼具了山洪和城市洪水的特征,因此對(duì)水文模擬和洪水預(yù)報(bào)模型提出了更高的要求。胡偉賢[27]基于SWMM 構(gòu)建了濟(jì)南市城市雨洪模型,并利用實(shí)測雨洪數(shù)據(jù)驗(yàn)證了模型的可靠性和適用性。常曉棟等[26]進(jìn)一步將山前平原型城市的子匯水區(qū)分為山區(qū)、平原區(qū)和主城區(qū)3類,并指出根據(jù)不同地形特點(diǎn)設(shè)置相應(yīng)的匯流演算方式、模型演算面積比及河段糙率系數(shù)能夠顯著提高模擬精度。程濤等[28]利用InfoWorks ICM 構(gòu)建了濟(jì)南市山前平原區(qū)的一維排水管網(wǎng)模型和二維地面淹沒模型,并對(duì)研究區(qū)內(nèi)節(jié)點(diǎn)溢流和地面淹沒情況進(jìn)行定量模擬,并驗(yàn)證了模型的適用性。
本文擬采用目前在流域洪水預(yù)報(bào)領(lǐng)域應(yīng)用較為廣泛的循環(huán)神經(jīng)網(wǎng)絡(luò),以小清河濟(jì)南市黃臺(tái)橋水文站以上流域?yàn)檠芯繉?duì)象,構(gòu)建山前平原型城市河道洪水預(yù)報(bào)模型,并探索其對(duì)具有復(fù)雜下墊面條件流域洪水預(yù)報(bào)的適用性,以期為山前平原型城市河道洪水預(yù)報(bào)預(yù)警提供參考。
Hochreiter 和Schmidhuber[29]在循環(huán)神經(jīng)網(wǎng)絡(luò)中創(chuàng)新性地引入了門控機(jī)制,構(gòu)建了LSTM 網(wǎng)絡(luò),有效地解決了序列預(yù)測中“長期依賴信息”學(xué)習(xí)的問題,其單元內(nèi)部結(jié)構(gòu)見圖1(a),其中包含遺忘門z(t)f、輸入門z(t)i和輸出門z(t)o3 個(gè)門結(jié)構(gòu),用于控制信息傳遞。Chung 等[30]在LSTM 的基礎(chǔ)上提出了GRU 網(wǎng)絡(luò),將門結(jié)構(gòu)簡化為更新門z(t)u和重置門z(t)r,其內(nèi)部結(jié)構(gòu)見圖1(b)。相比于LSTM,GRU 的結(jié)構(gòu)更簡單、參數(shù)更少、訓(xùn)練效率更高,研究表明其在保持與LSTM 相近的模擬精度的前提下,具備更快速的收斂能力[31-32]。
圖1 LSTM與GRU單元內(nèi)部結(jié)構(gòu)
為更全面地利用時(shí)間序列中的信息,Schuster 和Paliwal[33]提出了雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(Bidirectional Recurrent Neural Networks,BiRNN)結(jié)構(gòu)(圖2),由此也衍生出了雙向長短期記憶(Bidirectional Long Short-Term Memory,BiLSTM)[34]和雙向門控循環(huán)單元(Bidirectional Gate Recurrent Unit,BiGRU)[35]等網(wǎng)絡(luò),他們可以同時(shí)在正向和反向上進(jìn)行訓(xùn)練,從而能夠從時(shí)間序列數(shù)據(jù)中提取歷史和未來方向的特征,提升預(yù)測性能[36]。本文嘗試基于LSTM、GRU、BiLSTM 和BiGRU 網(wǎng)絡(luò)構(gòu)建洪水預(yù)報(bào)模型,并進(jìn)行性能對(duì)比,探索其對(duì)山前平原區(qū)城市河道洪水預(yù)報(bào)的適用性。
圖2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
本文從洪峰流量、峰現(xiàn)時(shí)間和整體過程3 個(gè)角度對(duì)流量過程的預(yù)報(bào)精度進(jìn)行評(píng)價(jià),選擇洪峰相對(duì)誤差(δRPE)、峰現(xiàn)時(shí)間誤差(ΔPTE)和納什效率系數(shù)(NSE)作為評(píng)價(jià)指標(biāo)[37]。
洪水預(yù)報(bào)的首要任務(wù)是對(duì)洪峰流量的預(yù)測,特別是對(duì)于中小河流[38]。通常洪水起漲和消落較快,對(duì)洪水起漲階段或洪峰流量的準(zhǔn)確預(yù)測通常意味著整體過程預(yù)報(bào)精度較高,因此本文選用洪峰相對(duì)誤差作為評(píng)價(jià)指標(biāo),如式(1)所示:
式中:Q為模擬序列的洪峰值,m3/s;Qobsmax為實(shí)測序列的洪峰值,m3/s。
峰現(xiàn)時(shí)間誤差計(jì)算方式如式(2)所示:
式中:T為模擬序列的峰現(xiàn)時(shí)間,h;T為實(shí)測序列的峰現(xiàn)時(shí)間,h。
納什效率系數(shù)計(jì)算方式如式(3)所示,其描述了模擬序列與實(shí)測序列之間整體偏差的大小。NSE越接近1,表示模擬精度越高,若小于0,則表示模型結(jié)果劣于實(shí)測值均值序列。
式中:Q、Q分別為實(shí)測和模擬序列t時(shí)刻的流量,m3/s;為實(shí)測流量序列的均值,m3/s;M為實(shí)測序列的長度。
本文還選取了均方根誤差(Root Mean Square Error,RMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)及最大水位誤差(ME)作為評(píng)價(jià)指標(biāo),具體計(jì)算公式如下:
式中:Z和Z分別為t時(shí)刻流量的模擬值與實(shí)測值,m3/s。N為場次洪水總數(shù)。
小清河流域發(fā)源于濟(jì)南市西部睦里莊,自西向東流經(jīng)濟(jì)南市、淄博市、濱州市、東營市、濰坊市,于壽光市羊角溝入海,全長237 km,控制流域面積10 336 km2,是濟(jì)南市重要防洪除澇河道,也是主城區(qū)唯一排水出口。流域多年平均降水量為619.7 mm,降水年際變化較大,年內(nèi)分配不均。
本文選取小清河黃臺(tái)橋水文站以上流域?yàn)檠芯繉?duì)象,黃臺(tái)橋水文站位于濟(jì)南市歷城區(qū)[39],東經(jīng)117°04′、北緯36°44′,控制流域面積321 km2,上游有劉家莊、吳家鋪、東紅廟、興隆、燕子山共5 座雨量站,研究區(qū)域位置及站點(diǎn)分布見圖3。
圖3 研究區(qū)域位置及站點(diǎn)分布圖
本文收集了黃臺(tái)橋水文站及其流域內(nèi)5 座雨量站1998年、2004年、2007年、2009年、2011年、2013年、2015年、2016 年、2018 年、2019 年、2021 年的實(shí)測降雨、流量和水位數(shù)據(jù)?;谑占乃臄?shù)據(jù)進(jìn)行了場次雨洪過程提取,篩除其中雨洪不對(duì)應(yīng)的場次,最終得到41 場洪水過程,其中涵蓋了單峰、雙峰和多峰型洪水過程,具有較好的代表性。
由于降雨、流量和水位數(shù)據(jù)存在量綱和尺度差異,會(huì)對(duì)模型精度及收斂速度造成影響,因此首先采用線性歸一化方法進(jìn)行預(yù)處理,計(jì)算公式如式(7)所示:
式中:xnorm為歸一化數(shù)值;x為觀測值;xmax和xmin分別為觀測值的最大值、最小值。
本文分別以流量、水位作為輸出變量構(gòu)建預(yù)測模型,考慮到降雨、流量和水位序列之間的相關(guān)性,在輸入變量選擇方面設(shè)置了多種組合方式,如表1所示。在輸入、輸出步長選擇方面,參考王帆等[37]的工作,通過試算得到不同輸入組合條件下的評(píng)價(jià)指標(biāo)分布(圖4、圖5),最終確定模型的輸入時(shí)段長為6 h、輸出時(shí)段長為3 h,預(yù)測流量過程的輸入變量為降雨、流量,預(yù)測水位過程的輸入變量為降雨、水位。
表1 輸入輸出變量設(shè)置
圖4 不同輸入組合預(yù)測流量的評(píng)價(jià)指標(biāo)
圖5 不同輸入組合預(yù)測水位的評(píng)價(jià)指標(biāo)
對(duì)歸一化處理后的場次降雨洪水?dāng)?shù)據(jù)進(jìn)行劃分,從所有洪水場次中不放回地抽取11場洪水作為測試集場次,將余下的場次按照輸入輸出步長進(jìn)行切片,生成訓(xùn)練樣本,從中隨機(jī)選取10%作為驗(yàn)證集樣本,其余樣本作為訓(xùn)練集樣本,各集合洪水場次及樣本個(gè)數(shù)見表2。
表2 洪水場次及樣本個(gè)數(shù)
通過調(diào)整模型的超參數(shù),使模型訓(xùn)練集和驗(yàn)證集損失函數(shù)均達(dá)到較優(yōu)狀態(tài),其中神經(jīng)元個(gè)數(shù)與批大小均以2 的次冪進(jìn)行試算,最終確定模型超參數(shù)如表3所示。
表3 模型超參數(shù)設(shè)置
利用基于BiGRU 網(wǎng)絡(luò)構(gòu)建的洪水預(yù)報(bào)模型,對(duì)測試集場次洪水進(jìn)行了模擬預(yù)報(bào),流量和水位過程的預(yù)報(bào)結(jié)果評(píng)價(jià)指標(biāo)分布如圖6、圖7 所示。由圖6 可見,當(dāng)預(yù)測步長在2 h 以內(nèi)時(shí),模型對(duì)洪峰流量、峰現(xiàn)時(shí)間和洪水過程均有著較高的預(yù)測精度。當(dāng)步長為3 h時(shí),預(yù)測散點(diǎn)逐漸偏離1∶1理想線,模型的預(yù)測性能有所下降,對(duì)洪水過程的預(yù)測誤差明顯增大,但洪峰相對(duì)誤差依然維持在較低的水平。由圖7 可見,模型對(duì)低水位過程的預(yù)測精度較高,接近于1∶1 理想線,對(duì)于高水位的預(yù)測整體偏低。隨著預(yù)測步長的增加,模型同樣呈現(xiàn)出性能下降的趨勢。
圖6 BiGRU模型預(yù)測流量的評(píng)價(jià)指標(biāo)
圖7 BiGRU模型預(yù)測水位的評(píng)價(jià)指標(biāo)
表4 和表5 顯示了4 種不同模型在預(yù)測流量和水位時(shí)的預(yù)報(bào)準(zhǔn)確性評(píng)價(jià)指標(biāo)。由表4 可以看出,在預(yù)測流量時(shí),預(yù)報(bào)精度隨著預(yù)見期的增加而逐漸下降。雙向神經(jīng)網(wǎng)絡(luò)BiLSTM 與BiGRU 模型的RMSE、MAE和NSE指標(biāo)分別為15.70—17.58、12.27—13.20、0.768—0.898與15.29—16.75、11.39—12.14、0.874—0.965,預(yù)報(bào)精度明顯比單向的循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM 與GRU 模型高。隨著時(shí)間推移,BiGRU 模型在預(yù)測流量時(shí)表現(xiàn)得更好。
表4 循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測精度評(píng)價(jià)指標(biāo)(流量)
表5 循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測精度評(píng)價(jià)指標(biāo)(水位)
由表5可以看出,在預(yù)測水位時(shí),預(yù)報(bào)精度同樣隨著預(yù)見期的增加而下降。BiGRU網(wǎng)絡(luò)的RMSE、MAE和NSE指標(biāo)分別為0.48—0.50、0.32—0.34、0.796—0.851,表現(xiàn)比其他循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測效果要好。整體比較流量和水位的NSE,可以看出流量過程的預(yù)測精度要高于對(duì)水位過程的預(yù)測精度。
本文從測試集洪水場次中選取“2018.8.13”“1998.8.2”兩場洪水過程,對(duì)比分析LSTM、GRU、BiLSTM 和BiGRU 模型的預(yù)測性能?!?018.8.13”場次洪水預(yù)報(bào)流量過程如圖8所示,可見各模型均能準(zhǔn)確地預(yù)測洪水的漲落過程,在對(duì)洪峰流量的預(yù)測方面,基于BiLSTM 和BiGRU 的模型要明顯優(yōu)于基于LSTM 和GRU 網(wǎng)絡(luò)所構(gòu)建的模型?!?998.8.2”場次洪水包含3 次連續(xù)的洪峰和退水過程,模型的連續(xù)模擬預(yù)測時(shí)間超過300 h,由圖9 可見,模型對(duì)洪水過程的整體趨勢能夠進(jìn)行準(zhǔn)確的預(yù)測,適用于洪水過程的連續(xù)模擬。在模型性能方面,基于LSTM 和GRU 網(wǎng)絡(luò)所構(gòu)建的模型表現(xiàn)出相近的性能,而基于BiLSTM 和BiGRU 網(wǎng)絡(luò)所構(gòu)建的預(yù)測模型性能明顯更優(yōu),證明了雙向網(wǎng)絡(luò)能夠更好地提取降雨、流量序列特征。
圖8“2018.8.13”場次洪水預(yù)報(bào)流量過程
圖9 “1998.8.2”場次洪水預(yù)報(bào)流量過程
相比于對(duì)流量過程的預(yù)測,各模型的水位預(yù)測精度均略有下降,如圖10、圖11 所示,預(yù)測水位過程存在明顯的鋸齒狀波動(dòng),其中基于LSTM 和GRU 網(wǎng)絡(luò)所構(gòu)建的模型尤為明顯。基于BiLSTM 和BiGRU 網(wǎng)絡(luò)所構(gòu)建的模型預(yù)測精度相對(duì)較高,尤其是基于BiGRU 的模型,隨預(yù)測步長的延長,預(yù)測性能幾乎沒有衰減。
圖10 “2018.8.13”場次洪水預(yù)報(bào)水位過程
圖11 “1998.8.2”場次洪水預(yù)報(bào)水位過程
本文針對(duì)山前平原型城市河流,開展了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的洪水預(yù)報(bào)模型構(gòu)建工作,以小清河濟(jì)南市黃臺(tái)橋水文站以上流域?yàn)檠芯繉?duì)象,評(píng)估了BiGRU 等循環(huán)神經(jīng)網(wǎng)絡(luò)變體的適用性,主要得到以下結(jié)論。
(1)基于LSTM、GRU、BiLSTM 和BiGRU 網(wǎng)絡(luò)所構(gòu)建的洪水預(yù)報(bào)模型均能夠準(zhǔn)確預(yù)測洪水的漲落過程,雖然預(yù)測性能隨預(yù)測步長的延長有所衰減,但在較短步長內(nèi)擁有較高的預(yù)測精度,證明了其對(duì)具有復(fù)雜下墊面特征的山前平原型城市河流洪水預(yù)報(bào)的適用性。
(2)相比于傳統(tǒng)水文模型,以神經(jīng)網(wǎng)絡(luò)模型為代表的數(shù)據(jù)驅(qū)動(dòng)模型,能夠通過建立映射,靈活地設(shè)置輸入、輸出變量,本文的研究表明降雨是模型的必要輸入,而通過增加流量、水位等輸入能夠進(jìn)一步提高預(yù)測精度。
(3)基于循環(huán)神經(jīng)網(wǎng)絡(luò)所構(gòu)建的模型,既適用于對(duì)場次洪水的預(yù)報(bào),也適用于對(duì)長系列過程的連續(xù)預(yù)測,整體看來,其對(duì)流量過程的預(yù)測精度要高于對(duì)水位過程的預(yù)測精度,且對(duì)低水位過程的預(yù)測精度要高于對(duì)洪峰水位的預(yù)測精度。
(4)在本文嘗試的4種循環(huán)神經(jīng)網(wǎng)絡(luò)變體中,基于BiGRU 網(wǎng)絡(luò)所構(gòu)建的模型預(yù)測性能最優(yōu),一方面在于其對(duì)洪峰、峰現(xiàn)時(shí)間及洪水過程的模擬精度更高,另一方面在于隨預(yù)測步長的延長,其預(yù)測性能衰減最弱。