朱躍龍,趙 群,余宇峰,萬定生
(河海大學(xué)計算機與信息學(xué)院,江蘇 南京 211100)
近年來,全球氣候變暖,極端降水事件頻發(fā)導(dǎo)致了各種洪澇災(zāi)害,給人類帶來巨大的經(jīng)濟社會損失。僅2020年全國共出現(xiàn)45次強降水過程,面降水量622 mm,較常年同期偏多13%,引發(fā)珠江、長江、黑龍江3個流域極端嚴重的流域性洪澇災(zāi)害[1]。為了減輕洪水災(zāi)害帶來的不利影響,及時準確的水文預(yù)報顯得尤為重要。水文預(yù)報是根據(jù)前期的水文氣象資料,對未來一定時期的水文資料進行預(yù)報,對防洪救災(zāi)的決策、水資源的合理利用等具有重要意義[2]。
隨著大數(shù)據(jù)時代的到來,基于數(shù)據(jù)驅(qū)動的水文預(yù)報模型在水文事件預(yù)報中越來越受到重視[3-4]。數(shù)據(jù)驅(qū)動的水文預(yù)報模型從歷史水文資料出發(fā),挖掘規(guī)律進行預(yù)測,為相關(guān)水利人員提供了一個新的預(yù)測方案。但現(xiàn)有基于數(shù)據(jù)驅(qū)動的水文模型大多側(cè)重于從歷史數(shù)據(jù)中學(xué)習(xí)時間特征,很少兼顧到數(shù)據(jù)的空間特征[5]。水文數(shù)據(jù)往往包含豐富的時空特征信息,而該特征信息可以為水文時空序列相似性,水文時空數(shù)據(jù)建模分析等作出貢獻[6],本文提出一種基于時空特征挖掘的流量過程智能模擬方法GS-Hydro,構(gòu)建水文結(jié)構(gòu)關(guān)系圖,利用圖卷積網(wǎng)絡(luò)挖掘空間特征的同時利用門控循環(huán)單元捕捉時間特征,以此提高預(yù)測精度。
數(shù)據(jù)驅(qū)動模型是從數(shù)據(jù)著手,通過對時間序列數(shù)據(jù)的分析,從大量的數(shù)據(jù)中發(fā)現(xiàn)和揭示數(shù)據(jù)的發(fā)展變化規(guī)律,以此估測和控制未來可能出現(xiàn)的狀況?;跀?shù)據(jù)驅(qū)動的洪水預(yù)報模型從歷史水文資料出發(fā),挖掘規(guī)律進行預(yù)測,相較于其他水文模型具有普適性。
Hwang等[7]提出一種基于最小二乘支持向量機(LS-SVM)的非線性水文時間序列預(yù)測方法,具有較好的預(yù)測精度和預(yù)測性能。Xing等[8]提出一種新的啟發(fā)式優(yōu)化算法BA算法,用于優(yōu)化SVM參數(shù)和預(yù)測2015年月平均流量,其預(yù)測精度比交叉驗證的支持向量機更高。Atiquzzaman等[9-10]針對傳統(tǒng)基于梯度的慢學(xué)習(xí)算法在訓(xùn)練和迭代確定網(wǎng)絡(luò)參數(shù)時的不確定性問題,提出一種基于極限學(xué)習(xí)機(ELM)的水文時間序列快速預(yù)測方法。根據(jù)洪水形成的基本原理,Chen等[11]提出一種基于數(shù)據(jù)驅(qū)動和機器學(xué)習(xí)的卷積回歸水文預(yù)報模型,該模型能夠反映小時降雨量對未來流量變化的影響,并通過疊加這些影響預(yù)測流量變化。
除了時序特征,自然界大部分的數(shù)據(jù)還具有空間結(jié)構(gòu)聯(lián)系。相比于單一的時序預(yù)測,基于時空特征結(jié)合的預(yù)測考慮了數(shù)據(jù)之間的空間特性,能夠挖掘出更多的信息規(guī)律,提高預(yù)測精度,而空間特征與時間特征的結(jié)合預(yù)報也被廣泛地運用到了各大領(lǐng)域[12-13]。
Ding等[14]利用長短期記憶模型,提出洪水預(yù)報模型(STA-LSTM模型),動態(tài)提取關(guān)鍵特征向量,實現(xiàn)中小河流洪水預(yù)報。除此之外,空間特征也可用于水文學(xué)的許多方面,如水文相似性分析[15]、流域場景模式庫構(gòu)建[16]、用水效率分析[17]等。
目前基于數(shù)據(jù)驅(qū)動的水文預(yù)報模型大多考慮時序特征,很少考慮河流之間的地理聯(lián)系和空間特征。單一測站的水文數(shù)據(jù)具有時間連續(xù)性、周期性,而將多測站的水文數(shù)據(jù)放在一起,不難看出它們之間的空間聯(lián)系。本文提出一種基于地理關(guān)系的時空智能流量過程模擬模型,通過地理關(guān)系建立測站之間的結(jié)構(gòu)聯(lián)系,輔助預(yù)測目標測站的流量值。
現(xiàn)實世界中存在大量的圖結(jié)構(gòu)或網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù),傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)難以處理。為了解決這一問題,一種處理圖結(jié)構(gòu)網(wǎng)絡(luò)的半監(jiān)督分類方法——圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional networks,GCN)[18]被提出,并被廣泛應(yīng)用于社會網(wǎng)絡(luò)、信息網(wǎng)絡(luò)等領(lǐng)域的特征學(xué)習(xí)。與CNN不同,GCN對圖像進行像素卷積,并可以挖掘網(wǎng)絡(luò)結(jié)構(gòu)。目前,GCN主要對社會網(wǎng)絡(luò)、信息網(wǎng)絡(luò)等非結(jié)構(gòu)化數(shù)據(jù)提取特征進行學(xué)習(xí),然而很少有人在水文時間序列數(shù)據(jù)中使用。
本文構(gòu)造了一種新的水文站點地理位置關(guān)系圖,利用GCN挖掘空間特征,再利用門控循環(huán)單元(GRU)[19]挖掘時間特征,進一步進行水文預(yù)報,方法結(jié)構(gòu)如圖1所示,圖中Xt為t時刻的輸入樣本,Ht為模型輸出。
圖1 GS-Hydro模型結(jié)構(gòu)Fig.1 Structure of GS-Hydro model
輸入層,以河流流量信息和當前時段面平均雨量信息為自變量,實現(xiàn)數(shù)據(jù)規(guī)范化、訓(xùn)練集劃分、驗證集劃分、測試集劃分等。隱藏層,在空間方面利用圖卷積神經(jīng)網(wǎng)絡(luò)捕捉河流復(fù)雜的網(wǎng)絡(luò)特征;在時間方面利用門控循環(huán)單元將前一時刻的信息傳遞到下一時刻,其中的更新門和復(fù)位門可以更好、更快地確定信息,為模型留下更多有價值的信息。輸出層,對數(shù)據(jù)進行反規(guī)范化處理,并對輸出結(jié)果進行預(yù)測。
2.1.1 水文測站關(guān)系結(jié)構(gòu)圖的建立
結(jié)構(gòu)圖的生成是訓(xùn)練圖卷積網(wǎng)絡(luò)模型的第一步,也是重要的一步。如果結(jié)構(gòu)圖不能很好地反映節(jié)點之間的關(guān)系,模型可能無法有效地挖掘信息。定義水文測站關(guān)系結(jié)構(gòu)圖如下:
G=(V,E)
(1)
式中:G——水文測站地理位置關(guān)系圖;V——節(jié)點,指各個水文測站;E——連接點邊的集合,指各個水文測站間的地理關(guān)系。
河道距離是目標流域到它的上游流域之間的河流長度,根據(jù)DEM估算。當每個網(wǎng)格中的水以最陡的坡度流向其相鄰網(wǎng)格時,可以找到水從任何點到海洋或者從研究區(qū)域流出的流動路徑。如果上游的水流經(jīng)過下游的水流,則河道距離是它們之間的流路長度。如果它們沒有河道聯(lián)系,則河道距離為零。
鄰接矩陣是存放節(jié)點間關(guān)系(邊或弧)數(shù)據(jù)的數(shù)組,定義如下:
(2)
式中:ai,j——鄰接矩陣中第i行、第j列的元素;α、β、δ——矩陣中元素的系數(shù)。
對模型進行訓(xùn)練擬合出適合的α、β和δ,然后求出水文測站地理位置關(guān)系圖的邊,以此構(gòu)造水文測站地理位置關(guān)系結(jié)構(gòu)圖。值得注意的是,當?shù)乩砭嚯x較大且沒有河道距離時,2個水文測站的流量變化幾乎沒有關(guān)聯(lián),本文對水平距離100 km以內(nèi)的站點計算節(jié)點間的關(guān)系。
2.1.2 圖卷積操作
本文使用圖卷積網(wǎng)絡(luò)對各測站進行空間特征挖掘,如圖2所示。
圖2 空間特征提取Fig.2 Spatial feature extraction
圖卷積網(wǎng)絡(luò)定義如下:
X(l+1)=f(X(l),A)
(3)
式中:l——層數(shù);X(l)——l層節(jié)點的特征;A——鄰接矩陣。
首先輸入特征矩陣和鄰接矩陣,然后對節(jié)點進行特征變換,用度矩陣對鄰接矩陣進行歸一化。加入自循環(huán)后,考慮每個節(jié)點與相鄰節(jié)點之間的關(guān)系,具體模型如下:
(4)
進行空間特征提取后可以對時間特征進行處理,本文使用門控循環(huán)單元(GRU)進行時間特征的提取。GRU可以改進長短時記憶網(wǎng)絡(luò)[21](LSTM)的門設(shè)計,克服梯度消失問題。同時,它具有更快的收斂速度,改善了LSTM訓(xùn)練耗時的問題。
設(shè)定模型損失函數(shù)為均方誤差函數(shù)e,計算公式如下。
(5)
式中:yt——t時刻的預(yù)測值;Yt——t時刻的真實值;n——模型輸入的樣本數(shù)目。
模型具體計算過程如下。
a.空間特征提取(以兩層卷積為例):
(6)
b.更新門構(gòu)建:zt=σz(Wz[ht-1,f(Xt,A)])
(7)
c.重置門構(gòu)建:rt=σr(Wr[ht-1,f(Xt,A)])
(8)
(9)
(10)
通過全連接層得到最終輸出:yt=O(Wcht+b),其中O(·)為線性函數(shù);Wc為權(quán)重;b為偏置。
試驗選取江西省鄱陽湖流域外洲站作為模型流量過程測試站點,如圖3所示。試驗選取外洲站1998—2010年夏季小時時段洪水流量21 060條數(shù)據(jù)以及降雨資料作為數(shù)據(jù),對區(qū)域內(nèi)雨量站的降雨量進行算術(shù)平均從而獲得面降雨量,選取前6 h內(nèi)的小時時段降雨作為降雨信息對流量預(yù)測提供輔助,區(qū)域內(nèi)選取的雨量站如圖4所示。由于部分降雨不完全,采用水文中常用的線性插值方法對缺失的雨量進行補充。試驗以各個水文站為節(jié)點,站點之間的地理關(guān)系為鄰接矩陣,各站點的歷史小時流量數(shù)據(jù)和小時降雨數(shù)據(jù)為特征矩陣。試驗使用60%的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,20%作為驗證數(shù)據(jù)集,20%作為測試數(shù)據(jù)集。
圖3 江西省試驗?zāi)M測試站點Fig.3 Experimental simulation test stations in Jiangxi Province
圖4 外洲站周圍雨量站示意圖Fig.4 Schematic diagram of rainfall stations around Waizhou Station
評價指標采用均方根誤差和確定性系數(shù)。采用支持向量機模型(SVM)[22]、長短時記憶網(wǎng)絡(luò)(LSTM)、門控循環(huán)單元(GRU)和提出的GS-Hydro模型進行訓(xùn)練。訓(xùn)練參數(shù)根據(jù)試驗調(diào)試,最優(yōu)超參配置如下:SVM的懲罰系數(shù)為0.3,核函數(shù)為徑向基核函數(shù),區(qū)間為0.05。LSTM的隱節(jié)點數(shù)為100,學(xué)習(xí)因子的區(qū)間為0.005,批處理大小為128,迭代次數(shù)為40。GUR中隱藏節(jié)點數(shù)為50,學(xué)習(xí)速率為0.005,批處理大小為32,迭代次數(shù)為50。GS-Hydro模型中的隱藏節(jié)點數(shù)為32,學(xué)習(xí)速率為0.005,批處理大小為64,迭代次數(shù)為100。
外洲站SVM、LSTM、GRU和GS-Hydro的模型流量3 h預(yù)見期預(yù)測模擬計算結(jié)果如圖5所示,不同模型在模擬預(yù)測中的評價指標見表1。
圖5 江西省外洲站3 h預(yù)見期下各模型流量預(yù)測結(jié)果Fig.5 Runoff prediction results of Waizhou Station in 3-hour forecast period with different models
表1 各模型預(yù)測結(jié)果評價指標對比Table 1 Comparison of prediction results of different models
從圖5中可以看出,SVM的預(yù)測結(jié)果比較抖動,得到的預(yù)測曲線不如LSTM、GRU和GS-Hydro穩(wěn)定。LSTM和GRU的預(yù)測結(jié)果相似,GS-Hydro比GRU好,比LSTM更穩(wěn)定。
從表1可以看出,1h流量預(yù)測相對最準確,預(yù)見期越長,精度越低。GS-Hydro是所有不同預(yù)測期的最佳模型,LSTM和GRU的性能略好于GRU,支持向量機表現(xiàn)最差。GS-Hydro的確定性系數(shù)最高,LSTM與GRU的差異不顯著,SVM稍差。因此,GS-Hydro模型在整體預(yù)測結(jié)果中是最好的,是因為GCN捕捉了流量的空間特征,在預(yù)測過程中加入了空間內(nèi)多個相關(guān)站的雨量,避免了梯度消失和均值漂移的問題。
本文提出了一種新的流量過程智能模擬方法GS-Hydro,該方法將圖卷積網(wǎng)絡(luò)(GCN)與門控循環(huán)單元(GRU)相結(jié)合,先建立基于河道關(guān)系的水文站點地理位置關(guān)系圖用以進行特征挖掘,再將GCN用于獲取樣本的空間特征,GRU用于捕捉樣本的時間特征。試驗表明GS-Hydro模型的性能優(yōu)于其他神經(jīng)網(wǎng)絡(luò)模型。