高延香
(陜西省延安市寶塔區(qū)水資源與節(jié)約用水中心,陜西 延安 716000)
盡管水對(duì)于所有形式的生活都是必不可少的,但有時(shí)也會(huì)具有破壞性。洪水,山體滑坡和泥石流都是由多余的水引起的[1]。世界上許多地區(qū)都容易遭受與水有關(guān)的災(zāi)害,其破壞以及由此造成的人員傷亡正在增加。在各種與水相關(guān)的災(zāi)害中,洪水災(zāi)害在造成的人員傷亡和破壞程度方面更加嚴(yán)重。還必須指出的是,不僅因?yàn)槿丝谶w移到經(jīng)濟(jì)前景更好的地區(qū),災(zāi)難的數(shù)量在增加,而且受影響的人數(shù)也在增加。延河屬于典型的多泥沙河流,是黃河中游泥沙主要輸入?yún)^(qū)之一,也是區(qū)域內(nèi)延河流域地質(zhì)洪澇災(zāi)害高發(fā)的原因之一。因此,預(yù)報(bào)延河流域的徑流量是十分重要的。
緩解洪災(zāi)可以通過預(yù)報(bào)徑流量來提前預(yù)測(cè)洪水,以便早作準(zhǔn)備、減少災(zāi)害損失。但河流流量時(shí)間序列非常復(fù)雜,并且包含各種頻率分量[2]。如果利用傳統(tǒng)物理性的水文模型來預(yù)測(cè)徑流量,雖然可以解釋徑流變化規(guī)律,但需要輸入許多參數(shù),太過復(fù)雜[1,3]。而在水文建模中,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)是一種合適的工具。如果對(duì)系統(tǒng)的水文地質(zhì)特征了解不足,并且相比于理解物理過程,認(rèn)為預(yù)測(cè)的準(zhǔn)確性更為重要的情況下,那么黑箱型模型是可行的選擇。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)屬于黑箱型模型[4],可用于捕獲復(fù)雜系統(tǒng)的非線性行為。循環(huán)神經(jīng)網(wǎng)絡(luò)模型已經(jīng)用于降雨-徑流過程中,并且不斷被改進(jìn)[5],且RNN在時(shí)間序列的預(yù)測(cè)方面具有一定的可行性。
因此,本文將利用循環(huán)神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)延河流域的徑流量,以期所建模型可以有效預(yù)報(bào)該流域的徑流量,提早預(yù)防,減少災(zāi)害的發(fā)生。
在訓(xùn)練RNN模型之前,利用歸一化公式對(duì)數(shù)據(jù)進(jìn)行處理,此類處理有益于模型的訓(xùn)練[3]。處理后的數(shù)據(jù)大小范圍在[0,1]內(nèi)。公式如下:
(1)
式中:xnorm、xi、xmin和xmax分別為數(shù)據(jù)的標(biāo)準(zhǔn)化值、觀測(cè)值、最小值和最大值。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)常用于時(shí)間序列預(yù)測(cè)任務(wù)[4,6]。RNN被認(rèn)為是遞歸的,因?yàn)樗鼈儗?duì)序列中的每個(gè)元素執(zhí)行相同的任務(wù),并且當(dāng)前輸出取決于先前的計(jì)算。在RNN中,單元之間的連接形成有向循環(huán)。RNN的結(jié)構(gòu)見圖1。
圖1 RNN網(wǎng)絡(luò)結(jié)構(gòu)圖
該算法迭代按以下方程式進(jìn)行:
ht=tanh(Uxt+Wht-1+b)
(2)
xt=tanh(Vht+c)
(3)
其中:ht為根據(jù)先前的隱藏狀態(tài)ht-1計(jì)算出的隱藏狀態(tài);xt為當(dāng)前時(shí)間的輸入值;U、W和V分別為在RNN中訓(xùn)練的輸入層到隱藏層的參數(shù),隱藏層到隱藏層的參數(shù)和隱藏層到輸出層的參數(shù)。
RNN模型的參數(shù)按經(jīng)驗(yàn)設(shè)定如下,主要有:隱含層神經(jīng)元數(shù)目32,迭代訓(xùn)練次數(shù)為250次,核函數(shù)采用Adam函數(shù),誤差函數(shù)用均方誤差來評(píng)價(jià)模型精度,設(shè)置誤差標(biāo)準(zhǔn)為0.001。本研究利用Matlab R2018進(jìn)行模型訓(xùn)練與測(cè)試。
通過均方根誤差RMSE來評(píng)價(jià)模型的效果。RMSE越接近于0,意味著模型精度越高,預(yù)測(cè)效果越強(qiáng)。RMSE的計(jì)算公式如下:
(4)
安塞縣延河干流設(shè)有安塞水文站[7]。安塞水文站設(shè)立于1973年6月,位于安塞縣真武洞鎮(zhèn),地理坐標(biāo)E109°19′,N36°56′,控制流域面積1 334 km2。安塞水文站有1981年~至今實(shí)測(cè)水文資料。本研究選用1981-2004年的逐月徑流數(shù)據(jù)用以模型的訓(xùn)練,用2005-5015年的逐月徑流數(shù)據(jù)用以模型的測(cè)試。
圖2為模型訓(xùn)練過程中,訓(xùn)練集和測(cè)試集的均方根誤差隨著迭代次數(shù)的變化。由圖2中可以看出,訓(xùn)練集隨著迭代次數(shù)的變化,均方根誤差先快速驟降,然后再緩慢下降。當(dāng)?shù)螖?shù)達(dá)到175時(shí)達(dá)到最低點(diǎn),隨后基本保持不變。測(cè)試集也有類似的規(guī)律,均方根誤差先驟降,但其在驟降到最低點(diǎn)后,又有緩慢的回升現(xiàn)象。不過與訓(xùn)練集相比,其均方根誤差更低。因此,本文選用迭代次數(shù)為175次的模型作為徑流預(yù)測(cè)模型。
圖2 RNN模型最佳訓(xùn)練結(jié)果
為了進(jìn)一步評(píng)價(jià)所建的徑流預(yù)測(cè)模型的效果,本文繪制了圖3、圖4。圖3為2005-2015年的逐月徑流預(yù)測(cè)值與實(shí)測(cè)的變化圖,從圖3中可以發(fā)現(xiàn),實(shí)測(cè)曲線與預(yù)測(cè)曲線的特征基本一致,但是在部分細(xì)節(jié)部分兩者之間具有明顯的差異,說明模型在預(yù)測(cè)時(shí),仍有一些偏差。
圖3 安塞站2005-2015年逐月徑流量預(yù)測(cè)
圖4 安塞站2005-2015年逐月徑流量偏差分布結(jié)果
圖4為實(shí)測(cè)值與預(yù)測(cè)值之間的偏差柱狀圖,由圖4可知,2005與2013這兩年,模型在預(yù)測(cè)時(shí)具有明顯高于其余年份的偏差,但其徑流的大致情況仍可以得到體現(xiàn),其模型預(yù)測(cè)的RMSE僅380 m3/s。對(duì)誤差進(jìn)行統(tǒng)計(jì)分析,見圖5。
圖5 安塞站2005-2015年逐月徑流量偏差統(tǒng)計(jì)結(jié)果
圖5中的分布說明,預(yù)測(cè)誤差大部分集中在零附近,所以本文所建的安塞站逐月徑流預(yù)測(cè)模型是具有一定預(yù)測(cè)能力。
本文還對(duì)模型效果進(jìn)行了相關(guān)性分析。圖6為實(shí)測(cè)值與預(yù)測(cè)值的散點(diǎn)圖,R為相關(guān)系數(shù)。整體的相關(guān)系數(shù)可達(dá)0.62,建模集的相關(guān)系數(shù)為0.61,而測(cè)試集的相關(guān)系數(shù)可以高達(dá)0.77。由圖6中的擬合線與1∶1直線的夾角可以發(fā)現(xiàn),模型對(duì)測(cè)試集的效果比較好??偟膩碚f,本文利用RNN來預(yù)測(cè)安塞站的逐月徑流量是有效的,雖然在某些年份有相對(duì)較大的誤差,但是預(yù)測(cè)值仍然與實(shí)測(cè)值較為接近。
圖6 安塞站逐月徑流量實(shí)測(cè)與預(yù)測(cè)散點(diǎn)圖
本文將RNN模型應(yīng)用于延河流域的逐月徑流預(yù)測(cè),結(jié)論如下:
在安塞站,RNN模型具有一定的適用性,其迭代達(dá)175次時(shí),具有最佳的效果。而且,用以預(yù)測(cè)2005-2015年逐月徑流量,有較好的效果,均方根誤差為180m3/s,實(shí)測(cè)值與預(yù)測(cè)值的相關(guān)系數(shù)可達(dá)0.77。模型的建立可為該地區(qū)的徑流預(yù)測(cè)及災(zāi)害預(yù)報(bào)提供一定的參考。