韓子晨,王 弋*,賀 斌
(1.華北電力大學(xué)水利與水電工程學(xué)院,北京 102206;2.廣東省科學(xué)院生態(tài)環(huán)境與土壤研究所,廣東 廣州 510650)
新疆作為中國(guó)西北的戰(zhàn)略屏障,是一帶一路的重要核心區(qū)和戰(zhàn)略資源的重要基地,同時(shí)由于地處亞洲中部干旱區(qū),水資源匱乏,分布不均,降水量少,蒸發(fā)損失較大,因此水資源的管理與規(guī)劃顯得尤為重要。對(duì)開都河這一干旱區(qū)多組分徑流的模擬結(jié)果可以作為預(yù)防洪水、干旱預(yù)警、環(huán)境保護(hù)、水電站運(yùn)行和水資源分配等領(lǐng)域的重要參考。
徑流模擬的數(shù)學(xué)模型有很多,但對(duì)于具體流域的徑流模擬各不相同,需要考慮不同氣候環(huán)境、地理?xiàng)l件等因素具體確定,并通過(guò)分析、建模和檢驗(yàn)等步驟判斷徑流模擬的準(zhǔn)確性和適用性。隨著近幾十年來(lái)計(jì)算機(jī)技術(shù)發(fā)展迅猛,計(jì)算機(jī)在功能上更加齊全,運(yùn)算速度更快,因此憑借計(jì)算機(jī)高速計(jì)算能力而得以發(fā)展的人工智能技術(shù),如機(jī)器學(xué)習(xí)、模擬退火算法、支持向量機(jī)等,在包括水文學(xué)的諸多領(lǐng)域有了交叉與結(jié)合。使用人工智能技術(shù)從大量的實(shí)測(cè)數(shù)據(jù)中建立的模型可以稱為數(shù)據(jù)驅(qū)動(dòng)模型[1]。對(duì)于事先假設(shè)一個(gè)模式而后用實(shí)測(cè)數(shù)據(jù)進(jìn)行生硬擬合的模型驅(qū)動(dòng)模型,這種建模方式不考慮數(shù)據(jù)內(nèi)蘊(yùn)含的物理意義和規(guī)律,只針對(duì)數(shù)據(jù)本身進(jìn)行分析、研究,從而總結(jié)出數(shù)據(jù)本身所存在的規(guī)律[2]。張少文等[3]于2005年通過(guò)遺傳算法優(yōu)化人工神經(jīng)網(wǎng)絡(luò),建立黃河上游徑流預(yù)測(cè)模型,與傳統(tǒng)預(yù)測(cè)模型相比,預(yù)報(bào)精度較高。李嬌等[4]于2013年應(yīng)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)泉州市山美水庫(kù)來(lái)水量進(jìn)行月時(shí)間尺度的模擬,模擬結(jié)果的誤差均在允許范圍內(nèi)且精確度較高。Agarwal等[5]于2004年在印度拿麥達(dá)河應(yīng)用梯度下降優(yōu)化技術(shù)預(yù)測(cè)徑流,結(jié)果優(yōu)于線性傳遞函數(shù)的模型。Boulmaiz等[6]于2016年在人工神經(jīng)網(wǎng)絡(luò)中引入EKF算法來(lái)改善非線性的輸入數(shù)據(jù)問(wèn)題,提高了預(yù)報(bào)精度。
以人工神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)正處于一個(gè)蓬勃發(fā)展的狀態(tài),運(yùn)用人工神經(jīng)網(wǎng)絡(luò)的方法為水文計(jì)算提供了便捷的途徑,但現(xiàn)有研究仍存在許多不足:神經(jīng)網(wǎng)絡(luò)參數(shù)的選擇還只能依靠經(jīng)驗(yàn)性的公式和大量重復(fù)性的實(shí)驗(yàn),流域情況發(fā)生變化時(shí)模型如何推廣;人工神經(jīng)網(wǎng)絡(luò)本身只是充當(dāng)了一個(gè)水文模擬的工具,當(dāng)更加深刻地研究水文規(guī)律和解決水文問(wèn)題時(shí)需要與實(shí)際的水文意義相結(jié)合;西北干旱區(qū)流域面積大、流域地形復(fù)雜、氣象站與水文站數(shù)量稀少,以及河流補(bǔ)給類型為冰雪融水和降水混合補(bǔ)給型等特點(diǎn),這造成了數(shù)據(jù)獲取的困難,從而制約了模型的效果。
在水文模擬領(lǐng)域通過(guò)采用新的技術(shù)理論、獲取更多的信息源來(lái)提高模擬的精度,這是水文模擬領(lǐng)域發(fā)展的趨勢(shì)。本研究嘗試應(yīng)用人工神經(jīng)網(wǎng)絡(luò)技術(shù),考慮氣候等因素的影響,將人工神經(jīng)網(wǎng)絡(luò)與水文模型相結(jié)合,對(duì)干旱區(qū)內(nèi)陸目標(biāo)流域徑流過(guò)程進(jìn)行分析、模擬與預(yù)測(cè)。
本論文的研究背景是新疆維吾爾自治區(qū)開都河流域。開都河流域位于新疆維吾爾自治區(qū)天山南坡,焉耆盆地北緣,流域面積22 000 km2,山區(qū)流域平均海拔3 100 m,流域地形復(fù)雜,河流發(fā)源于天山中部海拔5 000 m的薩爾明山的哈爾尕特和扎克斯臺(tái)溝,流域介于82°52′~86°55′E,41°47′~43°21′N 之間,山區(qū)流域平均海拔3 100 m,流域地勢(shì)北高南低,地形復(fù)雜。出山口以上流域集水面積約1.9×104km2,從河源至入湖口全長(zhǎng)560 km,是唯一能常年補(bǔ)給博斯騰湖的河流。開都河屬于冰雪融水和降水混合補(bǔ)給型河流,春季季節(jié)性積雪融化補(bǔ)給河流,夏季則以高山冰雪融水和山區(qū)降水補(bǔ)給為主,雨雪降水混合占徑流總量的45.3%,冰川融水占14.1%,流域內(nèi)年降水量分配不均,受季節(jié)影響明顯,連續(xù)最大4個(gè)月降水量發(fā)生在5—8月;蒸發(fā)年內(nèi)分布不均,全年蒸發(fā)量約為680 mm,多年平均徑流量約35.31×108m3,4—9月豐水期徑流量占全年徑流量的73.8%,10至次年3月枯水期徑流量占全年徑流量的26.2%。因此開都河具有干旱區(qū)的代表性和典型性,流域概況具體見(jiàn)圖1。
圖1 開都河流域
1.2.1BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括輸入層(input layer)、隱含層(hidden layer)和輸出層(output layer)[7],其中隱含層可以為一層或多層。BP神經(jīng)網(wǎng)絡(luò)有以下特點(diǎn)。
a)網(wǎng)絡(luò)為多層結(jié)構(gòu),相鄰兩層的每個(gè)神經(jīng)元都與鄰層所有的神經(jīng)元連接,而同一層的神經(jīng)元之間不存在連接。這樣的網(wǎng)絡(luò)結(jié)構(gòu),使BP神經(jīng)網(wǎng)絡(luò)可以完成復(fù)雜的計(jì)算工作。
b)網(wǎng)絡(luò)的激活函數(shù)可微,例如常用的Sigmoid函數(shù)和線性函數(shù)。Sigmoid函數(shù)根據(jù)映射后的區(qū)間范圍又可分為L(zhǎng)og-Sigmoid函數(shù)和Tan-Sigmoid函數(shù),它們的數(shù)學(xué)表達(dá)見(jiàn)式(1)[8]:
(1)
其中x的取值為任意實(shí)數(shù),函數(shù)的輸出區(qū)間分別為[0,1]和[-1,1],為網(wǎng)絡(luò)的分類工作提供便利。
c)網(wǎng)絡(luò)采用誤差反向傳播算法(Back-Propagation Algorithm)。BP算法的原理為,有監(jiān)督學(xué)習(xí)中,實(shí)際輸出與期望輸出差值的均方值作為誤差信號(hào)可以沿網(wǎng)絡(luò)反向傳播,在傳播的過(guò)程中網(wǎng)絡(luò)的每一層權(quán)值都會(huì)得到調(diào)整,這個(gè)過(guò)程將重復(fù)至誤差低于目標(biāo)值后神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)結(jié)束[9]。
這種算法可以有效地訓(xùn)練具有優(yōu)秀非線性擬合能力的多層前向神經(jīng)網(wǎng)絡(luò),所以多年來(lái)該算法一直受到研究人員廣泛的關(guān)注[10]。
1.2.2SRM原理
Snowmelt-Runoff Model(SRM)是由Martincc和Rango等人在1980s開發(fā)的,最初主要用于濕潤(rùn)和半濕潤(rùn)地區(qū),后通過(guò)應(yīng)用發(fā)現(xiàn)該模型對(duì)于干旱區(qū)的流域也有著很好的效果。
SRM在開發(fā)之初的目的就是為了解決山區(qū)流域融雪徑流模擬的問(wèn)題。這個(gè)水文模型的基礎(chǔ)為度日因子法,模型需要的數(shù)據(jù)為日平均氣溫、日降水和積雪覆蓋率[11]。因開都河流域的積雪覆蓋率數(shù)據(jù)的獲取較為困難,所以直接以度日模型計(jì)算冰雪融水量,將其代替積雪覆蓋率為BP神經(jīng)網(wǎng)絡(luò)增加一個(gè)輸入。
度日模型的建立依靠的是冰雪消融與氣溫之間存在的線性關(guān)系,該模型的優(yōu)點(diǎn)在于氣溫作為其主要輸入,比別的氣象因素較容易獲取,整個(gè)模型的計(jì)算較為簡(jiǎn)單。雖然模型存在如無(wú)法描述冰雪融化的物理過(guò)程的缺點(diǎn)等,但因其簡(jiǎn)單易用,還是被廣泛地應(yīng)用于相關(guān)研究中。度日模型的一般形式如下[12]:
M=DDF·PDD
(2)
式中M——某時(shí)段內(nèi)冰川或積雪的消融量,mm;DDF——冰川或積雪的度日因子,mm·d-1·℃-1,開都河流域高程變化較大,經(jīng)過(guò)高程分帶,選取平均高程帶的度日因子0.35為代表;PDD——某一時(shí)段內(nèi)的正積溫,其取值通常由式(3)計(jì)算[12]:
(3)
式中Tt——某天的日平均氣溫,℃;Ht——邏輯變量,其取值規(guī)則為,當(dāng)Tt>0℃時(shí),Ht=1,當(dāng)Tt≤0℃時(shí),Ht=0。
1.2.3自相關(guān)系數(shù)法
對(duì)于一組依次排列的變量,它們之間相關(guān)關(guān)系的強(qiáng)弱通過(guò)各階自相關(guān)系數(shù)反映,所以可以把開都河的日均流量當(dāng)作這樣的一組變量,然后選擇某一天的日均流量,再分別計(jì)算其前幾天的日均流量與該天日均流量的自相關(guān)系數(shù)大小,便可以使用這幾日的日均流量作為輸入進(jìn)行模擬。
自相關(guān)系數(shù)的計(jì)算公式見(jiàn)式(4)[13]:
(4)
式中xt——第t天日均流量;x——年均流量;n——徑流序列長(zhǎng)度;k——步長(zhǎng)。
開都河流域所處地區(qū)的氣候類型為溫帶大陸性氣候,全年平均氣溫為-4.16 ℃,平均最大積雪深度為12 cm,高寒氣候特征顯著。開都河的補(bǔ)給類型為冰雪融水和降水混合補(bǔ)給型,其年徑流量約35億 m3,全年徑流量年內(nèi)分布不均勻:春季的河流補(bǔ)給來(lái)源為冰雪融水,多年平均春季(3—5月)徑流總量近8億 m3;夏季的河流補(bǔ)給來(lái)源則包括冰雪融水和山區(qū)降水,多年平均夏季(6—8月)徑流總量約為15.5億 m3;冬季流域平均氣溫在0℃以下,基本沒(méi)有冰雪融水來(lái)補(bǔ)給河流,降水的形式為降雪,只能以積雪的形式積累在流域,河流主要依靠地下水補(bǔ)給。開都河流域面積大,且流域內(nèi)氣象站與水文站數(shù)量較少,河流的補(bǔ)給來(lái)源較復(fù)雜,這些不利條件給徑流模擬帶來(lái)了很大的困難。本文將采用BP神經(jīng)網(wǎng)絡(luò)研究開都河的徑流模擬。
初始的BP神經(jīng)網(wǎng)絡(luò)的輸入是日平均氣溫和降水,為了確定哪一個(gè)在模型中起決定作用,因此,把日平均氣溫和降水分別作為神經(jīng)網(wǎng)絡(luò)的輸入,分析得到的圖像結(jié)果[14]。
將日降水作為輸入,得到的結(jié)果見(jiàn)圖2??梢詮哪M結(jié)果圖中看到,預(yù)測(cè)日均流量的實(shí)線與實(shí)測(cè)日均流量的虛線吻合度較差,特別是在冬春季節(jié),模擬成功的只有在兩曲線的交點(diǎn)及其附近。
圖2 日降水作為輸入的模擬結(jié)果(2012年)
將日平均氣溫作為輸入,得到的結(jié)果見(jiàn)圖3。可以從模擬結(jié)果圖中看到,預(yù)測(cè)日均流量的實(shí)線與實(shí)測(cè)日均流量的虛線整體吻合度相較于把日降水作為輸入時(shí)有了很大的提高與改善。
圖3 日平均氣溫作為輸入的模擬結(jié)果(2012年)
通過(guò)對(duì)圖像的分析,可以得到結(jié)論,日平均氣溫是流域模型的主要影響因子[15]。因此對(duì)這個(gè)BP神經(jīng)網(wǎng)絡(luò)的徑流模擬模型的改進(jìn),應(yīng)該圍繞氣溫進(jìn)行[16]。
根據(jù)開都河流域的氣候與水文特點(diǎn),本文基于SRM的原理來(lái)對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn)后,將日平均氣溫、日降水及日冰雪消融量作為神經(jīng)網(wǎng)絡(luò)的輸入,得到的結(jié)果見(jiàn)圖4。
圖4 基于SRM原理改進(jìn)后的模擬結(jié)果(2012年)
根據(jù)圖4所示,夏季和冬季的模擬效果較好,春季的模擬效果較差,分析可能的原因如下。
a)開都河夏季的河流補(bǔ)給主要依靠冰雪融水和山區(qū)降水,開都河冬季的河流補(bǔ)給主要依靠地下水,由于開都河流域的主要影響因子氣溫在這2個(gè)季節(jié)幅度較小,因此這2個(gè)時(shí)段內(nèi)河流補(bǔ)給較為穩(wěn)定,不易受到偶然因素的影響而使河流的日均徑流量發(fā)生較大幅度的波動(dòng)。
b)春季的徑流來(lái)源主要依靠冰川和積雪的融水,決定冰川和積雪消融量的影響因子為氣溫,而在春季的氣溫并不穩(wěn)定,再加上開都河流域山區(qū)地形復(fù)雜,海拔變化劇烈,氣溫?zé)o法穩(wěn)定地保持在0 ℃以上[17]。這種氣溫的不穩(wěn)定性有時(shí)甚至?xí)斐纱貉春樗^(guò)夏季洪水。除此之外,大山口水文站在春季的實(shí)測(cè)日均流量存在異常,原因有可能是巴音布魯克草原牧草在這個(gè)時(shí)段為發(fā)芽期,需要大量用水,也有可能為上游水庫(kù)調(diào)度導(dǎo)致流量變化,使得實(shí)測(cè)日均流量非自然流量。
因此,基于當(dāng)前BP神經(jīng)網(wǎng)絡(luò)的徑流模擬模型的實(shí)際表現(xiàn)情況,以及該地區(qū)人民生產(chǎn)生活的需要,該論文研究的時(shí)段集中在汛期。現(xiàn)選取2012年7月16日至8月15日期間共計(jì)31 d的數(shù)據(jù),作為神經(jīng)網(wǎng)絡(luò)的測(cè)試集,結(jié)果見(jiàn)圖5。開都河7月16日至8月15日BP神經(jīng)網(wǎng)絡(luò)的日均流量模擬詳細(xì)結(jié)果見(jiàn)表1。
表1 實(shí)測(cè)、預(yù)測(cè)日均流量對(duì)比
圖5 2012年7月16日至8月15日的徑流模擬結(jié)果
從表中數(shù)據(jù)可得出,31個(gè)測(cè)試樣本數(shù)據(jù)中,誤差在20%以內(nèi)的有28個(gè),超過(guò)20%的則有3個(gè),根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范》中的規(guī)定[18],預(yù)報(bào)結(jié)果合格的標(biāo)準(zhǔn)為誤差不超過(guò)20%。由此計(jì)算可得,BP神經(jīng)網(wǎng)絡(luò)對(duì)開都河7月16日至8月15日期間的預(yù)報(bào)精度為90.32%,精度達(dá)到評(píng)定標(biāo)準(zhǔn)甲級(jí)。
研究了將日平均氣溫和降水作為輸入的BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型后,接著建立基于自相關(guān)系數(shù)法的BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型,用日均徑流作為模型的輸入,最后根據(jù)模擬結(jié)果做進(jìn)一步的分析與對(duì)比。
根據(jù)計(jì)算結(jié)果,選取前1、2、3、4、5 d的日均流量作為輸入,當(dāng)天的日均流量為輸出,從而建立了基于自相關(guān)系數(shù)法的BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型,模擬結(jié)果見(jiàn)圖6。
圖6 基于自相關(guān)系數(shù)法的模擬結(jié)果(2012年)
根據(jù)模擬結(jié)果,全年的預(yù)測(cè)日均流量的實(shí)線與實(shí)測(cè)日均流量的虛線整體吻合度很高。在366個(gè)測(cè)試樣本數(shù)據(jù)中,誤差在20%以內(nèi)的有244個(gè),由此計(jì)算可得,基于自相關(guān)系數(shù)法的BP神經(jīng)網(wǎng)絡(luò)對(duì)開都河2012年的預(yù)報(bào)精度為66.67%,精度達(dá)到評(píng)定標(biāo)準(zhǔn)丙級(jí)。
根據(jù)模擬結(jié)果,2種BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型都可以便捷地進(jìn)行徑流模擬,但兩者存在不同之處?;赟RM原理改進(jìn)的模型以日平均氣溫、降水以及冰雪融水作為輸入,有明確的物理意義,基于自相關(guān)系數(shù)法的模型以日均徑流為輸入,模型的底層邏輯為數(shù)據(jù)本身之間的聯(lián)系。兩者相比較,基于自相關(guān)系數(shù)法的模型模擬精度高,但基于SRM原理改進(jìn)的模型可以進(jìn)行更大時(shí)間廣度的模擬。因此,基于自相關(guān)系數(shù)法的模型適用于較短時(shí)間內(nèi)的徑流模擬,基于SRM原理改進(jìn)的模型適用于較大時(shí)間尺度上的徑流模擬。
徑流模擬的結(jié)果可以作為預(yù)防洪水、干旱預(yù)警、環(huán)境保護(hù)和水電站運(yùn)行等領(lǐng)域的重要參考,但是由于徑流模擬問(wèn)題的復(fù)雜性和艱巨性,雖然現(xiàn)有許多模擬方法,但仍不滿足實(shí)際應(yīng)用的需要。自人工神經(jīng)網(wǎng)絡(luò)出現(xiàn)以來(lái),尤其是近10年中,其發(fā)展速度令人驚喜,這為徑流的快速模擬找到了一條新的途徑。本論文中研究了BP神經(jīng)網(wǎng)絡(luò)在徑流模擬中的應(yīng)用,并取得了如下的成果。
a)建立了基于BP神經(jīng)網(wǎng)絡(luò)的開都河流域徑流模擬模型,確定了日平均氣溫是模型的主要影響因子,并根據(jù)SRM這一融雪徑流模型的原理,通過(guò)度日因子法為網(wǎng)絡(luò)增加了冰川和積雪的消融量的輸入,模型的性能有了改善,模型的物理意義也得到了加強(qiáng)。
b)運(yùn)用自相關(guān)系數(shù)法,將經(jīng)過(guò)處理的日均流量序列作為神經(jīng)網(wǎng)絡(luò)的輸入,相較于以日平均氣溫、日降水和日冰雪消融量為輸入,全年日均流量的模擬結(jié)果的精度提升很大,尤其是對(duì)于后者無(wú)法有效模擬的3—5月這一時(shí)段的日均流量。