伍佑倫,易放輝,劉曉群,宋 雯,呂慧珠,趙文剛
(1.湖南省水利水電科學(xué)研究院,湖南 長沙 410007;2.湖南省水利廳,湖南 長沙 410007)
河道徑流量分析與預(yù)報(bào)研究對于合理開發(fā)、利用水資源具有十分重要的意義[1-3]。通常情況下,徑流過程受流域下墊面、氣象、植被以及人類活動的綜合影響,表現(xiàn)出非線性、非平穩(wěn)性且具有大量不確定性、隨機(jī)性和高復(fù)雜性[4]。國內(nèi)外常見的徑流中長期預(yù)測、估算方法以基于數(shù)理統(tǒng)計(jì)的回歸分析[5]、SWAT模型[6]、基于質(zhì)量、能量守恒的水量平衡模型[7-8]、人工神經(jīng)網(wǎng)絡(luò)算法為主。一直以來水利工程修建、植被破壞等人類活動對徑流過程的影響越來越明顯,傳統(tǒng)回歸分析法在處理長系列水文資料時(shí),對于人類活動影響較大的徑流過程無法進(jìn)行還原計(jì)算,難以保證水文資料的一致性;水量平衡模型研究站點(diǎn)分布跨度較大、中間臨時(shí)性取水活動較多、基礎(chǔ)資料不齊全的站點(diǎn)時(shí)精度往往受限,使其在實(shí)踐中難以推廣;SWAT模型徑流研究中需要輸入研究區(qū)域土壤類型、地形等資料等眾多資料,參數(shù)難以確定。除此之外,以上方法預(yù)測過程中對于徑流的隨機(jī)性規(guī)律很難清晰準(zhǔn)確把握[9]。
目前,神經(jīng)網(wǎng)絡(luò)算法由于其非線性特點(diǎn),所以廣泛應(yīng)用于徑流預(yù)測,且常與其他方法耦合使用。鑒于影響徑流因素眾多,因子間相互聯(lián)系,導(dǎo)致預(yù)測精度、泛化能力較差,通過(核)主成分分析法能夠去除噪音、減少輸入?yún)?shù),與PSO、SVM、BP等算法結(jié)合能建立相對簡化的徑流預(yù)測模型[10-11]。除去影響因子眾多,徑流過程自身復(fù)雜性又是數(shù)據(jù)驅(qū)動預(yù)測模型的難點(diǎn)。小波分析對長序列徑流數(shù)據(jù)解構(gòu)能有效識別主頻、局部信息與SVM等算法強(qiáng)泛化能力配合在中長期徑流預(yù)測中能提供一定參考[12-13]。但在氣象、下墊面、人類活動共同作用下形成的徑流非線性非平穩(wěn)序列,其小波分析基函數(shù)憑經(jīng)驗(yàn)難以查找,經(jīng)驗(yàn)?zāi)B(tài)分解法(EMD)自適應(yīng)以觀測數(shù)據(jù)為基礎(chǔ),將徑流序列分解成若干高頻至低頻信號及殘差,通過神經(jīng)網(wǎng)絡(luò)算法依次預(yù)測,進(jìn)而重構(gòu)徑流序列[14-15]。與其他方法配合使得神經(jīng)網(wǎng)絡(luò)預(yù)測徑流精度有所提高,但其物理意義仍不十分明確。
本文借助EMD分解方法能同時(shí)在時(shí)域和頻域內(nèi)得到較高的分辨率,從水文時(shí)間序列中發(fā)現(xiàn)有序、確定性的內(nèi)在規(guī)律,揭示徑流復(fù)雜的運(yùn)動特征,給予各分量明確的物理意義,并結(jié)合常用神經(jīng)網(wǎng)絡(luò)算法建立合適的徑流估算模型。
西洞庭湖是洞庭湖西部咽喉,吞吐長江松滋、太平二口洪水,承接沅、澧二水,納滄、浪等八河入湖,是長江中下游洪水的首個(gè)“承接器”和防旱“前哨站”;同時(shí),也是江湖復(fù)合濕地生態(tài)系統(tǒng)的典型代表與調(diào)節(jié)器,具有強(qiáng)大的自然調(diào)蓄洪水功能,是構(gòu)建洞庭湖濕地乃至長江中下游濕地安全體系的重要戰(zhàn)略要地。區(qū)內(nèi)擁有河流、湖泊、沼澤、人工濕地等多種濕地生態(tài)類型,水系發(fā)達(dá),“漲水為湖,退水為洲”是其主要特征,自20世紀(jì)90年代以來共發(fā)生1995、1996、1998、1999 年累計(jì)5次特大洪水。南咀站作為西洞庭湖的重要水文站點(diǎn),控制松澧洪道和沅水經(jīng)西洞庭湖湖口(北端)流入南洞庭湖水情的重要控制站,其上游的松滋-太平水系建有控制性水文站點(diǎn)安鄉(xiāng)站,澧水水系建有控制性水文站點(diǎn)石龜山站[16-17]。
依托長江水利委員會荊江水文水資源勘測局、湖南省水文局收集1956—2008年石龜山、安鄉(xiāng)站月平均水位(Z)、流量(Q)數(shù)據(jù),南咀站月平均流量(Q)的水文資料,結(jié)合多元回歸法對缺測數(shù)據(jù)進(jìn)行插值補(bǔ)齊。
本研究以南咀站月平均流量作為基準(zhǔn)值,經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)后結(jié)合BP、小波神經(jīng)網(wǎng)絡(luò)(WAVE)、廣義回歸神經(jīng)網(wǎng)路(GRNN)估算南咀站月平均流量,研究其在南咀站的適用性。
經(jīng)驗(yàn)?zāi)B(tài)分解是一種非線性非平穩(wěn)信號的分析方法,因其具有多尺度分析、基函數(shù)由自身構(gòu)造的特點(diǎn)。廣泛應(yīng)用于海洋、大氣、天體觀測資料與地震記錄分析等模態(tài)參數(shù)識別方面,河道水位、流量隨季節(jié)、氣象及上下游變化一定程度上也呈現(xiàn)出非線性。因此,本文引入EMD方法進(jìn)行南咀站流量估算[18]。
同時(shí)鑒于河道水位、流量作為一種水文現(xiàn)象,其既有確定性又有隨機(jī)性。神經(jīng)網(wǎng)絡(luò)在處理信息的整體性和模糊性方面主要依賴于混沌,即在確定性方程描述的動力學(xué)系統(tǒng)中表現(xiàn)其非確定性行為(隨機(jī)性)。BP神經(jīng)網(wǎng)絡(luò)算法作為人工神經(jīng)網(wǎng)絡(luò)算法中應(yīng)用最廣泛、最成熟的算法,具有信號前向傳遞,誤差反向傳遞的特點(diǎn)[19];WAVE相較前向的神經(jīng)網(wǎng)絡(luò),其基元、整個(gè)結(jié)構(gòu)依據(jù)小波分析理論確定,可避免結(jié)構(gòu)設(shè)計(jì)的盲目性,具有更強(qiáng)的學(xué)習(xí)能力,精度更高[20];GRNN具有很強(qiáng)的非線性映射能力和柔性網(wǎng)絡(luò)結(jié)構(gòu)以及高度的容錯(cuò)性和魯棒性,很適合于解決非線性函數(shù)的逼近問題[15]。
本研究選取南咀站1956年1月至2005年12月平均流量數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)輸出訓(xùn)練樣本集,選取安鄉(xiāng)、石龜山站1956年1月至2005年12月平均流量、水位數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)輸入訓(xùn)練樣本集;神經(jīng)網(wǎng)絡(luò)測試樣本集為各站點(diǎn)2006年1月至2008年12月數(shù)據(jù)。
具體參數(shù)設(shè)置如下。
a)BP:采用4×125×1網(wǎng)絡(luò)結(jié)構(gòu),迭代次數(shù)100次,學(xué)習(xí)率0.1,目標(biāo)0.000 04,節(jié)點(diǎn)傳遞函數(shù)為tansig函數(shù),訓(xùn)練函數(shù)為trainlm函數(shù),網(wǎng)絡(luò)學(xué)習(xí)函數(shù)為learngdm。
b)GRNN:采用交叉驗(yàn)證的方式尋求徑向基函數(shù)的擴(kuò)展速度。
c)WAVE:采用4×6×1網(wǎng)絡(luò)結(jié)構(gòu),迭代次數(shù)100次,權(quán)值參數(shù)學(xué)習(xí)率為0.01、0.001。
為考察算法預(yù)測的有效性和精確度,選取4項(xiàng)誤差作為評價(jià)指標(biāo),分別為均方根誤差(RMSE)、平均絕對誤差(MAE)、平均相對誤差(ARE)、決定系數(shù)(R2)。
安鄉(xiāng)、石龜山、南咀站水位、流量長時(shí)間序列情況見圖1,圖1a、1b中各站點(diǎn)水位、流量均隨時(shí)間波動,由于安鄉(xiāng)、石龜山站點(diǎn)均位于南咀站上游,南咀站流量年際間的波動與石龜山、安鄉(xiāng)站水位、流量波動存在一定相似性。從圖1c、1d可以看出年際間石龜山、安鄉(xiāng)的流量、水位均呈下降趨勢,變化量分別為68.634 m3/s、0.365 m,153.916 m3/s、0.273 m,南咀流量變化呈下降趨勢,變化量為70.756 m3/s。其中安鄉(xiāng)站流量、石龜山站水位年際間變化最為顯著;從圖1e、1f可以看出,南咀站年內(nèi)最豐月份流量與最枯月份流量間差異隨時(shí)間增大而增大,其1969年年內(nèi)最枯月份流量與最豐月份流量相差6 423 m3/s,1999年年內(nèi)最枯月份與最豐月份相差8 007 m3/s,此外,1990年以前年內(nèi)最枯與最豐流量差值大于多年平均差值10 %的為18次,而1990年以后的19 a內(nèi)有13 a南咀站年內(nèi)最枯月份與最豐月份流量差值大于多年平均差值的10 %。安鄉(xiāng)、石龜山站年內(nèi)最豐月份流量與最枯月份流量間差異隨時(shí)間增大而減小。這主要因?yàn)榘侧l(xiāng)、石龜山站位于南咀站上游,尤其安鄉(xiāng)站位于松滋東支,隨著長江三峽水庫“清水下泄”模式運(yùn)行導(dǎo)致整個(gè)長江主河道下切,松滋河口門位置不斷抬高,洪水時(shí)期長江分流至松滋河水量減小,枯水期考慮生態(tài)問題長江下泄量增大使得松滋河流量維持在一定水平。石龜山站位于澧水洪道,但也受松滋河?xùn)|支影響。安鄉(xiāng)、石龜山水位年內(nèi)最高水位與最低水位間的差異隨年份增加而增大,且變化幅度分別為0.008 8、0.035 2 m/a。
南咀站作為安鄉(xiāng)、石龜山下游站點(diǎn),其水位、流量波動受石龜山站、安鄉(xiāng)站以及區(qū)間來水影響較大,為探求各影響因素對于南咀站月平均流量作用,本文對南咀站月平均流量長時(shí)間序列進(jìn)行EMD分解,得到1組不同尺度的分量及趨勢項(xiàng),見圖2。月平均流量IMF分量的計(jì)算周期及貢獻(xiàn)率見表1。各IMF分量包含不同周期震蕩變化信息。從圖2中可以看出分量IMF2是月平均流量原信號中振幅最大、能量最高的分量,且對月平均流量的波動貢獻(xiàn)最大(73.238 %),除IMF1之外,隨分量級數(shù)增大,振幅減小,能量較小,周期增大(表1)。從趨勢項(xiàng)中可以看出南咀站的月平均流量呈現(xiàn)先減小后增大再減小的趨勢,一定程度上與圖1b南咀站的年際變化吻合。
a)各站點(diǎn)月平均流量序列
b)各站點(diǎn)月平均水位序列圖1各站點(diǎn)水位、流量序列
d)各站點(diǎn)年平均水位序列
e)各站點(diǎn)年內(nèi)流量差值序列
f)各站點(diǎn)年內(nèi)水位差值序列注:Qa、Za、Qs、Zs、Qn分別為安鄉(xiāng)站月平均流量、水位、石龜山站月平均流量、水位、南咀站月平均流量續(xù)圖1各站點(diǎn)水位、流量序列
圖2 南咀站流量序列EMD分解
表1 南咀站EMD分解各IMF分量計(jì)算周期及貢獻(xiàn)率
基于上述各站點(diǎn)月平均流量、水位原始信號分析可知,南咀站月平均流量與安鄉(xiāng)、石龜山水位、流量存在一定關(guān)系,為量化其相關(guān)關(guān)系,并給予南咀站月平均流量IMF分量一定的物理意義,將各IMF分量與安鄉(xiāng)、石龜山水位、流量進(jìn)行相關(guān)性分析,見表2。
由表2可以看出,南咀站原始信號、IMF1—3分量與安鄉(xiāng)、石龜山站的水位、流量間呈極顯著的正相關(guān)關(guān)系;趨勢項(xiàng)與安鄉(xiāng)站流量、石龜山站水位呈極顯著負(fù)相關(guān)關(guān)系,與安鄉(xiāng)站水位呈負(fù)相關(guān),但不顯著,與石龜山站流量呈顯著負(fù)相關(guān)關(guān)系。且相關(guān)系數(shù)絕對值:Zs>Qa>Qs>Za。這可能因?yàn)楫?dāng)南咀站出口南洞庭湖水位較低時(shí),石龜山、安鄉(xiāng)站水位抬升、流量加大會形成一定水位差,導(dǎo)致南咀站出流量加大;而當(dāng)南洞庭湖水位比較高時(shí),由于南咀站一側(cè)為赤山第四紀(jì)紅色黏土,質(zhì)地黏重難以沖刷,另一側(cè)為堤垸導(dǎo)致出流能力有限,遇荊南三口、澧水來水較大時(shí),受南洞庭湖以及荊南三口、澧水間相互頂托作用導(dǎo)致石龜山、安鄉(xiāng)站水位、流量不斷抬升,南咀站流量變化不大現(xiàn)象出現(xiàn)。同時(shí),隨著長江三峽水庫及上游梯級運(yùn)用,南咀站流量變化由主要受安鄉(xiāng)站所在的松虎洪道來水情況的影響向澧水、松虎洪道共同作用轉(zhuǎn)化,以1956—1992、1992—2008年年平均流量來看,安鄉(xiāng)站流量由129 6.577 m3/s減小為927.688 m3/s,石龜山站僅由879.590 m3/s減小至758.375 m3/s,南咀站流量由2 108.281 m3/s減至1 886.125 m3/s,即安鄉(xiāng)站對南咀站流量貢獻(xiàn)率由61.810%衰減至49.185%,石龜山站對南咀站流量貢獻(xiàn)率由41.931%減至36.153%。此外,在三峽水庫以“清水下泄”方式運(yùn)用以來有研究表明整個(gè)長江中下游河道均處在沖刷的狀態(tài),導(dǎo)致河床底部高程降低,河道內(nèi)水面降低,但河槽內(nèi)蓄積的水量并未減小,即河道斷面的流量仍有可能呈現(xiàn)增大的趨勢。而與流經(jīng)安鄉(xiāng)站的松虎河相比,流經(jīng)石龜山站的澧水河道較寬,相同水位落差下,石龜山站帶來的流量變化大,同時(shí),相同變幅條件下,水位抬升較流量增大對于泄流本身影響更大。
表2 各IMF分量與各站點(diǎn)流量、水位相關(guān)性
注:**為0.01顯著水平下,*為0.05顯著水平下
根據(jù)南咀站流量數(shù)據(jù)EMD分解,本文設(shè)置3種模式:①安鄉(xiāng)、石龜山站水位、流量數(shù)據(jù)作為輸入數(shù)據(jù),南咀站流量分解數(shù)據(jù)IMF1—7、Res作為輸出數(shù)據(jù)(IMF-7);②安鄉(xiāng)、石龜山站水位、流量數(shù)據(jù)作為輸入數(shù)據(jù),南咀站流量分解數(shù)據(jù)IMF1—3、Res作為輸出數(shù)據(jù)(IMF-4);③安鄉(xiāng)、石龜山站水位、流量數(shù)據(jù)作為輸入數(shù)據(jù),南咀站流量數(shù)據(jù)作為輸出數(shù)據(jù)(Factor)。并結(jié)合GRNN、BP、WAVE3種神經(jīng)網(wǎng)絡(luò)算法估算南咀站月平均流量,見圖3。
從圖3中可以看出,與觀測值相比,3種算法估算值除GRNN、BP算法、IMF-4模式下部分點(diǎn)大于觀測值,其他點(diǎn)均偏小。從預(yù)測效果來看,F(xiàn)actor模式下,GRNN算法除相對誤差13.860%>11.170%(BP),其他指標(biāo)均優(yōu)于BP算法,優(yōu)于小波神經(jīng)網(wǎng)絡(luò)算法;IMF-7模式下,GRNN算法除均方根誤差363.546 m3/s>329.229 m3/s(WAVE),其他指標(biāo)均優(yōu)于小波神經(jīng)網(wǎng)絡(luò)算法,優(yōu)于BP算法;IMF-4模式下,GRNN算法優(yōu)于WAVE、BP算法,而小波神經(jīng)網(wǎng)絡(luò)除決定系數(shù)R20.875>0.867(BP),其他BP算法均優(yōu)于小波神經(jīng)網(wǎng)絡(luò)算法;GRNN算法估算徑流時(shí),F(xiàn)actor模式下平均絕對誤差、均方根誤差、平均相對誤差、決定系數(shù)分別為140.218 m3/s、182.469 m3/s、13.860%、0.986,優(yōu)于IMF-4模式和IMF-7模式,且IMF-4模式優(yōu)于IMF-7模式。而BP、WAVE算法估算徑流時(shí),全輸入模式優(yōu)于IMF-7輸入模式,IMF-7輸入模式優(yōu)于IMF-4輸入模式。
同時(shí),從圖3中,可以看出在南咀站徑流出現(xiàn)極大值時(shí),神經(jīng)網(wǎng)絡(luò)算法的模擬效果不佳,一方面可能因?yàn)槌霈F(xiàn)較大洪水時(shí),上下游水庫調(diào)度、蓄滯洪區(qū)運(yùn)用等人類活動干預(yù)使得原有徑流長序列數(shù)據(jù)一致性破壞,神經(jīng)網(wǎng)絡(luò)訓(xùn)練集與驗(yàn)證集從數(shù)據(jù)結(jié)構(gòu)存在一定差異;另一方面,隨著自然、人類活動的共同作用,導(dǎo)致大氣環(huán)流、局部氣候發(fā)生變化,局部地區(qū)極端天氣出現(xiàn),使得徑流序列隨機(jī)性更加復(fù)雜。此外,神經(jīng)網(wǎng)絡(luò)算法進(jìn)行時(shí)間序列預(yù)測時(shí)理想條件需要輸出值有界的同時(shí)還要有相當(dāng)多均勻分布的已知樣本,但自然界中完全均勻分布的現(xiàn)象不存在。
a)GRNN
b)BP
c)WAVE圖3 基于神經(jīng)網(wǎng)絡(luò)估算南咀站流量對比
表3 南咀站月平均流量估算評價(jià)指標(biāo)
注:MAE、RMSE單位為m3/s;ARE單位為%
本文通過EMD方法對南咀站月平均徑流量進(jìn)行分解,結(jié)合相關(guān)性分析分離出與輸入因子相關(guān)的IMF分量,引入BP、GRNN、WAVE算法估算、重構(gòu)南咀站月平均流量序列,經(jīng)對比分析得到以下初步結(jié)論。
a)南咀站月平均徑流量EMD分解中,IMF2分量能量最高、振幅最大,貢獻(xiàn)率最大(73.238%),分量IMF3—6隨分量級數(shù)增大,振幅減小,能量較小,周期增大。
b)南咀站月平均流量IMF分量與安鄉(xiāng)、石龜山站月平均水位流量相關(guān)性分析發(fā)現(xiàn),分量IMF1—3與安鄉(xiāng)、石龜山站水位流量呈極顯著正相關(guān)關(guān)系,趨勢項(xiàng)與石龜山站月平均水位、安鄉(xiāng)站月平均流量呈極顯著負(fù)相關(guān)關(guān)系,與石龜山站月平均流量顯著負(fù)相關(guān)。
c)GRNN、BP、WAVE算法估算南咀站月平均流量表明,同一模式,GRNN算法均優(yōu)于BP算法(Factor模式下除相對誤差外)、小波神經(jīng)網(wǎng)絡(luò)算法(IMF-7模式下除均方根誤差外);同一算法,F(xiàn)actor模式均優(yōu)于IMF-7模式,IMF-7模式優(yōu)于IMF-4模式(除GRNN算法外)。
EMD分解在神經(jīng)網(wǎng)絡(luò)進(jìn)行徑流估算中還涉及其他一些問題,以南咀站為例,分量IMF4—6與安鄉(xiāng)、南咀站水位、流量間并無顯著相關(guān)關(guān)系,后續(xù)研究中一方面需考慮藕池河中支水位、水文站點(diǎn)以及南咀站附近控制性雨量站對于南咀站月平均流量的影響;另一方面需從人類活動對于徑流影響方面入手,開展徑流還原計(jì)算,通過自然、人類活動兩方面疊加考慮徑流預(yù)測。