劉惟飛, 陳兵*, 余周
(1.華南理工大學(xué)環(huán)境與能源學(xué)院, 廣州 510006; 2. 廣東省環(huán)境風(fēng)險(xiǎn)防控與應(yīng)急處置工程技術(shù)研究中心, 廣州 510006)
湖泊是陸地表面封閉洼地中積水形成的比較寬闊的水域,具有抵御洪澇災(zāi)害、調(diào)蓄、補(bǔ)充地下水、景觀等作用[1]。湖泊水位是維持其生態(tài)系統(tǒng)結(jié)構(gòu)、功能和完整性的基礎(chǔ),精確的湖泊水位預(yù)測(cè)對(duì)災(zāi)害監(jiān)測(cè)和水情調(diào)度具有重要意義。目前機(jī)器學(xué)習(xí)算法由于其強(qiáng)大的非線性擬合能力被廣泛用于水文時(shí)序預(yù)測(cè)領(lǐng)域,其中包括支持向量機(jī)(support vector regression,SVR)和人工神經(jīng)網(wǎng)絡(luò)[2]。劉志飛[3]建立最小二乘支持向量的河段水位預(yù)測(cè)模型,驗(yàn)證了支持向量機(jī)模型在水位預(yù)測(cè)中的可靠性。傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)在水位預(yù)測(cè)中易出現(xiàn)梯度消失問題,即距離當(dāng)前時(shí)間步越長(zhǎng),信息反饋的梯度信號(hào)越不顯著。信息隨時(shí)間步數(shù)增加在網(wǎng)絡(luò)中記憶值變小的情況,這意味著RNN長(zhǎng)時(shí)學(xué)習(xí)能力失效。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory, LSTM)能有效改善傳統(tǒng)RNN的梯度消失問題被廣泛應(yīng)用于水文時(shí)序預(yù)測(cè)領(lǐng)域,并取得了很好的效果[4]。然而LSTM的缺點(diǎn)是它的復(fù)雜性,因此Cho等[5]提出了LSTM簡(jiǎn)化變體——門控循環(huán)單元(gated recurrent unit,GRU)。鑒于GRU在其他時(shí)間序列數(shù)據(jù)建模方面的成功,如燃油流量、路況、災(zāi)情信息預(yù)測(cè)等[6-8]。研究者們也嘗試將GRU引入水文時(shí)序預(yù)測(cè)領(lǐng)域并取得了不錯(cuò)成效。如段生月等[9]將基于彈性網(wǎng)正則化的GRU模型應(yīng)用于贛江流域外洲水文站的水位預(yù)測(cè),Gao等[10]將GRU模型應(yīng)用于雨量站的降水量預(yù)測(cè),均取得了不錯(cuò)效果。此外,組合模型理論上要比單一模型效果更好,能夠克服單一模型的局限[11]。如Pan等[12]將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和GRU網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合應(yīng)用于預(yù)測(cè)長(zhǎng)江水位變化,發(fā)現(xiàn)CNN-GRU預(yù)測(cè)性能優(yōu)于LSTM。
為改善傳統(tǒng)RNN的梯度消失問題以及探索GRU組合模型應(yīng)用于水文時(shí)序預(yù)測(cè)的有效性,現(xiàn)提出一種基于GRU與SVR的湖泊水位組合預(yù)測(cè)模型,以期取得更高的水位預(yù)測(cè)精度。并與傳統(tǒng)的CNN-GRU及單一模型進(jìn)行對(duì)比,分析各種方法的適用性。
研究區(qū)域?yàn)楂C德涌的源頭西湖區(qū)域,獵德涌是廣州市僅有的一條流經(jīng)珠江新城中央商務(wù)區(qū)的河涌,河涌集水面積16.2 km2,全長(zhǎng)6.5 km,采取自流方式排澇。獵德涌下游沿線水位過高是造成獵德涌流域低洼處水浸嚴(yán)重主要成因之一[13]。西湖位于廣州市天河區(qū)華南理工五山校區(qū)內(nèi)。西湖最大水深8.9 m,集水面積0.031 km2,通過雙向閥門往獵德涌排水。西湖水源主要依靠降雨或廣州市建設(shè)的“三涌補(bǔ)水工程”補(bǔ)充[14]。降雨發(fā)生時(shí),東莞莊北與華工片區(qū)的雨水通過管道一起匯入西湖。日常補(bǔ)水通過二級(jí)長(zhǎng)虹泵站提水為西湖補(bǔ)水,補(bǔ)水流量為1.2~2 m3/s,時(shí)間為6:00—18:00。西湖與獵德涌水位存在顯著的相關(guān)性,西湖水位變化對(duì)于研究獵德涌流域內(nèi)澇具有重要的意義。廣州市區(qū)域如圖1(a)所示,獵德涌流域如圖1(b)所示。
圖1 研究區(qū)域概況圖Fig.1 The overview map of study area
深度學(xué)習(xí)的水位預(yù)測(cè)模型編程語(yǔ)言采用python3.8實(shí)現(xiàn),深度學(xué)習(xí)框架采用谷歌開發(fā)的TensorFlowCPU2.0版本。計(jì)算機(jī)的配置是Windows7操作系統(tǒng),8 GB運(yùn)行內(nèi)存。
針對(duì)LSTM網(wǎng)絡(luò)參數(shù)冗雜、計(jì)算復(fù)雜的缺點(diǎn),GRU對(duì)LSTM進(jìn)行了簡(jiǎn)化改進(jìn),將LSTM中的遺忘門和輸入門合并為更新門,同時(shí)將單元狀態(tài)與隱藏層輸出合并,降低了網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度。因此GRU網(wǎng)絡(luò)中的門控循環(huán)單元只有更新門和重置門,結(jié)構(gòu)如圖2所示。
圖2 GRU結(jié)構(gòu)圖Fig.2 GRU structure diagram
t時(shí)刻GRU模型輸出ht的計(jì)算步驟如式(1)~式(5)所示。
rt=σ(Wr·[ht-1,xt]+br)
(1)
式(1)中:rt為t時(shí)刻重置門的輸出;Wr、br為重置門的權(quán)重與偏置;·表示點(diǎn)乘積;σ為sigmoid 函數(shù)。
zt=σ(Wz·[ht-1,xt]+bz)
(2)
式(2)中:zt為t時(shí)刻更新門的輸出;Wz、bz為更新門的權(quán)重與偏置。
(3)
(4)
yt=σ(Wo·ht)
(5)
式中:Wo為輸出向量與xt及ht-1構(gòu)成的連接矩陣相乘的權(quán)重參數(shù)。
利用課題組自主研發(fā)設(shè)計(jì)的測(cè)控模塊及智慧排水內(nèi)澇云服務(wù)系統(tǒng)[15]采集的2021年3月11日—8月31日的西湖每10 min間隔時(shí)刻的水位和雨量數(shù)據(jù)建立降雨水位預(yù)測(cè)模型。降雨量數(shù)據(jù)精度0.01 mm,液位精度為0.1 mm。包括25 056(24 h×6×174 d)組水位數(shù)據(jù)和降雨數(shù)據(jù),其中降雨量數(shù)據(jù)允許存在零值,包含雨前晴天數(shù)、降雨歷時(shí)等隱藏特征信息,代表模型既可以預(yù)測(cè)降雨期也能預(yù)測(cè)未降雨期。利用前20 016個(gè)數(shù)據(jù)(3月11日—7月27日,樣本量的80%)對(duì)模型進(jìn)行訓(xùn)練,5 040個(gè)數(shù)據(jù)(7月28日—8月31日,樣本量的20%)用于測(cè)試。8月不同時(shí)期的降雨場(chǎng)次較多,故選用該時(shí)段作為測(cè)試集。雨量及水位數(shù)據(jù)如圖3所示,測(cè)試集雨量信息如表1所示。
圖3 監(jiān)測(cè)點(diǎn)降雨量及水位變化Fig.3 Rainfall and water level data from monitoring stations
表1 系統(tǒng)記錄測(cè)試集降雨量數(shù)據(jù)Table 1 The system records the rainfall data of the test set
構(gòu)建的GRU-SVR組合模型技術(shù)路線如圖4所示,組合模型采用串聯(lián)式結(jié)構(gòu)。數(shù)據(jù)經(jīng)過GRU中間層單元提取特征信息,再次輸入全連接中間層經(jīng)過神經(jīng)元計(jì)算得到輸出向量,輸出向量輸入SVR組件經(jīng)過核函數(shù)轉(zhuǎn)換計(jì)算再通過全連接輸出層得到最終預(yù)測(cè)值。針對(duì)SVR核函數(shù)難以選擇的問題,構(gòu)建了3種不同核函數(shù)下的GRU-SVR進(jìn)行對(duì)比,以此選擇出契合GRU的支持向量回歸機(jī)。
圖4 GRU-SVR模型框架Fig.4 GRU-SVR model general framework
(1)模型數(shù)據(jù)準(zhǔn)備。為消除數(shù)據(jù)間量綱影響,利用最大最小值法將訓(xùn)練集S及測(cè)試集T歸一化至[0,1]區(qū)間。
(2)模型訓(xùn)練及預(yù)測(cè)。訓(xùn)練過程中,組合模型的訓(xùn)練集為
(6)
GRU-BP組合模型的測(cè)試集為
(7)
采用直接預(yù)測(cè)方式,預(yù)測(cè)長(zhǎng)度為6,即預(yù)測(cè)時(shí)間為1 h。
為了準(zhǔn)確評(píng)估模型的精度,采用均方根誤差(root mean square error,RMSE)、均方誤差(mean square error,MSE)和平均絕對(duì)誤差(mean absolute error,MAE)及平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)作為誤差分析指標(biāo),對(duì)模型預(yù)測(cè)誤差進(jìn)行量化評(píng)價(jià)。評(píng)價(jià)指標(biāo)公式如式(8)~式(11)所示。
(8)
(9)
(10)
(11)
式中:yact為實(shí)測(cè)的水位;ypre為模型預(yù)測(cè)的水位;i為水位值編號(hào);n為水位預(yù)測(cè)值數(shù)量。
模型參數(shù)中滑動(dòng)時(shí)間窗長(zhǎng)度(用于預(yù)測(cè)的時(shí)間片段長(zhǎng)度)設(shè)置為24。神經(jīng)網(wǎng)絡(luò)參數(shù)通過控制變量法[16]選取,根據(jù)經(jīng)驗(yàn)調(diào)試模型初始化參數(shù)之后,保持模型其他參數(shù)不變,每次只更改某一變量比較進(jìn)行貪心式尋優(yōu);SVR核函數(shù)參數(shù)通過網(wǎng)格搜索算法確定,最終確定GRU-SVR模型參數(shù)組合,參數(shù)如表2所示。
表2 不同核函數(shù)下的GRU-SVR模型參數(shù)Table 2 GRU-SVR model parameters under different kernel functions
以1 h預(yù)測(cè)時(shí)長(zhǎng)為例,構(gòu)建了3種不同核函數(shù)下的GRU-SVR模型尋優(yōu),并與CNN-GRU(卷積層為1層,卷積核個(gè)數(shù)為1,卷積核尺寸為9)、GRU(中間層為3,輸出維度為16)、SVR(多項(xiàng)式核)模型進(jìn)行對(duì)比,單一模型的超參數(shù)與組合模型設(shè)定一致。各模型訓(xùn)練集下的RMSE及MAE指標(biāo)如圖5所示??梢钥闯?,訓(xùn)練集下的GRU-SVR(多項(xiàng)式核)預(yù)測(cè)效果最好。
圖5 不同模型訓(xùn)練集下的預(yù)測(cè)結(jié)果Fig.5 The prediction results under different model training sets
為了驗(yàn)證GRU-SVR(多項(xiàng)式核)模型預(yù)測(cè)湖泊水位的優(yōu)點(diǎn),各模型在測(cè)試集下的預(yù)測(cè)結(jié)果如圖6所示,誤差指標(biāo)如表3所示。
表3 不同模型的測(cè)試集誤差指標(biāo)Table 3 Error metrics of different models under the test set
由圖6和表3可知,對(duì)于測(cè)試集的整體區(qū)間水位預(yù)測(cè),模型的預(yù)測(cè)精度從高到低依次為GRU-SVR(多項(xiàng)式核)、CNN-GRU、GRU、GRU-SVR(Sigmoid核)、SVR、GRU-SVR(RBF核)。GRU-SVR(多項(xiàng)式核)預(yù)測(cè)精度要比其他核函數(shù)高。雖然研究表明RBF核函數(shù)在多數(shù)樣本數(shù)據(jù)集有優(yōu)勢(shì)[17],但實(shí)驗(yàn)發(fā)現(xiàn)多項(xiàng)式核函數(shù)在該具備線性與非線性混合特性湖泊水位數(shù)據(jù)集表現(xiàn)更為出色。
圖6 不同模型的測(cè)試集預(yù)測(cè)結(jié)果Fig.6 The forecast results of different models
整體的測(cè)試集可劃分為降雨期和未降雨期,降雨期又分為暴雨期(日降雨總量大于50 mm)、大雨期(總量為25.1~50 mm)、中雨期(總量為10.1~25 mm)、小雨期(總量小于10 mm)。在降雨期,西湖水位受到降雨量、排水及補(bǔ)水量等因素影響。而在未降雨期,西湖水位主要受補(bǔ)水及排水量的影響。對(duì)比各模型在不同時(shí)期下的預(yù)測(cè)性能,評(píng)估模型在不同情況下的多因素特征學(xué)習(xí)能力。統(tǒng)計(jì)的降雨期數(shù)據(jù)為降雨起始時(shí)至降雨結(jié)束后1 h之間的數(shù)據(jù)。
3.3.1 降雨期預(yù)測(cè)
測(cè)試集包含兩場(chǎng)暴雨、六場(chǎng)大雨、四場(chǎng)中雨、四場(chǎng)小雨。不同模型在暴雨期、大雨期、中雨期、小雨期的預(yù)測(cè)結(jié)果分別如圖7~圖10所示。
由圖7~圖10可知,西湖水位與補(bǔ)水量、排水量、降雨量相關(guān)。隨著降雨總量變小,雨量與水位間的相關(guān)性減弱,水位曲線隨降雨總量減少逐漸呈現(xiàn)線性上升或下降趨勢(shì)。
圖7 模型在暴雨期的預(yù)測(cè)結(jié)果Fig.7 Forecast results of different models during the rainstorm period
圖8 模型在大雨期的預(yù)測(cè)結(jié)果Fig.8 Forecast results of different models during periods of heavy rain
圖10 模型在小雨期的預(yù)測(cè)結(jié)果Fig.10 Forecast results of different models during periods of light rain
GRU-SVR(多項(xiàng)式核)的預(yù)測(cè)誤差較小,在暴雨期、大雨期、中雨期及小雨期與實(shí)際水位的最大偏差分別為20、8、6、2 cm。CNN-GRU曲線擬合度僅次于GRU-SVR(多項(xiàng)式核),在某些時(shí)刻與GRU十分接近。與GRU-SVR(RBF核)相比,GRU-SVR(Sigmoid核)預(yù)測(cè)曲線在暴雨及大雨期表現(xiàn)較好,在中小雨期表現(xiàn)則稍弱。SVR精度最低,擬合曲線則明顯發(fā)生了較大偏離。
在暴雨及大雨期,各模型對(duì)雨強(qiáng)峰值段期間的水位預(yù)測(cè)精度要明顯低于雨量小且均勻分布的降雨時(shí)段。當(dāng)峰值雨量大于6 mm/10 min時(shí),模型在雨峰出現(xiàn)后1 h時(shí)段內(nèi)的預(yù)測(cè)誤差顯著增大;這也表明在歷時(shí)短、雨強(qiáng)大的時(shí)段區(qū)間,模型不易挖掘多特征因素對(duì)水位增量的影響。
各模型的預(yù)測(cè)精度會(huì)隨著變量因素增加而減少。相似降雨總量下,由于白天時(shí)刻增加補(bǔ)水變量因素,模型在夜間的預(yù)測(cè)精度會(huì)優(yōu)于白天。
3.3.2 未降雨期的預(yù)測(cè)
在未降雨期,西湖水位沒有雨量因素干擾。白天的水位主要由補(bǔ)水量和排水量決定,夜間的水位主要由排水量決定。未降雨期的排水和補(bǔ)水量在一段時(shí)間基本保持恒定,水位波動(dòng)較小,理論上可視為線性變化。將測(cè)試集中降雨期數(shù)據(jù)剔除,計(jì)算未降雨期數(shù)據(jù)的誤差。
3.3.3 預(yù)測(cè)結(jié)果對(duì)比
為了方便比較模型在不同時(shí)期的預(yù)測(cè)精度,將各模型在不同時(shí)期的RMSE值以直方圖的形式顯示,如圖11所示。
由圖11可知,每個(gè)模型RMSE反映的預(yù)測(cè)精度按暴雨期、大雨期、中雨期順序依次遞增。這是由于暴雨期的水位波動(dòng)大,雨量導(dǎo)致水位增量大,而中雨期的水位相對(duì)來說趨勢(shì)較為平穩(wěn)。理論上未降雨時(shí)期的預(yù)測(cè)精度要高于小雨時(shí)期,但GRU在未降雨期的預(yù)測(cè)精度稍低于小雨期。主要原因是小雨期統(tǒng)計(jì)數(shù)據(jù)量相對(duì)較少,而未降雨時(shí)期統(tǒng)計(jì)數(shù)據(jù)量多,水位數(shù)據(jù)受到隨機(jī)因素干擾的概率也增大,在某時(shí)刻有異常因素干擾。
圖11 模型均方根誤差指標(biāo)直方圖Fig.11 Model root mean square error index histogram
在測(cè)試集的不同時(shí)期,GRU模型的評(píng)價(jià)指標(biāo)都優(yōu)于SVR模型。這反映了循環(huán)神經(jīng)網(wǎng)絡(luò)在水文時(shí)間序列領(lǐng)域預(yù)測(cè)的優(yōu)勢(shì);SVR預(yù)測(cè)性能不均衡,對(duì)測(cè)試集中偏線性部分(小雨期及未降雨期)預(yù)測(cè)精度較低。主要由于SVR沒有循環(huán)神經(jīng)網(wǎng)絡(luò)中記憶結(jié)構(gòu),雨量相關(guān)性減弱時(shí),無法根據(jù)歷史時(shí)刻水位變化來挖掘出補(bǔ)水和排水量的時(shí)序變化規(guī)律。
卷積神經(jīng)網(wǎng)絡(luò)能有效提取多變量特征,因而CNN-GRU應(yīng)用于多變量下的水位預(yù)測(cè)具備明顯的優(yōu)勢(shì)[12]。但GRU組件自帶的特征提取能力就足以應(yīng)對(duì)特征變量較少的情況,卷積組件對(duì)模型整體的預(yù)測(cè)精度提升有限,故整體預(yù)測(cè)效果低于GRU-SVR(多項(xiàng)式核)。
大多情況下,GRU-SVR(多項(xiàng)式核)的評(píng)價(jià)指標(biāo)都優(yōu)于其他核函數(shù)下的GRU-SVR模型。除了未降雨期的預(yù)測(cè)精度低于GRU及CNN-GRU模型,該模型在降雨時(shí)期都表現(xiàn)不錯(cuò),尤其在暴雨及大雨期具有最高的預(yù)測(cè)精度,這表明GRU-SVR(多項(xiàng)式核)比較適用于降雨時(shí)期的預(yù)測(cè)。GRU-SVR(多項(xiàng)式核)水位預(yù)測(cè)模型的優(yōu)勢(shì)在于:GRU組件有效地提取數(shù)據(jù)中的水位與雨量之間的時(shí)空特征,SVR增強(qiáng)了模型整體在降雨期非線性預(yù)測(cè)能力;但不難看出,由于SVR的權(quán)重影響,模型整體在未降雨期的預(yù)測(cè)能力有限。
即當(dāng)雨量輸入向量為零值,對(duì)測(cè)試集線性部分預(yù)測(cè)不敏感,導(dǎo)致了該組合模型在未降雨期的預(yù)測(cè)誤差稍大。
在實(shí)際情況中,應(yīng)盡可能選取足夠多的樣本數(shù)據(jù)來建立數(shù)據(jù)驅(qū)動(dòng)模型,但由于各種不可抗因素,往往無法獲取完整的水文時(shí)序數(shù)據(jù)。因此,需要考慮選用不同的訓(xùn)練數(shù)據(jù)集來分析模型的效果。
為了評(píng)價(jià)增加訓(xùn)練數(shù)據(jù)后各學(xué)習(xí)模型的水位預(yù)測(cè)性能是否有所改善,首先將數(shù)據(jù)集分為訓(xùn)練集(80%,20 016組實(shí)測(cè)值)和驗(yàn)證集(20%,5 040組實(shí)測(cè)值),與上述保持一致。并基于水文時(shí)間序列數(shù)據(jù)自身的特點(diǎn),利用了參數(shù)優(yōu)化好的GRU-SVR、CNN-GRU、GRU、SVR模型,設(shè)計(jì)了3種不同的方案對(duì)水位進(jìn)行預(yù)測(cè),如圖12(a)所示。模型參數(shù)保持不變,以1 h預(yù)測(cè)時(shí)長(zhǎng)為例,比較了3種訓(xùn)練集數(shù)據(jù)模式下的擬合效果。各模型的水位預(yù)測(cè)數(shù)據(jù)的均方根誤差如圖12(b)所示。
由圖12(b)可知,在訓(xùn)練過程中,所有的學(xué)習(xí)模型在增加訓(xùn)練數(shù)據(jù)后都表現(xiàn)出更好的預(yù)測(cè)性能。與用35%訓(xùn)練數(shù)據(jù)訓(xùn)練模型相比,輸入65%的典型雨季期的數(shù)據(jù)訓(xùn)練對(duì)模型預(yù)測(cè)性能提升程度最大。但在進(jìn)一步將訓(xùn)練數(shù)據(jù)從65%提高到100%時(shí),模型的預(yù)測(cè)性能提升非常有限。所以,在構(gòu)建數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測(cè)湖泊水位時(shí),為了模型的精度考慮,應(yīng)盡可能地選擇足夠長(zhǎng)的時(shí)間序列的數(shù)據(jù)。在缺乏足夠多的樣本數(shù)據(jù)支撐時(shí),選取典型及代表性的水文數(shù)據(jù),也可以達(dá)到較好的模型預(yù)測(cè)效果。
圖12 不同訓(xùn)練集下的模型預(yù)測(cè)性能Fig.12 Model prediction performance under different training sets
GRU-SVR(多項(xiàng)式核)的預(yù)測(cè)效果較好,在不同的訓(xùn)練方案下的評(píng)價(jià)指標(biāo)值優(yōu)于其余模型;對(duì)比同一方案下各個(gè)模型評(píng)價(jià)指標(biāo)間差異度,GRU-SVR(多項(xiàng)式核)在訓(xùn)練數(shù)據(jù)為35%時(shí)與其余模型差異度最大,這表明該組合模型在樣本量較小時(shí)具有顯著優(yōu)勢(shì)。
雨量越小與湖泊的水位相關(guān)性也就越小,洪澇災(zāi)害的發(fā)生大多是由于暴雨、大雨導(dǎo)致的。在實(shí)際應(yīng)用中,暴雨及大雨的水位預(yù)報(bào)提前期越早,防洪方法就越有效。因此探索了暴雨及大雨期下最佳預(yù)測(cè)長(zhǎng)度。各模型優(yōu)化參數(shù)保持不變,對(duì)比了各模型在不同預(yù)測(cè)長(zhǎng)度下的均方根誤差,如圖13所示。
由圖13(a)可知,隨著預(yù)測(cè)長(zhǎng)度的增加,模型預(yù)測(cè)誤差逐漸增加。大多情況下,GRU-SVR在暴雨期下的預(yù)測(cè)精度都要高于其余模型;與從10 min增加到30 min相比,預(yù)測(cè)長(zhǎng)度從30 min增加到1 h時(shí),各模型的RMSE值變化幅度越大,即預(yù)測(cè)誤差顯著增大。
由圖13(b)可知,GRU-SVR(RBF核)、GRU-SVR(Sigmoid核)預(yù)測(cè)效果較差,在大雨期時(shí),當(dāng)預(yù)測(cè)長(zhǎng)度從10 min增加到1 h時(shí),GRU-SVR(多項(xiàng)式核)模型RMSE值變化幅度最小,CNN-GRU與GRU模型相接近;此外,大雨期下誤差幅度隨預(yù)測(cè)長(zhǎng)度的變化規(guī)律基本與暴雨期基本一致。對(duì)數(shù)據(jù)總體綜合分析,各模型參數(shù)保持不變的情況下,GRU-SVR(多項(xiàng)式核)組合模型穩(wěn)定性好,模型的適用性強(qiáng),不同預(yù)測(cè)長(zhǎng)度下都能達(dá)到相對(duì)穩(wěn)定的預(yù)測(cè)效果。
圖13 預(yù)測(cè)長(zhǎng)度對(duì)模型預(yù)測(cè)精度影響Fig.13 The Influence of prediction time on model prediction accuracy
為改善傳統(tǒng)RNN的梯度消失問題以及探索GRU組合模型在水文時(shí)序的預(yù)測(cè)效果,首次嘗試將GRU-SVR組合模型應(yīng)用于湖泊水位預(yù)測(cè)方面并分析其適用性,在實(shí)際應(yīng)用中有參考價(jià)值。
(1)核函數(shù)參數(shù)與組合模型的預(yù)測(cè)精度相關(guān)性較大,GRU-SVR(多項(xiàng)式核)的整體預(yù)測(cè)精度較GRU-SVR(RBF核)、GRU-SVR(Sigmoid核)分別提高了64.3%、51.3%。
(2)GRU組件可以改進(jìn)SVR模型無法反映長(zhǎng)短期時(shí)序規(guī)律的缺點(diǎn),對(duì)信息有效篩選,一定程度提高了預(yù)測(cè)準(zhǔn)確率。以預(yù)測(cè)長(zhǎng)度為1 h為例,與傳統(tǒng)的CNN-GRU及GRU、SVR模型相比,GRU-SVR(多項(xiàng)式核)在降雨不同時(shí)期的評(píng)價(jià)指標(biāo)均有不同程度的改進(jìn);且數(shù)據(jù)整體預(yù)測(cè)精度分別提升了3.2%、10.3%和59.3%。
(3)在缺乏足夠多的樣本數(shù)據(jù)支撐時(shí),選取典型及代表性的水文數(shù)據(jù),也可以達(dá)到較好的模型預(yù)測(cè)效果。且模型預(yù)測(cè)湖泊的暴雨和大雨期水位時(shí),表現(xiàn)出預(yù)測(cè)時(shí)長(zhǎng)越小,評(píng)價(jià)指標(biāo)越優(yōu)的趨勢(shì);相同預(yù)測(cè)時(shí)長(zhǎng)下,隨著隨雨量等級(jí)的增加,預(yù)測(cè)性能逐漸下降。在實(shí)際應(yīng)用中,綜合考慮精度和提前期的要求宜選擇30 min的預(yù)測(cè)長(zhǎng)度。