姬戰(zhàn)生,章國(guó)穩(wěn),黃 薇
(1.杭州市水文水資源監(jiān)測(cè)中心,浙江 杭州 310016;2.杭州電子科技大學(xué)自動(dòng)化學(xué)院,浙江 杭州 310018)
東苕溪位于浙江省東北部,發(fā)源于浙江省暴雨中心之一的天目山區(qū),下游為杭嘉湖平原河網(wǎng)區(qū),與太湖相連接,是典型的山溪——平原混合性河流。流域坡陡流急,一旦發(fā)生強(qiáng)降雨,洪水迅速?gòu)纳絽^(qū)流入平原河道造成水位暴漲,加之下游河道泄流不暢,洪水直接威脅杭嘉湖平原,極易形成較大的防洪壓力[1]。
東苕溪全流域降雨時(shí),既有區(qū)間降雨形成的洪水,又受上游3座大中型水庫(kù)放水影響和下游平原區(qū)洪水頂托,同時(shí)受蓄滯洪區(qū)和德清大閘分洪影響,影響要素多,工況多變,洪水過程復(fù)雜,常規(guī)水文預(yù)報(bào)方法難以適用,因此東苕溪洪水預(yù)報(bào)一直是浙江省水文預(yù)報(bào)的難點(diǎn)和痛點(diǎn)。目前較為精準(zhǔn)的預(yù)報(bào)以人工經(jīng)驗(yàn)預(yù)報(bào)為主,通過分析歷史資料建立模型進(jìn)行洪水預(yù)報(bào),但無法充分考慮河道變化、人類活動(dòng)等因素對(duì)水位的影響,存在預(yù)報(bào)精度不高、預(yù)見期短等問題。
隨著計(jì)算機(jī)等新一代技術(shù)的迅速發(fā)展,人工智能算法在洪水預(yù)報(bào)中得到進(jìn)一步的研究和推廣,尤其是以支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)為代表的學(xué)習(xí)算法已日趨成熟,在河道水位預(yù)報(bào)中得到越來越多的應(yīng)用[2-5]。支持向量機(jī)算法的復(fù)雜程度取決于樣本個(gè)數(shù),樣本越多算法越復(fù)雜,計(jì)算速度越慢。最小二乘支持向量機(jī)(LS-SVM)是支持向量機(jī)的改進(jìn)形式,采用等式約束代替SVM中的不等式約束,不僅降低模型的復(fù)雜程度,而且提高了計(jì)算效率[6]。因此,本文以東苕溪瓶窯水文站為例,嘗試將LS-SVM算法應(yīng)用于瓶窯站洪水預(yù)報(bào)中,并對(duì)預(yù)報(bào)成果進(jìn)行精度評(píng)定,以驗(yàn)證本文所提方法的有效性。
東苕溪屬太湖流域,其干流發(fā)源于天目山南麓,流經(jīng)臨安、瓶窯、德清等地,至湖州西門杭長(zhǎng)橋與西苕溪匯合流入太湖。流域總面積約為2 267 km2,干流長(zhǎng)151 km,瓶窯以上流域面積約1 420 km2。流域氣候?qū)儆趤啛釒Ъ撅L(fēng)氣候,濕潤(rùn)多雨,降雨集中在汛期。流域內(nèi)主要水利工程分“上蓄、中滯、下泄”:“上蓄”工程包括青山、里畈、水濤莊、四嶺4座大中型水庫(kù),“中滯”工程包括南湖、北湖滯洪區(qū)和永建等非常滯洪區(qū),“下泄”工程主要是導(dǎo)流港。流域內(nèi)主要河道和水利工程分布見圖1。
圖1 東苕溪流域內(nèi)主要河道和水利工程分布圖
支持向量機(jī)影響因素的選擇是否準(zhǔn)確很大程度決定了模型預(yù)測(cè)精度。本文根據(jù)東苕溪控制站瓶窯站的洪水特性,分析出4種影響水位的主要因素:
(1)起漲水位:即預(yù)測(cè)站點(diǎn)在預(yù)測(cè)時(shí)刻的水位。
(2)區(qū)間降水量:降水是引起河道水位變化的一個(gè)關(guān)鍵因素。
(3)上游水庫(kù)放水量:瓶窯站上游有3座大中型水庫(kù),水庫(kù)放水量對(duì)瓶窯站水位變化影響較大。
(4)下游水位:預(yù)測(cè)站點(diǎn)下游的德清大閘水位,能體現(xiàn)下游河道對(duì)預(yù)測(cè)站點(diǎn)的頂托作用。
采用瓶窯起漲水位、區(qū)間降水量、上游水庫(kù)放水量以及德清大閘水位建立特征向量X(n):
式中:Z1(n)為n時(shí)刻瓶窯水位,m;Z2(n)為n時(shí)刻德清水位,m;Q(n)為n時(shí)刻上游水庫(kù)放水量,m3/s;R(n)為n時(shí)刻區(qū)間降水量,mm。
不同的特征量往往具有不同的數(shù)量級(jí),而特征量的數(shù)量級(jí)的差異會(huì)對(duì)模型優(yōu)化帶來不利影響,常用做法是對(duì)所有特征量進(jìn)行歸一化使其處于同一數(shù)量級(jí),本文采用的歸一化方法如下:
式中:x′為歸一化水位數(shù)據(jù),m;x為預(yù)處理前數(shù)據(jù),m;xmax、xmin分別為訓(xùn)練集各特征量的最大值與最小值,m。
最小二乘支持向量回歸機(jī)是支持向量機(jī)理論和最小二乘結(jié)合得到的算法,首先將樣本從原始空間映射到高維線性空間,接著使用傳統(tǒng)最小二乘理論實(shí)現(xiàn)線性回歸,從而實(shí)現(xiàn)非線性回歸。
假設(shè)訓(xùn)練樣本為{xi,yi},i=1,...,n,通過核函數(shù)Φ將樣本映射到一個(gè)高維空間并建立線性回歸模型:
式中:f(x,w)為估計(jì)函數(shù);w為權(quán)重;b為閾值。
支持向量回歸機(jī)的擬合精度可以由損失函數(shù)ε來表示。實(shí)際數(shù)據(jù)往往無法實(shí)現(xiàn)精確擬合,因此引入松弛因子ξi、。式(3)可以轉(zhuǎn)換為尋求最優(yōu)回歸超平面:
相應(yīng)的約束條件為:
式中:C(C>0)為懲罰系數(shù),表示控制訓(xùn)練誤差的代價(jià)。式(4)的優(yōu)化問題可以通過引入拉格朗日函數(shù)轉(zhuǎn)化為對(duì)偶問題得到最優(yōu)解為:
根據(jù)Mercer核定理,核函數(shù)為K(x,y)=Φ(x) ·Φ(y),式(4)變?yōu)椋?/p>
式(7)為最小二乘支持向量回歸機(jī)的回歸函數(shù)。其中ai、和b可以通過約束條件求得,具體如下:
最小二乘支持向量回歸機(jī)便是基于以上原理建立預(yù)測(cè)模型。在支持向量機(jī)建模過程中,核函數(shù)和損失函數(shù)參數(shù)ε的選擇往往對(duì)模型預(yù)測(cè)精度有較大影響。常見的核函數(shù)有:RBF、線性、多項(xiàng)式及Sigmoid;而在實(shí)際應(yīng)用中損失函數(shù)參數(shù)ε一般在0.000 1~0.100 0選取。ε越大則擬合誤差越大,支持向量越少;反之,擬合精度越高,但有可能會(huì)出現(xiàn)過擬合問題,影響模型泛化能力。
本文以瓶窯站洪水水位過程為預(yù)報(bào)對(duì)象,以起漲水位、區(qū)間降水量、上游水庫(kù)放水量及下游水位為影響因素,選取東苕溪2007——2020年15場(chǎng)典型洪水過程中瓶窯站漲水段(北湖分洪的場(chǎng)次洪水,選取北湖分洪前的漲水段)對(duì)應(yīng)的水文數(shù)據(jù)作為樣本,構(gòu)建LS-SVM洪水預(yù)報(bào)模型。
將所有樣本劃分為訓(xùn)練樣本和預(yù)測(cè)樣本。本文以2007——2018年中的12場(chǎng)洪水?dāng)?shù)據(jù)作為訓(xùn)練樣本,用于模型構(gòu)建;以2019——2020年的3場(chǎng)洪水?dāng)?shù)據(jù)為預(yù)測(cè)樣本,用于檢驗(yàn)?zāi)P偷念A(yù)測(cè)精度。
對(duì)比采用不同核函數(shù)類型和損失函數(shù)參數(shù)ε時(shí)瓶窯水位預(yù)報(bào)結(jié)果,發(fā)現(xiàn)核函數(shù)選擇線性函數(shù)、損失函數(shù)參數(shù)ε取0.010 0時(shí)模型具有較好的預(yù)測(cè)結(jié)果。據(jù)此對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練建模,得到最終的LS-SVM洪水水位過程預(yù)報(bào)模型,并對(duì)預(yù)測(cè)樣本進(jìn)行預(yù)報(bào)(預(yù)見期取6 h)。訓(xùn)練和預(yù)測(cè)所得結(jié)果與瓶窯站實(shí)測(cè)水位過程對(duì)比見圖2~3,各場(chǎng)次洪水的預(yù)測(cè)精度評(píng)定結(jié)果見表1。
表1 精度評(píng)價(jià)表
續(xù)表1
圖2 LS-SVM模型對(duì)訓(xùn)練樣本的擬合結(jié)果圖
圖3 LS-SVM模型對(duì)預(yù)測(cè)樣本的擬合結(jié)果圖
從圖2和圖3可以看出,本文構(gòu)建的模型對(duì)訓(xùn)練樣本和預(yù)測(cè)樣本均擬合較好,預(yù)報(bào)結(jié)果較為準(zhǔn)確。表1計(jì)算結(jié)果表明:率定期的洪峰水位絕對(duì)誤差均值為0.23 m,洪峰水位相對(duì)誤差均值為3.61%,確定性系數(shù)均值為0.92,預(yù)報(bào)精度達(dá)到甲級(jí),預(yù)報(bào)合格率為100.00%,預(yù)報(bào)精度為甲級(jí);驗(yàn)證期內(nèi)洪峰水位絕對(duì)誤差均值為0.26 m,洪峰水位相對(duì)誤差均值為4.25%,確定性系數(shù)均值為0.95,預(yù)報(bào)精度達(dá)到甲級(jí),預(yù)報(bào)合格率為100.00%,預(yù)報(bào)精度為甲級(jí)。總體來看,LS-SVM模型在率定期和驗(yàn)證期內(nèi)的預(yù)報(bào)精度都很高,均達(dá)到甲級(jí)精度,說明模型的泛化能力較好,符合支持向量回歸機(jī)適用于小樣本、具有較好“魯棒性”的特點(diǎn)。
東苕溪是典型的山區(qū)——平原混合性河流,坡陡流急,常規(guī)水文預(yù)報(bào)方法難以適用。本文構(gòu)建一種基于LS-SVM的洪水預(yù)報(bào)模型,并對(duì)瓶窯站2007——2020年15場(chǎng)典型洪水過程漲水段進(jìn)行模型訓(xùn)練和預(yù)測(cè),結(jié)果表明預(yù)報(bào)精度能達(dá)到甲級(jí),具有較好的預(yù)報(bào)效果,可為東苕溪流域防洪決策提供參考。