王 超,李學(xué)輝,楊紹瓊,雷 旭,吳子怡,謝 平
(1.云南省水文水資源局,云南昆明650106;2.昆明市水文水資源局,云南昆明650103;3.武漢大學(xué),湖北武漢430071)
隨著經(jīng)濟(jì)社會(huì)的快速發(fā)展,對(duì)水庫(kù)群的調(diào)度運(yùn)行提出了越來(lái)越高的要求,中長(zhǎng)期水文預(yù)報(bào)是進(jìn)行水庫(kù)調(diào)度的重要基礎(chǔ),在水資源的宏觀(guān)調(diào)控、防汛抗旱等方面亦發(fā)揮著重要的參考作用。徑流的中長(zhǎng)期變化受太陽(yáng)黑子活動(dòng)、大氣環(huán)流、自然地理、流域特性等諸多因素的綜合影響,具有影響因子復(fù)雜、隨機(jī)性極強(qiáng)的特點(diǎn),模糊性、灰色性等多種不確定的屬性,是一個(gè)復(fù)雜的高度非線(xiàn)性系統(tǒng)。中長(zhǎng)期水文預(yù)報(bào)相對(duì)于短期水文預(yù)報(bào)來(lái)說(shuō),由于影響因子復(fù)雜,學(xué)術(shù)界尚未形成成熟可靠系統(tǒng)的預(yù)報(bào)方法,研究工作滯后于生產(chǎn)實(shí)際的要求。
現(xiàn)有徑流的中長(zhǎng)期預(yù)報(bào)理論,多從水文系列的統(tǒng)計(jì)相關(guān)特性著手研究,而對(duì)其物理成因研究尚在探索中;中長(zhǎng)期水文預(yù)報(bào)模型眾多,但缺乏一種普適型的模型滿(mǎn)足不同地區(qū)和不同水文序列,不同的模型其適用性大相徑庭。從預(yù)報(bào)方法看,較為傳統(tǒng)的有多元回歸分析、逐步回歸分析、自回歸模型、灰色模型等方法,近年來(lái)很多學(xué)者就人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)最小二乘法、遺傳規(guī)劃、季節(jié)性水平模型等方法也進(jìn)行了很多研究。其中,支持向量機(jī)最小二乘法(LSSVM)具有收斂速度高、非線(xiàn)性擬合能力強(qiáng)的特點(diǎn)[1-5];季節(jié)性水平模型對(duì)徑流序列進(jìn)行中長(zhǎng)期預(yù)測(cè)也具有一定的精度[6- 8]。因此本文運(yùn)用支持向量機(jī)最小二乘法模型對(duì)瀾滄江月徑流序列進(jìn)行預(yù)測(cè),并與季節(jié)性水平模型預(yù)測(cè)結(jié)果進(jìn)行比較,以探討兩種模型在瀾滄江月徑流預(yù)報(bào)上的適應(yīng)性。
Suykens等學(xué)者于1999年提出最小二乘支持向量機(jī),是以標(biāo)準(zhǔn)SVM的為基礎(chǔ)一種改進(jìn)算法,它不僅具有支持向量機(jī)泛化能力強(qiáng)、全局最優(yōu)等優(yōu)點(diǎn),而且采用等式約束代替標(biāo)準(zhǔn)SVM的不等式約束,把向量機(jī)的二次規(guī)劃問(wèn)題轉(zhuǎn)化為線(xiàn)性方程組問(wèn)題,抗干擾能力明顯提高,計(jì)算求解速度快,降低了計(jì)算求解的復(fù)雜程度[9-14]。
設(shè)訓(xùn)練集樣本T={(xk,yk)|k=1,2,3…,n}xk∈Rn,yk∈R,xk是輸入值,yk是輸出值。構(gòu)造的最優(yōu)決策函數(shù)為
f(x)=ωTφ(x)+b
(1)
式中,ω為權(quán)向量;b為偏置量。
按照結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原理,將最優(yōu)化問(wèn)題轉(zhuǎn)換為尋求最小目標(biāo)函數(shù)f(x)
(2)
式中,γ為懲罰系數(shù),表示對(duì)超出誤差e的試驗(yàn)樣本的懲罰權(quán)重,γ為可調(diào)參數(shù);φ(x)為核空間映射函數(shù);j(ω,e,b)為損失函數(shù)。
為推求ω和e,采用拉格朗日乘子法來(lái)求解這個(gè)二次規(guī)劃問(wèn)題,函數(shù)的定義:
(3)
式中,ai≥0(i=1,2,…,M)為拉格朗日乘子。
利用KK最優(yōu)化條件對(duì)上式進(jìn)行優(yōu)化可得
(4)
整理可得到以下線(xiàn)性方程:
(5)
z=[φ(x1)T;…,φ(xn)T],y=[y1;…;yn],1v=[1;…;1],α=[α1;…;αn]
令Ω=ZZT+γ-1I則a和b的表達(dá)式為:
a=(y-b1v)Ω-1
(6)
(7)
映射函數(shù)φ(x)與核函數(shù)K(,)存在著以下關(guān)系:
K(xi,xj)=φ(xi)Tφ(xj)
(8)
則最小二乘支持向量機(jī)的擬合函數(shù)可表示為:
(9)
核函數(shù)的參數(shù)選擇影響著模型的精度,核函數(shù)的參數(shù)越多對(duì)模型預(yù)測(cè)的精度以及預(yù)測(cè)的速度越不利,本文選取高斯徑向基核函數(shù),表達(dá)式為:
(10)
式中,η應(yīng)為核參數(shù)。
如果一個(gè)時(shí)間序列具有明顯的季節(jié)性變化,而且各季節(jié)不同周期平均值相對(duì)穩(wěn)定,則具備季節(jié)性水平模型的特點(diǎn),適用季節(jié)性水平模型開(kāi)展預(yù)測(cè)。模型中時(shí)段T的期望值為
μT=μρT
(11)
μ為各時(shí)段平均水平,ρΤ為時(shí)段T的季節(jié)比,季節(jié)比總是大于或等于零,平均值在同一個(gè)周期內(nèi)是1。且滿(mǎn)足
(12)
式中,M為一個(gè)周期劃分的時(shí)段數(shù)。
首先利用歷史時(shí)間序列對(duì)μ和ρΤ估計(jì)值進(jìn)行推求,即可進(jìn)一步推求出未來(lái)時(shí)段的預(yù)測(cè)值[15]。
為建立模型必須擁有至少兩個(gè)全周期的時(shí)間序列資料,時(shí)間序列個(gè)數(shù)的數(shù)目T必須是M的倍數(shù)。N表示歷史資料數(shù)據(jù)所包含的周期數(shù),即N=T/M。T個(gè)時(shí)間序列按周期劃分成N組,如下:
x1,x2,Λ,xM第一周期數(shù)據(jù)
xM+1,xM+2,Λ,x2M第二周期數(shù)據(jù)
…
x(N-1)M+1,x(N-1)M+2,Λ,xNM第N周期數(shù)據(jù)
根據(jù)上列數(shù)據(jù)得到M+1個(gè)估值如下:
(1)求各個(gè)周期的平均值
(13)
(2)求第t時(shí)段的季節(jié)比
(14)
(3)求各周期內(nèi)每個(gè)時(shí)段的平均季節(jié)比
(15)
(4)對(duì)每一周期內(nèi)的季節(jié)比進(jìn)行規(guī)范化處理,使其平均值等于1。
(5)按照文獻(xiàn)[15]相關(guān)步驟求出預(yù)測(cè)值。
根據(jù)水文情報(bào)預(yù)報(bào)規(guī)范,選取以下四個(gè)指標(biāo)對(duì)模型精度進(jìn)行評(píng)價(jià):
(1)納什模型效率系數(shù)
(16)
(2)水量平衡系數(shù)
(17)
(3)年均最大徑流的相對(duì)誤差
(18)
(4)年均最小徑流的相對(duì)誤差
(19)
式中,n為徑流序列的長(zhǎng)度,l為年份數(shù);Qpt和Qot分別為t時(shí)刻的預(yù)測(cè)值和實(shí)測(cè)值;Qo是實(shí)測(cè)徑流均值;Qpj,max和Qoj,max分別為第j年最大徑流的預(yù)測(cè)值和實(shí)測(cè)值;Qpj,min和Qoj,min分別表示第j年最小徑流的預(yù)測(cè)值和觀(guān)測(cè)值。NS和WB越接近于1,表示模型效果越好;REmax和REmin越接近于0,表示模型對(duì)極大值和極小值模擬預(yù)測(cè)能力越好。
溜筒江水文站是瀾滄江進(jìn)入云南的第一個(gè)水文站,開(kāi)展月徑流預(yù)測(cè)工作對(duì)下游的各梯級(jí)電站及各水利工程運(yùn)行具有較為重要的參考作用。以該站1956年~1994年的實(shí)測(cè)月徑流用于建模,并以1995年—1999年的實(shí)測(cè)月徑流作為校驗(yàn)。經(jīng)過(guò)對(duì)實(shí)測(cè)數(shù)據(jù)標(biāo)準(zhǔn)化處理后,運(yùn)用兩個(gè)模型分別進(jìn)行訓(xùn)練和預(yù)報(bào),逐月成果數(shù)據(jù)過(guò)多,此處以年為單位對(duì)誤差進(jìn)行統(tǒng)計(jì)分析,訓(xùn)練期和預(yù)測(cè)應(yīng)用期的模擬預(yù)測(cè)誤差見(jiàn)表1和表2,成果見(jiàn)圖1~2。
圖1 訓(xùn)練期模擬結(jié)果對(duì)比
圖2 預(yù)測(cè)應(yīng)用期預(yù)測(cè)結(jié)果對(duì)比
LS-SVM模型在1956年~1994年共468個(gè)月的訓(xùn)練期內(nèi)的平均誤差為±19.4%,變動(dòng)范圍在±8.7%~±35.4%之間;最大徑流誤差平均為±22.3%,變動(dòng)范圍在±1.5%~±48.6%之間;最小徑流誤差平均為±8.8%,變動(dòng)范圍在±0.4%~±22.6%之間;汛期整體誤差較枯期稍大。
表1 訓(xùn)練期模型的模擬誤差
在1995年~1999年共60個(gè)月的預(yù)測(cè)應(yīng)用期,Ls-SVM模型平均誤差為±17.9%,好于訓(xùn)練期,變動(dòng)范圍在±14.0%~±25.0%之間;最大徑流誤差平均為±9.5%,也好于訓(xùn)練期,變動(dòng)范圍在±2.3%~±25.7%之間;最小徑流誤差平均為±9.6%,與訓(xùn)練期相當(dāng),變動(dòng)范圍在±0.5%~±16.4%之間。
表2 預(yù)測(cè)應(yīng)用期模型的預(yù)測(cè)誤差
季節(jié)性水平模型在訓(xùn)練期內(nèi)的平均誤差為±12.5%,變動(dòng)范圍在±7.2%~±16.2%之間;最大徑流誤差平均為±16.4%,變動(dòng)范圍在±1.4%~±38.4%之間;最小徑流誤差平均為±5.8%,變動(dòng)范圍在±0.5%~±17.4%之間;汛期整體誤差較枯期也同樣稍大。
在預(yù)測(cè)應(yīng)用期內(nèi),季節(jié)性水平模型平均誤差為±19.1%,略低于訓(xùn)練期,變動(dòng)范圍在±13.4%~±30.9%之間;最大徑流誤差平均為±13.3%,與訓(xùn)練期相當(dāng),變動(dòng)范圍在±0.7%~±34.6%之間;最小徑流誤差平均為±15.6%,誤差比訓(xùn)練期稍大,變動(dòng)范圍在±2.0%~±28.3%之間。
訓(xùn)練期和預(yù)測(cè)應(yīng)用期的預(yù)測(cè)成果對(duì)比評(píng)價(jià)見(jiàn)表3。
表3 訓(xùn)練期和預(yù)測(cè)應(yīng)用期模型的模擬結(jié)果對(duì)比
根據(jù)表3分析,在訓(xùn)練期,季節(jié)性水平模型效率系數(shù)為90%,水量平衡系數(shù)為100%,年均最大和最小徑流相對(duì)誤差分別為16%和6%。LS-SVM模型效率系數(shù)為80%,水量平衡系數(shù)為100%,年均最大和最小徑流相對(duì)誤差分別為22%和9%。二者模擬效果均較好,季節(jié)性水平模型效率系數(shù)略高,年均最大和最小徑流相對(duì)誤差也略小,但總體差別不大。
在預(yù)測(cè)應(yīng)用期,季節(jié)性水平模型效率系數(shù)為85%,水量平衡系數(shù)為99%,年均最大和最小徑流相對(duì)誤差分別為13%和16%。LS-SVM模型效率系數(shù)為88%,水量平衡系數(shù)為97%,年均最大和最小徑流相對(duì)誤差均為10%。季節(jié)性水平模型效率系數(shù)略高,而LS-SVM模型年均最大和最小徑流相對(duì)誤差更小,精度更高。
從圖1~2可以直觀(guān)地看出,季節(jié)性水平模型和LSSVM模型預(yù)測(cè)值與實(shí)測(cè)值的總體趨勢(shì)一致,擬合過(guò)程符合性較好。預(yù)測(cè)應(yīng)用期除1998年汛期的預(yù)測(cè)值與實(shí)測(cè)值偏差較大外,其他年份整體預(yù)測(cè)值與實(shí)測(cè)值符合性極高,對(duì)應(yīng)性好,模型預(yù)測(cè)結(jié)果較好。
根據(jù)瀾滄江域溜筒江水文站1956年~1999年的實(shí)測(cè)月徑流資料,運(yùn)用季節(jié)性水平模型和LS-SVM模型,對(duì)徑流序列進(jìn)行模擬和預(yù)測(cè)。經(jīng)比較得到以下結(jié)論:
(1)在訓(xùn)練期,季節(jié)性水平模型與LS-SVM模型二者模擬效果均較好,季節(jié)性水平模型效率系數(shù)略高,年均最大和最小徑流相對(duì)誤差也略小,但總體差別不大。
(2)在預(yù)測(cè)應(yīng)用期,季節(jié)性水平模型與LS-SVM模型二者模擬效果均較好,季節(jié)性水平模型效率系數(shù)略高,但LS-SVM模型年均最大和最小徑流相對(duì)誤差更小,精度更高。
(3)季節(jié)性水平模型與LS-SVM模型二者模擬效果均較好,均可滿(mǎn)足瀾滄江水庫(kù)群調(diào)度的的需要,LS-SVM模型效果更佳。
參考文獻(xiàn):
[1] 巴歡歡, 郭生練, 鐘逸軒, 等. SSA-LSSVM在中長(zhǎng)期徑流預(yù)測(cè)中的應(yīng)用研究[J]. 水資源研究, 2016, 5(5): 423- 433.
[2] WANG Yun, GUO Shenglian, CHEN Hua, H, et al. Comparative study of monthly inflow prediction methods for the Three Gorges Reservoir[J]. Stochastic Environmental Research & Risk Assessment, 2014, 28(3): 555- 570.
[3] 周軼成, 焦國(guó)軍. 基于最小二乘支持向量機(jī)的馬營(yíng)河中長(zhǎng)期徑流預(yù)測(cè)研究[J]. 甘肅水利水電技術(shù), 2014, 50(12): 1- 3.
[4] 劉冀, 王本德, 袁晶瑄, 等. 基于相空間重構(gòu)的支持向量機(jī)方法在徑流中長(zhǎng)期預(yù)報(bào)中應(yīng)用[J]. 大連理工大學(xué)學(xué)報(bào), 2008, 48(4): 591- 595.
[5] 張衛(wèi)國(guó), 鐘平安, 張玉蘭, 等. 季節(jié)性支持向量機(jī)中長(zhǎng)期徑流預(yù)報(bào)模型[J]. 水力發(fā)電, 2014, 40(4): 17- 21.
[6] 孫傳文, 鐘平安, 萬(wàn)新宇, 等. 考慮季節(jié)因子的支持向量機(jī)徑流預(yù)測(cè)模型[J]. 中國(guó)農(nóng)村水利水電, 2014(4): 101- 104.
[7] 張瀟, 夏自強(qiáng), 黃峰, 等. 基于SSA-ARIM模型的青弋江干流徑流預(yù)測(cè)[J]. 中國(guó)農(nóng)村水利水電, 2015(3): 6- 9.
[8] 李佳, 王黎, 馬光文, 等. LS-SVM在徑流預(yù)測(cè)中的應(yīng)用[J]. 中國(guó)農(nóng)村水利水電, 2008(5): 8- 10.
[9] 崔東文. 多隱層BP神經(jīng)網(wǎng)絡(luò)模型在徑流預(yù)測(cè)中的應(yīng)用[J]. 水文, 2013, 33(1): 68- 73.
[10] WU C L, CHUN K W. Rainfall-runoff modeling using artificial neural network coupled with singular spectrum analysis[J]. Journal of Hydrology, 2011, 399(3- 4): 394- 409.
[11] 汪蕓, 郭生練, 李響. 奇異譜分析在中長(zhǎng)期徑流預(yù)測(cè)中的應(yīng)用研究[J]. 人民長(zhǎng)江, 2011, 42(9): 4- 7.
[12] SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293- 300.
[13] 邵駿, 袁鵬, 張文江, 等. 基于貝葉斯框架的LS-SVM中長(zhǎng)期徑流預(yù)報(bào)模型研究[J]. 水力發(fā)電學(xué)報(bào), 2010, 29(5): 178- 182.
[14] 林劍藝, 程春田. 支持向量機(jī)在中長(zhǎng)期徑流預(yù)報(bào)中的應(yīng)用[J]. 水利學(xué)報(bào), 2006, 37(6): 681- 686.
[15] 趙國(guó)杰, 張光錦, 趙新波,等. 基于季節(jié)性水平模型的中長(zhǎng)期徑流預(yù)測(cè)[J]. 海河水利, 2007(5): 37- 40.
[16] 蘇歡, 董曉華, 方燕琴. SWAT在淮河上游地區(qū)徑流模擬中的應(yīng)用研究[J]. 人民長(zhǎng)江, 2016, 47(8): 18- 28.