李 俊,武鵬林(太原理工大學(xué)水利科學(xué)與工程學(xué)院,太原 030024)
在汛期分期的基礎(chǔ)上,制定各分期的汛限水位,以制定汛期內(nèi)各個(gè)時(shí)期調(diào)度方案,使水庫(kù)汛后的蓄滿率得到提升,是實(shí)現(xiàn)洪水資源化的重要手段,更可以進(jìn)一步使防洪與興利相結(jié)合,增加水庫(kù)的效益。
傳統(tǒng)的汛期分期方法有數(shù)理統(tǒng)計(jì)法,模糊集合分析法等[1],他們具有考慮因素單一、主觀性強(qiáng)的缺點(diǎn),而Fisher最優(yōu)分割法在綜合考慮多個(gè)因子的作用的同時(shí)又能保持樣本的時(shí)序性,并能夠確定最優(yōu)分類數(shù)目[2],因此Fisher相對(duì)傳統(tǒng)方法具有一定的優(yōu)越性??紤]到各指標(biāo)對(duì)樣本的重要程度不同,把各個(gè)指標(biāo)的權(quán)重通過(guò)主成分分析法計(jì)算出來(lái),改進(jìn)Fisher最優(yōu)分割法,使其能夠更加合理地考慮汛期分期的各個(gè)影響因子的重要程度,從而獲得一個(gè)更加符合實(shí)際的分期結(jié)果。以吳城水庫(kù)為例,本文使用該改進(jìn)的方法對(duì)吳城水庫(kù)汛期進(jìn)行劃分,并與模糊集合分析法[3]進(jìn)行比較。
由于汛期分期是多指標(biāo)的有序聚類分析,而各指標(biāo)對(duì)樣本分類的重要程度不同,因此首先采用主成分分析法計(jì)算各指標(biāo)權(quán)重。
構(gòu)造樣本陣X:
式中:xij為第i個(gè)樣本中第j個(gè)指標(biāo)的值。
對(duì)樣本陣X做標(biāo)準(zhǔn)化,變?yōu)闃?biāo)準(zhǔn)化陣Y:
由于汛期分期中各指標(biāo)特征值為適度指標(biāo),因此采用下式對(duì)樣本陣X進(jìn)行標(biāo)準(zhǔn)化[4]:
(1)
標(biāo)準(zhǔn)矩陣Y的相關(guān)系數(shù)矩陣的計(jì)算:
(2)
主成分Fi的貢獻(xiàn)率為:
(3)
累計(jì)貢獻(xiàn)率為:
(4)
當(dāng)λk對(duì)應(yīng)的累計(jì)貢獻(xiàn)率大于或等于85%時(shí),則其有k(k≤m)個(gè)與λ1,λ2,…,λk對(duì)應(yīng)的主成分。
主成分載荷反映主成分Fi和各指標(biāo)之間的相關(guān)程度,各指標(biāo)在各主成分Fi(i=1,2,…,k)上的載荷lij為:
(5)
通過(guò)(5)式得到lij,接著通過(guò)(6)式得到各主成分的線性模型:
Fi=e1iX1+e2iX2+…+emiXm(i=1,2,…,k)
(6)
這樣,綜合得分模型為[5]:
其中,ai反映了各指標(biāo)變量在主成分中的綜合重要度。
由此,得各指標(biāo)變量的權(quán)重為:
(8)
Fisher最優(yōu)分割法作為對(duì)有序時(shí)間樣本序列進(jìn)行聚類劃分的方法,其分期依據(jù)是使樣本總離差平方和最小,并以類內(nèi)部差異最小,類間差異最大為原則。汛期分期屬于聚類分析,而聚類分析又分為有序樣本聚類分析與非有序樣本聚類分析,F(xiàn)isher最優(yōu)分割法作為有序樣本的聚類方法,其最優(yōu)解是使分成各組總的離差平方和最小,而所有可能的分類中都保持了樣本的時(shí)間連續(xù)性(換而言之,如果有一種分類破壞了樣本的時(shí)間連續(xù)性,即使其總的離差平方和再小,這些組合在Fisher分割法中也是不予以考慮的),正是這種特性使得Fisher最優(yōu)分割法能夠保持樣本的時(shí)間連續(xù)性。
在有序樣本{X1,X2,…,Xn}中,每一個(gè)樣本都對(duì)應(yīng)m項(xiàng)指標(biāo),則可得以下矩陣X(xij為第i個(gè)樣本的第j項(xiàng)指標(biāo)的指標(biāo)值):
為了消除物理尺寸的影響,對(duì)數(shù)據(jù)進(jìn)行以下轉(zhuǎn)化:
(9)
式中:x′ij為標(biāo)準(zhǔn)化后的數(shù)量值;xmax,,j為第j列的最大值。
同時(shí)根據(jù)各個(gè)指標(biāo)的權(quán)重,加權(quán)平均后得到向量Y,并以Y為基礎(chǔ)數(shù)據(jù)進(jìn)行汛期分期,Y可由下式求得:
(10)
(11)
設(shè)D(i,j)表示Q的直徑,則可以通過(guò)下式計(jì)算出D(i,j):
(12)
設(shè)將n個(gè)有序時(shí)間數(shù)據(jù)分為k類,則定義I(n,k)為其中一種分法,其可由下式進(jìn)行計(jì)算:
(13)
根據(jù)Fisher分割法的劃分原則,可得出當(dāng)I(n,k)最小時(shí)對(duì)應(yīng)的分法可以滿足Fisher的劃分原則,所以可以通過(guò)下式定義目標(biāo)函數(shù):
I*(n,k)=minI(n,k)
(14)
有以下定理:有序時(shí)間數(shù)據(jù)樣本的最優(yōu)k類分割,必須由最佳的k-1類分割在其某一個(gè)截尾子部分添加一個(gè)類組成。
遞推公式表達(dá)為:
k=2時(shí),
(15)
k>2時(shí),
(16)
如果要把有序時(shí)間序列分成k類,先找出分割點(diǎn)ik,使得由遞推公式計(jì)算出的I*(n,k)最小,則{yik,yik+1,…,yn}為第k類,然后再找分割點(diǎn)ik-1,使得I*(ik-1,k-1)最小,則同樣可得第k-1類,即{yik-1,yik-1+1,…,yik-1},依照同樣的方法可以找出所有最優(yōu)分類點(diǎn)。
通常I*(ik,k)~k曲線的拐點(diǎn)處對(duì)應(yīng)的k為最優(yōu)分段數(shù),即最優(yōu)分類數(shù),或者計(jì)算:
γ(k)=|I*(n,k)-I*(n,k-1)|
(17)
后與k繪制γ(k)~k曲線, 最大所對(duì)應(yīng)的k也是最優(yōu)分段數(shù)。
吳城水庫(kù)位于中陽(yáng)縣的東川河上,流域?qū)侔敫珊档貐^(qū),氣候特征為:干旱少雨,氣候寒冷,降雨集中于7-9月。多年平均降水量為472 mm,時(shí)間和空間上分配不均勻,各年雨量差異大,全年降水量的70%都來(lái)自汛期。
本文的基本資料為吳城水庫(kù)1955-2007年(2001-2005 年未測(cè))48 a的逐日降雨資料。研究的時(shí)間域?yàn)榧榷ǖ?-9月,以旬為基本單位,在吳城水庫(kù)控制流域內(nèi),選取能體現(xiàn)汛期的暴雨洪水變化規(guī)律的4個(gè)影響因子:多年旬平均降雨量、多年旬平均最大3 d雨量、多年大雨天數(shù)(降雨大于25 mm為大雨)、多年旬平均Cv值。
為了消除各指標(biāo)物理尺度的影響,因此根據(jù)式(1)對(duì)樣本指標(biāo)進(jìn)行處理,然后用SPSS軟件對(duì)標(biāo)準(zhǔn)化的樣本數(shù)據(jù)進(jìn)行主成分分析,經(jīng)分析可得表1及表2。
由表1可知,主成分1和2特征累積方差貢獻(xiàn)率達(dá)到85.756%,超過(guò)85%。因此,前兩個(gè)主成分能反映各項(xiàng)指標(biāo)的絕大部分信息。
表1 解釋的總方差Tab.1 Total variance explained
表2 成分矩陣Tab.2 Component matrix
根據(jù)式(5)可以得出樣本各指標(biāo)在主成分線性組合中的系數(shù),再由(6)、(7)得到綜合得分模型為:
F=0.373ω1+0.382ω2+0.421ω3+0.354ω4
(18)
根據(jù)式(8)求得各指標(biāo)的權(quán)重為ω=(ω1,ω2,ω3,ω4)=(0.232,0.275,0.250,0.243)。
將求得的各指標(biāo)權(quán)重系數(shù)代入式(10),求得向量Y,由式(11)和式(12)計(jì)算各種組合的類直徑,計(jì)算結(jié)果如表3所示。
表3 各類分段直徑D(i,j)Tab.3 The diameter of all kinds of section D(i,j)
目標(biāo)函數(shù)I*(n,k) 通過(guò)式(15)和式(16)求得,計(jì)算結(jié)果見(jiàn)表4。
由式(17)計(jì)算出γ(k),然后分別繪制I*(ik,k)~k、γ(k)~k曲線,分別見(jiàn)圖1、圖2。
由圖1得,曲線在k=3處出現(xiàn)拐點(diǎn),以此同時(shí)k=3時(shí),γ(k)最大,所以分三類最優(yōu),由表4查得3個(gè)分類分別為1-3月,4-9月,10-12月,即6月1日-6月30日為前汛期,7月1日-8月31日為主汛期,9月1號(hào)-9月30日為后汛期。
本文采用模糊集合分析法[6]對(duì)吳城水庫(kù)的汛期進(jìn)行模糊分析,同時(shí)算出吳城水庫(kù)汛期模糊集合的隸屬度,見(jiàn)表5。
如果以隸屬度大于0.5對(duì)應(yīng)的時(shí)間作為汛期的話,由表5
表4 分類目標(biāo)函數(shù)I*(n, k)計(jì)算結(jié)果Tab.4 The calculation results of objective function I*(n, k)
注:斜線后的數(shù)字為當(dāng)前分類情況下,第k類的與第k-1類的分割點(diǎn)ik。
圖1 I*(ik,k)~k關(guān)系圖Fig.1 The relation between I*(ik,k) and k
圖2 γ(k)~(k)關(guān)系圖Fig.2 The relation between γ(k) and k
表5 吳城水庫(kù)汛期經(jīng)驗(yàn)隸屬度Tab.5 Flood experience membership of Wucheng Reservoir
可以得到以下分期結(jié)果:
前汛期:6月1日至7月1日;主汛期:7月2日至9月3日;后汛期:9月4日至9月30日。為了便于比較把兩種方法的分期結(jié)果見(jiàn)表6。
表6 結(jié)果比較表Tab.6 Results of comparison
從以上的分析可以看出兩種方法的劃分結(jié)果一致,都能很好地反映出吳城水庫(kù)的暴雨洪水變化特點(diǎn)。但是模糊集合分析法在閾值選取方面多數(shù)依靠經(jīng)驗(yàn)選取,主觀性強(qiáng),相對(duì)而言Fisher最優(yōu)分割法比較客觀,因此說(shuō)明了Fisher最優(yōu)分割法可信,符合實(shí)際。
為了克服以往把各指標(biāo)的權(quán)重看作相等的不足,本文利用主成分分析法計(jì)算各項(xiàng)指標(biāo)權(quán)重以改進(jìn)Fisher最優(yōu)分割法,利用該改進(jìn)的Fisher最優(yōu)分割法對(duì)吳城水庫(kù)控制流域進(jìn)行汛期分期,并與模糊集合分析法的結(jié)果進(jìn)行比較。通過(guò)分析我們發(fā)現(xiàn),F(xiàn)isher最優(yōu)分割法適用于汛期分期,能使分期結(jié)果更加符合實(shí)際。
本文也存在很多不足:本文以旬為單位進(jìn)行劃分會(huì)人為打斷水文的連續(xù)性,如果能使劃分單位小一些,則可以使劃分結(jié)果更加接近實(shí)際。由于資料有限,所以有一些指標(biāo)也沒(méi)能收集到,如能收集到逐日徑流資料,則可以擁有更多關(guān)于吳城水庫(kù)的暴雨洪水變化特點(diǎn)的信息,使分期更加科學(xué)。
□
[1] 喻 婷,郭生練,劉 攀,等. 水庫(kù)汛期分期方法研究及其應(yīng)用[J].中國(guó)農(nóng)村水利水電,2006,(8):24-26, 56.
[2] 劉克琳,王銀堂,胡四一,等. Fisher最優(yōu)分割法在汛期分期中的應(yīng)用[J].水利水電科技進(jìn)展,2007,27(3):14-16, 37.
[3] 陳守煜. 工程水文水資源系統(tǒng)模糊集分析理論與實(shí)踐[M]. 遼寧大連:大連理工大學(xué)出版社,1998..
[4] 焦立新. 評(píng)價(jià)指標(biāo)標(biāo)準(zhǔn)化處理方法的探討[J]. 安徽農(nóng)業(yè)技術(shù)師范學(xué)院學(xué)報(bào),1999,13(3):7-10.
[5] 韓小孩,張耀輝,孫福軍,等. 基于主成分分析的指標(biāo)權(quán)重確定方法[J].四川兵工學(xué)報(bào),2012,33(10):124-126.
[6] 孫等平. 吳城水庫(kù)汛期分期調(diào)度研究與應(yīng)用[J].水利水電技術(shù),2012,43(7):109-112.