夏青青,李英海,郭家力,汪利,林偉
(三峽大學(xué)水利與環(huán)境學(xué)院,湖北宜昌443002)
水庫(kù)汛限水位分期控制是在確保水庫(kù)大壩及其下游防洪安全的前提下,合理利用洪水資源、緩解汛期防洪與興利之間矛盾的有效手段。但是如何根據(jù)流域氣象、水文等信息科學(xué)、準(zhǔn)確地對(duì)汛期進(jìn)行劃分,是進(jìn)行分期汛限水位控制首要解決的關(guān)鍵問(wèn)題。
傳統(tǒng)的汛期分期方法主要有成因分析法、數(shù)理統(tǒng)計(jì)法、模糊集合分析法和基于分形理論的方法等[1]。然而,這些分期方法各有優(yōu)缺點(diǎn):成因分析法建立在對(duì)研究流域的水文、氣象的成因分析基礎(chǔ)之上,分期結(jié)果因有較高的可靠性而被普遍采用,但在分析暴雨天氣的成因上存在一定的主觀性,也難以將汛期細(xì)分到天;數(shù)理統(tǒng)計(jì)法根據(jù)水文要素的統(tǒng)計(jì)規(guī)律進(jìn)行分期,具有原理簡(jiǎn)單、實(shí)用性強(qiáng)、可操作性強(qiáng)等優(yōu)點(diǎn),但是指標(biāo)閾值的選取具有較強(qiáng)的主觀性;模糊集合分析法考慮了汛期指標(biāo)在時(shí)間上的模糊性,但存在分期指標(biāo)單一、閾值的選取上具有主觀性的問(wèn)題;基于分形理論的方法物理背景強(qiáng),但只能考慮單因子指標(biāo)且需樣本容量較大、計(jì)算繁瑣。
Fisher最優(yōu)分割法是一種對(duì)有序樣本系列進(jìn)行最優(yōu)分段的數(shù)學(xué)統(tǒng)計(jì)方法,將Fisher最優(yōu)分割法應(yīng)用于汛期分期,為解決分期多指標(biāo)選取、分期數(shù)目以及相鄰分期分界點(diǎn)難確定等問(wèn)題提供了有效手段[2]。當(dāng)運(yùn)用Fisher最優(yōu)分割法在進(jìn)行汛期分期時(shí),選取的各個(gè)指標(biāo)的權(quán)重如何確定將直接影響分期的準(zhǔn)確性。目前的賦權(quán)方式主要有賦均權(quán)重[3]、專家評(píng)分法[2]、模糊層次分析法(FAHP)[4]、主成分分析法(PCA)[5]等。其中賦均權(quán)重將各個(gè)指標(biāo)的權(quán)重均值化,忽略了不同指標(biāo)的重要程度的差異;而專家評(píng)分法、模糊層次分析法和主成分分析法需要借助主觀經(jīng)驗(yàn)確定指標(biāo)權(quán)重,忽略了對(duì)各個(gè)指標(biāo)中隱含有用信息的挖掘。針對(duì)這一問(wèn)題,本文借助熵權(quán)法計(jì)算指標(biāo)權(quán)重的客觀性,提出基于熵權(quán)法的改進(jìn)Fisher最優(yōu)分割方法,并將其應(yīng)用于三峽水庫(kù)汛期分期問(wèn)題。
Fisher 最優(yōu)分割法屬于有序聚類方法的一種,能保證樣本序列的時(shí)序性,這與汛期的天然時(shí)序性相吻合。該方法以各個(gè)分段總離差平方和最小為依據(jù),以各段內(nèi)樣本間差異最小、各分段間差異最大為基本原則[2]。
xij′=
(1)
式中xij——第i行第j列數(shù)據(jù);xmax,j、xmin,j——第j列的最大、最小值。
然后,根據(jù)各個(gè)指標(biāo)所占比重大小加權(quán)平均后得到向量Y:
(2)
式中ωj——第j個(gè)指標(biāo)的權(quán)重。
(3)
式中yt——第t個(gè)分類中的樣本值,1≤t≤k。
若用D(it,it+1-1)來(lái)表示某一類Pt的類直徑,則可記為:
(4)
定義目標(biāo)函數(shù)為k類類直徑之和:
(5)
使目標(biāo)函數(shù)值最小的分割即為Fisher最優(yōu)分割,記為:
(6)
有序樣本{y1,y2,…,yn}的最優(yōu)k分割是在其某一截?cái)嗄┪沧佣蔚淖顑?yōu)分割B*(n,k-1)之后再添加一段形成的,因此最優(yōu)k分割的遞推公式為:
B*(n,k)=
(7)
若分類k(1 先找到分割點(diǎn),使B*(n,k)達(dá)到最小,即: B*(n,k)=B*(ik-1,k-1)+D(ik,n) (8) 于是得第k類為Pk={yik,yik + 1,…,yik + 1 -1};然后找分割點(diǎn)ik-1,使其滿足: Bk(ik-1,k-1)=B*(ik-1-1,k-2)+D(ik-1,ik-1) (9) 得到第k-1類Pk-1={yik-1,yik-1 + 1,…,yik -1}。依照同樣的方法,可求出所有分類P1,P2,…,Pk,由此得到最優(yōu)k分類的分類結(jié)果。 采用Fisher最優(yōu)分割法進(jìn)行汛期分期時(shí),需要對(duì)選取的各個(gè)指標(biāo)進(jìn)行賦權(quán)。熵權(quán)法以變量隱含的信息熵為基礎(chǔ),是一種客觀的權(quán)重賦值方法[7-8]。在汛期分期中,根據(jù)指標(biāo)的信息熵計(jì)算其對(duì)應(yīng)的權(quán)重,盡量消除權(quán)重計(jì)算的人為干擾,使指標(biāo)權(quán)重的確定更符合客觀實(shí)際。本文引入熵權(quán)法對(duì)Fisher最優(yōu)分割法中指標(biāo)進(jìn)行賦權(quán),其基本過(guò)程如下。 a) 根據(jù)信息熵的定義以及Fisher最優(yōu)分割法在數(shù)據(jù)處理中得到的標(biāo)準(zhǔn)化矩陣X′,采用下式計(jì)算指標(biāo)j的熵值Hj。 (10) b) 根據(jù)指標(biāo)j熵值Hj計(jì)算其熵權(quán)ωj′。 (11) c) 將Fisher最優(yōu)分割法中向量Y的計(jì)算權(quán)重由熵權(quán)ωj′確定,得到向量Y′,見(jiàn)公式(12),并按照后續(xù)過(guò)程對(duì)向量Y′進(jìn)行分期計(jì)算,再運(yùn)用Fisher最優(yōu)分割法對(duì)向量Y′進(jìn)行分期計(jì)算。 (12) 三峽水庫(kù)是長(zhǎng)江上游干流的控制性水庫(kù)工程,汛期防洪是其主要功能,防洪庫(kù)容221.5億m3。根據(jù)三峽水庫(kù)正常運(yùn)行期防洪調(diào)度規(guī)則,每年6月10日水庫(kù)水位降至汛限水位145 m,并從6月10日至9月30日都維持單一汛限水位運(yùn)行[8]。由于未考慮汛期洪水變化規(guī)律,未進(jìn)行分期汛限水位控制,導(dǎo)致每年三峽水庫(kù)在汛期會(huì)產(chǎn)生大量棄水,而在汛末可能出現(xiàn)無(wú)水可蓄的問(wèn)題。因此,分期汛限水位是提高三峽水庫(kù)汛期水資源利用效率的有效手段。而要實(shí)現(xiàn)汛限水位分期控制,首先要解決的就是汛期分期問(wèn)題。 表1 旬多年指標(biāo)特征值 利用式(1)對(duì)指標(biāo)特征值進(jìn)行標(biāo)準(zhǔn)化處理,然后采用熵權(quán)法計(jì)算5個(gè)指標(biāo)信息熵及其熵權(quán)結(jié)果,利用式(10)、(11)計(jì)算得其信息熵和熵權(quán),見(jiàn)表2。 表2 旬多年分期指標(biāo)信息熵和熵權(quán)確定 將標(biāo)準(zhǔn)化處理后的數(shù)據(jù)按式(12)賦予相應(yīng)的權(quán)重,得到向量Y′。用it表示該類分割的起點(diǎn),it+1-1表示該類分割的終點(diǎn),由于本研究中將汛期劃分為11旬,所以it={1,2,…,10},it+1-1={2,3,…,11},D(it,it+1-1)表示Pt={yit,yit + 1,…,yit + 1 -1}的類直徑。進(jìn)一步的,采用式(3)、(4)計(jì)算各種組合的類直徑D(it,it+1-1),見(jiàn)表3。 利用式(5)—(9)計(jì)算出最優(yōu)k分割的最優(yōu)值B*(n,k)(其中n=11,k=2,…,10),再計(jì)算出f(k),見(jiàn)表4。 利用表4中的數(shù)據(jù)繪制B*(n,k)-k曲線和斜率差值f(k)-k曲線,見(jiàn)圖1。 由圖1可以看出,最優(yōu)值B*(n,k)在k=2和k=3時(shí)相對(duì)較大,斜率差值f(k)在k=3時(shí)取得最大值,因此綜合判斷,取k=3為最優(yōu)分段數(shù)。由表3可知k=3時(shí)對(duì)應(yīng)的分類為1~2、3~7、8~11,故與之相應(yīng)汛期劃分結(jié)果為:6月10至30日為前汛期,7月1日至8月20日為主汛期,8月21日至9月30日為后汛期。 表3 類直徑D(it,it+1-1)計(jì)算 表4 最優(yōu)k分割結(jié)果 從氣候成因[9-10]來(lái)看,長(zhǎng)江流域具有明顯的季風(fēng)氣候,上游主要支流有金沙江、岷江、沱江、嘉陵江和烏江。根據(jù)西太平洋副熱帶高壓脊線位置移動(dòng)對(duì)降水影響可知:在6月中旬至下旬,暴雨主要出現(xiàn)在烏江流域、嘉陵江東部和三峽區(qū)間,若三者不同時(shí)遭受暴雨,則宜昌站不會(huì)出現(xiàn)大量級(jí)洪水;7月上旬至8月中旬,雨帶位于長(zhǎng)江上游,且易形成川西暴雨,隨著副高脊線周期性地東退西進(jìn),暴雨逐漸東移,易造成上游各個(gè)支流產(chǎn)生大量級(jí)洪水,在這個(gè)時(shí)期宜昌站易出現(xiàn)峰高量大的洪水。8月下旬,金沙江流域降水較多,而岷江、沱江和嘉陵江降水較少,因此宜昌出現(xiàn)量級(jí)較大洪水的概率較小。從9月初開(kāi)始,長(zhǎng)江上游受西風(fēng)帶偏北氣流影響,整個(gè)流域降水量減少。10月以后,副熱帶高壓脊線南退到北緯20°以南,長(zhǎng)江汛期隨之結(jié)束。因此,根據(jù)成因分析確定三峽水庫(kù)汛期分期結(jié)果為6月中旬至下旬為前汛期、7月初至8月中旬為主汛期、8月下旬至9月底為后汛期。這與基于熵權(quán)法的改進(jìn)Fisher最優(yōu)分割法的分期結(jié)果基本一致,說(shuō)明改進(jìn)方法對(duì)汛期的劃分符合洪水季節(jié)變化規(guī)律。 進(jìn)一步,為檢驗(yàn)本文的改進(jìn)方法是否合理,選取旬信息熵的相對(duì)平均離差RMAD[7]作為分期評(píng)判標(biāo)準(zhǔn),RAMD值越小表明分期方案越合理,其計(jì)算公式見(jiàn)式(13)、(14)。在計(jì)算得到的汛期分期的標(biāo)準(zhǔn)上將相應(yīng)的分割點(diǎn)向后挪1個(gè)或2個(gè)位得到新分期方案,比較各方案RAMD大小。文獻(xiàn)[7]給出了詳細(xì)的計(jì)算步驟,計(jì)算結(jié)果見(jiàn)表5。 (13) (14) 式中Si——旬信息熵;RMADk——第t類的相對(duì)平均離差。 表5 分期方案相對(duì)平均離差RMAD值 由表5得方案1的相對(duì)平均離差為0.040,較其他方案小。進(jìn)一步,采用基于賦均權(quán)重和主成分分析(PCA)[5]的Fisher最優(yōu)分割法對(duì)三峽水庫(kù)汛期進(jìn)行劃分,5個(gè)指標(biāo)的權(quán)重分別為(0.200,0.200,0.200,0.200,0.200)、(0.203,0.207,0.207,0.200,0.183),2種方法最后計(jì)算得到三峽水庫(kù)汛期分期結(jié)果均為前汛期為6月10至30日,主汛期為7月1日至9月10日,后汛期為9月11至30日,即與表5中的方案3對(duì)應(yīng)。而方案3相對(duì)平均離差為0.041相比方案1略大。因此,對(duì)比3種方法可知,本文改進(jìn)方法所得分期更加合理。 為解決Fisher最優(yōu)分割法中各指標(biāo)賦權(quán)重主觀性強(qiáng)的問(wèn)題,更加科學(xué)準(zhǔn)確地進(jìn)行水庫(kù)汛期分期,本文提出一種基于熵權(quán)法的改進(jìn)Fisher最優(yōu)分割方法,并將其應(yīng)用于三峽水庫(kù)進(jìn)行汛期分期,在確定分3期為最優(yōu)的基礎(chǔ)上,將三峽汛期劃分為前汛期(6月10日至30日)、主汛期(7月1日至8月20日)、后汛期(8月21日至9月30日)。通過(guò)氣候成因分析和旬信息熵的相對(duì)平均離差RMAD計(jì)算對(duì)分期結(jié)果進(jìn)行評(píng)價(jià),結(jié)果表明,通過(guò)熵權(quán)法計(jì)算Fisher最優(yōu)分割法中各指標(biāo)的權(quán)重能夠盡量消除權(quán)重計(jì)算的人為干擾,分期結(jié)果相比基于主成分分析和賦均權(quán)重的Fisher最優(yōu)分割法更為準(zhǔn)確。1.5 最優(yōu)分段數(shù)k的確定
2 基于熵權(quán)法的Fisher最優(yōu)分割法改進(jìn)
3 實(shí)例計(jì)算與分析
3.1 基于改進(jìn)Fisher最優(yōu)分割法的三峽水庫(kù)汛期劃分
3.2 結(jié)果分析
4 結(jié)論