張霞 武鵬林 祝雪萍
摘要:為消除指標相關性對聚類造成的影響,避免主觀地選取汛期時間域,提出綜合方法進行汛期分期。使用變異系數法和灰色關聯(lián)法對所選指標進行篩選,利用集對分析法劃分汛期時間域,最后利用Fisher最優(yōu)分割法進行汛期分期。對陳家灣水庫進行汛期分期,得出結果:汛期為6月1日-10月5日;前汛期為6月1日-6月25日,主汛期為6月26日-9月5日,后汛期為9月6日-10月5日。所得結果與前人分析結果較為一致,表明該方法符合實際,有一定的適用性。
關鍵詞:灰色關聯(lián)分析法;變異系數;集對分析法;Fisher最優(yōu)分割法;汛期分期;陳家灣水庫
中圖分類號:TV697.1+3
文獻標志碼:A
doi:10.3969/j .issn. 1000- 13 79.2019.02.012
1 引言
在全球氣候變化大背景下,對雨洪資源的有效利用提出了更高要求。水庫對洪水資源的利用,通過動態(tài)控制汛限水位,既符合洪水變化統(tǒng)計規(guī)律,還能確保防洪安全的前提下盡可能多地利用洪水資源,提高雨洪資源的利用率。因此,汛期與非汛期的合理劃分、汛期的精細劃分意義重大。目前,主要的汛期分期方法有數理統(tǒng)計法[1]、模糊集合分析法[2]、分形理論法[3]、系統(tǒng)聚類法[4]等,這些方法主觀性強,一般考慮指標單一,即便考慮多指標,也未對指標進行篩選。鑒于以上不足,本文以陳家灣水庫為例嘗試一種新的汛期分期方法。首先,以候(半旬)為時段選?、俣嗄旰蚱骄偨涤炅俊ⅱ诙嗄旰蚱骄畲? d降雨量、③多年候平均最大3d降雨量、④多年候平均大雨日數、⑤多年候平均暴雨日數作為指標,并綜合指標的信息與指標間的關聯(lián)度對指標進行篩選,彌補指標間相關性對聚類結果有效性造成影響[5]的不足:其次,利用集對分析法確定汛期時間域,避免以往人為認定汛期時間域帶來的誤差:最后利用Fisher最優(yōu)分割法,以候為單位劃分,以期得到更加精確的分期結果,為流域內水庫在汛期實行分期汛限水位控制、充分利用水資源提供依據[6]。
2 研究方法
2.1 灰色關聯(lián)分析法
灰色關聯(lián)度,用于衡量某一指標與其他指標之間關聯(lián)程度的一種方法。關聯(lián)度的具體計算步驟如下。
2.2 變異系數法
變異系數法認為,一個指標能夠反映對象間的差異越大,說明這個指標的區(qū)分度就越好;反之,如果各對象同一指標的指標值差別不大,則這個指標區(qū)分度就不大[7]。計算步驟如下。
(1)設有t年資料,每年有72個候,每一個候對應v個指標,則可以得到樣本矩陣X:
2.4 Fisher最優(yōu)分割法
有序時間系列最優(yōu)的分類應當符合“類內差別最小,類間差別最大”的原則,而汛期分期的過程屬于有序時間聚類問題[9-10],故本次使用Fisher最優(yōu)分割法進行汛期分期。具體分期步驟如下。
(1)對于n個時段,每個時段對應v個指標,則可以構成以下指標矩陣:
(4)汛期這一集合的類內距離(D)也可以通過式(10)求得。由于汛期的長度可以通過集對分析法求得,因此汛期這一集合的類內距離(D)是固定的。對于有序時間聚類問題,類間的距離與類內的距離之和等于B,所以當分類的數目一定時,對于某一種聚類方法,類內距離越小,類間距離就越大,這就說明這個分類的類內差別小,類間差別大,符合Fisher最優(yōu)分割法的聚類原則。
將n個有序時間數據分為s類,定義P(n,k)為其中一種分法,可由下式進行計算:
3 實例分析
陳家灣水庫位于山西省呂梁市中陽縣城南約6.5km的南川河上??刂屏饔蛎娣e309 km,多年平均徑流量1 616萬m。水庫總庫容933萬m.其中興利庫容375.5萬m.防洪庫容278.5萬m,死庫容327.0萬m,重復庫容48.0萬m,是一座以防洪、灌溉、供水為主,兼顧發(fā)電、養(yǎng)殖的年調節(jié)中型水庫。
3.1 基本資料及指標選取
以陳家灣水庫1957-2010年54 a的逐日降雨資料為基礎,獲取各指標時間序列。根據前述灰色關聯(lián)分析法以及變異系數法,以其中一個指標各候為參考母序列,除去該指標的其余4個指標各候為子序列,求得指標關聯(lián)度從小到大排序為③④②⑤①:對應的每個指標變異系數分別為2.29、1.61、0.94、0.95、0.98,以剔除關聯(lián)度較大的指標為目標,同時根據主成分分析法累計貢獻達到85 010時選取對應最少個數主成分進行分析[11]的原則進行篩選,得到指標③④②⑤。
3.2 汛期時間域的確定
按照集對分析法步驟將集合H符號化,并計算聯(lián)系度,得到部分計算結果見表1。
由表1可知:汛期時間域為6月1日-10月5日,非汛期時間域為1月-5月、10月6日-12月。相比以往按照當地氣候特點籠統(tǒng)確定的時間域,劃分結果更加有據可循。
3.3 汛期分期
(1)以6月1日-10月5日為有序樣本X,樣本容量為25.每個樣本均為4維向量,無量綱化后部分樣本數據見表2,各類分段直徑計算結果見表3。
(2)目標函數由式(14)、式(15)計算得出,計算結果見表4。f(s)由式(16)計算出,繪制f(s)-s曲線,見圖1。
(3)汛期分期結果。由圖1可得:s=3時,f(s)值最大,因此最優(yōu)分類為3類。查表4可得,汛期為6月1日-10月5日;前汛期:6.1~6.5(即6月1日-6月25日)、主汛期:6.6~9.1(即6月26日-9月5日)、后汛期:9.2~ 10.1(即9月6日-10月5日)。
3.4 結果對比
為了分析驗證結果的合理性,與文獻[12]所用的改進的集對分析法以及模糊集分析法所得結果作比較,見表5。汛期多年平均日降雨量見圖2,3種方法的分期時長見圖3。
結果對比分析:依據汛期時間域的劃分結果,本研究汛期總長127 d.較另兩種方法汛期總長122 d多10月第一個候,本研究將其劃人汛期,一方面是依據集對分析法劃分結果,另一方面,如圖2陳家灣6-10月多年平均日降雨數據顯示,降雨量跟6月相當,故整個汛期的劃分是更加合理的:改進集對分析法與模糊集分析法劃分結果基本一致,前汛期時長30 d左右、主汛期時長60 d左右、后汛期30 d左右,與現(xiàn)行的方案基本一致。而本研究Fisher最優(yōu)分割法結果與前兩者相比,前汛期縮短到25 d,主汛期延長到72 d(延長了10—14 d),后汛期保持基本一致(30 d左右)。即本研究將6月最后一候、9月第一候劃入主汛期,劃入主汛期的這兩個候分別相對其前、后的前汛期、后汛期平均降雨量更大一些,不僅驗證了以候為劃分單元的合理性、劃分結果的精確性,同時主汛期的延長符合暴雨的季節(jié)性特征,對水庫的安全更加有利,為科學確定水庫開始蓄水時間提供了重要參考。
4 結論
利用灰色關聯(lián)分析法以及變異系數法對所選指標進行篩選,彌補了指標單一的不足,消除了指標間關聯(lián)度對聚類結果的影響:再利用集對分析法對汛期的時間域進行劃分,代替以往主觀性較強的人為認定的汛期時間域:最后利用Fisher最優(yōu)分割法對汛期進行精細劃分。將劃分結果與改進的集對分析法以及模糊集分析法的結果進行比較,劃分結果較為一致,都能很好地反映陳家灣水庫的洪水變化特點。但是,模糊集分析分期結果比較依賴域值的選取,而域值的選取具有一定主觀性,本研究的方法有效彌補了主觀性強的缺陷。改進的集對分析法以旬為單位劃分得出結果,而本研究以候為單位劃分得出結果,故分期結果在趨于一致的基礎上更加精確、更加符合實際。
參考文獻:
[1] 王麗學,孫曉東,李學森,等,汛期分期定量分析方法在湯河水庫中的應用研究[J].水電能源科學,2011,29(3):44-47.
[2] 郭金城,郭倩,武學毅,基于模糊集合分析法與圓形分布法的水庫汛期分期研究[J].水電能源科學,2013,31(3): 50-53.
[3]侯玉,吳伯賢,鄭國權,分形理論用于洪水分期的初步探討[J].水科學進展,1999,10(2):140-143.
[4] 羅姍姍,宋星原,張艷軍,等,汛期分期分析方法在佛子嶺水庫群的應用研究[J].水電能源科學,2012,30 (2):44-48.
[5]朱惠倩,聚類分析的一種改進方法[J].湖南文理學院學報(自然科學版),2005,17(3):7-9.
[6] 肖聰,顧圣平,崔巍,等.Fisher最優(yōu)分割法在李仙江流域汛期分期中的應用[J].水電能源科學,2014,32(3):70-74.
[7]楊逾,鄭志明,基于范例推理的軟基處理評價方案研究[J].長江科學院院報,2015,32(12):93-97.
[8]王文圣,李躍清,金菊良,等,水文水資源集對分析[M].北京:科學出版社,2010:27 - 32.
[9]王賀佳,武鵬林,基于Fisher最優(yōu)分割法的汛期分期[J].人民黃河,2015,37(8):30-34.
[10] 劉克琳,王銀堂,胡四一,等.Fisher最優(yōu)分割法在汛期分期中的應用[J].水利水電科技進展,2007,27(3):14-16.
[11] 李俊,武鵬林,改進的Fisher最優(yōu)分割法在汛期分期中的應用[J].中國農村水利水電,2016(11):23-26.
[12]WU P L,LIJ,WANC J Y.Floods Season Division Basedon Improved Set Pair Analysis[J].Intemational Conferenceon Applied Mechanics and Materials, 2016( 10): 29-30.