王同旭,王鐵,雷冠軍
(1.黑龍江大慶水文局,黑龍江大慶163316;2.中國水利水電科學(xué)研究院水資源研究所,北京100038)
模糊C均值聚類法在節(jié)水灌溉水平聚類分析中的應(yīng)用
王同旭1,王鐵1,雷冠軍2
(1.黑龍江大慶水文局,黑龍江大慶163316;2.中國水利水電科學(xué)研究院水資源研究所,北京100038)
闡述了模糊C均值聚類法對樣本進行聚類的基本原理,對模糊C均值聚類法不能有效確定聚類數(shù)目的問題進行分析,提出采用動態(tài)聚類方法計算出聚類數(shù)目的前提下對模糊C均值聚類法進行改進。利用改進模糊C均值聚類法對某地區(qū)的節(jié)水灌溉水平進行聚類分析,結(jié)果表明模糊C均值聚類法具有較高的適用性。
模糊C均值聚類;動態(tài)聚類法;不一致系數(shù);節(jié)水灌溉指標(biāo)體系
模糊C均值聚類法是用隸屬度確定某個樣本點屬于某個聚類的一種聚類方法,該方法是對普通聚類法的改進,模型簡單實用,能夠有效減小運算時間。張肆紅[1]運用模糊C均值聚類法針對現(xiàn)場調(diào)查的泥石流的各因素劃分泥石流溝的類別,分類結(jié)果表明泥石流溝類別的劃分與現(xiàn)場調(diào)查和室內(nèi)結(jié)果較為一致,說明模糊C均值聚類法具有較好的適用性。張文[2]針對泥石流影響因素較多的問題,運用主成分分析法進行降維處理,對提取出的主成分運用模糊C均值聚類法進行分類,分類結(jié)果與現(xiàn)場實際情況吻合較好。徐茵[3]針對泥石流6個常用的影響因子采用熵權(quán)法計算各因子的權(quán)重,運用模糊C均值聚類法對烏爾德庫區(qū)的泥石流進行聚類,實際調(diào)查發(fā)現(xiàn)實際聚類結(jié)果能夠體現(xiàn)泥石流溝的發(fā)育狀態(tài)。張曙紅[4]指出模糊C均值聚類法對于處理低維的數(shù)據(jù)具有較高的有效性,但是難以很好地處理高維的數(shù)據(jù),提出一種基于遺傳算法采樣的模糊C均值聚類法,能夠提高處理大規(guī)模數(shù)據(jù)的能力。
模糊C均值聚類算法需要預(yù)先確定被分類的元素分為幾類,從初始分類出發(fā)用迭代方法進行修正,直到分類結(jié)果符合要求[5],具有較大的不確定性。針對模糊C均值聚類法需要人為確定出聚類數(shù)的不足,對模糊C均值聚類法改進,采用動態(tài)聚類方法求出聚類數(shù),進而采用模糊C均值聚類法聚類。構(gòu)建了節(jié)水灌溉水平的評價指標(biāo)體系,運用改進的模糊C均值聚類法聚類,聚類結(jié)果與動態(tài)聚類法保持一致,能夠有效避免模糊C均值聚類法聚類主觀性強的問題。
1.1 模型簡介
給定樣本矩陣:
其中,X的每一行為一個樣品(或觀測),每一列為一個變量的n個觀測值,X是由n個對象的(x1,x2,…,xn)的p個變量的觀測值構(gòu)成的矩陣。
假定將n個對象劃分為c類(2≤c≤n),設(shè)定c個類的聚類中心V=(v1,v2,…,vc),其中vi=(vi1,vi2,…,vip),(i=1,2,…,c)。令uik表示第k個對象xk屬于第i類的隸屬度,這里能夠使得各對象與聚類中心的距離最小的分類即為最佳的聚類。定義目標(biāo)函數(shù)
其中,U=(uik)c×n為隸屬度矩陣,dik=‖xk-vi‖。顯然,J(U,V)表示了各類中對象到聚類中心的加權(quán)平方距離之和,權(quán)重是對象xk屬于第i類的隸屬度的m次方。模糊C均值聚類法的聚類準(zhǔn)則是求U,V,使J(U,V)取得最小值。
1.2 建模步驟
模糊C均值聚類法的具體步驟如下:
2)通過下式計算第l步的聚類中心V(l):
3)修正隸屬度矩陣U(l),計算目標(biāo)函數(shù)值J(l)。
4)對給定的隸屬度終止容限ξu>0,當(dāng)max時,停止迭代,否則l=l+1,然后轉(zhuǎn)2,不斷迭代直到滿足迭代終止條件為止。
經(jīng)過以上步驟的迭代之后,可以求得最終的隸屬度矩陣U和聚類中心V,使得目標(biāo)函數(shù)J(U,V)的值達(dá)到最小。根據(jù)最終的隸屬度矩陣U中元素的取值可以確定所有樣品的歸屬,當(dāng)時,可將樣品xk歸為第j類。
1.3 模糊C均值聚類法的改進
模糊C均值聚類法是在已知聚類數(shù)目的前提下,根據(jù)目標(biāo)函數(shù)最小來確定最終的聚類結(jié)果,因而模糊C均值聚類法聚類數(shù)目的確定直接影響了聚類結(jié)果的優(yōu)劣。對于一系列樣本觀測值往往聚類數(shù)目的確定讓人莫衷一是,因而本文提出采用動態(tài)聚類的方法對模糊C均值聚類法進行改進。
設(shè)定聚類的閾值C,采用動態(tài)聚類法,當(dāng)一個節(jié)點和它的所有子節(jié)點的不一致系數(shù)小于C時,該節(jié)點及其下面的所有節(jié)點被聚為一類,不斷調(diào)整聚類閾值,觀察聚類的個數(shù)。為了有效判定當(dāng)次聚類效果的優(yōu)劣,采用不一致系數(shù)作為衡量聚類結(jié)果優(yōu)劣的標(biāo)準(zhǔn)。不一致系數(shù)可用來確定最終的分類個數(shù),在聚類過程中,若某一次聚類所對應(yīng)的不一致系數(shù)較上次有大幅度增加,則說明該次聚類的效果較差。
式中:ξi為第i次聚類時的不一致系數(shù);di1為第i次聚類時的聚類距離;di2為第i次聚類時所涉及的聚類距離的均值;di3為第i次聚類時所涉及的聚類距離的標(biāo)準(zhǔn)差;i=1,2,…,n-1,n為樣本的個數(shù)。
2.1 節(jié)水灌溉的內(nèi)涵
節(jié)水灌溉是根據(jù)種植作物的需水規(guī)律以及當(dāng)?shù)厮Y源的供給條件,最大限度利用當(dāng)?shù)刈匀唤邓凸喔人?,以獲取農(nóng)業(yè)的最佳綜合利用效益(包括經(jīng)濟效益、社會效益、生態(tài)環(huán)境效益等)為目標(biāo),而采取的多種措施的總稱。節(jié)水灌溉實際上是以降低灌溉用水的無效損耗量來實現(xiàn)節(jié)約水資源的目的,因此節(jié)水灌溉的技術(shù)體系就圍繞水資源的高效利用展開,具體技術(shù)貫穿于從水源到田間入水口等各輸水環(huán)節(jié)、從田間入水口到作物根系的灌水環(huán)節(jié),以及作物吸收利用根系層土壤水分的耗水環(huán)節(jié),在農(nóng)業(yè)灌水過程中,節(jié)約用水的理念無處不在。
2.2 節(jié)水灌溉指標(biāo)體系構(gòu)建
節(jié)水灌溉受到氣候、地質(zhì)等自然因素的影響,同時也受到經(jīng)濟、社會、技術(shù)等發(fā)展水平的制約,是一個復(fù)雜的多目標(biāo)、多層次的系統(tǒng)。節(jié)水灌溉水平的研究,就是對一個地區(qū)節(jié)水灌溉各指標(biāo)的研究,建立合理全面易于操作的評價指標(biāo)體系是研究節(jié)水灌溉水平的關(guān)鍵。評價指標(biāo)體系的建立有分析法、綜合法、頻度統(tǒng)計法和統(tǒng)計分析法等多種方法。
楊旭[6]將節(jié)水灌溉工程所涉及的指標(biāo)分為七大類,涉及到政策、技術(shù)、經(jīng)濟、財務(wù)、資源、環(huán)境、社會等指標(biāo),對于指標(biāo)的綜合評價提出采用加權(quán)等方法對綜合指標(biāo)進行協(xié)調(diào)。李曉淵[7]遵照指標(biāo)設(shè)定的系統(tǒng)性、簡潔性和可操作性原則,將新疆地區(qū)的節(jié)水灌溉的技術(shù)經(jīng)濟指標(biāo)評價體系分為投入產(chǎn)出、效果評價和比較效果三類指標(biāo),建立了組合賦權(quán)法的綜合評價模型,能夠有效對新疆地區(qū)的節(jié)水灌溉水平進行評價。張晶楠[8]在分析了節(jié)水灌溉的影響因素的基礎(chǔ)上,選取了工程節(jié)水、農(nóng)業(yè)節(jié)水和管理節(jié)水所對應(yīng)的34項指標(biāo)構(gòu)建節(jié)水灌溉評價指標(biāo)體系,采用模糊綜合評價法對四川省的節(jié)水灌溉水平進行評價。王慧[9]針對西北缺水地區(qū),從社會、經(jīng)濟、資源環(huán)境效益三方面共提出25個評價指標(biāo),利用改進的集對分析法對灌區(qū)節(jié)水改造效益進行綜合評價。張占龐[10]對生態(tài)灌區(qū)的水資源可持續(xù)利用建立了水資源發(fā)展程度、水資源與社會、經(jīng)濟、生態(tài)環(huán)境的協(xié)調(diào)程度的指標(biāo),并簡要論述了生態(tài)灌區(qū)的綜合評價方法。韓振中[11]等提出大型灌區(qū)節(jié)水改造評價指標(biāo)體系,包括水土資源指標(biāo)、生態(tài)環(huán)境指標(biāo)、社會經(jīng)濟指標(biāo)等7個準(zhǔn)則層,采用線性加權(quán)法進行灌區(qū)評估。高峰[12]等構(gòu)建了涵蓋技術(shù)、經(jīng)濟、資源、財務(wù)、政策、環(huán)境、社會評價7個準(zhǔn)則、41個具體指標(biāo)的節(jié)水灌溉工程評價指標(biāo)體系。劉從柱[13]依據(jù)關(guān)中灌區(qū)節(jié)水改造項目,建立包括項目效益、項目可持續(xù)性、建設(shè)過程、項目管理的灌區(qū)節(jié)水改造項目評價指標(biāo)體系,結(jié)合模糊綜合評判法將其應(yīng)用于關(guān)中灌區(qū),該研究構(gòu)建了較為完善的指標(biāo)體系,但是評價方法和權(quán)重確定的比較簡單。
節(jié)水灌溉指標(biāo)體系的建立,應(yīng)該能夠科學(xué)合理地反映節(jié)水灌溉的特征和優(yōu)勢,應(yīng)遵循下列基本原則:經(jīng)濟合理性原則,技術(shù)先進性原則,方案可行性原則,生態(tài)協(xié)調(diào)性原則、可持續(xù)性發(fā)展原則?;谀壳皹O端氣候現(xiàn)象嚴(yán)重,將節(jié)水灌溉水平的指標(biāo)定為社會效應(yīng)、經(jīng)濟效應(yīng)、環(huán)境效應(yīng),構(gòu)成節(jié)水灌溉水平評價的指標(biāo)體系,見表1。
我國是農(nóng)業(yè)大國兼灌溉大國,灌區(qū)在我國社會經(jīng)濟發(fā)展中的地位舉足輕重,合理高效地利用灌區(qū)水資源,是灌區(qū)生態(tài)環(huán)境保護的重要保障。為緩解我國灌區(qū)水資源短缺、水資源利用效率低下、生態(tài)環(huán)境惡化等問題,大規(guī)模的節(jié)水型農(nóng)業(yè)建設(shè)應(yīng)運而生。
由于評價區(qū)域多樣性,其自然生態(tài)環(huán)境各有不同,區(qū)域在發(fā)展節(jié)水灌溉過程中側(cè)重于對灌區(qū)的節(jié)水灌溉水平進行綜合評價,然而根據(jù)灌區(qū)的實際情況進行綜合聚類,為灌區(qū)的綜合管理提供分區(qū)管理、分區(qū)整治的依據(jù)是必需的。建立具有實際操作意義的全面反映我國界水灌溉狀況與進程,以及社會、經(jīng)濟和生態(tài)環(huán)境之間相互協(xié)調(diào)程度的指標(biāo)體系及評價方法,從而科學(xué)地指導(dǎo)節(jié)水灌溉的良性健康發(fā)展。
表1 節(jié)水灌溉水平評價指標(biāo)體系
為了研究河北某地區(qū)的節(jié)水灌溉水平,選取能夠找到的相關(guān)指標(biāo)作為該地區(qū)節(jié)水灌溉水平的評價指標(biāo),見表2。
表2 待評價地區(qū)指標(biāo)
對各待評價地區(qū)的節(jié)水灌溉指標(biāo)分別計算,依據(jù)指標(biāo)進行聚類,選擇閾值是0.1,0.5,1.0,1.5,2.0,2.5,分別進行動態(tài)聚類,聚類結(jié)果見表3,由于在聚類數(shù)目最小且聚類效果最好的原則下,選取聚類數(shù)目為3類。
在確定聚類數(shù)目為3類的條件下,采用模糊C均值聚類法進行聚類,見表4及圖1。
表3 動態(tài)聚類表
由于各地區(qū)的指標(biāo)的量綱不同,為了消除量綱的影響,對不同地區(qū)的指標(biāo)值采取歸一化處理,如表4。
表4 各地區(qū)模糊聚類的隸屬度及聚類結(jié)果
圖1 節(jié)水灌溉水平聚類樹形圖
在采用動態(tài)聚類法確定聚類數(shù)目的前提下,運用C均值模糊聚類法對六個地區(qū)的節(jié)水灌溉水平進行評價,結(jié)果表明模糊C均值聚類法和動態(tài)聚類法結(jié)果保持一致,說明模糊C均值聚類法的正確性,同時在動態(tài)聚類法確定聚類數(shù)目的基礎(chǔ)上運用模糊C均值聚類法,能夠有效提高該方法的實用性。
本文在對模糊C均值聚類法的基本原理進行闡述的基礎(chǔ)上,采用動態(tài)聚類的不一致性系數(shù)對模糊C均值聚類法進行改進,并對某地區(qū)的節(jié)水灌溉水平運用改進后的方法進行分類,結(jié)果表明,改進后的方法能夠有效確定聚類數(shù)目,且聚類結(jié)果與動態(tài)聚類結(jié)果保持一致,說明改進后的模糊C均值聚類法具有較強的適用性。
[1]張肆紅,路曉光,趙偉.FCM(模糊C-均值聚類)法在石流分類中的應(yīng)用[J].福建建筑,2010(3):77—79.
[2]張文,陳劍平,秦勝伍,李明,等.基于主成分分析的FCM法在泥石流分類中的應(yīng)用[J].吉林大學(xué)學(xué)報(地球科學(xué)版),2010,40(2):368—372.
[3]徐茵.烏爾德庫區(qū)泥石流模糊C均值聚類法初步分類研究[J].水文地質(zhì)與工程地質(zhì),2014,41(2):129—133.
[4]張曙紅,孫建勛,諸克軍.基于遺傳優(yōu)化的采樣模糊C均值聚類算法[J].系統(tǒng)工程理論與實踐,2004,24(5):121—125.
[5]朱喜林,武星星,李曉梅.基于改進型模糊聚類的模糊系統(tǒng)建模方法[J].控制與決策,2007,22(1):73—77.
[6]楊旭,曾賽星,王蔚武,張金萍.節(jié)水灌溉綜合評價指標(biāo)體系與量化方法[J].黑龍江水利科技,2005,33(4):27—28.
[7]李曉淵,朱美玲,何繼武.新疆干旱區(qū)農(nóng)業(yè)高效節(jié)水灌溉技術(shù)經(jīng)濟評價指標(biāo)體系構(gòu)建初探[J].農(nóng)村經(jīng)濟與科技,2010,21(4):62—63.
[8]張晶楠,楊路華,翟寧,樓豫紅,等.基于可變模糊集理論的區(qū)域節(jié)水灌溉發(fā)展水平評價方法[J].河北農(nóng)業(yè)大雪學(xué)報,2010,33(3):111—115+119.
[9]王慧,毛曉敏,董鋒.灌區(qū)節(jié)水綜合效應(yīng)評價的集對分析模型比較[J].節(jié)水灌溉,2010(2):48—51.
[10]張占龐,韓熙.生態(tài)灌區(qū)基本內(nèi)涵及評價指標(biāo)體系評價方法研究[J].安徽農(nóng)業(yè)科學(xué),2009,37(18):8621—8623.
[11]韓振中,門冠宇,劉云波,等.大型灌區(qū)續(xù)建配套與節(jié)水改造評價指標(biāo)體系的研究[J].中國農(nóng)村水利水電,2002(7):17—21.
[12]高峰,雷聲隆,龐鴻賓.節(jié)水灌溉工程模糊神經(jīng)網(wǎng)絡(luò)綜合評價模型[J].農(nóng)業(yè)工程學(xué)報,2003,19(4):84—87.
[13]劉從柱.大型灌區(qū)節(jié)水改造項目后評估指標(biāo)體系與評估方法研究[D].西安理工大學(xué),2007.
S274
A
1002-0624(2017)07-0055-04
2016-09-24