傅蜀燕,歐 斌,林志祥,3,高勝松
(1.南京水利科學研究院水文水資源與水利工程科學國家重點實驗室,江蘇 南京 210098;2.云南農業(yè)大學水利學院,云南 昆明 650201;3.云南省水利廳工程管理局,云南 昆明 650021;4.云南農業(yè)大學機電工程學院,云南 昆明 650201)
將堤防工程劃分為若干單元堤段,再將相似性較高的單元堤段劃為一類,實現(xiàn)堤防分類管理是提高堤防工程日常運行管理效率的有效方法。目前國內學者針對堤防分類方法開展了一些研究:馬曉忠等[1]按地質情況和地理位置將堤防分為若干組合堤段,再將組合堤段按堤防工程的填筑情況和堤身結構劃分為若干單元堤段,但分類依據不夠細化;楊德瑋等[2]細化了單元堤段的劃分依據,但未考慮單元堤段的相似性歸類,致使安全評價的工作量依然較大;張清明等[3]先按照堤防結構與外部環(huán)境擬定單元堤段,再選取不同指標對單元堤段進行聚類分析,但缺少對聚類結果優(yōu)劣的判定分析。鑒于此,本文在現(xiàn)有單元堤段劃分的基礎上,采用模糊聚類方法對單元堤段的各類指標進行相似性度量,再進行聚類分析,通過調整閾值,優(yōu)化分類組合并結合混合F統(tǒng)計方法和模糊劃分熵進行驗證,從而實現(xiàn)堤防工程單元堤段的最優(yōu)分類。
堤防工程可視作若干單元堤段組成。單元堤段劃分的基本原則為:
a. 將歷史曾經出險的險工段劃分為一個單元堤段。
b. 未曾出險堤段,則根據堤防斷面的主要特征(結構形式、地質條件、支護形式等),相同的堤段劃為同一單元堤段[3-4]。
單元堤段包含眾多屬性指標,選取堤身土黏粒含量、堤身干密度、背水面坡比、堤基結構、堤防隱患情況等作為單元堤防劃分的核心指標,其中前3項屬于定量指標,后2項屬于定性指標,定性指標按表1細分為4類。
表1 堤防定性指標分類
在將堤防劃分為若干單元的基礎上,視每個單元堤段包含若干區(qū)分其特性的核心指標,如表2所示。
表2 單元堤段核心指標
表2中X1~Xn代表所有的單元堤段集合,C1~Cp表示單元堤段核心指標的集合。這些指標能夠從不同角度描述單元堤段的特征,但也給聚類分析帶來了一定困難,尤其是定量指標,它們的量綱和量級并不一致,如不加調整地使用,數值較小的指標容易被忽略,因此有必要對原始指標值進行處理。處理方式主要有兩種:
a. 忽略量綱的差異,直接對各個定量指標的數值進行放大或縮小,使其量級大致相同,易于比較。
b. 對各個定量指標進行歸一化處理,因歸一化處理的目的是對單元堤段進行分類,并不比較優(yōu)劣,所以可以不考慮定量指標是成本型指標還是效益型指標。
本文定量指標采用歸一化處理方法[5]。
對于粗集決策表中定量指標和定性指標,需要采取合適的相似性度量公式構建模糊相似矩陣。單元堤段的相似性可以用它們之間的距離來衡量。對于定量指標,常用的距離公式有Minkowski距離、Manhattan距離、Euclidean距離、Mahalanobis距離、Chebyshev距離等。本文采用Euclidean距離公式,即
(1)
式中:dE為單元堤段之間關于定量指標的歐氏距離;cik、cjk分別為單元堤段Xi和單元堤段Xj第k個定量指標值;w為定量指標的個數。
對于定性指標,定義函數f(a,b)為
(2)
則單元堤段Xi和單元堤段Xj關于定性指標的距離為
(3)
式中:cik′、cjk′分別為單元堤段Xi和單元堤段Xj第k′個定性指標值;q為定性指標的個數。
由上述分析可知,單元堤段Xi和單元堤段Xj的相似性度量公式為
rij=r(Xi,Xj)=
(4)
由式(4)可建立n階模糊相似矩陣為
(5)
模糊相似矩陣R只滿足自反性和相似性,不具有傳遞性,可用平方法求傳遞閉包t(R),即R2=RR,R4=R2R2,……
經過有限次運算后,一定有R2k=R2(k+1),于是可以得到一個模糊等價矩陣t(R)=R2k。
然后設定模糊等價矩陣的閾值λ∈[0,1],若t(R)中rij≥λ,則單元堤段Xi和Xj可劃分為同一類[6-7]。在聚類過程中,可以不斷調整λ,直至得到比較合適的類別總數。
某堤防工程全長12.92 km,是流域平原區(qū)重要的防洪保護工程。堤防典型斷面堤頂寬6 m,堤身平均高度12.5 m,臨水側坡比1∶2.5,背水側受地形限制,坡比為1∶2和1∶2.5兩類,堤身為壤土均質土堤。河道水位主要受徑流影響,一般每年5—10月為汛期,11月—次年4月為枯季,水位變幅較大且呈現(xiàn)較明顯的年周期變化,歷史最高水位為 10.22 m。河道內廣泛發(fā)育著谷內式松散沉積物,在底部有古長江沉積的圓礫、礫砂及少量中細砂及砂壤土、黏性土;上部為砂壤土、粉細砂、黏性土及淤泥質土;表層則為最近代泛濫沉積的粉土-黏性土,歷經水流沖刷-沉積。由于水流緩慢、穩(wěn)定,沉積的規(guī)律性、層次均較明顯,夾層、互層狀,薄層分布、水平層理發(fā)育是其主要特性。
依據堤防單元堤段劃分的基本原則,全長12.92 km堤防共劃分為12個單元堤段,按照堤身土黏粒含量、堤身干密度、背水面坡比、堤基結構、堤防隱患情況等5類指標,單元堤段核心指標統(tǒng)計如表3所示。
表3 單元堤段核心指標統(tǒng)計
對表3中定量指標和定性指標分別采用式(1)和式(3)進行歸一化處理,然后采用式(4)建立單元堤段模糊相似矩陣R:
再對模糊相似矩陣R采用平方法給予改進:
對R4進行檢驗后知,其滿足自反性、對稱性,且R4°R4?R4,故R4滿足傳遞性,因此R4是一個模糊等價矩陣。取λ=0.7,得到λ截距矩陣Rλ為
Rλ=(rij)=
據此獲得該堤防的分類為{X1,X2,X4,X5,X8,X9,X10}、{X3}、{X6,X12}、{X7}、{X11}共5類,即原有的12個單元堤段被劃分為5類。當取λ=0.80,得到堤防的分類為{X1,X2,X4,X5,X8}、{X3}、{X9,X10}、{X6,X12}、{X7}、{X11}6類。
為驗證分類的優(yōu)劣程度,先采用混合F統(tǒng)計方法(Mixed-F)確定最佳分類數[8],分類結果如表4所示。當分類數為6時,對應的Mixed-F值最大,說明該分類數為最佳分類數。進一步驗證該分類的可靠性,采用模糊劃分熵進行評價[9],文獻中擬定某兩類的重疊程度(Hij(U;c))達到0.75時,兩類歸為同一類,驗證λ=0.80時,6類單元堤段(編號I~VI)之間的Hij(U;c)如表5所示。6類單元堤段的重疊度均較低,驗證了該分類的可靠性。
表4 不同分類數對應的Mixed-F
表5 不同分類數之間的Hij(U;c)
在劃分單元堤段的基礎上,采用
模糊聚類方法對單元堤段的定性指標和定量指標進行相似性度量,構建單元堤段模糊相似矩陣,采用平方法計算出模糊相似矩陣對應的模糊等價矩陣。通過不斷調整設置閾值,對單元堤段進行分類,再采用Mixed-F法和模糊劃分熵對分類結論進行了驗證,得到單元堤段劃分為6類的最優(yōu)分類方式,實現(xiàn)了減少堤防日常管理與安全評價工作量的目的。
參考文獻:
[1] 馬曉忠,彭雪輝,張友明,等.基于單元堤段洪澤湖大堤風險分析[J].水利水電技術,2015,46(4):143-147.
[2] 楊德瑋,盛金保,彭雪輝.堤防工程單元堤安全等級評判及風險估計[J].水電能源科學,2016,34(2):77-81.
[3] 張清明,徐帥,周楊.堤防工程安全評價單元堤段選取方法研究[J].人民黃河,2012,34(1):16-18.
[4] 歐斌. 土質堤防滲流和穩(wěn)定性狀剖析與安全評測方法[D].南京:河海大學,2016.
[5] 肖漢光,蔡從中. 特征向量的歸一化比較性研究[J].計算機工程與應用,2009,45(22):117-119.
[6] 羅蘭星. 模糊聚類分析中傳遞閉包法及其應用[J]. 四川省衛(wèi)生管理干部學院學報,2005,24(2):108-110.
[7] 周玉新,周志芳,孫其國.巖體結構面產狀的綜合模糊聚類分析[J].巖石力學與工程學報,2005,24(13):2283-2287.
[8] BEZDEK J C. Pattern recognition with objective function algorithms[M]. New York:Plenum Press,1981.
[9] 孫才志,王敬東,潘俊.模糊聚類分析最佳聚類數的確定方法研究[J]. 模糊系統(tǒng)與數學,2001,15(1):89-92.