盧軍源 劉宇 馬進
摘要:文章介紹了加權屬性K-means聚類算法在路面養(yǎng)護工程中的應用,提出了基于該算法的高速公路路面技術狀況分析及養(yǎng)護路段劃分決策,并以廣西某高速公路養(yǎng)護工程為例,對傳統(tǒng)K-means和加權屬性K-means聚類分析法在路面技術狀況屬性特征類似的每百米路段分類中的應用進行了比較。結果表明:加權屬性聚類算法比傳統(tǒng)的聚類算法更有效、可靠,可為今后高速公路養(yǎng)護工程項目提供計算分析和科學決策參考。
關鍵詞:數(shù)據(jù)挖掘;聚類分析;技術狀況;加權屬性;養(yǎng)護決策
中國分類號:U418.1
0引言
在養(yǎng)護工程實際工作中一般以每公里路段作為技術狀況評定或實施養(yǎng)護工程單元,且路況評定指標是以每公里為單元的平均值計算,不能反映病害的具體位置。若以每公里及更長里程為單元進行養(yǎng)護分析和病害處治,不利于精準地實施養(yǎng)護、維修的科學決策,必然會造成資源的浪費。況且現(xiàn)行養(yǎng)護技術規(guī)范內的養(yǎng)護決策樹技術指標閾值是以路網(wǎng)級的養(yǎng)護水平制定的,未必能夠適用于項目級養(yǎng)護工程。因此,依據(jù)大量的路況數(shù)據(jù)將養(yǎng)護路段細化劃分,有利于管理者決策和實際施工[1]。在大數(shù)據(jù)時代,數(shù)據(jù)挖掘應運而生,聚類分析作為數(shù)據(jù)挖掘的重要分支,在信息化時代有著舉足輕重的作用[2]。
1聚類分析方法理論
1.1傳統(tǒng)的K-means聚類算法
K-means聚類算法是由J.B.MacQueen在1967年提出的基于距離的聚類算法[3],但是沒有考慮不同屬性特征。其計算方法步驟如下:
2在路面養(yǎng)護工程的應用
2.1加權屬性K-means聚類方法
基于傳統(tǒng)K-means聚類分析并改進歐氏距離計算方法[4],有針對性地設定權重值,突出路面使用性能屬性,實現(xiàn)快速歸納不同路段位置的綜合病害特征,依據(jù)該特征進行路段劃分,可為相應的養(yǎng)護決策提供參考。加權屬性改進K-means聚類分析算法流程如圖1所示,其中k值和權重值ω的選擇成為聚類計算的關鍵。
2.2特征屬性數(shù)據(jù)標準化
由于路面技術狀況檢測指標如平整度、破損率、橫向力系數(shù)和車轍深度等在數(shù)值上不是一個量級,根據(jù)歐氏距離計算原理,直接進行聚類計算,量級大的樣本屬性如橫向力系數(shù)的影響最大,最終聚類結果會偏向該屬性,其他各類中屬性無明顯劃分,會陷入局部優(yōu)解。因此,在進行聚類分析前需要對不同的路面技術狀況指標數(shù)據(jù)進行標準化。
2.3聚類參數(shù)選擇方法
2.3.1聚類k值的選擇
在K-means聚類分析方法中[5],k值是人為設定的,往往需要領域專家結合實際狀況和需求定義。在高速公路養(yǎng)護工程中,基于路面技術狀況分項指標進行聚類分析,實際上是根據(jù)不同路面技術狀況進行路段劃分,不同路段有不同的屬性特征,理清“養(yǎng)護哪兒”“怎么養(yǎng)護”的主要矛盾。主要參考兩方面因素:(1)依據(jù)路面養(yǎng)護時機;(2)根據(jù)養(yǎng)護措施的綜合修復效果。以路面病害較為復雜的瀝青路面為例(如圖2所示),綜合瀝青路面病害屬性養(yǎng)護措施為4類、養(yǎng)護時機為4類,本文選定k=4進行聚類計算,其他聚類計算可參考本文研究思路進行選擇。
2.3.2權重值的選擇
由于不同屬性對路面技術狀況的重要程度有差異,因此為保證聚類的精度和效率,根據(jù)不同屬性對聚類結果的影響、重要程度進行賦權,進行加權時需要將計算的權重用在歐式距離計算中。聚類分析方法在路面養(yǎng)護工程中的應用需要在各種約束條件下進行才能獲取良好的聚類效果。依據(jù)路面技術狀況評定等級里程的統(tǒng)計,選擇參與聚類分析分項指標評定等級為良、中、次、差的里程數(shù),用于本文研究加權屬性聚類的權重值計算。權值計算方法如下頁表1所示。
3應用項目案例
現(xiàn)以廣西某高速公路養(yǎng)護工程項目為案例,路段全長108 km,以2019年度路面技術狀況指標檢測結果DR、RD、SFC和IRI的每百米數(shù)據(jù)作為樣本對象,上下行各1 080個樣本,分別采用傳統(tǒng)K-means和加權屬性K-means聚類分析法,將路面技術狀況屬性特征類似的每百米路段分類。學者們通常應用SPSS等軟件直接進行聚類運算和統(tǒng)計分析,但是類似軟件并沒有特征屬性設置權重值的功能。本文應用Python編寫傳統(tǒng)K-means聚類和加權屬性K-means聚類兩種算法的程序,統(tǒng)計分析聚類結果。
3.1聚類計算過程
根據(jù)前文所述將數(shù)據(jù)進行標準化,并選擇聚類K=4。依據(jù)2019年廣西某高速公路路面技術狀況分項指標評定里程匯總如表2所示,按前文的計算方法,計算聚類屬性距離權重值ωDR=0.04,ωIRI=0.06,ωSFC=0.81,ωRD=0.09。
3.2聚類計算結果分析
3.2.1傳統(tǒng)的K-means聚類結果
對上述高速公路上行路段樣本,執(zhí)行計算結果為A、B、C、D共4類,如表3所示。A類和D類是路面養(yǎng)護需重點關注路段,主要病害是抗滑不足和平整度較差,可采取加鋪薄層罩面或銑刨重鋪的養(yǎng)護措施提高路面使用性能。但路況分項指標數(shù)值范圍出現(xiàn)嵌套,劃分類別中路段特征屬性有重疊,主要原因是數(shù)據(jù)組屬性提供的貢獻一致,并且受到隨機初始聚類中心的影響,聚類準確性不高。
3.2.2加權屬性的K-means聚類結果
對上述高速公路上、下行路段樣本,執(zhí)行計算結果為1、2、3、4共4類,結論如下:
(1)如表4和表5所示分別為廣西某高速公路上、下行路段應用加權屬性K-menas聚類計算結果,對比該傳統(tǒng)的算法,路面技術狀況各分項指標的數(shù)值范圍內基本消除類別之間嵌套的問題,劃分類別中數(shù)據(jù)屬性能突出病害特征,能夠更清晰地判斷主要路面技術狀況問題。
(2)上、下行路段分別將各個百米路段劃分為4類(根據(jù)路面技術狀況數(shù)據(jù)總結和判斷病害特征):路況良好、但抗滑性能一般;抗滑不足,局部破損嚴重、平整度較差;抗滑不足、局部輕微車轍;路況良好。
(3)依據(jù)聚類結果的主要分類,表4、表5各個類別的路面屬性指標數(shù)據(jù)最大、最小值范圍,可將4個路段類別結合養(yǎng)護時機和養(yǎng)護措施實施養(yǎng)護決策。
(4)圖3和圖4所示為加權屬性聚類計算結果中百米路段的4個類別在某高速公路全線的分布點位、分段連續(xù)情況。根據(jù)表4和表5中4個類別的路況特點分析,抗滑不足、局部路段路面損壞嚴重和有車轍的路段主要集中在K1655~K1675段,經調查該路段多處為長大縱坡及轉彎超高路段,且貨車比例高達52%,抗滑性能較其他路段衰減快。
3.2.3基于聚類結果的路面養(yǎng)護建議
根據(jù)加權屬性K-means聚類分析結果,主要關注1類、2類、3類路段,4類路段可在3~5年內實施日常養(yǎng)護。針對2類路段建議立即采取養(yǎng)護措施,鑒于抗滑不足的主要問題,可實施預防養(yǎng)護手段,對原有路面加鋪超薄磨耗層;對3類路段可列入養(yǎng)護計劃之中,或者合并至2類路段一起實施養(yǎng)護,滿足施工連續(xù)性,具體情況依統(tǒng)籌養(yǎng)護資金和養(yǎng)護期限決定;1類路段抗滑性能一般,未來2~3年作為觀察期,依據(jù)每年度路面技術狀況檢測進行養(yǎng)護決策。
4結語
(1)用加權屬性的方法改進的K-means聚類分析,可以解決在傳統(tǒng)聚類分析中路面技術狀況各分項指標的數(shù)值范圍類別之間嵌套的問題,改進后各個類別的數(shù)據(jù)屬性能突出病害特征,能夠清晰判斷主要路面病害問題,提高路面養(yǎng)護路段劃分的準確性,便于養(yǎng)護決策分析。
(2)本文在k值的選擇上考慮了病害類型、養(yǎng)護措施和養(yǎng)護時機等方面情況,通常情況可以采用基于每個簇的質點與簇內樣本點的平方距離誤差和原理的“肘部法則”計算最佳k值,比較假定的k值是否接近,是否滿足最優(yōu)條件。
(3)加權屬性K-means聚類分析可綜合考慮所有可以量化的性能指標,但在實際養(yǎng)護工程中還有些非量化的因素,如歷史施工情況、養(yǎng)護投資、施工連續(xù)性要求、氣候影響等,不易在本文聚類方法中實現(xiàn)。因此,對于具體的養(yǎng)護決策應根據(jù)本文方法的計算結果綜合考慮其他的非量化因素或者將其因素量化后分析再確定實際的路段劃分。
參考文獻:
[1]汪首元,崔玉姣,馬偉中,等.基于K-均值聚類的瀝青路面使用性能評價[J].公路交通科技(應用技術版),2019(2):16-18.
[2][JP3]張陽,何麗,朱顥東.一種改進的K-means動態(tài)聚類算法[J].重慶師范大學學報(自然科學版),2016,33(1):97-101[JP2].
[3]孟海東,宋宇辰.大數(shù)據(jù)挖掘技術與應用[M].北京:冶金工業(yè)出版社,2014.
[4]董旭,魏振軍.一種加權歐式距離聚類方法[J].信息工程大學學報,2005,6(1):23-25.
[5]金鑫.聚類分析原理在高速公路養(yǎng)護路段劃分中的應用[J].北方交通,2016(5):90-94.