張麗娟,黃 晟,梅 誠(chéng),許薛軍
(1.華南理工大學(xué)土木與交通學(xué)院,廣東 廣州 510640;2.廣東省交通運(yùn)輸規(guī)劃研究中心,廣東 廣州 510101)
隨著行車荷載和使用年限的增加,瀝青路面服務(wù)水平不斷下降,路面逐漸發(fā)生破壞,準(zhǔn)確預(yù)測(cè)瀝青路面使用性能衰變規(guī)律,可為掌握瀝青路面技術(shù)狀況、評(píng)定路面結(jié)構(gòu)設(shè)計(jì)優(yōu)劣、制定養(yǎng)護(hù)決策提供依據(jù)。
瀝青路面使用性能受自然環(huán)境、交通荷載、結(jié)構(gòu)設(shè)計(jì)、材料性能、施工質(zhì)量和維修養(yǎng)護(hù)等多因素綜合影響,使得預(yù)測(cè)瀝青路面性能十分復(fù)雜。目前國(guó)內(nèi)外比較常見的確定型預(yù)測(cè)模型包括經(jīng)驗(yàn)法和力學(xué)經(jīng)驗(yàn)法等。如美國(guó)(NCHRP)1-37A模型[1]、KIM[2]等開發(fā)的基于力學(xué)經(jīng)驗(yàn)法的在役路面車轍預(yù)測(cè)模型;孫立軍[3]等提出基于瀝青路面初始性能指數(shù)、路齡等因素的瀝青路面性能衰變模型;汪海年[4]等提出了考慮當(dāng)?shù)貧夂驐l件、交通荷載與參數(shù)校正的MEPDG半剛性基層瀝青路面車轍預(yù)估模型。這些模型都是用數(shù)據(jù)擬合的回歸模型,預(yù)測(cè)值與真實(shí)值可以產(chǎn)生很大偏差,且有些模型考慮的性能影響因素不夠全面。
目前我國(guó)公路管理部門構(gòu)建了多個(gè)公路養(yǎng)護(hù)信息管理平臺(tái),積累了大量的道路路線、區(qū)間、路面結(jié)構(gòu)、交通量、路況基礎(chǔ)數(shù)據(jù)。大數(shù)據(jù)技術(shù)是挖掘這些信息資源的重要工具,大數(shù)據(jù)的相關(guān)算法已在瀝青路面性能預(yù)測(cè)中得到應(yīng)用。如劉黔會(huì)[5]等利用支持向量機(jī)(SVM)回歸方法,建立瀝青路面使用性能的預(yù)測(cè)評(píng)價(jià)模型;趙靜[6]等提出了基于灰色關(guān)聯(lián)度分析和支持向量機(jī)回歸(GRA-SVR)的瀝青路面使用性能預(yù)測(cè)模型。
K最鄰近(K Nearest Neighbor,簡(jiǎn)稱KNN)算法是數(shù)據(jù)挖掘領(lǐng)域常用的機(jī)器學(xué)習(xí)算法,在大規(guī)模、大批量的數(shù)據(jù)分級(jí)分類方面,KNN算法具有獨(dú)特的快速性、便捷性與精準(zhǔn)性。近年來(lái),有學(xué)者采用K最鄰近算法預(yù)測(cè)道路路段短時(shí)行程時(shí)間[7-9],但未見K最鄰近算法應(yīng)用于瀝青路面使用性能預(yù)測(cè)上。本文利用廣東省普通國(guó)省道典型瀝青路面路況資料,探索K最鄰近算法在瀝青路面使用性能預(yù)測(cè)領(lǐng)域的應(yīng)用。
根據(jù)廣東省公路事務(wù)中心提供的資料,本文篩選了廣東省9條國(guó)道和124條省道的普通國(guó)省道干線路段(總長(zhǎng)度達(dá)13 576 km),從中統(tǒng)計(jì)出廣東省普通國(guó)省道典型路面結(jié)構(gòu)及其組成[10](見表1)。
從表1可見,排名前2位的路面結(jié)構(gòu)為水泥路面結(jié)構(gòu),排名前3~6位的路面結(jié)構(gòu)為瀝青路面結(jié)構(gòu)(A1~A4型)。在普通國(guó)省道典型瀝青路面結(jié)構(gòu)中,一般采用厚度為20~35 cm水泥穩(wěn)定級(jí)配碎石(CGA)基層和15~20 cm水泥穩(wěn)定碎石(CCS)底基層,有些底基層采用石灰穩(wěn)定集料(LSGA),有些路段為水泥混凝土路面(PCC)上加鋪瀝青面層。表1分別列出了A2~A4型瀝青路面結(jié)構(gòu)常見的2種基層結(jié)構(gòu)組成。
根據(jù)表1的統(tǒng)計(jì)結(jié)果,本文選用A1~A4型瀝青路面結(jié)構(gòu)作為廣東省典型國(guó)省道典型瀝青路面結(jié)構(gòu)開展研究。
表1 廣東省普通國(guó)省道典型路面結(jié)構(gòu)Table1 ThetypicalpavementstructuresincommonnationalandprovincialtrunkhighwaysinGuangdongprovince排序路面結(jié)構(gòu)編碼路面結(jié)構(gòu)組成路面類型所占比例/%1C1水泥混凝土(23-26cm)水泥路面37.172C2水泥混凝土(20-23cm)水泥路面20.563A1瀝青混凝土(0-4cm)+(20-25)cmPCC+(15-20)CGA瀝青路面6.184A2A2-1瀝青混凝土(12-15cm)+(20-25)cmCGA+(15-20)cmCCS瀝青路面3.90A2-2瀝青混凝土(12-15cm)+(20-25)cmCGA+(15-20)cmLSGA5A3A3-1瀝青混凝土(15-16cm)+(20-25)cmPCC+(25-30)cmCGA瀝青路面3.71A3-2瀝青混凝土(15-16cm)+(30-35)cmCGA+(15-20)cmCCS6A4A4-1瀝青混凝土(8-10m)+(20-25)cmPCC+(15-20)cmCCS瀝青路面2.95A4-2瀝青混凝土(8-10m)+(25-30)cmCGA+(15-20)cmCCS
自然氣候條件、交通量和施工質(zhì)量是影響路面結(jié)構(gòu)使用性能的外部因素。根據(jù)對(duì)廣東省不同地區(qū)氣候、地質(zhì)及交通特點(diǎn)比較分析,從路面結(jié)構(gòu)設(shè)計(jì)角度來(lái)看,將全省劃分為2個(gè)自然片區(qū)較為合理,即粵北地區(qū)(①分區(qū)),珠三角、粵東和粵西地區(qū)(②分區(qū))。根據(jù)普通國(guó)省道交通量數(shù)據(jù),本文采用年平均日交通量AADT作為交通量分級(jí)的指標(biāo),將普通國(guó)省道交通量分成了輕交通、中交通、重交通3個(gè)等級(jí)。即輕交通等級(jí)的AADT值小于3 000 pcu/d,中交通等級(jí)的AADT為3 000~10 000 pcu/d,重交通等級(jí)的AADT大于10 000 pcu/d。
表1所列的典型瀝青路面結(jié)構(gòu)在兩個(gè)自然分區(qū)均有分布,且大多數(shù)普通國(guó)省道路段的交通量屬于重交通和中交通等級(jí),輕交通量等級(jí)情況只出現(xiàn)在部分省道中。A1瀝青路面結(jié)構(gòu)的瀝青面層厚度偏薄,只見于省道的輕交通量等級(jí)路面中,多屬于舊路改造路面。
根據(jù)自然氣候條件、交通荷載條件特點(diǎn),廣東省分為2個(gè)自然片區(qū),交通荷載分為輕、中、重3個(gè)交通量等級(jí)。根據(jù)面層、基層類型的材料及厚度差異,表1所列的典型瀝青路面結(jié)構(gòu)實(shí)際上可以細(xì)化為26種典型瀝青路面結(jié)構(gòu)。
根據(jù)《公路技術(shù)狀況評(píng)定標(biāo)準(zhǔn)》(JTG 5210-2018),采用路面使用性能指數(shù)PQI作為瀝青路面使用性能狀況評(píng)定指標(biāo)。PQI由路面損壞狀況指數(shù)PCI、路面行駛質(zhì)量指數(shù)RQI、路面車轍深度指數(shù)RDI、路面抗滑性能指數(shù)SRI等4個(gè)分項(xiàng)指標(biāo)組成。路面使用性能狀況分為優(yōu)、良、中、次、差5個(gè)等級(jí),PQI值評(píng)價(jià)等級(jí)分級(jí)標(biāo)準(zhǔn)見表2。
表2 PQI值評(píng)價(jià)等級(jí)分級(jí)標(biāo)準(zhǔn)Table2 ClassificationcriteriaofPQIevaluationlevel等級(jí)優(yōu)良中次差PQI值/%90^10080^9070^8060^700^60
根據(jù)廣東省公路事務(wù)中心提供的資料,本文選取了在2011年-2015年內(nèi)路面沒有進(jìn)行大中修、僅進(jìn)行普通日常養(yǎng)護(hù)情況下具有代表性的典型瀝青路面結(jié)構(gòu)路段,統(tǒng)計(jì)了上述26種廣東省國(guó)省道典型瀝青路面結(jié)構(gòu)的PCI、RQI、RDI、SRI等分項(xiàng)指標(biāo)5a檢測(cè)數(shù)據(jù),計(jì)算出PQI值。
圖1~圖5分別為不同自然分區(qū)、交通量等級(jí)下典型瀝青路面結(jié)構(gòu)的PQI值變化規(guī)律。
圖1 ①分區(qū)重交通條件下PQI值趨勢(shì)
圖2 ②分區(qū)重交通條件下PQI值趨勢(shì)
圖3 ①分區(qū)中交通條件下PQI值趨勢(shì)
圖4 ②分區(qū)中交通條件下PQI值趨勢(shì)
圖5 輕交通條件下PQI值趨勢(shì)
從圖1~圖5可以看出,各典型瀝青路面結(jié)構(gòu)代表性的5年評(píng)價(jià)等級(jí)都在“良”級(jí)以上,路面結(jié)構(gòu)使用性能隨時(shí)間而衰減,交通量越大,衰減程度越大。在交通量相同條件下,廣東省不同地區(qū)的瀝青路面使用性能差異不顯著。
K最鄰近(KNN)算法是數(shù)據(jù)挖掘領(lǐng)域中基于實(shí)例學(xué)習(xí)的非參數(shù)回歸預(yù)測(cè)法,通過(guò)搜索訓(xùn)練集數(shù)據(jù)庫(kù)中與預(yù)測(cè)值特征向量最相似的K個(gè)樣本來(lái)進(jìn)行分類和預(yù)測(cè)。如果某一個(gè)樣本與該訓(xùn)練集空間中K個(gè)最相似(即訓(xùn)練集空間中最近鄰)的樣本中的絕大多數(shù)都屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別[11-12]。KNN算法采用距離度量的方式判斷歷史數(shù)據(jù)與預(yù)測(cè)值特征向量的近似程度。
本文以歐幾里得距離(Euclidean)作為距離算法,以最大投票法(Consensus)作為決策類別屬性算法,在K值未定情況下,KNN算法步驟為:
a.通過(guò)己經(jīng)采集的數(shù)據(jù)構(gòu)建訓(xùn)練集S。其中,S由i個(gè)樣本組成,每個(gè)樣本由m個(gè)特征向量(輸入變量)及輸出變量y構(gòu)成,其數(shù)學(xué)表達(dá)式為:
(1)
b.先擬定K值(通常為奇數(shù)),再根據(jù)預(yù)測(cè)結(jié)果最終確定K值。
c.設(shè)yp為預(yù)測(cè)值(輸出變量),xp為預(yù)測(cè)值yp的特征向量,計(jì)算特征向量xp與訓(xùn)練集S中歷史特征向量xm的歐幾里得距離dm:
(2)
d.將計(jì)算得到的預(yù)測(cè)值特征向量與訓(xùn)練集歷史特征向量的距離由小到大排列,在訓(xùn)練集中搜尋出K個(gè)與xp距離最近的歷史特征向量,得出這K個(gè)歷史特征向量所對(duì)應(yīng)的輸出值集合y=[y1,y2,y3,…,yK]。
e.采用最大投票原則,投票數(shù)最多的輸出值yh(h∈K)即為待預(yù)測(cè)值yp。
KNN算法包括選擇訓(xùn)練集、構(gòu)建特征向量、選擇合適的K值、距離測(cè)量、決策判別等過(guò)程,如圖6所示。
圖6 KNN算法流程圖
a.建立KNN模型的訓(xùn)練集和測(cè)試集。
利用KNN算法預(yù)測(cè)路面使用性能時(shí),需要先建立有足夠多樣性和復(fù)雜性樣本的訓(xùn)練集,以保證訓(xùn)練集有一定的深度與廣度。表1所列的A1、A3、A4型瀝青路面結(jié)構(gòu)的組成、厚度各異,所在路段分布在①分區(qū)和②分區(qū),且有輕、中、重3種交通量等級(jí),滿足訓(xùn)練集的深度與廣度要求。因此,以A1、A3、A4型瀝青路面結(jié)構(gòu)作為訓(xùn)練集,將A2型瀝青路面結(jié)構(gòu)作為測(cè)試集。
b.建立KNN模型輸入、輸出指標(biāo)體系。
將影響路面使用性能的因素(自然分區(qū)、交通量等級(jí)、面層類型及厚度、基層類型及厚度、路齡)作為輸入指標(biāo)(特征向量),將PQI值及其評(píng)價(jià)等級(jí)作為輸出指標(biāo)(輸出變量),本文在Matlab平臺(tái)上進(jìn)行KNN算法仿真分析。在Matlab平臺(tái)上,自然分區(qū)、交通量等級(jí)、性能評(píng)價(jià)等級(jí)等無(wú)法以文本形式輸入,需要將文本轉(zhuǎn)化為數(shù)字形式輸入。
本文運(yùn)用歐幾里得距離算法,在由A1、A3、A4型瀝青路面結(jié)構(gòu)數(shù)據(jù)構(gòu)建的訓(xùn)練集中尋找K個(gè)近似樣本,通過(guò)最大投票法決策類別屬性算法預(yù)測(cè)A2型路面結(jié)構(gòu)的PQI值及其性能等級(jí),并與實(shí)測(cè)得到的PQI值進(jìn)行比較。
圖7~圖10為K=3時(shí)各自然分區(qū)、交通量等級(jí)下A2型瀝青路面結(jié)構(gòu)PQI值預(yù)測(cè)值和實(shí)測(cè)值。
圖7 ①分區(qū)重交通條件下PQI值預(yù)測(cè)(K=3)
圖8 ②分區(qū)重交通條件下PQI值預(yù)測(cè)(K=3)
圖9 ①分區(qū)中交通條件下PQI值預(yù)測(cè)(K=3)
圖10 ②分區(qū)中交通條件下PQI值預(yù)測(cè)(K=3)
圖11~圖14為K=5時(shí)各自然分區(qū)、交通量等級(jí)下A2型瀝青路面結(jié)構(gòu)的PQI值預(yù)測(cè)值和實(shí)測(cè)值。
圖11 ①分區(qū)重交通條件下PQI值預(yù)測(cè)(K=5)
圖12 ②分區(qū)重交通條件下PQI值預(yù)測(cè)(K=5)
圖13 ①分區(qū)中交通條件下PQI值預(yù)測(cè)(K=5)
圖14 ②分區(qū)中交通條件下PQI值預(yù)測(cè)(K=5)
選擇平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分誤差(MAPE)作為評(píng)價(jià)預(yù)測(cè)精度指標(biāo)。根據(jù)預(yù)測(cè)結(jié)果,計(jì)算出預(yù)測(cè)誤差指標(biāo)值見表3。
表3 KNN算法預(yù)測(cè)結(jié)果評(píng)價(jià)Table3 EvaluationofpredictedresultsbyKNNAlgorithmK值MAERMSEMAPE/%K=30.6920.8320.737K=50.7640.8740.793
從表3可見,兩個(gè)K值的PQI預(yù)測(cè)結(jié)果平均絕對(duì)百分誤差均小于1%,滿足預(yù)測(cè)精度要求,體現(xiàn)了KNN算法這種非參數(shù)回歸方法的優(yōu)越性。K=3時(shí)PQI值預(yù)測(cè)結(jié)果的MAE、RMSE和MAPE值均小于K=5時(shí)的值,說(shuō)明在該路面性能KNN預(yù)測(cè)模型中,K取值為3時(shí),預(yù)測(cè)誤差小、精度高。
a.基于K最鄰近算法的瀝青路面使用性能預(yù)測(cè)方法考慮了瀝青路面使用性能的非線性影響因素,其以自然分區(qū)、交通量等級(jí)、面層類型及厚度、基層類型及厚度、路齡作為特征向量,將PQI值及其評(píng)價(jià)等級(jí)作為輸出向量。KNN模型是一種多因素的綜合模型,相對(duì)于其他模型考慮的影響因素更多。
b.利用廣東省普通國(guó)省道典型瀝青路面結(jié)構(gòu)5 a的路況歷史數(shù)據(jù),構(gòu)建了KNN預(yù)測(cè)模型的訓(xùn)練集,PQI預(yù)測(cè)結(jié)果平均絕對(duì)百分誤差小于1%,模型預(yù)測(cè)精度較高,為瀝青路面結(jié)構(gòu)設(shè)計(jì)和制定養(yǎng)護(hù)決策提供參考依據(jù)。
c.模型預(yù)測(cè)結(jié)果受限于訓(xùn)練集的數(shù)據(jù)特性。如實(shí)例中訓(xùn)練集的瀝青路面結(jié)構(gòu)性能評(píng)價(jià)等級(jí)皆為“優(yōu)”、“良”等級(jí)時(shí),測(cè)試集瀝青路面結(jié)構(gòu)的性能評(píng)價(jià)等級(jí)結(jié)果呈現(xiàn)出只有“優(yōu)”、“良”等級(jí)的特點(diǎn)。因此,要求訓(xùn)練集的數(shù)據(jù)應(yīng)具有一定的廣度與深度,才能保證預(yù)測(cè)結(jié)果的準(zhǔn)確性。
d.K最鄰近算法是大數(shù)據(jù)挖掘算法,數(shù)據(jù)樣本的規(guī)模越大,其評(píng)價(jià)和預(yù)測(cè)結(jié)果更科學(xué)、準(zhǔn)確。將獲得的數(shù)據(jù)不斷補(bǔ)充到訓(xùn)練集中,基于K最鄰近算法的瀝青路面使用性能預(yù)測(cè)方法可實(shí)現(xiàn)動(dòng)態(tài)預(yù)測(cè),推進(jìn)大數(shù)據(jù)技術(shù)在道路工程領(lǐng)域中的應(yīng)用。