張金喜,郭旺達,宋 波,禚永昌,張陽光
(1.北京工業(yè)大學城市交通學院交通工程北京市重點實驗室,北京 100124;2.北京市道路工程質(zhì)量監(jiān)督站,北京 100076)
目前,我國交通基礎(chǔ)設(shè)施建設(shè)日趨完善,道路工程由“建”轉(zhuǎn)“養(yǎng)”已成為當下發(fā)展的必然趨勢.路面性能預(yù)測是路面養(yǎng)護與管理的重要內(nèi)容,精確地把握瀝青路面關(guān)鍵性能指標的衰變情況,有利于針對最佳的養(yǎng)護時機,制定科學的養(yǎng)護決策方案,以發(fā)揮路面最大的服役效益[1].路面狀況指數(shù)(pavement condition index,PCI)作為路面技術(shù)狀況評定的關(guān)鍵指標之一,用來評價路面的完好程度.因此如何對瀝青路面PCI進行更加準確、高效的預(yù)測,已經(jīng)成為路面養(yǎng)護管理領(lǐng)域研究的重要課題.
瀝青路面性能衰變是路面在實際服役過程中對引起其原有路面結(jié)構(gòu)或功能改變的因素的反饋.這些因素包括路面結(jié)構(gòu)、交通荷載、自然環(huán)境、養(yǎng)護干預(yù)等,冗雜繁多,因此表征路面性能的性能指標與其影響因素之間的非線性關(guān)系是極其復(fù)雜的.針對路面性能預(yù)測問題,國內(nèi)外眾多學者研究方法不一.路面性能預(yù)測的經(jīng)典模型是確定型模型,杜艷花[2]、張金喜等[3]通過總結(jié)高速公路路面性能指標隨時間的變化特點,采用指數(shù)型函數(shù)對歷史數(shù)據(jù)進行擬合,分別用于預(yù)測國際平整度指數(shù)(international roughness index,IRI)和路面PCI的衰變情況;肖金平等[4]在分析不同路面結(jié)構(gòu)的基礎(chǔ)上,建立了路面性能指標的余弦函數(shù)型衰變方程,計算結(jié)果與實測結(jié)果一致性較好.然而經(jīng)典研究方法是一般只考慮性能指標關(guān)于時間序列的經(jīng)驗預(yù)測模型,未能建立路面性能指標與其影響因素之間的非線性關(guān)系,與實際路面性能衰變情況匹配度相差較大,并且預(yù)測精度隨著預(yù)測周期的推移會逐漸降低.近年來隨著機器學習受到越來越多的關(guān)注,針對這種非線性的路面性能預(yù)測問題便有了新的研究方向.諸如人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、支持向量機(support vector machine,SVM)等人工智能方法在路面性能預(yù)測領(lǐng)域的出現(xiàn),解決了傳統(tǒng)線性預(yù)測模型無法應(yīng)對性能指標突變的問題.Satish等[5]基于人工神經(jīng)網(wǎng)絡(luò)建立平整度預(yù)測模型,雖然預(yù)測結(jié)果優(yōu)于線性回歸模型,但是由于樣本集不足導致局部出現(xiàn)過擬合的現(xiàn)象;趙靜等[6]將灰色理論與支持向量機模型相結(jié)合,綜合考慮路齡、交通荷載等因素建立車轍深度指數(shù)預(yù)測模型,在項目級預(yù)測中驗證了模型的精度,考慮到支持向量機模型易于表征小樣本情況下的非線性映射關(guān)系,對于路網(wǎng)級預(yù)測的效果仍有待驗證.
Breiman提出的隨機森林(randorn forest,RF)模型[7],可以有效地處理多因素耦合影響下的非線性回歸問題.相較其他機器學習模型,RF的魯棒性好、預(yù)測能力強.RF不僅克服了傳統(tǒng)經(jīng)驗?zāi)P驮谔幚韽?fù)雜交互作用的不足,而且與神經(jīng)網(wǎng)絡(luò)相比具有更強的抗噪和抗過擬合的能力.此外通過對比選取支持向量機核函數(shù)等參數(shù)復(fù)雜程度,構(gòu)建RF模型的超參數(shù)更容易理解.RF算法已經(jīng)成功被應(yīng)用到許多研究領(lǐng)域[8-12].但目前該算法在道路工程領(lǐng)域還未得到充分應(yīng)用.基于以上分析,本文提出一種基于RF的路面性能預(yù)測方法,并與神經(jīng)網(wǎng)絡(luò)、支持向量機預(yù)測模型的預(yù)測能力進行對比,以期找到一種路面狀況指數(shù)的精確預(yù)測方法來指導路面養(yǎng)護管理工作.
RF算法是一種在決策樹的基礎(chǔ)上建立的集成學習算法,可以用于解決分類和回歸問題.由于其泛化能力強、抗噪性能好,因此在地理[8]、農(nóng)業(yè)[9]、農(nóng)林學[10-11]、生物學[12]等領(lǐng)域都已經(jīng)取得了成功的應(yīng)用和推廣.RF對多重共線性不敏感,所以缺失數(shù)據(jù)和不平衡數(shù)據(jù)對預(yù)測結(jié)果的不良影響很小,最多可用數(shù)千個特征變量進行準確預(yù)測.現(xiàn)階段RF算法被視作是構(gòu)建非線性預(yù)測模型的最優(yōu)算法之一.
決策樹是RF算法的理論基礎(chǔ),在此對決策樹算法進行簡要介紹.決策樹作為識別重要變量和2個及以上特征變量關(guān)系最快的方法之一,可以用于解決分類和回歸問題.通常一棵決策樹由根節(jié)點出發(fā),經(jīng)由內(nèi)部節(jié)點逐層生長,最終在葉子節(jié)點處觸發(fā)生長閾值而停止生長.其中根節(jié)點代表整個總體,決策樹通過使用二分遞歸分割,將樣本集合通過相關(guān)策略拆分成2個子節(jié)點[13].經(jīng)過逐步拆分,最終由葉子結(jié)點輸出預(yù)測結(jié)果.假設(shè)存在一個同時包含預(yù)測變量和特征變量的訓練數(shù)據(jù)集D,構(gòu)造決策樹回歸算法流程如下.
1)遍歷全部特征后,找到最優(yōu)劃分特征和分割點(x(j),s),滿足均方誤差MSE(x(j),s)最小,然后劃分為2個節(jié)點.
2)對生成的2個節(jié)點重復(fù)調(diào)用1),直至滿足模型預(yù)設(shè)的停止生長條件(比如設(shè)置樹深、葉子節(jié)點包含的最少樣本數(shù)等).
3)根據(jù)最終生成的所有葉子節(jié)點,得到?jīng)Q策樹回歸器
(1)
式中:Rm為葉子節(jié)點的數(shù)量;cm為m點處的輸出值;I為指示函數(shù).
RF是以決策樹為基學習器通過集成方式構(gòu)建而成的有監(jiān)督機器學習方法[14],進一步在決策樹的訓練過程引入了隨機性,使其具備優(yōu)良的抗過擬合以及抗噪能力.RF分別從樣本選取和特征選擇2個角度體現(xiàn)其隨機性[15].
1)隨機選取樣本:RF中每一棵決策樹的樣本集均是從原始數(shù)據(jù)集中采用Bootstrap策略有放回地抽取、重組形成與原始數(shù)據(jù)集等大的子集合.這就意味著同一個子集里面的樣本可以是重復(fù)出現(xiàn)的,不同子集中的樣本也可以是重復(fù)出現(xiàn)的.
2)隨機選取特征:不同于單個決策樹在分割過程中考慮所有特征后,選擇一個最優(yōu)特征來分割節(jié)點.RF通過在基學習器中隨機考察一定的特征變量,之后在這些特征中選擇最優(yōu)特征[16].特征變量考察方式的隨機性使得RF模型的泛化能力和學習能力優(yōu)于個體學習器.
在回歸問題中,隨機森林回歸(random forest regression,RFR)模型在表征一組輸入和輸出之間高度非線性關(guān)系時表現(xiàn)出強大的學習能力.RFR算法流程如下:
1)組建訓練集D,采用Bootstrap策略從訓練集D中有放回地重復(fù)取樣,組成T個與訓練集D容量大小相等的新訓練集Di(1≤i≤T),即T個互相獨立的回歸決策樹.
2)在回歸樹i的M個特征中隨機考察m個子特征,遍歷每一個抽樣子特征后找到最優(yōu)劃分特征和分割點,滿足均方誤差MSE最小,然后劃分為2個節(jié)點并且不做剪枝處理.
3)對生成的2個節(jié)點重復(fù)調(diào)用步驟2),直至滿足模型預(yù)設(shè)的停止生長條件,決策樹hi生長完成.
4)集結(jié)所有獨立生長完成的回歸決策樹隨即生成RF回歸器
(2)
RF作為一種結(jié)構(gòu)復(fù)雜、實現(xiàn)簡單的集成學習算法,無須假設(shè)變量服從正態(tài)性等條件下即可完成對復(fù)雜數(shù)據(jù)集的分類和回歸建模[17],且對數(shù)據(jù)中的噪聲和異常值的包容程度較高,能夠有效地處理復(fù)雜的非線性交互作用,在很多領(lǐng)域的預(yù)測問題中都被證明了是一種有效的預(yù)測方法,但是在道路工程中的應(yīng)用寥寥無幾.由于本研究中預(yù)測變量與相關(guān)解釋變量均為連續(xù)型的數(shù)值變量,因此路面性能預(yù)測本質(zhì)上是一種非線性的回歸問題.鑒于此,本研究基于PCI數(shù)據(jù)組建訓練RFR模型的樣本集,并通過對比RFR模型較路面性能預(yù)測中常用機器學習模型(ANN、SVM)的預(yù)測能力,探討RFR模型在瀝青路面性能預(yù)測中的應(yīng)用.本文提出技術(shù)路線如圖1所示.
圖1 技術(shù)路線Fig.1 Technical route
特征變量相關(guān)描述如表1所示.本文以北京市瀝青路面為研究對象,從相關(guān)部門收集整理了2010—2016年的道路檢測數(shù)據(jù),氣候相關(guān)數(shù)據(jù)為北京市包括通州、密云在內(nèi)的9個縣區(qū)7年的氣象數(shù)據(jù),交通參數(shù)、路面結(jié)構(gòu)相關(guān)數(shù)據(jù)來自相關(guān)單位建養(yǎng)計劃.通過調(diào)查發(fā)現(xiàn),路面性能檢測時間可能會與養(yǎng)護工期沖突,因此造成目標年P(guān)CI值的缺失.此外在養(yǎng)護干預(yù)下路面結(jié)構(gòu)、材料的變化會導致路面性能變化趨勢突變.養(yǎng)護干預(yù)對于路面性能衰變影響重大,為排除此項因素干擾,本研究在進行數(shù)據(jù)篩選時選取的路段均為預(yù)測目標3年內(nèi)發(fā)生過養(yǎng)護干預(yù).本研究將PCI-1、AADT、AGE、PT、BT、ST、AP、AAT、SD作為模型的輸入變量,PCI作為模型的目標輸出變量.根據(jù)路面性能預(yù)測相關(guān)數(shù)據(jù)的收集以及參考國內(nèi)外文獻中進行路面性能預(yù)測工作提取的特征變量,確定組建容量為10×1 249的樣本集用于構(gòu)建路面性能預(yù)測的RF模型,其中訓練集與測試集的劃分比例為7∶3.
表1 特征變量相關(guān)描述Table 1 Description of the feature variables
本研究基于RF的路面性能預(yù)測模型的開發(fā)在Python 3.5平臺上實現(xiàn).在訓練模型過程中,必須定義對應(yīng)于RF算法的超參數(shù).在RF模型的構(gòu)建過程中,為了使預(yù)測模型誤差最小,采用網(wǎng)格搜索和十折交叉驗證的方法對路面性能預(yù)測模型中關(guān)鍵的超參數(shù)進行優(yōu)化,搜索結(jié)果如圖2所示.其中R2平均值和R2標準差分別表示十折交叉驗證下模型性能平均得分和穩(wěn)定性,前者越大說明模型性能得分越高,后者越小說明模型穩(wěn)定性越好.首先要確定的RF中決策樹的數(shù)量n_estimators,從圖2(a)可以看出隨著決策樹的數(shù)量由1增加到200時,R2平均值和R2標準差都呈現(xiàn)急劇變化并逐漸趨于穩(wěn)定.值得注意的是,如圖3所示模型的收斂時間由0.003 s增加至0.470 s.說明較少的樹無法很好地刻畫非線性關(guān)系,導致訓練后的RF模型擬合不足,當超過一定的臨界值后,繼續(xù)增加決策樹的數(shù)量并不會顯著提高模型的性能,反而會增加計算時間.除此之外,RF模型通過設(shè)置決策樹的最大深度max_depth控制其生長,當達到此閾值時決策樹會自動終止訓練.由圖2(b)可知,max_depth的模型性能曲線整體變化趨勢基本與n_estimators相同,本文不再進行過多贅述.通過折衷考慮模型性能得分、穩(wěn)定性和計算時間,本研究采用n_estimators=71、max_depth=51作為預(yù)測模型的最優(yōu)超參數(shù).
圖2 十折交叉驗證下關(guān)鍵參數(shù)調(diào)優(yōu)結(jié)果Fig.2 Results of the key parameters optimization using 10-fold cross-validation
圖3 收斂時間隨n_estimators變化趨勢Fig.3 Trend of the convergence time varies with the n_estimators
定量地比較不同機器學習模型學習效果的優(yōu)劣,是機器學習中一個不可或缺且十分重要的環(huán)節(jié).本研究采用均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE)、決定系數(shù)(R2)三個評價指標,評價機器學習模型的性能.前兩者是衡量預(yù)測值與實際值的接近程度,值越小說明預(yù)測精度越高;R2是預(yù)測值對于實際值的表達能力,值越大說明預(yù)測精度越高(最大為1).表征上述指標的數(shù)學表達分別為
(3)
(4)
(5)
本研究將基于RF的PCI預(yù)測模型的特征重要程度置換為相對特征重要程度.圖4給出了9種特征變量對于PCI預(yù)測的相對重要性得分.可以看出,PCI與目標年上1年的PCI高度相關(guān),時間序列數(shù)據(jù)對于路面性能預(yù)測至關(guān)重要.年平均日交通量AADT對于PCI預(yù)測的重要程度較大,這點通過交通荷載增加對路面結(jié)構(gòu)綜合累計損傷作用的增加不難被解釋.不同路齡狀況下路面性能衰變趨勢差異性顯著,因此PCI對于路齡這一特征變量敏感度較高.與路面自身結(jié)構(gòu)相關(guān)的特征變量中面層厚度PT、基層厚度BT這2個特征重要性略有差異,底基層厚度ST重要程度略低.由圖4可知,與氣象相關(guān)的特征變量對于PCI的影響同樣不容忽視,相對重要程度由大到小排序依次是日照時數(shù)SD、年降水量AP、年平均氣溫AAT,三者直接影響路面材料性能進而影響路面性能的衰變.
圖4 特征變量重要性Fig.4 Feature variable importance
本研究為證明基于RF的PCI預(yù)測模型的預(yù)測能力,保持與前者相同的訓練集和測試集,分別采用路面性能預(yù)測領(lǐng)域成功應(yīng)用的2種機器學習模型(SVM和ANN)進行對比研究.按照式(3)~(5)提出的評價指標,進一步定量地對比本文提出的3種機器學習模型性能.
表2給出了不同預(yù)測模型的RMSE、MAE、R2值以及計算時間.從表2看出,RFR模型在測試集和訓練集上表現(xiàn)出的學習能力和泛化能力強于ANN、SVR模型,對PCI預(yù)測具有可接受的準確性.總體來說,3種模型在訓練集上的RMSE分別為1.042、0.650、0.399,MAE分別為0.778、0.455、0.306,RFR表現(xiàn)出來的學習能力要優(yōu)于SVR和ANN模型.RFR預(yù)測模型的泛化能力優(yōu)越性顯著:相較前兩者,RFR模型的RMSE在測試集上分別降低了42.5%和17.7%,MAE分別下降了44.1%和15.8%,說明RF的預(yù)測值更加逼近實際值.此外,3種模型計算時間分別為0.259、0.130、0.174 s,這表明三者在此數(shù)據(jù)量大小下的計算效率并未存在顯著性差異.
表2 評價指標匯總Table 2 Summary of the evaluation indices
圖6 3種模型測試集預(yù)測值與實際值對比Fig.6 Comparison of the predicted and actual testing set of three models
圖5、6分別給出了評估3種模型在訓練集和測試集上預(yù)測值和實際值對比的散點圖.通過對比訓練集、測試集的預(yù)測結(jié)果,其中基于RF的PCI預(yù)測模型的R2分別達到0.976和0.916,預(yù)測精度優(yōu)于其他2個模型.對比圖5、6可知,訓練集的預(yù)測精度普遍高于其對應(yīng)的測試集的精度,考慮到R2相差不過10%且測試集樣本量不大,所以這種偏差并不嚴重.就訓練集樣本來說,ANN模型的預(yù)測值和實際值較零誤差線分散程度最大,SVM模型次之,RFR模型幾乎擬合在零誤差線附近,說明預(yù)測值和實際值基本達到一致.在測試集訓練結(jié)果中顯示,RFR模型的R2達到0.916均高于ANN模型(0.746)和SVM模型(0.866).
圖5 3種模型訓練集預(yù)測值與實際值對比Fig.5 Comparison of the predicted and actual training set of three models
3種模型預(yù)測結(jié)果存在差異性的原因在于,ANN模型需要依靠大量數(shù)據(jù)樣本不斷地修正模型來防止過擬合,提高自身的學習效果.本研究中數(shù)據(jù)集的數(shù)量相較于超量、海量數(shù)據(jù)集來說,訓練不足難以發(fā)揮人工神經(jīng)網(wǎng)絡(luò)的性能.SVM模型較ANN模型來說可以較好地表征小樣本下的非線性映射關(guān)系,但是其本身屬于弱學習器,而RF屬于由一系列弱學習器(決策樹)集結(jié)在一起的集成算法,并且通過引入隨機性增加模型抗噪能力,對于復(fù)雜結(jié)構(gòu)的路面性能預(yù)測數(shù)據(jù)集預(yù)測精度勢必強于單一的弱學習器(ANN、SVM).綜上所述,基于RF的瀝青路面狀況指數(shù)PCI預(yù)測模型就路網(wǎng)級預(yù)測能力來說,優(yōu)于人工神經(jīng)網(wǎng)絡(luò)和支持向量機預(yù)測模型,在處理非線性回歸問題上優(yōu)勢顯著.
1)本研究依據(jù)北京地區(qū)2010—2016年間路面性能特征、路面結(jié)構(gòu)特征、氣象特征以及交通參數(shù)特征,以瀝青路面PCI為研究對象,采用機器學習中的RF算法建立了北京市瀝青路面PCI預(yù)測模型.該模型能夠準確識別相關(guān)特征變量與PCI間復(fù)雜的耦合關(guān)系,用于預(yù)測目標年的PCI有較高的準確率.
2)本研究引入神經(jīng)網(wǎng)絡(luò)和支持向量機2種經(jīng)典機器學習算法,利用可視化散點圖以及參考的3種評價指標,通過對比研究證明了RF模型強大的學習和泛化能力:對學習結(jié)果和樣本集擬合后,RF模型預(yù)測值更為逼近實際值;在訓練集和測試集上的RMSE、MAE和R2都要優(yōu)于ANN和SVM機預(yù)測模型,驗證了RF模型的有效性以及優(yōu)越性.
3)路面性能預(yù)測是路面養(yǎng)護管理的重要內(nèi)容,基于RF算法的PCI預(yù)測模型通過高效、準確的預(yù)測可以推動建立現(xiàn)代公路養(yǎng)護管理體系,為后續(xù)北京市瀝青路面養(yǎng)護規(guī)劃以及養(yǎng)護資金調(diào)配提供指導.