易夢雪,曾 勇,秦張越,夏子又,賀 燚
(1.西南交通大學土木工程學院,成都 610031; 2.西南交通大學高速鐵路線路工程教育部重點實驗室,成都 610031)
高速鐵路工程項目投資分析是貫穿鐵路工程建設各個階段的一項重要工作。在高速鐵路項目預可行性研究階段,實際發(fā)生費用在工程總造價中的占比很小,卻對工程項目最終造價影響甚大[1-2],因此,高速鐵路預可行性研究階段的工程造價估算需要力求準確。而土建工程造價通常是高速鐵路工程總造價中占比最大的一項,對于高速鐵路土建工程造價的準確估算尤為重要。對于山區(qū)高速鐵路而言,土建工程項目建設周期一般較長,工程復雜,工程造價影響因素眾多,而早期研究方案可用于造價分析的信息量少,故預可行性研究階段對山區(qū)高速鐵路土建工程造價進行快速準確估算非常困難。
為得到鐵路或其他工程造價估算較精確解,學者們嘗試采用回歸分析、專家系統(tǒng)和新型預測技術等方法進行相關研究。孔令鶴[3]將回歸分析應用于建筑物造價估算,并通過計算機模擬實現(xiàn);曾學貴等[4]通過專家系統(tǒng)快捷估測鐵路工程造價, 但較依賴于專家經(jīng)驗,其準確度和有效性有限;CHEVROULET[5]等提出一種新型造價估算模型,該模型通過累加所有單項工程造價隨機數(shù)來估算項目的總造價,但模型需建立在大量歷史統(tǒng)計數(shù)據(jù)上,且單項工程數(shù)量繁多,因此,模型結構復雜,難以準確預測。
隨著人工智能知識庫的發(fā)展,具有強大的自適應性和學習能力的神經(jīng)網(wǎng)絡算法逐漸被應用到投資估算領域。WILMOT[6]將BP神經(jīng)網(wǎng)絡應用于公路工程造價,但依賴于數(shù)據(jù)庫的時效性和準確性;鄧雪松[7]在2000年提出一種改進的 BP 神經(jīng)網(wǎng)絡模型用于預測在預可行性研究階段的單線鐵路建設投資,但預測模型仍以累加單項工程造價來估算總造價,雖能進一步提升預測精度,但模型較為復雜;段曉晨[8]在提取顯著性影響因子后采用BP神經(jīng)網(wǎng)絡預測工程造價,但僅為隧道部分工程造價,缺乏整體性。雖然BP神經(jīng)網(wǎng)絡已應用于鐵路、公路工程造價估算,相關估算模型的高效性和準確性均有待提高。
卷積神經(jīng)網(wǎng)絡(CNN)相較于BP神經(jīng)網(wǎng)絡具有自學習功能,且能高速尋找優(yōu)化解,已廣泛應用于非線性預測領域。AHMED[9]和SOH[10]都利用卷積神經(jīng)網(wǎng)絡識別圖像應用于醫(yī)療領域; KHARE[11]和LIU[12]在人類情緒和行為上利用卷積神經(jīng)網(wǎng)絡進行識別;ASMAA[13]采用深層卷積神經(jīng)網(wǎng)絡對新型冠狀病毒肺炎進行分類;LIAO[14]通過提出雙流卷積神經(jīng)網(wǎng)絡提取圖片處理的命令流;TIAN[15]、QI[16]和袁華[17]均通過將卷積神經(jīng)網(wǎng)絡與長短期記憶人工神經(jīng)網(wǎng)絡相結合進行預測,而ZHU[18]和ZHANG[19]通過改進卷積神經(jīng)網(wǎng)絡使其自身具有時序效果,從而進行交通流預測。在山區(qū)高速鐵路預可研階段進行土建造價估算時,眾多影響因素對造價的影響是非線性的,而CNN中強調(diào)空間窗口的卷積核可處理非線性數(shù)據(jù),也可通過共享卷積核處理多維數(shù)據(jù),因而,CNN可適用于山區(qū)高速鐵路土建工程造價估算。
此外,山區(qū)高速鐵路土建工程造價預估算問題根本上是一種函數(shù)回歸問題,而支持向量回歸(SVR)是支持向量在函數(shù)回歸領域的應用,但SVR進行預測時存在核函數(shù)及參數(shù)選擇困難的問題,可認為是弱學習器,常采用Adaboost算法進行多次弱學習器的學習訓練,從而建立起較強的映射關系,因此,Adaboost與SVR算法被結合起來廣泛應用于預測領域。例如,周子東等[20]將Adaboost-SVR模型應用于風電項目造價預測中;丁玉劍等[21]利用Adaboost-SVR模型對直流桿塔間隙操作沖擊電壓進行預測。本文在研究時也將其作為一個比較模型。
山區(qū)高速鐵路土建工程造價與很多因素相關,但不同的影響因素與造價的相關性不同,相關性較弱的影響因素會影響最終預測結果的準確性,因此,需要選取相關性較高的關鍵指標來進行后續(xù)預測。雖然在預可行性研究階段進行山區(qū)高速鐵路土建工程造價預測十分困難,但CNN、BP和Adaboost-SVR這些新型預測模型的發(fā)展為其提供了便利,但不同預測模型的適用性與適用范圍皆有所差異。為快速而穩(wěn)健地在預可行性研究階段獲得較精確的山區(qū)高速鐵路土建工程造價,需要進行預測模型的對比選取,從而得到目前最精確的預測解。
因此,首先利用收集的山區(qū)高速鐵路土建工程造價相關數(shù)據(jù),對影響其土建工程造價估算的指標體系進行分析,并利用最大互信息系數(shù)(MIC)從中選取關鍵指標;然后,根據(jù)卷積神經(jīng)網(wǎng)絡原理構建山區(qū)高速鐵路土建工程造價預測模型,在保證預測精度的同時降低預測模型復雜度;最后,通過高速鐵路土建工程造價預測模型參數(shù)的優(yōu)化實現(xiàn)其土建工程造價的快速準確估算,并與CNN、BP、Adaboost-SVR模型的預測效果進行對比分析。
為較精確地預測山區(qū)高速鐵路土建工程造價,需合理選取山區(qū)高速鐵路中對土建工程造價預測有顯著性影響的指標建立關鍵指標體系。MIC[22]可用于檢測變量之間的非線性相關性,且具有普適性、公平性、對稱性、計算復雜度低和魯棒性高等特點,適用于尋找顯著影響山區(qū)高速鐵路土建工程造價的指標。
最大互信息系數(shù)越高,則變量間的相關性越大,其計算原理為式中,X、Y表示2個變量;B為關于樣本規(guī)模n的函數(shù),通常取B=n0.6;I(D,X,Y)為落入網(wǎng)格區(qū)域D的最大互信息值,通過除以log2(min(X,Y))進行歸一化,最終MIC的數(shù)值范圍為[0,1]。MIC閾值與相關性的對應關系如表1所示。
(1)
表1 MIC值與相關性的對應關系
基于CNN的山區(qū)高速鐵路土建工程造價預測模型的網(wǎng)絡結構如圖1所示,主要包括輸入層、多層卷積部分、全連接層部分和輸出層。將影響鐵路土建工程造價的關鍵指標作為輸入數(shù)據(jù),進行卷積操作提取各指標與鐵路造價的相關性;再通過池化處理壓縮數(shù)據(jù)和參數(shù)的量,避免過擬合現(xiàn)象的出現(xiàn)并降低模型復雜度;再通過扁平化層轉(zhuǎn)化數(shù)據(jù)形式,最后使用全連接層進行微調(diào)并輸出,便于與山區(qū)高速鐵路土建工程實際造價進行對比,進而優(yōu)化模型權重和偏置。
圖1 基于CNN的山區(qū)高速鐵路土建工程造價預測模型
建立的山區(qū)高速鐵路土建工程造價CNN預測模型不同于一般的卷積神經(jīng)網(wǎng)絡結構,該模型對二維數(shù)據(jù)進行縱向數(shù)據(jù)個數(shù)維度上的一維卷積,更有助于模型學習到關鍵指標和山區(qū)高速鐵路土建工程造價之間的關系,增強模型的普適性。卷積層均采用Relu函數(shù)作為激活函數(shù),前期較大的卷積核大小可降低噪聲的影響,后期較小的卷積核大小可用于提取更細微的特征。池化層采用最大池化運算規(guī)則。
(1)CNN預測模型精度評價指標
為有效評價山區(qū)高速鐵路土建工程造價預測模型的效果,選取平均相對誤差(Mean Relative Error,MRE)和平均準確率(Mean Accuracy,MA)作為預測模型精度的評價指標,其計算公式見式(2)和式(3)。MRE可反映預測值與真實值的平均相對偏差程度,MRE越小,模型預測的精度越好。MA反映預測結果的平均準確度,它與MRE相反,其值越大表明模型的預測精度越高。
(2)
MA=1-MRE
(3)
(2)CNN預測模型穩(wěn)定性評價指標
CNN模型預測能力強弱不僅僅決定于精度高低,也取決于預測模型穩(wěn)定性。為有效評價CNN預測模型穩(wěn)定性,采用多次運行結果中MA值的波動(Flu)進行評估。
(4)
式中,MAmax是多次運行CNN預測模型得到的MA最大值;MAmin是多次運行CNN預測模型得到的MA最小值;MAmean是多次運行CNN預測模型得到的MA平均值。
(3)CNN預測模型計算效率評價指標
CNN預測模型計算效率也是評判模型優(yōu)劣的重要指標,可采用模型運算時長t來評價山區(qū)高速鐵路土建工程造價CNN預測模型計算效率。
山區(qū)高速鐵路土建工程造價預測流程及偽代碼如圖2所示。其預測步驟主要包含MIC優(yōu)選關鍵指標、建立CNN預測模型、模型驗證和模型預測等。其中,在模型驗證階段,為提高預測精度,當驗證精度小于95%時重新訓練預測模型參數(shù)。
圖2 MIC-CNN模型預測流程圖及對應偽代碼
為得到山區(qū)高速鐵路預可行性研究階段影響其土建工程造價估算準確性的關鍵指標,利用文獻[23]中通過實際調(diào)研鐵路項目中標單位報價、期刊、年鑒等途徑收集的40條已完工山區(qū)高速鐵路土建工程造價相關信息進行分析。其中,各土建工程項目造價影響指標主要包括橋梁占比、隧道占比、路基寬度、正線數(shù)目等36個指標,如表2所示。
表2 山區(qū)高速鐵路土建工程造價主要影響指標
由于在山區(qū)高速鐵路預可行性研究階段進行土建工程造價估算時所能獲取的指標有限,因而,在表2的36個指標中初步選取預可行性研究階段較易獲取且真正影響土建工程造價的21個指標作為關鍵指標優(yōu)選對象。同時,因土建工程單位造價預測可使造價信息維持在較小的波動范圍內(nèi),使CNN模型更易收斂,參數(shù)更新更迅速,因而,采用土建工程單位造價作為其造價預測最終目標。初步選取的造價預測指標以及部分相關數(shù)據(jù)如表3所示。
表3 山區(qū)高速鐵路土建工程造價預測相關指標及數(shù)據(jù)
為在其中選取關鍵指標,采用MIC方法計算表3中各指標與山區(qū)高速鐵路土建工程單位造價的相關性系數(shù),結果如圖3所示。
圖3 預測指標與山區(qū)高速鐵路土建工程單位造價的MIC值
由圖3可知,除氣候、閉塞類型和牽引種類指標外,其余18個指標的MIC值均超過0.4,根據(jù)表1可知,其與山區(qū)高速鐵路土建工程造價均有較強相關性,故選取此18個指標作為預測鐵路工程造價的關鍵指標。最終確定的關鍵指標體系見表4。
表4 山區(qū)高速鐵路土建工程造價預測關鍵指標體系
(5)
(6)
3.2.1 卷積層層數(shù)和卷積核大小
因山區(qū)高速鐵路土建工程造價預測關鍵指標體系中包含18個預測指標,為尋找出最優(yōu)的卷積層層數(shù),設置卷積層層數(shù)為1~16層,在保持其他參數(shù)不變的情況下,運行程序10次取平均值(MREmean)以分析卷積層層數(shù)對模型預測損失和精確度的影響。因數(shù)據(jù)組合較多,僅在表5中展示部分驗證結果。
表5 卷積層層數(shù)對驗證結果的影響
為確保山區(qū)高速鐵路土建工程造價預測模型精度,要求驗證集預測結果精度達到95%,因而需選取平均相對誤差小于5%的卷積層數(shù)和卷積核大小。從表5中可以看出,隨著卷積層數(shù)增加,平均相對誤差呈先減小后增大的趨勢,當卷積層層數(shù)為7,卷積核大小為1×9×1+1×4×1+1×2×5時驗證數(shù)據(jù)的平均相對誤差(MRE)最小,為4.639%,說明此參數(shù)設置下預測模型最為精確,且滿足MRE誤差小于5%的要求。因此,山區(qū)高速鐵路土建工程造價預測模型卷積層層數(shù)設置為7層,卷積核大小為1×9×1+1×4×1+1×2×5。
3.2.2 卷積核個數(shù)
合理的卷積核個數(shù)是保證計算效率和預測結果的重要參數(shù)。為選取合理的卷積核個數(shù),在保持其他參數(shù)不變條件下運行程序10次取平均值,驗證結果如表6所示。
表6 卷積核個數(shù)對驗證結果的影響
由表6可知,隨著卷積核個數(shù)增加,驗證數(shù)據(jù)的平均相對誤差(MRE)存在先降低后升高的趨勢,當卷積核個數(shù)分別為8、16、32、64、128、256和512時,驗證數(shù)據(jù)的平均相對誤差(MRE)達到最小值4.639%,同時在10次預測結果中,最小損失值和最大損失值均小于其他卷積核個數(shù)組合。同時,當卷積核個數(shù)增加到1 024后,預測時長顯著增加,為同時保證山區(qū)高速鐵路土建工程造價預測效率和精度,卷積核個數(shù)設置為8、16、32、64、128、256和512的組合。
3.2.3 優(yōu)化學習算法
優(yōu)化學習算法可在訓練過程中更新和調(diào)整模型權重和偏差參數(shù),尋求最小的損失并使模型收斂。常用的優(yōu)化學習算法包括隨機梯度下降(SGD)、自適應梯度(Adagrad)、均方差傳播(RMSprop)、自適應矩估計(Adam)[24],不同模型的驗證結果和收斂情況分別如表7和圖4所示。
圖4 優(yōu)化學習算法下模型收斂情況
表7 優(yōu)化學習算法對驗證結果的影響
由圖4可知,預測模型采用SGD、Adagrad、RMSprop和Adam四種優(yōu)化學習算法均可收斂,但SGD算法和RMSprop算法在收斂過程中的波動較大。Adagrad算法收斂到0.3左右便相對穩(wěn)定,而其他3種算法都能收斂到0.2以下。同時,SGD算法、RMSprop算法和Adam算法大致都在迭代50次左右趨近收斂,而Adagrad算法收斂速度較慢。
由表7可知,預測模型采用SGD算法、RMSprop算法和Adagrad算法時,預測結果損失程度都較大,導致鐵路土建工程造價預測誤差均在10%以上,因此,采用Adam算法可以使模型達到更好的收斂效果和更快的收斂速度。
根據(jù)上述研究結果對MIC-CNN預測模型參數(shù)進行修正。為考察修正模型預測效果,利用平均相對誤差、平均準確率、波動指標、計算時長進行評價,將其與CNN、BP、Adaboost-SVR等幾種常用預測模型進行比較,4種模型分析結果如表8所示。MIC-CNN和CNN模型預測結果偏差均在10%以內(nèi), 其中MIC-CNN模型預測偏差最小,僅為5.476%,相較于CNN模型9.072%的偏差,MIC-CNN模型預測精度有明顯提升,說明利用MIC方法選取關鍵指標能較大提高預測準確度。但BP和Adaboost-SVR模型的預測偏差達到12.626%和28.010%,從而預測精度僅為87.372%和70.623%,不能應用于山區(qū)高速鐵路土建工程造價預測。相比于CNN、BP、Adaboost-SVR模型預測結果的波動情況和預測時長,MIC-CNN模型的波動僅為1.045%,預測時長僅為14.337s,該模型在預測山區(qū)高速鐵路土建工程造價時最穩(wěn)定和高效。
表8 不同模型的預測結果
MIC-CNN預測模型結果與真實值對比如圖5所示,其得到的各樣本土建工程單位造價預測值與真實值均較為接近,表明該預測模型能較準確地預測山區(qū)高速鐵路土建工程項目造價。
圖5 山區(qū)高速鐵路項目樣本土建工程單位造價的預測值與真實值
(1)利用MIC方法可以合理選取并構建用于山區(qū)高速鐵路預可行性研究階段土建工程造價的關鍵指標體系,其指標體系包括特大橋占比、大橋占比、中小橋占比、河海谷環(huán)境、特長隧道占比、長隧道占比、中小隧道占比等18個特征指標。
(2)通過對山區(qū)高速鐵路土建工程造價卷積神經(jīng)網(wǎng)絡預測模型參數(shù)進行大量對比分析可知,當卷積層層數(shù)設置為7層,卷積核大小為1×9×1、1×4×1和1×2×5,卷積核個數(shù)設為8、16、32、64、128、256和512的組合,并采用Adam優(yōu)化學習算法調(diào)整模型的權重和偏差參數(shù)時,模型預測精度和計算效率最高,且最穩(wěn)定。
(3)應用MIC-CNN模型預測山區(qū)高速鐵路土建工程造價的平均相對誤差僅為5.476%,而CNN模型預測的平均相對誤差達到9.072%,說明利用MIC方法優(yōu)選關鍵指標可降低模型的網(wǎng)絡復雜度并提高預測精度。BP和Adaboost-SVR模型預測山區(qū)高速鐵路土建工程造價的平均相對誤差分別達到12.626%和28.010%,與此兩種模型的預測結果相比,MIC-CNN模型的預測精度更高。
(4)MIC-CNN模型預測結果波動僅為1.045%,且預測時長僅為14.337s,預測模型有較高的穩(wěn)定性和計算效率。
(5)MIC-CNN模型不僅適用于山區(qū)高速鐵路土建工程造價預測,也可推廣應用到其他地域和類型鐵路的土建工程造價預測。本研究樣本數(shù)量有限,對預測精度可能有一定影響,后續(xù)將繼續(xù)補充樣本進行分析,以進一步提高模型預測精度。