王杰,盧毅
基于ANN貢獻(xiàn)分析及GEP算法的地鐵車站土建造價預(yù)測模型
王杰,盧毅
(長沙理工大學(xué) 交通運(yùn)輸工程學(xué)院,湖南 長沙 410114)
科學(xué)地選取工程特征因素及預(yù)測方法對于構(gòu)建一個好的造價預(yù)測模型十分關(guān)鍵。在選取的14個影響地鐵車站土建造價特征因素中,利用神經(jīng)網(wǎng)絡(luò)貢獻(xiàn)分析的變量選取方法,篩選出12個主要特征因素。并針對這選定的14個全部特征因素和12個主要特征因素分別組合BP神經(jīng)網(wǎng)絡(luò)和GEP 2種預(yù)測方法構(gòu)建4個不同的造價預(yù)測模型,應(yīng)用18組地鐵車站土建造價和特征因素的歷史數(shù)據(jù)進(jìn)行實(shí)例探究,通過2,MSE,RMSE和MaxRE 4個指標(biāo)的評價,結(jié)果表明:用主要特征因素為模型輸入變量能顯著提高模型的預(yù)測精度,且和GEP算法組合建立的造價預(yù)測模型為最優(yōu)。將主要特征因素選取和預(yù)測方法選取相結(jié)合構(gòu)建求解的最優(yōu)模型很好地解決了已有相關(guān)研究中選取特征因素主觀性多科學(xué)性不足及未考慮特征因素選取對預(yù)測方法選取的影響問題。
交通運(yùn)輸經(jīng)濟(jì);特征因素;造價預(yù)測;GEP模型;ANN模型;地鐵車站
造價預(yù)測是地鐵車站土建造價控制和管理的重要內(nèi)容之一,其精確程度直接影響到項目的投資決策、建設(shè)規(guī)模確定以及工程設(shè)計方案制定的科學(xué)性,因此其研究具有重要意義。地鐵車站土建造價的影響因素眾多,且不確定性大,其造價與其自身特征又具有高度的非線性關(guān)系。由此可見地鐵車站土建造價預(yù)測研究的關(guān)鍵問題主要是造價影響因素的選取、預(yù)測方法的選用及其優(yōu)化。近年來,地鐵工程造價預(yù)測模型引起了一些學(xué)者的研究:何佳[1]研究認(rèn)為地鐵車站長度在很大程度上反映車站的規(guī)模,從而直接影響地鐵的投資造價;馬靖華等[2]研究結(jié)果表明不同施工工法對地鐵車站的工程造價有明顯影響;黃義勇[3]通過全面系統(tǒng)的分析得出圍護(hù)結(jié)構(gòu)、車站主體結(jié)構(gòu)、出入口通道及土方支撐降水是地鐵車站造價的主要組成部分,并且與物價緊密相關(guān);黃棟[4]研究表明地鐵車站的不同埋深是工程造價的主要影響因素。對工程造價預(yù)測方法的研究上:Agnieszka等[5]通過問卷調(diào)查的方式確定工程類型,工程地理位置,工期等特征因素,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)預(yù)測工程間接費(fèi)用;Murat等[6]通過選取17個因素為變量建立基于人工神經(jīng)網(wǎng)絡(luò)的地鐵軌道造價預(yù)測模型;趙欣[7]引入模糊數(shù)學(xué)理論構(gòu)建地鐵土建工程造價的神經(jīng)網(wǎng)絡(luò)模型;王杰等[8]通過專家打分的方式選取8個地鐵隧道特征因素建立基于基因表達(dá)式編程(GEP)的地鐵隧道土建造價估算模型。這些文獻(xiàn)在特征因素選取方面,多根據(jù)經(jīng)驗法及比例法,選取的方法主觀性強(qiáng)科學(xué)性不足;未考慮特征因素選取對預(yù)測方法選取的影響。而預(yù)測方法選用上,神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)局部最優(yōu)及過度擬合現(xiàn)象。本文擬在實(shí)證研究中,選用基于神經(jīng)網(wǎng)絡(luò)(ANN)貢獻(xiàn)分析的變量選取方法[9],并結(jié)合GEP算法建立一個預(yù)測精度更為準(zhǔn)確的造價預(yù)測模型。該變量選取方法是將樣本數(shù)據(jù)中隱含的知識轉(zhuǎn)化到神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和連接權(quán)值中,根據(jù)計算每個輸入變量對網(wǎng)絡(luò)輸出的貢獻(xiàn)大小,剔除冗余變量,科學(xué)篩選出影響地鐵車站土建工程造價的主要特征因素。而GEP算法作為一種處理高斯和不確定性因素的新型人工智能數(shù)學(xué)建模方法,擁有強(qiáng)大的函數(shù)挖掘能力和處理高度非線性系統(tǒng)的能力,可以克服ANN預(yù)測建模方法的不足。
在計量經(jīng)濟(jì)建模與預(yù)測研究領(lǐng)域,主要考慮的神經(jīng)網(wǎng)絡(luò)模型是單隱層BP網(wǎng)絡(luò)(如圖1),其一般形式為:
(1)
若()為sigmoid函數(shù),()為線性函數(shù),
=0,…,;=0,…,。
則(,)可寫為:
其中:=1,…,;為樣本數(shù)。
對決定系數(shù)2進(jìn)行分解,則有:
定義:
顯然,0可以理解為未被解釋的殘差部分。從方差分析看,Z可理解為第個隱含層節(jié)點(diǎn)對輸出變量的貢獻(xiàn),個隱含層節(jié)點(diǎn)貢獻(xiàn)之和體現(xiàn)了模型對輸出變異解釋程度,即2。
式中:表示第個輸入變量對總體輸出的貢獻(xiàn),表示未引入因素對總體輸出的貢獻(xiàn)。
如果有個變量的貢獻(xiàn)之和(<)接近于1時(例≥*,*可以取0.85或0.95),就選取這個變量為重要變量,而刪掉那些貢獻(xiàn)比較小的變量。這里*的取值可以視具體情況而定。
圖1 單隱層BP神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D及其層次貢獻(xiàn)分析圖
Fig. 1 Topology diagram of BP neural network with single hidden layer and its hierarchical contribution analysis diagram
基因表達(dá)式編程融合遺傳算法(GA)和遺傳編程(GP)的優(yōu)勢,它以操作符號和基本變量作為遺傳信息,一個染色體(個體)代表一個問題解,通過遺傳、變異、重組等遺傳算子,進(jìn)行迭代,直到達(dá)到較好的適應(yīng)度,算法終止得到一個更接近事實(shí)本質(zhì)的模型和公式[6]。
通過以上介紹,可將GEP 算法描述如下:
輸入:模型輸入變量;算法參數(shù);輸出:最優(yōu)染色體(擬合函數(shù)f) Step 1:隨機(jī)初始化染色體群; Step 2:計算每個染色體的適應(yīng)度值; Step 3:判斷是否達(dá)到設(shè)定的結(jié)束條件,達(dá)到結(jié)束,未達(dá)到則繼續(xù)進(jìn)行下一步;
Step 4:遺傳操作產(chǎn)生下一代:首先保存最好個體,然后進(jìn)行包括選擇、復(fù)制、變異、IS插串、RIS插串、基因插串、基因重組等在內(nèi)的遺傳操作; Step 5:轉(zhuǎn)到Step 3。
研究流程圖見圖2。
選取工程特征因素要求一方面能代表工程所具有的特點(diǎn),另一方面能有效地將對工程主要成本構(gòu)成有影響的核心參數(shù)反映出來。根據(jù)黃義勇[3]的研究,圍護(hù)結(jié)構(gòu)、主體結(jié)構(gòu)、出入口通道及土方支撐降水是地鐵車站造價的主要成本構(gòu)成,約占土建費(fèi)用的84%。結(jié)合查閱已有文獻(xiàn)及工程歷史資料,根據(jù)專家的經(jīng)驗,剔除對工程造價影響相對較小的因素,初步選取14個變量作為地鐵車站土建工程造價的特征因素。根據(jù)這14個特征因素,搜集整理到18組廣州市不同線路的地鐵車站土建工程特征值及它們延米造價數(shù)據(jù)(見表1),考慮到統(tǒng)一量綱,將它們線性壓縮至[0.1,0.9](見表2)。
圖2 地鐵車站土建工程造價預(yù)測模型研究流程
表1 地鐵車站土建工程特征因素原始數(shù)據(jù)
132246.5027.341110.1014.222.883114101.86533.87 142151.6018.30119.0015.763.20271298.49349.83 153182.9023.101112.0017.203.60531198.49444.42 162168.2017.70328.0017.112.50531198.49353.14 172260.4026.401112.1013.572.094211101.86635.40 182147.6024.101115.0015.601.50562498.49668.53
注:施工方法1-3分別指明挖、蓋挖、明蓋。站臺形式1-3分別指島式、側(cè)式、一島兩側(cè)。主體結(jié)構(gòu)1-7分別指單層多跨、雙層單跨、雙層雙跨、雙層三跨、雙層多跨、多層三跨,多層多跨。圍護(hù)結(jié)構(gòu)中1-7分別指地下連續(xù)墻、圓形挖孔樁、矩形挖孔樁、鉆孔灌注樁、鉆孔灌注樁和挖孔樁、挖孔樁和土釘墻、土釘墻。支撐方式1-3分別指鋼支撐、錨桿支撐、水泥土 地錨。
表2 標(biāo)準(zhǔn)化后的地鐵車站土建工程特征因素數(shù)據(jù)
本文擬利用神經(jīng)網(wǎng)絡(luò)進(jìn)一步選擇影響地鐵車站土建造價的主要特征因素。神經(jīng)網(wǎng)絡(luò)設(shè)計第1步是選定其結(jié)構(gòu)。以14個特征因素作為神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元節(jié)點(diǎn),地鐵車站土建工程其延米造價作為輸出神經(jīng)元節(jié)點(diǎn),選定隱含層數(shù)為1。隱層神經(jīng)元個數(shù)采用“試湊法”進(jìn)行確定,試驗后隱層節(jié)點(diǎn)數(shù)取7。選用logsig作為輸入層到隱含層的激活函數(shù),隱含層與輸出層采用purelin型激活函數(shù)[7]。
BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練函數(shù)選取也很重要,因為它直接影響收斂速度與誤差率。根據(jù)張德豐[10]的研究,Levenberg-Marquardt反向傳播算法具有最快的收斂速度,因此選用trainlm為訓(xùn)練函數(shù)。由于是對具體數(shù)值的預(yù)測,損失函數(shù)選用MSE。相應(yīng)的參數(shù)設(shè)定為:顯示間隔次數(shù)=1,最大循環(huán)次數(shù)300,目標(biāo)誤差=1×10?7,其他參數(shù)設(shè)為默認(rèn)值。
2.3.1 選擇適應(yīng)度函數(shù)
由于本文樣本數(shù)據(jù)取值在[0.1,0.9]之間,考慮選用基于相對誤差的適應(yīng)度函數(shù),其函數(shù)表達(dá)式為:
2.3.2 設(shè)置算法參數(shù)
通過參考相關(guān)文獻(xiàn)的歷史經(jīng)驗及分析研究GEP算法特性[8, 11],選定如表3所示參數(shù)。
表3 GEP算法參數(shù)設(shè)定
將搜集到的案例數(shù)據(jù)的前15組設(shè)為訓(xùn)練樣本,后3組作為驗證樣本,并依據(jù)上述BP神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)設(shè)置,利用 MATLAB仿真,所得結(jié)果如圖3所示。
由圖3可知,第7次循環(huán)結(jié)束時訓(xùn)練樣本的均方誤差達(dá)到設(shè)定的精度要求(<1×10?7),從圖4可以看到:雖訓(xùn)練樣本具有極好的預(yù)測精度,但驗證樣本的預(yù)測精度低,無法滿足工程可研階段投資估算<±10%的精度要求。
圖3 訓(xùn)練效果與訓(xùn)練狀態(tài)
(a) 訓(xùn)練樣本預(yù)測結(jié)果對比;(b) 驗證樣本預(yù)測結(jié)果對比
將訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)代入式(10)~(11)分別計算出各輸入變量對隱層節(jié)點(diǎn)的貢獻(xiàn)及各隱層節(jié)點(diǎn)對輸出的貢獻(xiàn)值,再根據(jù)式(12)~(13)計算各輸入變量對輸出的貢獻(xiàn)值。具體的貢獻(xiàn)比例結(jié)果如圖3所示,其中114代表地鐵車站土建工程特征因素,15代表為未引入因素。
圖5 各輸入變量對輸出變量的貢獻(xiàn)以及試驗出現(xiàn)的頻數(shù)
Fig. 5 Contribution of each input variable to output variable and frequency of test occurrence
同時將18組樣本數(shù)據(jù)平分為6個部分:輪流選出一部分作為驗證樣本來檢驗網(wǎng)絡(luò)的泛化能力,其他的則作為訓(xùn)練樣本提供網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)。共進(jìn)行20次試驗,從每次試驗結(jié)果中統(tǒng)計累計貢獻(xiàn)值≥0.95的輸入變量出現(xiàn)的頻數(shù)(結(jié)果見圖5),將出現(xiàn)頻數(shù)大于10的因素篩選出來作為地鐵車站土建工程造價的主要特征因素,其分別為層數(shù)(1)、車站長(2)、標(biāo)寬準(zhǔn)(3)、施工方法(4)、站臺型式(5)、埋深(6)、主體結(jié)構(gòu)(7)、圍護(hù)結(jié)構(gòu)(8)、支撐方式(9)、支撐數(shù)(10)、物價指數(shù)(11)和出入口通道數(shù)(12)。
為了比較在不同建模方法以及不同輸入變量對地鐵車站土建工程造價預(yù)測效果的的影響,本文將上述選定的12個主要特征因素和14個全部特征因素分別作為模型自變量,再分別結(jié)合BP神經(jīng)網(wǎng)絡(luò)、GEP算法建模,同時構(gòu)建4個不同的造價預(yù)測模型。預(yù)測結(jié)果如表4。
表4 不同模型預(yù)測結(jié)果及誤差對比
表5 不同模型的預(yù)測評價結(jié)果
因此模型2為最優(yōu)模型,其擁有適應(yīng)度1 758.40。通過GEP算法挖掘得到此模型的最優(yōu)染色體結(jié)構(gòu)由6個子表達(dá)式樹構(gòu)成,其中每個子表達(dá)式樹對應(yīng)一個基因,每個子表達(dá)式樹通過‘+’號連接(見圖6)。該染色體結(jié)構(gòu)對應(yīng)的擬合函數(shù)的表達(dá)式為:
圖6 最優(yōu)染色體結(jié)構(gòu)
1) 應(yīng)用神經(jīng)網(wǎng)絡(luò)貢獻(xiàn)分析的變量選取方法,克服以往造價預(yù)測模型特征因素選取主觀性多科學(xué)性不足的問題,實(shí)證研究結(jié)果表明地鐵車站土建工程造價主要特征因素有12個:層數(shù)、車站長、標(biāo)寬準(zhǔn)、施工方法、站臺型式、埋深、主體結(jié)構(gòu)、圍護(hù)結(jié)構(gòu)、支撐方式、支撐數(shù)、物價指數(shù)和出入口通道數(shù)。并將主要因素選取與預(yù)測方法選用相結(jié)合進(jìn)行實(shí)例探究,解決未考慮特征因素選取對預(yù)測方法選取的影響問題。
2) 通過2,MSE,RMSE和MaxRE 4個模型評價指標(biāo)的結(jié)果不難看出:不論是采用ANN算法還是GEP算法構(gòu)建地鐵車站土建造價預(yù)測模型,與用全部特征因素作為輸入變量相比,運(yùn)用主要特征因素作為模型自變量能顯著提升所構(gòu)建模型的預(yù)測精度,其中以主要特征因素作為自變量結(jié)合GEP算法構(gòu)建的預(yù)測模型最優(yōu),能夠很好地滿足工程可研究階段造價估算的精度要求。
3) 研究選取的主要特征因素及GEP 算法模型在地鐵車站土建造價預(yù)測領(lǐng)域具有廣泛應(yīng)用價值,同時此研究設(shè)計方案可以在更大范圍的工程造價估算領(lǐng)域應(yīng)用。此次實(shí)例探究也再一次驗證了GEP算法強(qiáng)大的函數(shù)挖掘能力和極高的全局搜索效率,能夠有效地克服BP神經(jīng)網(wǎng)絡(luò)泛化能力不足(訓(xùn)練期預(yù)測精度高,驗證期預(yù)測精度低)的問題。由于僅收集到廣州市部分已完工地鐵車站的工程數(shù)據(jù),存在一定局限性,下一步可結(jié)合工程地質(zhì)及水文情況做進(jìn)一步研究。
[1] 何佳. 優(yōu)化車站建筑設(shè)計降低地鐵工程造價[J]. 工程建設(shè)與設(shè)計, 2004(6): 58?59.HE Jia. Optimizing station architectural design and reducing subway project cost[J]. Engineering Construction and Design, 2004(6): 58?59.
[2] 馬靖華, 程亞平. 地鐵車站不同施工工法對工程造價的影響研究[J]. 建筑經(jīng)濟(jì), 2019, 40(5): 64?68. MA Jinghua, CHENG Yaping. A study on the influence of different construction methods on the construction cost of subway stations[J]. Construction Economy, 2019, 40(5): 64?68.
[3] 黃義勇. 地鐵車站造價分析與控制[J]. 鐵路工程造價管理, 2012, 27(3): 55?59. HUANG Yiyong. Analysis and control of subway station cost[J]. Railway Engineering Cost Management, 2012, 27(3): 55?59.
[4] 黃棟. 地鐵車站的造價分析與控制[J]. 工程技術(shù)研究, 2017(6): 150?151. HUANG Dong. Cost analysis and control of subway station[J]. Engineering Technology Research, 2017(6): 150?151.
[5] Agnieszka Le?niak, Micha? Juszczyk. Prediction of site overhead costs with the use of artificial neural network based model[J]. Archives of Civil and Mechanical Engineering, 2018, 18(3): 973?982.
[6] Murat Gunduz, Latif Onurugur, Erhan Ozturk. Parametric cost estimation system for light rail transit and metro trackworks[J]. Expert Systems with Applications, 2011, 38(3): 2873?2877.
[7] 趙欣. 基于BP神經(jīng)網(wǎng)絡(luò)的地鐵土建工程造價估算方法研究[D]. 北京: 北京交通大學(xué), 2008. ZHAO Xin. Research on cost estimation method of subway civil engineering based on BP neural network[D]. Beijing: Beijing Jiaotong University, 2008.
[8] 王杰, 盧毅. 基于基因表達(dá)式編程的地鐵隧道土建工程造價估算[J]. 長沙理工大學(xué)學(xué)報(自然科學(xué)版), 2019, 16(3): 17?24. WANG Jie, LU Yi. Cost estimation of subway tunnel civil engineering based on gene expression programming [J]. Journal of Changsha University of Science and Technology (Natural Science Edition), 2019, 16(3): 17? 24.
[9] 高仁祥, 張世英. 基于神經(jīng)網(wǎng)絡(luò)的變量選擇方法[J]. 系統(tǒng)工程學(xué)報, 1998, 13(2): 32?37.GAO Renxiang, ZHANG Shiying. Variable selection method based on neural network[J]. Journal of Systems Engineering, 1998, 13(2): 34?39.
[10] 張德豐. Matlab神經(jīng)網(wǎng)絡(luò)仿真與應(yīng)用[M]. 北京: 電子工業(yè)出版社, 2009. ZHANG Defeng. Matlab neural network simulation and application[M]. Beijing : Electronic Industry Press, 2009.
[11] Danial Behnia, Mazda Behnia, Kourosh Shahriar. A new predictive model forrock strength parameters utilizing GEP Method[J]. Procedia Engineering, 2017(191): 591? 599.
Prediction model of subway station civil engineering cost based on ANN contribution analysis and GEP algorithm
WANG Jie, LU Yi
(School of Traffic and Transportation Engineering, Changsha University of Science and Technology, Changsha 410114, China)
Selecting engineering characteristic factors and forecasting methods scientifically is very important for constructing a good cost forecasting model. Among the 14 characteristic factors influencing the construction cost of subway stations, 12 main characteristic factors were selected by using the variable selection method of neural network contribution analysis. According to allthe14 characteristics of the selected factors and 12 key features combined BP neural network and GEP respectively, two types of forecast method were used, and four different cost prediction models were built. The18 sets of subway station construction cost factors and characteristics of the historical data were used to perform example exploration, and to conduct evaluation through2, MSE, RMSE, MaxRE four indices. The results show that the use of the main characteristic factors as model input variables can significantly improve the prediction precision, and the cost prediction model with the combination of GEP algorithm is the most optimal. By combining the selection of main characteristic factors with the selection of prediction methods, an optimal model was constructed to solve the problem of lack of subjectivity and multi-scientificity in the selection of characteristic factors and the influence of the selection of feature factors on the selection of prediction methods.
transport economy; characteristic factors; cost forecast; GEP model; ANN model; the subway station
U231+.4
A
1672 ? 7029(2020)08 ? 2152 ? 10
10.19713/j.cnki.43?1423/u.T20190998
2019?11?13
2018年度湖南省交通運(yùn)輸廳科技進(jìn)步與創(chuàng)新計劃項目資助(201836)
盧毅(1964?),男,湖南寧鄉(xiāng)人,教授,博士,從事公路工程管理、交通工程研究;E?mail:Lyhjr@163.com
(編輯 陽麗霞)