劉必君,葉雨辰
(1.南昌大學建筑工程學院,江西南昌330031;2.江西省華贛環(huán)境集團有限公司,江西南昌330105)
建筑工程是我國基礎建設的重要組成部分,它與國內生產總值(GDP)的發(fā)展水平息息相關。建筑業(yè)在我國的國內生產總值占比較大,尤其在近些年,建筑業(yè)在國內生產總值的份額持續(xù)增加。根據(jù)國家統(tǒng)計局資料顯示,隨著供給側結構性改革推進,2017年全年房地產開發(fā)投資109 799億元,比上年增長7.0%。其中住宅投資75 148億元,增長9.4%。因此建筑工程的施工成本預測研究具有重要意義。
關于建設工程施工成本的預測理論與數(shù)學模型包括:線性回歸、時間序列法、灰色理論、BP神經網絡等。近幾年,國內外基于人工神經網絡方法展開的工程成本預測的研究較多,也是目前理工科領域主流的預測方法。段鵬[1]分別針對傳統(tǒng)的如線性回歸、參數(shù)估計、指數(shù)平滑等統(tǒng)計分析方法進行對比分析,指出指數(shù)平滑法更適合短期內的一些預測,計算較為簡單,對樣本數(shù)據(jù)需求小。謝玉梅[2]通過收集類似工程已標價工程量清單的綜合單價建立數(shù)據(jù)庫,利用灰色預測模型預測分部分項工程成本。陳文勝[3]通過估算模型概念、結構和原理,構建了基于層次分析法改進的BP神經網絡的工程造價預測模型,并通過Matlab對案例進行分析。國外學者Sajadfar[4]結合了線性回歸和數(shù)據(jù)挖掘技術,提出了一個基于信息學框架的工程特征,應用于數(shù)據(jù)挖掘以及算法所支持的成本估算。Putra[5]提出了一種基于BP神經網絡的人工智能計算方法用于對已完工典型項目的直接成本和間接成本進行建模,以減少不確定性。該方法特別適用于評估安裝工程的成本,使工程成本估算的總不確定度大大降低。
雖然,國內外基于人工智能方法展開的工程成本預測的研究較多,主要通過兩個方式進行預測。一是通過神經網絡參數(shù)調整或者改進神經網絡來進行建筑工程成本、造價預測;另一種是通過其他數(shù)學分析方法改進神經網絡的方法來實現(xiàn)預測。這些研究方法在一定程度上都存在著理論方法選取不合適或者影響因素指標體系構建不完善的瑕疵,導致預測精度低,預測結果不穩(wěn)定。目前國內暫無學者將深度學習應用于施工成本預測領域,主要針對深度學習網絡的建模與改進方向進行探究。
在了解目前國內外各種常用的建筑工程施工成本(造價)預測方法后,重點分析對比了基本原理和預測結果。
(1)線性回歸法
線性回歸法原理是利用數(shù)理統(tǒng)計的方法研究變量之間的函數(shù)關系。預測精度受數(shù)據(jù)影響較大。
(2)時間序列法
時間序列法是通過歷史資料分析量與時間的變化規(guī)律,從而預測變量的具體數(shù)值。適合短期的發(fā)展預測,預測精度不高。
(3)灰色理論
灰色利潤根據(jù)序列曲線幾何形狀的相似程度來判斷其聯(lián)系是否緊密。適合短期預測,預測精度不高。
(4)神經網絡
神經網絡是多層前饋神經網絡,通過模擬動物的神經網絡行為特征,調整內部大量節(jié)點之間連接權值。預測結果易陷入局部極小值,預測精度較高。
(5)深度學習
深度學習神經網絡是指先進行無監(jiān)督學習提取數(shù)據(jù)特征,再進行有監(jiān)督學習,預測精度高。深度學習是由傳統(tǒng)的多層神經網絡發(fā)展而來,它具有優(yōu)秀的非線性映射能力和泛化能力,能夠表征復雜的高維函數(shù)。深度學習在計算機圖像識別、語音識別、自然語言處理、預測等其他領域表現(xiàn)優(yōu)異。
由于建筑工程施工成本的影響因素復雜,施工成本數(shù)據(jù)收集不易,因此,建筑工程施工成本的預測是一個典型的大樣本、高維非線性問題。而且建筑工程施工成本的快速預測往往是為企業(yè)成本管理服務,對預測的精度和時間要求也較高。在建筑工程施工成本預測方法的選取上,傳統(tǒng)的預測方法往往達不到較為理想的預測效果,而深度學習網絡模型,可有效避免傳統(tǒng)的施工成本預測方法如回歸分析、灰色理論等所表現(xiàn)出的預測精度較差,預測花費時間較長的問題,同時還具有一定的泛化能力。
在系統(tǒng)地分析傳統(tǒng)的建筑工程成本預測方法基礎上,選取了基于深度學習網絡下的棧式降噪自動編碼器和BP神經網絡強大的學習預測原理,通過建立預測模型對樣本數(shù)據(jù)進行訓練學習,可以準確快速地實現(xiàn)非線性工程項目施工成本的預測。同時,構建了高層建筑工程施工成本影響因素集合,全面概括了高層建筑工程土建結構施工成本影響因素體系,并提出相應的量化以及歸一化過程,有效避免了專家打分法下的指標量化方法產生的人為誤差,為建筑工程施工成本預測理論提供新的思路。
建筑工程項目的建設周期長、影響因素多、設計方案的多樣性等共同決定了建筑工程的成本。影響建筑工程成本的因素很多,總體來說可分為四類:工程屬性、環(huán)境屬性、市場屬性以及管理屬性。
工程屬性,也就是建筑工程自身結構設計的特征,包括建筑面積、占地面積、標準層建筑面積、基礎類別、結構類別、樓梯結構形式、抗震強度、外立面裝飾、層數(shù)、層高等。環(huán)境屬性,主要是現(xiàn)場條件,包括場地施工條件、排污、土方開挖處理難度等。市場屬性,與市場經濟環(huán)境相關的特征,包括人工成本、混凝土、鋼筋等原材料價格及其趨勢。管理屬性,指的是涉及到建筑工程項目建設階段管理的主要三方以及施工工期。
建筑工程施工成本指的是建筑工程的建造成本。一般情況下,對于施工單位來說,建筑工程成本即建筑安裝工程總價格,它是指在為建成某一項工程,預計或實際在市場交易活動中所形成的交易總價格[6]。而建筑安裝工程費由直接費、間接費、利潤和稅金組成。建筑工程項目成本是指承包商在進行某建筑工程項目的施工過程中發(fā)生的全部費用支出的總和。工程項目成本不同于施工企業(yè)成本,更有別于建筑安裝工程造價。它們的關系如下:
式(1)、式(2)中,建筑安裝工程造價是指建設單位支付給該建筑工程項目的工程價款收入,即工程項目的價格;施工企業(yè)成本是企業(yè)為工程項目施工所發(fā)生的各項費用支出,一般包括項目生產性費用支出和企業(yè)非生產性費用支出兩大部分。非生產性費用是施工企業(yè)為組織和管理生產經營活動而產生的費用,往往具有很大的伸展和壓縮空間,是企業(yè)形成利潤和效益增長的支撐點。主要包括電話費、運輸費、業(yè)務招待費、辦公用品費、能源費等。最終要預測的研究對象(被影響因素)——“施工成本”即上述施工企業(yè)成本。
由于結構類型與建筑層數(shù)是影響建筑施工成本的決定性因素,所以在考慮多樣本情況下統(tǒng)計數(shù)據(jù)的可靠度,將結構類型與建筑層數(shù)作為控制因素。所采集的建筑工程樣本數(shù)據(jù)限制結構類型為框架剪力墻結構,限制建筑層數(shù)為高層建筑(層數(shù)≥12,層高<100m),通過兩個控制因素的限制,使得預測網絡的原始數(shù)據(jù)更可靠,樣本數(shù)據(jù)學習過程中更穩(wěn)定,預測結果更貼近樣本。
非控制因素分為定量影響因素與定性影響因素。定量影響因素通過其數(shù)值上的大小對建筑工程施工成本產生影響,而定性影響因素由設計方案、施工工藝等方式決定。
建筑工程施工成本預測模型的樣本需要將收集的數(shù)據(jù)中的定量影響因素與定性影響因素進行量化,其量化過程如下:
(1)基礎工程
①基礎結構形式:按照基礎構造受力特點,可以分為:梁式基礎、條形基礎、片筏基礎、箱型基礎、樁基礎等。定性指標,量綱為一后,分別為1、2、3、4、5。②樁基類型及樁基工程量:建筑工程樁基礎主要有預制管樁、旋挖鉆孔灌注樁、人工挖孔樁、沖孔樁、多種樁型組合以及無工程樁,定性指標,量綱為一后,分別為1、2、3、4、5、6。這里之所以引入“無工程樁”,是因為高層建筑工程如果采用上述的梁式基礎或者片筏基礎等基礎類型的情況下,那么“樁基類型”項數(shù)據(jù)無法填寫,同樣地,下述“樁基工程量”數(shù)值也為“0”,為了避免無監(jiān)督學習階段出現(xiàn)“0”,在實際采集的數(shù)據(jù)中將“無樁基工程”項的“樁基工程量”換成“0.01”。
由于各種樁型的不同,樁基承載力不同,樁徑也大相徑庭,樁基的工程量主要以設計的混凝土灌注的工程量為準。樁基工程量為定量指標,取其單位為:“方”。
(2)地下室工程(見表1)
(3)建筑面積:定量指標,取其單位為“m2”。
(4)標準層面積:定量指標,取其單位為“m2”。
表1 地下室工程影響因素Tab.1 Influencing factors of basement engineering
(5)結構類型:為了預測的精確度,將樣本數(shù)據(jù)中的結構類型(控制因素)限定為框剪結構。
(6)樓梯類型
①疏散樓梯:定量指標,取其截面尺寸面積,m2。②電梯:主要考慮兩個方面,一是截面面積,定量指標,m2;二是電梯數(shù)量,定量指標,取其單位為“部”。
(7)建筑層數(shù):定量指標,取其單位為“層”。將建筑層數(shù)作為一個控制因素,統(tǒng)一采集的數(shù)據(jù)為高層建筑(層數(shù)≥12,層高<100m)。
(8)建筑層高:定量指標,m。
(9)抗震設防類別:抗震設防類別劃分為甲、乙、丙、丁四級,定性指標,量綱為一后,甲級為1、乙級為2、丙級為3、丁級為4。
(10)墻體砌筑材料:常見的砌筑材料有:非黏土燒結多孔磚、非黏土燒結空心磚、混凝土空心砌塊、燒結空心砌塊、加氣混凝土砌塊、石膏砌塊、加氣混凝土板、輕質條板、石膏空心條板。定性指標,量綱為一后,分別為:1、2、3、4、5、6、7、8、9。
(11)外立面裝飾:主要包括干掛、玻璃幕墻、面磚、涂料等。定性指標,量綱為一后,干掛為1、玻璃幕墻為2、面磚為3、涂料為4。
(12)屋面工程
①屋面結構:一般分為平屋頂、坡屋頂、拱屋頂、折板屋頂、薄殼屋頂、懸索屋頂、網架屋頂?shù)取6ㄐ灾笜耍烤V為一后,分別為1、2、3、4、5、6、7。②屋面防水:主要有卷材防水屋面、剛性防水屋面、涂膜防水屋面以及復合防水屋面。定性指標,量綱為一后,分別為1、2、3、4。
(13)場內施工條件:綜合考慮現(xiàn)場圍護設備、臨時設施、臨水和臨電等,是否符合施工工序有序進行的要求。定性指標,完全符合、基本符合以及暫不符合,量綱為一后,分別對應1、2、3。
(14)氣象特征:定性指標,根據(jù)歷史氣象特點,對施工產生較大、較小和無影響的分別量綱為一后為1、2、3。
(15)場外交通狀況:定性指標,對施工進度產生較大、較小和無影響的分別量綱為一化為1、2、3。
(16)人工造價指數(shù)
在研究影響建筑工程施工成本的影響因素時,除了要考慮不隨時間變化而改變的靜態(tài)因素外,還需考慮到人工與主材等價格跟隨市場價格波動而改變的動態(tài)影響因素。為了使所建立的預測模型能夠適應時間的變化,需要引進一個與時間變化相關的指標——工程造價指數(shù)。工程造價指數(shù)是反映一定時期的工程造價相對于某一固定時期(基準期)的工程造價變化程度的比值或比率[7]。通過與基準期的價格相比較,反映出當前的市場價格相對于基準期市場價格變動的趨勢,可以用做調整工程造價的價格差異的依據(jù)。
工程造價指數(shù)的計算公式為
因此,人工造價指數(shù),定量指標,取其單位為“1”,基準期統(tǒng)一為2011年5月。
(17)其他影響因素,見表2。
表2 其他影響因素Tab.2 Other influencing factors
深度學習網絡在計算機識別(圖像、語音等)領域取得了顯著的成功,在不同的應用領域通常會用到不同的網絡結構,三種常見的深度學習網絡分別是:深度卷積網絡(CNN)、受限玻爾茲曼機以及自動編碼網絡(Autoencoder)[8]。
在了解棧式降噪自動編碼器之前要先了解深度學習。深度學習起源于多層神經網絡,傳統(tǒng)的人工神經網絡只有監(jiān)督學習過程,而深度學習是先進行無監(jiān)督學習過程,這個過程最重要的目的就是提取數(shù)據(jù)特征,在提取的數(shù)據(jù)特征基礎上再進行有監(jiān)督學習過程,因此深度學習比傳統(tǒng)的多層神經網絡更加優(yōu)越。
深度自動編碼器(Auto-encoder,縮寫為DAE)是通過無監(jiān)督逐層貪心預訓練和參數(shù)優(yōu)化的多層非線性網絡從無標簽數(shù)據(jù)中提取高維復雜輸入數(shù)據(jù)的特征,并得到原始數(shù)據(jù)分布式特征表示的深度學習神經網絡結構。深度自動編碼器由編碼器、解碼器和隱含層構成。編碼器(encode)是輸入x到隱含表示h的映射,表示為
式中,S就是Sigmoid激活函數(shù)。
解碼器函數(shù)g(h)將隱含層數(shù)據(jù)映射回重構輸出y,表示為
式中,Sg是解碼器的激活函數(shù),同樣為Sigmoid函數(shù)。訓練DAE過程就是在訓練數(shù)據(jù)樣本集X上尋找參數(shù)θ={W,by,bh}的最小化重構誤差。重構誤差的表達式(代價函數(shù))為
式中,L為重構誤差函數(shù),用平方誤差函數(shù)表示為
本文選擇的深度學習模型的誤差反向傳播算法是基于online梯度下降法。自編碼網絡的輸入層是原始數(shù)據(jù),如圖像、聲音、數(shù)據(jù)包等,隱藏層就是特征提取層,經過自動編碼器提取相應的高維特征(編碼),再將得到的高維特征作為另一個自動編碼器的輸入(解碼)就可以得到更高層次的特征(輸出層)。
棧式降噪自動編碼器是將降噪自動編碼器通過棧的形式連接起來構成深度學習模型的隱藏層。棧式降噪自動編碼器是深度編碼器的一種,任何一種深度編碼器都是基于自動編碼器的[9]。
通過修改自動編碼器的編碼公式,得到降噪自動編碼器編碼的計算公式如下:
式(8)與普通自動編碼器的區(qū)別在于輸入數(shù)據(jù)己經完成降噪了。損失函數(shù)的計算公式仍舊是采用最小二乘法的L(x,z)函數(shù)。
棧式降噪自動編碼器的核心在于每一層的降噪自動編碼器先進行無監(jiān)督預訓練,再在無監(jiān)督預訓練完成的基礎上進行整個棧式降噪編碼器有監(jiān)督調整。通過多次的無監(jiān)督訓練學習、迭代,隱藏層的降噪編碼器同時調整自身的參數(shù)。棧式降噪編碼器在有監(jiān)督階段使用反向傳播算法回傳誤差,有監(jiān)督學習階段的過程就是BP神經網絡算法。
為了保證模型預測的準確性,需要收集工程案例相似的工程數(shù)據(jù)作為訓練樣本。在收集輸入數(shù)據(jù)的過程中,考慮到不同地區(qū)的人工、主材等價格不同,建造工藝和技術方案也有區(qū)別,因此樣本選取時均選用南昌及其周邊城市的住宅工程。通過江西省工程造價信息網和相關造價信息期刊等多種渠道收集并篩選2010年—2017年的高層住宅數(shù)據(jù)25組,所收集的樣本工程均為22—33層的住宅工程,且工程所在地均為南昌及其周邊城市,保證了樣本的地區(qū)統(tǒng)一性和類別一致性。經過初步統(tǒng)計訓練樣本的31個工程特征(影響因素X)和1個工程成本數(shù)據(jù)(被影響因素Y),可以得到訓練樣本的所有特征向量。
為了避免輸入數(shù)據(jù)絕對值相差過大而導致自編碼網絡的輸出達到飽和,甚至導致過早陷入局部最小值,需要提前對訓練數(shù)據(jù)樣本集X的輸入向量和輸出向量分別都進行數(shù)據(jù)的歸一化處理,使輸入輸出數(shù)據(jù)范圍控制在[0,1]區(qū)間內。
采用線性歸一化處理方式對輸入數(shù)據(jù)進行變換,變換公式為
式中:-xi為歸一化后的數(shù)據(jù);xi為當前收集的數(shù)據(jù);
xmin為該類數(shù)據(jù)的最小值;xmax為該類數(shù)據(jù)最大值。
為了方便模型對樣本數(shù)據(jù)的處理和計算,對得到的初步統(tǒng)計數(shù)據(jù)進行量化。量化后的輸入向量見表3。
根據(jù)式(9)對初步統(tǒng)計數(shù)據(jù)表3進行變換,再將變換后的數(shù)據(jù)導入Matlab中進行預測分析。
表3 工程特征向量量化表Tab.3 Engineering feature vector quantization table
根據(jù)圖1,訓練預測過程在80—100次迭代時,預測數(shù)據(jù)收斂。返回到Matlab運行結果代碼進行數(shù)據(jù)反查,預訓練(無監(jiān)督學習)全局誤差在第88次迭代達到0.05,第100次訓練迭代時,全局誤差為0.042。有監(jiān)督學習階段,發(fā)現(xiàn)在第424次迭代時,全局誤差達到0.001,已經基本滿足預測精度,第500次迭代時,全局訓練誤差達到0.000 8。
通過重繪的測試樣本施工成本預測值與實際值比較,可以得到測試樣本的預測值與實際值的相對誤差如表4所示。
圖1 誤差損失函數(shù)Fig.1 Error loss function
通過分析表4的數(shù)據(jù)可以發(fā)現(xiàn):預測的3組數(shù)據(jù)中,預測結果與實際值的相對誤差均小于2%。
表4 測試樣本實際施工成本與預測值的相對誤差Tab.4 Relative error between actual construction cost and predicted value of test sample(萬元)
可以看到,3個預測樣本的相對誤差最大為1.61%,相對誤差最小的甚至在1.00%以內,一般情況下,在項目施工階段,工程施工成本測算的相對誤差一般控制在2%以內,就可以作為施工組織的依據(jù),因此采用棧式降噪自動編碼器構建的建筑工程施工成本預測模型預測效果很好,相對誤差表現(xiàn)理想。
為了更好地研究新模型的預測效果的穩(wěn)定性將表4中的相對誤差值圖形化,見圖2。
由圖表可以總結出,預測的相對誤差最大為1.39%,最小達到了0.82%,預測模型在控制相對誤差上表現(xiàn)良好,穩(wěn)定性強,且仿真分析結果很好地檢驗了預測模型的預測效果。另外,整個棧式降噪自動編碼器模型的建立以及進行建筑工程施工成本預測的實現(xiàn)均在Matlab編程平臺上,通過一系列編程運算即可實現(xiàn),相較于傳統(tǒng)的概預算軟件、BP神經網絡等方法進行建筑工程施工成本的估算或者預測來說,所構建的建筑工程施工成本預測模型預測速度較快,預測結果穩(wěn)定。
圖2 預測相對誤差穩(wěn)定性Fig.2 Predictive relative error stability
通過查閱工程管理與工程造價相關文獻資料,以及結合多年的實際工作經驗,對建筑工程施工成本預測進行了較為深入地研究,主要結論如下:
(1)通過分析影響建筑工程施工成本影響因素,構建了建筑工程施工成本的影響因素集合體系,以及影響因素指標的詳細量化、歸一化過程,對預測模型起到重要輔助作用。
(2)在預測算法理論上深入研究了棧式降噪自動編碼器的基本原理、算法結構、Matlab建模等研究工作,在理論與實踐操作的層面探討了解決建筑工程施工成本預測此類非線性問題的流程,同時結合建筑工程施工成本管理、預測的理論,應用棧式降噪自動編碼器進行建模仿真分析。
(3)根據(jù)理論上的對比以及實例預測結果分析,以Matlab編程語言構建的預測模型可以實現(xiàn)高層建筑工程施工成本預測,預測速度較傳統(tǒng)預測方法更快更精確,預測精度在2%以內。隨著招投標制度以及工程計價制度的完善,建筑施工行業(yè)已然是一個充分市場化競爭的行業(yè),各個企業(yè)之間的成本差異也逐漸縮小。未來建筑工程的施工企業(yè)成本預測理論將會在大數(shù)據(jù)以及規(guī)范的市場背景下愈加完善。