摘要:工程造價預測是項目可行性研究的基礎,其準確性直接影響項目的投資決策。住宅工程在建設過程中往往面臨建設前期設計深化不夠、單方造價測算困難、造價估算精度不高等問題。為了提高住宅工程造價預測的準確性,提出一種基于粒子群優(yōu)化算法的最小二乘支持向量機(PSO-LSSVM)預測模型。該模型采用預測值與實際值的均方根誤差最小為適應度評價函數(shù),基于30組小樣本數(shù)據(jù),選取15項住宅工程特征指標作為樣本輸入、單方造價作為樣本輸出,并利用粒子群算法(PSO)優(yōu)化算法最小二乘支持向量機(LSSVM)模型的關(guān)鍵參數(shù)組合(γ,σ),構(gòu)建PSO-LSSVM預測模型?;诖?,采用15組測試數(shù)據(jù)集進行、PSO-LSSVM模型預測精度驗證。結(jié)果表明:LSSVM模型正則化參數(shù)γ、徑向基核參數(shù)σ分別取250、0.747 9時,LSSVM預測模型最優(yōu);PSO-LSSVM模型預測值與實際值的相對誤差可控制在3.20%以內(nèi),均方根誤差可控制在[1.64%,2.72%],PSO-LSSVM預測模型表現(xiàn)出良好的預測精度和預測穩(wěn)定性。提出的PSO-LSSVM預測模型可以穩(wěn)定高效地對實際住宅工程造價進行預測,同時,也為類似建設工程造價預測提供參考。
關(guān)鍵詞:住宅工程;造價預測;粒子群優(yōu)化算法(PSO) ;最小二乘支持向量機算法(LSSVM)
0"引言
工程造價是工程建設項目在決策階段科學、合理、有效地開展財務分析和經(jīng)濟評價的重要依據(jù),在工程建設項目中具有重要作用。工程建設項目在實際建設中,前期往往由于設計深度不夠,可用于工程造價準確測算的依據(jù)不足,進而降低了工程建設項目資金使用決策的合理性和招投標佐證的科學性。因此,工程造價預測逐漸成為工程項目建設可行性研究的一項重要內(nèi)容。傳統(tǒng)的工程造價預測方法,一般采用線性、非線性回歸、時間序列等方法"[1],而影響工程建設項目單方造價的指標要素多、本身異構(gòu)性強、因素相關(guān)性差,基于傳統(tǒng)工程造價預測的方法不能獲得滿意的預測精度"[2]。近年來,隨著大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展,以相似類型工程的積累數(shù)據(jù)為樣本,采用神經(jīng)網(wǎng)絡(NN)或支持向量機(SVM)的機器學習模型構(gòu)造工程造價預測模型的工程造價成本預測方法已成為研究熱點。劉毅然等"[2]采用量子人工蜂群(QABC)算法優(yōu)化后的NN模型實現(xiàn)了工程造價的穩(wěn)定預測。謝金豪等"[3]提出一種基于GA-BP神經(jīng)網(wǎng)絡的工程造價預測模型,并驗證了模型預測的準確性。陳悅?cè)A等"[4]對比研究了多種優(yōu)化算法的NN與SVM預測模型在工程造價預測上的應用,得出PCA-CV-SVM模型具有更高的預測穩(wěn)定性和精確性。王巧鳳"[5]對比研究了GA-BP與GA-SVM模型在土建工程、裝飾裝修工程和安裝工程中的造價預測表現(xiàn),得出GA-SVM模型可將工程總造價預測誤差控制在5%以內(nèi),比BP模型具有更好的預測精度。
上述智能預測模型一種傳統(tǒng)工程造價預測模型相比,樣本要求更寬泛,預測效率高,但是,仍存在樣本數(shù)量大、收斂速度慢,容易陷入局部最優(yōu)等缺陷。SVM在解決小樣本、非線性和高維函數(shù)問題上具有特有優(yōu)勢,最小二乘支持向量機(LSSVM)將SVM優(yōu)化問題的非等式約束替換為等式約束,進一步提升了模型的非線性擬合性能和泛化能力"[6]。因此,為實現(xiàn)小樣本量下工程造價預測的準確性,本研究采用LSSVM模型對住宅工程造價進行預測,同時采用相比GA算法具有更快收斂速度的全局優(yōu)化算法——粒子群算法(PSO)優(yōu)化獲取LSSVM模型的正則化參數(shù)γ及徑向基(RBF)核函數(shù)參數(shù)σ,以提高LSSVM模型泛化能力、收斂速度和模型預測精度。基于本文提出的PSO-LSSVM住宅工程造價預測模型,通過工程實例驗證預測模型準確性,以期為后續(xù)相關(guān)工程項目造價預測提供參考。
1"住宅造價預測模型建立
1.1"PSO-LSSVM算法模型
LSSVM是Suykens等人提出的一種基于標準支持向量機SVM改進機器學習算法。LSSVM將SVM中松弛變量不等式約束改為等式約束,從而通過解線性方程組求解LSSVM,大幅提高了算法收斂速度和精度"[7]。LSSVM數(shù)學模型如下
S={(xi,yi)xi∈R"n×p,yi∈R}(1)
式中,S為給定訓練樣本數(shù)據(jù)集,xi、yi分別為數(shù)據(jù)輸入、輸出項;n為樣本數(shù)量;p為輸入樣本因子數(shù)量。
基于結(jié)構(gòu)風險最小化原則,LSSVM優(yōu)化函數(shù)為
minJ(w,e)=min12‖w‖"2+12γ∑ni=1e"2is.t."yi=〈w,(xi)〉+b+ei(2)
式中,J為損失函數(shù);(xi)為非線性映射函數(shù);w為權(quán)重向量;ei為模型輸出實際值和預測值間的回歸誤差;γ為確定模型復雜度和精度間的權(quán)衡正則化參數(shù);b為偏置項。
進一步,構(gòu)造式(2)的拉格朗日函數(shù)LLSSVM,即
LLSSVM=12‖w‖"2+12γ∑ni=1e"2i-∑ni=1αi{〈w,φ(xi)〉+b+ei-yi}(3)
式中,αi為拉格朗日乘數(shù)。
通過對式(3)參數(shù)w,b,ei和αi分別求導,可得出LLSSVM問題最優(yōu)解條件,消除參數(shù)w和ei,最終獲得LSSVM模型如下
f(x)=∑ni=1αiK(x, xi)+b(4)
式中,K(x,xi)為核函數(shù)。
由于RBF核函數(shù)具有預設參數(shù)少、泛化能力強等特點,LSSVM模型一般采用RBF作為核函數(shù)。RBF函數(shù)可表示為
K(x, xi)=exp-‖x-xi‖"22σ"2(5)
式中,σ為核函數(shù)寬度,σ>0。
通過LSSVM模型建立過程可知,正則化參數(shù)γ和核函數(shù)寬度σ是影響模型精確預測的關(guān)鍵參數(shù)"[8]。采用預設參數(shù)(γ,σ)值,根據(jù)LSSVM模型的預測精度進行調(diào)整,其效率低,而且往往并不能找到最優(yōu)參數(shù)組合(γ,σ)。
PSO算法是基于鳥群覓食行為的規(guī)律性啟發(fā)而開發(fā)的,其適用于高維優(yōu)化問題的全局優(yōu)化算法。相比GA算法,其具有更快收斂于全局最優(yōu)解的特點。PSO-LSSVM算法的核心思想是基于初始LSSVM模型,通過構(gòu)建PSO適應度評價函數(shù),優(yōu)化獲取具有最優(yōu)參數(shù)組合(γ,σ)的LSSVM模型。
PSO-LSSVM算法模型框架如下:
(1)獲取樣本數(shù)據(jù)并進行數(shù)據(jù)歸一化處理,進行參數(shù)初始化,建立初始LSSVM模型。
(2)設計適應度評價函數(shù)fadapt(γ,σ),通過PSO算法不斷更新粒子速度和位置,計算新參數(shù)組合下的fadapt(γ,σ)適應度值,并獲得最優(yōu)參數(shù)組合(γ,σ)。
(3)建立具有最優(yōu)參數(shù)組合(γ,σ)的LSSVM模型。
本研究中,采用均方根誤差(RMSE)建立適應度評價函數(shù)fadapt(γ,σ),并以適應度最小為模型函數(shù)優(yōu)化目標,即
min fadapt(γ, σ)=1n∑ni=1(yi-y^i)"2(6)
式中,i為LSSVM模型預測值。
1.2"住宅造價預測模型建立流程
基于PSO-LSSVM算法模型,設計住宅造價預測模型。首先,獲取一定數(shù)量,包含關(guān)鍵特征指標的住宅工程造價數(shù)據(jù),并對數(shù)據(jù)進行歸一化處理;其次,設置PSO-LSSVM模型初始化參數(shù),包括粒子位置和速度范圍、粒子群規(guī)模、迭代次數(shù)、慣性權(quán)重和學習因子等;再次,基于LSSVM模型數(shù)據(jù),計算每個粒子的適應度值,并更新粒子位置和速度,在最大迭代次數(shù)范圍內(nèi)計算最優(yōu)目標適應度下的粒子最優(yōu)速度和最優(yōu)位置,獲取最優(yōu)參數(shù)組合(γ,σ);最后,將最優(yōu)參數(shù)組合(γ,σ)賦值給LSSVM模型,建立具有最優(yōu)參數(shù)組合(γ,σ)的LSSVM模型,并對住宅工程測試數(shù)據(jù)集進行預測,驗證模型預測精度。PSO-LSSVM住宅工程造價預測模型計算流程圖如圖1所示。
2"PSO-LSSVM住宅工程造價預測模型應用
2.1"工程特征與樣本數(shù)據(jù)處理
2.1.1"工程特征指標的選取
工程特征指標的選取直接影響工程建設項目造價的預測結(jié)果。由于工程建設項目的特殊性,工程指標具有多樣性和復雜性。如果選取過多的工程特征指標,可能造成預測模型收斂速度慢,甚至無法收斂;如果選取過少的工程特征指標,則不能真實反應工程造價的情況,影響模型預測結(jié)果。本研究基于實際經(jīng)驗,結(jié)合相關(guān)參考文獻,在遵循適度合理原則的基礎上,綜合考慮并選取了包括具有定量和定性特點的15項工程特征指標,作為PSO-LSSVM預測模型輸入樣本數(shù)據(jù)集的特征因子。
其中,工程特征指標中的定量指標包括工期x1,地上建設層數(shù)x2,地下建設層數(shù)x3,項目建設面積x4,檐口高度x5,三級鋼使用占比x6;定性指標包括主體結(jié)構(gòu)類型x7,基礎類型x8,鋼筋市價等級x9,混凝土市價等級x10,抗震等級x11,建筑外形x12,門窗類型x13,裝修標準x14,安裝工程水平x15。為了將定性指標轉(zhuǎn)化為可計算的量化指標,針對定性指標中的不同等級或水平,借鑒特征哈希思想,采用相鄰自然數(shù)進行編碼表示,即
x7={框架剪力墻,剪力墻,框架,磚混}={1,2,3,4}
x8={獨立,筏板,滿堂,磚混,樁,條形}={1,2,3,4,5}
x9={(3500,4000],(4000,4500],(4500,5000],(5000,5500]}={1,2,3,4}
x10={(300,350],(350,400],(400,450],(450,500]}={1,2,3,4}
x11={一級,二級,三級}={1,2,3}
x12={塔式,板式,異形}={1,2,3}
x13={塑鋼,鋁合金,實木,防火}={1,2,3,4}
x14={毛坯,簡單,精裝}={1,2,3}
x15={簡單,普通,良好,完備}={1,2,3,4}
2.1.2"樣本數(shù)據(jù)處理
本研究樣本數(shù)據(jù)主要來自工作中的已竣工住宅項目數(shù)據(jù),并根據(jù)上述工程指標特征量化方法,對數(shù)據(jù)進行初步處理。為驗證基于小樣本數(shù)據(jù)的預測模型在工程造價預測中能有較高的預測精度,抽取前30組數(shù)據(jù)作為訓練樣本數(shù)據(jù)集,后15組數(shù)據(jù)作為模型預測精度的測試樣本數(shù)據(jù)集。45組數(shù)據(jù)的住宅工程特征指標量化處理數(shù)據(jù)表見表1。
由于工程特征指標中,各指標數(shù)據(jù)量綱均不相同,尤其是定性指標量化為定量指標后,部分指標數(shù)據(jù)在數(shù)值大小上存在量級差異,數(shù)量級大的指標可能掩蓋數(shù)量級小的指標對單方造價預測結(jié)果的影響。因此,有必要在數(shù)據(jù)輸入LSSVM模型前進行歸一化處理,以消除數(shù)據(jù)量綱和數(shù)量級差異帶來的不利影響。本研究中,考慮到PSO-LSSVM預測模型是基于MATLAB平臺來實現(xiàn),輸入樣本數(shù)據(jù)集的歸一化通過LSSVM模型訓練初始化函數(shù)trainlssvm的參數(shù)設計進行處理。
2.2"LSSVM模型γ,σ參數(shù)的PSO優(yōu)化
采用PSO算法進行LSSVM模型(γ,σ)參數(shù)尋優(yōu)時,首先,將樣本數(shù)據(jù)導入,其次,對LSSVM模型訓練初始化函數(shù)trainlssvm和PSO初始化參數(shù)進行設置, LSSVM-PSO參數(shù)初始化設計表見表2。
通過MATLAB編程,在樣本數(shù)據(jù)經(jīng)過LSSVM初始模型訓練的基礎上耦合PSO算法進行參數(shù)尋優(yōu),PSO優(yōu)化迭代曲線圖如圖2所示。
從圖2可看出,在粒子種群迭代26代后,適應度評價函數(shù)fadapt(γ,σ)取得最小值為1.553 3。此時,優(yōu)化計算得到的LSSVM模型最優(yōu)參數(shù)組合(γ,σ)為(250,0.747 9)。
2.3"PSO-LSSVM模型預測結(jié)果分析
將PSO優(yōu)化后的最優(yōu)參數(shù)組合(γ,σ)代入LSSVM模型,再次對30組樣本數(shù)據(jù)集進行模型訓練。使用余下的15組測試樣本數(shù)據(jù)集,進行基于PSO參數(shù)優(yōu)化的LSSVM訓練模型的住宅工程單方造價預測。 PSO-LSSVM模型預測結(jié)果對比曲線如圖3所示??梢钥闯?,除個別預測值與測試樣本實際值差別相對較大,PSO-LSSVM預測模型計算的單方造價絕對誤差最大值出現(xiàn)在圖中樣本編號的2號位置,最大絕對誤差為121.10元/m"2,相對誤差最大值為6.53%;其余模型預測值與實際值的相對誤差均在3.20%以內(nèi),低于實際工程造價快速估算誤差的一般要求。
為進一步評價模型預測效果,計算住宅工程PSO-LSSVM模型預測數(shù)據(jù)的擬合優(yōu)度R"2,樣本單方造價實際值和預測值絕對誤差的均方根誤差RMSEee,以及平均百分比誤差MAPE值,模型預測結(jié)果評價表見表3。
從表3可以看出,PSO-LSSVM模型對預測數(shù)據(jù)的擬合優(yōu)度R"2達到95%以上,具有很好的擬合程度,能夠很好地反應輸入指標與輸出指標間的復雜線性關(guān)系。模型預測值與實際值間的偏離程度較小,為40.90元/m"2。結(jié)合圖3,單方造價屬于[1500元/m"2,2500元/m"2],模型預測的均方根誤差為[1.64%,2.72%],遠小于一般相對誤差控制在5%以內(nèi)的要求,表現(xiàn)出良好的預測穩(wěn)定性和預測精度。同時,從模型預測數(shù)據(jù)的平均百分比誤差MAPE值也可以看出,模型預測具有良好的預測準確性。
因此,綜合模型預測值與實際值誤差對比曲線和模型預測評價參數(shù)計算結(jié)果可知,PSO-LSSVM模型對住宅工程造價具有穩(wěn)定優(yōu)良的預測精度,模型預測均方根誤差可控制在2.72%以內(nèi),采用本模型對類似住宅工程進行工程造價快速預測具有可行性。
3"結(jié)語
(1)針對實際工程項目建設前期設計深化不夠?qū)е碌膯畏皆靸r測算困難、采用傳統(tǒng)方法進行工程造價預測精度不足等問題,首先,提出了一種基于PSO-LSSVM的工程造價預測模型;其次,結(jié)合住宅工程實際情況,給出了住宅工程造價預測模型計算流程;再次,基于工程實例,確定了15項模型輸入工程特征指標,并將單方造價作為模型輸出指標;最后,采用30組小樣本數(shù)據(jù)集,進行PSO算法對LSSVM模型關(guān)鍵參數(shù)γ和σ尋優(yōu),構(gòu)建了具有最優(yōu)參數(shù)組合(γ,σ)的LSSVM預測模型。
(2)基于PSO-LSSVM最優(yōu)模型進行住宅工程單方造價預測結(jié)果分析,結(jié)果表明:PSO-LSSVM模型預測值與實際值的相對誤差基本可控制在3.20%以內(nèi),模型擬合優(yōu)度R"2達到0.955 6,模型預測值與實際值的均方根誤差百分比區(qū)間為[1.64%,2.72%],遠小于一般相對誤差控制在5%以內(nèi)的要求。PSO-LSSVM模型表現(xiàn)出良好的預測穩(wěn)定性和預測精度,在實際住宅工程造價預測應用中具有可行性。
參考文獻
[1]ABU HAMMAD A A,ALI S M A, SWEIS G J,et,al."Statistical analysis on the cost and duration of public building projects[J]."Journal of Management in Engineering,2010,26(2):105-112.
[2]劉毅然,張福泉."基于量子蜂群優(yōu)化的神經(jīng)網(wǎng)絡工程造價預測[J].北京印刷學院學報,2022,30(8):58-63.
[3]謝金豪,劉文昌."基于GA-BP神經(jīng)網(wǎng)絡的建筑工程造價預測研究[J].建筑經(jīng)濟,2022,43(S1):235-240.
[4]陳悅?cè)A,鄭思敏,劉文路."基于機器學習的工業(yè)建筑工程造價預測研究[J]."武漢理工大學學報(信息與管理工程版),2021,43(4):314-321.
[5] 王巧鳳."基于智能算法的快速工程投資估算研究[D]."太原:太原理工大學,2021.
[6] 彭軍龍,胡珂,王夢瑤,等."基于SSA-LSSVM的住宅工程造價預測研究[J]."長沙理工大學學報(自然科學版),2023,20(3):137-145.
[7]楊鄧,楊俊杰,胡晨陽,等."基于改進LSSVM的短期電力負荷預測[J]."電子測量技術(shù),2021,44(18):47-53.
[8]黃沈海,金顯,馬婷婷,等."基于灰色關(guān)聯(lián)模型的LSSVM在變電工程快速報價中的研究[J]."價值工程,2023,42(1):7-9.
收稿日期:2023-12-04
作者簡介:
霍達(1991—),女,注冊造價工程師,研究方向:工程造價管理與咨詢。