鄒梅松,古 欣,石華川
(1.重慶中煙工業(yè)有限責(zé)任公司,重慶 400039;2.中國輕工業(yè)成都設(shè)計(jì)工程有限公司,四川 成都 610000)
逐步回歸過程是將變量引入一個(gè)模型,構(gòu)建一個(gè)檢驗(yàn)過程解釋模型中的變量,當(dāng)模型中的變量不再顯著時(shí),控制該變量刪除,控制回歸方程只含有顯著性變量[1]。工程造價(jià)是卷煙廠建設(shè)工程中重要的工作,從卷煙廠建設(shè)工程前期準(zhǔn)備階段起,綜合建設(shè)工程的設(shè)計(jì)、管理階段,預(yù)測得到工程的花費(fèi)[2]。預(yù)測黔江卷煙廠建設(shè)工程的造價(jià),能夠?yàn)楣こ探ㄔO(shè)初期的決策人員提供決策意見,在工程建設(shè)過程中,能夠有效地控制工程各項(xiàng)開銷,形成一個(gè)科學(xué)化的預(yù)測過程[3]。因此,在逐步回歸的支持下,構(gòu)建建設(shè)工程造價(jià)預(yù)測模型。
國外構(gòu)建工程造價(jià)預(yù)測模型起步較早,以機(jī)器學(xué)習(xí)算法作為支持,匯總了多種影響因素,構(gòu)成工程造價(jià)預(yù)測模型[4]。國內(nèi)研究預(yù)測模型起步較晚,最初以指數(shù)平滑作為算法的處理依據(jù),利用主成分分析匯總為模型的指數(shù)[5],構(gòu)建形成工程造價(jià)預(yù)測模型。從文獻(xiàn)[6]中的預(yù)測模型來看,利用逐步回歸方法有效提取建設(shè)工程造價(jià)數(shù)據(jù),采用多重共線處理過程控制預(yù)測模型的泛化過程,形成了工程預(yù)測過程。從文獻(xiàn)[7]中的預(yù)測模型來看,以工程造價(jià)的影響因素作為預(yù)測模型變化指標(biāo),結(jié)合灰色模型構(gòu)建造價(jià)控制約束函數(shù),并以該約束函數(shù)作為造價(jià)預(yù)測模型的數(shù)值約束關(guān)系。經(jīng)過階段性的工程預(yù)測后,現(xiàn)有的工程造價(jià)模型求解得到的預(yù)測變量數(shù)值偏差過大,導(dǎo)致預(yù)測模型內(nèi)函數(shù)擬合優(yōu)度數(shù)值較小,模型內(nèi)選定的指標(biāo)關(guān)聯(lián)性較差,針對該問題,構(gòu)建基于逐步回歸的黔江卷煙廠建設(shè)工程造價(jià)預(yù)測模型。
在采用逐步回歸算法整理預(yù)測變量時(shí),將歷史預(yù)測變量數(shù)據(jù)標(biāo)準(zhǔn)化處理后[8-9],計(jì)算數(shù)據(jù)的均值,可表示為:
其中,x表示數(shù)據(jù)均值,xi表示建設(shè)工程變量,n表示變量的數(shù)量。根據(jù)計(jì)算得到的均值確定數(shù)據(jù)中的標(biāo)準(zhǔn)值,為控制參與模型構(gòu)建指標(biāo)的數(shù)量,更新處理數(shù)據(jù)變量的偏定系數(shù),數(shù)值關(guān)系可表示為:
其中,Uk表示偏定函數(shù),ri表示更新函數(shù),k表示重復(fù)更新次數(shù)。對應(yīng)上述更新處理過程,選定偏決定參數(shù)較大的數(shù)值作為自變量,不斷檢驗(yàn)自變量的顯著性,檢驗(yàn)過程可表示為:
其中,Up表示數(shù)值逆變函數(shù),M表示顯著參數(shù),其余參數(shù)含義不變。當(dāng)檢驗(yàn)得到的自變量顯著性較強(qiáng)時(shí),將rk-1轉(zhuǎn)換為決策過程,不斷剔除造價(jià)變量中不顯著變量,整理更新處理得到的變量數(shù)據(jù)后,設(shè)定黔江卷煙廠預(yù)測數(shù)據(jù)變化區(qū)間,形成一個(gè)有效的預(yù)測過程。
在設(shè)定黔江卷煙廠建設(shè)工程預(yù)測數(shù)據(jù)區(qū)間時(shí),采用MATLAB軟件模擬仿真數(shù)據(jù),采用最小二乘法處理造價(jià)數(shù)據(jù)中的懲罰系數(shù)以及寬度系數(shù),設(shè)定造價(jià)數(shù)據(jù)的上下限數(shù)值區(qū)間,區(qū)間數(shù)值可表示為:
其中,uk表示造價(jià)函數(shù),ui表示數(shù)據(jù)隸屬度函數(shù),α表示置信參數(shù)。在上述數(shù)值的控制下,以工程數(shù)據(jù)的歷史殘差作為對比標(biāo)準(zhǔn),數(shù)據(jù)區(qū)間表達(dá)如圖1所示。
圖1 數(shù)據(jù)區(qū)間表達(dá)
在圖1所示的數(shù)據(jù)區(qū)間表達(dá)變化下,采用類樣本加權(quán)訓(xùn)練造價(jià)數(shù)據(jù)區(qū)間,整理造價(jià)數(shù)據(jù)的區(qū)間估計(jì)數(shù)值,數(shù)值可表示為:
其中,PL表示下限數(shù)值,Pu表示上限數(shù)值,PI表示置信參數(shù)。在整理造價(jià)數(shù)據(jù)的區(qū)間估計(jì)數(shù)值后,引入支持向量機(jī)聚類為不同類別的數(shù)據(jù)組,綜合卷煙廠建設(shè)工程的工程技術(shù)參數(shù),選定最優(yōu)數(shù)據(jù)組,構(gòu)建造價(jià)預(yù)測模型。
以上述處理過程作為預(yù)測模型組合數(shù)據(jù),在構(gòu)建預(yù)測模型時(shí),組合預(yù)測函數(shù)的權(quán)重,數(shù)值關(guān)系可表示為:
其中,Q表示組合函數(shù)的誤差,wa表示數(shù)值擬合參數(shù)。在預(yù)測數(shù)值關(guān)系控制下,擬合工程建設(shè)過程中產(chǎn)生的質(zhì)量指標(biāo),形成的擬合目標(biāo)函數(shù),數(shù)值關(guān)系可表示為:
其中,C(Q)表示構(gòu)建的擬合目標(biāo),et表示擬合處理過程中產(chǎn)生的擬合誤差函數(shù)。在控制預(yù)測模型的精度時(shí)將擬合處理的樣本數(shù)據(jù)分割處理為多個(gè)數(shù)據(jù)范數(shù)值,控制擬合誤差參數(shù)數(shù)值最小,以設(shè)定的約束數(shù)值關(guān)系作為標(biāo)準(zhǔn),在平面空間范圍內(nèi)繪制變化線段,整理散落在標(biāo)準(zhǔn)線段周圍的造價(jià)數(shù)據(jù)點(diǎn),標(biāo)準(zhǔn)數(shù)值的線性變化及整理過程如圖2所示。
在圖2所示的預(yù)測整理過程下,選定接近標(biāo)準(zhǔn)線段的數(shù)據(jù)點(diǎn),并整理為預(yù)測數(shù)值矩陣,整理得到的數(shù)值關(guān)系可表示為:
圖2 數(shù)值預(yù)測整理過程
其中,R1表示數(shù)值產(chǎn)生的伴隨變化函數(shù),Et表示單向預(yù)測函數(shù)。以上述構(gòu)建得到的數(shù)值關(guān)系作為最終的預(yù)測數(shù)值模型。綜合上述數(shù)值處理過程,最終完成預(yù)測模型的構(gòu)建。
準(zhǔn)備二十組黔江卷煙廠建設(shè)工程所產(chǎn)生的數(shù)據(jù),工程數(shù)據(jù)如表1所示。
表1 樣本數(shù)據(jù)
在表1所示的樣本數(shù)據(jù)下,準(zhǔn)備CPU 型號為Inteli7、內(nèi)存容量為16GB 的計(jì)算機(jī),作為模型驗(yàn)證的上位機(jī)。對應(yīng)上述統(tǒng)計(jì)采集的數(shù)值指標(biāo),在上位機(jī)內(nèi)部建立指標(biāo)邏輯關(guān)系,邏輯關(guān)系如圖3所示。
圖3 構(gòu)建的指標(biāo)邏輯關(guān)系
在圖3構(gòu)建的指標(biāo)邏輯關(guān)系下,準(zhǔn)備文獻(xiàn)[6]和文獻(xiàn)[7]兩種傳統(tǒng)預(yù)測模型與所設(shè)計(jì)的預(yù)測模型進(jìn)行測試,對比三種預(yù)測模型的性能。
在上述實(shí)驗(yàn)環(huán)境下,調(diào)用工程層高、混凝土價(jià)格、鋼筋價(jià)格以及工期作為預(yù)測指標(biāo),根據(jù)工程實(shí)踐過程可知,單一指標(biāo)的變化可能會(huì)引起多個(gè)預(yù)測指標(biāo)產(chǎn)生變化,假定三種預(yù)測模型均調(diào)整高指標(biāo),指標(biāo)的初始因素參數(shù)為0.1,定義其他指標(biāo)隨從變化的敏感性,數(shù)值關(guān)系可表示為:
其中,λ表示設(shè)定的單位指標(biāo)參數(shù),n表示隨從參數(shù),f 表示數(shù)值變化幅值。在上述數(shù)值關(guān)系控制下,得到預(yù)測模型對相同預(yù)測指標(biāo)的敏感性,敏感性結(jié)果如圖4所示。
控制三種預(yù)測模型處理相同的預(yù)測指標(biāo),在定義的敏感度數(shù)值關(guān)系下,固定指標(biāo)的幅值變化參數(shù),以指標(biāo)交匯點(diǎn)對應(yīng)的敏感度數(shù)值作為最終的實(shí)驗(yàn)結(jié)果。當(dāng)預(yù)測模型的敏感度參數(shù)越大,則表示該種預(yù)測模型的預(yù)測結(jié)果越精確。根據(jù)圖4中所示的實(shí)驗(yàn)結(jié)果可知,文獻(xiàn)[6]預(yù)測模型的敏感度數(shù)值為0.4,該種預(yù)測模型的精度較差。文獻(xiàn)[7]預(yù)測模型的敏感度數(shù)值為0.5,預(yù)測模型的預(yù)測精度較佳。而所設(shè)計(jì)的預(yù)測模型敏感度數(shù)值為0.65,與兩種傳統(tǒng)預(yù)測模型相比,所設(shè)計(jì)的預(yù)測模型敏感度數(shù)值最大,該
圖4 三種預(yù)測模型敏感度結(jié)果
種預(yù)測模型精度最佳。
保持上述實(shí)驗(yàn)環(huán)境不變,使用三種預(yù)測模型處理準(zhǔn)備的卷煙廠建設(shè)工程預(yù)測參數(shù),調(diào)用三種預(yù)測模型中的回歸預(yù)測方程,計(jì)算回歸方程的擬合優(yōu)度,數(shù)值關(guān)系可表示為:
其中,R2表示計(jì)算得到的擬合優(yōu)度,SSE表示殘差平方和,SST表示總平方和。在上述數(shù)值關(guān)系的控制下,計(jì)算并統(tǒng)計(jì)三種預(yù)測模型的擬合優(yōu)度結(jié)果,數(shù)值結(jié)果如表2所示。
對應(yīng)構(gòu)建的擬合優(yōu)度判斷數(shù)值關(guān)系,在計(jì)算不同工程預(yù)測編號時(shí),根據(jù)表2所示的實(shí)驗(yàn)結(jié)果可知,文獻(xiàn)[6]預(yù)測模型得到的擬合優(yōu)度數(shù)值在0.75 左右,預(yù)測模型選定的指標(biāo)間的相關(guān)性較差。文獻(xiàn)[7]預(yù)測模型得到的擬合優(yōu)度數(shù)值在0.86左右,擬合優(yōu)度數(shù)值較大,對應(yīng)預(yù)測模型內(nèi)設(shè)定的預(yù)測指標(biāo)相關(guān)性較強(qiáng)。而所設(shè)計(jì)的預(yù)測模型得到的擬合優(yōu)度數(shù)值在0.94左右,與兩種傳統(tǒng)預(yù)測模型相比,所設(shè)計(jì)的預(yù)測模型得到的擬合優(yōu)度數(shù)值最大,模型內(nèi)選定指標(biāo)間的相關(guān)性最強(qiáng),更加適合在卷煙廠建設(shè)工程預(yù)測過程中應(yīng)用。
表2 三種預(yù)測模型的擬合優(yōu)度結(jié)果
在現(xiàn)代工程建設(shè)發(fā)展下,如何構(gòu)建科學(xué)化精度化的預(yù)測模型成為了當(dāng)下的研究熱點(diǎn)。在逐步回歸技術(shù)的支持下,構(gòu)建預(yù)測模型,能夠改善傳統(tǒng)預(yù)測模型中函數(shù)關(guān)系擬合優(yōu)度數(shù)值較小,模型內(nèi)預(yù)測指標(biāo)關(guān)聯(lián)性較差的不足。為今后構(gòu)建預(yù)測模型提供理論及數(shù)據(jù)支持。
自動(dòng)化技術(shù)與應(yīng)用2022年3期