張家忠
基于貢獻(xiàn)度-極限學(xué)習(xí)機(jī)理論算法的輸電線路工程造價(jià)預(yù)測
張家忠
張家忠 危雪林 李冰清
江西博微新技術(shù)有限公司
工程造價(jià)預(yù)測是工程造價(jià)控制的前提,是工程項(xiàng)目可行性研究的基礎(chǔ),也是招投標(biāo)制定標(biāo)底的依據(jù),因此工程造價(jià)預(yù)測成為工程建設(shè)中首要解決的問題??焖俣譁?zhǔn)確地進(jìn)行工程造價(jià)的預(yù)測,對于工程項(xiàng)目的管理實(shí)踐具有重大的理論意義和現(xiàn)實(shí)意義。本文采用貢獻(xiàn)度-極限學(xué)習(xí)機(jī)這些數(shù)學(xué)方法構(gòu)成輸電線路工程造價(jià)預(yù)測模型,并證明該理論與方法的科學(xué)性,進(jìn)而研究解決工程造價(jià)預(yù)測效率不高這一難題。
傳統(tǒng)的造價(jià)預(yù)測一般使用機(jī)理型的構(gòu)建造價(jià)預(yù)測物理模型,近些年來,隨著智能算法的興起,很多學(xué)者開始將灰色關(guān)聯(lián)理論、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(Support Vector Machine,SVM)等方法應(yīng)用于對工程造價(jià)預(yù)測,雖然在各個(gè)領(lǐng)域都取得了一定的效果,但方法本身仍存在不足:灰色模型(如GM(1,1),GM(1,N)等)適用于小樣本,具有運(yùn)算簡單等特點(diǎn),但其對樣本的分布規(guī)律有較嚴(yán)格的要求;神經(jīng)網(wǎng)絡(luò)對非線性系統(tǒng)有良好的逼近能力,但難以確定該模型的結(jié)構(gòu),難以掌握網(wǎng)絡(luò)訓(xùn)練水平,模型求解容易陷入局部最小值,且對連接權(quán)系數(shù)初值敏感,模型參數(shù)不易尋找,過度依賴設(shè)計(jì)技巧。SVM方法具有可靠的理論基礎(chǔ),能克服神經(jīng)網(wǎng)絡(luò)的上述不足,較好地解決小樣本、非線性、高維數(shù)等實(shí)際問題,因此,本文選取極限學(xué)習(xí)機(jī)模型作為輸電線路工程造價(jià)預(yù)測的預(yù)測模型。
為了構(gòu)建造價(jià)預(yù)測模型,首先需要在輸電線路造價(jià)費(fèi)用構(gòu)成模塊中,分析各費(fèi)用項(xiàng)對工程總造價(jià)貢獻(xiàn)度的大小,根據(jù)其對工程總造價(jià)貢獻(xiàn)的大小,對各費(fèi)用項(xiàng)進(jìn)行排序。在工程造價(jià)預(yù)測時(shí),優(yōu)先考慮貢獻(xiàn)度較高的費(fèi)用項(xiàng),在這里提出費(fèi)用貢獻(xiàn)度的概念。
費(fèi)用貢獻(xiàn)度原理:研究各分項(xiàng)費(fèi)用對總費(fèi)用構(gòu)成影響的大小。定義分項(xiàng)費(fèi)用貢獻(xiàn)度模型為
在實(shí)際的分析中,可對貢獻(xiàn)度進(jìn)行賦權(quán)累加分析,直到貢獻(xiàn)度系數(shù)區(qū)間趨于穩(wěn)定。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是由Huang等人提出的一種新的性能優(yōu)良的機(jī)器學(xué)習(xí)算法,該方法摒棄了傳統(tǒng)的調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值的策略,不但避免了陷入局部最小化的風(fēng)險(xiǎn),而且極大地提高了網(wǎng)絡(luò)的學(xué)習(xí)速度和推廣性能。相關(guān)研究表明,ELM和SVM有近似的預(yù)測精度,但其參數(shù)易得,運(yùn)算速度非???,在學(xué)習(xí)速率上有明顯優(yōu)勢。
ELM確定隱含層神經(jīng)元個(gè)數(shù)和激勵(lì)函數(shù)g(x),對于每一組隨機(jī)生成的w 和b ,都可計(jì)算出一個(gè)唯一的β與之對應(yīng)。具體步驟如下:
對網(wǎng)絡(luò)的輸入權(quán)值wi和隱層節(jié)點(diǎn)偏置值bi進(jìn)行隨機(jī)賦值,i=1,2,…,M;
計(jì)算隱層輸出矩陣H ;
數(shù)據(jù)預(yù)處理
輸電線路工程造價(jià)費(fèi)用構(gòu)成主要包括費(fèi)用、量、價(jià)、技術(shù)條件等。因此,造價(jià)預(yù)測研究采集數(shù)據(jù)來源自各網(wǎng)省《國家電網(wǎng)公司輸變電工程造價(jià)分析數(shù)據(jù)收集表(2013-2014)》,數(shù)據(jù)共采集2013-2014年各網(wǎng)省輸變輸電線路工程,其工程數(shù)量128個(gè)、造價(jià)分析數(shù)據(jù)20736個(gè)。因?yàn)椴杉降臄?shù)據(jù)中存在部分?jǐn)?shù)據(jù)計(jì)算方式不同、數(shù)據(jù)單位不統(tǒng)一、數(shù)量級不統(tǒng)一等問題,需對樣本工程數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理常用方法為歸一化方法,關(guān)于數(shù)據(jù)的歸一化,很多文獻(xiàn)都有詳細(xì)的介紹,本文不再單獨(dú)介紹。
貢獻(xiàn)度分析
依據(jù)預(yù)處理后樣本工程數(shù)據(jù),利用matlab軟件,計(jì)算“決算.靜態(tài)投資”與造價(jià)預(yù)測指標(biāo)的貢獻(xiàn)度。取每個(gè)預(yù)測指標(biāo)與靜態(tài)投資貢獻(xiàn)度的絕對值,貢獻(xiàn)度絕對值相等的指標(biāo),其對靜態(tài)投資的影響是相同的。將相關(guān)系數(shù)優(yōu)化,同時(shí)統(tǒng)計(jì)有效樣本工程數(shù)。
貢獻(xiàn)度系數(shù)值越大,表明兩者之間的關(guān)聯(lián)度越大。初始貢獻(xiàn)度不足以說明兩者之間絕對的關(guān)聯(lián)度。根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論,通過貢獻(xiàn)度累加,二次分析預(yù)測指標(biāo)與靜態(tài)投資的貢獻(xiàn)度。
通過貢獻(xiàn)度初始優(yōu)化和賦權(quán)優(yōu)化,得出貢獻(xiàn)度區(qū)間[0.6,0.7]的概率為賦權(quán)系數(shù)0.8的界限,即對靜態(tài)投資的貢獻(xiàn)度系數(shù)應(yīng)大于0.6,則根據(jù)貢獻(xiàn)度分析,可得造價(jià)預(yù)測主要指標(biāo)包括:線路長度合計(jì)(折單)(0.761)、桿塔.總基數(shù)(基)(0.603)、桿塔.直線塔(基)(0.653)、導(dǎo)線.線材量(t)(0.886)、土石方量.基坑(0.736)土石方量.接地(0.738)、基礎(chǔ)混凝土總量(m3)(0.718)、基礎(chǔ)鋼材量(t)(0.886)。
隱含層結(jié)點(diǎn)分析
根據(jù)極限學(xué)習(xí)機(jī)預(yù)測理論,首先需確定隱含層神經(jīng)元個(gè)數(shù)。通過多次實(shí)驗(yàn),進(jìn)行累加計(jì)算,直到隱含層個(gè)數(shù)趨于穩(wěn)定值。經(jīng)過多次實(shí)驗(yàn)和累加計(jì)算,發(fā)現(xiàn)誤差和最低的神經(jīng)元層數(shù)基本確定在26,因此,將平均誤差隱含神經(jīng)元個(gè)數(shù)確定值為26。如圖1所示。
圖1 多次待定隱含層個(gè)數(shù)預(yù)測誤差平均
造價(jià)預(yù)測及評價(jià)
樣本工程數(shù)量128個(gè),由于主要指標(biāo)數(shù)據(jù)缺省,有效樣本工程數(shù)量為75個(gè)。選取前60條工程數(shù)據(jù)作為訓(xùn)練樣本,后15條工程數(shù)據(jù)為檢驗(yàn)樣本(工程編號為A001-A015)。應(yīng)用極限學(xué)習(xí)機(jī)造價(jià)預(yù)測模型對工程靜態(tài)投資進(jìn)行預(yù)測,預(yù)測結(jié)果如圖2。
圖2 造價(jià)預(yù)測分析藍(lán)色:實(shí)際造價(jià)值;紅色:預(yù)測造價(jià)值。
綜合輸電工程造價(jià)預(yù)測結(jié)果,證明極限學(xué)習(xí)機(jī)可用于造價(jià)預(yù)測,由于采集樣本貢獻(xiàn)度僅為80%,且樣本數(shù)據(jù)可能有誤,因此預(yù)測絕對百分誤差在20%左右可接受。使用樣本數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)進(jìn)行造價(jià)預(yù)測,絕對百分誤差分別為31.3%和24.7%,證明了極限學(xué)習(xí)機(jī)算法在預(yù)測精度上較神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的優(yōu)越性。
在算法時(shí)間復(fù)雜度方面,神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練迭代10000次,用時(shí)22s,支持向量機(jī)預(yù)測用時(shí)14s,極限學(xué)習(xí)機(jī)為保證預(yù)測精度,預(yù)測500次取均值,僅用時(shí)27s,平均預(yù)測一次只需0.054s,因此極限學(xué)習(xí)機(jī)的運(yùn)算速度較神經(jīng)網(wǎng)絡(luò)及支持向量機(jī)較優(yōu)。
10.3969/j.issn.1001-8972.2015.02.054