李 玨,肖麗紅,黃 祺
(1.長(zhǎng)沙理工大學(xué)交通運(yùn)輸工程學(xué)院,湖南 長(zhǎng)沙 410004; 2.湖南交通職業(yè)技術(shù)學(xué)院,湖南 長(zhǎng)沙 410132)
公路工程造價(jià)控制是工程建設(shè)管理工作重要組成部分,而其投資決策階段的工程造價(jià)控制是公路工程造價(jià)控制的源頭,它對(duì)建設(shè)全過(guò)程的工程造價(jià)往往其決定性作用。[1]公路工程項(xiàng)目特點(diǎn)涉及許多的不確定性因素,構(gòu)成復(fù)雜,其工程造價(jià)計(jì)算繁瑣,且具有動(dòng)態(tài)性和較大的模糊性。有關(guān)數(shù)據(jù)表明,決策與設(shè)計(jì)階段對(duì)工程造價(jià)的影響程度達(dá)到88%,項(xiàng)目前期投資估算的偏差和設(shè)計(jì)的不合理,是造成投資效益低下、“三超”現(xiàn)象屢禁不止的根源。[2]除此之外,公路工程前期準(zhǔn)確估算可保證項(xiàng)目計(jì)劃、時(shí)間安排和資源分配有效進(jìn)行,因此,加強(qiáng)對(duì)公路工程投資決算階段的研究具有重大意義。
基于案例推理(case based Reasoning,CBR)是20世紀(jì)70年代末發(fā)展起來(lái)的一項(xiàng)人工智能技術(shù),起源于認(rèn)知科學(xué)中記憶在人類推理活動(dòng)中所扮演的角色,是人工智能領(lǐng)域一種迅速而且有效的推理方法。[ 3]案例推理模型是利用以往類似問(wèn)題的求解經(jīng)驗(yàn)解決當(dāng)前的問(wèn)題。它首先通過(guò)檢索已經(jīng)解決好的問(wèn)題集合(案例庫(kù))中與當(dāng)前問(wèn)題類似的案例,然后對(duì)此進(jìn)行一系列的修改后,給當(dāng)前問(wèn)題提供合適解的一種推理模式。案例推理一般過(guò)程由檢索、復(fù)用、修正、學(xué)習(xí)4個(gè)主要過(guò)程組成。[4]基于案例推理模型的工程估算是利用已完工程項(xiàng)目的資料建立案例庫(kù);同時(shí)對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化處理,在檢索階段,首先對(duì)目標(biāo)案例(待測(cè)項(xiàng)目)進(jìn)行項(xiàng)目特征描述;然后從案例庫(kù)中檢索與之相似的舊案例,并對(duì)相似案例的待定結(jié)果進(jìn)行修正,并把修正階段分為修正I、修正II階段,修正I階段運(yùn)用定量方法,通過(guò)對(duì)檢索得到一系列相似案例重用,在目標(biāo)案例特征屬性值的基礎(chǔ)上對(duì)其調(diào)整,彌補(bǔ)了該模型應(yīng)用于工程估算的不足之處;修正II階段為專家評(píng)價(jià),確定當(dāng)前案例的結(jié)果;學(xué)習(xí)階段是對(duì)當(dāng)前案例學(xué)習(xí)后并保存在案例庫(kù),以便豐富案例庫(kù)。其實(shí)現(xiàn)流程如圖1所示。
公路工程主要特征在于它是建設(shè)在大地表面上的一種線性帶狀結(jié)構(gòu)物,因此,其造價(jià)也體現(xiàn)了特殊性和差異性。其結(jié)構(gòu)組成包括:路基、路面、排水結(jié)構(gòu)物、公路特殊結(jié)構(gòu)物(如隧道、橋梁、擋土墻等)以及防護(hù)工程。從實(shí)踐中我們得知,公路工程的任何一個(gè)特征都會(huì)影響到總的工程造價(jià),如果考慮所有的特征屬性,盡管對(duì)案例的描述起一定的作用,但增加了案例檢索的復(fù)雜性,甚至對(duì)案例庫(kù)的聚類起反作用。[5]因此,為了避免選擇工程特征屬性的盲目性,本文結(jié)合公路工程實(shí)際的客觀規(guī)律來(lái)挑選,盡量選取獨(dú)立的因素。同時(shí),為了方便后面的研究,我們把公路工程項(xiàng)目特征劃分為二種:數(shù)值型、字符型 。綜上所述,選取13個(gè)公路工程特性,可以比較全面的反映公路工程造價(jià)的情況。[6]公路工程項(xiàng)目特征如下表1所示。
圖1 案例推理模型流程圖
為了使估算的結(jié)果更加準(zhǔn)確,所有使用的數(shù)據(jù)盡量采用工程預(yù)決算數(shù)據(jù)。對(duì)于數(shù)值類型數(shù)據(jù)的屬性值直接采用原始數(shù)據(jù)表示;對(duì)于字符型的項(xiàng)目特征,把定性的數(shù)據(jù)定量化,在路面形式中,可以分為:瀝青混凝土路面和水泥混凝土路面,分別取0.8和0.6;在地形特征中,可分為平原、微丘區(qū)、重丘區(qū),這三種情況分別取0.2、0.5和0.8,所在地區(qū)工程特性的選取中,中國(guó)各個(gè)省份分為三種情況,分別取為0.3、0.6和0.9。當(dāng)一條路的不同路段有不同的工程特性時(shí),利用加權(quán)求和的方法。[6]
表1 公路工程項(xiàng)目特性
權(quán)重系數(shù)的大小反映案例相似性評(píng)估中各個(gè)特征屬性的相對(duì)重要程度,取值將直接影響到評(píng)估結(jié)果的好壞。[7]由于公路工程各個(gè)特征在案例中所處地位不同,對(duì)案例性質(zhì)的影響程度和所起的作用也不相同,因此公路工程項(xiàng)目特征權(quán)重值的分配和確定是進(jìn)行案例匹配的重要基礎(chǔ)性工作之一。傳統(tǒng)的案例特征定權(quán)方法過(guò)分依賴于主觀判斷和經(jīng)驗(yàn),而運(yùn)用粗糙集理論對(duì)特征屬性權(quán)重系數(shù)的計(jì)算方法,可以克服傳統(tǒng)方法的局限性,使案例相似性匹配更具有客觀性,提高匹配精確度。[8]同時(shí),在進(jìn)行某一分類檢索時(shí),并且可以根據(jù)這種重要程度對(duì)各個(gè)相似特征屬性的權(quán)重值賦值,刪除某些沒有起到預(yù)期作用的特征屬性,提高案例檢索的效率,因此,本文運(yùn)用粗糙集方法確定公路工程特征屬性的權(quán)重值。
把一個(gè)信息決策表系統(tǒng)表示為S=(U,A,V,F),其中U為非空的有限論域,表示在案例中所有案例的集合;A=C∪D(C∩D=?)是非空的屬性有限集,其中條件屬性C為案例特征屬性的集合,V為屬性取值的集合。[7]在公路工程造價(jià)預(yù)測(cè)分析中,由于無(wú)決策屬性,在信息系統(tǒng)處理中令D=C進(jìn)行離散化。
基于粗糙集的案例特征屬性權(quán)重計(jì)算步驟為:
(1)首先需對(duì)案例庫(kù)中的數(shù)據(jù)預(yù)處理。采用Rough Set理論中連續(xù)屬性的離散方法[8]對(duì)公路工程項(xiàng)目特征連續(xù)屬性值進(jìn)行離散化,轉(zhuǎn)變?yōu)槎ㄐ詫傩?。其基本任?wù)是通過(guò)選擇適當(dāng)?shù)膭澐贮c(diǎn)將整個(gè)連續(xù)屬性的值域范圍化為一些離散區(qū)間,并且用不同的整數(shù)值代表每個(gè)子區(qū)間得屬性值。
(2)計(jì)算各案例庫(kù)特征屬性的知識(shí)熵H(ai),并進(jìn)行歸一化后得出權(quán)值。在離散化的基礎(chǔ)上,確定當(dāng)前特征對(duì)案例的劃分,特征ai劃分為ρ
(1)
其知識(shí)熵計(jì)算公式:
(2)
根據(jù)特征屬性的知識(shí)熵大小確定權(quán)重分配,歸一化處理的權(quán)值計(jì)算公式為
wi=H(ai)/∑H(ai)
(3)
因此,權(quán)重的取值范圍為[0,1-1/n],(n=1/|U|),符合權(quán)值的要求,當(dāng)分類均勻的時(shí)候不確定性最大,權(quán)重也最大。當(dāng)不分類就不存在不確定性,其權(quán)重為0,而權(quán)重為0的屬性對(duì)造價(jià)幾乎沒有影響,可把該屬性刪除,達(dá)到了簡(jiǎn)約屬性的目的,也減少了案例匹配工作。
在案例推理系統(tǒng)中,目標(biāo)案例以不完整或者模糊的信息出現(xiàn),需要利用目標(biāo)案例特征屬性聯(lián)想過(guò)去的源案例,即對(duì)案例庫(kù)進(jìn)行檢索。在最初的檢索結(jié)束后,需比較它們之間的相似性由此得出一些與目標(biāo)案例相似的案例。現(xiàn)有的傳統(tǒng)檢索方法主要包括:最近相鄰法、歸納法、知識(shí)引導(dǎo)法,以上三種方法都比較適合定性屬性的檢索,但對(duì)定量屬性的檢索不易完成,而且對(duì)于一些具有模糊型的定量屬性的檢索就更為困難。[9]考慮到影響公路工程造價(jià)因素眾多,需要從總體上分析兩個(gè)工程項(xiàng)目的相似性,結(jié)合灰色關(guān)聯(lián)分析法對(duì)定量屬性進(jìn)行檢索,開展了對(duì)公路工程項(xiàng)目的總體相似性分析。
由于案例庫(kù)中的案例不盡相同,為了簡(jiǎn)化工作,首先對(duì)案例庫(kù)中的案例進(jìn)行粗選,其計(jì)算公式:w=n/m,其中m代表目標(biāo)案例與案例庫(kù)中案例屬性并集屬性的個(gè)數(shù),n代表交集中屬性的個(gè)數(shù)。在CBR系統(tǒng)中可令w=1時(shí)的案例可作為粗選結(jié)果。[10]
灰色關(guān)聯(lián)分析法是分析系統(tǒng)中各個(gè)元素之間關(guān)聯(lián)程度或相似程度的方法,其基本思想是依關(guān)聯(lián)程度對(duì)系統(tǒng)排序。[11]進(jìn)行關(guān)聯(lián)分時(shí),把目標(biāo)案例的特征屬性作為參考的數(shù)據(jù)列,參考的數(shù)據(jù)列常記為X0,X0={X0(1),X0(2),…,X0(n)},被比較數(shù)據(jù)列表示為Xi,Xi={Xi(1),Xi(2),…,Xi(n)}。對(duì)于一個(gè)參考數(shù)據(jù)列X0,比較數(shù)據(jù)列為Xi,可用下述關(guān)系表示各比較數(shù)據(jù)列與參考數(shù)據(jù)列的各元素差:
ξi(k)=
(4)
其中:ρ為分辨系數(shù),ρ∈(0,1)。引入它可以減少極值對(duì)計(jì)算的影響,在實(shí)際運(yùn)用中,應(yīng)根據(jù)序列間的關(guān)聯(lián)程度選擇分辨系數(shù),取ρ≤0.5最為恰當(dāng)。
關(guān)聯(lián)度是表示兩個(gè)事物的關(guān)聯(lián)程度,具體地說(shuō),關(guān)聯(lián)度是因素之間關(guān)聯(lián)性大小的量度,它可以定量地描述了各因素之間相對(duì)變化的情況,關(guān)聯(lián)度計(jì)算式表示為
(5)
其中,ri表示數(shù)據(jù)列Xi與X0的關(guān)聯(lián)度,wk表示第k個(gè)元素的特征權(quán)重值。關(guān)聯(lián)度ri越大,表示目標(biāo)案例與該案例的相似程度越高。對(duì)相似案例的關(guān)聯(lián)度按大小進(jìn)行排序,取閥值ζ=0.6,當(dāng)相似案例關(guān)聯(lián)度大于閥值時(shí),保留這些相似案例,當(dāng)相似案例的關(guān)聯(lián)度小于閥值時(shí),將其舍掉。
經(jīng)過(guò)相似案例的檢索階段,得到一些與目標(biāo)案例相似的案例。由于檢索后的結(jié)果并不能作為目標(biāo)案例的解,因此,需把目標(biāo)案例與相似案例的特征屬性之間的值進(jìn)行比較,根據(jù)特征權(quán)重值對(duì)相似案例的建議解修正,最后確定目標(biāo)案例的解。
檢索后得出幾個(gè)相似案例的建議解,每個(gè)屬性相似度可用目標(biāo)案例的屬性值與相似案例的屬性值之間的比值表示,其計(jì)算式表示為
(6)
其中,ASi表示特征屬性i的相似度,X0(i)表示目標(biāo)案例屬性值i,Xj(i)表示相似案例屬性值i(j=1,2,…,n)。由于所選取的屬性與公路工程造價(jià)都是正相關(guān),屬性i的誤差率AERi表示為:
(7)
當(dāng)目標(biāo)案例與源案例的屬性值完全一致時(shí),ASi取值為1,每一個(gè)特征屬性對(duì)公路造價(jià)的影響不同,因此,特征屬性i的修正值A(chǔ)RVi為
ARVi=(wi×PS)×AERi=ICCi×AERi
(8)
其中,ICCi表示特征屬性i對(duì)公路造價(jià)的影響大小,PS表示為相似案例的建議解。
對(duì)相似案例的特征屬性的修正值進(jìn)行求和,最后可以得出相似案例的修正解,其計(jì)算公式為
(9)
對(duì)相似案例的修正值進(jìn)行分析,舍掉修正值偏離大的相似案例,根據(jù)相似案例的關(guān)聯(lián)度,對(duì)修正后的結(jié)果進(jìn)行加權(quán)平均計(jì)算,得出目標(biāo)案例的估算值。
本文利用文獻(xiàn)[6]的23條已竣工高速公路工程的預(yù)決算資料,假設(shè)案例庫(kù)由編號(hào)為E1~E22的實(shí)例組成,把實(shí)例E0作為目標(biāo)案例,用它們對(duì)所建模型進(jìn)行檢驗(yàn)。首先運(yùn)用索引機(jī)制進(jìn)行粗選,檢索出與目標(biāo)案例有相同特征屬性的實(shí)例,同時(shí),為了方便比較,需把粗選后實(shí)例的造價(jià)建安費(fèi)都換算為同一時(shí)期(2000年)的價(jià)格,結(jié)果如表2所示。
表2 已建高速公路工程特性和造價(jià)數(shù)據(jù)
由表2,可用U={E0,E1…,Es}表示案例集合,12個(gè)案例特征屬性可以描敘為:C={X1,X2,,..,X12},對(duì)8個(gè)實(shí)例的定量屬性進(jìn)行離散處理,采用文獻(xiàn)[8]的離散方法,利用MATLAB對(duì)屬性特征值離散化,使其變?yōu)槎ㄐ詫傩?離散后的結(jié)果見表3。
表3 離散化的工程實(shí)例特征屬性表
如X1對(duì)案例庫(kù)劃分為U/IND(X1)={(E1,E2),(E3,E5),(E4),(E7),(E8)},由公式(1)、(2)得主線路程屬性權(quán)重值,利用公式(3)進(jìn)行歸一化后得到特征屬性權(quán)向量:
W=(w1,w2,…,w12)=
(0.1053,0.1053,0.0981,0.0810,0.1093,
0.0931,0.0972,0.0931,0.0891,0.0850,
0.0526)
由表2中的數(shù)據(jù),運(yùn)用公式(4),可分別得出目標(biāo)案例E0與實(shí)例E1~E8元素差ξi,把ξi分別代入公式(5)可得出目標(biāo)案例的關(guān)聯(lián)度,r1=0.7665,r2=0.8010,,r3=0.7338,r4=0.6217,r5=0.7296,r6=0.5453,r7=0.6655,r8=0.6330,其關(guān)聯(lián)度大小排序?yàn)椋簉2>r1>r3>r5>r7>r8>r4>r6。因此,其與目標(biāo)案例匹配的相似程度排序?yàn)椋珽2>E1>E3>E5>E7>E8>E4>E6。取ζ=0.6,由于E6關(guān)聯(lián)度小于0.65,將E6舍掉,保留E1、E2、E3、E4、E5、E7、E8作為相似案例。
由公式(6)、(7)、(8),對(duì)相似案例E1、E2、E3、E4、E5、E7、E8的工程造價(jià)建安費(fèi)進(jìn)行修正,可得出修正后分別為:RS1=1759.373,RS2=1694.60,RS3=1768.15,RS4=1850.34,RS5=1762.42,RS7=1780.48,RS8=1788.13。按相似程度從高到低排列,其修正前和修正后誤差率如圖2所示。
圖2 相似案例的建議解修正前和修正后的誤差率
由于相似案例E4的修正后的值偏離比較大,將其舍掉,由相似案例的關(guān)聯(lián)度,對(duì)E1、E2、E3、E5、E7、E8的修正后的結(jié)果采用加權(quán)平均的方法,1759.373*0.7665/4.3294+1694.60*0.8010/4.3294+1768.15*0.7338/4.3294+1762.42*0.7296/4.3294+1780.48*0.6655/4.3294+1788.13*0.6330/4.3294=1756.84,從估算當(dāng)前目標(biāo)案例的工程造價(jià)建安費(fèi)結(jié)果可以看出,證明了該方法的有效性。
本文基于案例推理模型形成了一種對(duì)公路工程精確估算的方法,整個(gè)過(guò)程充分發(fā)揮了采用定量分析對(duì)數(shù)據(jù)處理的優(yōu)勢(shì),克服了多指標(biāo)因素相互關(guān)聯(lián)的情況,從而準(zhǔn)確地檢索到相似案例,并對(duì)相似案例定量地調(diào)整和評(píng)價(jià),提高了對(duì)公路工程造價(jià)預(yù)測(cè)的準(zhǔn)確度,實(shí)例分析驗(yàn)證了本文模型的有效性。
[參考文獻(xiàn)]
[1]林佑性.公路工程投資決策階段造價(jià)控制的主要問(wèn)題和對(duì)策[J].科技經(jīng)濟(jì)市場(chǎng),2008(9):34-35.
[2]汪曉慧.基于案例推理的道路工程投資估算方法的分析[J].工程與建設(shè),2009(5):745-747.
[3]王曉亮,劉西拉.基于事例推理系統(tǒng)中的模糊檢索[J].上海交通大學(xué)學(xué)報(bào),2007(11):1783-1787.
[4]武智鵬,陳立潮,黃波.基于案例推理的研究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2007(1):158-159.
[5]Marir ,F., and Watson, I. (1995). CBR efurb: Case-based cost estimation, Institute of Electrical Engineers (IEE), London, 513-515.
[6]張馳宇.高速公路造價(jià)快速估算模型與方法研究[D].西南交通大學(xué),2006.
[7]李聞?dòng)?基于事例推理的稿件刊發(fā)計(jì)劃的建模方法研究[D].大連理工大學(xué),2002.
[8]孫翎,張金隆,遲嘉昱.基于粗糙集的CBR系統(tǒng)案例特征權(quán)值確定[J].計(jì)算機(jī)工程與應(yīng)用,2003(30):44-46.
[9]陳虹,毛紅保.一種新的基于粗糙集的案例特征權(quán)值確定方法[J].西安工業(yè)大學(xué)學(xué)報(bào),2010(30):402-405.
[10]苗奪謙,Rough set理論中連續(xù)屬性的離散化方法[J].自動(dòng)化學(xué)報(bào),2011(5):296-302.
[11]張文領(lǐng),姜韶華,劉國(guó)棟 .基于灰色關(guān)聯(lián)分析的工程項(xiàng)目案例推理模型研究 [J].價(jià)值工程,2009(11):84-87.