楊 龍 ,徐雄軍 ,黃丞遠(yuǎn) ,薛田良 ,張 磊
(1.國網(wǎng)孝感供電公司 運(yùn)維檢修部,湖北 孝感 442000;2.三峽大學(xué) 電氣與新能源學(xué)院,湖北 宜昌 443002)
要實現(xiàn)電網(wǎng)高質(zhì)量發(fā)展,專業(yè)化、精準(zhǔn)化的輸變電工程造價管理是其重要的基礎(chǔ)。而做到專業(yè)化、精準(zhǔn)化的輸變電工程造價管理首先需要解決的是如何對現(xiàn)有工程進(jìn)行造價水平進(jìn)行評估,只有在已知現(xiàn)有造價水平的情況下才能進(jìn)一步評估和監(jiān)測在建工程的造價情況,從而實現(xiàn)精準(zhǔn)動態(tài)造價管控。但是,目前鮮有針對輸變電工程造價水平的評估方法研究,此缺失影響了輸變電工程的投資管控效率。
目前,對輸變電工程造價進(jìn)行管控,主要從兩方面進(jìn)行。一是從影響造價水平的因素入手,通過篩選主要影響造價水平的因素對工程整體造價進(jìn)行定性分析。文獻(xiàn)[1]從影響深度入手,對影響變電工程造價的16個主要因素進(jìn)行遞階層次關(guān)系分析,按照遞階關(guān)系,把影響因素分為深層原因、淺層原因及表層原因,把深層原因確定為關(guān)系因素。文獻(xiàn)[2]從造價影響因素因果鏈角度,采用系統(tǒng)解釋結(jié)構(gòu)模型ISM,找到了影響工程項目造價的表層原因、中層原因和深層次原因。文獻(xiàn)[3]針對設(shè)計階段的造價影響因素進(jìn)行了分析。文獻(xiàn)[4]針對輸電線路工程造價影響因素進(jìn)行了分析,采用篩方法選擇了桿路長度、輸送容量、地形綜合系數(shù)、線材價格、風(fēng)速、塔材價格、覆冰7個指標(biāo)為工程造價主要影響因素,并進(jìn)行了工程檢驗。文獻(xiàn)[5]從影響造價的全責(zé)角度,把造價影響因素歸結(jié)為客觀原因、建設(shè)方原因、設(shè)計原因和施工原因等4個方面。文獻(xiàn)[6]從相關(guān)性角度,分析出了電纜能耗、經(jīng)濟(jì)指標(biāo)和運(yùn)行長度三個關(guān)鍵影響因素。另一種研究思路是結(jié)合某一具體工程造價指標(biāo)對工程造價情況進(jìn)行研究。文獻(xiàn)[7]以工程決算投資為指標(biāo),針對220 k V變電工程,通過識別關(guān)鍵因素構(gòu)建支持向量機(jī)評估模型,結(jié)合工程進(jìn)行造價評估。文獻(xiàn)[8]通過工程概算投資,構(gòu)建REGR-WNN組合變權(quán)模型,對工程造價進(jìn)行監(jiān)測。文獻(xiàn)[9]結(jié)合工程靜態(tài)投資,以隨機(jī)森林和支持向量機(jī)建立智能概算估算模型,結(jié)合實例驗證了該方法的有效性。
無論是從影響造價水平因素入手,還是從某一具體工程造價指標(biāo)出發(fā),都給現(xiàn)有輸變電工程造價管控提供了一定的決策依據(jù)。然而上述方法僅通過已知數(shù)據(jù)進(jìn)行統(tǒng)計分析計算,是一種典型的事后控制策略,統(tǒng)計分析結(jié)果如何體現(xiàn)輸變電工程造價水平?統(tǒng)計數(shù)據(jù)變化后造價水平會如何變化?如何對正在進(jìn)行的工程進(jìn)行造價水平監(jiān)測預(yù)警?上述問題在目前方法下還無法有效回答。隨著人工智能技術(shù)在各行業(yè)的廣泛應(yīng)用,通過對輸變電造價歷史數(shù)據(jù)庫的深度學(xué)習(xí),進(jìn)行輸變電工程造價水平監(jiān)測成為解答上述問題的一種可行方法。
為此,本文提出一種輸變電工程造價水平智能評估監(jiān)測方法,主要結(jié)合機(jī)器學(xué)習(xí)解決高維小樣本特性造價數(shù)據(jù)帶來的影響,并實現(xiàn)智能化的電網(wǎng)工程造價水平評估監(jiān)測過程?;谀呈」こ淘靸r數(shù)據(jù),證明所提方法的可行性。
輸變電工程主要包含變電工程、線路工程、通信工程三大類。表1給出了某省2010年—2018年輸變電工程造價數(shù)據(jù)庫各類工程樣本容量及樣本特征維度統(tǒng)計結(jié)果。如表1所示,各類型輸變電工程造價原始樣本經(jīng)數(shù)據(jù)預(yù)處理后,可用于輸變電工程造價監(jiān)測的樣本僅占原始樣本的50%左右。另一方面,由于輸變電造價過程的復(fù)雜性,現(xiàn)有各類工程的造價特征維度達(dá)到了106維(平均維度)。因此,輸變電工程造價數(shù)據(jù)庫具有明顯的高維小樣本特性。
表1 輸變電工程造價數(shù)據(jù)特征Tab.1 Data characteristics of transmission and transformation engineering cost data
一方面,特征維度高、樣本容量小的高維小樣本數(shù)據(jù)會造成單一維度的絕對樣本容量偏少,在造價水平評估過程中出現(xiàn)“過擬合”現(xiàn)象;另一方面,高特征維度又會為帶來“維數(shù)災(zāi)”問題。這都會嚴(yán)重影響工程造價水平評估的精準(zhǔn)性。因此,為實現(xiàn)精準(zhǔn)化的輸變電工程造價水平評估監(jiān)測,需要對原始的工程造價數(shù)據(jù)進(jìn)行特征選擇處理[10]以消除高維小樣本特性帶來的不良影響。
為減小高維小樣本造價數(shù)據(jù)帶來的特征選擇穩(wěn)定性問題,考慮采用基于深度比特神經(jīng)網(wǎng)絡(luò)的隨機(jī)比特森林(Random Bits Forest,RBF)學(xué)習(xí)算法[11],提出了一種RBF-RCE輸變電工程造價數(shù)據(jù)特征選擇方法,如圖1所示。該方法主要分為如下三步。
(1)步驟1,輸變電工程造價數(shù)據(jù)特征辨識聚類。主要采用K均值聚類算法(K-Means Clustering)對樣本特征進(jìn)行聚類篩選,形成m個特征聚類,特征fi與fj之間的相關(guān)距離定義如式(1)所示:
(2)步驟2,輸變電工程造價數(shù)據(jù)特征重要性計算。基于Bootstrap重采樣獲得M組訓(xùn)練樣本集,以及袋外測試集(Out of Bag,OOB)。在此基礎(chǔ)上,對所有特征進(jìn)行隨機(jī)特征置換,獲得置換訓(xùn)練集。把訓(xùn)練集和特征隨機(jī)訓(xùn)練集分別用隨機(jī)比特森林算法進(jìn)行準(zhǔn)確率學(xué)習(xí),得到OOB準(zhǔn)確率γi和γfij。然后采用公式(2)~公式(5)計算特征重要度fimp:
(3)步驟3,剔除多余特征,形成最終特征子集。首先根據(jù)特征總數(shù)設(shè)定特征類,刪除閾值p和特征數(shù),刪除閾值q,后續(xù)分為如下三種情況考慮:
①根據(jù)步驟1,當(dāng)完成輸變電工程造價數(shù)據(jù)特征辨識聚類工作后,若所取得的特征類m大于p值時,刪除特征得分最低特征類中的d×10-2特征,具體刪除特征數(shù)量根據(jù)m而定。
②當(dāng)特征類m小于p,且特征得分最低特征類中特征數(shù)大于q時,則刪除特征得分最低特征類中的d×10-2特征。
③當(dāng)特征類m小于p,且特征得分最低特征類中特征數(shù)小于q時,則不做特征刪除,直接構(gòu)成新的樣本特征子集。最后判斷是否滿足終止條件,若滿足,則輸出為最終特征子集;若不滿足,返回第一步進(jìn)行迭代。
通過RBF-RCE特征選擇方法,能夠?qū)崿F(xiàn)對高維造價數(shù)據(jù)的降維處理,同時有效擴(kuò)充了工程樣本數(shù)量,進(jìn)而避免由工程造價數(shù)據(jù)的高維小樣本特性,對后續(xù)分類學(xué)習(xí)可能造成的“維數(shù)災(zāi)”以及過擬合現(xiàn)象的不良影響。RBF-RCE特征選擇方法的提出,有效解決了以往針對工程造價數(shù)據(jù)的處理方法缺乏的困境,為后續(xù)的數(shù)據(jù)識別分類的準(zhǔn)確性提供了有力保障。整體的RBF-RCE工程造價數(shù)據(jù)特征選擇方法如圖1所示。
圖1 RBF-RCE特征選擇方法Fig.1 RBF-RCE feature selection method
為衡量輸變電工程造價水平,本文建立了動態(tài)造價水平評估監(jiān)測指標(biāo)(Dynamic Cost Level,DCI),如式(7)所示。
式中,ESI,i(Estimated Static Investment,ESI)為工程i的概算靜態(tài)投資,F(xiàn)SI,i(Final Accounts Static Investment,F(xiàn)SI)為工程i的決算靜態(tài)投資。其評價標(biāo)準(zhǔn)如式(8)所示:
式中,α為造價水平合格臨界值,大于α表明該工程造價結(jié)果不滿足平均造價水平要求,輸出結(jié)果0;反之,則表明該工程符合造價水平要求,輸出結(jié)果為1。然而,實際評估過程中如何選擇α的值,是一件困難的事情,主要有以下兩方面考慮:
(1)變電工程、線路工程與通信工程要因具體工程類型的不同來選擇不同的α值,才能實際反映工程的造價水平。
(2)常規(guī)輸變電工程技術(shù)經(jīng)濟(jì)管控中有一個期望指標(biāo)(α*),該指標(biāo)表示從技術(shù)經(jīng)濟(jì)管理角度需要達(dá)到的理想DCI值。但是現(xiàn)有數(shù)據(jù)分析表明,大多數(shù)工程是無法嚴(yán)格達(dá)到這一理想指標(biāo)的α*,如果采用α*作為造價水平合格臨界值,造價評估監(jiān)測結(jié)果將無法反映真實的造價水平。
為此,提出了一種分段區(qū)間指標(biāo)選取方法作為可行的解決途徑。通過綜合2011年—2018年三類工程的造價數(shù)據(jù)庫分析三類工程DCI分布情況,變電工程的DCI指標(biāo)95%以上分布在(0,0.32)區(qū)間內(nèi),線路工程DCI指標(biāo)95%主要集中在(0,0.3)內(nèi),而通信工程的DCI指標(biāo)有95%分布在(0,0.45)區(qū)間。為此,根據(jù)不同工程類型的實際情況設(shè)置閾值,可得改進(jìn)的輸變電工程造價水平評價準(zhǔn)則如式(9)所示:
式中,α0為不同工程的DCI指標(biāo)上限,取值分別為0.32(變電工程),0.3(線路工程),0.45(通信工程),超過即代表該項工程造價超標(biāo)。α*為造價期望值,取值一般在0.1到0.2之間。
造價水平智能評估監(jiān)測模型主要分為三個模塊,分別為造價數(shù)據(jù)處理模塊,數(shù)據(jù)分類學(xué)習(xí)模塊以及在線評估監(jiān)測模塊。以造價數(shù)據(jù)處理模塊為起始,通過數(shù)據(jù)分類學(xué)習(xí)模塊,最終憑借在線評估監(jiān)測模塊實現(xiàn)對工程的實時在線造價評估監(jiān)測,具體的工程造價水平智能評估監(jiān)測方法如圖2所示。
在圖2中,三個模塊結(jié)合形成了整體的工程造價水平智能評估監(jiān)測方法,關(guān)于各模塊的具體描述如下所述。
3.2.1 造價數(shù)據(jù)處理模塊的構(gòu)造
在工程造價數(shù)據(jù)處理模塊中,主要涉及對原始工程造價數(shù)據(jù)的收集以及在此基礎(chǔ)上的數(shù)據(jù)處理工作。針對工程造價數(shù)據(jù)庫,采用上文提及的RBF-RCE特征選擇方法進(jìn)行造價數(shù)據(jù)預(yù)處理,使處理后的造價數(shù)據(jù)不再具有高維小樣本特性,保證最后的在線評估監(jiān)測模塊能夠正常工作,得到準(zhǔn)確的評估監(jiān)測結(jié)果。通過將工程造價數(shù)據(jù)庫與特征選擇方法的整合,構(gòu)造成造價數(shù)據(jù)處理模塊,負(fù)責(zé)對工程造價數(shù)據(jù)進(jìn)行學(xué)習(xí)分類前的數(shù)據(jù)預(yù)處理工作。
3.2.2 數(shù)據(jù)分類學(xué)習(xí)模塊的設(shè)計
本模塊的設(shè)計目的是通過訓(xùn)練得到一個最優(yōu)評估器以完成后續(xù)的在線評估監(jiān)測工作。通過將造價數(shù)據(jù)處理模塊處理后的造價數(shù)據(jù)直接輸入到數(shù)據(jù)分類學(xué)習(xí)模塊中進(jìn)行分類學(xué)習(xí)??紤]需要實現(xiàn)較好的學(xué)習(xí)效果,采用集成學(xué)習(xí)的方式,集合多個學(xué)習(xí)器,對處理后的工程造價數(shù)據(jù)進(jìn)行學(xué)習(xí)分類。在集成學(xué)習(xí)的基礎(chǔ)上,造價水平智能評估監(jiān)測模型通過結(jié)合一種基于NP準(zhǔn)則的傘式集成學(xué)習(xí)方法。該方法,將多個基礎(chǔ)較弱的學(xué)習(xí)器結(jié)合NP準(zhǔn)則改進(jìn)得到新的學(xué)習(xí)器(如NP-ADA、NP-SVM等)。結(jié)合NP準(zhǔn)則,使原本的基礎(chǔ)較弱的學(xué)習(xí)器的學(xué)習(xí)能力得到提升,能夠?qū)こ淘靸r數(shù)據(jù)進(jìn)行更好的學(xué)習(xí)分類。在接收到預(yù)處理的造價數(shù)據(jù)后,通過圖2中流程篩選出最優(yōu)的學(xué)習(xí)評估器。根據(jù)多個改進(jìn)學(xué)習(xí)器得到的結(jié)果,進(jìn)行評優(yōu)篩選,結(jié)合最優(yōu)評估器篩選評價機(jī)制,選取最終分類結(jié)果最精準(zhǔn)的分類器作為最優(yōu)評估器進(jìn)行后續(xù)的在線評估監(jiān)測,具體的評優(yōu)機(jī)制采取投票策略[12],具體如式(10)所示:
式中,hi(x)為各基礎(chǔ)學(xué)習(xí)器的分類結(jié)果,Ci為最優(yōu)取值,H(x)為輸出的最優(yōu)評估器。
結(jié)合投票策略篩選出最優(yōu)評估器后,將最優(yōu)評估器作為對工程進(jìn)行造價評估監(jiān)測的基礎(chǔ),與后續(xù)的在線評估監(jiān)測模塊結(jié)合,完成最終對工程造價水平的在線評估監(jiān)測過程。
3.2.3 在線評估監(jiān)測模塊的搭建
在上述模塊篩選出最優(yōu)評估器后,通過最優(yōu)評估器與RBF-RCE特征選擇方法結(jié)合構(gòu)成在線評估監(jiān)測模塊的核心。當(dāng)存在待評估監(jiān)測造價水平的工程時,將其具體造價數(shù)據(jù)輸入到在線評估監(jiān)測模塊中,待評估監(jiān)測造價數(shù)據(jù)首先通過RBF-RCE特征選擇方法進(jìn)行特征選擇處理,經(jīng)過特征選擇后的數(shù)據(jù)輸入到最優(yōu)評估器中進(jìn)行評估監(jiān)測。最優(yōu)評估器采取在線實時評估監(jiān)測的方式,以電網(wǎng)工程造價大數(shù)據(jù)為基礎(chǔ),通過最優(yōu)評估器學(xué)習(xí)得到的工程造價評估結(jié)果納入工程造價大數(shù)據(jù)庫中,與同類型工程的造價水平進(jìn)行實時在線的分析比對,進(jìn)而得到精準(zhǔn)化的工程造價水平評估監(jiān)測結(jié)果,實現(xiàn)實時在線化的電網(wǎng)工程造價水平智能評估監(jiān)測。
通過選取某省2010年—2018年造價數(shù)據(jù)庫作為測試數(shù)據(jù),采用結(jié)構(gòu)系統(tǒng)解釋模型ISM與本文提出的輸變電工程造價水平智能評估監(jiān)測方法同時對該組數(shù)據(jù)進(jìn)行評估分析,并對評估結(jié)果加以比較,用以校驗智能評估監(jiān)測方法的有效性。
在實例驗證中,從造價影響因素因果鏈的角度出發(fā),以22類主要影響工程造價的因素為主,對工程整體造價進(jìn)行評估分析。采用ISM模型對該組數(shù)據(jù)進(jìn)行分析評估,得到如表2所示的造價評估結(jié)果。
表2 ISM造價評估分析結(jié)果Tab.2 ISM cost evaluation analysis results
表2中工程類別一欄數(shù)字1代表變電工程,2代表線路工程,3代表通信工程。綜合分析,通過ISM模型對工程整體的造價評估分析得到的DCI與實際工程計算得到的DCI的平均偏離在6%左右,最大偏差達(dá)到12%,部分工程因評估DCI偏差較大導(dǎo)致最后評估結(jié)果出現(xiàn)問題。
采用本文所提的基于傘式NP集成式輸變電工程造價水平智能評估監(jiān)測方法,對該組數(shù)據(jù)進(jìn)行評估分析,得到如表3所示的造價評估結(jié)果。
表3工程類別中數(shù)字含義同表2。由表3可知,利用本文所提的智能評估監(jiān)測方法進(jìn)行評估,得到的工程DCI與實際工程計算的DCI精確度平均不到2%,最大精確度為5%,此結(jié)果總體優(yōu)于傳統(tǒng)ISM模型的評估結(jié)果。即使出現(xiàn)評估DCI存在偏差的情況,也未對最后的評估結(jié)果造成影響,由此可知本文所提的智能評估方法能夠給出符合實際工程造價的評估分析結(jié)果。
表3 智能評估監(jiān)測方法造價評估分析結(jié)果Tab.3 Intelligent evaluation and monitoring method cost evaluation analysis results
相比傳統(tǒng)的ISM模型,基于傘式NP集成式輸變電工程造價水平智能評估監(jiān)測方法得到的工程造價水平更加精準(zhǔn)化,證明了其具有工程應(yīng)用前景。
本文所研究的基于傘式NP集成式輸變電工程造價水平智能評估監(jiān)測方法相比傳統(tǒng)ISM模型評估工程造價水平方法,通過針對性處理工程造價數(shù)據(jù)高維小樣本特性,解決造價數(shù)據(jù)“維數(shù)災(zāi)”及“過擬合”問題,有效優(yōu)化提高了工程造價評估結(jié)果的精確性。相較于傳統(tǒng)ISM模型評估方法,基于傘式NP集成式輸變電工程造價水平智能評估監(jiān)測方法的評估結(jié)果的精確度提高了4.40%,解決了傳統(tǒng)ISM模型對于工程造價水平評估費(fèi)時費(fèi)力且誤差較大的問題,具有較好的工程實際應(yīng)用前景。