齊 霞, 王綿斌, 張 妍, 王建軍, 張曉曼
(1. 國(guó)網(wǎng)冀北電力有限公司 經(jīng)濟(jì)技術(shù)研究院,北京 100045; 2.華北電力大學(xué) 經(jīng)濟(jì)與管理學(xué)院,北京 102206)
高維小樣本條件下的變電工程造價(jià)預(yù)測(cè)研究
齊 霞1, 王綿斌1, 張 妍1, 王建軍2*, 張曉曼1
(1. 國(guó)網(wǎng)冀北電力有限公司 經(jīng)濟(jì)技術(shù)研究院,北京 100045; 2.華北電力大學(xué) 經(jīng)濟(jì)與管理學(xué)院,北京 102206)
利用因子分析方法對(duì)影響輸變電工程的因素進(jìn)行了篩選,建立適合小樣本條件下的概算估算模型.通過某地區(qū)的實(shí)例分析,證實(shí)了提出方法的有效性.
輸變電工程;造價(jià)預(yù)測(cè);小樣本
為應(yīng)對(duì)環(huán)境污染以及全球資源日趨減少等問題,社會(huì)對(duì)節(jié)能減排、環(huán)境友好型新能源的發(fā)展與探究等要求日益提高,因此,對(duì)作為清潔電能運(yùn)輸保障基礎(chǔ)的輸變電工程的要求也不斷增強(qiáng).在輸變電工程建設(shè)環(huán)節(jié),如何控制輸變電工程造價(jià)問題是一個(gè)非常重要的問題.然而,由于輸變電工程涉及的因素眾多,使得審核人員在審核輸變電工程造價(jià)時(shí),能夠參考的可類比的輸變電工程十分有限.目前的審核中,多是依靠審核人員的相關(guān)經(jīng)驗(yàn)進(jìn)行主觀上的推測(cè),缺乏科學(xué)定量化的手段進(jìn)行估算.因此,研究高維小樣本條件下的輸變電工程造價(jià)估算問題,輔助輸變電工程造價(jià)管理控制成為一個(gè)研究熱點(diǎn).在小樣本的條件下,對(duì)研究對(duì)象進(jìn)行預(yù)測(cè)的一個(gè)思路是在原有的樣本條件下盡可能地利用已有樣本的信息進(jìn)行擴(kuò)展,得到適合統(tǒng)計(jì)模型的樣本量,對(duì)研究對(duì)象進(jìn)行建模預(yù)測(cè).但是有學(xué)者研究指出,基于大量統(tǒng)計(jì)樣本的預(yù)測(cè)模型,如線性回歸、神經(jīng)網(wǎng)絡(luò)等不再適用,并且在多屬性的情況下首先需要做的工作是降維[1-2].很多學(xué)者對(duì)小樣本數(shù)據(jù)預(yù)測(cè)建模進(jìn)行了研究,如灰色預(yù)測(cè)模型[3-4],支持向量機(jī)模型[5]等.上述研究均取得了不錯(cuò)的成果,但是目前對(duì)于輸變電工程造價(jià)的小樣本預(yù)測(cè)估算問題還很少見到.由于在實(shí)際輸變電工程造價(jià)時(shí),不同線路電壓等級(jí)、地形、出線方式、建設(shè)規(guī)模等因素均會(huì)造成工程造價(jià)的較大偏差,因此,在某工程造價(jià)估算審核時(shí),將使得審核人員的可參照類比工程有限,需要建立高維小樣本條件下的估算模型幫助審核人員給出該工程造價(jià)的審核參考值.本文以輸變電工程中的變電工程為研究對(duì)象,構(gòu)建了高維小樣本條件下的變電工程造價(jià)預(yù)測(cè)估算模型.首先采用因子分析方法中的主成分分析方法對(duì)影響變電工程造價(jià)的高維情況進(jìn)行降維處理,在此基礎(chǔ)上,構(gòu)建適用于小樣本條件下的支持向量機(jī)預(yù)測(cè)模型對(duì)變電工程造價(jià)進(jìn)行估算,為變電工程的造價(jià)控制提供借鑒.
1.1 高維小樣本條件下變電工程造價(jià)預(yù)測(cè)思路
輸變電工程造價(jià)可以分為兩類,包括輸電線路工程造價(jià)數(shù)據(jù)和變電工程造價(jià)數(shù)據(jù),其中變電工程指的是在輸變電工程中對(duì)變電站進(jìn)行建設(shè)的工程,其造價(jià)包括安裝工程費(fèi)用、建筑工程費(fèi)用和其他費(fèi)用三個(gè)部分.安裝工程包括主變安裝、配電安裝、無功、控制、通信、遠(yuǎn)動(dòng)、電纜接地等工程,建筑工程包括主變、配電相關(guān)建筑、供水系統(tǒng)等.影響整個(gè)變電工程的造價(jià)環(huán)節(jié)眾多,每個(gè)環(huán)節(jié)控制造價(jià)的因素眾多.因此,往往在收集一個(gè)工程項(xiàng)目數(shù)據(jù)時(shí),其屬性有近百個(gè),加上影響整個(gè)變電工程造價(jià)的變電規(guī)模、建筑規(guī)模、電壓等級(jí)等,影響變電工程的因素更加復(fù)雜,對(duì)某個(gè)變電工程造價(jià)進(jìn)行估算控制時(shí),可類比的工程偏少.在此種情況下,應(yīng)該首先對(duì)變電工程造價(jià)的歷史數(shù)據(jù)進(jìn)行降維處理,然后利用降維后的因素對(duì)造價(jià)的歷史數(shù)據(jù)進(jìn)行分類,在分類的基礎(chǔ)上對(duì)其進(jìn)行小樣本條件下的預(yù)測(cè)建模工作,從而得出預(yù)測(cè)結(jié)果.
1.2 利用主成分分析方法進(jìn)行降維處理
對(duì)影響因素進(jìn)行分析的方法簡(jiǎn)稱為因素分析法,該方法是利用相關(guān)方法(多為統(tǒng)計(jì)方法)對(duì)研究對(duì)象和相關(guān)影響因素之間的影響程度進(jìn)行定量化的分析.因素分析法分為單個(gè)因素分析法和多因素分析法等,在屬性篩選上應(yīng)用得較為廣泛.較為常用的因素分析法有主成分分析法.
對(duì)數(shù)據(jù)降維處理較為常用的方法是主成分分析法.主成份分析法化繁為簡(jiǎn),借助線性轉(zhuǎn)換,經(jīng)過投射的方法將高維數(shù)據(jù)轉(zhuǎn)化到低維空間中去處理,通過轉(zhuǎn)換能夠刪減重復(fù),并在保留大部分原屬性信息的條件下精簡(jiǎn)屬性.主成分分析法在經(jīng)投射形成的坐標(biāo)中,以原始數(shù)據(jù)方差為依據(jù),將其看成信息貢獻(xiàn)率,依據(jù)信息貢獻(xiàn)率將各個(gè)成分進(jìn)行排序,并作為屬性篩選的參考值.應(yīng)用主成分分析法進(jìn)行屬性篩選的步驟如下:
(1) 確定樣本矩陣并標(biāo)準(zhǔn)化. 選取樣本集,構(gòu)建樣本矩陣X=(xij),1≤i≤m,1≤j≤n.其中xi=(xi1,xi2,…,xim)′表示樣本記錄數(shù),x=(x1,x2,…,xn)表示指標(biāo),并將矩陣標(biāo)準(zhǔn)化.
(2) 計(jì)算標(biāo)準(zhǔn)化后矩陣的m個(gè)指標(biāo)的協(xié)方差矩陣相關(guān)系數(shù)矩陣R,其中矩陣中元素 rij的計(jì)算為
(3) 計(jì)算特征值λ,并按照大小排列,根據(jù)特征值計(jì)算各成分的方差貢獻(xiàn)率αi及累計(jì)方差貢獻(xiàn)率bi,其計(jì)算方式分別如下:
確定篩選后因素也就是主成分的標(biāo)準(zhǔn)一般有兩個(gè):或者是定義一個(gè)累計(jì)貢獻(xiàn)度,取達(dá)到該累計(jì)貢獻(xiàn)度以前的所有因素,一般取為85%;或者是選取特征值大于1的因素.
1.3 支持向量機(jī)預(yù)測(cè)方法
支持向量機(jī)繼承了神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),并且改進(jìn)了神經(jīng)網(wǎng)絡(luò)的全局尋優(yōu)能力,使得使用同樣樣本訓(xùn)練后的預(yù)測(cè)值為唯一值,并且在小樣本下表現(xiàn)良好的特性.該方法是目前預(yù)測(cè)方法中的較新的方法,在小樣本的情況下被認(rèn)為是能夠完全替代神經(jīng)網(wǎng)絡(luò)的智能預(yù)測(cè)方法.支持向量機(jī)的基本原理如下:
假設(shè)有訓(xùn)練樣本集G={(xi,di)},i=1,…,N, xi∈Rn,di∈R1.支持向量機(jī)預(yù)測(cè)模型是將樣本點(diǎn)x映射到高維空間F中,構(gòu)建下述估計(jì)函數(shù)進(jìn)行線性回歸:
y = f(x)=wψ(x)+b,
其函數(shù)逼近問題等價(jià)于如下函數(shù)最?。?/p>
其中‖w‖2/2表示的是函數(shù)的平滑程度, Lε(d,y) 稱為ε-敏感損失函數(shù).通過引入松弛變量ζ、ζ*和拉格朗日公式進(jìn)行轉(zhuǎn)換,可將上式變成
利用Karush-Kuhn-Tucker條件和對(duì)偶理論求目標(biāo)函數(shù)的極值,可以將原問題轉(zhuǎn)化為:
求解上述問題可得到支持向量機(jī)回歸函數(shù):
式中K(xi,xj)稱為核函數(shù),需要滿足Mercer條件,一般選取高斯核函數(shù)
K(xi,xj)=exp(-||xi-xj||2/2s2) .
對(duì)某區(qū)域變電站工程造價(jià)審核后的概算數(shù)據(jù)進(jìn)行收集,共收集到執(zhí)行新規(guī)定后的具有標(biāo)準(zhǔn)數(shù)據(jù)的變電工程42項(xiàng),其中500 kV及以上等級(jí)3項(xiàng),220 kV等級(jí)9項(xiàng),35 kV等級(jí)及以下7項(xiàng),110 kV等級(jí)的變電工程23項(xiàng).通過資料的收集情況可以看出,線路工程歷史造價(jià)資料主要集中在110 kV等級(jí),其余電壓等級(jí)的工程資料樣本量太少,因此選擇110 kV的變電工程作為樣本實(shí)驗(yàn)數(shù)據(jù).110 kV的變電工程對(duì)應(yīng)的屬性指標(biāo)近百個(gè).歷史資料中,變電工程屬性指標(biāo)主要有:主變?nèi)萘?、靜態(tài)投資、動(dòng)態(tài)投資、本期電容器規(guī)模、110 kV本期出線、35 kV本期出線、10 kV本期出線等.
表1 變電工程主成分分析結(jié)果表
首先,利用上文中的主成分分析法對(duì)變電工程進(jìn)行降維處理,在降維計(jì)算前,為了消除量綱影響,首先利用歸一化將各指標(biāo)數(shù)據(jù)歸結(jié)到[0,1],利用Matlab進(jìn)行計(jì)算,可以得到主成分分析后的結(jié)果,如表1所示.通過結(jié)果可以看出,篩選后的屬性因素有本期規(guī)模、占地投資、電力電纜投資、控制電纜投資、建筑投資、土石方投資這6個(gè)屬性對(duì)造價(jià)技術(shù)經(jīng)濟(jì)指標(biāo)貢獻(xiàn)率達(dá)95%以上.
結(jié)合得到的屬性篩選結(jié)果,對(duì)樣本數(shù)據(jù)按照4∶1的比例進(jìn)行分割,即選擇80%的工程數(shù)據(jù)作為訓(xùn)練樣本,其余20%左右的工程數(shù)據(jù)做為測(cè)試樣本,利用Matlab libsvm工具箱進(jìn)行支持向量機(jī)模型的構(gòu)建,輸入變量為上述篩選出的6個(gè)變量,輸出變量為工程的靜態(tài)投資,利用libsvm中的默認(rèn)優(yōu)化參數(shù)設(shè)置進(jìn)行預(yù)測(cè),其預(yù)測(cè)結(jié)果如圖1所示.
從圖1中可以看出,整個(gè)樣本集的預(yù)測(cè)結(jié)果均表現(xiàn)不錯(cuò),基本和原值曲線吻合.曲線前半段較后半段擬合效果更好,說明預(yù)測(cè)結(jié)果在訓(xùn)練集部分表現(xiàn)較測(cè)試集部分更好,具體的誤差分析如表2所示.
表2 利用支持向量機(jī)給出的最后預(yù)測(cè)結(jié)果及誤差分析
表2中的靜態(tài)投資的數(shù)值是歸一化后的數(shù)據(jù),其中訓(xùn)練集的平均絕對(duì)誤差(MAPE)是1.37%,而測(cè)試集的平均絕對(duì)誤差是1.8%,所有測(cè)試點(diǎn)的誤差不超過3%,最大值為2.78%,結(jié)合電力工程造價(jià)的誤差標(biāo)準(zhǔn)規(guī)范,在5%以內(nèi)的概算造價(jià)均符合實(shí)際要求,因此所建模型可以滿足實(shí)際工作的需要,表明了模型的有效性.
本文對(duì)高維小樣本情況下的變電工程造價(jià)預(yù)測(cè)估算問題進(jìn)行了研究,針對(duì)多因素高維情況,首先利用因素分析法中的主成分分析方法進(jìn)行降維處理,選取累計(jì)貢獻(xiàn)率達(dá)95%以上的6個(gè)因素作為小樣本下支持向量機(jī)預(yù)測(cè)模型的輸入變量,對(duì)工程造價(jià)的靜態(tài)投資進(jìn)行了預(yù)測(cè),所得預(yù)測(cè)結(jié)果經(jīng)過測(cè)試檢驗(yàn)?zāi)軡M足實(shí)際工作的需要,可以為輸變電工程造價(jià)審核控制提供參考.
[1] 謝力,魏汝祥,蔣國(guó)萍. 基于分片逆回歸的小樣本組合預(yù)測(cè)建模方法[J]. 統(tǒng)計(jì)與決策,2013(2):73-76.
[2] 謝力,魏汝祥,蔣國(guó)萍,等. 基于局部線性嵌入的小樣本組合預(yù)測(cè)方法[J]. 統(tǒng)計(jì)與決策,2015(9):9-12.
[3] 王正新. 基于傅立葉級(jí)數(shù)的小樣本振蕩序列灰色預(yù)測(cè)方法[J]. 控制與決策,2014(2):270-274.
[4] 曾波,孟偉. 基于灰色理論的小樣本振蕩序列區(qū)間預(yù)測(cè)建模方法[J]. 控制與決策,2016(7):1311-1316.
[5] 陳保家,陳雪峰,田紅亮,等. 小樣本條件下的設(shè)備實(shí)時(shí)可靠度預(yù)測(cè)研究[J]. 現(xiàn)代制造工程,2015(1):1-8.
責(zé)任編輯:龍順潮
Transmission Project Cost Forecasting under the High-dimension Small Sample Conditions
QIXia1,WANGMian-bin1,ZHANGYan1,WANGJian-jun2*,ZHANGXiao-man1
(1.Electric Power Economic Research Institute in Northern Hebei Technology, State Grid, Beijing 100045; 2. School of Economics and Management,North China Electric Power University, Beijing 102206 China )
This paper uses the factor analysis method to select the important factors from high dimensional conditions at first, and establishes a suitable estimate model under the condition of small sample. Finally, a case study of a certain region is given and the results show that the proposed method is effective.
transmission project; cost estimation; small sample
2016-04-23
國(guó)家自然科學(xué)基金項(xiàng)目(71401054)
王建軍(1981—),男,吉林 白山人,博士,副教授. E-mail:chgc8@126.com
TP29
A
1000-5900(2016)04-0112-04