張 旺, 管維亞, 張建峰, 陳 紅, 盧文飛
(1. 國網(wǎng)江蘇電力設(shè)計(jì)咨詢有限公司, 江蘇 南京 210008;2. 國網(wǎng)江蘇省電力有限公司經(jīng)濟(jì)技術(shù)研究院, 江蘇 南京 210008;3. 東南大學(xué) 土木工程學(xué)院, 江蘇 南京 211189)
基礎(chǔ)設(shè)施是夯實(shí)城市建設(shè)和發(fā)展的物質(zhì)基礎(chǔ)之一,其投資是加速城市化發(fā)展進(jìn)程和實(shí)現(xiàn)城市現(xiàn)代化的重要舉措。據(jù)世界銀行測算,基礎(chǔ)設(shè)施的存量每增長1%,GDP也會(huì)增長1%[1]。就中國而言,基礎(chǔ)設(shè)施投資對經(jīng)濟(jì)增長總體上有顯著的正向影響,促進(jìn)基礎(chǔ)設(shè)施投資也是中國促進(jìn)經(jīng)濟(jì)發(fā)展的經(jīng)驗(yàn)之一[2]?;A(chǔ)設(shè)施兼具“溢出效應(yīng)[3]”和“網(wǎng)絡(luò)效應(yīng)[4]”等屬性,投資形成的效果呈現(xiàn)連鎖反應(yīng)和投資乘數(shù)效應(yīng)[5]。在中國經(jīng)濟(jì)進(jìn)入新常態(tài)、供給側(cè)改革加快的背景下,提高基礎(chǔ)設(shè)施投資效率,擴(kuò)大有效投資,使投資更具有針對性,將基礎(chǔ)設(shè)施投資規(guī)劃策略由粗放型轉(zhuǎn)變?yōu)榫珳?zhǔn)化,解決目前基礎(chǔ)設(shè)施投資中的投資不足、投資冗余等問題,實(shí)現(xiàn)資源的合理配置,是當(dāng)下基礎(chǔ)設(shè)施投資亟待解決的關(guān)鍵問題之一。然而以往的研究主要聚焦于基礎(chǔ)設(shè)施投資對經(jīng)濟(jì)增長[6]和區(qū)域發(fā)展[7]的影響、風(fēng)險(xiǎn)評價(jià)[8,9]等方面,鮮有關(guān)注基礎(chǔ)設(shè)施投資規(guī)劃、預(yù)測的研究?;A(chǔ)設(shè)施投資應(yīng)當(dāng)兼顧規(guī)模與質(zhì)量,實(shí)現(xiàn)基礎(chǔ)設(shè)施項(xiàng)目精準(zhǔn)、高效投資的前提就在于對項(xiàng)目的投資進(jìn)行準(zhǔn)確預(yù)測。
在基礎(chǔ)設(shè)施投資預(yù)測中常用的模型或方法有回歸分析、神經(jīng)網(wǎng)絡(luò)模型、矩陣模型等[10]。基礎(chǔ)設(shè)施投資中影響因素眾多,且各影響因素之間呈現(xiàn)非線性關(guān)系,傳統(tǒng)的統(tǒng)計(jì)模型方法如回歸分析在應(yīng)用于非線性數(shù)據(jù)時(shí)難以克服自身的局限性[11],預(yù)測精度低。為了克服社會(huì)經(jīng)濟(jì)系統(tǒng)中存在的非線性、高維、小樣本等問題,神經(jīng)網(wǎng)絡(luò)模型得到了深度的應(yīng)用和發(fā)展[12]。例如,唐麗春和許秀娟利用廣州市基礎(chǔ)設(shè)施基于改進(jìn)的GA-PSO(Genetic Algorithm and Particle Swarm Optimization)算法對基礎(chǔ)設(shè)施投資進(jìn)行了預(yù)測[10];Asadabadi等[13]提出了一種適用于大規(guī)模應(yīng)用的遞歸噪聲遺傳算法,用以研究長期交通投資規(guī)劃的優(yōu)化問題;Pan等[14]基于灰色神經(jīng)網(wǎng)絡(luò),構(gòu)建了發(fā)電投資動(dòng)態(tài)預(yù)測模型。神經(jīng)網(wǎng)絡(luò)模型雖然預(yù)測效果較好,但是算法參數(shù)設(shè)置復(fù)雜、解釋性差,尤其在小樣本時(shí)易出現(xiàn)過學(xué)習(xí)、泛化能力差等問題。
XGBoost(Extreme gradient boosting)是一種基于Boosting的新型集成學(xué)習(xí)算法。與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相比其具有運(yùn)行速度快、泛化能力強(qiáng)、預(yù)測精度高、魯棒性好等優(yōu)點(diǎn)[15],此外XGBoost算法的模型可解釋性較高,能用于小樣本的預(yù)測,目前已經(jīng)在徑流預(yù)測[16]、信用卡交易預(yù)測[17]、電機(jī)電流預(yù)測[18]等領(lǐng)域得到了廣泛應(yīng)用,但在基礎(chǔ)設(shè)施投資預(yù)測領(lǐng)域尚無深入應(yīng)用。因此,本文采用XGBoost算法對基礎(chǔ)設(shè)施投資進(jìn)行預(yù)測,以便為投資者提供準(zhǔn)確的投資參考信息。同時(shí),為了驗(yàn)證算法的可靠性,本文采用交叉驗(yàn)證的方式,對投資預(yù)測結(jié)果的可靠性進(jìn)行評估,并通過交叉驗(yàn)證確定模型最優(yōu)參數(shù)。最后以變電站工程為例,基于國網(wǎng)某省公司的部分變電站實(shí)例數(shù)據(jù),對本文的模型進(jìn)行檢驗(yàn),說明XGBoost算法的有效性。
XGBoost算法是由Chen等[19]在GBDT算法基礎(chǔ)上改進(jìn)的算法,該算法通過對損失函數(shù)引入正則項(xiàng)來控制模型的復(fù)雜度,避免了出現(xiàn)過擬合的問題;同時(shí)該算法還對損失函數(shù)進(jìn)行了二階泰勒展開,進(jìn)一步提高了算法的收斂速度和收斂精度[20],優(yōu)化了模型的性能。
(1)
式中:fk為單棵回歸樹;xi為輸入變量,在基礎(chǔ)設(shè)施投資中即為各預(yù)測指標(biāo);K為回歸樹的個(gè)數(shù);F為回歸樹所構(gòu)成的空間。
為了學(xué)習(xí)得出式(1)中的函數(shù)集,需要將下面的正則化目標(biāo)函數(shù)L最小化。
(2)
(3)
為了簡化式(3)的優(yōu)化過程,對其進(jìn)行二階泰勒展開,式(3)可改寫為:
(4)
去掉式(4)中的常數(shù)項(xiàng),得到第t次迭代的簡化目標(biāo)函數(shù)為:
(5)
設(shè)Ij={i|q(xi)=j}為葉子j的集合,將上式進(jìn)行化簡,可以得到:
(6)
基于以上推導(dǎo),對于一個(gè)特定的樹結(jié)構(gòu)q(x),式(6)通過對ωj求導(dǎo)可以得到葉子節(jié)點(diǎn)的最優(yōu)權(quán)重和目標(biāo)函數(shù)的極值為:
(7)
(8)
(9)
式(9)的結(jié)果也叫增益,在每次分裂時(shí)選擇增益最大的節(jié)點(diǎn)。當(dāng)樹達(dá)到了深度閾值或者所有節(jié)點(diǎn)分裂時(shí)Lsplit<0,則樹停止分裂,即得到最優(yōu)的集成樹模型。
在數(shù)據(jù)量較少的研究中,樣本的劃分方式及排序的隨機(jī)性對預(yù)測結(jié)果影響較大,如果僅采用一組測試集與訓(xùn)練集,則會(huì)存在不能充分利用樣本信息,導(dǎo)致預(yù)測準(zhǔn)確率不高,評估可靠性不足的問題。
在K折交叉驗(yàn)證中,用到的數(shù)據(jù)是訓(xùn)練集中的全部數(shù)據(jù)。將訓(xùn)練集平均分割為K個(gè)互斥子集,每次選取第K份作為驗(yàn)證集,余下(K-1)份則作為訓(xùn)練集,重復(fù)該過程K次,得到K個(gè)模型對模型性能的評價(jià),基于評價(jià)結(jié)果可以計(jì)算平均性能。由于驗(yàn)證集和測試集兩部分?jǐn)?shù)據(jù)不同,估計(jì)得到的泛化誤差更接近真實(shí)的模型表現(xiàn)。K折交叉驗(yàn)證使用了無重復(fù)抽樣技術(shù)的好處:每次迭代過程中每個(gè)樣本點(diǎn)只有一次被劃入訓(xùn)練集或測試集的機(jī)會(huì)。通過這種方式得到的結(jié)果對數(shù)據(jù)劃分方法敏感度相對較低,能提高結(jié)果的可靠性。同時(shí),對于模型需要調(diào)整的每一個(gè)參數(shù),都進(jìn)行一整輪的K折交叉驗(yàn)證,如此可以找到能使模型泛化性能最優(yōu)的超參值。
在應(yīng)用XGBoost算法和交叉驗(yàn)證進(jìn)行基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測時(shí),首要的步驟是建立相應(yīng)類型基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測指標(biāo)體系。在確定基礎(chǔ)設(shè)施投資預(yù)測指標(biāo)體系時(shí),需要遵循完備性、可獲得性、可操作性、可比性等原則,識(shí)別基礎(chǔ)設(shè)施投資的內(nèi)外部影響因素(如建設(shè)地點(diǎn)、時(shí)間和技術(shù)方案、設(shè)備選型等),分項(xiàng)構(gòu)建基礎(chǔ)設(shè)施投資預(yù)測的指標(biāo)體系(如分為建筑工程、安裝工程等分項(xiàng)),這樣不僅有利于基礎(chǔ)設(shè)施項(xiàng)目總投資的預(yù)測,也有利于基礎(chǔ)設(shè)施項(xiàng)目分項(xiàng)投資的預(yù)測。在選擇投資預(yù)測指標(biāo)時(shí)既要考慮全面又要甄選出關(guān)鍵指標(biāo),指標(biāo)體系的數(shù)量選取要適度,指標(biāo)過多或者過少都不利于結(jié)果的預(yù)測。在指標(biāo)體系的構(gòu)建過程中,可以采用主成分分析、專家訪談等方法不斷對指標(biāo)體系進(jìn)行修正,保證指標(biāo)體系的有效性,同時(shí)確保最終模型能得到可靠的結(jié)果。
在確定基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測指標(biāo)體系后,需要獲取相應(yīng)基礎(chǔ)設(shè)施項(xiàng)目實(shí)例作為數(shù)據(jù)樣本。將實(shí)例樣本劃分為訓(xùn)練集和測試集,訓(xùn)練集用于對模型進(jìn)行訓(xùn)練,得到優(yōu)質(zhì)模型,而測試集則用來對模型進(jìn)行檢驗(yàn)。為了提升模型的可靠性,本文提出的模型采用交叉驗(yàn)證的方式,進(jìn)一步將訓(xùn)練集均分為K份,取其中第K份為驗(yàn)證集,其余K-1份為測試集。在完成K次實(shí)驗(yàn)后取平均結(jié)果,驗(yàn)證其是否滿足可靠性,滿足則模型訓(xùn)練完成,不滿足則對其中的參數(shù)進(jìn)行優(yōu)化,以滿足對模型可靠性的要求。需要注意的是,對于模型中的每一個(gè)需要優(yōu)化的參數(shù),都需要進(jìn)行一整輪的交叉驗(yàn)證,以找到使得模型泛化性能最優(yōu)的超參值。在確定模型的最優(yōu)參數(shù)后,在全部訓(xùn)練集上重新訓(xùn)練模型,并使用獨(dú)立測試集對模型進(jìn)行測試,得到最終的預(yù)測結(jié)果,同時(shí)對模型預(yù)測性能做出最終評價(jià),基于XGBoost算法的基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測流程如圖1所示。
圖1 基于XGBoost算法的基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測流程
為了對模型的準(zhǔn)確性和穩(wěn)健性進(jìn)行評估,本文選取平均絕對誤差MAE以及擬合優(yōu)度R2作為評價(jià)指標(biāo)。其中,MAE的取值范圍為[0,+∞),預(yù)測值與真實(shí)值完全吻合時(shí)等于0,即完美模型;誤差越大,該值越大。R2的值越接近1說明模型預(yù)測值對實(shí)際觀測值的擬合程度越好。上述兩項(xiàng)指標(biāo)對應(yīng)的計(jì)算公式為:
(10)
變電站工程是電力基礎(chǔ)設(shè)施的重要組成部分,變電站工程具有投資數(shù)額巨大、產(chǎn)品結(jié)構(gòu)單一、項(xiàng)目周期長等特點(diǎn)。其建設(shè)對完善地區(qū)電網(wǎng)網(wǎng)架結(jié)構(gòu),滿足地區(qū)用電需求,發(fā)展培育戰(zhàn)略性能源產(chǎn)業(yè),優(yōu)化工業(yè)結(jié)構(gòu)和推動(dòng)地區(qū)經(jīng)濟(jì)發(fā)展都具有重要意義。在新電改背景下,有效地進(jìn)行變電站投資預(yù)測,對實(shí)現(xiàn)電力基礎(chǔ)設(shè)施高效益發(fā)展至關(guān)重要。由于變電站投資預(yù)測存在高維、非線性、小樣本的特點(diǎn),采用傳統(tǒng)的預(yù)測方法預(yù)測精度不高且計(jì)算繁雜。因此本文構(gòu)建基于XGBoost算法的變電站工程項(xiàng)目投資預(yù)測模型,以國網(wǎng)某省公司2016―2020年的部分完整變電站投資工程為例,驗(yàn)證本文模型的有效性。
變電站由建筑工程和電氣設(shè)備安裝工程兩部分組成。建筑工程主要包含建筑物和構(gòu)筑物,電氣設(shè)備安裝工程主要包含一次設(shè)備和二次設(shè)備安裝以及試驗(yàn)和調(diào)試等。因此,本文將變電站的投資預(yù)測指標(biāo)分為電氣設(shè)備和建筑工程兩類。建筑工程類指標(biāo)主要反應(yīng)建筑的組成、構(gòu)造、建材用量和地基處理方式等主要內(nèi)容。而電氣設(shè)備類指標(biāo)主要反應(yīng)電氣設(shè)備的組成、種類、數(shù)量、接配電型式等內(nèi)容。由于電氣二次設(shè)備在變電站總投資中占比較小且通常在進(jìn)行較為詳細(xì)的設(shè)計(jì)時(shí)才能確定,因此,本文不考慮二次設(shè)備類的指標(biāo)。參考QGDW 11337-2014《輸變電工程工程量清單計(jì)價(jià)規(guī)范》、DLT 5218-2005《220~500 kV變電所設(shè)計(jì)技術(shù)規(guī)程》等相關(guān)規(guī)程、規(guī)范和文獻(xiàn)等,按照變電站電氣設(shè)備和建筑工程分別對變電站工程投資預(yù)測指標(biāo)體系進(jìn)行初步篩選。初步篩選的指標(biāo)體系中指標(biāo)過多,數(shù)據(jù)繁雜,且對于預(yù)測模型的建立也具有非常大的挑戰(zhàn)。因此,以國網(wǎng)某省公司2016―2020年的部分完整變電站投資工程的數(shù)據(jù)對初步篩選指標(biāo)進(jìn)行主成分分析。假設(shè)有m個(gè)變電站工程,每個(gè)變電站工程有n個(gè)投資預(yù)測指標(biāo),首先構(gòu)建原始數(shù)據(jù)矩陣X:
(11)
然后對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,消除量綱和數(shù)量級(jí)對評價(jià)的影響,本文采用Z-score方法進(jìn)行標(biāo)準(zhǔn)化:
(12)
根據(jù)標(biāo)準(zhǔn)化后的矩陣計(jì)算相關(guān)系數(shù)矩陣R:
(13)
式中:rij為變量xi和xj的相關(guān)系數(shù)。根據(jù)式(13)的相關(guān)系數(shù)矩陣計(jì)算得出對應(yīng)的特征值λ1,λ2,…,λn以及特征值所對應(yīng)的標(biāo)準(zhǔn)正交特征向量β1,β2,…,βn,構(gòu)成的特征向量組為β=(β1,β2,…,βn)。
得到特征向量后,根據(jù)方差累積貢獻(xiàn)率的大小確定提取前p個(gè)主成分,方差累積貢獻(xiàn)率為:
(14)
則提取的主成分的權(quán)重值可以根據(jù)下式計(jì)算得到:
(15)
根據(jù)上述主成分分析方法步驟,基于國網(wǎng)某省公司2016―2020年的部分完整變電站投資工程的數(shù)據(jù),本文篩選出建筑工程和電氣設(shè)備部分的關(guān)鍵指標(biāo)及對應(yīng)權(quán)重如表1所示。
基于上述指標(biāo),進(jìn)行專家訪談,對指標(biāo)進(jìn)行修正。專家指出,為了較為全面地反應(yīng)變電站的建設(shè)屬性,還需要考慮變電站基礎(chǔ)特征類指標(biāo),從變電站整體角度找到對投資影響較大的因素,其中需要包含的內(nèi)容為:額定電壓等級(jí)、建設(shè)時(shí)間、建設(shè)地點(diǎn)、變電站型式、全站建筑面積、建設(shè)性質(zhì)和是否為智能化變電站等幾個(gè)變電站基礎(chǔ)屬性。在電氣設(shè)備部分,專家認(rèn)為,銅排和扁鋼用量對投資影響不大,而主變壓器的臺(tái)數(shù)和容量,高壓側(cè)配電形式、接線形式、斷路器臺(tái)數(shù)和母線PT間隔,橋接線和主變進(jìn)線或出線間隔等幾個(gè)指標(biāo)對總投資影響較大。在建筑工程部分,電纜溝對總投資影響較小,建筑工程中的地基處理方案、主控(綜合樓)建筑面積、鋼構(gòu)和支架等用鋼量、主變及進(jìn)出線基礎(chǔ)混凝土量等對投資影響較大,需要增加。在進(jìn)行多輪專家訪談修正后,本文最終構(gòu)建了如圖2所示的變電站工程項(xiàng)目投資預(yù)測指標(biāo)體系。
偶爾迷茫的王老師(以下稱王老師):還不知道呢?,F(xiàn)在中小學(xué)教師評職稱,需要做課題、發(fā)論文。美其名曰是要打造“研究型教師”,可是光發(fā)表論文這一條要求,就不知難為了多少人呢!
圖2 變電站工程項(xiàng)目投資預(yù)測指標(biāo)體系
在預(yù)測結(jié)果方面,本文在預(yù)測結(jié)果輸出方面選擇了建筑工程費(fèi)和安裝工程費(fèi)兩項(xiàng)進(jìn)行預(yù)測。由于設(shè)備費(fèi)需要根據(jù)具體的電氣設(shè)備型號(hào)確定,且各型號(hào)設(shè)備之間費(fèi)用差異較大,因此本文沒有考慮設(shè)備費(fèi)用的預(yù)測。
本文的數(shù)據(jù)來源于國網(wǎng)某省公司主網(wǎng)工程數(shù)據(jù),選取了自2016―2020年期間的變電站工程數(shù)據(jù),經(jīng)過前期數(shù)據(jù)清洗,刪除了空缺值較多的工程,對于部分特征數(shù)據(jù)不全的項(xiàng)目采用回歸插補(bǔ)法進(jìn)行填充,最終共采集到642個(gè)變電站工程的數(shù)據(jù)用于本文的模型,測試集和訓(xùn)練集的劃分比例為7∶3。文中的相關(guān)模型計(jì)算在Python 3.7的環(huán)境下完成。
在采用XGBoost算法對基礎(chǔ)設(shè)施項(xiàng)目投資進(jìn)行預(yù)測時(shí),需要對大量模型中的參數(shù)進(jìn)行設(shè)定。XGBoost模型涉及到三類參數(shù),第一類參數(shù)是通用參數(shù)(General Parameters),作用是設(shè)置模型的整體功能;第二類是提升參數(shù)(Booster Parameters),該類參數(shù)是選擇每一步采用的booster,值得注意的是,其中的lambda和gamma對應(yīng)正則項(xiàng)中的懲罰系數(shù)λ和γ,用來控制XGBoost的正則化部分;第三類是學(xué)習(xí)參數(shù)(Learning Parameters),作用是進(jìn)行模型的優(yōu)化。模型的預(yù)測結(jié)果對模型參數(shù)的具體設(shè)置較為敏感,參數(shù)設(shè)置不合理易導(dǎo)致模型欠擬合或者過擬合,使模型預(yù)測精度不高。本文基于網(wǎng)格搜索(Grid Search)搜索最優(yōu)參數(shù),并選擇交叉驗(yàn)證后的最優(yōu)結(jié)果作為模型的最優(yōu)參數(shù)。在進(jìn)行K折交叉驗(yàn)證時(shí),不同的K值對模型性能的提升效率不同,根據(jù)Jung[21]在2017年的研究提出,建議選擇K值時(shí)滿足n/K>3d,其中n為樣本數(shù)據(jù)量,d為特征數(shù)目。本文的樣本量為642個(gè),特征維數(shù)為25,結(jié)果為K<8.56,因此本文選擇5折交叉驗(yàn)證進(jìn)行模型參數(shù)的優(yōu)化。本文選取的主要參數(shù)最終調(diào)參結(jié)果如表2所示。
表2 XGBoost參數(shù)設(shè)置
利用表2中調(diào)整后的最優(yōu)參數(shù)對基于XGBoost的基礎(chǔ)設(shè)施投資預(yù)測模型進(jìn)行訓(xùn)練,再用訓(xùn)練好的模型對測試集數(shù)據(jù)進(jìn)行預(yù)測。本文的預(yù)測值包括建筑工程投資、安裝工程投資兩項(xiàng),最終輸出的基于XGBoost的基礎(chǔ)設(shè)施投資預(yù)測模型預(yù)測值與真實(shí)值的對比如圖3,4所示。
圖3 建筑工程投資預(yù)測結(jié)果
圖4 安裝工程投資預(yù)測結(jié)果
從圖3,4的預(yù)測值與實(shí)際值的對比來看,建筑工程投資和安裝工程投資的預(yù)測值曲線與真實(shí)值曲線基本吻合,說明預(yù)測值與真實(shí)值比較接近,預(yù)測效果良好,體現(xiàn)了本文所提出的基于XGBoost的基礎(chǔ)設(shè)施投資預(yù)測模型效果良好。
為了進(jìn)一步體現(xiàn)本文所構(gòu)建的基于XGBoost的基礎(chǔ)設(shè)施投資預(yù)測模型的性能,本文還采用了傳統(tǒng)的線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型對本文的案例進(jìn)行預(yù)測,并將MAE和R2作為評價(jià)指標(biāo),各模型的輸出結(jié)果如表3所示。
表3 模型預(yù)測性能比較
從表3所顯示的MAE和R2的結(jié)果來看,本文所提出的基于XGBoost算法的基礎(chǔ)設(shè)施投資預(yù)測模型輸出的建筑工程投資和安裝工程投資的預(yù)測精度均高于傳統(tǒng)的線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型。其中基于XGBoost算法的建筑工程投資預(yù)測的擬合優(yōu)度為0.870,安裝工程費(fèi)的擬合優(yōu)度為0.903,相較于線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型均有較大的提升,均接近于1,說明了預(yù)測值與真實(shí)值之間的擬合程度很高,模型的可靠性強(qiáng)。從平均絕對誤差來看,基于XGBoost模型的基礎(chǔ)設(shè)施投資預(yù)測模型相較于線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型誤差更小,預(yù)測所得的結(jié)果更為接近真實(shí)值,能為決策者提供更為準(zhǔn)確的參考信息,實(shí)現(xiàn)基礎(chǔ)設(shè)施投資的精準(zhǔn)預(yù)測,從而依據(jù)精準(zhǔn)預(yù)測制定合理的投資策略,提高基礎(chǔ)設(shè)施投資效益。
準(zhǔn)確預(yù)測基礎(chǔ)設(shè)施項(xiàng)目投資,對于投資者而言,能夠在有限的資金條件下對基礎(chǔ)設(shè)施優(yōu)化配置提供參考,實(shí)現(xiàn)基礎(chǔ)設(shè)施項(xiàng)目高效益投資。本文通過采用XGBoost算法對基礎(chǔ)設(shè)施項(xiàng)目投資進(jìn)行預(yù)測,并以國網(wǎng)某省公司變電站工程項(xiàng)目實(shí)例為樣本,對本文提出的模型進(jìn)行了驗(yàn)證,并將該模型的預(yù)測性能與傳統(tǒng)的線性回歸模型以及神經(jīng)網(wǎng)絡(luò)模型的性能進(jìn)行對比分析,結(jié)果顯示本文提出的基于XGBoost算法的基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測模型具有良好的預(yù)測性能,能夠較為準(zhǔn)確地預(yù)測基礎(chǔ)設(shè)施項(xiàng)目的投資,能為決策者提供有效的參考,為項(xiàng)目科學(xué)化投資提供重要借鑒。
雖然本文提出的基于XGBoost算法的基礎(chǔ)設(shè)施項(xiàng)目投資預(yù)測模型能夠較為準(zhǔn)確地預(yù)測基礎(chǔ)設(shè)施項(xiàng)目的投資,但是提出的模型主要是針對電力基礎(chǔ)設(shè)施投資預(yù)測,未來可對其他類型的基礎(chǔ)設(shè)施投資做深入分析,針對具體的基礎(chǔ)設(shè)施項(xiàng)目類型進(jìn)行預(yù)測指標(biāo)體系的確定,以形成完整的基于XGBoost的基礎(chǔ)設(shè)施投資預(yù)測體系。