姚日權(quán),費英群,丁云峰,王勝華,田林
(國網(wǎng)浙江省電力有限公司湖州供電公司,浙江湖州 313000)
電網(wǎng)是承載我國國家能源策略的主體之一,對能源資源配置、服務經(jīng)濟社會發(fā)展大局有著重要意義,電網(wǎng)的發(fā)展是國家經(jīng)濟水平發(fā)展的重要標志[1-4]。近年來,隨著用電量需求的增長,電網(wǎng)投資規(guī)模也不斷增大。在這一過程中,為了提高對于基建工程全過程的管控能力,深化利用現(xiàn)有的工程自動竣工結(jié)算、大數(shù)據(jù)云平臺數(shù)字化、信息化應用基礎和歷史數(shù)據(jù)資源[5-6],通過全時感知和新形勢下市場價格波動信息,全面掌控先進設備工藝等現(xiàn)代工程建設特征,結(jié)合大數(shù)據(jù)分析方法,構(gòu)建多維、動態(tài)、精準、智能、適應各類電網(wǎng)基建工程技術(shù)類型的資本性項目標準成本體系。而提升投資預算編報質(zhì)量,實現(xiàn)投入產(chǎn)出最大化,提升精益化管理水平,則需要有效提升電力工程數(shù)據(jù)的智能化分析水平[7-11]。
結(jié)合上述背景,文中對電力工程數(shù)據(jù)的智能化分析方法進行了研究。通過集成歷年工程的海量數(shù)據(jù)分析工程設備、材料歷史趨勢和波動特性,動態(tài)感知各個年度的數(shù)據(jù)資源,建立智能化的電力工程數(shù)據(jù)挖掘和分析預測模型。
文中數(shù)據(jù)挖掘的目標主要是:分析電力工程項目建設過程中重要電網(wǎng)工程設備材料波動對電網(wǎng)投資策略造成的影響。結(jié)合該場景,需要構(gòu)建適用于工程設備材料的預測模型[12-14]。在模型構(gòu)建時,文中主要從兩個方面進行數(shù)據(jù)挖掘模型的構(gòu)建,一是考慮工程設備的歷史價格進行預測分析;二是從影響設備材料價格的相關影響因素進行分析[15-20]。
在基于歷史數(shù)據(jù)進行數(shù)據(jù)分析時,可以從數(shù)學的角度出發(fā),按照時間序列分析的思想進行數(shù)據(jù)分析。在分析歷史數(shù)據(jù)時,文中使用的算法為支持向量機(SVM),其基本原理如圖1 所示。
圖1 SVM基本原理
定義數(shù)量為n的訓練集合(xi,yi)和非線性映射ψ(x)為:
二者由線性回歸函數(shù)完成從樣本輸入空間Rd到高維特征Rk的映射:
其中,ω是高維空間下的權(quán)向量,b為模型的偏置。SVM 算法的最終目的為實現(xiàn)結(jié)構(gòu)風險的最小化,即找到最優(yōu)ω、b。在模型參數(shù)的計算過程中,SVM 通常基于結(jié)構(gòu)風險最小化原則:
其中,c為優(yōu)化過程中的正則化系數(shù),為調(diào)節(jié)結(jié)構(gòu)風險的松弛因子。在求解該優(yōu)化問題時,該文使用的是Largrange 函數(shù),其基本過程如下:
首先,引入拉格朗日乘子:
根據(jù)Karush-Kunhn-Tucker 優(yōu)化算法有:
此時,定義優(yōu)化過程中所采用堆成函數(shù)的核函數(shù)為:
式(4)此時可以轉(zhuǎn)化成以下形式:
最終可以得到模型的預測公式:
其中,K(xi,xj)是模型預測時使用的徑向基函數(shù),其形式如下:
在基于價格影響因素進行數(shù)據(jù)分析時,該文引入了數(shù)據(jù)挖掘領域中的灰狼優(yōu)化算法(GWO)。GWO 算法是一個以灰狼種群等級制度和群體捕食行為作為基礎原理的優(yōu)化算法。
以自然界中的狼群為參考,狼群可劃分為4 個等級,各等級的職責如表1 所示?;依莾?yōu)化的算法示意圖如圖2 所示。
表1 灰狼種群職責劃分
采用數(shù)學語言對該原理進行描述如下:對于一個灰狼種群,其數(shù)量為M,搜索空間為k。對于編號為i的灰狼個體,其位置可描述為:
式(12)和式(13)給出了狼群包圍獵物的過程:
其中,D是狼群中狼與獵物間的距離,x(t)是迭代后的灰狼個體位置,A、C是模型的參數(shù)向量,其計算方法如下:
當灰狼群體中,等級α、β、δ靠近獵物時,獵物的位置此時是可估計的,灰狼群體依據(jù)α、β、δ來進行位置的迭代更新。結(jié)合文中的應用場景,普通的灰狼優(yōu)化算法在迭代時容易陷入局部最優(yōu)。因此,文中在傳統(tǒng)的灰狼算法上引入動態(tài)進化算子和非線性收斂因子,提升算法的性能。引入動態(tài)進化算子后,狼種群結(jié)合α、β、δ的位置進行位置更新。
此時,位置更新方法可改寫成:
此外,由于式(14)中的收斂因子a是線性變化的,不能完整地映射算法在優(yōu)化過程中的非線性過程,因此對a進行改進:
在對改進的灰狼算法進行進化改進時,文中使用差分進化算法。該算法包括變異、交叉、選擇3 個步驟,首先對種群進行初始化:
對隨機搜索空間上的N個初始種群進行變異:
然后進行交叉操作,以提升種群的多樣性:
基于貪婪算法進行選擇,選擇進化后較優(yōu)的個體作為新一代個體:
在電網(wǎng)工程建設過程中,設備購置費用占據(jù)工程造價總成本的一半以上。因此,該文主要基于電網(wǎng)工程設備價格對工程數(shù)據(jù)進行智能化分析。在電網(wǎng)工程設備中,主要關注“4 個設備”、“3 種材料”。其中,“4 個設備”為變壓器、短路器、GIS 開關、隔離開關;“3 種材料”為鐵塔、導線、電纜。
在進行工程投資需求分析時,文中結(jié)合各項材料的歷史價格數(shù)據(jù)、價格波動數(shù)據(jù)、將SVM 算法與灰狼優(yōu)化算法進行結(jié)合。具體的算法步驟如圖3 所示。
圖3 基于差分進化的灰狼優(yōu)化支持向量機算法步驟
文中以電網(wǎng)公司采購的220 kV 某180 MVA 型號的變壓器,以及220 kV 角鋼塔的價格數(shù)據(jù)為數(shù)據(jù)基礎。在進行數(shù)據(jù)分析時,采集了2006~2020 年的數(shù)據(jù),前10 年作為訓練數(shù)據(jù),后5 年作為預測的測試數(shù)據(jù)。
根據(jù)上述的歷史價格,引入價格波動率,其計算方法如下:
其中,ui為設備、材料的價格比率,s為價格比率標準差,δ為得到的波動率。結(jié)合式(22)可得到變壓器與鐵塔的波動特性。
結(jié)合價格波動特征以及價格影響因素,使用圖3所示的算法得到變壓器和鐵塔在2016~2020 年間的預測價格,結(jié)果如表2 所示。
表2 變壓器、鐵塔價格預測結(jié)果
為了評估模型的預測效果,文中使用平均相對誤差作為評價指標:
最終得到變壓器在這一時間區(qū)間內(nèi)的預測結(jié)果與實際結(jié)果的平均相對誤差為3.35%,鐵塔的平均相對誤差為2.26%。鐵塔的平均相對誤差較小,這通常是由于鐵塔價格的波動率較低導致的。
結(jié)合上文中的預測結(jié)果,可以得到電網(wǎng)工程的投資需求預測結(jié)果。為了更優(yōu)地評估該文算法對電力工程數(shù)據(jù)的分析預測效果,文中引入基于灰色預測的BP 神經(jīng)網(wǎng)絡算法(GA-BP)作為對比算法。表3和表4 分別給出了該文算法和GA-BP 算法的模型參數(shù)??梢钥闯?,兩個算法的最大迭代次數(shù)相同,均為500 次,保證了模型訓練、算法預測過程中相同的算法復雜度,增加了計算結(jié)果的可信度。
表3 該文算法參數(shù)
表4 GA-BP算法模型參數(shù)
在進行電網(wǎng)投資預測時,仍使用該地區(qū)2016~2020 年的相關工程數(shù)據(jù),前10 年作為訓練數(shù)據(jù),后5年作為預測的驗證數(shù)據(jù)。首先,按照上文所述方式對各項設備與材料分別進行預測;然后將所有的數(shù)據(jù)進行加權(quán)求和,并得到最終的數(shù)據(jù)分析結(jié)果。預測結(jié)果如表5 所示。
表5 電網(wǎng)投資需求預測結(jié)果
在評估兩個模型的效果時,仍使用平均相對誤差。經(jīng)計算,該文算法在進行電網(wǎng)投資需求預測時的平均相對誤差為2.86%,而GA-BP 的平均相對誤差為6.42%,平均相對誤差提升了3.56%。
隨著電力工程數(shù)據(jù)不斷積累,其已成為各級電網(wǎng)建設與分析的重要資源之一。該文在各類工程數(shù)據(jù)上建立了數(shù)據(jù)的分析和預測模型,可以準確地預測電網(wǎng)工程中設備、材料的變化趨勢,精確把控電網(wǎng)投資需求。該模型可以充分利用自動竣工階段、大數(shù)據(jù)平臺等信息化資源,對研究建立電網(wǎng)工程標準成本體系具有重要意義。