吳 云, 雷建文, 鮑麗山, 李春哲
(1. 東北電力大學信息工程學院, 吉林省吉林市 132012; 2. 國網江蘇省電力有限公司信息通信分公司, 江蘇省南京市 221000; 3. 國網吉林省電力有限公司遼源供電公司, 吉林省遼源市 136200)
短期電力負荷預測是電網運行調度、生產規(guī)劃的重要組成部分,它主要是對未來幾時、一天甚至幾天的電力負荷進行預測,其主要用于安排短期調度計劃、應對緊急情況,是電力系統安全穩(wěn)定和經濟運行的基礎[1-2]。
隨著影響負荷預測因素的數量、種類的增多,隨機性以及分布特點變得復雜,傳統的負荷預測方法的速度與精度已經不能滿足大數據環(huán)境下的要求[3]。越來越多的算法應用到負荷預測領域之中,使得負荷預測的精度不斷提高[4]。文獻[5]把灰色模型與神經網絡的優(yōu)點相互結合,并采用遺傳算法對神經網絡進行優(yōu)化,以此完成對短期電力負荷的預測,預測精度較單一的神經網絡方法有所提高。然而該方法的訓練樣本中有很多異于待測日特征的樣本,這不僅造成神經網絡訓練時間較長,而且收斂速度較慢。文獻[6]把改進的隨機森林算法與灰色投影相結合對電網短期負荷預測。該方法雖然通過灰色關聯投影法能夠找到與待測日具有相似特征的歷史日,但是找到的相似日只具備良好的負荷趨勢相似性,而不具備良好的負荷曲線形狀相似性[7],因此預測精度也有待提高。
為彌補傳統灰色關聯分析法在選擇相似日時只考慮負荷特征曲線的幾何相似程度而忽略了數值接近程度的缺陷,克服反向傳播(BP)神經網絡泛化能力差、易陷入局部最優(yōu)[8]等不足,本文提出了一種基于改進灰色關聯與蝙蝠優(yōu)化神經網絡的短期負荷預測(IGRA-BA-BP)方法,并結合實際案例對該方法進行了驗證。結果表明,相比現有的短期負荷預測方法,本文方法的預測結果有所提高。
短期電力負荷預測是依據電力負荷和其影響因素的歷史數據,建立相關的預測模型,對未來的電力負荷進行科學的預測。氣象因素是影響負荷變化的重要因素,它對負荷的影響主要體現在氣象因素的突變會導致電力負荷隨之突然變化[9-10]。日期類型對電力負荷的影響主要體現在工作日與休息日(周末和節(jié)假日)之間的用電量差距[11]。因而本文選取氣象因素和日期類型作為負荷的主要影響因素,來對電力負荷進行預測。
把影響負荷的主要影響因素作為選取相似日粗集的指標,通過下述相似日粗集選取規(guī)則選取相似日粗集。由天氣預報得知待測日的氣象數據,從歷史日中選出最高溫度與待測日相差±3 ℃以內的樣本組成集合A;從集合A中選出最低溫度與待測日相差±3 ℃以內的樣本組成集合B;從集合B中的選出平均溫度與待測日相差±3 ℃以內的樣本組成集合C;從集合C中選出降雨量與待測日相差±3 mm以內的樣本組成集合D;從集合D中選出日期類型(工作日、節(jié)假日、周末)與待測日一致的樣本組成集合E,則集合E為相似日粗集。
此過程只是選取出了與待測日具有粗糙相似的日期類型和氣象特征的歷史日,為了提高預測精度,再運用灰色關聯分析方法[12],在相似日粗集中進一步抽取與待測日具有高度關聯的若干歷史日,以這些歷史日作為下一步預測模型的訓練樣本,無疑將會較大地提高負荷預測的精度[13]。
溫度和降雨量以及日期類型的數量級和單位都不相同,不能做進一步計算,如要進一步計算各相似日粗集中的樣本與待測日的灰色關聯度,需要對各影響因素進行量化,從而方便相似度的計算。本文參考文獻[14]對日期類型的與氣象數據進行量化來定性描述日期類型與氣象因素對短期電力負荷預測的影響。因其只對降雨類型做了量化,這樣量化不夠精細,因此本文參照其方法對降雨量根據區(qū)間進行量化,如表1所示。
表1 降雨量區(qū)間及其量化值Table 1 Rainfall interval and its quantified value
關聯分析的基本思想是根據數據序列的相似程度來判斷關聯程度[7,12],是灰色系統理論提出的一種分析系統中各因素關聯程度的方法。傳統灰色關聯分析法使用兩個數據序列之差的絕對值計算關聯度,只考慮了數據序列之間的幾何相似程度,而忽略了數值接近程度。如果兩條曲線平行,以傳統灰色關聯分析法計算出二者關聯度為1,實則兩條曲線的關聯度不為1,計算出的關聯度與實際不符。
本文從兩個角度分析兩條特征曲線的關聯度,兩條特征曲線各點的差越接近0或者商越接近1,則兩條特征曲線越接近。提出一種融合差方式和除方式的灰色關聯分析方法,從形狀和距離上定義綜合灰色關聯度。改進灰色關聯度步驟如下。
1)構造特征矩陣
由各影響因素的值組成特征向量X,待測日特征向量以X0=[x0(1),x0(2),,x0(m)]表示。相似日粗集中的每日的特征向量以X1,X2,,Xn表示,這n+1個序列構成一個m×(n+1)階的特征矩陣如式(1)所示。
[X0X1X2Xn]=
(1)
式中:m為特征向量的維數;n為相似日粗集中樣本個數;xi(k)表示相似日粗集中第i個樣本的第k個特征;x0(k)表示待測日的第k個特征;下標i=1,2,,n,k=1,2,,m(下同)。
2)計算差矩陣
求待測日序列與相似日粗集中樣本序列各分量的差值,組成差值矩陣,如式(2)所示。
(2)
(3)
3)計算商矩陣
求待測日序列與相似日粗集中樣本序列各分量的商,組成商矩陣,如式(4)所示。
(4)
(5)
4)計算綜合灰色關聯度
求得相似日粗集中每個歷史日與待測日的綜合灰色關聯度。綜合灰色關聯度計算公式如下:
(6)
按照求取的綜合灰色關聯度,選擇相似日粗集中綜合關聯度大于0.85的所有樣本組成相似日集。
BP神經網絡是一種按照誤差逆向傳播,反復修正各層之間的連接權值和閾值,使得誤差函數值達到最小的多層前饋神經網絡,相鄰層之間通過不同的權值實現連接[15]。本文采用單隱含層的三層神經網絡,輸入層節(jié)點數為8個,其中包含待測日的負荷影響因素與待測日前一天t時刻、t-1時刻、t-2時刻的負荷值。輸出層節(jié)點為一個,代表待測日t時刻的負荷值,隱含層節(jié)點數根據經驗式(7)來確定[16]。
(7)
式中:m′和n′分別為輸入層、輸出層節(jié)點的個數;h為隱含層節(jié)點個數;a為1~10之間的調節(jié)常數,最終選定隱含層的節(jié)點數為4。隱含層和輸出層的激活函數采用sigmoid函數[17]
蝙蝠算法(bat algorithm,BA)[18]是一種全局搜索優(yōu)化算法,其基本思想是將每個種群個體映射為空間中的可行解,把搜索過程和優(yōu)化過程模擬成蝙蝠個體搜尋獵物和移動的過程,蝙蝠所處位置的優(yōu)劣以求解問題的適應度函數來衡量,將尋優(yōu)過程類比為個體的優(yōu)勝劣汰過程。
蝙蝠在搜索尋優(yōu)的過程中每個個體的位置、速度以及回聲頻率按如下公式進行變化:
fi=fmin+(fmax-fmin)β
(8)
(9)
(10)
對于局部搜索,一旦從現有的最優(yōu)解中選出一個解,每只蝙蝠的下一個解pnew就在隨機游走中就近產生,即
pnew=pold+θAt
(11)
在初始時個體保持較強的響度和較低的脈沖發(fā)射率,在搜尋到食物后,則不斷減小響度,增大脈沖發(fā)射率,蝙蝠在搜尋獵物過程中,脈沖發(fā)射率和響度表示公式如下:
(12)
(13)
由于神經網絡訓練過程緩慢,容易陷入局部小值,甚至還有可能無法收斂[20],所以要對BP神經網絡的初始參數進行優(yōu)化。蝙蝠算法因具備并行性、分布式和收斂速度快等特點,被廣泛應用到各個領域。它比粒子群優(yōu)化算法[21]和遺傳算法更具發(fā)展?jié)摿?BA算法結合這些算法的主要優(yōu)點,在優(yōu)化神經網絡方面性能優(yōu)越[22]。
采用BA對BP神經網絡的初始權值和閾值進行優(yōu)化,使其不易陷入局部極小值,還可以增強泛化性能,提高預測精度和收斂速度。BA優(yōu)化的適應度函數為:
(14)
BA優(yōu)化BP神經網絡的步驟如下。
步驟1:初始化神經網絡結構,即初始化輸入層、隱含層、輸出層的節(jié)點個數,導入訓練數據。
步驟3:計算適應度Fitness(i)當前最優(yōu)適應度Fbest,當前最優(yōu)位置pbest。
步驟4:按照式(8)至式(10)產生新解。
步驟7:判斷算法是否達到終止條件,若達到終止條件,輸出結果,得到神經網絡的最優(yōu)權值和閾值。否則,返回步驟4繼續(xù)迭代。
步驟8:將蝙蝠全局最優(yōu)位置對應的權值和閾值作為BP神經網絡參數,建立最優(yōu)的負荷預測模型。BA優(yōu)化BP神經網絡流程圖見附錄A圖A1。
算例1:采用中國南方某地區(qū)2014年6月1日到9月23日的歷史數據,對2014年9月24日全天24 h的電力負荷進行預測。首先利用本文第1節(jié)所述規(guī)則從歷史數據中選出相似日粗集,共有28個樣本被選入相似日粗集。再利用本文改進的灰色關聯方法計算相似日粗集中樣本與待測日的綜合灰色關聯度,計算結果見圖1。選取綜合灰色關聯度大于0.85的樣本作為待測日的最終相似日集,用來訓練神經網絡。
圖1 綜合灰色關聯度Fig.1 Comprehensive grey relational degree
把預處理后的原始數據y經式(15)歸一化后與量化之后的影響因素組成神經網絡的輸入向量。預測結果的反歸一化如式(16)所示。
(15)
(16)
相關參數設置:BP神經網絡為3層網絡結構,隱含層和輸出層之間采用sigmoid函數,學習率為0.01,輸入節(jié)點為8個,隱含層節(jié)點為4個,輸出節(jié)點為1個,需要優(yōu)化的權值和閾值為8×4+4×1+4+1=41個,其中權值為36個,閾值為5個。所以蝙蝠個體維數為41,個體中各分量的范圍為[-1,1],種群規(guī)模為20,脈沖響度為0.3,脈沖發(fā)射率為0.5,脈沖響度衰減系數和脈沖發(fā)射率增加系數都為0.9,回聲頻率范圍[fmin,fmax]為[0,3],最大迭代次數為5 000次,期望誤差為0.001。
使用全部歷史數據分別通過單一的BP神經網絡預測方法、蝙蝠優(yōu)化BP神經網絡組合預測(BA-BP)方法、傳統灰色關聯與蝙蝠優(yōu)化BP神經網絡組合預測(GRA-BA-BP)方法以及本文所提IGRA-BA-BP方法對2014年9月24日電力負荷進行預測,預測結果如圖2所示。
圖2 預測負荷曲線與實際負荷曲線Fig.2 Prediction load curves and actual load curve
(17)
由于相對誤差ERE有正負,為了避免正負相抵消,計算平均相對誤差的時候取相對誤差的絕對值。平均相對誤差如式(18)所示,均方根誤差如式(19)所示。
(18)
(19)
均方根誤差指標加強了數值大的誤差的作用,提高了該指標的靈活性。
為方便分析,把相對誤差去絕對值,做出對比如圖3所示。
圖3 相對誤差對比Fig.3 Comparison of relative error
4種方法的平均相對誤差和均方根誤差如表2所示。
表2 平均相對誤差與均方根誤差Table 2 Mean relative error and root mean square error
由圖3和表2可以看出:采用優(yōu)化過的神經網絡來預測短期電力負荷,誤差比單一的神經網絡預測要小;BA-BP方法預測結果的平均相對誤差和均方根誤差比單一的BP神經網絡分別減小1.07%和1.06%;采用灰色關聯選取相似日和優(yōu)化的神經網絡相結合的預測方法,預測效果相比沒有采用相似日法的預測效果也有明顯的提升;GRA-BA-BP方法預測結果的平均相對誤差和均方根誤差比BA-BP方法分別減小0.29%和0.37%;而預測效果最好的是IGRA-BA-BP方法,其預測結果比GRA-BA-BP方法預測結果的平均相對誤差和均方根誤差分別降低了0.07%和0.05%;IGRA-BA-BP方法的預測效果比BA-BP和BP方法的預測效果都有了大幅的提高,其中平均相對誤差與均方根誤差比BP方法分別減小了1.43%和1.48%。
算例2:為充分證明本文方法的優(yōu)越性,隨機選擇一組數據對其中一天的負荷進行預測,以2014年3月1日到5月20日的歷史數據,對2014年5月21日全天24 h的電力負荷進行預測。并分別與算例1另外三種方法的預測結果對比,預測負荷曲線和實際負荷曲線圖見附錄A圖A2,具體的預測誤差見附錄A表A1。
針對短期電力負荷預測中選擇相似日的問題,本文首先通過相似日粗集選取規(guī)則從歷史日中選取與待測日具有相似性的樣本,在常規(guī)灰色關聯分析的基礎之上引入形狀相似性和距離相近性,選取綜合灰色關聯度大于0.85的樣本組成相似日集,利用相似日集作為神經網絡預測模型的訓練樣本,減少了訓練樣本的數量和差異程度。在BP神經網絡預測的基礎上,對其初始權值和閾值進一步優(yōu)化,使得BP神經網絡很快速地收斂到一個較好的解。通過把本文方法的預測的結果分別和沒有經過相似日選擇的兩種方法以及利用傳統灰色關聯方法選取相似日的預測方法相比較可得,改進的灰色關聯方法與蝙蝠優(yōu)化的神經網絡結合,可以有效提高短期電力負荷預測的預測精度,為電網發(fā)電、調度等環(huán)節(jié)提供可靠支持。但是隨著電力系統數據量的增加,文中方法在大數據環(huán)境下的應用還有一定的局限性。未來可以將本文方法和大數據平臺結合,進一步提高該方法的訓練效率、應用范圍及數據處理能力。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx)。