孫景釕,胡長洪,項燁鋆,趙 碚,劉津源,陳夢翔,蔡昌春
(1.國網(wǎng)浙江省電力有限公司溫州供電公司,浙江 溫州 325000;2.江蘇省輸配電裝備技術重點實驗室(河海大學),江蘇 常州 213022)
電力系統(tǒng)短期負荷預測是電力系統(tǒng)運行與調(diào)度的基礎,預測精度直接影響電力系統(tǒng)運行的安全性和經(jīng)濟性。影響負荷波動的因素眾多,其中氣象因素尤為重要[1-2],氣象因素直接影響用戶用電習慣從而導致負荷波動。因此,從負荷波動的機理出發(fā),分析氣象因素對負荷變化的影響對于提高短期負荷預測精度具有重要意義。
近年來,國內(nèi)外學者針對負荷預測及影響因素開展了大量的研究工作。文獻[3]針對通過可視化降維方法解決負荷預測中高維氣象數(shù)據(jù)的擁擠和結構易變問題,從而提高負荷預測精度。文獻[4-5]利用費歇信息進行氣象因素建模,挖掘負荷-氣象因素關聯(lián)性使得負荷預測中氣象因素的處理更加客觀。文獻[6-8]通過分析母線負荷與氣象因素相關特性,創(chuàng)建了基于數(shù)值天氣預報和負荷分類預測的母線負荷預測模型,并提出了基于氣象預報的母線負荷預測方法,但是對于氣象因素沒有給出明確的劃分和選擇方法。
為了更加精準描述氣象因素對負荷預測的影響,聚類分析法常常被用來提取數(shù)據(jù)樣本特征以分析氣象因素的影響[9-12]。文獻[13]針對多類樣本數(shù)據(jù)提出多核模糊聚類算法,選取子核函數(shù)及其參數(shù)用于構造多核函數(shù),從而增大不同類別樣本間的差別。文獻[14]提出了一種電力短期負荷場景中改進多核模糊C 均值聚類算法,提升預測聚類能力,但是在核函數(shù)各參數(shù)選擇偏于經(jīng)驗。
人工智能、深度學習方法能夠充分挖掘負荷變化的本質(zhì)特征,其在負荷預測領域的應用越來越廣泛。文獻[15-16]提出了一種GRU-NN(門控循環(huán)單元神經(jīng)網(wǎng)絡)的短期負荷預測方法,通過建模學習負荷數(shù)據(jù)內(nèi)部動態(tài)變化規(guī)律,融合天氣影響因素分析負荷變化的內(nèi)在聯(lián)系。文獻[17-18]提出了在LSTM(長短期記憶)神經(jīng)網(wǎng)絡中采用Attention 機制進行輸入特征分析,提高歷史訓練數(shù)據(jù)特征的可辨識性。文獻[19-20]利用改進深度系數(shù)自編碼器和極限學習機結合的方法進行短期負荷預測,實現(xiàn)氣象因素的稀疏處理和低維壓縮編碼。然而,傳統(tǒng)LSTM 神經(jīng)網(wǎng)絡在負荷預測中往往存在誤差累計現(xiàn)象,從而影響預測精度。
本文針對復雜氣象因素下負荷預測困難的問題,分別從負荷數(shù)據(jù)處理和預測方法兩方面開展工作。提出了基于多核C 均值模糊聚類的負荷影響因素聚類壓縮,利用核函數(shù)提取影響負荷波動的氣象因素動態(tài)特征;在傳統(tǒng)LSTM結構的基礎上,引入反饋環(huán)節(jié),利用正反向計算結合消除LSTM神經(jīng)網(wǎng)絡訓練過程的累計誤差,提出基于深度學習的多層雙向LSTM 神經(jīng)網(wǎng)絡負荷預測模型,由此提升負荷預測精度。最后,以歷史負荷的聚類數(shù)據(jù)為訓練樣本驗證本文方法的有效性和合理性,實驗結果表明本文方法能夠充分考慮歷史負荷數(shù)據(jù)中的氣象因素特征,提高負荷預測的準確性。
影響負荷波動的氣象因素較多,實際負荷數(shù)據(jù)和氣象因素間存在強耦合、非線性關系。分析負荷與氣象影響因素的相關性是剖析負荷特征的主要方式。斯皮爾曼相關系數(shù)法是分析氣象因素與負荷相關性的常用方法,可以更直觀的看出每一類影響因素對負荷的影響程度,能夠精準的刻畫變量間的關聯(lián)程度。斯皮爾曼相關系數(shù)法是通過內(nèi)部重復值來比較內(nèi)部變量間的單調(diào)性,用+1或-1來表示,斯皮爾曼相關系數(shù)公式如下所示:
核函數(shù)法是數(shù)據(jù)特征提取的常用方法,可以彌補單一核方法提取負荷數(shù)據(jù)特性存在特征描述單一的不足。利用多核函數(shù)將氣象因素的低維非線性關系轉變?yōu)楦呔S線性問題從而提高聚類對多維空間數(shù)據(jù)的聚合能力。在聚類過程中采用基于模糊準則自動調(diào)節(jié)不同核函數(shù)的權重系數(shù),提升組合核函數(shù)的特征學習能力和聚類后系統(tǒng)描述的泛化能力。
假設聚類模型樣本集為{x1,x2,…,xN},xk∈RN,利用非線性映射函數(shù)Φ將低維空間的樣本映射到高維特征空間中{Φ(x1),Φ(x2),…,Φ(xN)}。高維特征空間中基本核函數(shù)可以用低維空間的點積表示:
在滿足Mercer 條件下將多個核函數(shù)構造凸線性組合以提高組合核函數(shù)的泛化能力,線性組合關系表示為:
式中:Kk為基本核函數(shù);β為不同核函數(shù)的權重系數(shù);M為核函數(shù)的個數(shù)。
利用核函數(shù)將負荷數(shù)據(jù)樣本中的氣象因素從高維空間向低維空間映射,并提取各種影響因素的特征空間,實現(xiàn)每類樣本特征的劃分和分類。文中多核C均值模糊聚類的目標函數(shù)為:
式中:d為第i個樣本聚類數(shù)據(jù)到第j類聚類中心的Euclid距離,由式(8)計算:
聚類中心Φ(Vi)在特征空間H中表示為:
由上述可知,多核模糊C 均值聚類模型聚類過程中需要明確核函數(shù)參數(shù)值σ、模糊指數(shù)m、收斂閾值ε和聚類簇數(shù)c等四個參數(shù)。通過初始化中心矩陣及隸屬度矩陣使其滿足歸一化條件,利用迭代計算獲得最終權重和隸屬度,迭代過程的終止條件為隸屬度矩陣||U(t)-U(t-1)||<ε。
傳統(tǒng)單向LSTM 神經(jīng)網(wǎng)絡模型在短期負荷預測中由于存儲歷史與當前的信息,導致在訓練過程中容易出現(xiàn)累積誤差等問題。如圖1所示,雙向LSTM 神經(jīng)網(wǎng)絡模型輸出由兩個信息傳遞相反的LSTM 循環(huán)層構成,前向層按照時間順序傳遞信息,后向層按時間順序逆向傳遞信息。在神經(jīng)網(wǎng)絡訓練過程中,分前向訓練和后向訓練兩個LSTM 模塊,前向訓練輸入序列是數(shù)據(jù)樣本,后向訓練的輸入序列的反向樣本,網(wǎng)絡的輸出由前向輸出和后向輸出共同決定。
圖1 雙向LSTM神經(jīng)網(wǎng)絡記憶單元結構
前向層從1 時刻到t時刻正向計算得到并保存每個時刻向前隱含層的輸出;后向層逆時間序列反向計算得到并保存每個時刻向后隱含層的輸出。最后融合前向層和后向層對應時刻的輸出結果,雙向LSTM神經(jīng)網(wǎng)絡的表達式為:
式中:st為t時刻的前向隱藏層狀態(tài);為t時刻的反向隱藏層狀態(tài);ot為t時刻輸出層的值;g和f為激活函數(shù);xt為輸入向量;V、U、W為隱藏層到輸出層、輸入層到隱藏層、隱藏層之間的權重矩陣;V′、U′、W′為對應的反向權重矩陣。
在傳統(tǒng)雙向LSTM 神經(jīng)網(wǎng)絡的基礎上構建深度化多層機制和反向反饋機制,強化負荷數(shù)據(jù)本質(zhì)特征,避免學習過程中訓練記憶的模糊化,減少訓練誤差。本文提出的多層堆疊雙向LSTM 神經(jīng)網(wǎng)絡結構如圖2所示,相對單層網(wǎng)絡多層堆疊模型能夠對早期預測數(shù)據(jù)加深記憶,形成正、反記憶網(wǎng)絡雙向訓練,從負荷數(shù)據(jù)的不同時序提取數(shù)據(jù)特征。多層堆疊形態(tài)的LSTM 神經(jīng)網(wǎng)絡各層之間的關聯(lián)如下所示:
圖2 多層雙向LSTM神經(jīng)網(wǎng)絡結構
通過對歷史負荷數(shù)據(jù)進行基于氣象因素的聚類分析,構建多層雙向LSTM 神經(jīng)網(wǎng)絡的短期負荷預測模型,具體流程如圖3所示,負荷預測過程分兩個階段,分別為負荷訓練樣本數(shù)據(jù)的聚類分析和負荷預測。
圖3 負荷預測流程
第一階段:負荷訓練數(shù)據(jù)的多核均值聚類。構建基于高斯核和線性核組合的多核模糊C 均值聚類方法,實現(xiàn)多特征氣象因素樣本數(shù)據(jù)集的低維非線性空間映射至高維線性空間,通過指標評價構建負荷樣本訓練數(shù)據(jù)。
第二階段:多層雙向LSTM 神經(jīng)網(wǎng)絡預測?;谟柧殧?shù)據(jù)構建短期負荷預測模型進行負荷預測,在神經(jīng)網(wǎng)絡訓練過程中利用預測誤差評價指標優(yōu)化神經(jīng)網(wǎng)絡參數(shù),評價指標主要有平均絕對百分比誤差MAPE、平均絕對誤差MAE和均方根誤差RMSE。
式中:yi為實際測量負荷數(shù)據(jù);預測模型輸出負荷數(shù)據(jù);M為負荷樣本數(shù)量。
為了驗證本文方法的合理性和準確性,本文采用配電網(wǎng)變電站實際運行數(shù)據(jù)和相關氣象數(shù)據(jù)進行仿真驗證。負荷訓練樣本數(shù)據(jù)的采樣精度為5 min和15 min兩個時間尺度,負荷訓練數(shù)據(jù)為一個月的數(shù)據(jù)量,預測未來一天和星期進行分析。在進行氣象因素聚類時,聚類核函數(shù)參數(shù)σ=0.005、隸屬度函數(shù)模糊指數(shù)m=1.08、收斂閾值ε=0.000 1,聚類迭代次數(shù)為300 次、聚類簇為c=3。本文采用python 開發(fā)LSTM 深度神經(jīng)網(wǎng)絡,電腦配置為I9-9900k-3.6GHz,16G內(nèi)存。
利用多核模糊C 均值聚類模型分析負荷訓練數(shù)據(jù)中的氣象影響因素,利用多核模糊C 均值聚類模型對原始數(shù)據(jù)集樣本進行聚類處理。樣本數(shù)據(jù)中影響因素為平均溫度等8種氣象數(shù)據(jù)。通過多核模糊C 均值算法聚類后的樣本數(shù)據(jù)分布結果如圖4所示,從圖4中可以看出,聚類模型將多維氣象因素聚類為兩類,兩類子簇之間有邊界清晰,其聚類結果的誤差不超過4%?;谏鲜?中氣象數(shù)據(jù)的負荷相關性分析如表1所示,聚類結果的各項指標如表2 所示,多核模糊C 均值聚類較FCM(模糊C 均值)、KFCM(單核模糊C 均值)和DBSCAN(密度聚類算法)在NMI(標準化互信息)、ACC(準確度)、RI(蘭德系數(shù))和ARI(調(diào)整蘭德系數(shù))等4 個指標都具有更加合理的聚類效果。
圖4 數(shù)據(jù)集1三維分布
表1 不同影響因素的斯皮爾曼相關系數(shù)
表2 不同聚類算法比較
利用多層堆疊神經(jīng)網(wǎng)絡進行負荷預測,此時不同層數(shù)的神經(jīng)網(wǎng)絡在不同程度上提取數(shù)據(jù)特征,神經(jīng)網(wǎng)絡層數(shù)和最終預測精度存在一定的關系。表3給出了神經(jīng)網(wǎng)絡模型層數(shù)與預測誤差之間的關系,本文神經(jīng)網(wǎng)絡的層數(shù)為3層。圖5給出了不同預測方法的結果對比,由圖5 可知多層雙向LSTM 模型的預測結果相較于傳統(tǒng)LSTM 模型、雙向LSTM神經(jīng)網(wǎng)絡以及BP網(wǎng)絡,預測結果更加接近負荷真實值。
表3 多層堆疊雙向LSTM層數(shù)與預測誤差
圖5 不同神經(jīng)網(wǎng)絡預測的對比
通過聚類分析將影響因素根據(jù)其對負荷的影響進行聚類劃分,進一步的對比不同算法的負荷預測結果。經(jīng)過聚類分析后,將訓練數(shù)據(jù)的影響因素分為a和b兩類,分別進行基于MBLSTM(多層雙向長短期記憶)神經(jīng)網(wǎng)絡預測,結果如圖6 所示,圖7 給出了不同LSTM 神經(jīng)網(wǎng)絡的預測結果對比,預測誤差的定量分析如表4所示。由表4可知在考慮氣象因素并對其進行聚類分析后,誤差從1.44%降低至0.25%。通過氣象因素聚類,能夠有效甄別影響因素相似的負荷數(shù)據(jù),由此提高訓練數(shù)據(jù)的相似性,但是并沒有增加計算負擔,考慮氣象因素比不考慮氣象因素的計算時間增加了0.96 s。
表4 負荷預測誤差對比
圖6 a、b類數(shù)據(jù)預測結果
圖7 考慮氣象因素聚類前后負荷預測
為進一步驗證本文方法的合理性,利用冬季負荷數(shù)據(jù)進行仿真分析,此時負荷預測的結果如圖8所示。利用聚類劃分處理訓練樣本數(shù)據(jù)并以此進行預測大大降低了氣象因素對負荷訓練、預測過程的影響。從表5可以看出,未考慮氣象因素的短期負荷預測模型的MAPE 誤差值在4.15%,由于冬季負荷的敏感性較低,整體上冬季負荷預測的誤差較夏季大,考慮氣象因素分類整體預測誤差為0.65%。
圖8 考慮聚類氣象因素負荷預測結果
表5 負荷預測誤差對比
本文提出了基于多層模糊C 均值聚類和MBLSTM神經(jīng)網(wǎng)絡的短期負荷預測方法。通過多層模糊C 均值聚類將負荷氣象影響因素進行低維空間映射,實現(xiàn)影響因素的精確分類和聚合,明確負荷氣象因素的耦合關系;進一步的,提出多層堆疊形式的雙向LSTM 神經(jīng)網(wǎng)絡,通過構建雙向計算機制和多層堆疊形式,提高負荷數(shù)據(jù)間的前后關聯(lián),挖掘負荷序列數(shù)據(jù)關聯(lián)信息,從而提高負荷預測精度。仿真結果表明,本文所提方法能夠提高負荷影響因素的區(qū)分度,有效提高負荷預測精度。