蒲 維,楊毅強,張淵博,付江濤,宋 弘
(1 四川輕化工大學自動化與信息工程學院,四川 宜賓 644000; 2 人工智能四川省重點實驗室,四川 宜賓 644000; 3 阿壩師范學院,四川 阿壩 623002)
在國內發(fā)布“十四五”的規(guī)劃中,明確指出加快電網基礎設施智能化改造和智能微電網建設,提高電力系統(tǒng)互補互濟和智能調節(jié)能力將成為未來的發(fā)展方向。 電力資源作為一種二次能源,是其他各行各業(yè)健康發(fā)展的基石,高精準的電力負荷預測對整個電力系統(tǒng)經濟有效、安全運行起著不容忽視的作用[1]。 隨著新能源汽車等用電設備的數(shù)量不斷增長,導致電網的隨機性、不確定性、不穩(wěn)定性進一步提高,因此,迫切需要一種穩(wěn)定性好、預測精度高的電力負荷預測模型。
文獻[2-3]分別采用了粒子群算法和遺傳算法進行參數(shù)優(yōu)化,雖然對預測精度有所提升,但這2 種算法存在收斂速度緩慢,且復雜繁瑣的問題。 文獻[4-5]采用了經驗模態(tài)分解對原始數(shù)據進行分解,但在使用經驗模態(tài)分解的過程中會伴隨有端點效應、模態(tài)混疊等情況,而變分模態(tài)分解可以有效地避免經驗模態(tài)分解存在的問題[6-9]。 文獻[10-12]中選用單一的電力負荷數(shù)據作為輸入特征,未考慮到影響負荷數(shù)據的其他因素(如工作日、溫度、電價),不能充分提取變量間的信息關系。 文獻[13-14]中采用循環(huán)神經網絡(Recurrent Neural Network,RNN)進行預測,該網絡能夠很好地捕獲數(shù)據的時序性,但經常伴隨著梯度消失、爆炸的問題。 文獻[1,3,11,15]中采用長短期記憶神經網絡(Long Short-Term Memory,LSTM)。 LSTM 網絡是在RNN基礎上添加多個閾值門改進的,能夠很好地解決RNN 網絡梯度消失、爆炸的問題,但當原始數(shù)據呈現(xiàn)高度線性,且含有噪聲時,采用LSTM 網絡進行預測模型訓練會導致過擬合的情況。 文獻[9,16]中,采用了BP 神經網絡(Back propagation,BP)進行訓練,其權值和閾值等參數(shù)在訓練過程中是隨機產生的,且BP 網絡存在學習率低,泛化能力弱,同時極易陷入局部最優(yōu)的問題[17]。
基于已有的研究內容,本文提出了一種新型的預測模型—基于NGO-VMD-FCBF-Informer 電力負荷組合預測模型,以解決現(xiàn)有電力負荷預測模型優(yōu)化方法不夠理想的問題,同時對該模型進行了有效性的論證。
Dehghani 等學者[18]在研究北方蒼鷹捕食行為的過程中獲得了靈感,由此提出了一種新的搜索算法,并將其命名為北方蒼鷹優(yōu)化算法(Northern Goshawk Optimization,NGO)。 該優(yōu)化算法主要是對北方蒼鷹的捕食行為進行模擬,北方蒼鷹種群作為NGO 算法中的搜索者,種群中每只北方蒼鷹需要對目標獵物的捕獲問題提出解決方案,NGO 算法的優(yōu)化效果明顯強于GWO 算法、WOA 算法及MPA算法[18]。
捕食過程由獵物識別和獵物捕獲兩個階段組成。 在獵物識別階段中,北方蒼鷹進行全局隨機搜索,識別并選擇最佳區(qū)域獵物,同時發(fā)動快速攻擊。表達式如下:
其中,Pi為第i只北方蒼鷹的目標獵物位置;Xk為K只北方蒼鷹向量組成的矩陣;為新狀態(tài)第一階段下第i個提議的解決方案的第j個維度。為第一階段的目標函數(shù)值;r為[0,1] 區(qū)間的隨機數(shù);I也是隨機數(shù),其值可以取1 或2。
在獵物捕獲階段中,由于獵物試圖逃跑,因此存在一個短暫的追逐過程——追尾,然后捕獲獵物。這種行為的模擬增加了算法對搜索空間的局部搜索的利用能力。 表達式如下:
其中,R為種群攻擊范圍半徑;t為當前迭代次數(shù);T為最大迭代次數(shù);為第二階段的目標函數(shù)值。
變分模態(tài)分解(Variational Mode Decomposition,VMD)算法是由Dragomiretskiy 等學者[19]在2014年提出了一種新型完全非遞歸的模態(tài)信號處理方法。該方法可以通過特定的方式將原始數(shù)據分解成若干個不同帶寬及頻率的本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)。
與經驗模態(tài)分解相比,VMD 分解可以有效的避免端點效應及模態(tài)混疊的情況,可以更好地提取負荷數(shù)據信息,并且,VMD 分解的IMF 分量層數(shù)K及懲罰因子α 可以人為設置,其自適應性明顯更強。針對電力負荷數(shù)據具有非線性、非平穩(wěn)性等特點,VMD 分解是一種非常適宜的分解方法。
快速相關性濾波算法(Fast Correlation-Based Filter,F(xiàn)CBF)作為一種典型基于相關性分析的特征選擇方法之一,能有效衡量2 個特征變量之間相關性,其評判標準為對稱不確定性(Symmetrical Uncertainty,SU),以此篩選出與目標特征變量相關性高的特征變量[20]。
在相關信息量中引入熵作為隨機特征X與Y不確定性的度量,通過熵的定義可以將特征X的熵進行表達,則可進一步表達出同時滿足特征X與Y的條件熵。 表達式如下:
其中,P(xi)、P(yj)分別表示當隨機特征X與Y取xi、yj值的概率。
引入信息增益(Information Gain,IG) 來表達在特征X熵減(Y提供的關于X的額外信息),表達式如下:
可得出SU的表達式:
其中,SU的取值范圍為(0,1),且值越大表示2個特征變量之間相關性程度越高。
研究表明,Transformer 在提高預測精準度方面具有潛力,但Transformer 存在二次時間復雜度、高內存使用量和編碼器-解碼器體系結構固有的局限性等問題。 為了解決這些問題,Informer 模型應運而生[21],該模型對Transformer 原有的自注意力機制進行了概率稀疏化,降低了計算復雜度,并有效提高了序列預測的準確度[22]。 Informer 模型結構如圖1所示。
圖1 Informer 模型結構圖Fig. 1 Informer model structure diagram
1.4.1 稀疏自注意力機制
與傳統(tǒng)的自注意力機制相比,稀疏自注意力機制在將傳統(tǒng)的自注意力機制的Q(Query)進行稀疏化操作得到新的。 稀疏自注意力機制的公式如下:
其中,A表示Attention機制;Q,K,V表示由輸入變量線性變換獲得的相同行列的3 個矩陣;T表示矩陣的轉置;softmax表示激活函數(shù);d表示變量輸入維度。
1.4.2 編碼器
編碼器(Encoder)由數(shù)量若干的多頭概率稀疏自注意力和“蒸餾”(Distilling)共同構成,是用來接受輸入端長時間序列數(shù)據輸入,同時從輸入中獲取數(shù)據的長期依賴性。 自注意力蒸餾機制公式如下:
1.4.3 解碼器
解碼器(Decoder)由一個多頭自注意力和一個掩碼多頭稀疏自注意力共同構成,采用生成式預測方式來緩解長序列預測時的速度過慢的問題。 公式如下:
其中,表示start token;L為時間序列的長度。
2.1.1 數(shù)據選取
本文選取某地2010年7月至9月期間電力負荷數(shù)據集,其負荷數(shù)據信息采樣間隔為30 min,采集共計4 415 組負荷數(shù)據。 在此,選取2010年7月1日至9月20日,共計3 936 組數(shù)據作為訓練集,選取2010年9月21日至30日,共計479 組數(shù)據作為測試集。
該數(shù)據集包含了7 個實時特征變量及電力負荷信息,其中包括2 個時間序列特征變量:時間點與星期變量;4 個氣象特征變量:干球溫度、露點溫度、濕球溫度及濕度變量;1 個市場特征變量:電價變量。
2.1.2 數(shù)據預處理
由于原始數(shù)據的輸入特征變量在數(shù)值上可能存在相差幾個量級的問題,這將導致數(shù)量級大的特征變量在學習算法中占據主導地位,從而忽略了針對量級小的特征變量的學習。 為了解決量綱上存在差距造成的影響,同時提高算法的收斂速度及預測精度的問題,本文選用Min-Max 歸一化對負荷數(shù)據進行歸一化處理。 歸一化公式如下:
其中,Xmax和Xmin分別為原始數(shù)據中的最大值及最小值;X′為歸一化處理后的數(shù)據值。
2.1.3 性能評價指標
本文選用了均值絕對誤差(MAE)、平均絕對百分比誤差(MAPE) 及均方根誤差(RMSE) 三個指標作為實驗負荷預測結果精度的衡量標準。 性能評價指標的數(shù)值越低,表明該模型的預測精度越精準。性能評價指標的公式如下:
其中,hp、hi分別表示t =i的預測值和實際值。
基于NGO-VMD-FCBF-Informer 的電力負荷組合預測模型流程如圖2 所示。 整個預測流程由2 個部分共同組成:NGO 算法優(yōu)化VMD 分解部分及FCBF-Informer 電力負荷預測部分。
圖2 NGO-VMD-FCBF-Informer 組合預測模型流程圖Fig. 2 Flow chart of NGO-VMD-FCBF-Informer combination prediction model
2.2.1 NGO-VMD(OVMD)
在使用VMD 分解對原始數(shù)據進行處理前,需要手動設置IMF分量層數(shù)K及懲罰因子α。 由于這2 個參數(shù)在VMD 分解中占據著主導地位,對分解的結果起著決定性的作用,如若參數(shù)設置不當將導致后續(xù)步驟難以進行[22]。 縱然研究人員可以憑借經驗對2 個參數(shù)進行預先設置,但人為設置參數(shù)會存在主觀性、隨機性等問題。 且參數(shù)往往需要多次設置、直至較優(yōu),該過程繁瑣且費時費力,并且人為確定的最終參數(shù)極大可能會遜于NGO 算法尋優(yōu)確定的參數(shù),這將導致VMD 分解不充分,原始數(shù)據的非線性、非平穩(wěn)性不能得到最大程度的緩解。 因此,本文選用NGO 算法對VMD 分解的IMF分量層數(shù)K及懲罰因子α進行尋優(yōu),OVMD 部分的主要工作是對原始數(shù)據進行分解處理。 采用NGO 算法優(yōu)化VMD 分解的[K,α] 參數(shù)組合具體步驟如下。
(1)設置VMD 分解的收斂容差等基本參數(shù)。
(2)設置NGO 算法的種群數(shù)及最大迭代次數(shù);選用樣本熵局部最小值作為NGO 算法適應度函數(shù)。
(3)設置VMD 分解的[K,α] 參數(shù)組合尋優(yōu)范圍。
(4)利用VMD 對原始信號進行分解處理,同時計算出尋優(yōu)范圍內不同[K,α] 參數(shù)組合的適應度值。
(5)隨著迭代的進行,利用NGO 算法的優(yōu)化機制不斷更新出種群個體的位置信息。
(6)循環(huán)(4) ~(5)的步驟,直至獲得了最優(yōu)[K,α] 參數(shù)組合或者迭代次數(shù)達到預設最大迭代次數(shù)。
(7)輸出當前最優(yōu)[K,α] 參數(shù)組合。
本文設置IMF分量個數(shù)k及懲罰因子α的尋優(yōu)范圍分別為[2,20]與[200,4 000],[k,α] 參數(shù)組合經過NGO 算法尋優(yōu),最終本文確定的最優(yōu)[k,α]參數(shù)組合為[18,3 400],利用VMD 算法對原始數(shù)據進行分解。 根據分解的結果可知,IMF1 分量至IMF18 分量的分量頻率依次增大,數(shù)值量級依次減小。 在這18 個IMF分量中,IMF1 所占數(shù)量級最大、且與原始數(shù)據最為接近,IMF2 分量與IMF3 分量的數(shù)值量級屬于同級,IMF4 分量至IMF18 分量的數(shù)值量級較一致。
2.2.2 FCBF-Informer
FCBF-Informer 的作用是篩選出與電力負荷高度相關的特征變量作為輸入變量后進行負荷預測,采用FCBF-Informer 進行負荷預測的具體步驟如下:
(1) 在經過NGO 算法對VMD 分解的IMF分量層數(shù)K及懲罰因子α的優(yōu)化步驟后,采用FCBF算法對多維特征變量進行篩選,篩選出與電力負荷高度相關的特征變量作為輸入變量。
(2) 將確定作為輸入變量的特征變量與各個IMF分量同時作為Informer 模型的輸入,對輸入變量進行歸一化處理后,再進行訓練和預測,得到各個IMF分量對應的預測值。
(3)對各個IMF分量的預測值進行反歸一化操作,將反歸一化操作后各個IMF分量預測值進行重構疊加得到最終的預測值,并將該值與原始數(shù)據進行對比分析。
經過FCBF 算法的處理,可以獲知,本文選用數(shù)據集的原始輸入特征變量與電力負荷相關程度由高到低依次為電價、露點溫度、干球溫度、濕球溫度、濕度以及星期(未計入時間點特征變量),并且星期特征變量相關性較小,所以本文選擇除去星期特征變量剩余的5 個特征變量作為Informer 模型的輸入變量。
在Informer 模型中,不同的超參數(shù)會對負荷預測的精度產生重大的影響。 經過多次實驗本文最終確定Informer 模型的編碼器、解碼器的輸入步長及層數(shù)等基本超參數(shù)設置,見表1。
表1 Informer 模型超參數(shù)設置Tab. 1 Setting of Informer model hyperparameters
3.2.1 組合模型實驗結果
為論證OVMD 及FCBF 算法引入到Informer 模型的可行性和有效性,在此將OVMD、FCBF 與Informer 進行了組合,構成不同組合預測模型進行預測。 性能指標見表2,實驗結果如圖3 所示。
表2 不同組合模型的性能評價指標Tab. 2 Performance evaluation indexes of different combination models
圖3 不同組合預測模型結果Fig. 3 Results of different combination prediction models
FCBF-Informer 及OVMD-Informer 兩種模型在3 個性能評價指標上均有不同程度上的降低。 在Informer 模型中引入FCBF 算法,F(xiàn)CBF 算法可以在眾多特征變量中篩選出與預測變量相關性較大的特征變量,研究人員可以自主地選擇輸入特征變量,避免了特征變量間的冗余,在降低計算時間的同時,提高了收斂速度。 Informer 模型中引入OVMD 分解,OVMD 分解可以降低原始數(shù)據的非線性、非平穩(wěn)性,減少了波峰和波谷的出現(xiàn)次數(shù),提高原始數(shù)據的質量。
同時,相比于 Informer、 FCBF - Informer 及OVMD-Informer 三種模型,本文模型進一步降代了3 個性能評價指標,本文模型預測結果的性能評價指標MAE為 48.21,MAPE為 0.58%,RMSE為59.48。 該模型預測曲線擬合程度在一定程度上得到加強,尤其是在預測波峰和波谷到來的時間點,其預測結果與真實值更為接近。 充分論證了在Informer 模型基礎上引入OVMD 分解及FCBF 算法的可行性和有效性。
3.2.2 不同模型實驗結果
為了進一步論證本文模型的可行性和有效性,在此選用了BP、LSTM、CNN-LSTM、CNN-BiLSTM等模型與本文模型進行了對比實驗。 為了保障實驗的客觀性,對比實驗模型中超參數(shù)的設置盡量與本文模型保持相同或者一致(如輸入步長、丟棄率、批量大小等),若對比模型中存在本文模型沒有的超參數(shù),而其他模型擁有同類超參數(shù)也應該相同或者一致(如隱藏層的層數(shù)、神經元個數(shù)等)。 性能指標見表3,實驗結果如圖4 所示。
表3 不同模型的性能評價指標Tab. 3 Performance evaluation indexes of different models
圖4 不同模型預測結果Fig. 4 Different models predict results
由所列不同模型的性能評價指標可知,與BP、LSTM、CNN-LSTM、CNN-BiLSTM 這類單一預測模型相比,Informer 模型有著不錯的預測效果,這是因其在時域上對非平穩(wěn)性、非線性負荷數(shù)據擁有更為敏感的感知能力,同時在捕捉歷史負荷數(shù)據輸入特征變量及特征變量間的潛在信息更為充分,能夠對輸入輸出之間進行更為高效的擬合,因而該模型的預測性能更為優(yōu)異。 不過,單一的預測模型對歷史負荷數(shù)據集質量要求苛刻,在對非平穩(wěn)性、非線性的歷史負荷數(shù)據進行預測時得到的結果精度較差。
組合模型可以在保障歷史負荷數(shù)據的時序性基礎上提高其平穩(wěn)性,同時對輸入特征變量進行篩選,進行多變量對單變量的負荷預測。 由此可見,組合模型預測相比單一預測模型有著更為滿意的結果。
為了解決現(xiàn)有預測模型優(yōu)化方法不夠理想、預測精度不高的問題,本文提出了一種基于NGOVMD-FCBF-Informer 的電力負荷組合預測模型,經過仿真對比實驗論證,得出了如下結論:
(1)文中利用NGO 算法對VMD 分解的IMF 分量層數(shù)K及懲罰因子α尋優(yōu),經過OVMD 處理后的數(shù)據相較于原始數(shù)據,在很大程度上其非線性、非平穩(wěn)性得以降低,有利于Informer 模型更好地進行訓練。
(2)文中考慮了氣象條件等影響因素,同時采用FCBF 算法對影響負荷的特征變量進行篩選作為預測模型輸入,不僅可以減少部分工作量,加快算法的計算速度,同時對預測模型的精度有一定的改善。
(3)根據實驗結果顯示,本文提出的預測模型克服了單一模型的局限性,有效地解決了現(xiàn)有方法預測結果精度不高的問題,可以為電力系統(tǒng)的日常工作、安排提供有益的理論指導參考,具有極其重要的意義。