秦 川,丁鵬飛,劉 波,鞠 平
(1. 河海大學能源與電氣學院,江蘇省 南京市 211100;2. 國網(wǎng)江蘇省電力有限公司淮安供電分公司,江蘇省 淮安市 223002)
負荷預測對于電力系統(tǒng)的規(guī)劃運行、管理運營、市場交易等方面具有重要意義。在日負荷曲線中,峰值一般是電力部門最為關心的數(shù)據(jù)[1]。特別是在夏季,負荷功率幅值處于一年中的高位水平,日峰荷與電網(wǎng)安全穩(wěn)定運行之間具有密切聯(lián)系[2]。為此,許多學者對夏季日峰荷展開研究,尤其關注峰荷與溫度之間的關系[3-5]。
夏季溫度對負荷的影響具有累積效應,使得負荷與溫度之間呈現(xiàn)一種復雜的非線性關系,對預測造成不利影響[6-7]。溫度累積效應是指預測日負荷不僅受預測日溫度影響,同時也受到預測日相鄰前幾日溫度的影響[8-10],例如,在夏季連續(xù)多日高溫后溫度突然降低并不會導致負荷驟然下降。導致這一現(xiàn)象的原因在于人體對溫度的感知滯后于外界溫度的變化以及人類生活行為的慣性。不少學者針對累積效應提出了溫度修正公式[6,8-9,11],以加權方式將前幾日的溫度與預測日溫度結合起來計算修正溫度,目標函數(shù)通常為最大化負荷與修正溫度間的線性相關性。除了溫度,相對濕度同樣對負荷具有一定的影響[12],因此在對累積效應修正前,普遍會先基于相對濕度對溫度進行一次修正。研究結果表明,溫度修正有助于改進預測效果。文獻[13]依據(jù)峰荷與累積效應修正溫度的擬合曲線獲得不同日歷屬性下峰荷的典型差值,并對其標幺化,即將傳統(tǒng)的獨熱編碼日歷屬性轉換為與峰荷值相對應的標幺值,削弱了溫度累積效應對日期類型系數(shù)的影響。此外,文獻[14-15]在多元線性回歸基準預測模型[16]的基礎上,前者根據(jù)近因原理引入滯后溫度和移動平均溫度體現(xiàn)累積效應,后者進一步引入了相對濕度變量以改進預測效果。
綜上所述,對于累積效應的處理,目前的主流方法為溫度修正。溫度修正公式量化了相鄰前幾日溫度對預測日溫度的影響,事實上累積效應是一種復雜的非線性關系,難以被直接量化,修正公式本質上類似于一種簡化方法,且公式的形式依賴于人工經(jīng)驗來確定。與此同時,深度學習自2006 年被Hinton等人提出以來,在當前大數(shù)據(jù)的背景下一直處于極高的熱度,能夠挖掘難以發(fā)現(xiàn)的深層特征或反映某些難以用明確統(tǒng)一的數(shù)學模型描述的復雜關系,特別是長短期記憶(long short-term memory,LSTM)網(wǎng)絡十分適合于處理當前信息與歷史信息之間的關系[17-21],而累積效應正是歷史溫度序列對負荷的作用。因此,可考慮基于LSTM 網(wǎng)絡來反映累積效應。
為此,本文提出了基于LSTM 網(wǎng)絡的特征解耦峰荷預測模型。模型包含時間、氣象、歷史峰荷3 個輸入分支,從結構上對輸入特征實現(xiàn)解耦處理。其中,氣象分支僅以累積效應相關因素為輸入,以有效反映累積效應。然后,簡略介紹基于溫度修正計及累積效應的常規(guī)方法。最后,通過實例分析,驗證了特征解耦模型更適合于計及累積效應的峰荷預測。
簡單來說,要計及累積效應需要將歷史氣象特征作為模型輸入。除了溫度和相對濕度等氣象特征,歷史負荷特征、時間類特征同樣需要作為預測輸入。按照常規(guī)的模型結構來說,這些特征將會組成向量輸入模型,盡管這些特征的性質完全不同,但對于模型來說都只是數(shù)字而已,僅僅數(shù)值有所不同,模型經(jīng)過訓練能夠感知輸入向量中不同維度間的差異,同時也存在以下問題:在模型訓練過程中,氣象特征與其余特征混在一起相互作用,模型無法單獨學習氣象特征,進而會影響其對累積效應的學習。因此,模型結構設計的思想是模型能夠獨立處理氣象數(shù)據(jù),接著將處理結果與其余因素組合進行二次處理,即從結構上將累積效應的學習過程獨立出來。
顯然,上述思想對模型結構的靈活性要求很高,神經(jīng)網(wǎng)絡恰好能滿足該要求,同時神經(jīng)網(wǎng)絡中的LSTM 網(wǎng)絡具有很強的時序處理能力。為此,建立具有多個輸入分支的神經(jīng)網(wǎng)絡模型,其結構如圖1所示,圖中不同類型的因素在模型結構上實現(xiàn)了解耦,因此可稱該模型為特征解耦模型,顯然,其具有3 個分支。
圖1 特征解耦模型的結構Fig.1 Structure of feature decoupling model
1)氣象分支:將每日的溫度與相對濕度組成二維特征向量,連接起來構成氣象特征序列,將其輸入LSTM 網(wǎng)絡隱藏層,后接一個一維全連接層,即為該分支的輸出。由前述可知,累積效應一般需要考慮前3 d 氣象因素的影響,加上預測日的氣象因素合計需要考慮4 d,因此將LSTM 網(wǎng)絡隱藏層的步長設為4。
2)負荷分支:與氣象分支類似,每日峰荷特征連接起來構成負荷特征序列,將其輸入LSTM 網(wǎng)絡隱藏層,后接一維全連接層。考慮前一個星期的峰荷影響,因此將該LSTM 網(wǎng)絡隱藏層的步長設為7。
3)時間分支:時間特征包括年份、月份、日期類型,不同日的時間特征之間沒有關聯(lián),不需要再設置LSTM 網(wǎng)絡隱藏層,隱藏層采用全連接層即可。
然后,將3 個分支進行拼接,再輸入全連接層,最終產(chǎn)生模型輸出。
由圖1 可知,各分支在連接以前獨立運行,即特征解耦模型對不同類型的輸入特征分別進行處理,有利于模型更好地學習負荷與相應類型特征間的關系。就氣象分支而言,該分支對累積效應涉及的特征進行單獨處理,有利于對累積效應的深入學習。
從結構角度來看,這與模型融合有些類似,若將模型某一分支的輸出引出,該分支即相當于一個元模型,而分支后連接的全連接層相當于融合模型[22-23]。不同的是,模型融合的元模型分別獨立進行訓練;特征解耦模型的分支部分是無法獨立訓練的,原因在于,對于各分支而言,其輸入特征是已知的,但其輸出標簽是不可獲知的。分支的訓練依賴于整個模型的訓練,當模型訓練完成后,分支即訓練完成。換而言之,特征解耦模型能將其每個分支作為一個模型,即由一個整體模型獲得多個個體模型。
從學習方式角度來看,特征解耦模型的訓練屬于有監(jiān)督學習,而其分支的訓練類似于無監(jiān)督學習,由此也體現(xiàn)了自適應性,而且分支會產(chǎn)生什么樣的輸出在模型訓練完成前是不可知的?;贚STM網(wǎng)絡的氣象分支以歷史溫度與相對濕度為輸入,該分支的輸出可認為是累積效應的一種映射,由此保證模型在峰荷預測時能夠有效計及累積效應,進而提升預測效果。
一般來說,網(wǎng)絡隱藏層數(shù)越多,模型對復雜關系的學習能力越強,但同時伴隨著訓練時間的延長,而且過分復雜的模型需要規(guī)模足夠大的數(shù)據(jù)集作為支撐,且容易出現(xiàn)過擬合,因此要合理控制模型復雜度。一方面,峰荷數(shù)據(jù)集規(guī)模通常較??;另一方面,特征解耦模型將不同特征區(qū)別處理,對于任一分支而言,輸入特征類型單一且維數(shù)較少,對復雜度要求低。因此,設置LSTM 網(wǎng)絡隱藏層的層數(shù)默認為2,神經(jīng)元個數(shù)默認設為128,具體地應依據(jù)訓練情況進行合理調(diào)參。
為了驗證特征解耦模型的有效性,采用溫度修正方法與其進行對比。下文對溫度修正方法進行簡略介紹。
首先,采用溫濕指數(shù)[8]考慮相對濕度的影響,如式(1)所示。
式中:H為溫濕指數(shù);T為溫度;R為相對濕度;各系數(shù)采用文獻[24]中提出的系數(shù),c1=-42.38,c2=2.049,c3=10.14,c4=-0.224 8,c5=-6.838×10-3,c6=-5.482×10-2,c7=1.228×10-3,c8=8.528×10-4,c9=-1.99×10-6。只有當空氣溫度較高或較低時,相對濕度的影響較大,因此使用溫濕指數(shù)修正應滿足T>27 ℃,R>40%。如果不滿足上述條件,則不進行修正。
然后,依據(jù)累積效應對溫濕指數(shù)進行二次修正[25],如式(2)所示。同時,為保證修正結果在合理范圍內(nèi)且滿足“近大遠小”的原則,修正時應滿足的約束條件如式(3)所示。
式中:T′為當天的修正溫度;H0為當天的溫濕指數(shù);Hi為i天前的溫濕指數(shù);k0、k1、k2、k3為相應的修正系數(shù),具體數(shù)值采用遺傳算法對數(shù)據(jù)集進行辨識獲得。辨識的目標函數(shù)如式(4)所示,r(T′,P)表示修正溫度T′與負荷功率P的Pearson 相關系數(shù),約束條件參照式(3)。
基于2 個地級城市的實際數(shù)據(jù)集對比溫度修正與特征解耦模型應用于夏季峰荷預測的效果。訓練集為2014 年至2017 年夏季數(shù)據(jù),測試集為2018 年夏季數(shù)據(jù),迭代多步預測一個月的日峰荷變化,即多步預測的預測步數(shù)為31。所有程序基于Python 編程實現(xiàn)。評價指標采用平均絕對百分比誤差(mean absolute percentage error,MAPE)eMAPE,見式(5)。
式中:n為預測天數(shù);P′i為第i天的預測負荷;Pi為第i天的實際負荷。
對峰荷與氣象數(shù)據(jù)分別進行最大、最小歸一化處理,對年份、月份、星期、節(jié)假日等時間類離散型數(shù)據(jù)進行獨熱編碼。對于氣象數(shù)據(jù),計算峰荷與氣象因素間的相關系數(shù),如附錄A 表A1 所示,選擇采用平均溫度、平均相對濕度;星期數(shù)據(jù)如附錄A 表A2所示,按星期一至五、星期六、星期日等3 類進行編碼。
采用控制變量法確定特征解耦模型的結構,在保證模型學習曲線穩(wěn)定收斂的前提下,以驗證損失最小化為目標逐步調(diào)整模型中網(wǎng)絡隱藏層的層數(shù)與神經(jīng)元個數(shù),其中層數(shù)可調(diào)范圍為1 至4,神經(jīng)元個數(shù)可調(diào)范圍為2 至128(調(diào)節(jié)步長為2)。經(jīng)過調(diào)參,特征解耦模型的網(wǎng)絡隱藏層參數(shù)如表1 所示,模型的詳細結構即模型所有網(wǎng)絡隱藏層的輸入輸出情況如附錄B 圖B1 所示。為有效緩解梯度消失問題,設置所有LSTM 網(wǎng)絡第1 層隱藏層的激活函數(shù)為softsign,其余均為默認的線性函數(shù)linear。同時,設置模型的損失函數(shù)為均方誤差函數(shù),優(yōu)化器為RMSProp,其學習率設為0.001。設置最大迭代次數(shù)為1 000。為防止過擬合,附加了早停規(guī)則:當驗證損失達到10 次未下降時,則停止迭代。
表1 特征解耦模型網(wǎng)絡隱藏層參數(shù)Table 1 Parameters of hidden layers of feature decoupling model network
模型的負荷分支LSTM 網(wǎng)絡隱藏層的時間步長由計及的歷史負荷天數(shù)確定為7,氣象分支LSTM 網(wǎng)絡隱藏層的時間步長由累積效應計及天數(shù)(含預測日)確定為4,在此處進行相關驗證,嘗試計及不同天數(shù)的效果,具體情況如附錄C 圖C1 和圖C2 所示。顯然,當歷史負荷計及天數(shù)為7、累積效應計及天數(shù)為4 時驗證損失最小,證明了其合理性。
基于2 個地級城市2014—2017 年的夏季數(shù)據(jù),首先計算溫濕指數(shù),其次基于遺傳算法進行優(yōu)化,結果如表2 所示。兩地區(qū)的修正公式參數(shù)辨識結果十分接近,說明兩地區(qū)的負荷與氣象的相關情況也較為接近。
表2 遺傳算法優(yōu)化結果Table 2 Optimization results of genetic algorithm
為了驗證所提特征解耦模型效果,對兩地2018 年7 月和8 月的日峰荷分別進行迭代多步預測。對比之一是分別采用原始溫度與修正溫度,引入支持向量機(SVM)、極限梯度提升(XGBoost)、常規(guī)的LSTM 網(wǎng)絡模型進行峰荷預測,并將預測結果與特征解耦模型進行對比。上述模型參數(shù)等信息詳見附錄D。預測結果如表3 所示。
表3 采用原始溫度與修正溫度下的預測誤差Table 3 Forecasting error with original temperature and corrected temperature
根據(jù)表3 得到相關結論如下。
1)對于SVM、XGBoost、LSTM 網(wǎng)絡模型,采用修正溫度后誤差均有所下降,以城市1 為例,7 月誤差平均降低了7.94%,8 月誤差平均降低了11.75%,驗證了采用修正公式計及累積效應的有效性。
2)相較于基于修正溫度獲得的最小誤差,特征解耦模型的預測誤差平均低了22.4%,一方面直接說明了該模型的有效性,另一方面驗證了采用該方法計及累積效應的可行性。以城市1 峰荷為例,特征解耦模型的預測結果與真實值的對比如圖2(a)所示,預測值曲線與真實值曲線在大多數(shù)日期的重合度很高,直觀地驗證了該模型的可行性。
3)對于特征解耦模型,其學習曲線詳見附錄C圖C3,訓練損失與驗證損失較為穩(wěn)定地收斂到接近0,說明該模型的預測結果是可信的。此外,預測誤差變化如圖2(b)所示,預測誤差較為均勻地分布于0 值兩側,未出現(xiàn)因迭代預測導致的誤差累積增長。
圖2 特征解耦模型的預測情況Fig.2 Forecasting of feature decoupling model
為了進一步驗證預測效果,對比之二采用文獻[8]所述溫度修正公式,并利用常規(guī)LSTM 網(wǎng)絡模型(下文簡稱“LSTM-修正溫度2”)進行峰荷預測;采用文獻[13-14]所述模型(下文簡稱“近因模型”“近因-濕度模型”)進行峰荷預測。預測結果對比如表4 所示。
表4 不同預測模型下的預測誤差Table 4 Forecasting error with different forecasting models
從表4 可以看出,與上述幾種模型相對比,本文所提特征解耦模型的預測效果最優(yōu)。
以城市1 為例,對特征解耦模型的輸出進行分析。特征解耦模型的氣象分支以氣象特征序列為輸入,旨在反映累積效應。測試集上氣象分支輸出與實際峰荷的對比如圖3(a)所示,分支輸出的變化趨勢與實際峰荷的變化趨勢大體一致,說明氣象分支的輸出對于峰荷預測具有重要意義。為計及累積效應,氣象分支的輸入為累積效應的相關因素,具體為預測日及其前3 d 的溫度與相對濕度,其中顯然預測日的溫度與相對濕度最為重要。為便于探索氣象分支對溫度、相對濕度的處理情況,繪制訓練集上氣象分支輸出與溫度、相對濕度的分布如圖3 所示。從圖中可以看出,分支輸出與預測日溫度間的關系類似于sigmoid 函數(shù),當溫度較為舒適或溫度很高時,輸出變化趨勢放緩;分支輸出與相對濕度間也呈現(xiàn)了一定的規(guī)律性。結合前述,特征解耦模型的預測效果優(yōu)于采用修正溫度的各個模型,說明了氣象分支對累積效應的相關因素進行了有效處理,亦說明了特征解耦模型相較于修正公式更適合于計及累積效應的峰荷預測。
圖3 氣象分支輸出情況分析Fig.3 Analysis on output of meteorology branch
時間分支的輸出如圖4 所示,時間分支輸出準確反映了月份的變化,同時準確地區(qū)分出了星期一至星期五為一類,星期六與星期日又各為一類,說明了時間分支對時間數(shù)據(jù)的處理是合理有效的。
圖4 時間分支的輸出情況Fig.4 Output of time branch
負荷分支的輸出與實際峰荷的對比如圖5 所示,分支輸出較好地反映了峰荷變化的趨勢,且存在為期1 d 的滯后性,這說明在負荷分支計及的歷史負荷中,前一日的峰荷起著最為重要的作用。同時,8 月的輸出變化趨勢與實際峰荷變化趨勢的相似程度不如7 月,判斷這可能是導致8 月的預測誤差相較于7 月更大的重要原因。綜上所述,各分支的輸出均呈現(xiàn)合理的變化規(guī)律,進一步驗證了模型的有效性。
圖5 負荷分支的輸出情況Fig.5 Output of load branch
近年來極端氣象多發(fā),高溫數(shù)據(jù)存在超出歷史記錄的可能。在缺乏歷史峰荷樣本數(shù)據(jù)的場景下,可從以下兩方面分析驗證特征解耦模型的預測能力。
1)根據(jù)圖3(b)可以看出,氣象分支輸出與預測日平均溫度間呈現(xiàn)出類似于sigmoid 函數(shù)的規(guī)律,可見當出現(xiàn)極端高溫天氣時,峰荷功率也會逐漸出現(xiàn)飽和。
2)選取2018 年7 月22 日城市1 數(shù)據(jù)(測試集),手動修改當日平均溫度并進行預測,特征解耦模型預測結果如表5 所示。從表中可以看出,隨著平均溫度均勻攀升,模型預測峰荷攀升放緩。這說明在應對高溫氣象時,模型可以預測峰荷攀升情況,而攀升放緩也符合前述峰荷逐漸飽和的分析。
表5 極端高溫情況下特征解耦模型預測結果Table 5 Forecasting results of feature decoupling model under extreme high temperature
本文提出了一種計及氣象累積效應的特征解耦峰荷預測模型,其包含時間、氣象、歷史峰荷3 個輸入分支,從結構上對輸入特征實現(xiàn)解耦處理。其中,基于LSTM 網(wǎng)絡的氣象分支以歷史氣象數(shù)據(jù)為輸入,從而保證模型在峰荷預測時能夠有效計及累積效應,進而提升預測效果。
采用實際的負荷數(shù)據(jù)進行夏季峰荷預測。結果表明,相較于溫度修正等常規(guī)方法,特征解耦模型取得了更佳的峰荷預測效果,而且特征解耦模型各分支的輸出均具有顯著的規(guī)律性,從而驗證了該模型的有效性。后續(xù)工作將進一步分析研究分支輸出的物理意義,從而為氣象敏感負荷估算等提供依據(jù)。
附錄見本刊網(wǎng)絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡全文。