摘 要:準確地預測用電量有助于電力氣象服務工作的開展,并可保障電力系統(tǒng)經濟、安全、可靠運行?;跂|至縣2014—2018年日用電量數據,結合氣象要素和日期因素,通過相關性分析篩選要素,并利用長短期記憶(LSTM)神經網絡開展多時次用電量預測。利用人體舒適度指數、平均地面溫度、最高氣溫、最低氣溫、平均水汽壓、日期因素和用電量序列數據構建用電量預測LSTM模型,該模型利用過去24日數據,對未來1、3、6日日用電量進行預測,其標準化均方根誤差(CVRMSE)分別為0.06、0.09和0.11,相對誤差(RE)分別為0.27、0.26、0.27,決定系數(R2)分別為0.56、0.22、0.12。結果證實了基于LSTM神經網絡預測短期用電量的可行性,可為電力部門開展需求側管理、提高能源存儲運營水平提供技術支持。
關鍵詞:電力氣象服務;長短期記憶神經網絡;多時次預測;日用電量
中圖分類號:TM715 文獻標志碼:B 文章編號:2095–3305(2024)07–0-03
隨著智慧電網的發(fā)展,用電量的精準預測能幫助供電公司更好地進行負載規(guī)劃,并減少過多的電能產量[1-2]。
準確的預測數據能讓公用設備提供商模擬和預測用電負載真實評估能源價格,從而維持生產和需求的平衡,減少生產損失,以及更好地規(guī)劃未來和設計負載。
當前,廣泛應用于預測用電量的模型主要有工程學模型和數據挖掘模型。隨著深度學習的發(fā)展,如何應用數據挖掘模型預測電力負荷受到廣泛重視。深度架構中的人工神經網絡(ANN)擅長捕捉大數據中復雜的非線性特征,因而在相關研究中尤為重要[3]。深度學習中大量的隱藏層賦予了其通過分析輸入輸出之間的關系學習復雜數據的特征,因此探究如何結合先進的神經網絡算法和相關要素預測用電量成為近些年的研究熱點。
利用先進的神經網絡模型結合氣象數據等因子提高用電量預測準確率,對電力氣象服務的開展和保障電力系統(tǒng)經濟、安全、可靠運行具有重要意義[4-5]。
1 數據與方法
用電量數據來源于國網池州市供電公司所提供的東至縣用電量數據。氣象因子選用平均氣溫、最高和最低氣溫、降雨量、蒸發(fā)量、最大風速、平均地面溫度、日照時數等,數據來源于CIMISS,數據時段為2014年1月1日—2018年12月31日。
1.1 數據預處理
神經網絡模型的訓練表現和預測準確率十分依賴數據質量,因此數據預處理是一項重要工作。
用電量數據為東至縣供電公司整理后的數據,數據質量較高且不存在缺測的情況。東至站氣象觀測數據中降水量少量數據缺測,蒸發(fā)量和日照時數數據存在連續(xù)缺測,利用東至站2017年同時段相對濕度、氣溫日較差、風速對蒸發(fā)量建模,再利用該模型結合2018年的相對濕度、氣溫日較差、風速參數計算缺測的蒸發(fā)量數據。經分析,模型如下:
y=4.301-0.048x1+0.025x2+0.181x3(1)
式(1)中,y為蒸發(fā)量,x1、x2、x3分別為相對濕度、氣溫日較差、風速。對于日照時數的缺測值修補,以2017—2018年該時段岳陽、株洲站日照時數為自變量,
對東至站該時段日照時數建模如下:
y=0.353x1+0.452x2+0.779(2)
式(2)中,y為東至站日照時數,x1為岳陽站日照時數,x2為株洲站日照時數。將缺測時段的岳陽、株洲站日照時數代入式(2),得到缺測時段東至站日照時數。降水量及其他氣象因子的少量缺測數據采用前后平均值進行插補。
1.2 長短期記憶模型的構建
長短期記憶神經網絡是循環(huán)神經網絡的一種變體,引入自循環(huán)使得梯度長時間持續(xù)流動[6-8]。通過輸入門、遺忘門、輸出門(公式如下)控制自循環(huán)權重,累積的時間尺度可以因輸入序列而改變。
ft=σ(Wf·[hf-1xt]+bf)(3)
it=σ(Wi·[hf-1xt]+bi)(4)
Ct=tan h(Wc·[hf-1xt]+bc)(5)
Ct=ft⊙Ct-1+it⊙Ct(6)
Ot=σ(Wo·[ht-1xt]+bo)(7)
ht=Ot⊙tan h(Ct)(8)
整理后的氣象參數、日期因素、用電量序列數據共1 826行,為防止訓練過程中的梯度爆炸,需要將參數分別進行歸一化處理。
(9)
式(9)中,xi為各項參數,xmin為該項參數最小值,xmax為該項參數最大值。各項參數歸一化后取值范圍均為[0,1]。
(10)
式(10)中,yi為驗證集日用電量真實值,為根據當輪訓練模型計算的驗證集日用電量計算值,m為驗證集數據量。連續(xù)的時間序列數據會對模型訓練產生影響,因此每輪訓練集采用隨機抽樣的方式構建,訓練前在訓練集中隨機抽取500組連續(xù)64條數據集,每個數據集中包括前24日的氣象參數、日期因素和用電量數據,預測下1、3、6日的用電量數值。訓練后的驗證階段同樣采用隨機抽取的方式進行評估。
1.3 評價指標
模型預測值與真實值間差異的評價基于以下3種指標。
標準化均方根誤差:
(11)
相對誤差:
(12)
決定系數:
(13)
式(11)~(13)中,為日用電量的模型預測值(kW·h),
yi為其真實值(kW·h),y為日用電量的平均值(kW·h),
N為觀測次數。CV(RMSE)為均方根誤差的標準化值,該數值越小,表示預測模型的精度越高;RE為相對誤差值(%),可用于反映模型預測的可信程度;R2為決定系數,可用于判斷模型的解釋力。
該研究數據預處理、分析、模型訓練、效果評估及部分作圖過程均在R語言(版本3.6.0)中完成。LSTM模型的建立基于keras深度學習框架,作圖利用了“ggplot2”包。
2 結果與分析
2.1 日用電量與各要素之間的相關性分析
圖1為日用電量與日起因子之間的關系,可以看出,工作日用電量相對于節(jié)假日會有少許增加。
圖2為日用電量與氣象要素之間的關系,因計算人體舒適度指數時使用了平均氣溫、相對濕度和風速數據,故此3種氣象要素不再單獨驗證與日用電量之間的相關性。由圖2可知,人體舒適度指數、平均地面溫度、最高氣溫、最低氣溫、平均水汽壓與日用電量間有明顯的二次曲線關系,平均氣壓與其相關關系不明朗,但也有二期曲線關系的趨勢。其他氣象因子如風速、降水量、蒸發(fā)量、日照時數與日用電量間均無明顯相關性。
2.2 基于多要素的日用電量LSTM預測
整理數據得出,用電量在2014—2018年逐年波動增加。較好的神經網絡模型結構可以在較少的計算量下得到更好的預測效率。經過多輪測試,最終得出7層模型結構,激活函數為“ReLU”,優(yōu)化器為“ADAM”,最大訓練輪數設置為100輪。
LSTM模型在1日尺度上的預測值十分準確,在較長的時間尺度上也具有較高的精度。圖3為1、3、6日下的LSTM模型預測值與真實值的對比情況,可以看出,1日預測步長下預測值與真實值基本一致,3日和6日步長下也緊貼著y=x線。
3 結論與討論
該研究在相關分析的基礎上精減參數類型,并基于氣象要素、日期因素和日用電量序列數據利用LSTM模型訓練并預測多時次動態(tài)日用電量參數,取得了較好的預測效果。分析得出,除平均氣壓外,其他因子對日用電量的影響效果明顯。由用電量LSTM預測模型的預測結果可證實該種訓練和預測方式可實現準確率較高的短期日用電量預測。
神經網絡模型的成功應用依賴于準確的各流程算法和足量的時間序列數據,該研究應用的算法均經過仔細檢驗,可確保準確無誤,但受數據量的限制,無法試驗算法在更長時間尺度上的預測能力。
精準的用電量預測對于電力運營管理至關重要[9-10]。
該研究利用相關分析方法,所篩選的氣象要素、日期因素、用電量序列數據,并結合LSTM模型成功預測東至縣短期日用電量,其結果可為電力部門開展需求側管理、提高能源存儲運營水平、減輕能源短缺威脅,最終實現智慧電網提供數據和技術支持。
參考文獻
[1] 王增平,趙兵,紀維佳,等.基于GRU-NN模型的短期負荷預測方法[J].電力系統(tǒng)自動化,2019,43(5):53-58.
[2] 唐平雅.電力需求預測方法和能源需求預測模型探討[J].中國電力,2000(4):32-34,52.
[3] 孫靜,阮本清,蔣任飛.寧夏引黃灌區(qū)參考作物蒸發(fā)蒸騰量及其氣候影響因子的研究[J].灌溉排水學報,2006(1):54 -57,61.
[4] 易禮秋.基于長短期記憶神經網絡變權綜合的短期電力負荷預測[D].烏魯木齊:新疆財經大學,2021.
[5] 邱凱旋,李佳.基于貝葉斯優(yōu)化和長短期記憶神經網絡(BO-LSTM)的短期電力負荷預測[J].電力學報,2022,37(5): 367-373.
[6] 陳勝,劉鵬飛,王平,等.基于LSTM人工神經網絡的電力系統(tǒng)負荷預測方法[J].沈陽工業(yè)大學學報,2024,46(1):66-71.
[7] 王子樂,王子謀,蔡瑩,等.基于長短期記憶神經網絡組合算法的短期電力負荷預測[J].現代電力,2023,40(2):201-209.
[8] 姜凡.基于長短期記憶神經網絡的短期電力負荷預測研究[D].武漢:湖北工業(yè)大學,2021.
[9] 吳翔宇,荀超,肖芬,等.基于RF變量選擇與LSTM回歸的長期用電量預測模型[J].電氣傳動,2023,53(5):71-76.
[10] 蔡翔,朱莉.改進深度神經網絡的用戶用電量預測方法[J].湖北工業(yè)大學學報,2023,38(1):15-20.