趙海波,相志軍,肖林松
基于異構(gòu)數(shù)據(jù)的電力短期負(fù)荷大數(shù)據(jù)預(yù)測方案
趙海波1,相志軍2,肖林松1
(1.威勝信息技術(shù)股份技術(shù)有限公司,湖南 長沙 410205;2.中國電力技術(shù)裝備有限公司,北京 100052)
隨著多種可再生能源電力的接入,電力系統(tǒng)正在向更智能、更靈活、交互性更高的系統(tǒng)過渡。負(fù)荷預(yù)測,特別是針對單個(gè)電力客戶的短期負(fù)荷預(yù)測在未來電網(wǎng)規(guī)劃和運(yùn)行中發(fā)揮著越來越重要的作用。提出了一個(gè)基于異構(gòu)數(shù)據(jù)的電力短期負(fù)荷大數(shù)據(jù)預(yù)測方案,該方案收集來自智能電表和天氣預(yù)報(bào)的數(shù)據(jù),預(yù)處理后將其加載到非關(guān)系型數(shù)據(jù)庫中進(jìn)行存儲(chǔ)并做進(jìn)一步的異構(gòu)數(shù)據(jù)處理;設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)長短期記憶遞歸神經(jīng)網(wǎng)絡(luò)模型,用于確定負(fù)荷分布并預(yù)測未來24 h的住宅小區(qū)用電量;最后利用一個(gè)住宅小區(qū)的智能電表數(shù)據(jù)集對提出的短期負(fù)荷預(yù)測框架進(jìn)行了測試,并使用均方根誤差和平均絕對百分比誤差兩個(gè)指標(biāo),對比了預(yù)測模型與兩種經(jīng)典算法的性能,驗(yàn)證了所提模型的有效性。
短期負(fù)荷預(yù)測;長短期記憶網(wǎng)絡(luò);遞歸神經(jīng)網(wǎng)絡(luò);聚類;大數(shù)據(jù)
電力是當(dāng)今社會(huì)最重要的能源之一,收集利用歷史電力負(fù)荷數(shù)據(jù),挖掘其潛在價(jià)值,對于電網(wǎng)企業(yè)和人們的日常生活都具有重要意義。智能電網(wǎng)利用傳感和信息通信技術(shù)提高電網(wǎng)能源傳遞的效率、可靠性和安全性,智能計(jì)量的普及有利于電力負(fù)荷大數(shù)據(jù)的收集和分析處理,由此產(chǎn)生的一個(gè)好處是基于收集的歷史負(fù)荷海量數(shù)據(jù)預(yù)測下一個(gè)時(shí)期的電力需求,可以給發(fā)電控制和電網(wǎng)調(diào)度提供輔助決策依據(jù)。
短期負(fù)荷預(yù)測(short-term load forecasting,STLF)是電力系統(tǒng)需求響應(yīng)分析的基礎(chǔ),重要性不言而喻,其一直是新能源系統(tǒng)、微電網(wǎng)控制和電力大數(shù)據(jù)研究者關(guān)注的焦點(diǎn)[1-4]。就統(tǒng)計(jì)模型而言,時(shí)間序列建模用于捕捉電力負(fù)荷的時(shí)間序列特征,多元線性回歸利用年、周和日的季節(jié)性對每小時(shí)的能源需求進(jìn)行建模[5]。研究結(jié)果表明,相同信息的復(fù)雜特征導(dǎo)致預(yù)測準(zhǔn)確率較低,從而提出用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)對短期負(fù)荷進(jìn)行預(yù)測,以負(fù)荷和氣象信息為輸入,輸出目標(biāo)日的峰谷負(fù)荷,取得了良好的預(yù)測效果[6]。Oprea等[7]提出可擴(kuò)展大數(shù)據(jù)框架收集智能電表和天氣傳感器的數(shù)據(jù),實(shí)施并對比了幾種機(jī)器學(xué)習(xí)算法,以確定負(fù)荷曲線并預(yù)測未來24 h住宅建筑的用電量。王德文等[8]采用遺傳算法對灰色預(yù)測模型進(jìn)行優(yōu)化,并對中長期電力負(fù)荷進(jìn)行預(yù)測,結(jié)果表明,改進(jìn)后的模型具有較高的精度。
本文闡述了一個(gè)大數(shù)據(jù)預(yù)測方案,該方案從各種來源收集相關(guān)數(shù)據(jù),即來自低壓用電信息采集系統(tǒng)中智能電表、天氣預(yù)報(bào)的數(shù)據(jù),然后將其預(yù)處理并加載到非關(guān)系型(NoSQL)數(shù)據(jù)庫中,該數(shù)據(jù)庫能夠存儲(chǔ)各種數(shù)據(jù)格式的數(shù)據(jù),無須像傳統(tǒng)關(guān)系數(shù)據(jù)庫那樣進(jìn)行耗時(shí)耗力的數(shù)據(jù)規(guī)范化;然后,使用聚類算法識(shí)別對用戶電力需求有重大影響的一組關(guān)鍵特征,最后設(shè)計(jì)并訓(xùn)練提出的長短期記憶(long short-term memory,LSTM)預(yù)測模型,根據(jù)存儲(chǔ)在NoSQL數(shù)據(jù)庫中的數(shù)據(jù)預(yù)測未來24 h的電力負(fù)荷預(yù)測結(jié)果。
本文提出的方案通過LSTM建模電力需求和相關(guān)特征參量之間的關(guān)系來預(yù)測未來短期的電力需求。電力短期負(fù)荷預(yù)測的LSTM流程如圖1所示。
圖1 電力短期負(fù)荷預(yù)測的LSTM流程
依托記錄了公寓用電情況的可用數(shù)據(jù)集合,開發(fā)了3類與電力需求相關(guān)的特征變量,即歷史負(fù)荷數(shù)據(jù)、天氣數(shù)據(jù)和日歷信息;接著通過特征選擇刪除不太重要的特征,并降低維數(shù)和模型復(fù)雜度;最后使用所選擇的特征訓(xùn)練本文提出的LSTM預(yù)測模型。
大數(shù)據(jù)分析的挑戰(zhàn)之一是處理和分析來自不同來源的海量數(shù)據(jù)。住宅用戶的智能電表通常每隔15 min記錄和報(bào)告電力消耗數(shù)據(jù),包括以下信息:時(shí)間戳、電表ID、公寓ID、有功功率(用戶消耗的電能量)、無功功率和視在功率等。
天氣數(shù)據(jù)可從氣象局網(wǎng)站獲得,分辨率通常為1 h,包含溫度、風(fēng)速、風(fēng)向、相對濕度、能見度、云量、氣壓、降水強(qiáng)度和概率等。
智能儀表和氣象傳感器記錄的測量數(shù)據(jù)需要適當(dāng)?shù)尿?yàn)證、過濾和轉(zhuǎn)換,以對STLF具有價(jià)值并保證一致性。因此,對這些原始數(shù)據(jù)進(jìn)行預(yù)處理,并用插值法將丟失或損壞的值替換為以前時(shí)間間隔中最合適的值。從不同來源收集的異構(gòu)數(shù)據(jù)為不同格式和不同時(shí)間分辨率的半結(jié)構(gòu)化數(shù)據(jù),例如數(shù)據(jù)格式包括RAW、JSON、CSV等。數(shù)據(jù)處理和存儲(chǔ)的解決方案可以是具有強(qiáng)大搜索引擎的NoSQL數(shù)據(jù)庫,如MongoDB、Oracle、NoSQL[9]。
選用3類數(shù)據(jù),即從智能電表收集的歷史負(fù)荷數(shù)據(jù)、天氣數(shù)據(jù)和日歷信息,在每個(gè)類別中,有幾個(gè)特征對功耗的影響是不均勻的,因此需要分析每個(gè)特征的重要性,并選擇一組合適的特征在本文的預(yù)測模型中使用。
對于歷史負(fù)荷數(shù)據(jù),將消費(fèi)者分組到相關(guān)集群并獲得其負(fù)載概況,不同的消費(fèi)模式比總的聚合消費(fèi)更具可預(yù)測性。除了消費(fèi)數(shù)據(jù),還可以從網(wǎng)絡(luò)調(diào)查或問卷中提取和處理有用的見解。此外,負(fù)荷曲線通過強(qiáng)調(diào)其對峰值和非峰值的貢獻(xiàn),提供了對電力消耗結(jié)構(gòu)更準(zhǔn)確的觀點(diǎn)。因此,通過估計(jì)每個(gè)集群的用電量,可以減少預(yù)測誤差,提高STLF的性能。
天氣數(shù)據(jù)有很多屬性,需要應(yīng)用相關(guān)分析算法選擇影響用電量的最重要屬性。通過對不相關(guān)屬性進(jìn)行噪聲濾波,減少了輸入維數(shù)和后續(xù)計(jì)算時(shí)間,提高了精度。此外,考慮大功率電器的利用率在不同用戶間的巨大差異,需要對每個(gè)季節(jié)的用電量進(jìn)行聚類分析。
作為一種深度學(xué)習(xí)方法,LSTM通過使用大量的訓(xùn)練樣本,挖掘數(shù)據(jù)中包含的隱藏信息,實(shí)現(xiàn)了對高維函數(shù)的更多逼近,增強(qiáng)了基于多層非線性變換的建模能力。此外,LSTM擅長處理時(shí)間序列問題。而每個(gè)用戶的用電量本身就是一種時(shí)間序列,因此本文使用LSTM預(yù)測用電量。
LSTM的核心思想是一個(gè)存儲(chǔ)單元可以隨時(shí)間保持由各種門控單元控制的信息[10-11]。LSTM的實(shí)現(xiàn)結(jié)構(gòu)如圖2所示。各個(gè)門控單元的狀態(tài)基于當(dāng)前輸入和先前輸出來維持,通過引入輸入門控單元、輸出門控單元和遺忘門控單元來決定要遺棄的信息以及要傳遞的信息。輸入門控單元用于控制是否允許外部信息覆蓋當(dāng)前單元中的狀態(tài),遺忘門控單元允許LSTM重置其自身狀態(tài),輸出門控單元狀態(tài)決定是否影響其他單元。
圖2 LSTM的實(shí)現(xiàn)結(jié)構(gòu)
LSTM可以以多層方式工作,每層由多個(gè)單元組成,需要在模型的復(fù)雜度和計(jì)算效率之間進(jìn)行折中。模型越復(fù)雜,其性能可能越好,然而,這可能會(huì)導(dǎo)致過度擬合模型,該模型在訓(xùn)練集中表現(xiàn)得非常好,但無法適應(yīng)數(shù)據(jù)集的其他數(shù)據(jù)。同時(shí),過于復(fù)雜的模型將是一個(gè)低效的模型。
目前沒有明確的規(guī)則或標(biāo)準(zhǔn)程序來確定神經(jīng)元或?qū)拥臄?shù)量,算法的有效性取決于環(huán)境屬性,如訓(xùn)練集的大小、數(shù)據(jù)特征的數(shù)量、計(jì)算性能。一般來說,層的數(shù)量與神經(jīng)元的數(shù)量成反比,而大量的層可能會(huì)遇到梯度消失和過度擬合等問題。
在核心功能不變的前提下,為了簡化LSTM,引入了門控循環(huán)單元(gated recurrent unit,GRU)[12],GRU中重置單元[t]、更新單元[t]、激活單元[t]和遺忘單元[t]的計(jì)算方式分別如式(1)~式(4)所示。
通過不斷縮小LSTM輸出和實(shí)際訓(xùn)練樣本之間的差值,迭代調(diào)整所有權(quán)重系數(shù)和偏差,存儲(chǔ)和維護(hù)當(dāng)前時(shí)間步長的信息,從而在可接受的學(xué)習(xí)時(shí)長內(nèi)影響未來的LSTM模型輸出。
通過建立模型結(jié)構(gòu),并通過多次迭代對相應(yīng)的權(quán)重矩陣和初始參數(shù)進(jìn)行微調(diào),預(yù)測模型在其隱藏的存儲(chǔ)單元中可以獲得足夠的信息,從而能夠預(yù)測具有可接受偏差的未知負(fù)荷。
2.1.1 歷史負(fù)荷數(shù)據(jù)
作為樣本的歷史電力負(fù)荷數(shù)據(jù)來自石家莊市供電公司2021年電力用戶用電信息采集系統(tǒng)的原始文件,這些數(shù)據(jù)對應(yīng)于一個(gè)居住社區(qū)中的314個(gè)公寓用戶,用電數(shù)據(jù)每15 min采集一次,總共有10 000余萬條記錄,每條負(fù)荷記錄有3個(gè)主要屬性,分別是時(shí)間戳、公寓/電表ID和有功功率(單位為kW)。
然而,智能電表本地?cái)?shù)據(jù)采集采用高速電力線載波通信方式,在吞吐量和通信時(shí)延方面的不足導(dǎo)致大量數(shù)據(jù)不完整或者丟失。歷史采集數(shù)據(jù)的預(yù)處理規(guī)則是:如果電力負(fù)荷值超出邊界或者丟失,則使用線性插值法,調(diào)整負(fù)荷值為相鄰讀數(shù)值的平均值。此外,功耗數(shù)值以小時(shí)為分辨單位進(jìn)行轉(zhuǎn)換以適應(yīng)每小時(shí)的天氣數(shù)據(jù),這樣處理可將負(fù)荷數(shù)據(jù)丟失率從8.46%降至2.86%。
所用樣本中314個(gè)公寓用戶的個(gè)人日常生活和用電行為會(huì)有很大的不同,因此將用戶分割成不同的群體對于STLF至關(guān)重要。這里使用經(jīng)典的均值算法進(jìn)行分類[9]。給定一個(gè)參數(shù),該算法選取個(gè)中心并按歐氏距離將每個(gè)點(diǎn)分布到最近的中心,然后計(jì)算每個(gè)組的新中心,并迭代該過程,直到中心不再變化。最后,通過迭代分類運(yùn)算全年的負(fù)荷數(shù)據(jù)將消費(fèi)者分為5個(gè)聚類,分別為聚類0、聚類1、聚類2、聚類3和聚類4。5個(gè)聚類的占比如圖3所示,其中聚類1的用戶數(shù)量最多,聚類4次之。
圖3 5個(gè)聚類的占比
2.1.2 天氣數(shù)據(jù)
石家莊市位于中國河北省,該地區(qū)為暖溫帶半濕潤大陸性季風(fēng)氣候,四季分明,年平均氣溫為13.3℃;冬夏季長,春秋季短,冬季盛行西北風(fēng),天氣晴朗,氣候寒冷,月均氣溫可達(dá)-2.9℃;夏季炎熱多雨,月均氣溫可達(dá)26.5℃。
獲取的每小時(shí)天氣數(shù)據(jù)可用于模擬分析,如溫度、體感溫度氣壓、相對濕度、能見度、風(fēng)速、風(fēng)向、降水概率。為了區(qū)分相關(guān)性最大的氣象因素,使用單變量線性回歸檢驗(yàn)的SelectKBest和scikit-learn Python工具包中的Lasso正則化的LassoCV算法。天氣數(shù)據(jù)與電力負(fù)荷的相關(guān)性見表1,最后選擇了3個(gè)關(guān)鍵因素,即溫度、體感溫度和氣壓。
表1 天氣數(shù)據(jù)與電力負(fù)荷的相關(guān)性
2.1.3 日歷數(shù)據(jù)
觀察工作日(周一至周五)和周末(周六和周日)的用電情況差異,梳理出工作日(2021年12月8日)和周末(2021年12月12日)5個(gè)聚類的小時(shí)負(fù)荷總量,工作日與周末的電力負(fù)荷對比如圖4所示。與工作日相比,周末用電負(fù)荷明顯更高,用電高峰持續(xù)時(shí)間長,沒有明顯的中午和晚上兩個(gè)相對用電高峰期。推測出現(xiàn)上述趨勢的原因是大多數(shù)居民周末在家的時(shí)間更長,周末家庭電器的工作時(shí)間也更長。
考慮計(jì)算性能,本文的LSTM有250個(gè)神經(jīng)元,由于預(yù)測了5個(gè)聚類的負(fù)荷,因此在輸出層有5個(gè)神經(jīng)元。在神經(jīng)網(wǎng)絡(luò)中,激活函數(shù)是引導(dǎo)網(wǎng)絡(luò)通過訓(xùn)練集擬合過程的關(guān)鍵。激活函數(shù)有兩類:線性函數(shù)和非線性函數(shù),后者被應(yīng)用得更多。模型選用LSTM中傳統(tǒng)的兩種激活函數(shù),即S形函數(shù)和雙曲線正切函數(shù)。此外,機(jī)器學(xué)習(xí)中成本函數(shù)的作用是在訓(xùn)練階段評估實(shí)際值和預(yù)測值之間的差距,并使用反向傳播方法修改神經(jīng)元和神經(jīng)鏈的權(quán)重。反向傳播使用梯度下降法計(jì)算偏導(dǎo)數(shù)得出斜率,并修改權(quán)重。最常見的代價(jià)函數(shù)是均方誤差和交叉熵,分別適用于回歸問題和分類問題。本文研究的負(fù)荷預(yù)測本質(zhì)上是一個(gè)回歸問題,因此采用均方誤差作為模型的代價(jià)函數(shù)。
學(xué)習(xí)率參數(shù)對于機(jī)器學(xué)習(xí)過程有非常重要的意義,學(xué)習(xí)率和梯度下降之間有很強(qiáng)的相關(guān)性。每次執(zhí)行梯度下降時(shí),學(xué)習(xí)速率可以確定步長。大的學(xué)習(xí)率沒有適合的、滿意的解決方案,而小的學(xué)習(xí)率會(huì)導(dǎo)致很長的訓(xùn)練時(shí)間。
圖4 工作日與周末的電力負(fù)荷對比
在本文所提模型中,學(xué)習(xí)率最初設(shè)置為傳統(tǒng)缺省值0.1,并通過每輪減少10%進(jìn)行迭代以獲得更好的錯(cuò)誤值。通過實(shí)驗(yàn),模型中的學(xué)習(xí)率選擇設(shè)置為0.001。另外,過擬合問題在機(jī)器學(xué)習(xí)過程中比較突出,隨著訓(xùn)練集的誤差越來越小,驗(yàn)證集的誤差則越來越大。常用的訓(xùn)練方法有早期停止和中途放棄兩種,本文模型選用直接的早期停止法,即在訓(xùn)練集和驗(yàn)證集之間存在明顯差異之前停止訓(xùn)練過程,以提高訓(xùn)練效率。
使用本文模型、多元線性回歸和BP神經(jīng)網(wǎng)絡(luò)3種模型預(yù)測目標(biāo)社區(qū)的短期負(fù)荷。首先針對每一個(gè)聚類進(jìn)行預(yù)測計(jì)算,得出每個(gè)聚類的小時(shí)負(fù)荷數(shù)值,將24個(gè)預(yù)測小時(shí)值相加得到一日的負(fù)荷用電量。同樣,將5個(gè)聚類的預(yù)測值相加,得到整個(gè)社區(qū)的總體負(fù)荷用電量。
圖5 聚類1的工作日負(fù)荷預(yù)測結(jié)果
聚類1的工作日負(fù)荷預(yù)測結(jié)果如圖5所示,描述了用戶數(shù)量占比最大的聚類1在冬季和夏季工作日(2021年12月16日、2021年7月6日)的小時(shí)預(yù)測值和實(shí)際值。聚類1的周末負(fù)荷預(yù)測結(jié)果如圖6所示,描述了聚類1在周末(2021年12月19日、2021年7月10日)的小時(shí)預(yù)測值和實(shí)際值。從圖5和圖6可以看出,該社區(qū)居民在夏季和冬季的日用電量差異較小,預(yù)測結(jié)果與實(shí)際負(fù)荷值比較接近,而且本文模型的預(yù)測結(jié)果偏差略小于其他兩種模型。
圖6 聚類1的周末負(fù)荷預(yù)測結(jié)果
采用3種模型進(jìn)行對2021年12月16日的負(fù)荷進(jìn)行預(yù)測,3種模型的RMSE對比見表2。本文模型的RMSE最低,領(lǐng)先0.29~2.22 kW。此外,表2表明,聚類1的RMSE最低,僅為1.31 kW;聚類4的RMSE指標(biāo)次之,為1.42 kW,這兩個(gè)聚類的用戶數(shù)量占樣本用戶數(shù)量近60%。
表2 3種模型的RMSE對比/ kW
采用3種模型對2021年12月16日進(jìn)行負(fù)荷預(yù)測,3種模型的MAPE對比見表3。與多元線性回歸和BP神經(jīng)網(wǎng)絡(luò)相比,本文模型的MAPE指標(biāo)明顯領(lǐng)先。此外,表3表明,本文模型中聚類1的MAPE指標(biāo)最高,僅為7.28%,聚類2次之,為7.32%,尚可接受。
表3 3種模型的MAPE對比
為檢驗(yàn)本文模型對不同年份負(fù)荷預(yù)測的適用性,選用石家莊市同一個(gè)社區(qū)2018年的5 500多萬條歷史負(fù)荷記錄進(jìn)行大數(shù)據(jù)訓(xùn)練和分析,用戶群被分為5個(gè)簇,就一個(gè)春季工作日(2018年5月21日)的負(fù)荷進(jìn)行預(yù)測和偏差比對,3種模型的RMSE和MAPE對比分別見表4和表5。從表4和表5可以看出,本文模型的RMSE和MAPE兩個(gè)指標(biāo)均優(yōu)于其他兩種模型。
表4 3種模型的RMSE對比/kW
表5 3種模型的MAPE對比
本文研究了居民用戶短期負(fù)荷預(yù)測問題,提出了一種在大數(shù)據(jù)框架下使用LSTM算法的短期負(fù)荷預(yù)測模型,主要通過處理分析以不同時(shí)間分辨率記錄的大量用戶電力負(fù)荷數(shù)據(jù),動(dòng)態(tài)確定最重要的屬性為預(yù)測因素,并考慮它們對未來電力負(fù)荷的影響,同時(shí),通過對非相關(guān)屬性進(jìn)行噪聲過濾,減少了LSTM算法的配置,提高了性能。與傳統(tǒng)直接預(yù)測某個(gè)社區(qū)總負(fù)荷的策略相比,通過考慮消費(fèi)模式的相似性將消費(fèi)者分組到相關(guān)的集群中,STLF的性能得到了提高。通過RMSE和MAPE兩個(gè)指標(biāo),將本文模型與傳統(tǒng)線性回歸和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對比分析,從中可以看出,本文模型具有良好的預(yù)測性能。本文的工作可以為電力部門進(jìn)行新能源接入背景下的配電控制和電價(jià)動(dòng)態(tài)調(diào)整提供決策依據(jù)。下一步研究將在更廣的不同區(qū)域維度上驗(yàn)證預(yù)測方案的性能和應(yīng)用模式,提高適用性,推動(dòng)該電力短期負(fù)荷預(yù)測方案的實(shí)用化。
[1] 張東霞, 王繼業(yè), 劉科研, 等. 大數(shù)據(jù)技術(shù)在配用電系統(tǒng)的應(yīng)用[J]. 供用電, 2015, 32(8): 6-11.
ZHANG D X, WANG J Y, LIU K Y, et al. Application of big data technologies in power distribution and utilization system[J]. Distribution & Utilization, 2015, 32(8): 6-11.
[2] 趙明欣, 張春雷, 宋曼詩, 等. 基于居民小區(qū)負(fù)荷成長周期的負(fù)荷預(yù)測方法[J]. 供用電, 2016, 33(8): 64-68.
ZHAO M X, ZHANG C L, SONG M S, et al. A load forecasting method based on load growth cycle of residential community[J]. Distribution & Utilization, 2016, 33(8): 64-68.
[3] JIANG H, WANG K, WANG Y H, et al. Energy big data: a survey[J]. IEEE Access, 2016(4): 3844-3861.
[4] DAKI H, EL HANNANI A, AQQAL A, et al. Big data management in smart grid: concepts, requirements and implementation[J]. Journal of Big Data, 2017(4): 13.
[5] HONG T, GUI M, BARAN M E, et al. Modeling and forecasting hourly electric load by multiple linear regression with interactions[C]//Proceedings of IEEE PES General Meeting. Piscataway: IEEE Press, 2010.
[6] 王克杰, 張瑞. 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的短期電力負(fù)荷預(yù)測方法研究[J]. 電測與儀表, 2019, 56(24): 70-75.
WANG K J, ZHANG R. Research on short-term power load forecasting method based on improved BP neural network[J].Electrical Measurement & Instrumentation, 2019, 56(24): 70-75.
[7] OPREA S V, BARA A. Machine learning algorithms for short-term load forecast in residential buildings using smart meters, sensors and big data solutions[J]. IEEE Access, 2019(7): 177874-177889.
[8] 王德文, 周昉昉. 基于無監(jiān)督極限學(xué)習(xí)機(jī)的用電負(fù)荷模式提取[J]. 電網(wǎng)技術(shù), 2018, 42(10): 3393-3400.
WANG D W, ZHOU F F. Extraction of electricity consumption load pattern based on unsupervised extreme learning machine[J]. Power System Technology, 2018, 42(10): 3393-3400.
[9] ZHOU H X, ZHANG Y J, YANG L F, et al. Short-term photovoltaic power forecasting based on long short term memory neural network and attention mechanism[J]. IEEE Access, 2019(7): 78063-78074.
[10] MOR G, VILAPLANA J, DANOV S, et al. EMPOWERING, a smart big data framework for sustainable electricity suppliers[J]. IEEE Access, 2018(6): 71132-71142.
[11] MOGHADDASS R, WANG J H. A hierarchical framework for smart grid anomaly detection using large-scale smart meter data[J]. IEEE Transactions on Smart Grid, 2018, 9(6): 5820-5830.
[12] ZHAO T, ZHOU Z Q, ZHANG Y, et al. Spatio-temporal analysis and forecasting of distributed PV systems diffusion: a case study of Shanghai using a data-driven approach[J]. IEEE Access, 2017(5): 5135-5148.
A big data framework for short-term power load forecasting using heterogenous data
ZHAO Haibo1, XIANG Zhijun2, XIAO Linsong1
1. Willfar Information Technology Co., Ltd., Changsha 410205, China 2. China Electronic Power Equipment and Technology Co., Ltd., Beijing 100052, China
The power system is in a transition towards a more intelligent, flexible and interactive system with higher penetration of renewable energy generation, load forecasting, especially short-term load forecasting for individual electric customers plays an increasingly essential role in future grid planning and operation. A big data framework for short-term power load forcasting using heterogenous was proposed, which collected the data from smart meters and weather forecast, pre-processed and loaded it into a NoSQL database that was capable to store and further processing large volumes of heterogeneous data. Then, a long short-term memory (LSTM) recurrent neural network was designed and implemented to determine the load profiles and forecast the electricity consumption for the residential community for the next 24 hours. The proposed framework was tested with a publicly available smart meter dataset of a residential community, of which LSTM’s performance was compared with two benchmark algorithms in terms of root mean square error and mean absolute percentage error, and its validity has been verified.
short-term load forecasting, long short-term memory network, recurrent neural network, clustering, big data
U416.216
A
10.11959/j.issn.1000–0801.2022292
2022-07-01;
2022-12-06
國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(No.2020YFB0906000,No.2020YFB0906002)
趙海波(1978-),男,博士,威勝信息技術(shù)股份有限公司高級(jí)工程師,主要研究方向?yàn)殡娏Υ髷?shù)據(jù)分析、移動(dòng)通信、電力終端設(shè)計(jì)。
相志軍(1984-),男,高級(jí)工程師,主要研究方向?yàn)锳MI系統(tǒng)數(shù)據(jù)采集。
肖林松(1980-),男,威勝信息技術(shù)股份有限公司高級(jí)工程師,主要研究方向?yàn)殡娏K端設(shè)備開發(fā)、電力大數(shù)據(jù)分析。
s: The National Key Research and Development Program of China (No.2020YFB0906000, No.2020YFB0906002)