王健,易姝慧,劉浩*,王春枝,劉儉,汪根榮
(1中國電力科學(xué)研究院有限公司 武漢 430070;2湖北工業(yè)大學(xué) 計算機(jī)學(xué)院,武漢 430068)
短期電力負(fù)荷預(yù)測是電力負(fù)荷預(yù)測中的不可忽視的一部分,它對不管是過去傳統(tǒng)的還是現(xiàn)在智能化的電力系統(tǒng)運(yùn)行都有舉足輕重的作用.在現(xiàn)在開放式的電力市場中,短期負(fù)荷預(yù)測是保證電力系統(tǒng)經(jīng)濟(jì)、安全、穩(wěn)定運(yùn)行的有效工具,很多重要的決策都是以短期電力負(fù)荷預(yù)測結(jié)果為基礎(chǔ)依據(jù)而做出的,比如電力系統(tǒng)的安全性和可靠分析、電力系統(tǒng)的維護(hù)保養(yǎng)安排以及發(fā)電生產(chǎn)的調(diào)度計劃等.因此短期電力負(fù)荷預(yù)測一直是一個值得研究的課題,提高短期電力負(fù)荷預(yù)測的精確度更成了現(xiàn)代電力行業(yè)部門管理和運(yùn)行的關(guān)鍵.
國外很早就開始了短期電力負(fù)荷預(yù)測方面的研究,有大量的相關(guān)研究文獻(xiàn),文獻(xiàn)[1]中ENGLE等人提出了幾種回歸模型用于預(yù)測第二天的負(fù)荷數(shù)據(jù).文獻(xiàn)[2]中RAZAVI和TOLSON等人提出了一種基于神經(jīng)網(wǎng)絡(luò)的能源短期負(fù)荷預(yù)測模型,將歷史每小時負(fù)荷數(shù)據(jù)、溫度和星期幾等作為輸入變量,對未來1天到7天的電力負(fù)荷分布進(jìn)行預(yù)測.CARPINTEIRO等人[3]提出了一種新的基于層次混合神經(jīng)網(wǎng)絡(luò)的電力負(fù)荷長期預(yù)測模型,它可以應(yīng)用于需要時間序列分析的領(lǐng)域.文獻(xiàn)[4]中提出了相似日的預(yù)測方法,該方法基于搜索出近一年、兩年或三年內(nèi)與預(yù)測日特征相似的天數(shù)的歷史數(shù)據(jù).文獻(xiàn)[5]中時間序列分析方法是電力負(fù)荷預(yù)測領(lǐng)域的重要手段之一,預(yù)測即描述歷史數(shù)據(jù)隨時間動態(tài)變化的規(guī)律,通過建立相關(guān)模型來預(yù)測未來值.文獻(xiàn)[6]中為了提高電力生產(chǎn)效率,研究針對電力負(fù)荷預(yù)測問題提出了一套綜合解決方案,與持久性和搜索算法相結(jié)合,建立一個新的集成ultra-short-term電力負(fù)荷預(yù)測方法基于adaptive-network-based模糊推理系統(tǒng)(簡稱ANFIS)和反向傳播神經(jīng)網(wǎng)絡(luò).
與國外相比,國對電力負(fù)荷預(yù)測方面的研究起步較晚,但隨著經(jīng)濟(jì)的發(fā)展、科學(xué)技術(shù)的進(jìn)步及電力行業(yè)一些專家學(xué)者不斷地研究鉆研,電力行業(yè)也在快速的發(fā)展,電力負(fù)荷預(yù)測變得更加的精準(zhǔn)、智能、精細(xì).文獻(xiàn)[7]中先研究了改進(jìn)的深度信念網(wǎng)絡(luò)在時間序列數(shù)據(jù)集的模型,并將改進(jìn)的模型用于短期電力負(fù)荷預(yù)測.文獻(xiàn)[8]中主要針對短期電力負(fù)荷數(shù)據(jù)非線性部分預(yù)測精度低問題提出了基于改進(jìn)的粒子群算法和深度遞歸神經(jīng)網(wǎng)絡(luò)的短期電力負(fù)荷預(yù)測模型.文獻(xiàn)[9]主要研究的基于神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型及其在短期負(fù)荷預(yù)測方面的應(yīng)用.文獻(xiàn)[10]中提出了一種隨機(jī)森林與模糊聚類相結(jié)合的負(fù)荷預(yù)測方法,相比于傳統(tǒng)的支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)方法,驗證了該方法的有效性.文獻(xiàn)[11]中提出了支持向量機(jī)預(yù)測模型、長短期記憶網(wǎng)絡(luò)預(yù)測模型并將二者進(jìn)行組合的組合預(yù)測模型,將模型結(jié)合短期電力負(fù)荷數(shù)據(jù)進(jìn)行驗證,實驗結(jié)果表明二者的組合模型預(yù)測結(jié)果誤差低于2%.
由于短期電力負(fù)荷數(shù)據(jù)屬于時間序列數(shù)據(jù),故可采取對時間敏感有記憶功能的算法進(jìn)行預(yù)測.但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)對于周期較長的時間序列數(shù)據(jù)容易出現(xiàn)梯度消失或梯度爆炸的問題,故本次對短期負(fù)荷預(yù)測的研究是基于長短期記憶的神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory network,LSTM)進(jìn)行的.本文的工作內(nèi)容包括:首先將LSTM結(jié)構(gòu)單元中的隱含層由單一Tanh激活函數(shù)改為采用了一種基于權(quán)重的混合激活函數(shù)組(Tanh函數(shù)、Sigmod函數(shù)、Relu函數(shù)組合),然后采用注意力機(jī)制改進(jìn)LSTM模型用于短期電力負(fù)荷預(yù)測,能有效挖掘電力負(fù)荷數(shù)據(jù)中的時序信息和變化規(guī)律.實驗結(jié)果顯示,改進(jìn)后的模型預(yù)測準(zhǔn)確度更高.
本次實驗的電力負(fù)荷數(shù)據(jù)取自某地的電力負(fù)荷集,數(shù)據(jù)集包含了地區(qū)1和地區(qū)2從2009年1月1日至2015年1月10日的電力負(fù)荷數(shù)據(jù)以及2012年1月1日至2015年1月17日的天氣因素數(shù)據(jù).電力負(fù)荷數(shù)據(jù)是每15分鐘進(jìn)行一次采樣,每日96次采樣,電力負(fù)荷單位為MW.天氣因素主要包括:日最高溫度、日最低溫度、日平均溫度、日相對濕度以及日降雨量.本次實驗選取了某地區(qū)1的數(shù)據(jù),電力負(fù)荷數(shù)據(jù)有2208行97列,氣象數(shù)據(jù)有1113行6列.
由于2015年的日負(fù)荷數(shù)據(jù)只有1個月的,所以只選取了2009年至2014年以天為單位的日電力負(fù)荷數(shù)據(jù)來觀察每年的電力負(fù)荷變化,如圖1所示.
從圖1可以看出,2009年至2014年,每年的電力負(fù)荷數(shù)據(jù)呈現(xiàn)的波形都類似,在每年的1月份到3月份中間都會出現(xiàn)一次波谷,最大負(fù)荷的峰值出現(xiàn)在5月份到10月份之間,負(fù)荷的變化規(guī)律成鋸齒狀,波形呈現(xiàn)出周期性.
另外從圖1還可以看出電力負(fù)荷數(shù)據(jù)具有一定的連續(xù)性,沒有看到階躍或離散的數(shù)據(jù)現(xiàn)象,這是由電網(wǎng)系統(tǒng)對發(fā)電、輸送電及用電過程的穩(wěn)定性要求所決定的.電力負(fù)荷數(shù)據(jù)的連續(xù)性、周期性的特點,是電力負(fù)荷能夠被預(yù)測的前提和基礎(chǔ),其特點也是電力數(shù)據(jù)本身固有自帶的特性.
負(fù)荷預(yù)測的基本原則是確保負(fù)荷預(yù)測技術(shù)的科學(xué)性的先決條件,是預(yù)測方案產(chǎn)生的基礎(chǔ)[12].本次實驗中的電力負(fù)荷數(shù)據(jù)從圖1可以看出:有明顯的周期規(guī)律但也有明顯的波動,影響電力數(shù)據(jù)波動的原因就是外界因素的影響,如本次數(shù)據(jù)中所體現(xiàn)的外在因素主要是天氣因素如日最高溫度、日最低溫度、日平均溫度、日降雨量、日相對濕度等.要想提高短期負(fù)荷預(yù)測的精度,就要研究這些外在因素與負(fù)荷數(shù)據(jù)之間相關(guān)性的大小,找出相關(guān)性大的影響因素,將其作為特征作為輸入,以提高負(fù)荷預(yù)測模型的精度.
圖1 2009年至2014年負(fù)荷數(shù)據(jù)Fig.1 Load datafrom 2009 to2014
為了觀察天氣因素中的日最高溫度、日最低溫度、日平均溫度、日降雨量及日相對濕度與電力負(fù)荷數(shù)據(jù)之間的相關(guān)度,將天氣因素數(shù)據(jù)[13-14]與電力負(fù)荷數(shù)據(jù)合并到一張表格中并將日最高溫度、日最低溫度、日平均溫度、日降雨量及日相對濕度與日最高負(fù)荷、最低負(fù)荷、平均負(fù)荷、日負(fù)荷9個特征繪制了2012年至2014年共1096天的9個特征子圖,如圖2所示.
通過觀察圖2可以看出,日最大溫度、日平均溫度、日最低溫度的波動曲線比較類似,且日平均溫度、日最高溫度、日最低溫度的波動曲線與日最高負(fù)荷、日最低負(fù)荷、日平均負(fù)荷、日總負(fù)荷的變化曲線的變化趨勢比較同步,隨著日平均溫度、日最高溫度、日最低溫度的上升,負(fù)荷值也跟著上升;隨著日平均溫度、日最高溫度、日最低溫度的下降負(fù)荷值也跟著下降,這說明日平均溫度、日最高溫度、日最低溫度與電力負(fù)荷量存在著很強(qiáng)的相關(guān)性.經(jīng)觀察相對濕度與電力負(fù)荷也存在著一定的相關(guān)性,但較弱,降雨量與電力負(fù)荷的相關(guān)度更弱.為了進(jìn)一步說明特征之間具體的相關(guān)性,下面將對相關(guān)性的系數(shù)進(jìn)行計算.
圖2 2012年至2014年特征子圖Fig.2 Featuresubgraphsfrom 2012 to 2014
相關(guān)性最常用的是皮爾森相關(guān)系數(shù)(Pearson correlation coefficient).該系數(shù)是用來反映兩個變量線性相關(guān)程度的統(tǒng)計量,使用公式:
公式(1)中,Cov(x,y)是協(xié)方差,分母上的兩個變量σx、σy表示的是x和y的標(biāo)準(zhǔn)差(standard deviation),皮爾森相關(guān)系數(shù)范圍為[-1,1],越接近1表明正相關(guān)性關(guān)系越強(qiáng),越接近-1表明負(fù)相關(guān)性關(guān)系越強(qiáng),0則表示兩個變量間沒有線性關(guān)系.線性相關(guān)系數(shù)|r|及相關(guān)程度判定標(biāo)準(zhǔn):當(dāng)0<=|r|<0.3時,表示低度相關(guān);當(dāng)0.3<=|r|<0.8時,表示中度相關(guān),當(dāng)0.8<=|r|<1時,表示高度相關(guān).
為了進(jìn)一步說明最高負(fù)荷、最低負(fù)荷、平均負(fù)荷、日負(fù)荷、平均溫度、最高溫度、最低溫度、相對濕度、降雨量這9個特征之間的相關(guān)度,特通過pandas讀取數(shù)據(jù),再由數(shù)據(jù)框調(diào)用corr方法,計算了它們之間的皮爾森相關(guān)系數(shù),如表1所示.
通過表1可以看出,最高溫度、最低溫度、平均溫度與負(fù)荷數(shù)據(jù)的相關(guān)系數(shù)大于0.3小于0.8,呈現(xiàn)中相關(guān)度,相對濕度、降雨量與負(fù)荷數(shù)據(jù)的相關(guān)系數(shù)都小于0.3,呈現(xiàn)出低相關(guān)性.故在該模型中舍棄特征相對濕度、降雨量,僅將最高負(fù)荷、最低負(fù)荷、平均負(fù)荷、日總負(fù)荷、平均溫度、最高溫度、最低溫度7個特征作為模型的輸入.
表1 特征之間的相關(guān)系數(shù)Tab.1 Pearson correlation coefficient amongfeature
數(shù)據(jù)預(yù)處理是為后期模型的訓(xùn)練做準(zhǔn)備,而且數(shù)據(jù)的預(yù)處理也對模型的預(yù)測精度有影響.故為了提高電力負(fù)荷的預(yù)測精度,電力數(shù)據(jù)需要經(jīng)過預(yù)處理才能將數(shù)據(jù)喂給預(yù)測模型具體預(yù)處理的過程,主要包括:根據(jù)需要整理合并數(shù)據(jù)集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化處理、數(shù)據(jù)集劃分.
(1)數(shù)據(jù)集合并整理.
找出每一天采樣的96個樣本中的最大值、最小值,并求出96個樣本點的平均值和求和,即得到日最高負(fù)荷、日最低負(fù)荷、日平均負(fù)荷、日總負(fù)荷4個特征數(shù)據(jù).將這4個維度的特征數(shù)據(jù)與日平均溫度、日最高溫度、日最低溫度3個維度的特征整合到一起,作為模型的輸入特征,將7個維度的特征量數(shù)據(jù)與每天的96個樣本點數(shù)據(jù)整合到一張數(shù)據(jù)表中,從而得到一個全新的數(shù)據(jù)集作為本次實驗的數(shù)據(jù)集(1106行103列).
(2)數(shù)據(jù)異常處理.
導(dǎo)入整理好的數(shù)據(jù)集,由于收集數(shù)據(jù)值是由人為采集和設(shè)備采集,可能會存在缺失值和異常值,而缺失值和異常值又會影響電力負(fù)荷預(yù)測的精度,故需要對缺失和異常的數(shù)據(jù)值進(jìn)行查看并進(jìn)行處理,用當(dāng)日樣本點的平均值代替異常值和補(bǔ)充缺失值,以避免缺失及異常值對預(yù)測結(jié)果帶來的不良影響.
(3)數(shù)據(jù)標(biāo)準(zhǔn)化處理.
由于數(shù)據(jù)尺度太大會影響模型的訓(xùn)練效果并且長短期記憶神經(jīng)網(wǎng)絡(luò)預(yù)測模型對輸入的數(shù)據(jù)尺度比較敏感,故可用以下公式(2)對異常處理后的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除量級量綱的影響提高預(yù)測模型精確度,簡化計算,提高模型的收斂速度.
公式(2)中x是原始電力負(fù)荷數(shù)據(jù),xmean為原始電力負(fù)荷數(shù)據(jù)的平均值,xstd為原始電力負(fù)荷數(shù)據(jù)的方差,xnorm為標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)電力負(fù)荷值,其實質(zhì)是將原始電荷數(shù)據(jù)轉(zhuǎn)化為符合均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布的新負(fù)荷數(shù)據(jù).經(jīng)過標(biāo)準(zhǔn)化處理后的電力負(fù)荷數(shù)據(jù),在不改變原始電力負(fù)荷變化趨勢的情況下縮小了電力負(fù)荷數(shù)據(jù)尺度.
(4)將數(shù)據(jù)集劃分為訓(xùn)練集和測試集.
預(yù)處理后的數(shù)據(jù)集總共有1106行103列,1106行是指由1106天,103列是日平均負(fù)荷、日最高負(fù)荷、日最低負(fù)荷、日總負(fù)荷、日最低溫度、日最高溫度、日平均溫度7個維度特征數(shù)據(jù)加上每天的96個負(fù)荷采集樣本數(shù)據(jù),數(shù)據(jù)集劃分是按照訓(xùn)練數(shù)據(jù)集占80%,測試數(shù)據(jù)集占20%來進(jìn)行劃分的.x_train取的是數(shù)據(jù)集的前884行的特征數(shù)據(jù),y_train取的是前884行的每天的96個采集樣本數(shù)據(jù).x_test取的是數(shù)據(jù)集的后222行特征數(shù)據(jù),y_test取的是后222行的每天的96個采集樣本數(shù)據(jù).
2.1.1 改進(jìn)的LSTM單元
激活函數(shù)的作用是使神經(jīng)網(wǎng)絡(luò)模型的線性改為非線性.若沒有激活函數(shù),則無論神經(jīng)網(wǎng)絡(luò)有多少層,輸出與輸入都將呈現(xiàn)出線性關(guān)系.即隱藏層失去了其作用,沒有激活函數(shù)的每層都相當(dāng)于矩陣相乘,由此可見激活函數(shù)對長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的影響.為了更充分地發(fā)揮隱含層的作用,更好地適應(yīng)和學(xué)習(xí)非線性關(guān)系的電力負(fù)荷數(shù)據(jù),將LSTM單元中的激活函數(shù)進(jìn)行了改進(jìn),如圖3中紅圈中的激活函數(shù)Tanh,將Tanh激活函數(shù)改進(jìn)成了基于Tanh、Sigmoid、Relu的加權(quán)激活函數(shù)組,具體展現(xiàn)如圖4所示.
根據(jù)圖3-圖4,其中σ為sigmoid函數(shù),LSTM改進(jìn)后,LSTM單元當(dāng)前的輸出值st公式為公式(3),展示如下:
圖3 LSTM單元內(nèi)部結(jié)構(gòu)圖Fig.3 Internal structurediagramof LSTMunit
圖4 改進(jìn)后的LSTM單元內(nèi)部結(jié)構(gòu)圖Fig.4 Internal structure diagram of improved LSTM unit
其中Wi為權(quán)重矩陣,ct為當(dāng)前時刻的單元狀態(tài),ot輸出門的輸出值,st為改進(jìn)的LSTM單元當(dāng)前的輸出值,T為矩陣轉(zhuǎn)置.
2.1.2 改進(jìn)的AM-LSTM模型
在對時間序列數(shù)據(jù)進(jìn)行處理的時候,會通過計算得到序列中各個元素的特征,如果需要在序列數(shù)據(jù)上進(jìn)行信息提取時,需要關(guān)注整個序列的特征,而簡單地將各個元素的特征相加或者是說求平均,則會導(dǎo)致模型的輸入序列中每一個元素對于模型的輸出序列中的每一個元素的影響力相同.因此,本文在模型中引入attention機(jī)制,加入注意力機(jī)制的改進(jìn)的LSTM模型稱為改進(jìn)的AM-LSTM模型.改進(jìn)的AM-LSTM模型用到了序列到序列的框架,其中編碼器(Encoder)部分采用的改進(jìn)的LSTM單元,解碼器(Decoder)部分也采用的改進(jìn)的LSTM單元,具體框架如圖5所示.
Lut對照品,批號111520-201605,質(zhì)量分?jǐn)?shù)99.6%,中國食品藥品檢定研究院;香葉木素對照品,批號P0587,質(zhì)量分?jǐn)?shù)99.4%,上海源葉生物科技有限公司;聚乙烯吡咯烷酮(PVK 30),批號25000240379,Ashland公司;卵磷脂,批號PC-98T,輔必成上海醫(yī)藥科技有限公司;其他試劑均為分 析純。
圖5 改進(jìn)的AM-LSTM模型Fig.5 Improved AM-LSTM model
初始向量x1,x2,...,xn是輸入特征向量,本次訓(xùn)練數(shù)據(jù)集有最高溫度、最低溫度、平均溫度、最高負(fù)荷、最平負(fù)荷、平局負(fù)荷、日總負(fù)荷7個特征向量,故用到7個改進(jìn)的LSTM單元,7個輸入特征向量經(jīng)過改進(jìn)的LSTM單元進(jìn)行編碼,輸出固定長度的向量通過注意力機(jī)制(Attentional Mechanism)輸出注意力機(jī)制的上下文C1,C2,…..,Ct,輸出的注意力機(jī)制上下文通過解碼層,輸出預(yù)測結(jié)果o1,o2,...on.
在基于注意力機(jī)制的網(wǎng)絡(luò)模型中,它是首先計算一組注意力權(quán)重,通過乘上編碼器輸出的向量來創(chuàng)建權(quán)重的組合.計算結(jié)果應(yīng)該包含有關(guān)輸入序列特定部分的信息,從而幫助解碼器選擇正確的表征進(jìn)行輸出.因此,解碼器(Decode)可以使用編碼器(Encode)序列的不同部分作為context直到解碼完所有序列.
注意力機(jī)制在解碼階段的每個時間步長t計算一個向量ct和一個輸出結(jié)果ot, 計算公式為:
其中hj是輸入向量xj的隱藏層狀態(tài),atj是hj預(yù)測ot的權(quán)重.向量ct也被稱作為期望注意力向量,通常可以被softmax函數(shù)計算出來,公式為:
其中attentionScore函數(shù)可以選擇解碼部分的隱藏狀態(tài)和編碼的隱藏狀態(tài)來計算出一個用于計算權(quán)重的分?jǐn)?shù).
模型評估指標(biāo)是用來評價模型預(yù)測誤差精度大小的預(yù)測性能的評價標(biāo)準(zhǔn)尺度,本次實驗采用了平均絕對誤差MAE(Mean Absolute Error)、均方根誤差RMSE(Root Mean Squared Error)、對稱平均絕對百分比誤差(Symmetric Mean Absolute Percentage Error)、決定系數(shù)R2(R-Square)等來評估預(yù)測模型的預(yù)測精度[15-16].具體如下:
假設(shè)y=[y1,y2,y3,…,yn],其中n=1,2,3...4,為未來4天的真實值.y^=[y^1,y^2,y^3,…,y^n]為未來4天的預(yù)測值,其中n=1,2,3...4.m是測試樣本數(shù)量,則本次回歸模型的評估指標(biāo)的公式分別可表達(dá)為:
均方絕對誤差(MAE):
均方根誤差(RMSE):
決定系數(shù)(Coefficient of Determination,R2):
公式(7)中yˉi表示的是真實值的第i天的平均值,其中MAE、RMSE、SMAPE的范圍均為[0,+∞),當(dāng)預(yù)測值等于真實值時等于0,即理想模型;誤差越大則模型預(yù)測精度越低;而R-Squared的范圍為[0,1],如果R-Squared=0則說明模型擬合效果特別差,如果R-Squared=1則說明模型無錯誤,一般來說,RSquared的值越大,表示模型擬合效果越好,預(yù)測值與真實值越接近,模型預(yù)測精度越高.
本次實驗采用改進(jìn)的長短期記憶網(wǎng)絡(luò)模型,用3年的電力數(shù)據(jù)進(jìn)行測試訓(xùn)練,訓(xùn)練好的模型用最近1年的電力負(fù)荷數(shù)據(jù)來預(yù)測未來4天的電力負(fù)荷,其主要步驟如圖6所示.
圖6 改進(jìn)的AM-LSTM算法預(yù)測模型流程圖Fig.6 Flow chart of improved AM-LSTMalgorithmprediction model
輸入:最高溫度、最低溫度、平均溫度、日最高負(fù)荷、日最低負(fù)荷、日平均負(fù)荷、日負(fù)荷7個特征向量及96個負(fù)荷樣本向量.其中7個特征作為x_train,96個采集樣本向量作為y_train.
輸出:未來4天的電力負(fù)荷預(yù)測值,每天的負(fù)荷預(yù)測值數(shù)據(jù)包含96(24h/15min=96)個時間點的負(fù)荷預(yù)測值.
第1步,確定模型的輸入.將收集好的歷史數(shù)據(jù)作為模型的最主要輸入量,同時為了提高模型的預(yù)測準(zhǔn)確率,需要將一些可能影響負(fù)荷變化規(guī)律的外在因素進(jìn)行充分考慮.對可能影響負(fù)荷變化規(guī)律的一些外在因素日最高溫度、日最低溫度、日平均溫度、相對濕度、降雨量與電力負(fù)荷數(shù)據(jù)(日最高負(fù)荷、日最低負(fù)荷、日平均負(fù)荷、日總負(fù)荷)進(jìn)行相關(guān)性分析,找出相關(guān)性大并有助于提高模型預(yù)測精度的影響因素,將其數(shù)據(jù)看作特征和電力負(fù)荷數(shù)據(jù)一起作為模型的特征輸入.
第2步,數(shù)據(jù)預(yù)處理.輸入的數(shù)據(jù)若不經(jīng)過預(yù)處理而直接喂給模型用于訓(xùn)練,這會致使訓(xùn)練的結(jié)果不佳,因此模型的輸入數(shù)據(jù)在輸入模型前,一定要經(jīng)過預(yù)處理.預(yù)處理過程主要包括:對缺失等異常數(shù)據(jù)進(jìn)行補(bǔ)充、對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理、將數(shù)據(jù)分為訓(xùn)練集和測試集等.
第3步,預(yù)處理后的數(shù)據(jù)喂給模型對模型進(jìn)行訓(xùn)練,訓(xùn)練后的模型會輸出預(yù)測的負(fù)荷數(shù)劇,將預(yù)測的數(shù)據(jù)和真實數(shù)據(jù)進(jìn)行對比,評估觀測模型的預(yù)測效果.
第4步,如果預(yù)測效果達(dá)不到要求,就修改調(diào)整模型的參數(shù)進(jìn)行再次訓(xùn)練預(yù)測結(jié)果與前一次訓(xùn)練的預(yù)測結(jié)果對比,直到模型的預(yù)測結(jié)果達(dá)到要求為止.
為了能體現(xiàn)出改進(jìn)的AM-LSTM模型的預(yù)測精度更高,本次實驗對LSTM模型、AM-LSTM模型結(jié)合電力負(fù)荷數(shù)據(jù)也進(jìn)行了訓(xùn)練并預(yù)測,結(jié)合改進(jìn)前的LSTM、改進(jìn)的AM-LSTM模型的預(yù)測結(jié)果進(jìn)行對比分析.LSTM模型對未來4天的電力負(fù)荷預(yù)測結(jié)果(真實值與預(yù)測值的對比)如圖7~10所示.
圖7 LSTM模型預(yù)測第1天的結(jié)果Fig.7 Predicted resultsof first day using LSTMmodel
圖8 LSTM模型預(yù)測第2天的結(jié)果Fig.8 Predicted results of second day using LSTMmodel
圖9 LSTM模型預(yù)測第3天的結(jié)果Fig.9 Predicted results of third day using LSTM model s
圖10 LSTM模型預(yù)測第4天的結(jié)果Fig.10 Predicted resultsof fourth day using LSTMmodels
為了改進(jìn)的AM-LSTM模型對未來4天電力負(fù)荷預(yù)測的預(yù)測結(jié)果(每天隔15分鐘一個電力負(fù)荷值,共由96個電力負(fù)荷值)如圖11~14:
圖11 改進(jìn)的AM-LSTM模型預(yù)測第1天的結(jié)果Fig.11 Predicted results of first day using Improved AM-LSTM model
圖12 改進(jìn)的AM-LSTM模型預(yù)測第2天的結(jié)果Fig.12 Predicted resultsof second day using Improved AM-LSTMmodel
圖13 改進(jìn)的AM-LSTM模型預(yù)測第3天的結(jié)果Fig.13 Predicted resultsof third day using Improved AM-LSTMmodel s
從圖11-圖14中,可以看出改進(jìn)的AM-LSTM模型能夠更好地預(yù)測出未來4天的電力負(fù)荷值,擬合效果優(yōu)于改進(jìn)的AM-LSTM.為了更值觀地看到改進(jìn)的AM-LSTM模型的性能,根據(jù)模型的評估指標(biāo)公式計算了模型的評估指標(biāo),如表2所示.
圖14 改進(jìn)的AM-LSTM模型預(yù)測第4天的結(jié)果Fig.14 Predicted resultsof fourth day using Improved AM-LSTMmodel
表2 改進(jìn)的AM-LSTM模型評估指標(biāo)Tab.2 Improved AM-LSTM model evaluation index
本文主要提出了改進(jìn)的AM-LSTM模型,并結(jié)合短期電力負(fù)荷數(shù)據(jù)驗證并證明了改進(jìn)的AM-LSTM短期電力負(fù)荷預(yù)測模型的預(yù)測精度比未改進(jìn)的AMLSTM精度更高,添加了注意力機(jī)制的LSTM模型比LSTM模型的預(yù)測精度高.在提出改進(jìn)的AM-LSTM模型前還做了一些數(shù)據(jù)處理的工作,主要包括:對電力負(fù)荷數(shù)據(jù)進(jìn)行了分析,得出電力負(fù)荷數(shù)據(jù)呈現(xiàn)周期性、連續(xù)性的特性;分析了外在天氣因素日最高溫度、日平均溫度、日最低溫度、相對濕度、降雨量與最高負(fù)荷、最低負(fù)荷、平均負(fù)荷、日總負(fù)荷之間的相關(guān)性,并選取了相關(guān)性高的天氣因素數(shù)據(jù)與負(fù)荷數(shù)據(jù)一起作為輸入特征;將數(shù)據(jù)特征數(shù)據(jù)與每天采集的96個樣本數(shù)據(jù)整合在一起,對整合后的數(shù)據(jù)進(jìn)行清洗、標(biāo)準(zhǔn)化、劃分訓(xùn)練集和測試集.