宣菊琴,鄭潔云,陳 波,陳 強(qiáng),陳曉彬,林婷婷
(1.國(guó)網(wǎng)福建省電力有限公司,福建 福州 350003;2.國(guó)網(wǎng)福建省電力有限公司經(jīng)濟(jì)技術(shù)研究院,福建 福州 350012;3.國(guó)網(wǎng)福州供電公司,福建 福州 350009;4.國(guó)網(wǎng)龍巖供電公司,福建 龍巖 364031)
如今,國(guó)民經(jīng)濟(jì)正處于飛速發(fā)展階段,人們的生活質(zhì)量也不斷提升,同時(shí)對(duì)電能質(zhì)量的要求也越來越高。電網(wǎng)系統(tǒng)的負(fù)荷預(yù)測(cè)是電能質(zhì)量的保障,也是電能管理的重要環(huán)節(jié)[1]。負(fù)荷預(yù)測(cè)精準(zhǔn)性為電力系統(tǒng)智能化水平運(yùn)行提供重要支撐,對(duì)電力系統(tǒng)狀態(tài)進(jìn)行實(shí)時(shí)動(dòng)態(tài)評(píng)估與增加發(fā)電經(jīng)濟(jì)效益均有重要作用[2]。由于負(fù)荷存在波動(dòng)性與復(fù)雜性特征,因此根據(jù)負(fù)荷特點(diǎn)構(gòu)建負(fù)荷預(yù)測(cè)模型是提升負(fù)荷預(yù)測(cè)精準(zhǔn)度的關(guān)鍵[3]。因此,亟待提出一種電力負(fù)荷預(yù)測(cè)的新方法,從而進(jìn)一步提高負(fù)荷預(yù)測(cè)準(zhǔn)確度,滿足實(shí)際需求。
目前,用于電力系統(tǒng)負(fù)荷預(yù)測(cè)的方法主要有線性回歸法、卡爾曼濾波法、人工神經(jīng)網(wǎng)絡(luò)法及支持向量機(jī)時(shí)間序列建模等[4]。其中,傳統(tǒng)的時(shí)間序列法主要將負(fù)荷擬成時(shí)間序列信號(hào),并通過不同的時(shí)間序列對(duì)負(fù)荷展開預(yù)測(cè),還能夠在該模型基礎(chǔ)上構(gòu)建負(fù)荷預(yù)測(cè)的卡爾曼濾波模型、負(fù)荷預(yù)測(cè)的自回歸模型以及自回歸積分滑動(dòng)平均模型等[5-7]。上述模型主要以線性模型為基礎(chǔ),其建立的預(yù)測(cè)模型較為簡(jiǎn)單,并對(duì)負(fù)荷序列的平穩(wěn)性要求較高,因此在復(fù)雜條件因素下,預(yù)測(cè)精度會(huì)大大降低。為了彌補(bǔ)此不足,人工神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)等淺層機(jī)器學(xué)習(xí)算法被廣泛研究[8-11]。其具有良好的非線性函數(shù)擬合特征,能夠有效提高負(fù)荷預(yù)測(cè)的精度。但是該模型還存在淺層預(yù)測(cè)模型對(duì)非線性負(fù)荷的隱藏特征認(rèn)知不夠,受外界干擾影響大等問題。
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,深度學(xué)習(xí)理論成為了智能化的熱點(diǎn),其具有良好的自適應(yīng)學(xué)習(xí)能力以及認(rèn)知能力?;谏疃壬窠?jīng)網(wǎng)絡(luò)的負(fù)荷預(yù)測(cè)模型通過訓(xùn)練學(xué)習(xí),其預(yù)測(cè)結(jié)果比傳統(tǒng)預(yù)測(cè)模型的誤差低,精度高[12-14]。隨著模糊理論的普及,引入該理論進(jìn)行負(fù)荷預(yù)測(cè)也獲得了一定效果[15-16]。然而,目前基于深度學(xué)習(xí)或模糊理論對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè)的模型尚未成熟。仍存在訓(xùn)練效率低以及迭代次數(shù)多等問題,降低了負(fù)荷預(yù)測(cè)的精準(zhǔn)性。因此,亟待研究一種能夠綜合考慮各影響因素的電網(wǎng)中期負(fù)荷預(yù)測(cè)方法,對(duì)電網(wǎng)系統(tǒng)安全經(jīng)濟(jì)運(yùn)行至關(guān)重要。
本文為了提高以居民、學(xué)校為主地區(qū)的中期電網(wǎng)負(fù)荷預(yù)測(cè)效果,針對(duì)基于改進(jìn)棧式自編碼算法的中期負(fù)荷預(yù)測(cè)方法展開了一系列研究。首先構(gòu)建獨(dú)立分量分析法(independent component analysis,ICA)的數(shù)學(xué)模型并對(duì)影響電力系統(tǒng)負(fù)荷的因素進(jìn)行篩選和歸一化處理;利用參數(shù)自適應(yīng)微分進(jìn)化算法對(duì)棧式自編碼算法參數(shù)展開在線優(yōu)化,通過將影響因素進(jìn)行模糊化并構(gòu)造其隸屬度函數(shù);棧式自編碼算法通過樣本訓(xùn)練和參數(shù)微調(diào)改善組合預(yù)測(cè)模型,并將該算法與傳統(tǒng)方法進(jìn)行預(yù)測(cè)結(jié)果對(duì)比,進(jìn)而對(duì)所提算法的有效性進(jìn)行驗(yàn)證。
在電力負(fù)荷預(yù)測(cè)中,考慮過多影響因素會(huì)引起噪聲,且對(duì)主導(dǎo)的因素分析不足,將會(huì)造成預(yù)測(cè)結(jié)果的精度降低。在針對(duì)不同的負(fù)荷類型以及預(yù)測(cè)時(shí)期,因素影響程度不同,而且數(shù)據(jù)維度大最終也會(huì)造成擬合度存在失真現(xiàn)象。為了提高負(fù)荷預(yù)測(cè)結(jié)果的準(zhǔn)確度,減少預(yù)測(cè)模型影響因素的數(shù)量,需要對(duì)各類數(shù)據(jù)實(shí)施降維處理進(jìn)而根據(jù)預(yù)測(cè)對(duì)象獲得其主導(dǎo)影響因素。
獨(dú)立分量分析法(Independent Component Analysis,ICA)的特征提取依據(jù)初始數(shù)據(jù)的潛在規(guī)律和特征展開解析,進(jìn)而使處理后的數(shù)據(jù)可以更好反饋初始數(shù)據(jù)的信息,同時(shí)不會(huì)改變數(shù)據(jù)的潛在規(guī)律和特征[17]。標(biāo)準(zhǔn)ICA 的數(shù)學(xué)模型為:
式中:相量y為觀測(cè)信號(hào),是多元隨機(jī)混合信號(hào),即[y1,y2,…,yN]T;A為M×N的常數(shù)固定的混合矩陣;相量x為有N個(gè)未知的源信號(hào)構(gòu)成的一個(gè)列向量,且分量彼此統(tǒng)計(jì)獨(dú)立,即[x1,x2,…,xN]T。對(duì)觀測(cè)向量y進(jìn)行中心化和白化處理,即:
式中:向量B表示白化矩陣。經(jīng)過預(yù)白化處理后,將觀測(cè)信號(hào)y轉(zhuǎn)成了信號(hào)向量v,該信號(hào)向量具有單位方差,且各分量間兩兩正交。
ICA 的目的是在只知道混合信號(hào)y的情況下,獲得M×N解混矩陣WT,使式(3)u的各分量盡可能統(tǒng)計(jì)獨(dú)立。所獲得u為恢復(fù)信號(hào),即為目的源信號(hào)。
通過信息最大化法對(duì)ICA 模型進(jìn)行處理,信息熵表示了數(shù)據(jù)內(nèi)包含的平均信息量,且其為一個(gè)標(biāo)量。一個(gè)離散信源的熵則能夠被定義為:
式中:參數(shù)Pi表示x與xi相等的先驗(yàn)概率;參數(shù)N為一個(gè)離散信號(hào)的輸出擁有N種不一樣的取值結(jié)果;參數(shù)C表示一個(gè)固定值,值為2;E表示值的數(shù)學(xué)期望。
當(dāng)概率密度函數(shù)的協(xié)方差矩陣一樣時(shí),其高斯分布信號(hào)中有最大的熵。負(fù)熵的表達(dá)式為:
式中:參數(shù)gG表示與y具有相同協(xié)方差矩陣的高斯分布向量。然而,在實(shí)際中源信號(hào)的概率分布是未知的,傳統(tǒng)對(duì)負(fù)熵的評(píng)估是通過高階矩陣,利用一個(gè)對(duì)照函數(shù)G展開近似分析,其表達(dá)式為:
式中:wi表示分離矩陣W的第i行向量。令J(gi)獲得最優(yōu)解時(shí),符合下述條件:
式中:參數(shù)α代表一個(gè)常數(shù)。為了避免出現(xiàn)計(jì)算飽和現(xiàn)象,先對(duì)負(fù)荷數(shù)據(jù)進(jìn)行歸一化處理:
通過ICA 算法對(duì)影響電力系統(tǒng)負(fù)荷的因素進(jìn)行篩選,減少數(shù)據(jù)的輸入量。將對(duì)負(fù)荷影響較小的因素進(jìn)行篩除,根據(jù)預(yù)測(cè)的對(duì)象保留氣候環(huán)境、歷史負(fù)荷等對(duì)負(fù)荷預(yù)測(cè)影響較大因素,進(jìn)而增強(qiáng)預(yù)測(cè)的準(zhǔn)確性和效率。
在針對(duì)本文以居民、學(xué)校為主地區(qū)的用電負(fù)荷預(yù)測(cè)時(shí),各項(xiàng)影響因素中氣溫對(duì)負(fù)荷的影響最為顯著,然而由于現(xiàn)實(shí)條件里溫度因素是不確定的。為了提高負(fù)荷預(yù)測(cè)的精度,針對(duì)此輸入的非模糊集合構(gòu)造特有的隸屬度函數(shù),引入模糊化的處理過程,將明確的數(shù)據(jù)轉(zhuǎn)換成模糊集合。模糊理論能夠反映數(shù)據(jù)非線性特征以及具有較強(qiáng)的結(jié)構(gòu)表現(xiàn)能力。本文將每日的平均氣溫t作為輸入模糊變量,且在模糊劃分時(shí),應(yīng)在保證每個(gè)空間有些許重疊的情況下分別對(duì)應(yīng)相應(yīng)的隸屬度函數(shù)。根據(jù)福建省氣候特性將該輸入變量的模糊劃分為三個(gè)溫度區(qū)間,分別為:0~10 ℃的低溫段、5 ℃~25 ℃的中溫段以及20 ℃~40 ℃的高溫段。為了使各溫度區(qū)間的隸屬度函數(shù)在模糊化處理后其輸出函數(shù)仍能保持原來形態(tài),將三個(gè)溫度區(qū)間均使用三角形型隸屬度函數(shù)進(jìn)行表示。
針對(duì)0~10 ℃的低溫段通過偏小型三角形隸屬度函數(shù),其公式為:
對(duì)于5~25 ℃的中溫段采用中間型三角形分布,其公式為:
對(duì)于20~40 ℃的高溫段采用偏大型三角形分布,其公式為:
微分進(jìn)化算法(Differential Evolution,DE)是一種基于種群進(jìn)化的實(shí)數(shù)編碼的優(yōu)化算法。該算法有較高的魯棒性以及全局搜索特性,其主要有初始化、變異、交叉以及選擇四個(gè)內(nèi)容:
(1)種群初始化。在解空間的全部范圍內(nèi)進(jìn)行種群初始化,從而構(gòu)造優(yōu)化搜索的初始點(diǎn)。令解空間的初始化種群定義為Y0,即[y1,y2,…,yNd],其中,Nd為表示種群數(shù)量。種群的進(jìn)化個(gè)體定義為,即,參數(shù)D表示優(yōu)化問題的維數(shù)。
式中:參數(shù)s1,s2以及s3均為一個(gè)正整數(shù),且三者不相等;參數(shù)F表示變異率,為一個(gè)實(shí)數(shù)。
(3)種群交叉。把種群變異后所得到的個(gè)體與當(dāng)前個(gè)體展開二項(xiàng)分布交叉計(jì)算,得到新的個(gè)體,其過程被定義為:
式中:參數(shù)i和j是一個(gè)隨機(jī)數(shù)值,參數(shù)CR表示交叉概率;且j和CR值均在0~1 的范圍內(nèi);參數(shù)S(i)表示[1,D]中的一個(gè)隨機(jī)量。
式中:參數(shù)f表示了個(gè)體對(duì)應(yīng)的目標(biāo)函數(shù)。
微分進(jìn)化算法的搜索效果受到算法參數(shù)的影響較大,且該參數(shù)在實(shí)施過程內(nèi)不易明確。結(jié)合自適應(yīng)算法能夠大大增強(qiáng)系統(tǒng)全局搜索的效率,并依據(jù)搜索結(jié)果確定算法中的參數(shù)。如果變異率值偏大,微分算法的搜索效率接近隨機(jī)搜索,造成其效率不高。自適應(yīng)算法先引入變異因子,被定義為:
式中:參數(shù)Q0表示初始的變異參數(shù)。在初始階段,即第一代時(shí),Q等于2Q0,變異率較大,保障個(gè)體的豐富多樣,防止早熟;隨著計(jì)算深入,變異率慢慢下降不斷靠近于Q0,從而保障解的完整性。此外,若交叉概率越大,則變異個(gè)體的作用越大,其局部搜索特性以及算法收斂速率也越佳,能夠有效地保障良好的種群豐富性以及全局搜索特性。根據(jù)慣性權(quán)重思想,其交叉概率因子計(jì)算公式為:對(duì)交叉?zhèn)€體
式中:Km表示最大迭代次數(shù);參數(shù)CRm以及CRmin分別表示了微分進(jìn)化算法的最大交叉概率和最小交叉概率。通過迭代,隨迭代次數(shù)K的增大,參數(shù)CR也將會(huì)從小變大。進(jìn)而,在初始階段提高個(gè)體對(duì)交叉?zhèn)€體的作用,在后期階段提高變異個(gè)體對(duì)交叉?zhèn)€體的作用,進(jìn)而實(shí)現(xiàn)加快算法收斂速率,讓全局搜索以及局部搜索達(dá)到相對(duì)平衡的情況,使得該算法計(jì)算效率和準(zhǔn)確性大幅度提升。
(1)自編碼式深度學(xué)習(xí)基本結(jié)構(gòu)
自編碼式深度學(xué)習(xí)(SAE-NN)的基本原理是將數(shù)據(jù)向一個(gè)恒定的函數(shù)持續(xù)靠近,進(jìn)而使得輸出結(jié)果不斷趨于輸入數(shù)據(jù),其與三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似,分別為第一層的可視層、第二層的隱藏層以及最后的重構(gòu)可視層,具體如圖1 所示。其中,從可視層到隱藏層使用其編碼功能,從隱藏層到重構(gòu)可視層使用其解碼功能。
圖1 自編碼式深度學(xué)習(xí)結(jié)構(gòu)
令棧式自編碼式深度學(xué)習(xí)模型的輸入數(shù)據(jù)與輸出數(shù)據(jù)形式、結(jié)構(gòu)相同,把氣象條件、日類型、地方政策以及歷史負(fù)荷等數(shù)據(jù)進(jìn)行同構(gòu),形成一個(gè)訓(xùn)練樣本集合X={x1,x2,…,xi,…,xN},其中N為訓(xùn)練樣本集合所擁有的樣本數(shù),子集合xi為{xi,1,xi,2,…,xi,d},而且可視層中的每個(gè)元素均能和集合xi中元素一一對(duì)應(yīng)。把集合xi作為特征向量,通過編碼過程將其輸入至隱藏層里,其編碼過程被定義為:
式中:{w1,b1}表示可視層與隱藏層的連接權(quán)值和偏置值矩陣。利用該式完成特征提取后,對(duì)一階特征進(jìn)行重構(gòu),其表達(dá)式為:
式中:{w2,b2}表示隱藏層與重構(gòu)可視層的連接權(quán)值和偏置值矩陣。
(2)棧式自編碼式深度學(xué)習(xí)模型設(shè)計(jì)
棧式自編碼神經(jīng)網(wǎng)絡(luò)主要由底層的棧式自編碼器模型(SAE)和頂層的邏輯回歸模型(LR)兩個(gè)部分構(gòu)成。其中,SAE 模型為數(shù)個(gè)稀疏自編碼器累積構(gòu)成。該模型主要承擔(dān)將當(dāng)前l(fā)層的自編碼隱藏層輸出結(jié)果h(l)傳輸至下一層,并作為該層的自編碼可視層的輸入,其過程表示為:
式中:l取值為1,2,…,n-1;n表示層的棧式自編碼器模型內(nèi)自編碼器的數(shù)量。
由于對(duì)電力負(fù)荷特性的造成影響的因素有很多,包括自身特性影響和外部條件干擾,如氣象條件、工作日、周末、歷史負(fù)荷、地方相關(guān)扶持政策等。因此,將這些影響因素的數(shù)據(jù)也作為棧式自編碼式深度學(xué)習(xí)模型的輸入數(shù)據(jù),其多輸入單輸出SAE 模型結(jié)構(gòu)如圖2 所示。為了能夠?qū)χ衅谪?fù)荷進(jìn)行預(yù)測(cè),在SAE 模型的上層構(gòu)建一個(gè)LR 模型進(jìn)行預(yù)測(cè)。
圖2 棧式自編碼式深度學(xué)習(xí)模型結(jié)構(gòu)
初始輸入的樣本x(1)通過SAE 模型多次非線性變換后獲得賦有多個(gè)負(fù)荷預(yù)測(cè)的重要信息的n階特征,用h(n)來表示。接著n階特征h(n)又成為頂層LR 模型的輸入數(shù)據(jù)展開負(fù)荷預(yù)測(cè)。將經(jīng)過SAE模型學(xué)習(xí)的深層樣本特征代替原始向量成為負(fù)荷預(yù)測(cè)的樣本輸入數(shù)據(jù),能夠提升網(wǎng)絡(luò)的泛化能力。
(3)棧式自編碼式深度學(xué)習(xí)模型訓(xùn)練
棧式自編碼式深度學(xué)習(xí)模型為一種半監(jiān)督式的學(xué)習(xí)方式,一般通過由下往上的無監(jiān)督預(yù)訓(xùn)練實(shí)現(xiàn)SAE 模型的參數(shù)初始化,其次通過從上往下的有監(jiān)督訓(xùn)練對(duì)整體網(wǎng)絡(luò)的參數(shù)進(jìn)行微調(diào)。棧式自編碼式深度學(xué)習(xí)模型的基礎(chǔ)是利用將整體代價(jià)函數(shù)進(jìn)行最小化,不斷對(duì){w,b}的值進(jìn)行調(diào)整,進(jìn)而擬合輸入數(shù)據(jù)和輸出數(shù)據(jù)的關(guān)系,其整體代價(jià)函數(shù)的表達(dá)式為:
式中:參數(shù)yi表示目標(biāo)函數(shù)的輸出值;參數(shù)fi表示目標(biāo)函數(shù)的預(yù)測(cè)值。
底層的棧式自編碼器模型是通過逐層貪婪學(xué)習(xí)算法進(jìn)行學(xué)習(xí)訓(xùn)練,此算法一次只針對(duì)含有一個(gè)隱藏層的自編碼器進(jìn)行訓(xùn)練。當(dāng)此自編碼器達(dá)到最佳時(shí)去掉重構(gòu)可視層,并把隱藏層的輸出結(jié)果當(dāng)作下一個(gè)自編碼器的輸入,從而對(duì)下一個(gè)自編碼器進(jìn)行訓(xùn)練,直到最后一層自編碼器也達(dá)到最佳時(shí)即完成SAE 模型的無監(jiān)督預(yù)訓(xùn)練。在此逐步深入的訓(xùn)練過程中,樣本數(shù)據(jù)通過單個(gè)自編碼器得到一個(gè)輸出,接著通過最小化代價(jià)函數(shù)對(duì){w,b}的值進(jìn)行更替,其更替方式為:
式中:參數(shù)k表示迭代次數(shù);l取值為1,2,…,n-1;λ表示每次迭代的學(xué)習(xí)步長(zhǎng)。CS(w,b)表示自編碼器的誤差代價(jià)函數(shù),具體表達(dá)式為:
式中:參數(shù)d和參數(shù)n分別為輸入層所含有的節(jié)點(diǎn)數(shù)量以及隱藏層中的神經(jīng)元數(shù)量;參數(shù)θ和參數(shù)μ分別為權(quán)重的衰減參數(shù)以及稀疏項(xiàng)的權(quán)重值;KL(ρ‖ρk)則表示稀疏項(xiàng)的懲罰因子,其中ρ的值通常取0.05。通過無監(jiān)督預(yù)訓(xùn)練后,底層的棧式自編碼器模型已設(shè)定初始權(quán)值,再利用頂層的邏輯回歸模型對(duì)整體進(jìn)行有監(jiān)督參數(shù)微調(diào),此時(shí)的代價(jià)函數(shù)為J(w,b)。利用梯度下降法對(duì)代價(jià)函數(shù)J(w,b)的參數(shù)進(jìn)行多次迭代和更新,從而獲得最佳的中期負(fù)荷預(yù)測(cè)模型。
通過利用基于改進(jìn)棧式自編碼算法模型對(duì)負(fù)荷潛在變化特點(diǎn)及其和外部干擾因素間的關(guān)系進(jìn)行分析和提取,進(jìn)而實(shí)現(xiàn)對(duì)電網(wǎng)系統(tǒng)中期負(fù)荷的預(yù)測(cè),其實(shí)施流程如圖3 所示,具體步驟如下:
圖3 改進(jìn)棧式自編碼負(fù)荷預(yù)測(cè)算法流程
(1)首先把各類數(shù)據(jù)進(jìn)行修正,分析預(yù)測(cè)電力負(fù)荷的主要影響因素,如天氣因素、日類型等,利用ICA進(jìn)行特征提取,從而篩選主導(dǎo)的影響因素并對(duì)數(shù)據(jù)進(jìn)行歸一化處理,并作為負(fù)荷預(yù)測(cè)模型的輸入量;
(2)將篩選出的主要影響因素利用模糊理論獲得其隸屬度關(guān)系,并對(duì)樣本數(shù)據(jù)進(jìn)行重構(gòu),以滿足預(yù)測(cè)模型的輸入輸出要求;
(3)利用自適應(yīng)微分算法對(duì)棧式自編碼算法的預(yù)測(cè)模型進(jìn)行參數(shù)優(yōu)化,并輸出最優(yōu)參數(shù)。
(4)將學(xué)習(xí)樣本和優(yōu)化參數(shù)輸入至棧式自編碼式深度學(xué)習(xí)模型中展開特征訓(xùn)練,從而獲得氣象、日類型、經(jīng)濟(jì)水平以及歷史負(fù)荷等高階特征數(shù)據(jù),并通過樣本逐層訓(xùn)練以及模型參數(shù)微調(diào)進(jìn)而匹配最佳組合預(yù)測(cè)模型;
(5)把需要測(cè)試的樣本數(shù)據(jù)輸入至最佳預(yù)測(cè)模型中進(jìn)而展開針對(duì)不同時(shí)期的負(fù)荷預(yù)測(cè),并依據(jù)預(yù)測(cè)結(jié)果對(duì)該模型的有效性和可靠性進(jìn)行評(píng)價(jià)。
為了能夠?qū)χ衅谪?fù)荷預(yù)測(cè)效果展開有效評(píng)價(jià),本文選取相對(duì)誤差ε、平均絕對(duì)百分誤差(εMAPE)、平均百分誤差(εMPE)以及最大誤差(εME)作為評(píng)價(jià)指標(biāo),具體公式為:
式中:參數(shù)fk和Fk分別表示預(yù)測(cè)點(diǎn)的負(fù)荷真實(shí)值和組合模型的預(yù)測(cè)值,參數(shù)n表示預(yù)測(cè)點(diǎn)的個(gè)數(shù)。
算例涉及的負(fù)荷訓(xùn)練數(shù)據(jù)均來源于福建電網(wǎng)某地區(qū)實(shí)際的負(fù)荷數(shù)據(jù),該地區(qū)以居民和學(xué)校為主,包括一些高新企業(yè)。選取該地區(qū)2017 年以及2018 年1 月、2 月的數(shù)據(jù)作為預(yù)測(cè)2019 年1 月負(fù)荷的訓(xùn)練集。將輸入特征向量的數(shù)據(jù)進(jìn)行預(yù)處理,提取主要的影響因素如歷史負(fù)荷、氣溫以及星期屬性,并進(jìn)行編碼分別定義成L、T以及W。
令歷史負(fù)荷L表示預(yù)測(cè)日期之前的M天的日最大負(fù)荷數(shù)據(jù),并以星期為周期表現(xiàn)出周期變化趨勢(shì),令一周的負(fù)荷定義為L(zhǎng)1,L2,……,L7。氣溫T因素在模糊化后,將其三個(gè)溫度段,低溫、中溫以及高溫分別編號(hào)為0、0.5、1。星期屬性則是利用二進(jìn)制編碼,從周一至周日分別定義為[0 0 1,0 1 0,0 1 1,1 0 0,1 0 1,1 1 0,1 1 1]。本文使用的組合深度模型含有3 個(gè)隱藏層,主要有關(guān)參數(shù)設(shè)定為:參數(shù)μ初始值設(shè)為0.1,參數(shù)λ初始值為0.3,參數(shù)ρ初始值設(shè)為0.5,參數(shù)θ初始值為0.1。
本文采用滾動(dòng)預(yù)測(cè)模式,即把前預(yù)測(cè)值作為后續(xù)預(yù)測(cè)的輸入數(shù)據(jù),直至完成所有負(fù)荷預(yù)測(cè)。通過對(duì)2018 年12 月25 日至31 日的數(shù)據(jù)進(jìn)行分析并得到2019 年1 月1 日的預(yù)測(cè)結(jié)果;然后其數(shù)據(jù)樣本更新為2018 年12 月26 日至2019 年1 月1 日的數(shù)據(jù),并得到2019 年1 月2 日的預(yù)測(cè)結(jié)果,依次類推,直到預(yù)測(cè)得到該月的預(yù)測(cè)數(shù)據(jù)。通過MATLAB 仿真,其結(jié)果如表1 所示。
從表1 數(shù)據(jù)可看出,基于自適應(yīng)改進(jìn)棧式自編碼組合算法的預(yù)測(cè)結(jié)果最大相對(duì)誤差為4.62%,預(yù)測(cè)結(jié)果能夠跟蹤實(shí)際值的變化,誤差也符合工程應(yīng)用的范圍,說明了本文所提改進(jìn)方法對(duì)中長(zhǎng)期負(fù)荷預(yù)測(cè)具有較高預(yù)測(cè)精度。
表1 2019 年1 月的負(fù)荷預(yù)測(cè)結(jié)果
氣候因素作為影響中長(zhǎng)期負(fù)荷預(yù)測(cè)精度的重要因素,獲取準(zhǔn)確的氣候數(shù)據(jù)對(duì)于中長(zhǎng)期負(fù)荷預(yù)測(cè)工作而言尤為重要。但實(shí)際收集的氣候數(shù)據(jù)缺失度很高,很難達(dá)到預(yù)期效果。因此,本文預(yù)測(cè)模型開展訓(xùn)練之前先對(duì)氣候數(shù)據(jù)采取了模糊化處理,弱化了一些苛刻氣候?qū)δP陀?xùn)練的影響,具體結(jié)果見圖4 所示。
圖4 氣溫模糊化前后預(yù)測(cè)結(jié)果比較
圖4 給出了采用自適應(yīng)優(yōu)化后,改進(jìn)棧式自編碼算法中氣溫因素在模糊化前后的所得到的結(jié)果對(duì)比。通過分析可以得出氣溫在模糊化后使得負(fù)荷預(yù)測(cè)結(jié)果精度大幅度提升,并且效果在后半階段尤為顯著,預(yù)測(cè)效果比未進(jìn)行模糊化更加的貼近和接近實(shí)際值。
為了進(jìn)一步驗(yàn)證所提基于改進(jìn)棧式自編碼算法的準(zhǔn)確性,表2 給出了對(duì)比算法PSO-SVM、棧式自編碼及改進(jìn)棧式自編碼算法在氣溫模糊化前后的預(yù)測(cè)結(jié)果對(duì)比,通過對(duì)比分析平均絕對(duì)百分誤差(εMAPE)、平均百分誤差(εMPE)以及最大誤差(εME)的誤差評(píng)價(jià)指標(biāo),得到基于改進(jìn)棧式自編碼算法預(yù)測(cè)精度優(yōu)于PSO-SVM 算法,且在自適應(yīng)算法優(yōu)化的基礎(chǔ)上,使氣溫經(jīng)過模糊化后預(yù)測(cè)結(jié)果的準(zhǔn)確性得到了進(jìn)一步提高。
表2 不同算法的負(fù)荷預(yù)測(cè)結(jié)果對(duì)比
為了充分論證本文算法在全年的負(fù)荷預(yù)測(cè)中同樣具有很高的預(yù)測(cè)精度,對(duì)全年的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,見圖5 所示。
圖5 全年不同月份的負(fù)荷預(yù)測(cè)結(jié)果
從圖中可以看出,在氣溫較低的1 月和12 月以及氣溫較高的7 月、8 月和9 月,分別由于取暖和制冷設(shè)備的使用造成其負(fù)荷水平較高;在氣溫較為舒適的3 月至5 月份其用電負(fù)荷則處于最低水平。此外,由于2 月份有春節(jié)和元宵假期,造成其負(fù)荷也處于較低水平。改進(jìn)棧式自編碼算法能夠綜合考慮氣溫和節(jié)假日等因素,其預(yù)測(cè)結(jié)果與實(shí)際情況較為符合,而PSO-SVM 算法雖然能夠表現(xiàn)負(fù)荷隨氣溫變化的大致趨勢(shì),但未表現(xiàn)出秋季的用電低谷,也未考慮到2 月份的假期因素,其與實(shí)際情況偏差較大。因此負(fù)荷預(yù)測(cè)效果比PSO-SVM 方法效果更為顯著。
在構(gòu)造基于改進(jìn)棧式自編碼的中期負(fù)荷預(yù)測(cè)模型時(shí),為了能夠進(jìn)一步提高預(yù)測(cè)精度,提出利用自適應(yīng)微分進(jìn)化算法并結(jié)合氣溫因素進(jìn)而匹配最佳的中期負(fù)荷預(yù)測(cè)模型,得到以下結(jié)論:利用ICA 算法對(duì)因素進(jìn)行篩選,再通過自適應(yīng)微分進(jìn)化算法進(jìn)而對(duì)改進(jìn)棧式自編碼算法的參數(shù)進(jìn)行最佳匹配,不僅能夠有效減少傳統(tǒng)方法在參數(shù)選擇上的無目的性,還可以提高預(yù)測(cè)結(jié)果準(zhǔn)確性。該算法的預(yù)測(cè)結(jié)果誤差比常用的PSO-SVM 算法的小,而且更為穩(wěn)定;將影響負(fù)荷的重要因素氣溫值展開模糊化分析,有效地降低基于改進(jìn)棧式自編碼預(yù)測(cè)模型輸入變量處理對(duì)預(yù)測(cè)結(jié)果精度的影響,進(jìn)一步提高負(fù)荷預(yù)測(cè)準(zhǔn)確度。通過對(duì)全年不同月份負(fù)荷預(yù)測(cè)結(jié)果表明,改進(jìn)棧式自編碼算法能夠綜合考慮氣溫和節(jié)假日等因素,其預(yù)測(cè)結(jié)果更為準(zhǔn)確可靠,也比常用的PSO-SVM 算法預(yù)測(cè)精度高。因此,該改進(jìn)算法的綜合預(yù)測(cè)效果較為顯著。負(fù)荷預(yù)測(cè)模型有效克服了因梯度彌散而陷入局部最優(yōu)的缺陷,經(jīng)過逐層提取負(fù)荷、氣象數(shù)據(jù)間隱含的非線性特征,挖掘出負(fù)荷數(shù)據(jù)流的深層變化規(guī)律,以實(shí)現(xiàn)對(duì)未來負(fù)荷更加準(zhǔn)確的預(yù)測(cè)。