李 婧, 田龍威, 王艷青
(上海電力學(xué)院 a.計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院; b.電氣工程學(xué)院, 上海 200090)
電力系統(tǒng)穩(wěn)定安全有效的運(yùn)行關(guān)乎國(guó)計(jì)民生。文獻(xiàn)[1-2]的研究表明,電力系統(tǒng)短期負(fù)荷預(yù)測(cè)的準(zhǔn)確性對(duì)電力系統(tǒng)合理運(yùn)行具有十分重要的作用,是電網(wǎng)分配電能的重要依據(jù)。
電力系統(tǒng)中的負(fù)荷預(yù)測(cè)對(duì)電力企業(yè)來(lái)說(shuō)十分重要,有助于合理規(guī)劃電力的生產(chǎn)輸送和傳輸分配。文獻(xiàn)[3]提出,由于諸多因素(比如季節(jié)、假期、周末和社會(huì)發(fā)展等)的影響,導(dǎo)致電力負(fù)荷的時(shí)序變化呈現(xiàn)不規(guī)則的曲線,因此必須全面分析各種因素對(duì)電力系統(tǒng)的影響,找出內(nèi)在規(guī)律,才能建立合適的高精度的預(yù)測(cè)模型。國(guó)內(nèi)外學(xué)者對(duì)此進(jìn)行了大量的研究,常用的算法也有很多,比如神經(jīng)網(wǎng)絡(luò)、時(shí)間序列、灰色模型、隨機(jī)森林等。文獻(xiàn)[4]提出了一種多變量時(shí)間序列的控制自回歸模型進(jìn)行短期預(yù)測(cè);文獻(xiàn)[5]提出了一種基于極限學(xué)習(xí)機(jī)的短期負(fù)荷預(yù)測(cè)集成預(yù)測(cè)模型并利用混合算法提升精度;文獻(xiàn)[6]利用電力系統(tǒng)負(fù)荷的局部特征并利用人工免疫算法進(jìn)行短期負(fù)荷預(yù)測(cè);文獻(xiàn)[7]考慮了多種因素,利用粒子群改進(jìn)算法模型以提高預(yù)測(cè)的精度;文獻(xiàn)[8]在Spark分布式集群環(huán)境下搭建了并行隨機(jī)森林回歸算法模型進(jìn)行預(yù)測(cè),該算法表現(xiàn)出了良好的魯棒性;文獻(xiàn)[9]針對(duì)電力用戶,按用電特征“分層”得到了表征不同類型電力用戶用電特征的層負(fù)荷特性曲線,并以匯集方式回歸建模;文獻(xiàn)[10]采用改進(jìn)誤差最小化的差分進(jìn)化算法,以提高人工神經(jīng)網(wǎng)絡(luò)的精度;文獻(xiàn)[11]最早提出了徑向基函數(shù)(Radial Basis Function,RBF)的概念;文獻(xiàn)[12]將RBF運(yùn)用于神經(jīng)網(wǎng)絡(luò)中,提出了3層RBF網(wǎng)絡(luò)模型;文獻(xiàn)[13-15]中的神經(jīng)網(wǎng)絡(luò)以其快速的學(xué)習(xí)速度、良好的泛化能力被廣泛應(yīng)用于各種分線性擬合、時(shí)間序列分析等問(wèn)題。
針對(duì)RBF網(wǎng)絡(luò)在電力負(fù)荷預(yù)測(cè)中由層數(shù)引起的過(guò)擬合或欠擬合的缺陷,本文利用RBF模型優(yōu)越的擬合能力和遺傳算法(Genetic Algorithm,GA)強(qiáng)大的進(jìn)化尋優(yōu)能力,提出一種GA-RBF電力系統(tǒng)短期負(fù)荷預(yù)測(cè)模型。并利用電力系統(tǒng)實(shí)測(cè)負(fù)荷數(shù)據(jù),分析GA-RBF模型和RBF基本模型的預(yù)測(cè)效果,以驗(yàn)證所提出的電力系統(tǒng)短期負(fù)荷預(yù)測(cè)模型的精確性。
基于電力系統(tǒng)負(fù)荷數(shù)據(jù)序列的非線性特征,利用RBF強(qiáng)大的擬合能力,能更好地尋找負(fù)荷數(shù)據(jù)的內(nèi)部規(guī)律,采用GA優(yōu)化RBF網(wǎng)絡(luò)中的層數(shù),構(gòu)成GA-RBF模型,優(yōu)化傳統(tǒng)RBF模型的不足,實(shí)現(xiàn)更精確的預(yù)測(cè)。
GA是根據(jù)生物進(jìn)化方式而產(chǎn)生的一種隨機(jī)化的啟發(fā)式算法模型。文獻(xiàn)[16]提到,GA通過(guò)對(duì)種群進(jìn)行遺傳操作實(shí)現(xiàn)種群個(gè)體的迭代優(yōu)化,以得到更好的適應(yīng)度。其遺傳操作主要是對(duì)種群進(jìn)行選擇、交叉、變異操作從而實(shí)現(xiàn)種群進(jìn)化。
(1) 適度函數(shù)的選擇 適度函數(shù)的取值直接決定GA種群中個(gè)體的優(yōu)劣。本文中GA主要對(duì)RBF網(wǎng)絡(luò)訓(xùn)練以發(fā)現(xiàn)最優(yōu)的隱藏層數(shù),而種群的隨機(jī)性易使RBF預(yù)測(cè)模型產(chǎn)生過(guò)擬合。為避免過(guò)擬合,故選平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)為適度函數(shù)。
(1)
式中:yi——第i次預(yù)測(cè)的值;
(3) 交叉和變異 交叉和變異都是根據(jù)事先定好的概率選擇相應(yīng)的種群個(gè)體進(jìn)行操作。交叉主要是兩條染色體根據(jù)交叉位點(diǎn)互換部分染色體進(jìn)而產(chǎn)生新的個(gè)體;變異主要是對(duì)選擇的染色體上的某點(diǎn)進(jìn)行取反變換,即0變成1或1變?yōu)?的操作。
圖1為一種高效的采用局部逼近方式的RBF神經(jīng)網(wǎng)絡(luò)的3層結(jié)構(gòu)圖。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖1中,x為神經(jīng)網(wǎng)絡(luò)的輸入向量,x=(x[1],x[2],x[3],…,x[m]);w1,w2,w3,…,wn為網(wǎng)絡(luò)的隱藏層到輸出層的權(quán)值;y為輸出向量。RBF可以逼近任意非線性函數(shù),在訓(xùn)練中,相比其他神經(jīng)網(wǎng)絡(luò)更加簡(jiǎn)潔且有更快的收斂速度,并且Cover定理也保證了RBF神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)上的合理性。
1.2.1 RBF神經(jīng)網(wǎng)絡(luò)的基本構(gòu)成
RBF網(wǎng)絡(luò)輸入層的選取直接影響著輸出結(jié)果的精確度。本文選取影響電力系統(tǒng)負(fù)荷預(yù)測(cè)的相關(guān)因素,如溫度、星期及延遲一階的數(shù)據(jù)等作為輸入層。
RBF網(wǎng)絡(luò)隱藏層的激活函數(shù)為徑向基函數(shù)——局部沿中心點(diǎn)徑向?qū)ΨQ增加或衰減的非負(fù)線性函數(shù)。由于高斯函數(shù)形式簡(jiǎn)單且對(duì)多變量的輸入復(fù)雜程度也不增加太多,故本文選取常用的高斯函數(shù)作為其激活函數(shù),即
(2)
式中:x——隱藏層節(jié)點(diǎn)的輸入向量;
ci——第i節(jié)點(diǎn)的中心向量;
σi——第i節(jié)點(diǎn)高斯函數(shù)的寬度;
‖‖——?dú)W式范數(shù)。
RBF的輸出層即為預(yù)測(cè)結(jié)果,根據(jù)預(yù)測(cè)需求可以是單個(gè)預(yù)測(cè)值也可以是多個(gè)預(yù)測(cè)值。本文的預(yù)測(cè)結(jié)果為單個(gè)預(yù)測(cè)值,其表達(dá)式為
yi=WΦi
(3)
式中:W——權(quán)值向量;
Φi——隱藏層中心向量。
1.2.2 RBF神經(jīng)網(wǎng)絡(luò)隱藏層的結(jié)構(gòu)設(shè)計(jì)及權(quán)值修正策略
RBF神經(jīng)網(wǎng)絡(luò)的兩個(gè)主要問(wèn)題是網(wǎng)絡(luò)隱藏層的結(jié)構(gòu)設(shè)計(jì)問(wèn)題和輸出層的權(quán)值修正問(wèn)題。RBF的結(jié)構(gòu)設(shè)計(jì)就是采用非線性優(yōu)化方法對(duì)隱藏層節(jié)點(diǎn)數(shù)的確定以及函數(shù)的參數(shù)優(yōu)化問(wèn)題,隱藏層的神經(jīng)元數(shù)目應(yīng)在一個(gè)合理的范圍內(nèi),過(guò)小通常會(huì)造成模型泛化嚴(yán)重,過(guò)大則會(huì)造成過(guò)擬合問(wèn)題。一般情況下,其數(shù)量應(yīng)在[n,m]范圍內(nèi)(n是輸入層數(shù)量,m是樣本總數(shù))。由于樣本總數(shù)較大,因此其數(shù)量應(yīng)遠(yuǎn)小于樣本總數(shù)。
首先,針對(duì)RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì),本文使用Kmeans聚類算法對(duì)數(shù)據(jù)進(jìn)行分類。隱藏層的神經(jīng)元數(shù)目N即為分類數(shù)據(jù)的k值,利用Kmeans算法可求出聚類中心ci和徑向基函數(shù)的寬度σi
(4)
數(shù)據(jù)分類過(guò)程中k值的好壞會(huì)直接影響RBF神經(jīng)網(wǎng)絡(luò)的性能。本文將訓(xùn)練數(shù)據(jù)集劃分為a和b兩部分,利用遺傳算法得到最優(yōu)的N值,即得最優(yōu)k值。
其次,采用負(fù)梯度下降方式更新權(quán)重。定義RBF神經(jīng)網(wǎng)絡(luò)的誤差函數(shù)和性能函數(shù)分別為
(5)
(6)
RBF輸出層的權(quán)值調(diào)整策略為
(7)
式中:Wm——m次迭代的權(quán)值矩陣,m=0,1,2,…,imax,imax為最大迭代次數(shù);
η——學(xué)習(xí)速率,0<η<1;
em——m次迭代的誤差矩陣。
定 理η為學(xué)習(xí)速率,則當(dāng)0<η<1/N時(shí)神經(jīng)網(wǎng)絡(luò)算法收斂。
證 明取Lyapunov函數(shù)為J(m)=0.5e2(m),則
ΔJ(m)=0.5e2(m+1)-0.5e2(m)
(8)
故可得
ΔJ(m)=0.5[e(m)+Δe(m)]2-0.5e2(m)=
Δe(m)[e(m)+0.5Δe(m)]=
(9)
(10)
又有
(11)
(12)
由式(9)和式(12)可知,0<η<1/N,即當(dāng)學(xué)習(xí)速率滿足0<η<1/N時(shí),ΔJ(m)<0,因此本文算法是收斂的。
改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練基本步驟如下。
步驟1 初始化數(shù)據(jù)集:對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行去噪和標(biāo)準(zhǔn)化處理,以減少不合理數(shù)據(jù)對(duì)預(yù)測(cè)的影響并減小計(jì)算量。以某地區(qū)3個(gè)月的歷史負(fù)荷為訓(xùn)練數(shù)據(jù)集,實(shí)驗(yàn)數(shù)據(jù)每1 h采集一次,一天共計(jì)24點(diǎn)的負(fù)荷數(shù)據(jù)。由于原始數(shù)據(jù)一般范圍比較大且其量綱不同,故對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理以簡(jiǎn)化計(jì)算。
(13)
步驟2 將訓(xùn)練數(shù)據(jù)集劃分為a和b兩部分,其中b部分為選取訓(xùn)練集某日的數(shù)據(jù),a為訓(xùn)練集中去除b部分的數(shù)據(jù)。
步驟3 利用GA生成初始種群。
步驟4 利用種群參數(shù),令Kmeans算法中k=N將數(shù)據(jù)分類,根據(jù)分類結(jié)果得到分類中心,即為隱藏層徑向基函數(shù)的中心c。寬度σ可由式(4)計(jì)算得出。
步驟5 利用步驟4隱藏層個(gè)數(shù)N,徑向基函數(shù)的中心c及寬度σ構(gòu)建RBF訓(xùn)練模型,對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,并利用負(fù)梯度下降法更新權(quán)重,直到精度滿足要求或迭代次數(shù)達(dá)到最大值。
步驟6 利用訓(xùn)練好的RBF模型對(duì)訓(xùn)練集中待預(yù)測(cè)日進(jìn)行預(yù)測(cè),然后計(jì)算每個(gè)種群的適應(yīng)度,即MAPE。
步驟7 判斷條件是否停止。否,對(duì)種群根據(jù)各自適應(yīng)度進(jìn)行選擇交叉變異,然后轉(zhuǎn)向步驟4;是,進(jìn)入下一步驟。
步驟8 按照訓(xùn)練結(jié)果選擇種群中適應(yīng)度最優(yōu)的個(gè)體作為RBF的隱藏層層數(shù)N,對(duì)整個(gè)訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,獲取GA-RBF神經(jīng)網(wǎng)絡(luò)模型各參數(shù)。
步驟9 對(duì)待預(yù)測(cè)日進(jìn)行預(yù)測(cè),獲取待預(yù)測(cè)日的電力負(fù)荷數(shù)據(jù)。
本模型的流程圖如圖2所示。
圖2 模型流程示意
根據(jù)所建立的模型對(duì)某地區(qū)2009年5月16日(周末日期更具代表性)每小時(shí)的負(fù)荷數(shù)據(jù)(一天共計(jì)24個(gè)負(fù)荷值)進(jìn)行預(yù)測(cè)。訓(xùn)練數(shù)據(jù)取2月1日到5月15日的歷史數(shù)據(jù)。變量的編碼位數(shù)和種群數(shù)目為11和10,遺傳次數(shù)為50,交叉和變異概率分別為0.75和0.1。
利用GA-RBF神經(jīng)網(wǎng)絡(luò)建立的負(fù)荷預(yù)測(cè)模型對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,模型的適應(yīng)度變化如圖3所示。
圖3 模型適應(yīng)度的平均值和最優(yōu)值變化曲線
由圖3可知,經(jīng)過(guò)50代的遺傳變異,模型的最優(yōu)適應(yīng)度達(dá)到了1.113 4,對(duì)應(yīng)最佳層數(shù)為956層,此時(shí)模型的泛化能力達(dá)到最佳狀態(tài)。
利用所建GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和基本RBF模型分別對(duì)電力系統(tǒng)短期負(fù)荷進(jìn)行預(yù)測(cè)?;灸P椭饕捎肕ATLAB內(nèi)置net=Newrb()模型,通過(guò)定義其合適的隱藏層數(shù)進(jìn)行預(yù)測(cè)。不同模型的預(yù)測(cè)結(jié)果曲線和預(yù)測(cè)誤差如圖4和圖5所示。
圖4 不同模型的預(yù)測(cè)曲線對(duì)比
圖5 兩種模型的預(yù)測(cè)誤差對(duì)比
由圖4可以看出,本文算法的預(yù)測(cè)效果更好,能以更小的誤差擬合待預(yù)測(cè)日的負(fù)荷曲線。從圖5可以看出,GA-RBF算法有效地減小了模型的預(yù)測(cè)誤差。
為了更精確對(duì)比兩種模型,本文選取兩種量化指標(biāo)對(duì)預(yù)測(cè)效果進(jìn)行分析,分別為MAPE和平均絕對(duì)誤差(Mean Absolute Error,MAE)。
(15)
對(duì)比模型是MATLAB中基本的RBF預(yù)測(cè)模型和GA-RBF模型。表1為2009年 5月16日每小時(shí)負(fù)荷預(yù)測(cè)結(jié)果對(duì)比,表2為量化指標(biāo)結(jié)果對(duì)比。
表1 2009年5月16日每小時(shí)負(fù)荷預(yù)測(cè)結(jié)果對(duì)比
表2 量化指標(biāo)結(jié)果對(duì)比
由表1可以看出,GA-RBF模型相對(duì)于RBF模型擁有更小的誤差;由表2可以看出,GA-RBF模型相比于基本的RBF模型的MAPE值降低了4.7%,同樣GA-RBF模型的量化指標(biāo)MAE相較于RBF模型降低了60.27 kW。由此可知,改進(jìn)的RBF模型能夠更加有效準(zhǔn)確地對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè),且相較于RBF模型擁有更高的精度。
每個(gè)日期及總的量化指標(biāo)數(shù)據(jù)比較如表3所示。由表3可知,GA-RBF模型有更準(zhǔn)確的預(yù)測(cè)結(jié)果,進(jìn)一步驗(yàn)證了該模型的有效性。
表3 量化指標(biāo)結(jié)果對(duì)比
本文利用RBF高效的非線性擬合特性進(jìn)行了電力系統(tǒng)短期負(fù)荷預(yù)測(cè),提出了一種GA-RBF神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)短期負(fù)荷預(yù)測(cè)方法。既能有效地確定網(wǎng)絡(luò)的最佳層數(shù),又能避免網(wǎng)絡(luò)的過(guò)擬合問(wèn)題。通過(guò)仿真結(jié)果可知,相比于傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有更準(zhǔn)確的預(yù)測(cè)結(jié)果和良好的泛化能力。