王世芳,鮑程程
(1.安徽工程大學(xué) 電氣工程學(xué)院,安徽 蕪湖 241000;2.西南大學(xué) 電子信息工程學(xué)院,重慶 400715)
電力系統(tǒng)在全國經(jīng)濟(jì)發(fā)展中的作用至關(guān)重要,對(duì)電力負(fù)荷預(yù)測(cè)的精準(zhǔn)程度與國家的發(fā)展以及經(jīng)濟(jì)效益息息相關(guān),因此電力負(fù)荷預(yù)測(cè)在當(dāng)代已成為眾多學(xué)者的研究課題。對(duì)于受到越來越多因素影響的電力負(fù)荷預(yù)測(cè),傳統(tǒng)的憑借經(jīng)驗(yàn)的預(yù)測(cè)方法已不適用于當(dāng)下。在前人研究的基礎(chǔ)上,挑選了兩種較為精確的方法對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè),分別是灰色系統(tǒng)理論與多元線性回歸模型。灰色預(yù)測(cè)理論是針對(duì)包含已知與未知信息的系統(tǒng)進(jìn)行預(yù)測(cè),即通過已知的用電量數(shù)據(jù)來預(yù)測(cè)未來的電力負(fù)荷,而多元線性回歸模型是以電力負(fù)荷為因變量,多個(gè)影響電力負(fù)荷的因素為自變量進(jìn)行預(yù)測(cè),最后分析兩種方法的預(yù)測(cè)精度,對(duì)比哪種方法更適合對(duì)未來電力負(fù)荷進(jìn)行預(yù)測(cè)。理論上這兩種方法都適用于當(dāng)下受多重因素影響的電力負(fù)荷預(yù)測(cè),預(yù)測(cè)結(jié)果表明兩種精度都適合電力負(fù)荷預(yù)測(cè)。
電力負(fù)荷預(yù)測(cè)是通過利用已有的原始數(shù)據(jù)以及相關(guān)信息,找出電力負(fù)荷變化的規(guī)律,從而預(yù)測(cè)其未來的變化情況。隨著經(jīng)濟(jì)的發(fā)展,傳統(tǒng)的負(fù)荷預(yù)測(cè)方法已不適應(yīng)長期電力負(fù)荷預(yù)測(cè)理論的要求。灰色理論把隨機(jī)量當(dāng)作是在一定范圍內(nèi)變化的灰色量,將無規(guī)律的歷史數(shù)據(jù)累加生成特定序列來構(gòu)建微分方程模型。研究在對(duì)蕪湖市市轄區(qū)電力中長期負(fù)荷預(yù)測(cè)的研究中引入了灰色預(yù)測(cè)理論的建模方法以及殘差分析,簡化了問題,保證了預(yù)測(cè)精度的要求。
取安徽省蕪湖市市轄區(qū)的長期電力負(fù)荷情況的原始數(shù)據(jù)x
(j
)為GM
(1,1)建模序列:x
(j
)={x
(1),x
(2),x
(3),…,x
(m
-1),x
(m
)},(1)
在求取GM
(1,1)模型時(shí),首先要對(duì)蕪湖市市轄區(qū)近幾年電力負(fù)荷情況進(jìn)行一階累加生成新的序列,即AGO序列令為x
(j
)={x
(1),x
(2),x
(3),…,x
(m
-1),x
(m
)},(2)
其中,
x
(1)=x
(1),(3)
x
(2)=x
(1)+x
(2),(4)
(5)
取x
(j
)的均值序列令為y
(j
),取y
(j
)為白化背景序列值:y
(j
)=0.
5x
(j
)+0.
5x
(j
-1),(6)
y
(j
)={y
(2),y
(3),y
(4),…,y
(m
-1),y
(m
)},(7)
對(duì)新生成的序列建立GM
(1,1)灰的微分方程:x
(j
)+cx
(j
)=d
,(8)
式中,c
,d
為特定的參數(shù)。c
為發(fā)展系數(shù),它的選取可以適當(dāng)提高背景值的精確度;d
為灰作用量,由于d
是我們計(jì)算得來的,相當(dāng)于作用量,是具有灰的信息覆蓋的作用量。對(duì)新生成的序列建立GM
(1,1)白化形式的微分方程:(9)
I
=(A
A
)A
z
,I
可通過最小二乘法求出,z
=AI
。式中,A
為數(shù)據(jù)矩陣,而(A
A
)A
是數(shù)據(jù)矩陣A
的廣義逆矩陣;I
是參數(shù)向量;z
是數(shù)據(jù)向量。(10)
z
=[x
(2),x
(3),x
(4),…,x
(m
-1),x
(m
)]。(11)
通過式(9)可求得微分方程的解,然后就得到GM
(1,1)預(yù)測(cè)模型如下:(12)
(13)
GM
(1,1)預(yù)測(cè)模型后,要對(duì)其進(jìn)行精度檢驗(yàn),判定所建模型是否合理,只有通過檢驗(yàn)的模型才能用來作預(yù)測(cè),灰色預(yù)測(cè)模型的精度檢驗(yàn)一般有三種方法:相對(duì)誤差大小檢驗(yàn)法,關(guān)聯(lián)度檢驗(yàn)法以及后驗(yàn)差檢驗(yàn)法,如表1所示。研究主要介紹后驗(yàn)差檢驗(yàn)法。計(jì)算殘差得(14)
(15)
(16)
(17)
后驗(yàn)差比值為
(18)
式中,P
與C
是后驗(yàn)差檢驗(yàn)法的兩個(gè)重要指標(biāo)。其中,C
越小越好,C
越小則S
越大,而S
越小。S
大則樣本數(shù)據(jù)方差大,即樣本數(shù)據(jù)離散程度大;S
小則殘方差小,即殘差數(shù)據(jù)離散程度小。C
小則盡管樣本數(shù)據(jù)離散,而GM
(1,1)模型計(jì)算的預(yù)測(cè)值與實(shí)際值相差不是很離散。.
37%,最大誤差為13.76%,而2011年預(yù)測(cè)的相對(duì)誤差只有0.37%,均方差比值C
=0.
1,后驗(yàn)差比值P
=1,則說明系統(tǒng)預(yù)測(cè)精度好,對(duì)本組選取的數(shù)據(jù)而言,該預(yù)測(cè)精度足夠?qū)ξ磥碛秒娏窟M(jìn)行預(yù)測(cè)。表1 精度檢驗(yàn)表
表2 2006~2012年蕪湖市市轄區(qū)用電量(×108 kW·h)
表3 蕪湖市市轄區(qū)用電量預(yù)測(cè)(×108 kW·h)
灰色預(yù)測(cè)理論仿真圖如圖1所示?;疑A(yù)測(cè)理論模型程序流程圖如圖2所示。
圖1 灰色預(yù)測(cè)理論仿真圖圖2 灰色預(yù)測(cè)理論模型程序流程圖
r
個(gè)影響因素,即自變量分別為A
,A
,…,A
,因變量為B
,(a
1,a
2,…,a
,b
)(i
=0,1,…,m
)為(A
,A
,…,A
,B
)的實(shí)驗(yàn)數(shù)據(jù),即(19)
式中,回歸系數(shù)α
(i
=0,1,…,r
)與σ
都是未知的,γ
是隨機(jī)誤差。取α
=(α
,α
,…,α
),B
=(b
,b
,…,b
),γ
=(γ
,γ
,…,γ
),其中,(20)
則多元線性回歸模型為
(21)
(22)
(23)
殘差平方和為
(24)
對(duì)給定觀測(cè)數(shù)據(jù)(a
1,a
2,…,a
,b
)(i
=0,1,…,m
)而言,α
選擇式(25)的最優(yōu)解。(25)
(26)
研究以蕪湖市市轄區(qū)的用電量為因變量,以2002~2012年蕪湖市市轄區(qū)的GDP以及人口為自變量進(jìn)行電力負(fù)荷預(yù)測(cè)。該多元線性回歸模型將采用Excel軟件進(jìn)行相關(guān)問題的分析處理,通過選中Excel菜單欄中“工具”的“加載宏”命令,選擇“分析工具庫”中的“數(shù)據(jù)分析”里的“回歸”,即可進(jìn)行分析預(yù)測(cè)。
(1)線性回歸分析。以蕪湖市市轄區(qū)用電量為因變量Y
,GDP和人口為自變量X
、X
,用Excel進(jìn)行線性回歸分析,2002~2012年蕪湖市市轄區(qū)用電量與GDP、人口數(shù)據(jù)如表4所示。表4 2002~2012年蕪湖市市轄區(qū)用電量、GDP與人口數(shù)據(jù)表
(2)線性回歸結(jié)果檢驗(yàn)。
①回歸統(tǒng)計(jì)表如表5所示。由表5可知,復(fù)相關(guān)系數(shù)Multiple
R
是0.
993 58,則GDP與蕪湖市市轄區(qū)用電量的關(guān)系呈高度正相關(guān);而多重判定相關(guān)系數(shù)R
Square
即復(fù)相關(guān)系數(shù)的平方,表現(xiàn)的是自變量解釋因變量變差的程度,R
Squsre
為0.
987 20;修正多重判定系數(shù)Adjusted
R
用于多元回歸,Adjusted
R
為0.
983 99,其擬合優(yōu)度較高,表明蕪湖市市轄區(qū)用電量有98.
399%由人口與GDP決定,標(biāo)準(zhǔn)誤差表明觀測(cè)值與趨勢(shì)值平均離差。表5 回歸統(tǒng)計(jì)表
表6 方差分析表
該計(jì)算中用每個(gè)平方和分別除以總平方和,4 111.
415(SS
列的回歸分析)÷4 164.
746(SS
列的總計(jì))=0.
987 20(多重判定相關(guān)系數(shù)),即GDP及人口對(duì)蕪湖市市轄區(qū)用電量影響為98.
72%,殘差變量影響了剩余的1.
28%(52.
330(SS
列殘差)÷4 164.
746(SS
列總計(jì)));由F
值計(jì)算得到的P
值為2.
69E
-08(實(shí)際值為0.
000 000 026 9),小于置信水平0.
05,表明回歸方程的回歸效果顯著,因此可以用自變量的變化解釋因變量的變化。③回歸系數(shù)的顯著性檢驗(yàn)表如表7所示。由表7可知,數(shù)據(jù)都是截距與斜率的各項(xiàng)指標(biāo),依次為非標(biāo)準(zhǔn)化的偏回歸系數(shù),偏回歸系數(shù)的標(biāo)準(zhǔn)誤差,原假設(shè)為0的樣本統(tǒng)計(jì)量,各系數(shù)P
值及置信區(qū)間上下限。GDP回歸系數(shù)為0.
055 52,P
值為0.
000 01,表明該回歸方程中變量GDP有統(tǒng)計(jì)學(xué)意義。由表7第二列的值可知,蕪湖市市轄區(qū)電力負(fù)荷預(yù)測(cè)回歸方程式為:用電量=-0.
553 82+0.
055 52×GDP+0.
095 23×人口,通過GDP數(shù)據(jù)可對(duì)蕪湖市市轄區(qū)用電量的電力負(fù)荷進(jìn)行定量預(yù)測(cè)。表7 回歸系數(shù)的顯著性檢驗(yàn)表
如2013年蕪湖市市轄區(qū)人口為136.
10萬,GDP為1 269.
08億元,用電量為83.
16億千瓦時(shí),則由上述回歸方程式可求得:(27)
由回歸方程得到的用電量與實(shí)際值有一定誤差,但是并不影響多元線性回歸模型的有效性。
④觀測(cè)值與預(yù)測(cè)值對(duì)比如表8所示。由表8與表4對(duì)比可知,Excel擬合結(jié)果與算法預(yù)測(cè)結(jié)果基本一致,各年用電量預(yù)測(cè)的平均相對(duì)誤差為5.62%,2004年電力負(fù)荷預(yù)測(cè)的相對(duì)誤差低至0.52%,最大的相對(duì)誤差是15.76%。綜上,準(zhǔn)確的用電量的預(yù)測(cè)必須建立在準(zhǔn)確的GDP及人口數(shù)據(jù)基礎(chǔ)上,復(fù)雜以及經(jīng)常變動(dòng)的經(jīng)濟(jì)環(huán)境可能會(huì)影響GDP及人口預(yù)測(cè)的準(zhǔn)確性,帶來一些誤差,但這對(duì)線性回歸模型有效性影響不大,本回歸模型及結(jié)果可以作為負(fù)荷預(yù)測(cè)的科學(xué)依據(jù)。
表8 Excel擬合所得觀測(cè)值與預(yù)測(cè)值對(duì)比表(×108 kW·h)
(3)擬合結(jié)果。GDP與蕪湖市市轄區(qū)用電量擬合情況如圖3所示。人口與蕪湖市市轄區(qū)用電量擬合情況如圖4所示。利用Excel中顯示趨勢(shì)線的公式與R
的平方值生成趨勢(shì)線,得出回歸線性方程。由圖3可知,用電量與GDP的回歸方程為y
=0.
061 2x
+5.
662 7,其中,R
=0.
997 9,R
是Y
的預(yù)估值與實(shí)際值之比,其越接近1,說明線性擬合效果越好,相關(guān)性越強(qiáng)。由圖4可知,人口與用電量的回歸方程為y
=0.
844 2x
-43.
794,其中,R
=0.
839 1,表明該回歸模型所預(yù)測(cè)的負(fù)荷有較高的預(yù)測(cè)精度,可用來對(duì)蕪湖市市轄區(qū)未來幾年負(fù)荷進(jìn)行預(yù)測(cè)。圖3 GDP與蕪湖市市轄區(qū)用電量擬合情況圖4 人口與蕪湖市市轄區(qū)用電量擬合情況
對(duì)蕪湖市市轄區(qū)2002~2012年用電量分別采用灰色預(yù)測(cè)理論模型以及多元線性回歸模型的方法進(jìn)行預(yù)測(cè),預(yù)測(cè)值如表9所示。表9對(duì)應(yīng)的擬合圖如圖5所示。對(duì)兩種方法所得預(yù)測(cè)值分別進(jìn)行了相對(duì)誤差計(jì)算,計(jì)算結(jié)果如表10所示。
表9 蕪湖市市轄區(qū)用電量觀測(cè)值與兩種方法所得預(yù)測(cè)值對(duì)比表(×108 kW·h)
圖5 觀測(cè)值與兩種方法所得預(yù)測(cè)值對(duì)比圖
表10 兩種方法誤差對(duì)比表
通過上述計(jì)算以及Matlab仿真與Excel擬合結(jié)果可知,當(dāng)分別采用灰色預(yù)測(cè)理論即多元線性回歸模型對(duì)2002~2012年蕪湖市市轄區(qū)用電量進(jìn)行預(yù)測(cè)時(shí),兩種方法預(yù)測(cè)結(jié)果的精度都符合要求,但二者是有差異的。由灰色預(yù)測(cè)理論預(yù)測(cè)得到的平均相對(duì)誤差不到5.37%,最大相對(duì)誤差是13.76%,而由多元線性回歸模型預(yù)測(cè)得到的平均相對(duì)誤差為5.62%,比灰色預(yù)測(cè)理論模型平均相對(duì)誤差高,多元線性回歸模型的最大相對(duì)誤差是15.76%。由此可見,灰色預(yù)測(cè)理論模型更適合對(duì)未來中期電力負(fù)荷進(jìn)行預(yù)測(cè)。
對(duì)于其他案例應(yīng)用灰色預(yù)測(cè)理論,如果精度不夠,還可以對(duì)其進(jìn)行改進(jìn)。通過建立殘差序列進(jìn)行修正,或者對(duì)原始數(shù)據(jù)加以處理,都可以提高GM
(1,1)模型的精度?;疑A(yù)測(cè)理論相對(duì)于多元線性回歸模型而言,不用考慮多個(gè)自變量的影響,只需要一組原始數(shù)據(jù)就可以對(duì)用電量進(jìn)行預(yù)測(cè),需要的數(shù)據(jù)少,方法簡單。研究分別利用灰色預(yù)測(cè)理論與多元線性回歸模型兩種算法對(duì)蕪湖市市轄區(qū)的用電量進(jìn)行負(fù)荷預(yù)測(cè),有一定的實(shí)用價(jià)值,而同類成果只采取了其中某一種方法進(jìn)行負(fù)荷預(yù)測(cè),沒有進(jìn)行算法的對(duì)比,實(shí)用性一般。安徽工程大學(xué)學(xué)報(bào)2021年5期