曹敏 巨健 白澤洋 劉駿濤
(1 國(guó)網(wǎng)陜西省電力公司 陜西西安 710048 2 蘇文電能科技股份有限公司 江蘇常州 213000)
相關(guān)學(xué)者已經(jīng)對(duì)用電量的預(yù)測(cè)進(jìn)行了深入的研究, 取得了顯著的成果。 文獻(xiàn)[4]和文獻(xiàn)[5]在傳統(tǒng)的灰色預(yù)測(cè)模型的基礎(chǔ)上,提出了改進(jìn)的灰色模型電量預(yù)測(cè)方法;文獻(xiàn)[6]和文獻(xiàn)[7]將偏最小二乘回歸分析方法用于中長(zhǎng)期電力負(fù)荷預(yù)測(cè);文獻(xiàn)[8]和文獻(xiàn)[9]將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于電力預(yù)測(cè)當(dāng)中。
除了上述方法外, 另外最具代表性的就是自回歸移動(dòng)平均(Auto-Regressive and Moving Average Model,ARMA)模型和支持向量機(jī)(Support Vector Machine,SVM)模型。 已經(jīng)有許多研究將它們應(yīng)用于電力預(yù)測(cè)當(dāng)中[10-11]。ARMA 模型由自回歸模型(AR)和移動(dòng)平均模型(MA)組成,采用歷史數(shù)據(jù)和白噪聲序列進(jìn)行預(yù)測(cè), 是一種精確度較高的線性時(shí)間序列預(yù)測(cè)模型。SVM 模型是根據(jù)統(tǒng)計(jì)學(xué)理論提出的一種機(jī)器學(xué)習(xí)方法, 是一種性能優(yōu)異的非線性分析模型。 用電量預(yù)測(cè)的不確定性主要是因?yàn)橛绊懫漕A(yù)測(cè)結(jié)果的各種內(nèi)在和外在因素較多, 只通過(guò)單一的線性或者非線性描述進(jìn)行預(yù)測(cè)的結(jié)果精準(zhǔn)度較低。 因此本文提出一種基于ARMA 和SVM 模型的用電量組合預(yù)測(cè)方法,對(duì)售電公司下用電企業(yè)的用電量進(jìn)行預(yù)測(cè),通過(guò)將預(yù)測(cè)結(jié)果與單一ARMA 和SVM 模型的預(yù)測(cè)結(jié)果進(jìn)行比較,驗(yàn)證本文模型的有效性和可行性。
自回歸移動(dòng)平均模型的預(yù)測(cè)過(guò)程有模型定階、參數(shù)估計(jì)、求解等步驟。 模型的數(shù)學(xué)表達(dá)式為:
式中:Lt為預(yù)測(cè)結(jié)果,i(1≤i≤p)和θj(1≤j≤q)為系數(shù),p、q 分別為自回歸部分模型和移動(dòng)平均部分模型的階數(shù),αt是白噪聲序列,Xt是歷史數(shù)據(jù)序列。
預(yù)測(cè)結(jié)果與前p 次的歷史數(shù)據(jù)有關(guān), 同時(shí)也受到前q 次以及當(dāng)前的隨機(jī)干擾項(xiàng)的影響。
采用從低階到高階逐步試探的方法確定模型階數(shù), 并確定最優(yōu)參數(shù)。 根據(jù)已確定的階數(shù)和參數(shù),得到最優(yōu)模型,得到t時(shí)刻的線性部分的預(yù)測(cè)結(jié)果Lt。
4)水利部門(mén)資料。水利普查成果等資料,可作為地理國(guó)情信息普查中水體、水工設(shè)施信息獲取的重要輔助資料,提高普查結(jié)果精度。水利部門(mén)的流域單元邊界數(shù)據(jù)及流域單元名稱(chēng),河流空間分布數(shù)據(jù)及相關(guān)屬性信息,湖泊空間分布數(shù)據(jù)及相關(guān)屬性信息,水庫(kù)、塘壩屬性;水電站、水閘、堤防名稱(chēng)及編碼、級(jí)別屬性;取水口、地表水源地、入河湖排污口的空間分布數(shù)據(jù)及相關(guān)屬性信息;水文站和水位站空間分布數(shù)據(jù),為地理國(guó)情普查數(shù)據(jù)采集及統(tǒng)計(jì)分析提供數(shù)據(jù)來(lái)源。
ARMA 模型對(duì)線性數(shù)據(jù)的處理較有優(yōu)勢(shì), 但是對(duì)非線性數(shù)據(jù)的信息較難捕捉, 其預(yù)測(cè)只考慮時(shí)間序列本身的變化規(guī)律,幾乎不考慮其它相關(guān)變量的變化情況,而現(xiàn)實(shí)中的時(shí)間序列受到眾多非線性因素的影響且含有復(fù)雜的噪聲, 其確定的階數(shù)和參數(shù)往往并非最優(yōu),從而導(dǎo)致預(yù)測(cè)精度不高。
支持向量機(jī)模型的預(yù)測(cè)過(guò)程包括支持向量確定、 核函數(shù)選擇、核參數(shù)確定、求解等步驟。 模型的數(shù)學(xué)表達(dá)式為:
式中:SVS 為支持向量個(gè)數(shù),αi為每個(gè)訓(xùn)練樣本的拉格朗日系數(shù),yi(-1 或1)為向量標(biāo)簽,K(xi,x)為所選擇的核函數(shù),b0為偏置量。 核函數(shù)代替了傳統(tǒng)線性方程中的線性量,將數(shù)據(jù)映射到高維空間處理, 選擇合適的核函數(shù)直接影響預(yù)測(cè)模型的性能和準(zhǔn)確性,完成核函數(shù)的選擇后,計(jì)算核函數(shù)的最優(yōu)核參數(shù),隨后對(duì)樣本進(jìn)行訓(xùn)練預(yù)測(cè),建立SVM 模型,求得相關(guān)參數(shù),最終得到預(yù)測(cè)結(jié)果Nt。
SVM 模型在解決非線性、小樣本、高維數(shù)的模式識(shí)別方面具有良好的泛化能力,其得到的最優(yōu)解具有全局性,解決了其它算法中無(wú)法避免的局部最優(yōu)問(wèn)題。 但其預(yù)測(cè)效果對(duì)核函數(shù)的選擇較為敏感,學(xué)習(xí)能力由核函數(shù)的類(lèi)型和參數(shù)決定,對(duì)于大樣本數(shù)據(jù)較難得到理想的訓(xùn)練效果, 需要提升其泛化能力和訓(xùn)練效率。
售電公司下用戶的用電量受到眾多因素的影響, 由于其為月度統(tǒng)計(jì), 因此以年為單位會(huì)呈現(xiàn)一定的周期性規(guī)律,ARMA 作為1 種時(shí)間序列方法,可以較好地對(duì)用電量的線性相關(guān)性做出預(yù)測(cè)。 同時(shí),用戶的用電量還受到用電負(fù)荷、溫度、計(jì)劃用電量等因素的影響, 且這些因素之間也有著錯(cuò)綜復(fù)雜的關(guān)系,將這些因素作為變量輸入SVM 模型進(jìn)行非線性回歸,可以較好的完成對(duì)用電量非線性部分的預(yù)測(cè)。
本文針對(duì)售電公司用戶用電量的預(yù)測(cè)問(wèn)題, 基于ARMA和SVM 模型采用1 種組合的預(yù)測(cè)方法, 把用電量時(shí)間序列看成由線性自相關(guān)結(jié)構(gòu)和非線性結(jié)構(gòu)兩部分構(gòu)成, 分別發(fā)揮ARMA 模型和SVM 模型對(duì)線性模型和非線性模型處理的優(yōu)勢(shì),將二者組合進(jìn)行用電量的預(yù)測(cè)。 通過(guò)組合模型進(jìn)行預(yù)測(cè)的具體步驟如下:
(1)獲取歷史用電量實(shí)際數(shù)據(jù);
(2)構(gòu)建ARMA 模型得到t 時(shí)刻的線性部分的預(yù)測(cè)結(jié)果Lt;
(3)重復(fù)步驟(2),對(duì)最后n 個(gè)樣本進(jìn)行預(yù)測(cè),得到預(yù)測(cè)結(jié)果序列L;
(4)將上一步得到的預(yù)測(cè)結(jié)果序列L 與歷史用電量數(shù)據(jù)相減,得到殘差序列N;
(5)獲取負(fù)荷、計(jì)劃用電量、溫度的歷史數(shù)據(jù);
(6)將步驟(5)獲取的數(shù)據(jù)與步驟(4)得到的殘差序列N進(jìn)行歸一化處理:
式中:yi為歸一化結(jié)果;xi為原始數(shù)據(jù);max (x) 為最大值;min(x)為最小值。
(7)得到歸一化后的數(shù)據(jù)集,作為SVM 模型的樣本集;
(8)選擇核函數(shù),確定SVM 參數(shù),生成預(yù)測(cè)結(jié)果Nt;
(9)將線性部分預(yù)測(cè)結(jié)果Lt和非線性部分預(yù)測(cè)結(jié)果Nt組合,得到最終預(yù)測(cè)結(jié)果Yt=Lt+Nt。
通過(guò)組合模型進(jìn)行用電量預(yù)測(cè)的流程圖如圖1 所示。
本文采用的實(shí)驗(yàn)數(shù)據(jù)來(lái)自某售電公司的用戶用電數(shù)據(jù),將5 家用戶企業(yè)的歷史用電量數(shù)據(jù)以及用電負(fù)荷、溫度、計(jì)劃用電量等相關(guān)數(shù)據(jù)作為樣本數(shù)據(jù)輸入, 根據(jù)第2 節(jié)所述步驟建立預(yù)測(cè)模型,并利用模型預(yù)測(cè)用戶企業(yè)的每月用電量數(shù)據(jù)。依次采用ARMA 模型、SVM 模型和ARMA-SVM 組合模型對(duì)5家用戶企業(yè)的用電量分別進(jìn)行預(yù)測(cè), 并對(duì)比分析這3 種模型的預(yù)測(cè)效果。
為考察用電量的預(yù)測(cè)效果, 本文選取平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)作為定量反映模型預(yù)測(cè)精度的指標(biāo),其計(jì)算公式如下:
圖1 組合模型預(yù)測(cè)過(guò)程
式中:yi為實(shí)際用電量,為預(yù)測(cè)用電量,n 為實(shí)驗(yàn)樣本的總數(shù)量,MAPE 值越小,說(shuō)明預(yù)測(cè)值與實(shí)際值的差異越小,預(yù)測(cè)精度越高。
以用戶企業(yè)A 為例,分別用ARMA、SVM 和組合模型對(duì)其連續(xù)24 個(gè)月的用電量進(jìn)行預(yù)測(cè),將預(yù)測(cè)結(jié)果與其實(shí)際用電量進(jìn)行對(duì)比。
用戶企業(yè)A 從2016 年1 月至2018 年12 月各月份的實(shí)際用電量數(shù)據(jù)如表1 所示。
表1 用戶企業(yè)A 實(shí)際用電量數(shù)據(jù) 單位:MWh
分別利用ARMA、SVM 和組合模型的預(yù)測(cè)結(jié)果與實(shí)際用電量的對(duì)比如圖2~圖4 所示。
A、B、C、D、E 5 家用戶企業(yè)分別用ARMA、SVM 和組合模型預(yù)測(cè)的結(jié)果與相應(yīng)的實(shí)際用電量計(jì)算出的MAPE 值對(duì)比情況如表2 所示。
表2 預(yù)測(cè)結(jié)果的MAPE 值情況
圖2 ARMA 模型預(yù)測(cè)結(jié)果與實(shí)際用電量對(duì)比
圖3 SVM 模型預(yù)測(cè)結(jié)果與實(shí)際用電量對(duì)比
圖4 組合模型預(yù)測(cè)結(jié)果與實(shí)際用電量對(duì)比
通過(guò)對(duì)比結(jié)果可以看出,SVM 模型的預(yù)測(cè)結(jié)果普遍優(yōu)于ARMA 模型, 這說(shuō)明了非線性因素的作用對(duì)用電量的預(yù)測(cè)有關(guān)鍵的影響,特別是在數(shù)據(jù)波動(dòng)較大時(shí)(如春節(jié)期間用戶用電量下降趨勢(shì)明顯),SVM 模型的預(yù)測(cè)更加精準(zhǔn),而ARMA 模型更適用于較為平穩(wěn)的訓(xùn)練數(shù)據(jù)。而綜合了ARMA 和SVM 的組合模型預(yù)測(cè)精度普遍優(yōu)于單一的ARMA 和SVM 模型,有較好的穩(wěn)定性,說(shuō)明其充分利用了原始數(shù)據(jù)中的信息,避免了單一模型的局限性, 驗(yàn)證了綜合考慮線性和非線性作用的組合模型的合理性與必要性。
售電公司作為電力市場(chǎng)的新興主體, 其對(duì)用戶用電量預(yù)測(cè)的準(zhǔn)確性是關(guān)乎其減少偏差考核風(fēng)險(xiǎn)和提高競(jìng)爭(zhēng)力的關(guān)鍵。針對(duì)用電量預(yù)測(cè)的線性和非線性特征,本文利用ARMA 模型捕捉其線性趨勢(shì),利用SVM 模型預(yù)測(cè)其非線性規(guī)律,據(jù)此建立ARMA 和SVM 的組合模型, 對(duì)用戶企業(yè)的用電量進(jìn)行預(yù)測(cè)。 實(shí)驗(yàn)結(jié)果表明,組合模型既兼顧了單一預(yù)測(cè)模型各自的優(yōu)勢(shì),又彌補(bǔ)了彼此的不足,相較于單一的ARMA 和SVM 模型,其預(yù)測(cè)結(jié)果具有有效性和更高的精確性, 可以為售電公司的預(yù)測(cè)用電量工作提供很好的技術(shù)支持。