吳金浩 楊秀媛 孫 駿
(北京信息科技大學(xué),北京 100192)
基于主成分分析法的風(fēng)電功率短期組合預(yù)測(cè)
吳金浩楊秀媛孫駿
(北京信息科技大學(xué),北京 100192)
間歇性與不確定性是風(fēng)力發(fā)電的固有特性,在風(fēng)力發(fā)電迅速發(fā)展的背景下風(fēng)電功率預(yù)測(cè)的重要性日漸凸顯。為了減少單一模型在個(gè)別預(yù)測(cè)點(diǎn)誤差較大的情況,提高整體預(yù)測(cè)方法的預(yù)測(cè)精度及相對(duì)誤差率,本文采用反向傳播(BP)神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)(SVM)兩種基本模型進(jìn)行組合,并引入粒子群(PSO)以及交叉驗(yàn)證(CV)算法來優(yōu)化模型中的參數(shù)。結(jié)合主成分分析法(PCA)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,在不降低預(yù)測(cè)精度的前提下,對(duì)原數(shù)據(jù)進(jìn)行降維處理從而提高運(yùn)算效率。使用模型分別對(duì)未來5天進(jìn)行預(yù)測(cè),結(jié)果表明組合預(yù)測(cè)模型的標(biāo)準(zhǔn)平均誤差(NMAE)、標(biāo)準(zhǔn)均方根誤差(NRMSE)都滿足國內(nèi)現(xiàn)行指標(biāo),而且預(yù)測(cè)精度比單一模型有很大提高,相對(duì)誤差更加穩(wěn)定,有效減少了較大誤差點(diǎn)的出現(xiàn)。實(shí)例研究表明,基于主成分分析法的風(fēng)電功率短期組合預(yù)測(cè)模型的可行性。
風(fēng)功率預(yù)測(cè);主成分分析法;BP神經(jīng)網(wǎng)絡(luò);粒子群算法;支持向量機(jī);組合預(yù)測(cè)
隨著對(duì)風(fēng)力發(fā)電的深入研究,風(fēng)電固有的間歇性以及不確定性成為了制約其發(fā)展的主要因素。大容量風(fēng)電場(chǎng)接入電網(wǎng)后,造成電網(wǎng)電壓、頻率的波動(dòng),給調(diào)度運(yùn)行帶來很大困難,甚至威脅到電力系統(tǒng)的穩(wěn)定運(yùn)行。因此,及時(shí)、精確地預(yù)測(cè)風(fēng)電功率是首先需要解決的問題[1-2]。
目前,已經(jīng)有研究人員做了風(fēng)電功率預(yù)測(cè)多種方面的研究。文獻(xiàn)[3]使用時(shí)間序列法建模,得到預(yù)測(cè)時(shí)刻與前段時(shí)刻風(fēng)速的關(guān)系,并確定神經(jīng)網(wǎng)絡(luò)輸入變量數(shù)目,這種方法本質(zhì)是基于時(shí)間序列模型,在風(fēng)況發(fā)生突變時(shí)無法準(zhǔn)確預(yù)測(cè),對(duì)較長(zhǎng)時(shí)間的預(yù)測(cè)也無法得到精確結(jié)果;文獻(xiàn)[4]理論分析得出風(fēng)功率由風(fēng)速、風(fēng)向等因素決定,使用數(shù)值天氣預(yù)報(bào)系統(tǒng)收集的歷史數(shù)據(jù),建立BP神經(jīng)網(wǎng)絡(luò)模型,在風(fēng)電場(chǎng)實(shí)裝顯示預(yù)測(cè)效果良好,模型預(yù)測(cè)誤差在15%左右,需要進(jìn)一步優(yōu)化或者開發(fā)更精確的預(yù)測(cè)模型;文獻(xiàn)[5]將粒子群(PSO)算法與基于前向神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,從而提高功率預(yù)測(cè)的精度,結(jié)果顯示模型平均誤差以及標(biāo)準(zhǔn)差都有不同程度地下降,預(yù)測(cè)準(zhǔn)確率高于優(yōu)化前的結(jié)果;文獻(xiàn)[6]使用交叉熵理論來確定組合預(yù)測(cè)的權(quán)值,先分析各預(yù)測(cè)模型的交叉程度,再根據(jù)公式求取權(quán)值,結(jié)果顯示使用交叉熵理論的組合模型精度較高。
目前傳統(tǒng)的組合預(yù)測(cè)的只是解決了單一預(yù)測(cè)模型可能出現(xiàn)較大誤差的問題,但基礎(chǔ)組合算法本身精度并不高,而且普遍存在運(yùn)算時(shí)間較長(zhǎng)、無法在工程上應(yīng)用的問題。本文先對(duì)基礎(chǔ)算法進(jìn)行優(yōu)化,提高BP神經(jīng)網(wǎng)絡(luò)與SVM的精度再進(jìn)行組合,這樣整體預(yù)測(cè)效果獲得很大提升。然后使用主成分分析法對(duì)原始數(shù)據(jù)進(jìn)行主成分分析數(shù)據(jù)預(yù)處理,在不降低預(yù)測(cè)精度的前提下減少運(yùn)算時(shí)間。實(shí)測(cè)數(shù)據(jù)研究表明,本文提出的組合預(yù)測(cè)模型可以穩(wěn)定、高效的完成預(yù)測(cè)任務(wù),具有很大工程應(yīng)用的潛力。
主成分分析法(principal components analysis,PCA)是一種多元統(tǒng)計(jì)分析方法,利用降維的思想在少量信息損失的前提下,將多個(gè)指標(biāo)轉(zhuǎn)化為若干綜合指標(biāo)[8]。因此,面對(duì)多輸入因素的問題,只需考慮幾個(gè)主要的組成部分,從而使問題得到簡(jiǎn)化,提高分析效率。結(jié)合本文風(fēng)電功率預(yù)測(cè)模型,可用于解決預(yù)測(cè)模型輸入變量多、部分變量之間相關(guān)、運(yùn)算時(shí)間過長(zhǎng)的問題。
理論分析表明:主成分是原數(shù)據(jù)矩陣的協(xié)方差矩陣的特征向量的線性組合,它們是互不相關(guān)的,其方差為數(shù)據(jù)矩陣的特征根。計(jì)算出矩陣的特征根值并按照順序排列為λ1≥λ2≥…≥λp> 0。其中,第一主成分的貢獻(xiàn)率定義為,是第一主成分的方差與總方差和的比值;前兩個(gè)主成分的貢獻(xiàn)率定義為,前k個(gè)主成分的累計(jì)貢獻(xiàn)率定義為。當(dāng)前k個(gè)主成分的貢獻(xiàn)率達(dá)到85%,就可以認(rèn)為主成分可以代替原始數(shù)據(jù)。
選擇風(fēng)速、風(fēng)向、溫度、濕度和壓強(qiáng)五個(gè)因素作為預(yù)測(cè)模型的輸入項(xiàng)。對(duì)風(fēng)向分別進(jìn)行正弦、余弦計(jì)算,得到六維的原始輸入數(shù)據(jù),然后運(yùn)用PCA對(duì)原數(shù)據(jù)分析處理。
2.1預(yù)測(cè)模型的選擇
風(fēng)電輸出功率與風(fēng)速、風(fēng)向等多種因素有關(guān),使用傳統(tǒng)的建模方式很難精確表達(dá)。人工智能方法如BP神經(jīng)網(wǎng)絡(luò)、SVM等具有較強(qiáng)的非線性學(xué)習(xí)能力,能通過統(tǒng)計(jì)數(shù)據(jù)學(xué)習(xí)得到其內(nèi)在關(guān)系。BP神經(jīng)網(wǎng)絡(luò)與SVM都具有很強(qiáng)的模式分類和非線性函數(shù)逼近能力,BP神經(jīng)網(wǎng)絡(luò)采用的是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,而SVM是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,考慮的是經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信界之和的最小化。兩種方法在非線性函數(shù)擬合方面各有優(yōu)勢(shì),具有組合互補(bǔ)的可行性。
2.2BP神經(jīng)網(wǎng)絡(luò)模型與粒子群算法參數(shù)優(yōu)化
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò)(Multilayer Feedforward Neural Networks,MFNN)模型[11]。網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,u和y分別是網(wǎng)絡(luò)的輸入、輸出向量,網(wǎng)絡(luò)由輸入層、隱層和輸出層節(jié)點(diǎn)組成,前層至后層節(jié)點(diǎn)通過權(quán)值連接。
圖1 BP神經(jīng)網(wǎng)絡(luò)示意圖
傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)使用梯度下降法調(diào)整參數(shù),這種方法相鄰兩次迭代的搜索方向是正交的,迭代在向極小值靠近的過程中,走的是曲折的路徑,使得網(wǎng)絡(luò)收斂速度下降,可能找到的是局部極值而不是整體極值。為解決這些問題,采用粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)來進(jìn)行參數(shù)尋優(yōu)。粒子群算法是一種群體智能算法,根據(jù)生物種群特性,所有粒子都將跟隨最優(yōu)粒子在空間中移動(dòng),直到找到問題的極值。PSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)整體流程如圖2所示。
圖2 PSO-BP神經(jīng)網(wǎng)絡(luò)流程圖
2.3支持向量機(jī)模型與交叉驗(yàn)證算法參數(shù)優(yōu)化
支持向量機(jī)(support vector machine,SVM)是90年代中期發(fā)展起來的基于統(tǒng)計(jì)學(xué)理論的一種機(jī)器學(xué)習(xí)方法,通過尋求結(jié)構(gòu)風(fēng)險(xiǎn)最小來提高學(xué)習(xí)機(jī)泛化能力,在統(tǒng)計(jì)樣本數(shù)量較少時(shí)也能獲得良好的統(tǒng)計(jì)規(guī)律[12]。SVM主要任務(wù)是在空間中尋找一個(gè)最優(yōu)超平面來逼近目標(biāo)函數(shù),其基本原理如圖3所示。
圖3 SVM原理示意圖
圖3中,H為分類超平面;1H和2H為距分類超平面最近的兩平行面;mL為兩平面間隔。假設(shè)樣本是線性可分的,任務(wù)就是實(shí)現(xiàn)把樣本點(diǎn)分開,且保證分類間隔盡可能大。實(shí)際情況多數(shù)樣本都是線性不可分的,使用一個(gè)非線性映射,把低維的輸入數(shù)據(jù)映射到高維特征空間,然后在高維空間內(nèi)尋找最優(yōu)分類平面。
當(dāng)使用SVM模型進(jìn)行回歸預(yù)測(cè)時(shí),尋找最優(yōu)的懲罰參數(shù)c和核函數(shù)參數(shù)g能得到比較理想的預(yù)測(cè)準(zhǔn)確率。本文使用交叉驗(yàn)證法(cross validation,CV)來確定參數(shù)c和g,首先將原始數(shù)據(jù)分成K組,將每個(gè)子集數(shù)據(jù)分別做一次驗(yàn)證集,其余的K-1組子集數(shù)據(jù)作為訓(xùn)練集,這樣會(huì)得到K個(gè)模型,用這K個(gè)模型最終的驗(yàn)證集的分類準(zhǔn)確率的平均數(shù)作為交叉驗(yàn)證法下分類器的性能指標(biāo)。CV算法優(yōu)化SVM整體流程如圖4所示。
圖4 CV-SVM流程示意圖
3.1組合模型的概念
組合預(yù)測(cè)就是使用多種預(yù)測(cè)方法對(duì)同一模型預(yù)測(cè),根據(jù)不同的計(jì)算規(guī)則確定預(yù)測(cè)方法的權(quán)值,最后整合為一個(gè)綜合模型[17]。采用組合預(yù)測(cè)法消除單一預(yù)測(cè)方法中的較大誤差,提高整體模型的穩(wěn)定性。
假設(shè)使用m種方法對(duì)模型分別預(yù)測(cè),單一預(yù)測(cè)方法的預(yù)測(cè)值分別為fi, i=1,2,…,m 。則組合預(yù)測(cè)可表示為f=l1f1+l2f2+…+lmfm,其中l(wèi)1, l2,…,lm為各種預(yù)測(cè)方法的加權(quán)系數(shù)。組合預(yù)測(cè)的主要任務(wù)是確定各預(yù)測(cè)方法的權(quán)值,下文給出三種常見的加權(quán)系數(shù)計(jì)算方法。圖5經(jīng)過優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)與SVM預(yù)測(cè)模型的組合示意圖。
圖5 組合預(yù)測(cè)模型
3.2算術(shù)平均法
算術(shù)平均法也稱為等權(quán)平均法,對(duì)m種單項(xiàng)預(yù)測(cè)模型取相同的權(quán)值,即各模型比重相同。算術(shù)平均法適用于無法確定單項(xiàng)預(yù)測(cè)模型詳細(xì)精確度的情況。由于算術(shù)平均方法計(jì)算簡(jiǎn)單,工程上可以快速得出結(jié)果,適用性比較強(qiáng)。
系數(shù)計(jì)算式:
3.3預(yù)測(cè)誤差平方和倒數(shù)法
預(yù)測(cè)誤差平方和倒數(shù)法,考慮到每種方法的預(yù)測(cè)精度,是一種非等權(quán)值的計(jì)算方法。需要先計(jì)算出每種預(yù)測(cè)的誤差平方和,這個(gè)值越大對(duì)應(yīng)的預(yù)測(cè)精度就越低,相應(yīng)模型的權(quán)值也會(huì)比較小,再根據(jù)系數(shù)計(jì)算公式求取每種模型的權(quán)值,該方法更符合客觀規(guī)律。
系數(shù)計(jì)算公式:
式中,itx為第i種方法在第t時(shí)刻的預(yù)測(cè)值,tx為同一對(duì)象在第t時(shí)刻的觀測(cè)值,ite為第i種單項(xiàng)預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)誤差。
3.4二項(xiàng)式系數(shù)法
二項(xiàng)式系數(shù)法也是一種非等權(quán)計(jì)算方法,具體做法與平方和倒數(shù)不同。需要先求各單一預(yù)測(cè)模型的誤差方差和Eii,再對(duì)其進(jìn)行排序,不妨設(shè)E11>E22>…>Emm。根據(jù)統(tǒng)計(jì)學(xué)中位數(shù)的概念,排在中間模型對(duì)應(yīng)的權(quán)系數(shù)最大,遠(yuǎn)離中位數(shù)的模型權(quán)系數(shù)較小。
系數(shù)計(jì)算式:
國家能源局2011年發(fā)布的《風(fēng)電場(chǎng)功率預(yù)報(bào)管理暫行辦法》規(guī)定風(fēng)電場(chǎng)功率預(yù)測(cè)系統(tǒng)提供的日預(yù)測(cè)曲線最大誤差不超過25%;實(shí)時(shí)預(yù)測(cè)誤差不超過15%;全天預(yù)測(cè)結(jié)果的均方根誤差應(yīng)小于20%[19]。
現(xiàn)行行業(yè)標(biāo)準(zhǔn)[20]及文獻(xiàn)廣泛采用標(biāo)準(zhǔn)平均誤差(normalized mean absolute error, NMAE)、標(biāo)準(zhǔn)平均相對(duì)誤差(normalized mean relative error,NMRE)、標(biāo)準(zhǔn)均方根誤差(normalized root mean square error, NRMSE)等來評(píng)估風(fēng)功率預(yù)測(cè)效果。NMAE指預(yù)測(cè)值與真實(shí)值之間平均相差多少,是絕對(duì)誤差的平均值;NMRE是指絕對(duì)誤差占真實(shí)值的百分比;NRMSE是觀測(cè)值與真實(shí)值偏差的平方和觀測(cè)次數(shù)n比重的平方根,反映預(yù)測(cè)的精密度。
式中,x(i) 為樣本真實(shí)值;x′(i)為樣本預(yù)測(cè)值;capP是風(fēng)電場(chǎng)的額定裝機(jī)容量;N為預(yù)測(cè)樣本個(gè)數(shù)。本文采用前兩個(gè)指標(biāo)來評(píng)估預(yù)測(cè)模型。
5.1風(fēng)電場(chǎng)基本情況
本文算例風(fēng)電場(chǎng)裝備80臺(tái)額定容量1.5MW的雙饋感應(yīng)風(fēng)力發(fā)電機(jī)組(WPG-DFIG),總裝機(jī)容量為120MW,風(fēng)機(jī)輪轂高度65m,葉輪直徑58m。連續(xù)采集2013年5月的各項(xiàng)數(shù)據(jù),數(shù)據(jù)分辨率為15min。使用5月前26天數(shù)據(jù)訓(xùn)練模型,首先選擇5月27日作為預(yù)測(cè)日,預(yù)測(cè)長(zhǎng)度為一天,即96個(gè)點(diǎn)。每一點(diǎn)輸入項(xiàng)為風(fēng)機(jī)實(shí)時(shí)風(fēng)速、風(fēng)向、溫度、濕度和壓強(qiáng)五個(gè)因素,輸出項(xiàng)為風(fēng)電機(jī)組實(shí)時(shí)輸出功率。然后使用訓(xùn)練好的模型,分別對(duì)28、29、30、31日進(jìn)行預(yù)測(cè)并作誤差分析。
5.2PCA數(shù)據(jù)預(yù)處理
首先對(duì)數(shù)據(jù)進(jìn)行歸一化處理,統(tǒng)一各參數(shù)的量綱。風(fēng)速歸一化采用公式對(duì)實(shí)時(shí)風(fēng)速進(jìn)行處理,式中vmax為歷史最大風(fēng)速。氣溫、氣壓、濕度的歸一化方法與風(fēng)速一致。風(fēng)向可能在0°~360°之間變化,只對(duì)風(fēng)向取正弦值或余弦值并不能完全區(qū)分0°~360°內(nèi)所有風(fēng)向,因此風(fēng)向要取正弦、余弦兩個(gè)值來描述。歸一化后訓(xùn)練數(shù)據(jù)為一個(gè)2496×6的矩陣,預(yù)測(cè)數(shù)據(jù)為一個(gè)96×6的矩陣。
然后進(jìn)行主成分提取,計(jì)算歸一化后訓(xùn)練數(shù)據(jù)的協(xié)方差矩陣,求出協(xié)方差矩陣的特征根及貢獻(xiàn)率并依據(jù)累積貢獻(xiàn)率提取主成分,計(jì)算結(jié)果見表1。
由表1可知前三個(gè)特征值累計(jì)貢獻(xiàn)率已達(dá)96.9719%,說明前三個(gè)主成分基本包含了全部信息,取前三個(gè)特征值,計(jì)算出相應(yīng)的特征向量,計(jì)算結(jié)果見表2。
表1 特征值及貢獻(xiàn)率
表2 特征向量表
通過特征向量寫出主成分表達(dá)式如下:
第一主成分:
第二主成分:
第三主成分:
通過上述表達(dá)式對(duì)數(shù)據(jù)進(jìn)行PCA處理,則訓(xùn)練數(shù)據(jù)轉(zhuǎn)換為2496×3的矩陣,預(yù)測(cè)數(shù)據(jù)轉(zhuǎn)換為96× 3的矩陣。處理后變?yōu)?個(gè)輸入?yún)?shù),這3個(gè)輸入互不相關(guān)且包含原來參數(shù)所有的信息。原來幾項(xiàng)參數(shù)之間互有聯(lián)系,全部作為輸入會(huì)導(dǎo)致信息冗余,經(jīng)過PCA處理后可以在不影響精度的情況下,提高運(yùn)算速度。
5.3單一模型的預(yù)測(cè)
對(duì)于BP神經(jīng)網(wǎng)絡(luò)模型,選用包含一個(gè)隱含層的3層網(wǎng)絡(luò),隱層神經(jīng)元傳遞函數(shù)采用S型正切函數(shù),輸出層神經(jīng)元傳遞函數(shù)采用S型對(duì)數(shù)函數(shù)。進(jìn)過PCA數(shù)據(jù)預(yù)處理后,輸入變?yōu)?維,隱層節(jié)點(diǎn)數(shù)定為7。方向傳播使用梯度下降法調(diào)整權(quán)值和閾值。然后使用粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,進(jìn)化次數(shù)定為30,種群規(guī)模定為60。為防止粒子盲目搜索,將其位置和速度分別限制在區(qū)間[5,5]-[0,1]。
表3是兩種預(yù)測(cè)方法的標(biāo)準(zhǔn)平均誤差、標(biāo)準(zhǔn)均方根誤差以及訓(xùn)練時(shí)間。圖6是兩種預(yù)測(cè)方法得到的一天時(shí)間(96個(gè)點(diǎn))預(yù)測(cè)結(jié)果??梢钥闯?,BP神經(jīng)網(wǎng)絡(luò)可以基本完成預(yù)測(cè)任務(wù),經(jīng)過粒子群算法參數(shù)尋優(yōu)后預(yù)測(cè)精度得到進(jìn)一步提高,但某些點(diǎn)明顯存在誤差過大的情況,單獨(dú)使用這一種模型效果不佳。
表3 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)誤差及訓(xùn)練時(shí)間
圖6 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)效果對(duì)比
對(duì)于支持向量機(jī)模型,使用徑向基函數(shù)作為核函數(shù),svmtrain程序中的懲罰參數(shù)c和核函數(shù)g,任意給定兩個(gè)較小的值。然后使用交叉驗(yàn)證的方法,通過計(jì)算可以找到一定意義最佳的參數(shù)c和g。
表4是兩種預(yù)測(cè)方法的標(biāo)準(zhǔn)平均誤差、標(biāo)準(zhǔn)均方根誤差以及訓(xùn)練時(shí)間。圖7是兩種預(yù)測(cè)方法得到的一天時(shí)間(96個(gè)點(diǎn))預(yù)測(cè)結(jié)果??梢钥闯觯?jīng)過交叉驗(yàn)證參數(shù)尋優(yōu)后預(yù)測(cè)精度有所提高,但兩種預(yù)測(cè)模型也存在在某些點(diǎn)誤差比較明顯的情況。SVM預(yù)測(cè)精度與BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度在同一水平,而且誤差較大的點(diǎn)并不一致,這是下文兩種模型組合的基礎(chǔ)。
表4 支持向量機(jī)模型預(yù)測(cè)誤差及訓(xùn)練時(shí)間
圖7 支持向量機(jī)模型預(yù)測(cè)效果對(duì)比
5.4組合模型的預(yù)測(cè)
兩種經(jīng)過參數(shù)優(yōu)化后的模型PSO-BP以及CV-SVM的標(biāo)準(zhǔn)平均誤差均小于15%,標(biāo)準(zhǔn)均方根誤差均小于20%,且數(shù)值在同一數(shù)量級(jí),符合組合預(yù)測(cè)的要求。根據(jù)上文計(jì)算公式得到三種模型的權(quán)系數(shù)見表5,三種組合模型預(yù)測(cè)誤差及訓(xùn)練時(shí)間見表6,組合模型的預(yù)測(cè)結(jié)果如圖8所示,相對(duì)誤差如圖9所示。
由于圖8可以直觀看到,組合預(yù)測(cè)的預(yù)測(cè)效果十分明顯。其中平方和倒數(shù)模型的預(yù)測(cè)精度最高,其標(biāo)準(zhǔn)平均誤差為9.31%,標(biāo)準(zhǔn)均方根誤差為12.63%,比單一預(yù)測(cè)模型以及其他方法相比優(yōu)勢(shì)明顯。由于選取的兩種模型本身精度差距不大,因此可以看到算術(shù)平均模型的精度排第二,在工程上使用可以犧牲精度而提高效率。二項(xiàng)式模型效果較差,這是由于本文只選取了兩種模型組合,如選三種及以上數(shù)量的模型組合,二項(xiàng)式模型就能發(fā)揮很好的作用。三種模型的預(yù)測(cè)時(shí)間基本等同于原來兩種預(yù)測(cè)模型的時(shí)間之和。由圖9可以看出基本上預(yù)測(cè)點(diǎn)誤差值能保持在一點(diǎn)范圍內(nèi),顯示出了組合預(yù)測(cè)模型平穩(wěn)的優(yōu)勢(shì)。圖中只有一個(gè)點(diǎn)有相對(duì)誤差大于10%,但不能排除該數(shù)據(jù)本身有誤的可能性。
表5 三種組合模型權(quán)系數(shù)
表6 三種組合模型預(yù)測(cè)誤差及訓(xùn)練時(shí)間
圖8 三種組合模型的預(yù)測(cè)結(jié)果
圖9 三種組合模型的預(yù)測(cè)相對(duì)誤差
使用平方和倒數(shù)組合模型分別對(duì)5月28日、29日、30日、31日進(jìn)行預(yù)測(cè),并作誤差分析,結(jié)果如表7所示,而且無較大相對(duì)誤差的出現(xiàn)。最后可以得出使用本文的組合模型能有效減少較大誤差的出現(xiàn),提高預(yù)測(cè)精度的結(jié)論。
表7 未來4日預(yù)測(cè)誤差及訓(xùn)練時(shí)間
本文基于實(shí)測(cè)數(shù)據(jù),先使用PCA方法對(duì)數(shù)據(jù)進(jìn)行降維處理,后建立組合預(yù)測(cè)模型預(yù)測(cè)未來24h風(fēng)力發(fā)電功率。從數(shù)據(jù)預(yù)測(cè)效果和誤差分析,可以得到以下結(jié)論:
1)主成分分析法可以對(duì)觀測(cè)變量降維,能夠客觀地反映影響風(fēng)功率預(yù)測(cè)的各種影響因素,在保證預(yù)測(cè)精度的前提下提高運(yùn)算速度。
2)經(jīng)過參數(shù)優(yōu)化后PSO-BP神經(jīng)網(wǎng)絡(luò)與CV-SVM模型可以獲得高的預(yù)測(cè)精度,兩種模型精確度在同一水平而且誤差較大的點(diǎn)不盡相同,適合進(jìn)行模型組合。
3)分別求出算術(shù)平均法、誤差平方和倒數(shù)法、以及二項(xiàng)式系數(shù)法的權(quán)值,分析得出組合預(yù)測(cè)可以有效減少較大誤差的出現(xiàn),從而提高預(yù)測(cè)精度。本文兩種模型組合的情況,誤差平方和倒數(shù)法模型精度最高。
4)組合預(yù)測(cè)受基礎(chǔ)預(yù)測(cè)模型精度的限制,因此選擇合適的兩種或者多種組合模型是關(guān)鍵。目前風(fēng)電功率物理預(yù)測(cè)模型發(fā)展迅速,未來可以考慮將歷史數(shù)據(jù)外推模型與物理模型組合起來,以應(yīng)對(duì)各種復(fù)雜地形、不同天氣條件下預(yù)測(cè)任務(wù)。
[1] 何東, 劉瑞葉. 基于主成分分析的神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)集成風(fēng)功率超短期預(yù)測(cè)[J]. 電力系統(tǒng)保護(hù)與控制,2013, 4(4): 50-54.
[2] 周松林, 茆美琴, 蘇建徽. 基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測(cè)[J]. 電網(wǎng)技術(shù), 2011, 35(9):128-132.
[3] 楊秀媛, 肖洋, 陳樹勇. 風(fēng)電場(chǎng)風(fēng)速和發(fā)電功率預(yù)測(cè)研究[J]. 中國電機(jī)工程學(xué)報(bào), 2005, 25(11): 1-5.
[4] 范高鋒, 王偉勝, 劉純. 基于人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率短期預(yù)測(cè)系統(tǒng)[J]. 電網(wǎng)技術(shù), 2008(22): 72-76.
[5] 楊志凌, 劉永前. 應(yīng)用粒子群優(yōu)化算法的短期風(fēng)電功率預(yù)測(cè)[J]. 電網(wǎng)技術(shù), 2011, 05(5): 159-164.
[6] 陳寧, 沙倩, 湯奕, 等. 基于交叉熵理論的風(fēng)電功率組合預(yù)測(cè)方法[J]. 中國電機(jī)工程學(xué)報(bào), 2012(4):29-34, 22.
[7] 孟安波, 陳育成. 基于虛擬預(yù)測(cè)與小波包變換的風(fēng)電功率組合預(yù)測(cè)[J]. 電力系統(tǒng)保護(hù)與控制, 2014,3(3): 71-76.
[8] 羅毅, 劉峰, 劉向杰. 基于主成分—遺傳神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測(cè)[J]. 電力系統(tǒng)保護(hù)與控制,2012(23): 47-53.
[9] 王麗婕, 冬雷, 高爽. 基于多位置NWP與主成分分析的風(fēng)電功率短期預(yù)測(cè)[J]. 電工技術(shù)學(xué)報(bào), 2015, 5(5): 79-84.
[10] 王麗婕, 冬雷, 廖曉鐘, 等. 基于小波分析的風(fēng)電場(chǎng)短期發(fā)電功率預(yù)測(cè)[J]. 中國電機(jī)工程學(xué)報(bào), 2009(28):30-33.
[11] 范高鋒, 王偉勝, 劉純, 等. 基于人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測(cè)[J]. 中國電機(jī)工程學(xué)報(bào), 2008(34):118-123.
[12] 王賀, 胡志堅(jiān), 仉夢(mèng)林. 基于模糊信息?;妥钚《酥С窒蛄繖C(jī)的風(fēng)電功率波動(dòng)范圍組合預(yù)測(cè)模型[J]. 電工技術(shù)學(xué)報(bào), 2014(12): 218-224.
[13] Ernst B, Oakleaf B, Ahlstrom ML, et al. Predicting the wind[J]. Power and Energy Magazine, IEEE, 2007,5(6): 78-89.
[14] Peiyuan C, Pedersen T, Bak-Jensen B, et al. ARIMA-based time series model of stochastic wind power Generation[J]. IEEE Transactions on Power Systems, 2010, 25(2): 667-676.
[15] Chen Xia, Dong Zhaoyang, Meng Ke, et al. Electricity price forecasting with extreme learning machine and bootstrapping[J]. IEEE Transactions on Power Systems,2012, 27(4): 2055-2062.
[16] 劉純, 范高鋒, 王偉勝, 等. 風(fēng)電場(chǎng)輸出功率的組合預(yù)測(cè)模型[J]. 電網(wǎng)技術(shù), 2009(13): 74-79.
[17] Rodrigues AB, Da Silva MD. Confidence intervals estimation for reliability data of power distribution equipments using bootstrap[J]. IEEE Transactions on Power Systems, 2013, 28(3): 3283-3291.
[18] Khosravi A, Nahavandi S, Creighton D. Prediction intervals for Short-Term wind farm power Generation forecasts[J]. IEEE Transactions on Sustainable Energy,2013, 4(3): 602-610.
[19] 風(fēng)電場(chǎng)功率預(yù)測(cè)預(yù)報(bào)管理暫行辦法[S]. 北京: 國家能源局, 2011
[20] 風(fēng)電功率預(yù)測(cè)功能規(guī)范[S]. 北京: 國家電網(wǎng)公司,2011.
The Combination Forecasting Model for Wind Farm Power based on PCA
Wu Jinhao Yang Xiuyuan Sun Jun(Beijing Information Science and Technology University, Beijing 100192)
Intermittency and uncertainty is the inherent characteristics of the wind power and in the rapid development of wind power generation background the importance of wind power forecasting is becoming more and more obvious. In order to reduce the error of the single model and are improve the prediction accuracy and relative error rate of the whole forecasting method, the paper combine two basic models of BP neural network and support vector machine(SVM), and introduce the particle swarm and cross validation to optimize the parameters. The original data are preprocessed by principal component analysis (PCA). In the premise of little reducing the accuracy of prediction, the original data is reduced to the dimension of the original data to improve the operation efficiency. The results show that the NMAE and NRMSE of the combined forecasting model meet the domestic current index. And the accuracy of the model is improved, and the relative error is more stable. This method can effectively reduce the appearance of large errors. In the final, these prove the feasibility of the combination forecasting model for wind farm power based on PCA.
wind power forecast; principal components analysis (PCA); BP neural network; particle swarm; support vector machine (SVM); forecast combination
國家自然科學(xué)基金(51377011)
吳金浩(1988-),男,山東省濟(jì)寧市兗州區(qū)人,本科,主要從事風(fēng)電場(chǎng)與水電廠協(xié)同運(yùn)行研究工作。