雷蕾瀟,張新燕,孫 珂
(新疆大學(xué) 電氣工程學(xué)院,新疆 烏魯木齊 830046)
隨著經(jīng)濟(jì)的發(fā)展,能源短缺與環(huán)境污染問(wèn)題越來(lái)越嚴(yán)重.風(fēng)力發(fā)電是可再生能源領(lǐng)域中最成熟、最具規(guī)模開(kāi)發(fā)條件的發(fā)電方式之一.風(fēng)電場(chǎng)輸出功率預(yù)測(cè)是保障風(fēng)能安全、穩(wěn)定、高效的技術(shù)手段.根據(jù)采集的實(shí)時(shí)氣象、輸出功率等數(shù)據(jù),分析、挖掘數(shù)據(jù)特征,預(yù)測(cè)風(fēng)電場(chǎng)輸出功率,對(duì)全網(wǎng)電力平衡及保障系統(tǒng)安全穩(wěn)定運(yùn)行具有重要意義.氣象因素的不確定性、不穩(wěn)定性及數(shù)據(jù)間的相關(guān)性增加了風(fēng)電場(chǎng)輸出功率預(yù)測(cè)的難度.電網(wǎng)智能化使數(shù)據(jù)數(shù)量增加、質(zhì)量下降,在一定程度上降低了風(fēng)電場(chǎng)輸出功率預(yù)測(cè)的準(zhǔn)確度.
常用的輸出功率預(yù)測(cè)方法有:時(shí)間序列法、灰色預(yù)測(cè)法和卡爾曼濾波、BP(back propagation)神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、回歸預(yù)測(cè)等.文獻(xiàn)[8]采用Random Forest算法對(duì)風(fēng)速、風(fēng)向進(jìn)行預(yù)測(cè),提高了風(fēng)電場(chǎng)輸出功率預(yù)測(cè)的準(zhǔn)確度.文獻(xiàn)[9]提出了天氣數(shù)值預(yù)報(bào)與多元線(xiàn)性回歸相結(jié)合的模型,擬合出準(zhǔn)確度高、誤差小的回歸方程,利用風(fēng)電場(chǎng)輸出功率的實(shí)測(cè)數(shù)據(jù)對(duì)該模型進(jìn)行驗(yàn)證,提高了輸出功率預(yù)測(cè)的準(zhǔn)確度.文獻(xiàn)[10]對(duì)神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),使用大量實(shí)測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練,提高了輸出功率預(yù)測(cè)的準(zhǔn)確度.文獻(xiàn)[11]使用灰色關(guān)聯(lián)度和支持向量機(jī)分析氣象因素與負(fù)荷間的變化,能對(duì)短期預(yù)測(cè)進(jìn)行精細(xì)控制.文獻(xiàn)[12]考慮實(shí)時(shí)氣象耦合作用,采用時(shí)域卷積網(wǎng)絡(luò)提升了預(yù)測(cè)的準(zhǔn)確度.文獻(xiàn)[13]采用K-means 算法對(duì)樣本數(shù)據(jù)進(jìn)行聚類(lèi)分析,根據(jù)聚類(lèi)結(jié)果選取同類(lèi)歷史負(fù)荷為訓(xùn)練樣本數(shù)據(jù),提高了預(yù)測(cè)的準(zhǔn)確度.
在復(fù)雜的風(fēng)電場(chǎng)運(yùn)行環(huán)境下,單一的氣象因素不能準(zhǔn)確反映氣象對(duì)輸出功率的影響,且在數(shù)據(jù)存儲(chǔ)和傳輸?shù)倪^(guò)程中會(huì)出現(xiàn)數(shù)據(jù)異常或空缺的情況,降低了預(yù)測(cè)的準(zhǔn)確度.因此,筆者提出基于關(guān)聯(lián)規(guī)則及BP神經(jīng)網(wǎng)絡(luò)的風(fēng)電場(chǎng)輸出功率預(yù)測(cè)方法,該方法對(duì)異常和缺失數(shù)據(jù)進(jìn)行處理,采用改進(jìn)K-means聚類(lèi)算法對(duì)溫度/風(fēng)速氣象數(shù)據(jù)進(jìn)行聚類(lèi)分析,使用Apriori算法挖掘風(fēng)電場(chǎng)輸出功率與氣象因素間的關(guān)聯(lián)規(guī)則,將關(guān)聯(lián)規(guī)則應(yīng)用于BP神經(jīng)網(wǎng)絡(luò),以提高預(yù)測(cè)的準(zhǔn)確度.
筆者將風(fēng)電場(chǎng)作為研究對(duì)象,使用聚類(lèi)分析及數(shù)據(jù)間的關(guān)聯(lián)規(guī)則,結(jié)合BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)風(fēng)電場(chǎng)的輸出功率.在功率預(yù)測(cè)前,須對(duì)歷史數(shù)據(jù)進(jìn)行預(yù)處理.某時(shí)刻輸出功率變化值超出波動(dòng)范圍時(shí),計(jì)算數(shù)據(jù)偏離度,將其與設(shè)定的波動(dòng)閾值進(jìn)行比較,找出數(shù)據(jù)異常值和缺失值,并將異常值設(shè)為空值.偏離度及其相關(guān)參量的表達(dá)式為
(1)
(2)
(3)
其中:ρ
為偏離度,x
為某點(diǎn)樣本值,E
為樣本均值,N
為樣本數(shù),l
為數(shù)據(jù)點(diǎn)的序號(hào),σ
為標(biāo)準(zhǔn)差.將所得數(shù)據(jù)與前一天同一時(shí)段數(shù)據(jù)進(jìn)行對(duì)比,采用拉格朗日插值法得到插補(bǔ)的風(fēng)電場(chǎng)輸出功率.利用Pearson相關(guān)系數(shù)對(duì)風(fēng)電場(chǎng)輸出功率與各數(shù)據(jù)特征值間的相關(guān)程度進(jìn)行計(jì)算.相關(guān)系數(shù)及其有關(guān)參量的表達(dá)式為(4)
(5)
(6)
其中:p
為相關(guān)系數(shù),x
為某點(diǎn)的風(fēng)電場(chǎng)輸出功率,y
為某點(diǎn)的氣象數(shù)據(jù).K-means算法是基于距離的動(dòng)態(tài)聚類(lèi)算法,通過(guò)聚類(lèi)判定兩對(duì)象間的相似度,距離越近,相似度越大.傳統(tǒng)的K-means算法一般將開(kāi)始的樣本作為初始聚類(lèi)中心,這種方式具有隨機(jī)性和不確定性,易導(dǎo)致誤差大、迭代次數(shù)多的問(wèn)題出現(xiàn).針對(duì)該問(wèn)題,筆者提出改進(jìn)的K-means算法.
數(shù)據(jù)集A
={(x
,y
),(x
,y
),…,(x
,y
)},數(shù)據(jù)點(diǎn)與原點(diǎn)(0,0)的距離為(7)
把極差與聚類(lèi)數(shù)k
值的商記為單位聚類(lèi)數(shù)的距離,其表達(dá)式為(8)
其中:d
,d
為分別距離的最大、最小值.把第j
(j
=1,2,…,k
)類(lèi)聚類(lèi)中心的位置矢量的大小記為R
,其表達(dá)式為R
=j
×r.
(9)
誤差平方和(SSE)是手肘法判定最佳聚類(lèi)數(shù)的核心指標(biāo).SSE的表達(dá)式為
(10)
其中:c
表示樣本的第i
簇;是c
中某樣本點(diǎn)的位置矢量,是聚類(lèi)中心的位置矢量.采用改進(jìn)的K-means算法對(duì)測(cè)量的數(shù)據(jù)按照風(fēng)速和溫度特征進(jìn)行聚類(lèi),具體步驟如下:
(1) 計(jì)算所有數(shù)據(jù)點(diǎn)與原點(diǎn)(0,0)距離d
.將R
作為初始聚類(lèi)中心集合M
(a
),a
的初始值取為1.(2) 使用歐式距離計(jì)算公式計(jì)算x
與R
間的距離,其表達(dá)式為(11)
(3) 計(jì)算各組新的聚類(lèi)中心集合M
(a
+1).
(4) 若M
(a
+1)=M
(a
),則迭代結(jié)束,M
(a
)為聚類(lèi)中心.否則,進(jìn)行(2)步,直到迭代結(jié)束.該改進(jìn)算法對(duì)溫度/風(fēng)速氣象數(shù)據(jù)進(jìn)行聚類(lèi)分析,能減少重復(fù)掃描,降低尋找頻繁項(xiàng)的時(shí)間,進(jìn)而提高算法的效率.
Apriori算法通過(guò)循環(huán)搜索尋找頻繁項(xiàng),挖掘數(shù)據(jù)庫(kù)中各項(xiàng)的相關(guān)性. Apriori算法主要完成以下兩個(gè)任務(wù):
(1) 將兩個(gè)u
項(xiàng)頻繁集連接為候選的(u
+1)項(xiàng)頻繁集.(2) 通過(guò)設(shè)定的最小支持度排除不必要的中間結(jié)果,獲得最高的頻繁集.
Apriori算法結(jié)構(gòu)簡(jiǎn)單、計(jì)算思路清晰、對(duì)關(guān)聯(lián)規(guī)則的查找具有優(yōu)勢(shì),但是其計(jì)算效率不高.針對(duì)Apriori算法的不足,筆者提出改進(jìn)的Apriori算法.通過(guò)將關(guān)聯(lián)規(guī)則中的支持度和可信度賦值給對(duì)應(yīng)的初始權(quán)值,該改進(jìn)算法能發(fā)現(xiàn)樣本中不同數(shù)據(jù)類(lèi)型間的聯(lián)系,進(jìn)而找到風(fēng)電場(chǎng)輸出功率與氣象因素間的關(guān)聯(lián)規(guī)則.將關(guān)聯(lián)規(guī)則應(yīng)用于風(fēng)電場(chǎng)功率預(yù)測(cè),可減少權(quán)值更迭的次數(shù)以及降低誤差,從而提升風(fēng)電場(chǎng)輸出功率的預(yù)測(cè)準(zhǔn)確度.
BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層構(gòu)成.BP神經(jīng)網(wǎng)絡(luò)通過(guò)向前傳遞誤差信息、修正權(quán)值,達(dá)到降低誤差的目的,最終使輸出達(dá)到期望值.筆者結(jié)合改進(jìn)K-means算法、改進(jìn)Apriori算法及BP神經(jīng)網(wǎng)絡(luò),提出基于關(guān)聯(lián)規(guī)則及BP神經(jīng)網(wǎng)絡(luò)的風(fēng)電場(chǎng)輸出功率預(yù)測(cè)方法.將關(guān)聯(lián)規(guī)則引入BP神經(jīng)網(wǎng)絡(luò),用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出功率.基于關(guān)聯(lián)規(guī)則及BP神經(jīng)網(wǎng)絡(luò)的輸出功率預(yù)測(cè)的具體步驟如下:
(1) 對(duì)數(shù)據(jù)進(jìn)行歸一化處理.
(2) 采用改進(jìn)的K-means聚類(lèi)算法對(duì)溫度/風(fēng)速氣象數(shù)據(jù)進(jìn)行聚類(lèi).
(3) 使用改進(jìn)的Apriori算法挖掘溫度/風(fēng)速與輸出功率間的關(guān)聯(lián)規(guī)則.
(4) 將關(guān)聯(lián)規(guī)則中的支持度和可信度賦值給對(duì)應(yīng)的初始權(quán)值,取學(xué)習(xí)速率γ
=0.
1、訓(xùn)練期望誤差ε
=0.
01.(5) 輸入歷史氣象數(shù)據(jù),將其作為訓(xùn)練樣本,計(jì)算各層的輸出.
(6) 計(jì)算理論輸出與實(shí)際輸出間的誤差.
(7) 誤差大于設(shè)定誤差時(shí),通過(guò)輸出誤差與權(quán)值的負(fù)梯度修正權(quán)值,使誤差減小.
(8) 檢查誤差是否低于期望誤差?若是,則輸出風(fēng)電場(chǎng)輸出功率預(yù)測(cè)結(jié)果;若否,則繼續(xù)訓(xùn)練、預(yù)測(cè),直至符合期望誤差的要求.
該文數(shù)據(jù)來(lái)源于某地風(fēng)電場(chǎng)2015年1月1日至2018年12月31日每隔1 h整點(diǎn)實(shí)測(cè)的輸出功率,共計(jì)15 056個(gè)數(shù)據(jù).實(shí)測(cè)數(shù)據(jù)還包括溫度、濕度、風(fēng)速、大氣壓、風(fēng)向等整點(diǎn)氣象數(shù)據(jù).通過(guò)預(yù)處理對(duì)風(fēng)電場(chǎng)輸出功率數(shù)據(jù)進(jìn)行異常值識(shí)別、空缺值置零處理,且用拉格朗日插值及牛頓插值法對(duì)數(shù)據(jù)原始值進(jìn)行插補(bǔ).數(shù)據(jù)原始值及插補(bǔ)結(jié)果如表1所示.由表1可知,兩種方法的插補(bǔ)結(jié)果完全相同.
表1 數(shù)據(jù)原始值及插補(bǔ)結(jié)果
整個(gè)樣本數(shù)據(jù)按相同組距分成9段,每個(gè)數(shù)據(jù)段平均采樣點(diǎn)數(shù)為500,在同一個(gè)數(shù)據(jù)段內(nèi)取風(fēng)速、溫度、輸出功率的平均值.
根據(jù)處理后的數(shù)據(jù),計(jì)算各數(shù)據(jù)特征量間的Pearson相關(guān)系數(shù).從相關(guān)系數(shù)可知,風(fēng)電場(chǎng)輸出功率與濕度、大氣壓及風(fēng)向低度相關(guān),風(fēng)電場(chǎng)輸出功率與溫度及風(fēng)速中度相關(guān),故該文能挖掘出溫度、風(fēng)速與風(fēng)電場(chǎng)輸出功率間的關(guān)聯(lián)規(guī)則.
k
=10的關(guān)聯(lián)規(guī)則的支持度和可信度賦值給對(duì)應(yīng)的初始權(quán)值.取前2 160個(gè)數(shù)據(jù)作為訓(xùn)練樣本,后240個(gè)數(shù)據(jù)作為測(cè)試樣本.4種方法的預(yù)測(cè)誤差如表2所示.由表2可知,相對(duì)其他3種方法,該文方法的最大相對(duì)誤差、最小相對(duì)誤差、平均相對(duì)誤差均最小,其最大相對(duì)誤差不超過(guò)5.78%,最小相對(duì)誤差僅為0.01%.可見(jiàn)該文方法能提高風(fēng)電場(chǎng)輸出功率預(yù)測(cè)的準(zhǔn)確度,具有有效性.
表2 4種方法的預(yù)測(cè)誤差 %
該文方法能有較高的預(yù)測(cè)準(zhǔn)確度,主要原因?yàn)椋焊倪M(jìn)Apriori算法能挖掘出溫度/風(fēng)速與輸出功率間的關(guān)聯(lián)規(guī)則,且將此關(guān)聯(lián)規(guī)則引入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行功率預(yù)測(cè).
筆者結(jié)合改進(jìn)K-means算法、改進(jìn)Apriori算法及BP神經(jīng)網(wǎng)絡(luò),提出了基于關(guān)聯(lián)規(guī)則及BP神經(jīng)網(wǎng)絡(luò)的風(fēng)電場(chǎng)輸出功率預(yù)測(cè)方法.將4種方法的預(yù)測(cè)誤差進(jìn)行對(duì)比,結(jié)果表明:相對(duì)其他3種方法,該文方法的最大相對(duì)誤差、最小相對(duì)誤差、平均相對(duì)誤差均最小.可見(jiàn)該文方法能提高風(fēng)電場(chǎng)輸出功率預(yù)測(cè)的準(zhǔn)確度,具有有效性.