任建龍 ,趙巧娥,嚴(yán)志偉,高金城
(1.山西大學(xué) 電力工程系,太原 030013;2.國網(wǎng)山西省電力公司檢修分公司,太原030006;3.中國電纜工程有限公司,北京100079)
大數(shù)據(jù)是一種避免隨機(jī)分析(即抽樣調(diào)查)而采用所有數(shù)據(jù)進(jìn)行處理的一種捷徑[1]。如果我們通過分析全部的數(shù)據(jù)得到風(fēng)力發(fā)電實(shí)際運(yùn)行風(fēng)速數(shù)據(jù)和輸出功率數(shù)據(jù)之間的函數(shù)關(guān)系,并通過預(yù)測風(fēng)速映射之后實(shí)現(xiàn)風(fēng)力發(fā)電輸出功率的預(yù)測,那么具有大數(shù)據(jù)4V特性的風(fēng)力發(fā)電實(shí)際運(yùn)行大數(shù)據(jù)勢必會(huì)使我們投入大量的人力、物力以及時(shí)間,甚至最后都得不到準(zhǔn)確的結(jié)果[2]。
研究風(fēng)速、功率預(yù)測的文獻(xiàn)很多,如文獻(xiàn)[3]利用帶有核函數(shù)的極限學(xué)習(xí)機(jī)(KELM)對(duì)風(fēng)速預(yù)測,通過給定核函數(shù)的參數(shù)就可以避免由于隨機(jī)設(shè)置初始權(quán)值造成極限學(xué)習(xí)機(jī) (ELM)性能不穩(wěn)定的問題,但是沒有對(duì)核函數(shù)的參數(shù)進(jìn)行尋優(yōu)設(shè)置,導(dǎo)致最后的預(yù)測誤差很大;文獻(xiàn)[4]利用混沌學(xué)中的相空間重構(gòu)(PSR)理論對(duì)風(fēng)速進(jìn)行預(yù)處理,然后再利用ELM預(yù)測風(fēng)速,雖然考慮了風(fēng)速數(shù)據(jù)空間及時(shí)間上的相關(guān)性,提高了預(yù)測精度,但是并沒有考慮ELM初始權(quán)值隨機(jī)設(shè)定造成ELM學(xué)習(xí)性能不穩(wěn)定給最后預(yù)測精度帶來的影響,也沒有對(duì)相空間重構(gòu)中的延遲時(shí)間τ和重構(gòu)維數(shù)m進(jìn)行尋優(yōu)處理;文獻(xiàn)[5]利用粒子群算法(PSO)對(duì)PSR理論中的延遲時(shí)間τ和重構(gòu)維數(shù)m進(jìn)行尋優(yōu)處理,嘗試尋找相空間重構(gòu)參數(shù)和的優(yōu)化值,但是并沒有從全局考慮,很容易得到局部最優(yōu)解;文獻(xiàn)[6]利用PSO對(duì)正則化參數(shù)γ和核函數(shù)寬度σ進(jìn)行尋優(yōu),再用KELM預(yù)測,雖然對(duì)核函數(shù)參數(shù)進(jìn)行了優(yōu)化處理,但是并沒有考慮風(fēng)速數(shù)據(jù)空間及時(shí)間上的相關(guān)性,也沒有克服PSO容易陷入局部最優(yōu)解這一缺點(diǎn)。本文考慮風(fēng)電場實(shí)際運(yùn)行數(shù)據(jù)異質(zhì)值的存在,利用優(yōu)化粒子群算法(IPSO)優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)速,同時(shí)提出改進(jìn)移動(dòng)平均平滑算法(IMASA)濾除異質(zhì)值擬合風(fēng)速-功率曲線。根據(jù)山西北部某風(fēng)電場(簡稱晉北風(fēng)場)的實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行風(fēng)速及功率的預(yù)測分析。
大數(shù)據(jù)背景下的風(fēng)力發(fā)電運(yùn)維數(shù)據(jù)的主要特點(diǎn)是那些偏離正常運(yùn)行主體數(shù)據(jù)的異質(zhì)值會(huì)對(duì)風(fēng)力發(fā)電的研究造成嚴(yán)重的影響,并不能被隨意忽略或者刪除[7]。
由于風(fēng)的隨機(jī)性、間歇性和不確定性,風(fēng)電場的實(shí)際運(yùn)行風(fēng)速-功率數(shù)據(jù)可以看作是大量數(shù)據(jù)組成的波動(dòng)序列{ys(i)},其呈條帶狀分布在標(biāo)準(zhǔn)風(fēng)速-功率曲線兩側(cè)[8]。為了方便研究,可將風(fēng)電場視為一個(gè)輸入風(fēng)速、輸出功率的簡化系統(tǒng)[9]。
移動(dòng)平均平滑算法(MASA)通過跨度內(nèi)定義的相鄰數(shù)據(jù)點(diǎn)的平均值代替每個(gè)數(shù)據(jù)點(diǎn)來平滑數(shù)據(jù)[10]。這個(gè)算法的通用表達(dá)如式(1)所示:
式中:ys(i)是第 i個(gè)數(shù)據(jù)的平滑值;N 是 ys(i)鄰近數(shù)據(jù)點(diǎn)的個(gè)數(shù);2N+1是跨度。
考慮到風(fēng)電場實(shí)際運(yùn)行數(shù)據(jù)異質(zhì)值對(duì)擬合風(fēng)速-功率曲線準(zhǔn)確度的影響[11]以及MASA存在的不足,提出(IMASA),即為跨度內(nèi)的數(shù)據(jù)點(diǎn)定義一個(gè)權(quán)重函數(shù),通過權(quán)重函數(shù)值判斷要平滑的數(shù)據(jù)點(diǎn)是否具有最大權(quán)重值以及對(duì)擬合曲線的影響程度。通過把跨度以外的數(shù)據(jù)點(diǎn)的權(quán)重值定義為零來避免異質(zhì)值對(duì)擬合曲線準(zhǔn)確度的影響,其數(shù)學(xué)表達(dá)如式(2)、式(3)所示:
式中:x是與數(shù)據(jù)點(diǎn)平滑相關(guān)的平滑值;xi是x通過跨度定義的最鄰近數(shù)據(jù)點(diǎn);d(x)是x沿橫軸到跨度內(nèi)最遠(yuǎn)的距離。
最后,利用最小二乘法將所得平滑值點(diǎn)擬合成一條映射曲線如式(4)所示:
總結(jié)以上算法,其原理流程如圖1所示。
圖1 擬合風(fēng)速-功率曲線原理Fig.1 Principle of fitting wind speed power curve
在風(fēng)速樣本數(shù)據(jù)進(jìn)行分組劃分時(shí),采用常規(guī)的K-means聚類算法雖然也能對(duì)風(fēng)速樣本數(shù)據(jù)進(jìn)行分類劃分,但是由于大數(shù)據(jù)下風(fēng)速數(shù)據(jù)具有空間和時(shí)間相關(guān)性,對(duì)具有高相關(guān)性的風(fēng)速數(shù)據(jù)進(jìn)行聚類劃分時(shí),很容易產(chǎn)生不穩(wěn)定的聚類結(jié)果,對(duì)準(zhǔn)確劃分風(fēng)速數(shù)據(jù)具有一定的影響。模糊C均值聚類算法(FCM)能夠有效地改善風(fēng)速數(shù)據(jù)的空間和時(shí)間的相關(guān)性對(duì)最后聚類結(jié)果的影響,改善風(fēng)速數(shù)據(jù)聚類劃分結(jié)果的合理性。
FCM是經(jīng)典聚類算法之一,它通過隸屬度矩陣表示每個(gè)樣本與各個(gè)分類之間的關(guān)系[12],其原理如圖2所示。
但是FCM也有不足的地方:①聚類中心隨機(jī)選取,比較難確定,且聚類中心的選取對(duì)聚類結(jié)果影響很大;②容易得到次優(yōu)解??梢姡:鼵均值聚類算法雖然在風(fēng)速預(yù)測中得到了應(yīng)用,但仍需改進(jìn)。
風(fēng)電場不同機(jī)組采集的風(fēng)速可以看作一組按照一定時(shí)間分辨率記錄的多變量時(shí)間序列數(shù)值[13],即:
式中:時(shí)間 t=1,2,…,n;變量 i=1,2,…,m;變量 vi(t)表示第i臺(tái)風(fēng)機(jī)在t時(shí)刻的捕獲值。所以可將風(fēng)電場不同機(jī)組捕獲的風(fēng)速數(shù)據(jù)記為一個(gè)m×n的多變量時(shí)間序列矩陣M,即
式中:t=1,2,…,n(n 為時(shí)間點(diǎn)數(shù));i=1,2,…,m(m為風(fēng)機(jī)編號(hào));對(duì)M進(jìn)行相空間重構(gòu),其空間中的相點(diǎn)可以表示為 vq,如式(7)所示:
Guang-Bin Huang在2004年率先提出ELM,其實(shí)質(zhì)是單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFN)學(xué)習(xí)算法的一種[14]。而以強(qiáng)大的非線性映射能力著稱的核函數(shù)在處理非線性映射問題上具有很好的應(yīng)用[15]。將Huang所提ELM隱含層結(jié)點(diǎn)映射用核函數(shù)等效代替,便可得到穩(wěn)健性和非線性逼近能力更好的KELM。求解KELM 如式(8)、式(9)所示:
令ELM隱含層輸出矩陣如式(10)所示:
從而可以將求解ELM寫成式(11):
令
那么基于核函數(shù)的ELM就可以用式(13)表示:
通常,工程上選取的核函數(shù)為高斯核函數(shù),其數(shù)學(xué)表達(dá)式如下所示:
針對(duì)Kennedy和Eberhart先前提出的PSO[16-17]在工程應(yīng)用中存在搜索精度不高,容易陷入局部最優(yōu)解等不足,本文率先利用IPSO克服以上算法存在的不足并應(yīng)用到風(fēng)速預(yù)測的實(shí)踐當(dāng)中[18]。粒子移動(dòng)的下一時(shí)刻的速度如式(15)所示:
式中,vd′(t+1)表示任一粒子在維度d上下一時(shí)刻的速度;xd(t)表示任一粒子在維度d上t時(shí)刻的位置;w為慣性權(quán)重;pd(t)為任一粒子當(dāng)前搜索到的最優(yōu)解;pgd(t)為整個(gè)粒子群當(dāng)前的最優(yōu)解;c1、c2是可以改變 pd(t)和 pgd(t)相對(duì)重要性的學(xué)習(xí)因子;rand()為隨機(jī)數(shù),取值一般在0~1之間。式(15)中常數(shù)能對(duì)慣性權(quán)重值、學(xué)習(xí)因子進(jìn)行權(quán)衡,避免c1、c2過增,避免粒子更新偏向粒子局部或粒子整體,同時(shí)也避免了速度過增,使粒子群算法表現(xiàn)出更好地搜索性和收斂性還不增加計(jì)算量。粒子移動(dòng)的下一位置為vd′(t+1)=xd(t)+vd(t)。
在利用IPSO進(jìn)行優(yōu)化時(shí),以ARE作為衡量優(yōu)化效果的標(biāo)準(zhǔn)。那么
為了降低程序迭代次數(shù)和計(jì)算量,設(shè)定尋優(yōu)參數(shù)的約束條件如下所示:
最后,編寫程序,利用IPSO進(jìn)行優(yōu)化處理。具體程序原理如圖3所示。
本文根據(jù)晉北風(fēng)場現(xiàn)場實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行實(shí)例分析。晉北風(fēng)場位于山西盛風(fēng)嶺地區(qū),總跨度約12.2 km,平均海拔在 1692~2120 m 之間,場址中心位于東經(jīng) 114°~116°之間, 北緯 114°~116°之間,分為一、二期,共66臺(tái)機(jī)組,總裝機(jī)容量99 MW。由于該風(fēng)電場位于山西以北典型山嶺地帶,所處地理環(huán)境復(fù)雜,綜合考慮,該風(fēng)電場的地理位置布置情況如圖4所示。
圖3 IPSO優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)功率流程Fig.3 Flow chart of IPSO optimized fuzzy PSR-KELM model for predicting wind power
圖4 晉北風(fēng)場風(fēng)機(jī)地理分布圖Fig.4 Geographical distribution map of the north wind fan
晉北風(fēng)場在不同時(shí)間段內(nèi)的2個(gè)月實(shí)際運(yùn)行風(fēng)速-功率數(shù)據(jù)統(tǒng)計(jì)散點(diǎn)結(jié)果如圖5所示。
圖5 晉北風(fēng)場實(shí)際運(yùn)行風(fēng)速-功率散點(diǎn)圖Fig.5 Actual wind speed power dispersion diagram of Shanxi north wind field
本文以晉北風(fēng)場10天的數(shù)據(jù)為例,根據(jù)晉北風(fēng)場每10 min采集一次、總長度1440個(gè)的實(shí)際運(yùn)行數(shù)據(jù)樣本點(diǎn)進(jìn)行實(shí)例分析,前十分之九的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),后十分之一的風(fēng)速數(shù)據(jù)作為測試數(shù)據(jù)。利用IPSO優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)速并將預(yù)測結(jié)果與實(shí)際運(yùn)行數(shù)據(jù)、不同模型 (模糊PRS-KELM模型和PRS-KELM四參數(shù)優(yōu)化模型)進(jìn)行比較,如圖6所示。
圖6 不同模型的風(fēng)速預(yù)測結(jié)果Fig.6 Wind speed prediction results of different models
將IPSO優(yōu)化模糊PSR-KELM模型、不同模型(模糊PRS-KELM模型和PRS-KELM四參數(shù)優(yōu)化模型)預(yù)測風(fēng)速與實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行比較,分析誤差結(jié)果如圖7所示。
圖7 不同模型的風(fēng)速預(yù)測誤差分析結(jié)果Fig.7 Analysis results of wind speed prediction error of different models
將預(yù)測風(fēng)速映射到利用IMASA濾除異質(zhì)值后擬合的風(fēng)速-功率曲線上預(yù)測功率并與MASA、不濾除異質(zhì)值處理預(yù)測結(jié)果比較如圖8所示。
圖8 基于映射不同擬合曲線預(yù)測功率結(jié)果Fig.8 Predicting power results based on different fitting curves
利用式(16)計(jì)算晉北風(fēng)場利用不同模型預(yù)測風(fēng)速及功率的平均相對(duì)誤差如表1所示。
表1 風(fēng)速及功率的預(yù)測ARE值Tab.1 ARE value of wind speed and power
通過分析表1可以看出,基于IPSO優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)速的預(yù)測誤差值較小,IPSO優(yōu)化模糊PSR-KELM模型與模糊PRS-KELM模型和PRS-KELM四參數(shù)優(yōu)化模型相比,精確度大大提高,說明IPSO優(yōu)化模糊PSR-KELM模型的有效性。同時(shí),預(yù)測功率誤差說明IMASA濾除風(fēng)電場實(shí)際運(yùn)行風(fēng)速-功率數(shù)據(jù)異質(zhì)值的必要性和有效性。
根據(jù)晉北風(fēng)場的實(shí)際運(yùn)行數(shù)據(jù)分析,利用PSR-KELM四參數(shù)優(yōu)化模型訓(xùn)練IPSO優(yōu)化模糊C均值聚類算法生成的模糊樣本進(jìn)行風(fēng)速預(yù)測,克服了大數(shù)據(jù)下風(fēng)電場實(shí)際運(yùn)行數(shù)據(jù)中的異質(zhì)值對(duì)風(fēng)速預(yù)測模型準(zhǔn)確度和穩(wěn)定性的影響。另外,由于大數(shù)據(jù)下風(fēng)電場運(yùn)行數(shù)據(jù)異質(zhì)值的存在,通過分析晉北風(fēng)場實(shí)際運(yùn)行數(shù)據(jù)發(fā)現(xiàn),IMASA可以很好的避免異質(zhì)值的影響并準(zhǔn)確的擬合出一條基于實(shí)際運(yùn)行數(shù)據(jù)的風(fēng)電場風(fēng)速-功率曲線。
另外,通過表1中不同模型對(duì)風(fēng)速以及功率的預(yù)測誤差對(duì)比還可以看出,利用本文提出的風(fēng)功率預(yù)測模型完全可以對(duì)風(fēng)電場出力變化趨勢進(jìn)行準(zhǔn)確預(yù)測,并對(duì)風(fēng)電場的運(yùn)行并網(wǎng)目標(biāo)實(shí)現(xiàn)可預(yù)測調(diào)控監(jiān)視。