梁 濤,崔 潔,石 歡,李宗琪
(河北工業(yè)大學(xué),天津 300131)
在過去十幾年里,人們對可再生能源的利用給予了高度的重視,其中風(fēng)能的裝機(jī)容量最大,成為占比最高的可再生能源[1]。風(fēng)電機(jī)組功率曲線可以為風(fēng)電機(jī)組故障診斷、功率預(yù)測等工作提供一定的理論依據(jù)。然而由于制作商提供的功率曲線都是在特定的測試環(huán)境下給出的,不同風(fēng)電場所處的地理環(huán)境不同,即使是同一風(fēng)場內(nèi)的風(fēng)機(jī)也會(huì)因?yàn)轱L(fēng)機(jī)的分布位置不同和尾流效應(yīng)等因素而使每臺(tái)風(fēng)機(jī)的功率曲線都不盡相同[2]。為了更實(shí)際的了解風(fēng)機(jī)性能,需要對風(fēng)電機(jī)組功率曲線進(jìn)行擬合。
在風(fēng)機(jī)實(shí)測數(shù)據(jù)中,往往含有大量異常數(shù)據(jù)點(diǎn),若不將這些異常點(diǎn)剔除將嚴(yán)重影響曲線擬合效果。剔除異常點(diǎn)通常采用的方法包括:四分位數(shù)法、k-means聚類法和基于密度聚類[3]的方法。其中,四分位數(shù)法檢測異常點(diǎn)的效果不穩(wěn)定,會(huì)出現(xiàn)漏檢的現(xiàn)象;k-means聚類算法初始值的確定對聚類結(jié)果有很大影響且只適用于凸數(shù)據(jù)集;基于密度聚類的方法對樣本分布不均勻的數(shù)據(jù)集通常不能得到很好的效果。
曲線擬合方法主要分為兩類:參數(shù)法和非參數(shù)法。參數(shù)法是以數(shù)學(xué)模型為基礎(chǔ)的,求出模型的各個(gè)參數(shù)就能確定該模型,如:分段線性回歸擬合法、多項(xiàng)式回歸擬合法[4]、基于概率分布模型的曲線擬合法等。參數(shù)模型的優(yōu)點(diǎn)是推理過程易于理解,便于計(jì)算。但在數(shù)據(jù)結(jié)構(gòu)復(fù)雜的情況下,參數(shù)模型的擬合效果往往不如非參數(shù)模型。非參數(shù)化方法不會(huì)預(yù)先指定函數(shù)模型,而是從數(shù)據(jù)本身獲得所需要的信息,適應(yīng)能力強(qiáng),效果較穩(wěn)定。常用的非參數(shù)模型主要包括:神經(jīng)網(wǎng)絡(luò)、模糊邏輯方法等。
本文大體分為異常點(diǎn)剔除、曲線擬合和效果評估三個(gè)步驟。由于本研究的數(shù)據(jù)是稠密均勻的,采用帶噪聲應(yīng)用的密度空間聚類 (Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法對原始數(shù)據(jù)集進(jìn)行聚類分析,剔除異常數(shù)據(jù)點(diǎn),然后以多項(xiàng)式回歸曲線擬合法作為基準(zhǔn)模型,對其余三種回歸模型展開了討論分析,并將它們應(yīng)用于SCADA系統(tǒng)記錄的實(shí)測數(shù)據(jù)中,最后從擬合精度方面對四種模型的擬合效果進(jìn)行評價(jià)。
圖1為河北某風(fēng)電場SCADA系統(tǒng)記錄的16號風(fēng)機(jī)從2018年1月1日至2018年1月30日期間共4320對數(shù)據(jù)的風(fēng)速-功率散點(diǎn)圖,由圖可見,從風(fēng)電場采集到的數(shù)據(jù)中含有很多異常點(diǎn),這些異常點(diǎn)會(huì)對功率曲線的建模精度產(chǎn)生很大影響。
圖1 風(fēng)速-功率散點(diǎn)數(shù)據(jù)圖
DBSCAN是一種基于密度的聚類算法,數(shù)據(jù)點(diǎn)密集的區(qū)域代表了風(fēng)機(jī)運(yùn)行的基準(zhǔn)狀態(tài)。DBSCAN通過半徑參數(shù)Eps和鄰域密度閾值MinPts來描述樣本分布的緊密程度。采用文獻(xiàn)[5]中的經(jīng)驗(yàn)數(shù)值,取鄰域密度閾值為4,半徑參數(shù)的值通過繪制k-距離曲線方法得到,k-距離曲線圖明顯拐點(diǎn)位置為對應(yīng)的較好參數(shù)。剔除異常點(diǎn)之后的散點(diǎn)圖如圖2。
圖2 剔除異常點(diǎn)后的散點(diǎn)圖
曲線建模方法主要分為參數(shù)法和非參數(shù)法,到目前為止,沒有哪一種建模方法能夠在任何數(shù)據(jù)情況下都表現(xiàn)出最優(yōu)的擬合效果[6]。研究不同的功率曲線建模方法,并確定一種可以為該種類型的數(shù)據(jù)集帶來最好建模效果的方法是十分有必要的。
多項(xiàng)式曲線擬合已被廣泛應(yīng)用于風(fēng)力發(fā)電機(jī)組功率曲線建模技術(shù)中,其原理是用多項(xiàng)式函數(shù)的形式來描繪一個(gè)區(qū)域內(nèi)所有觀測點(diǎn)散點(diǎn)分布的大致走向,展開系數(shù)由最小二乘法確定。設(shè)函數(shù)的k階多項(xiàng)式為
P=Vβ+ε
(1)
其中
P=(p1,p2,…,pN)T,β=(β1,β2,…,βk)T,
(2)
應(yīng)用最小二乘法確定多項(xiàng)式系數(shù)得:
β=(VTV)-1VTP
(3)
采用經(jīng)驗(yàn)法確定的多項(xiàng)式階數(shù)會(huì)嚴(yán)重影響擬合精度,為了獲得最佳擬合效果,通過誤差評價(jià)指標(biāo)來確定擬合階數(shù)。由圖3的運(yùn)行結(jié)果可知,當(dāng)階數(shù)為12時(shí)獲得的擬合效果最好。多項(xiàng)式擬合功率曲線散點(diǎn)圖的效果如圖4。
圖3 階數(shù)選擇結(jié)果圖
圖4 多項(xiàng)式擬合風(fēng)速-功率曲線
多項(xiàng)式曲線擬合法受異常點(diǎn)的影響較大,尤其是在切入風(fēng)速和切出風(fēng)速附近,擬合效果欠佳。為了減弱異常點(diǎn)對擬合效果的影響,采用局部加權(quán)多項(xiàng)式方法對散點(diǎn)進(jìn)行擬合。局部加權(quán)多項(xiàng)式法屬于非參數(shù)法,對于每一個(gè)需要預(yù)測的點(diǎn),都要重新根據(jù)整個(gè)數(shù)據(jù)集計(jì)算模型,使得數(shù)據(jù)本身適應(yīng)性較好,擬合精度更高,但計(jì)算量較大,訓(xùn)練時(shí)間較長。
局部加權(quán)多項(xiàng)式擬合在特定目標(biāo)點(diǎn)v0建立模型:
J(β)=arg min(P-Vβ)TWs(v0)(P-Vβ)
(4)
得系數(shù)矩陣為:
β=(VTWs(v0)V)-1VTWs(v0)P
(5)
其中Ws(v0)是權(quán)值系數(shù)矩陣,采用高斯核函數(shù)作為平滑核函數(shù)計(jì)算權(quán)值系數(shù)陣。局部加權(quán)多項(xiàng)式法擬合的功率曲線如圖5。
圖5 局部加權(quán)多項(xiàng)式擬合風(fēng)速-功率曲線
通過對比圖4和圖5的擬合曲線可以發(fā)現(xiàn),在切入風(fēng)速和切出風(fēng)速附近,局部加權(quán)多項(xiàng)式擬合法比多項(xiàng)式擬合法表現(xiàn)出了更好的性能。
雖然局部加權(quán)多項(xiàng)式擬合法能擬合出功率曲線模型的大致形狀,但從圖5可以看出,局部加權(quán)多項(xiàng)式法在拐點(diǎn)處的擬合效果欠佳,從而無法得到風(fēng)速與功率之間非線性關(guān)系的理想近似值。樣條擬合實(shí)際是采用分段擬合的原則,在鄰近的兩個(gè)節(jié)點(diǎn)之間用低階多項(xiàng)式來擬合該段散點(diǎn),并且要在這些節(jié)點(diǎn)兩端保證一定的連續(xù)性使曲線光滑,從而用低階的樣條插值產(chǎn)生和高階多項(xiàng)式擬合類似的效果,在曲線拐點(diǎn)附近擬合效果良好。
最常用的樣條擬合法是三次樣條曲線擬合法,假設(shè)在區(qū)間[a,b]上有a=x0 1)B(x)在區(qū)間[a,b]上有連續(xù)的一階和二階連續(xù)導(dǎo)數(shù); 2)B(x)在每一個(gè)小區(qū)間[xi,xi+1] (i=0,…,n-1)上都是不高于三次的多項(xiàng)式。則稱B(x)是以x為節(jié)點(diǎn)的三次樣條函數(shù)。B(x)在某一節(jié)點(diǎn)處的函數(shù)為 Bi(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3 (6) 由定義的約束條件可得 (7) 計(jì)算出 (8) 其中 hi=xi+1-xi,Di=B″(xi)(i=1,2,…,n) (9) 在自由邊界條件下,即D0=Dn=0時(shí),將(8)帶入式(7)得式(10) (10) 解矩陣方程可得D0=D1=Dn,即可得B(x)函數(shù)表達(dá)式。圖6顯示了在使用5個(gè)和10個(gè)等距節(jié)點(diǎn)時(shí),由16號風(fēng)機(jī)數(shù)據(jù)建立的三次樣條擬合模型。由于樣條擬合通過增加節(jié)數(shù)而引入了靈活性,所以三次樣條擬合在平穩(wěn)性和適應(yīng)性方面優(yōu)于多項(xiàng)式擬合。 圖6 三次樣條法擬合風(fēng)速-功率曲線 由圖6可以看出,三次樣條擬合法在曲線彎曲部分可以提供良好的擬合效果,保證了曲線的光滑性,但對于直線段的擬合效果不好,在三次樣條擬合的基礎(chǔ)上引入B樣條函數(shù)。B樣條函數(shù)的最大優(yōu)點(diǎn)就是具有局部性,即改變某一個(gè)控制點(diǎn)的位置只會(huì)對相鄰曲線段的擬合效果產(chǎn)生影響而不會(huì)影響整條曲線,因此采用三次B樣條擬合可以對曲線進(jìn)行小范圍調(diào)整以提高擬合精度。 p次B樣條曲線方程為: (11) 其中Pi(i=0,1,…,n)為可以改變曲線形狀的控制點(diǎn),u=[u0,u1,…,um]為節(jié)點(diǎn)矢量,Ni,p(u) (i=0,1,…,n)為p次B樣條基函數(shù),通常由節(jié)點(diǎn)矢量根據(jù)Cox-deBoor遞推式(12)得出: (12) 由此,三次B樣條曲線方程為 (13) 在計(jì)算準(zhǔn)均勻三次B樣條曲線時(shí)會(huì)使曲線的首末端點(diǎn)與首末型值點(diǎn)相對應(yīng),內(nèi)部型值點(diǎn)依序作為擬合曲線的分段點(diǎn),則由型值點(diǎn)qi(i=0,1,…,n)擬合出來的曲線共有n段,需要的控制點(diǎn)Pj(j=0,1,…,n+2)共有n+3個(gè),節(jié)點(diǎn)矢量為u=[u0,u1,…,un+6],為確定型值點(diǎn)對應(yīng)的三次B樣條基函數(shù),采用向心參數(shù)化方法計(jì)算各段所對應(yīng)的節(jié)點(diǎn)為 u0=u1=u2=u3=0, un+3=un+4=un+5=un+6=1 (14) 將式(14)帶入式(12)即可得出三次B樣條基函數(shù)。 由位于曲線上的的型值點(diǎn)和三次B樣條基函數(shù)即可反求出所需的各個(gè)控制點(diǎn),由(13)即可擬合出所需的風(fēng)速功率曲線。 準(zhǔn)均勻三次B樣條擬合法通過10個(gè)型值點(diǎn)擬合出的風(fēng)速-功率曲線如圖7。 圖7 三次B樣條曲線擬合 圖8為四種曲線擬合方法得到的風(fēng)速-功率曲線。 圖8 四種功率曲線對比 由于風(fēng)電機(jī)組風(fēng)速-功率的散點(diǎn)圖呈帶狀分布,各個(gè)散點(diǎn)與擬合出的曲線之間存在一定的距離[7],為了評估各個(gè)模型擬合曲線的能力,本文選用MAE(平均絕對誤差)、RMSE(均方根誤差)和R2(R平方)來評價(jià)模型精度。 (15) (16) (17) 為了更準(zhǔn)確的反映各種方法的曲線擬合能力,根據(jù)風(fēng)電場風(fēng)機(jī)位置分布圖分別選取距離16號風(fēng)機(jī)近的23號風(fēng)機(jī)和距離較遠(yuǎn)的7號風(fēng)機(jī)對擬合效果進(jìn)行驗(yàn)證,對兩臺(tái)風(fēng)機(jī)同樣選取從2018年1月1日至2018年1月30日期間共4320對數(shù)據(jù)進(jìn)行散點(diǎn)圖的擬合。各建模方法的誤差計(jì)算結(jié)果見表1。 表1 各建模方法誤差計(jì)算結(jié)果 考慮到風(fēng)電機(jī)組功率曲線的精確建模對于風(fēng)電機(jī)組狀態(tài)監(jiān)測及功率預(yù)測有著重要的意義,本文提出了四種估算風(fēng)電機(jī)組功率曲線的參數(shù)和非參數(shù)模型,以多項(xiàng)式擬合法為基準(zhǔn)展開討論。多項(xiàng)式擬合法受異常點(diǎn)影響較大,若想獲得較高的擬合精度必須采用高階多項(xiàng)式進(jìn)行擬合,但階數(shù)過高容易產(chǎn)生過擬合的現(xiàn)象,由此,引入了局部加權(quán)擬合法。局部加權(quán)擬合法受異常點(diǎn)的影響較小,可以大致擬合出曲線輪廓,但在曲線拐點(diǎn)處擬合效果欠佳。三次樣條擬合法通過增加一系列節(jié)點(diǎn)來引入靈活性,克服了局部加權(quán)擬合法的缺點(diǎn)而對直線段的擬合容易產(chǎn)生較大波動(dòng)。最后,提出了三次B樣條曲線擬合法,它即保留了三次樣條的優(yōu)點(diǎn)又克服了其缺點(diǎn)。 本文選取三臺(tái)風(fēng)力發(fā)電機(jī)對所提出的方法進(jìn)行了性能分析,使用四種誤差評價(jià)指標(biāo)來評估每種方法的準(zhǔn)確性。研究結(jié)果表明,與其它分析方法相比,三次B樣條擬合法具有更好的性能。3.4 三次B樣條
4 模型性能評估
5 結(jié)論