亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于偏最大信息系數(shù)與組合XGBoost的短期風(fēng)功率預(yù)測(cè)

        2021-12-01 00:41:30李科黃東晨陶子彬熊歡李浩文杜業(yè)冬
        電力工程技術(shù) 2021年6期
        關(guān)鍵詞:風(fēng)速模型

        李科,黃東晨,陶子彬,熊歡,李浩文,杜業(yè)冬

        (南瑞集團(tuán)(國(guó)網(wǎng)電力科學(xué)研究院)有限公司,江蘇 南京 211106)

        0 引言

        風(fēng)能是一種可大規(guī)模商用的綠色可再生能源。由于風(fēng)力發(fā)電具有強(qiáng)烈的間歇性和隨機(jī)性,且周期規(guī)律不明顯,當(dāng)風(fēng)電大規(guī)模并入電網(wǎng)時(shí),可能對(duì)電網(wǎng)的安全及穩(wěn)定運(yùn)行產(chǎn)生不良影響[1]。因此,亟需發(fā)展精準(zhǔn)的風(fēng)功率預(yù)測(cè)技術(shù)。

        圍繞著短期風(fēng)功率預(yù)測(cè),國(guó)內(nèi)外學(xué)者進(jìn)行了諸多探索。自回歸滑動(dòng)平均模型(autoregressive moving average model,ARMA)假設(shè)當(dāng)前時(shí)刻的值與前一時(shí)刻的值及隨機(jī)干擾量均有關(guān),具有一定捕捉時(shí)序信息的能力,是一種常用于風(fēng)功率預(yù)測(cè)的時(shí)間序列分析模型[2]。但對(duì)于功率波動(dòng)較大且無(wú)明顯周期規(guī)律的風(fēng)電場(chǎng)而言,使用ARMA模型會(huì)導(dǎo)致預(yù)測(cè)結(jié)果誤差較大。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[3—4]和支持向量機(jī)(support vector machine,SVM)[5]是另外2種經(jīng)典的風(fēng)功率預(yù)測(cè)模型。ANN能夠自適應(yīng)、自學(xué)習(xí),以任意精度逼近任何非線性映射,非常適合描述風(fēng)功率預(yù)測(cè)模型復(fù)雜與非線性的特點(diǎn)。但ANN訓(xùn)練時(shí)間長(zhǎng),調(diào)參過(guò)程較為繁瑣,容易出現(xiàn)過(guò)擬合的情況[6]。相較而言,SVM有著較強(qiáng)的泛化能力,不易過(guò)擬合。然而,當(dāng)訓(xùn)練樣本大幅增加時(shí),SVM的性能提升不明顯[7—8]。

        近年來(lái),極限梯度提升(extreme gradient boosting,XGBoost)[9]算法由于在Kaggle、KDD等一系列大數(shù)據(jù)算法競(jìng)賽中表現(xiàn)優(yōu)異,引發(fā)了大量的關(guān)注。XGBoost不僅在算法精度上較傳統(tǒng)算法表現(xiàn)出色,同時(shí)也支持并行化運(yùn)行,減少了模型的訓(xùn)練時(shí)間。此外,XGBoost還具有可移植性強(qiáng)、支持多數(shù)主流編程語(yǔ)言、集成了Spark等各類主流大數(shù)據(jù)平臺(tái)等特性[10],這些特性增強(qiáng)了XGBoost的普適性,使得XGBoost在工程化應(yīng)用方面具有更大的優(yōu)勢(shì)。目前XGBoost已經(jīng)在光伏發(fā)電量預(yù)測(cè)[11—14]等多個(gè)領(lǐng)域有所應(yīng)用。然而,僅使用單一預(yù)測(cè)模型存在一定的泛化問(wèn)題,需要結(jié)合組合預(yù)測(cè)策略[15]。文獻(xiàn)[16]以反向傳播 (back propagation,BP)神經(jīng)網(wǎng)絡(luò)、線性外推和SVM為底層算法,構(gòu)建一種動(dòng)態(tài)調(diào)整權(quán)重分配的風(fēng)電預(yù)測(cè)集成學(xué)習(xí)模型,獲得了提高模型整體泛化能力的效果。然而,文中的方法缺少效率層面上的考慮。另外,在工程應(yīng)用中,不同風(fēng)電場(chǎng)適用的模型氣象特征輸入不同[17],需要有相應(yīng)的算法選擇合適的氣象特征作為模型的輸入變量。

        綜上所述,文中提出一種結(jié)合偏最大信息系數(shù)(partial maximal information coefficient,PMIC)特征選擇算法的組合XGBoost短期風(fēng)功率預(yù)測(cè)模型。首先,設(shè)計(jì)基于PMIC的特征選擇算法,對(duì)風(fēng)速、風(fēng)向等常用氣象特征進(jìn)行優(yōu)選;其次,以XGBoost為底層算法構(gòu)建組合預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)短期風(fēng)功率的預(yù)測(cè)。算例結(jié)果表明,文中方法能有效提高短期風(fēng)功率預(yù)測(cè)精度及計(jì)算效率,有助于工程化應(yīng)用。

        1 特征選擇

        1.1 風(fēng)功率預(yù)測(cè)問(wèn)題中常用的氣象特征

        據(jù)已有文獻(xiàn)及現(xiàn)場(chǎng)情況,目前常用氣象特征有:

        (1)風(fēng)速Vh,即風(fēng)電場(chǎng)與地面相對(duì)高度為h米時(shí)的平均風(fēng)速,在文中后續(xù)算例中,h的取值范圍為{30,50,70,90,110}。

        (2)風(fēng)向Ddir,即風(fēng)電場(chǎng)當(dāng)?shù)氐钠骄L(fēng)向。

        (3)溫度Ttemp,即風(fēng)電場(chǎng)當(dāng)?shù)氐钠骄鶞囟取?/p>

        (4)濕度Hhum,即風(fēng)電場(chǎng)當(dāng)?shù)氐钠骄鶟穸取?/p>

        (5)氣壓Ppres,即風(fēng)電場(chǎng)當(dāng)?shù)氐钠骄鶜鈮骸?/p>

        在短期風(fēng)功率預(yù)測(cè)問(wèn)題中,風(fēng)速是決定風(fēng)電場(chǎng)輸出功率的主導(dǎo)因素。由于地表粗糙度和大氣熱分層的影響,風(fēng)速的分布并不完全遵循對(duì)數(shù)風(fēng)廓線或指數(shù)風(fēng)廓線,有時(shí)還會(huì)出現(xiàn)低海拔風(fēng)速高于高海拔風(fēng)速的情況。因此,在選擇預(yù)測(cè)模型的特征輸入時(shí),可以考慮不同高度的風(fēng)速,這樣能夠更好地表征風(fēng)電場(chǎng)周圍的大氣特征[18]。

        另外,根據(jù)文獻(xiàn)[19],風(fēng)速之外的因素也可能對(duì)風(fēng)電場(chǎng)的功率出力情況造成影響。對(duì)于不同風(fēng)電場(chǎng),氣象特征對(duì)輸出功率的影響程度也不相同。例如,當(dāng)風(fēng)電場(chǎng)內(nèi)風(fēng)機(jī)空間布局密集程度較大時(shí),尾流效應(yīng)對(duì)風(fēng)電場(chǎng)出力的影響尤其突出[20],此時(shí)風(fēng)向?qū)︼L(fēng)功率有較大的影響。因此,需在建立模型前對(duì)特征進(jìn)行選擇。

        1.2 基于PMIC的特征選擇

        最大信息系數(shù)(maximal information coefficient,MIC)是一種衡量變量間相關(guān)性程度的統(tǒng)計(jì)量[21],不僅能夠刻畫(huà)變量間的線性與非線性關(guān)系,還能夠捕獲變量間潛在的非函數(shù)關(guān)系。其主要思想為:如果2個(gè)變量之間具有一定的相關(guān)關(guān)系,對(duì)相應(yīng)變量的散點(diǎn)圖進(jìn)行不同方案的網(wǎng)格劃分,計(jì)算對(duì)應(yīng)的互信息(mutual information,MI)值并且進(jìn)行正則化,取這些值中的最大值,則該值為這2個(gè)變量的MIC。其中,MI值是衡量變量之間相關(guān)性程度的指標(biāo)。給定變量X={xi},Y={yi},i=1,2,…,n,n為樣本數(shù)目,其MI值定義為:

        (1)

        式中:f(x,y)為X和Y的聯(lián)合概率密度;f(x),f(y)分別為X和Y的邊緣概率密度。采用高斯函數(shù)對(duì)上述概率密度進(jìn)行估計(jì),至此,可進(jìn)一步求得MI值。

        給定一個(gè)有限二元數(shù)據(jù)集合D={(xi,yi)},i=1,2,…,n,將變量X劃分為x個(gè)區(qū)間,Y劃分為y個(gè)區(qū)間,則能夠得到一個(gè)x×y的網(wǎng)格劃分G。同樣的x×y規(guī)格的網(wǎng)格劃分方案有多種,對(duì)每一種方案,計(jì)算其MI值,取不同劃分方案下Imi(X,Y)的最大值作為劃分G的MI值。至此,定義集合D在劃分G下的最大MI值為:

        I*(D,x,y)=maxGI(D|G)

        (2)

        式中:D|G為集合D在G上的概率分布;I(D|G)為在該概率分布下的MI值;maxG為遍歷所有可能的x×y網(wǎng)格G。

        將所有劃分方案下的最大MI值進(jìn)行正則化,并組成特征矩陣M(D)x,y,定義為:

        (3)

        最大信息系數(shù)Imic定義為:

        (4)

        式中:B(n)為網(wǎng)格劃分x×y的上限值。在文獻(xiàn)[22]中,建議將ε設(shè)為0.6,即B(n)=n0.6。

        然而,風(fēng)電場(chǎng)相關(guān)氣象特征之間普遍存在一定程度的耦合關(guān)系。為此,文中在MIC的基礎(chǔ)上進(jìn)一步引入偏互信息(partial mutual information,PMI),將MIC改造為PMIC,以消除耦合給特征選擇帶來(lái)的不利影響。

        設(shè)X和Z為多輸入系統(tǒng)中的輸入變量,Y為輸出變量。若X和Z之間具有耦合關(guān)系,將導(dǎo)致X和Y之間最大信息系數(shù)Imic(X,Y)的計(jì)算出現(xiàn)偏差。因此,文中應(yīng)用條件期望mX(z)和mY(z)分別對(duì)X和Y中包含Z的信息剔除,分別記為U,V:

        (5)

        U=X-mX(Z)

        (6)

        V=Y-mY(Z)

        (7)

        式中:f(z)為Z的邊緣概率密度函數(shù)。X和Y的PMIC記為:

        Ipmic(X,Y)=Imic(U,V)

        (8)

        文中采用赤池信息量準(zhǔn)則(akaike information criterion,AIC)[22]作為變量篩選的結(jié)束條件,即:

        (9)

        式中:ri為根據(jù)已選變量計(jì)算的Y回歸殘差;p為已選變量個(gè)數(shù)。隨著變量的篩選,TAIC不斷減小,當(dāng)TAIC達(dá)到最小值時(shí),最優(yōu)自變量集合篩選完畢。

        設(shè)輸入變量集為F,輸入變量為Y,最優(yōu)輸入變量集為S,F(xiàn)S為最大的PMIC值對(duì)應(yīng)的候選變量。PMIC變量選擇算法流程如下:

        (1)將S初始化為空集。

        (2)計(jì)算F中各變量與Y的最大信息系數(shù)Imic(Fi,Y)。

        (3)選擇使IMIC(Fi,Y)值最大的FS。

        (4)計(jì)算TAIC值,并將FS移入S。

        (5)若F≠φ,計(jì)算V=Y-mY(S);對(duì)于每一個(gè)Fj∈F,計(jì)算U=Fj-mFj(S)。

        (6)選擇使Imic(U,V)值最大的FS。

        (7)更新TAIC值,若TAIC減小,則將FS移入S,返回步驟(5),否則終止篩選。

        2 短期風(fēng)功率組合預(yù)測(cè)模型

        2.1 XGBoost算法原理

        XGBoost是一種以決策樹(shù)為基礎(chǔ)的梯度提升算法,計(jì)算速度快,模型表現(xiàn)好。給定含有N個(gè)樣本和M個(gè)氣象特征的訓(xùn)練樣本集D={(xi,yi)}(i=1,2,…,N,xi∈RM,yi∈R),RM為具有M個(gè)維度的實(shí)數(shù)集。XGBoost算法使用由K個(gè)回歸決策樹(shù)函數(shù)相加構(gòu)成的集成模型對(duì)功率進(jìn)行回歸預(yù)測(cè):

        (10)

        (11)

        (12)

        (13)

        式中:ftrou(xi)為第trou輪增加的決策樹(shù)函數(shù);Ω(ftrou)為第trou輪對(duì)應(yīng)的正則項(xiàng),對(duì)以上目標(biāo)函數(shù)進(jìn)行二階泰勒展開(kāi),并移除常數(shù)項(xiàng),可得:

        (14)

        其中:

        (15)

        (16)

        式中:gi,hi分別為損失函數(shù)的一、二階導(dǎo)數(shù)。

        通過(guò)對(duì)目標(biāo)函數(shù)進(jìn)行二階泰勒展開(kāi),同時(shí)用到了一階導(dǎo)數(shù)和二階導(dǎo)數(shù),有利于模型在訓(xùn)練集上更快地收斂。

        綜合式(12)和式(14),并定義:

        (17)

        則有:

        (18)

        對(duì)于一個(gè)確定的樹(shù)結(jié)構(gòu)qtree,其對(duì)應(yīng)的最優(yōu)化目標(biāo)函數(shù)值為:

        (19)

        (20)

        式(19)可用于衡量樹(shù)結(jié)構(gòu)qtree的質(zhì)量。通常所有可能的樹(shù)結(jié)構(gòu)不可能被完全枚舉出來(lái),故XGBoost采用一種貪心算法,每次在已有的葉子節(jié)點(diǎn)中加入分裂。假設(shè)IL和IR為分裂后左右子節(jié)點(diǎn)的集合,設(shè)I=IL∪IR,則分裂后產(chǎn)生的信息增益如下:

        (21)

        式(21)通常用來(lái)評(píng)價(jià)分割的候選節(jié)點(diǎn)。

        2.2 組合XGBoost預(yù)測(cè)模型構(gòu)建

        組合預(yù)測(cè)能有效綜合多個(gè)單一模型的信息,減少單個(gè)模型的預(yù)測(cè)風(fēng)險(xiǎn),提升算法整體的預(yù)測(cè)精度[23—24]。由此,文中結(jié)合前文闡述的基于PMIC的特征選擇算法,構(gòu)建以XGBoost為底層算法的組合預(yù)測(cè)模型。相應(yīng)的訓(xùn)練流程如圖1所示。

        圖1 組合XGBoost模型訓(xùn)練流程Fig.1 Training process of combined XGBoost model

        (1)對(duì)原始特征集執(zhí)行基于PMIC的特征選擇操作。

        (2)根據(jù)選擇出的風(fēng)速高度將相應(yīng)的數(shù)據(jù)集分成n個(gè)訓(xùn)練子集{M1,M2,…,Mn}。

        (3)利用XGBoost分別對(duì)n個(gè)訓(xùn)練子集進(jìn)行訓(xùn)練,生成n個(gè)子模型X1,X2,…,Xn,利用測(cè)試集及均方誤差對(duì)每個(gè)子模型的預(yù)測(cè)誤差ei進(jìn)行評(píng)估,計(jì)算公式為:

        (22)

        (4)利用熵權(quán)法對(duì)各子模型進(jìn)行權(quán)重分配。

        相應(yīng)的預(yù)測(cè)流程如圖2所示。

        圖2 組合XGBoost模型預(yù)測(cè)流程Fig.2 Forecasting process of combined XGBoost model

        (1)對(duì)預(yù)測(cè)集進(jìn)行包含特征選擇在內(nèi)的數(shù)據(jù)預(yù)處理工作,并根據(jù)風(fēng)速高度將處理后的預(yù)測(cè)集分成n個(gè)預(yù)測(cè)子集N1,N2,…,Nn。

        (2)利用訓(xùn)練流程生成的各XGBoost子模型X1,X2,…,Xn及對(duì)應(yīng)權(quán)重W1,W2,…,Wn對(duì)測(cè)試樣本進(jìn)行計(jì)算,得出預(yù)測(cè)結(jié)果。

        3 算例分析

        3.1 數(shù)據(jù)集與模型評(píng)價(jià)指標(biāo)

        為充分論證文中所提方法性能,文中采用華東某風(fēng)電場(chǎng)A、西北某風(fēng)電場(chǎng)B的實(shí)測(cè)數(shù)據(jù)及歷史數(shù)值天氣預(yù)報(bào)數(shù)據(jù)進(jìn)行了相關(guān)實(shí)驗(yàn)。其中,風(fēng)電場(chǎng)A的平均風(fēng)速較小,波動(dòng)相對(duì)穩(wěn)定;而風(fēng)電場(chǎng)B則平均風(fēng)速較大,波動(dòng)性較強(qiáng)。表1和表2分別為2個(gè)風(fēng)電場(chǎng)數(shù)據(jù)的數(shù)據(jù)概況及相關(guān)風(fēng)電機(jī)組的主要參數(shù)。

        表1 風(fēng)電場(chǎng)A和B的數(shù)據(jù)概況Table 1 The data overview of wind farms A and B

        表2 風(fēng)電場(chǎng)A和B的風(fēng)電機(jī)組主要參數(shù)Table 2 Main parameters of wind turbines in wind farms A and B

        訓(xùn)練階段的輸入為測(cè)風(fēng)塔不同高度的風(fēng)速數(shù)據(jù)及風(fēng)電場(chǎng)當(dāng)?shù)氐钠骄L(fēng)向、溫度、濕度及氣壓數(shù)據(jù),輸出為實(shí)測(cè)功率。測(cè)試階段的輸入為對(duì)應(yīng)的數(shù)值天氣預(yù)報(bào)數(shù)據(jù),輸出為預(yù)測(cè)功率。對(duì)于短期功率預(yù)測(cè),后一天的數(shù)值天氣預(yù)報(bào)數(shù)據(jù)由預(yù)報(bào)供應(yīng)商于前一天的6點(diǎn)前發(fā)布。

        在數(shù)據(jù)預(yù)處理方面,采用文獻(xiàn)[25]中數(shù)據(jù)預(yù)處理方法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行預(yù)處理。

        在模型精度評(píng)價(jià)方面,參考國(guó)家電網(wǎng)頒布的《風(fēng)功率預(yù)測(cè)功能規(guī)范》[26],選用均方根誤差、平均絕對(duì)誤差和合格率作為風(fēng)電場(chǎng)功率預(yù)測(cè)的精度的評(píng)價(jià)指標(biāo),各指標(biāo)的具體定義如下。

        均方根誤差:

        (23)

        平均絕對(duì)誤差:

        (24)

        合格率:

        (25)

        其中:

        (26)

        式中:Pft為t時(shí)刻預(yù)測(cè)功率值;Pt為t時(shí)刻實(shí)測(cè)功率值;Sop為風(fēng)電場(chǎng)的額定裝機(jī)容量。

        3.2 特征選擇

        為得到2個(gè)風(fēng)電場(chǎng)的最優(yōu)特征子集,利用PMI對(duì)MIC進(jìn)行改造,構(gòu)建一種基于PMIC的特征選擇算法,相應(yīng)的特征選擇過(guò)程分別如圖3、圖4所示。對(duì)于風(fēng)電場(chǎng)A而言,當(dāng)?shù)?個(gè)特征被選出來(lái)時(shí),TAIC最小,為-86 275。對(duì)于風(fēng)電場(chǎng)B而言,當(dāng)?shù)?個(gè)特征被選出來(lái)時(shí),TAIC最小,為-97 553。相應(yīng)的特征選擇結(jié)果如表3所示。

        圖3 風(fēng)電場(chǎng)A對(duì)應(yīng)的特征選擇過(guò)程Fig.3 Feature selection process corresponding to wind farm A

        圖4 風(fēng)電場(chǎng)B對(duì)應(yīng)的特征選擇過(guò)程Fig.4 Feature selection process corresponding to wind farm B

        表3 風(fēng)電場(chǎng)A和B對(duì)應(yīng)的最優(yōu)特征子集Table 3 The optimal feature subsets for wind farms A and B

        表3中,如文中1.1節(jié)所述,V30,V70,V90分別表示30 m,70 m,90 m層高對(duì)應(yīng)的風(fēng)速特征。在不同高度的風(fēng)速特征選擇方面,風(fēng)電場(chǎng)A比風(fēng)電場(chǎng)B少選了110 m風(fēng)速,這是由于風(fēng)電場(chǎng)A風(fēng)機(jī)風(fēng)輪掃風(fēng)范圍所限。在其他氣候條件選擇方面,風(fēng)電場(chǎng)B選擇了風(fēng)向和溫度,風(fēng)電場(chǎng)A則只選擇了氣壓,表明不同風(fēng)電場(chǎng)的輸出功率對(duì)氣候條件的敏感程度不同。

        3.3 算法整體預(yù)測(cè)效果分析

        為了驗(yàn)證組合XGBoost模型在解決短期風(fēng)功率預(yù)測(cè)問(wèn)題上的有效性,文中首先將未經(jīng)特征選擇的單一預(yù)測(cè)模型ARMA、SVM、BP、XGBoost、結(jié)合了PMIC的XGBoost(PMIC-XGBoost)與結(jié)合了PMIC的組合XGBoost(PMIC-CXGBoost)作為類比模型同時(shí)進(jìn)行風(fēng)功率預(yù)測(cè),并從訓(xùn)練效率和模型精度兩方面進(jìn)行驗(yàn)證。

        以風(fēng)電場(chǎng)A中的訓(xùn)練數(shù)據(jù)為基礎(chǔ),圖5為不同未經(jīng)特征選擇的單一預(yù)測(cè)模型在相同迭代次數(shù)下的訓(xùn)練耗時(shí)。可見(jiàn),XGBoost模型訓(xùn)練耗時(shí)要遠(yuǎn)低于其他模型,展現(xiàn)了其在模型訓(xùn)練效率方面的優(yōu)越性。其原因在于,XGBoost在效率上進(jìn)行了多方面優(yōu)化,包括基于列存儲(chǔ)塊的并行學(xué)習(xí)實(shí)現(xiàn)、采用緩存感知訪問(wèn)、外存塊計(jì)算等。因此,選擇XGBoost作為底層算法能使組合模型具備更高的計(jì)算效率。

        圖5 模型訓(xùn)練耗時(shí)與迭代次數(shù)的關(guān)系Fig.5 Relationship between model training time and number of iterations

        表4為不同模型對(duì)于風(fēng)電場(chǎng)A和風(fēng)電場(chǎng)B的預(yù)測(cè)結(jié)果??梢?jiàn),風(fēng)電場(chǎng)A具有遠(yuǎn)低于風(fēng)電場(chǎng)B的均方根誤差和平均絕對(duì)誤差,同時(shí)也有更高的合格率,表明平均風(fēng)速小,波動(dòng)相對(duì)穩(wěn)定的風(fēng)電場(chǎng)的輸出功率更好預(yù)測(cè)。當(dāng)由風(fēng)電場(chǎng)A切換到風(fēng)電場(chǎng)B時(shí),ARMA、SVM、BP的預(yù)測(cè)效果均急劇下降,而基于XGBoost模型,即XGBoost,PMIC-XGBoost,PMIC-CXGBoost仍能有10%左右的均方根誤差及7%以下的平均絕對(duì)誤差,合格率則均在87%上。統(tǒng)計(jì)結(jié)果表明,XGBoost在模型精度方面相較其他單一預(yù)測(cè)模型更加優(yōu)越且穩(wěn)定,這是因?yàn)閄GBoost的設(shè)計(jì)同時(shí)考慮了學(xué)習(xí)能力與泛化能力。在學(xué)習(xí)能力方面,XGBoost是一種由若干決策樹(shù)組成的集成學(xué)習(xí)模型,決策樹(shù)的個(gè)數(shù)理論上可以任意大,意味著XGBoost可以更靈活地對(duì)訓(xùn)練樣本進(jìn)行擬合,從樣本中學(xué)習(xí)更加豐富的信息。另外,XGBoost針對(duì)目標(biāo)函數(shù)進(jìn)行二階泰勒展開(kāi),在對(duì)一階導(dǎo)數(shù)進(jìn)行保留的同時(shí)加入二階導(dǎo)數(shù),能夠使模型在訓(xùn)練集上更容易收斂。在泛化能力方面,XGBoost 算法在正則項(xiàng)上對(duì)單顆樹(shù)中葉節(jié)點(diǎn)的數(shù)量及葉節(jié)點(diǎn)的權(quán)重均進(jìn)行了控制,避免模型出現(xiàn)過(guò)擬合,進(jìn)而提升模型在訓(xùn)練集外的泛化能力。

        表4 不同模型的預(yù)測(cè)結(jié)果Table 4 The forecasting results of different models %

        比較單一XGBoost和PMIC-XGBoost:對(duì)于風(fēng)電場(chǎng)A,PMIC-XGBoost的均方根誤差和平均絕對(duì)誤差相較單一XGBoost分別下降了1.39%和1.27%,合格率提升了1.65%;對(duì)于風(fēng)電場(chǎng)B,PMIC-XGBoost的均方根誤差和平均絕對(duì)誤差也相較單一XGBoost分別下降了1.67%和1.16%,合格率提升了1.43%。該結(jié)果驗(yàn)證了基于PMIC的特征選擇算法的有效性。

        比較PMIC-XGBoost和PMIC-CXGBoost:無(wú)論是風(fēng)電場(chǎng)A還是風(fēng)電場(chǎng)B,PMIC-CXGBoost模型整體的均方根誤差、平均絕對(duì)誤差都要小于PMIC-XGBoost,其合格率也高于PMIC-XGBoost。其中,風(fēng)電場(chǎng)A的均方根誤差和平均絕對(duì)誤差分別相較PMIC-XGBoost低了1.69%和1.84%,合格率相較高了2.44%;風(fēng)電場(chǎng)B的均方根誤差和平均絕對(duì)誤差分別相較PMIC-XGBoost低了1.84%和2.1%,合格率相較高了2.61%。該結(jié)果表明,引入組合預(yù)測(cè)的思想后,預(yù)測(cè)效果有了進(jìn)一步的提升。

        表5比較了文中組合預(yù)測(cè)方法PMIC-CXGBoost與其他相近組合預(yù)測(cè)方法的性能,類比模型為文獻(xiàn)[16]中的集成學(xué)習(xí)預(yù)測(cè)模型,底層算法的迭代次數(shù)設(shè)為300。文獻(xiàn)[16]中的模型也將不同高度的風(fēng)速作為模型的輸入,底層算法則采用了BP神經(jīng)網(wǎng)絡(luò)、線性外推和線性SVM,對(duì)應(yīng)風(fēng)電場(chǎng)A和風(fēng)電場(chǎng)B。與文獻(xiàn)[16]中的集成學(xué)習(xí)預(yù)測(cè)模型相比,文中所提組合XGBoost不僅具有更優(yōu)的精度,也具備更短的訓(xùn)練時(shí)間。

        表5 文中組合預(yù)測(cè)方法PMIC-CXGBoost和文獻(xiàn)[16]中的預(yù)測(cè)方法的對(duì)比Table 5 Comparison of the proposed combination forecasting method PMIC-CXGBoost and the forecasting method in reference 16

        圖6和圖7分別為文中方法在2個(gè)風(fēng)電場(chǎng)中風(fēng)功率預(yù)測(cè)值和實(shí)測(cè)值的比較??梢钥闯?,文中方法能很好地預(yù)測(cè)實(shí)測(cè)序列的變化趨勢(shì)。

        圖6 風(fēng)電場(chǎng)A中組合XGBoost預(yù)測(cè)值與實(shí)測(cè)值的比較Fig.6 Comparison of forecasting and measured values of combined XGBoost in wind farm A

        圖7 風(fēng)電場(chǎng)B中組合XGBoost預(yù)測(cè)值與實(shí)測(cè)值的比較Fig.7 Comparison of forecasting and measured values of combined XGBoost in wind farm B

        4 結(jié)語(yǔ)

        針對(duì)當(dāng)前短期風(fēng)功率預(yù)測(cè)中存在的精度以及工程化應(yīng)用問(wèn)題,文中提出一種將PMIC特征選擇與組合XGBoost相結(jié)合的預(yù)測(cè)模型。一方面,引入PMI對(duì)MIC進(jìn)行改造,使相關(guān)特征選擇算法不僅能得到對(duì)風(fēng)功率影響程度較大的氣象特征,也有利于消除變量間的耦合關(guān)系。另一方面,為兼顧算法的精度和效率,減少單個(gè)模型的預(yù)測(cè)風(fēng)險(xiǎn),采用XGBoost作為底層算法構(gòu)建組合預(yù)測(cè)模型。將2個(gè)具有較大差異的風(fēng)電場(chǎng)作為算例進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,結(jié)合了PMIC特征選擇的組合XGBoost模型不僅在精度方面效果理想,在計(jì)算效率方面,也較相近組合預(yù)測(cè)模型有更好的效果,便于工程化應(yīng)用。

        在下一步工作中,將考慮將誤差修正技術(shù)引入組合XGBoost預(yù)測(cè)模型中,使得算法整體上具備更好的反饋能力,以進(jìn)一步提升短期風(fēng)功率的預(yù)測(cè)精度。

        猜你喜歡
        風(fēng)速模型
        一半模型
        基于Kmeans-VMD-LSTM的短期風(fēng)速預(yù)測(cè)
        基于最優(yōu)TS評(píng)分和頻率匹配的江蘇近海風(fēng)速訂正
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        基于GARCH的短時(shí)風(fēng)速預(yù)測(cè)方法
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        考慮風(fēng)切和塔影效應(yīng)的風(fēng)力機(jī)風(fēng)速模型
        GE在中國(guó)發(fā)布2.3-116低風(fēng)速智能風(fēng)機(jī)
        日本中文字幕av网址| 无遮无挡爽爽免费视频| 久久国产精品波多野结衣av| 精品国产1区2区3区AV| 青青草成人原视频在线播放视频| 一区二区三区中文字幕p站| 激情航班h版在线观看| 天堂中文资源在线地址| 91青青草免费在线视频| 国产白浆在线免费观看| 亚洲亚洲人成综合网络| 2022Av天堂在线无码| 午夜国产在线精彩自拍视频| 漂亮人妻洗澡被公强 日日躁| 久久夜色精品国产噜噜亚洲av| 亚洲爆乳大丰满无码专区| 久久综合九色综合久久久 | 蜜桃视频高清在线观看| 人妻精品在线手机观看| 免费无码一区二区三区蜜桃大| 亚洲中文欧美日韩在线人| 蜜桃av一区二区三区久久| 欧美亚洲精品suv| 18禁高潮出水呻吟娇喘蜜芽| 亚洲精品国产二区三区在线| 中文字幕亚洲高清视频| 久久午夜无码鲁丝片午夜精品| 无码AV高潮喷水无码专区线| 元码人妻精品一区二区三区9| 亚洲中文字幕久久精品一区| 国产午夜鲁丝片av无码| 中文字幕亚洲综合久久菠萝蜜 | 国产一区二区黄色的网站| 鲁一鲁一鲁一鲁一曰综合网| 日韩第四页| 亚洲日本精品一区二区三区| 天天摸天天做天天爽水多| 天堂在线www中文| 国产天堂av手机在线| 国产一区二区三区av天堂| 亚洲精品久久中文字幕|