祁 樂,唐 健,江 平,鄭芳雯,劉德志
(1.廣西電網(wǎng)電力調(diào)度控制中心,廣西 南寧 530023;2.北京心知科技有限公司,北京 100102)
隨著海上風(fēng)電制造、安裝、并網(wǎng)成本的逐步下降,海上風(fēng)電開發(fā)不斷向深海拓展,預(yù)計(jì)中國(guó)海上風(fēng)電累計(jì)裝機(jī)容量將在2025年達(dá)到2 500萬(wàn)kW[1]。海上風(fēng)電場(chǎng)裝機(jī)規(guī)模大、風(fēng)能質(zhì)量高,但因海上存在風(fēng)流熱效應(yīng)和放大的尾流效應(yīng)等,且海上風(fēng)電功率預(yù)測(cè)技術(shù)發(fā)展較晚,故海上風(fēng)電功率預(yù)測(cè)一般以陸上風(fēng)電模型為基準(zhǔn),并結(jié)合海上特征加以改進(jìn),相關(guān)研究證明該做法切實(shí)可行[2]。
傳統(tǒng)的風(fēng)功率預(yù)測(cè)方法可分為物理模型、統(tǒng)計(jì)模型和將二者結(jié)合的方法[3]。隨著氣象數(shù)值模式性能的提高,目前主流采用結(jié)合法,即使用機(jī)器學(xué)習(xí)方法對(duì)數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)風(fēng)速預(yù)測(cè)結(jié)果進(jìn)行誤差訂正后處理,得到較為準(zhǔn)確的風(fēng)速,并基于優(yōu)化后的風(fēng)速進(jìn)行風(fēng)電功率預(yù)測(cè)[4]。
通過(guò)引入多位置NWP 信息,可有效避免出現(xiàn)單位置NWP 無(wú)法準(zhǔn)確描述風(fēng)電場(chǎng)氣象信息的問題,提高預(yù)測(cè)精度[5-6]。文獻(xiàn)[7]同時(shí)考慮多位置NWP 與非典型氣象特征,基于最大相關(guān)-最小冗余原則和主成分分析進(jìn)行特征選擇,減少整體冗余性,有效降低了預(yù)測(cè)模型的訓(xùn)練時(shí)間。此外,考慮風(fēng)機(jī)數(shù)據(jù)的時(shí)間相關(guān)性,用聚類分析方法生成不同天氣類型數(shù)據(jù),針對(duì)不同天氣類型進(jìn)行NWP 數(shù)據(jù)訂正后處理,能進(jìn)一步提升預(yù)報(bào)能力[8]。文獻(xiàn)[9]考慮功率變化趨勢(shì),獲取更優(yōu)的性能,可在一定程度上解決功率波動(dòng)大的問題,即爬坡問題。然而上述研究只針對(duì)風(fēng)電場(chǎng)的單一風(fēng)速,缺乏對(duì)大型風(fēng)電場(chǎng)內(nèi)部差異的充分考慮,沒有利用機(jī)組各風(fēng)機(jī)的歷史信息。
機(jī)組分類是研究大型風(fēng)電場(chǎng)發(fā)電規(guī)律的重要手段,相關(guān)研究也表明基于風(fēng)電場(chǎng)機(jī)組分類的功率輸出模型能有效代表實(shí)際功率輸出情況,可降低功率建模過(guò)程的復(fù)雜度和時(shí)間[10]。近年來(lái),考慮機(jī)組分類的短期功率預(yù)測(cè)的研究表明,風(fēng)電場(chǎng)內(nèi)不同風(fēng)機(jī)受地形、尾流、湍流影響而差異明顯,基于機(jī)組分類的功率預(yù)測(cè)優(yōu)于單一風(fēng)速的功率預(yù)測(cè)[11-13]。但遺憾的是,此類研究均僅簡(jiǎn)單對(duì)機(jī)組的所有子類進(jìn)行功率預(yù)測(cè)建模,并采用疊加法對(duì)將預(yù)測(cè)功率累加求和,受到各個(gè)子類預(yù)測(cè)精度的影響,模型誤差累計(jì)造成其精度偏低。
綜上所述,提出一種考慮多NWP 和機(jī)組分類的功率預(yù)測(cè)校正模型,基于多NWP 信息和單一風(fēng)速進(jìn)行風(fēng)速訂正后處理,并通過(guò)理想功率曲線,生成初始預(yù)測(cè)功率。然后基于層次聚類[14],將風(fēng)電場(chǎng)內(nèi)風(fēng)力發(fā)電機(jī)組分類成若干代表組,生成若干組預(yù)測(cè)風(fēng)速;通過(guò)正則化極限學(xué)習(xí)機(jī)(Regularized Extreme Learning Machine,RELM)建立代表預(yù)報(bào)風(fēng)速與初始預(yù)測(cè)功率殘差的關(guān)系,最終校正初始預(yù)測(cè)功率。通過(guò)算例分析,所提出的模型能有機(jī)結(jié)合多NWP 和機(jī)組內(nèi)部信息,有效避免極端誤報(bào),提高考核天的準(zhǔn)確率,減少短期功率預(yù)測(cè)考核電量。
建立的海上風(fēng)電功率模型主要由初步預(yù)測(cè)功率模型和考慮機(jī)組分類的校正模型兩部分組成。
初步預(yù)測(cè)功率模型采用經(jīng)典的兩步法,首先使用物理模型和統(tǒng)計(jì)模型結(jié)合的方法預(yù)測(cè)風(fēng)速,為了考慮多位置的NWP信息,采用適合處理高維樣本的極限梯度提升樹(Extreme Gradient Boosting,XGBoost)模型作為統(tǒng)計(jì)學(xué)模型,然后將訂正后的NWP 預(yù)測(cè)風(fēng)速代入理想功率曲線(曲線由風(fēng)機(jī)信息所得),得到初始預(yù)測(cè)功率。
為引入風(fēng)場(chǎng)內(nèi)部差異信息,基于層次聚類將機(jī)組S 臺(tái)風(fēng)機(jī)風(fēng)速分類為G 組,生成G 組子類平均風(fēng)速,經(jīng)訂正后處理模塊生成G 組預(yù)測(cè)風(fēng)速,作為RELM 模型的輸入,模擬初始預(yù)測(cè)功率與實(shí)際觀測(cè)功率的差值,最終校正初始預(yù)測(cè)功率。
如圖1所示,設(shè)置3組實(shí)驗(yàn)。
圖1 風(fēng)功率預(yù)測(cè)流程
1)單一風(fēng)速:將風(fēng)電場(chǎng)平均風(fēng)速作為優(yōu)化目標(biāo),經(jīng)XGBoost 模型得優(yōu)化預(yù)報(bào)風(fēng)速,代入理想功率曲線,得預(yù)測(cè)功率P1。
2)機(jī)組分類:基于層次聚類,將S 臺(tái)風(fēng)機(jī)分為G組,分別以G 組平均風(fēng)速作為優(yōu)化目標(biāo),得G 組優(yōu)化預(yù)報(bào)風(fēng)速W,代入理想功率曲線得各組預(yù)測(cè)功率,累加得風(fēng)電場(chǎng)預(yù)測(cè)功率P2。
3)RELM 校正:設(shè)預(yù)測(cè)功率P1與真實(shí)功率的差距為殘差D,以D 為優(yōu)化目標(biāo),W 為RELM 模型輸入,預(yù)測(cè)殘差與P1之和即為最終預(yù)測(cè)功率P3。
為覆蓋風(fēng)電場(chǎng)更大范圍、涵蓋各種地形,應(yīng)選取風(fēng)電場(chǎng)周邊典型4~9 個(gè)位置的NWP 的氣象數(shù)據(jù),每個(gè)位置包含4 個(gè)高度層的經(jīng)向風(fēng)、緯向風(fēng)、溫度、濕度、氣壓等5 個(gè)參數(shù)信息,即每個(gè)時(shí)刻最多含180 維數(shù)據(jù)。NWP 為未來(lái)72 h 預(yù)報(bào)數(shù)據(jù),每天進(jìn)行一次更新,時(shí)間分辨率插值至15 min。
對(duì)機(jī)組分類時(shí),層次聚類法無(wú)須先驗(yàn)地指定子類的個(gè)數(shù)。相較k 點(diǎn)均值中心法kmeans、模糊C 點(diǎn)均值中心法(Fuzzy C Means,F(xiàn)CM)等方法,可添加約束,調(diào)整子類的個(gè)數(shù)。基于此,采用層次聚類法中的凝聚法,采用自底向上策略,輸入數(shù)據(jù)機(jī)組內(nèi)所有風(fēng)機(jī)的相似性度量向量矩陣,逐步合并相似距離相近的風(fēng)機(jī)為一類,直至將所有風(fēng)機(jī)聚為一個(gè)大類。具體流程為:
1)設(shè)N 為樣本數(shù),M 為風(fēng)機(jī)數(shù),選取同一時(shí)間段參與并網(wǎng)的M1臺(tái)風(fēng)機(jī),構(gòu)建N×M1階矩陣;
2)基于歐式距離、皮爾遜相關(guān)系數(shù)、熵相關(guān)系數(shù),計(jì)算M1個(gè)風(fēng)機(jī)兩兩間的相似性度量矩陣。
3)利用離差平方和法[15]計(jì)算不通類之間的距離d,每縮小一類,離差平方和SX就要增大,選擇使SX增加最小的兩類合并,如式(1)所示。
4)若類的個(gè)數(shù)不等于1,則重復(fù)執(zhí)行步驟3),否則執(zhí)行步驟5)。
5)保證類內(nèi)的風(fēng)機(jī)數(shù)不超過(guò)總風(fēng)機(jī)數(shù)一半,取子類個(gè)數(shù)的最大值。
6)計(jì)算聚類評(píng)判標(biāo)準(zhǔn)指數(shù)[16],確定計(jì)算相似性度量的方法。
設(shè)Y 為歷史功率,X 為歷史氣象數(shù)據(jù),則上述提及相似度距離公式為:
①歐式距離DXY為
式中:xi、yi分別為樣本i的氣象數(shù)據(jù)和功率數(shù)據(jù)。
②皮爾遜相關(guān)系數(shù)ρXY為
③熵相關(guān)系數(shù)IXY為
式中:H(X)為X 的信息熵;H(X,Y)為X、Y 聯(lián)合熵;I(X;Y)為互信息,表示X 和Y 之間共享信息量的多少。信息熵和聯(lián)合熵分別定義為:
式中:p(·)為落入?yún)^(qū)間的頻率;MX、Np分別為X、Y 升序排列等分的子區(qū)間的個(gè)數(shù),對(duì)于等分區(qū)間個(gè)數(shù)可參考式(7)。
④另外,聚類評(píng)價(jià)標(biāo)準(zhǔn)選取基于標(biāo)準(zhǔn)差指數(shù)(Standard Deviation Based Index,STDI)ISTD,其定義為類間距離與類內(nèi)距離之比,如式(8)所示,其值越大代表聚類效果越好。
式中:ck為第k類的質(zhì)心;為所有樣本的質(zhì)心;xi為第k類中的第i個(gè)樣本;nk為第k類中所有樣本數(shù)。
NWP 作為輸入特征,經(jīng)XGBoost 模型后獲得預(yù)測(cè)風(fēng)速,而預(yù)測(cè)風(fēng)速的準(zhǔn)確性是預(yù)測(cè)功率是否準(zhǔn)確的關(guān)鍵。XGBoost 為梯度提升樹(Gradient Boosting,GBoost)算法的改良版本,Boosting 屬于串行的集成方法,第t 個(gè)弱學(xué)習(xí)器優(yōu)化學(xué)習(xí)前t-1 個(gè)學(xué)習(xí)器的殘差部分,逐步引入學(xué)習(xí)器而最大化地降低目標(biāo)函數(shù),進(jìn)而得到一個(gè)強(qiáng)學(xué)習(xí)器。由于多NWP 數(shù)據(jù)具有多維(180 個(gè))特征,XGBoost 構(gòu)建學(xué)習(xí)器時(shí)會(huì)對(duì)特征采樣,并添加正則項(xiàng),防止過(guò)擬合,同時(shí)訓(xùn)練速度快,十分適合NWP風(fēng)速訂正后處理[17]。
XGBoost 算法以CART 回歸樹為弱學(xué)習(xí)器,預(yù)測(cè)函數(shù)輸出y′為
式中:gt(·)為CART回歸樹;xi為輸入特征,i=1,…,N;T 為XGBoost 超參數(shù),指共有T 個(gè)弱學(xué)習(xí)器;F 為搜索空間。
正則化目標(biāo)函數(shù)為
式中:yi為真值樣本,i=1,…,N;J 為葉子節(jié)點(diǎn)的個(gè)數(shù);ω為各葉子節(jié)點(diǎn)權(quán)重,δ、γ、λ為超參數(shù)。
則訓(xùn)練過(guò)程如下:
1)對(duì)所有樣本,初始化一顆CART 樹,同時(shí)得預(yù)測(cè)輸出g0為
式中:c為預(yù)測(cè)輸出集合
2)對(duì)所有樣本計(jì)算負(fù)梯度rti為
3)利用負(fù)梯度,擬合一顆CART回歸樹,得到第t顆回歸樹,其對(duì)應(yīng)的葉子節(jié)點(diǎn)區(qū)域?yàn)镽tj,j=1,2,…,J。其中J為回歸樹t的葉子節(jié)點(diǎn)的個(gè)數(shù)。
4)對(duì)葉子區(qū)域j=1,2,…,J,計(jì)算最佳擬合值ctj為
5)經(jīng)T輪更新得強(qiáng)學(xué)習(xí)器,最終預(yù)測(cè)輸出為
國(guó)家能源局規(guī)定,所有并網(wǎng)運(yùn)行的風(fēng)電場(chǎng)須每日定時(shí)向電網(wǎng)調(diào)度機(jī)構(gòu)提供次日00:00—24:00 發(fā)電功率曲線,稱為日前功率預(yù)測(cè),屬短期功率預(yù)測(cè)范疇。評(píng)價(jià)標(biāo)準(zhǔn)如式(17)—式(18)所示。
式中:Ad為日前準(zhǔn)確率;Qd為日前考核電量;n為一天的預(yù)測(cè)個(gè)數(shù)(一般取96,即預(yù)測(cè)時(shí)間分辨率為15 min);PMi為i 時(shí)刻的實(shí)際功率;PPi為i 時(shí)刻的日前功率預(yù)測(cè)值;CAP為風(fēng)電場(chǎng)可用容量;PN為風(fēng)電場(chǎng)裝機(jī)容量。
對(duì)于長(zhǎng)時(shí)間(nd天),其評(píng)價(jià)函數(shù)為準(zhǔn)確率ACC和考核電量QCE,計(jì)算公式為:
式中:Adi為第i天日前準(zhǔn)確率;Qdi為第i天日前考核電量。
相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)具有結(jié)構(gòu)簡(jiǎn)單、學(xué)習(xí)能力好、泛化能力強(qiáng)等優(yōu)點(diǎn)。如圖2,RELM 網(wǎng)絡(luò)在傳統(tǒng)ELM 模型的基礎(chǔ)上引入正則化系數(shù),可一定程度上提高功率預(yù)測(cè)模型的精度[18]。
圖2 RELM結(jié)構(gòu)
風(fēng)電場(chǎng)各風(fēng)機(jī)風(fēng)速進(jìn)行機(jī)組分類后,經(jīng)XGBoost模型得多組子類的預(yù)測(cè)風(fēng)速,視該若干組風(fēng)速為風(fēng)電場(chǎng)內(nèi)的差異特征,作為RELM 模型的輸入。同時(shí)由初步功率預(yù)測(cè)模型獲取預(yù)測(cè)功率計(jì)算預(yù)測(cè)功率與實(shí)際功率之差,將功率殘差作為RELM 模型的學(xué)習(xí)目標(biāo),預(yù)測(cè)需校正的功率,獲得最終的預(yù)測(cè)功率。
設(shè)xa為“機(jī)組分類”實(shí)驗(yàn)的預(yù)報(bào)風(fēng)速,d′為“單一風(fēng)速”實(shí)驗(yàn)的預(yù)測(cè)功率與真實(shí)功率的殘差,f 為激活函數(shù),則RELM的輸出函數(shù)為:
式中:ωi和βi分別為輸入、輸出向量與第i 個(gè)隱含層神經(jīng)元之間的連接權(quán)值;bi為第i 個(gè)隱含層神經(jīng)元對(duì)應(yīng)的偏置值,L為隱含層個(gè)數(shù)。
將式(21)寫成矩陣形式,有:
式中:β為輸出向量與隱含層神經(jīng)元之間的連接權(quán)值向量;D′為殘差矩陣;H為激活函數(shù)矩陣。
引入正則項(xiàng),得RELM的目標(biāo)函數(shù)為
隨機(jī)確定輸入權(quán)值矩陣ω 以及偏置向量b,由式(23)—式(25)可得最優(yōu)輸出權(quán)值矩陣為
式中:I為單位矩陣。
根據(jù)初始預(yù)測(cè)功率P1與最優(yōu)殘差預(yù)報(bào),得最終預(yù)測(cè)功率P3為
對(duì)浙江某海上風(fēng)電場(chǎng)開展研究,其中有效試驗(yàn)數(shù)據(jù)為2019-07-10至2020-04-24期間的實(shí)測(cè)風(fēng)速、功率數(shù)據(jù),采樣周期為15 min。該場(chǎng)站如圖3 所示,處于近海區(qū)域,北部臨近我國(guó)第一大群島,西部為大陸架,海面糙率變化各向異質(zhì),故選擇周邊9個(gè)NWP信息(NWP1—NWP 3 為群島位置)作為初步預(yù)測(cè)模型的輸入特征,剔除風(fēng)電場(chǎng)內(nèi)嚴(yán)重缺數(shù)的風(fēng)機(jī)后,本研究共篩選59 臺(tái)風(fēng)機(jī)數(shù)據(jù)進(jìn)行研究,圖3 中鏤空?qǐng)A點(diǎn)為風(fēng)機(jī)所在位置。
圖3 風(fēng)場(chǎng)風(fēng)機(jī)排布與周圍NWP位置
計(jì)算59 臺(tái)風(fēng)機(jī)2019 年風(fēng)速數(shù)據(jù)的3 種相似性度量,并將不同的度量矩陣進(jìn)行層次聚類,對(duì)聚類結(jié)果計(jì)算STDI評(píng)判標(biāo)準(zhǔn)值,如表1所示。
表1 不同聚類下的STDI值
由表1 可知皮爾遜相關(guān)系數(shù)為最優(yōu)聚類的相似性度量,基于皮爾遜相關(guān)系數(shù)的聚類結(jié)果如圖4 所示,最終機(jī)組分類成4 類,每一類分布情況如圖5 所示,最終獲得4組子類平均風(fēng)速及其累計(jì)功率。
圖4 基于皮爾遜相關(guān)系數(shù)的聚類結(jié)果
圖5 不同機(jī)組子類的分布
采用2019 年數(shù)據(jù)作為初步預(yù)測(cè)功率模型的訓(xùn)練數(shù)據(jù),將2020-01-01至2020-03-01的數(shù)據(jù)同時(shí)作為初步功率模型的驗(yàn)證數(shù)據(jù)和校正模型訓(xùn)練數(shù)據(jù),并利用2020-03-01 至2020-03-24 的數(shù)據(jù)對(duì)RELM模型進(jìn)行參數(shù)調(diào)優(yōu),最終以2020-03-25至2020-04-24的數(shù)據(jù)驗(yàn)證模型的功率預(yù)測(cè)效果。
“單一風(fēng)速”實(shí)驗(yàn)將風(fēng)電場(chǎng)平均風(fēng)速v0作為初步預(yù)測(cè)功率模型的輸入,記為A0 組。“機(jī)組分類”實(shí)驗(yàn)將4 組子類(A1、A2、A3、A4)平均風(fēng)速作為初步預(yù)測(cè)功率模型的輸入。最后“單一風(fēng)速”所得預(yù)測(cè)功率經(jīng)校正模型,得“RELM 校正”實(shí)驗(yàn)的最終預(yù)測(cè)功率。
機(jī)組分類后,經(jīng)XGBoost 的預(yù)測(cè)風(fēng)速結(jié)果見表2。由于組內(nèi)信息較為一致,各項(xiàng)評(píng)價(jià)指標(biāo)較“單一風(fēng)速”的風(fēng)速預(yù)測(cè)結(jié)果要好,各類內(nèi)的風(fēng)速規(guī)律更容易被模型學(xué)習(xí)出來(lái)。由圖6 可見,各子類的預(yù)報(bào)風(fēng)速存在差異,在所選取的樣本點(diǎn)中,同一時(shí)刻預(yù)報(bào)風(fēng)速差異可達(dá)3~4 m/s。由此可知,風(fēng)電場(chǎng)內(nèi)存在差異信息,可利用該信息進(jìn)行預(yù)測(cè)功率校正。
表2 風(fēng)速模擬結(jié)果評(píng)價(jià)指標(biāo)
圖6 四組子類預(yù)測(cè)風(fēng)速對(duì)比
3 組實(shí)驗(yàn)功率預(yù)測(cè)結(jié)果對(duì)比如表3 所示,在訓(xùn)練集(為初步預(yù)測(cè)功率模型的測(cè)試集)中,“機(jī)組分類”預(yù)測(cè)功率較優(yōu),考核電量QCE下降5.36%,可見提高預(yù)測(cè)風(fēng)速的準(zhǔn)確性能有效提高預(yù)測(cè)功率的精度。經(jīng)校正模型后,“REML 校正”模型長(zhǎng)期準(zhǔn)確率ACC有略微提升,而考核電量QCE有明顯下降,相較“單一風(fēng)速”下降19.24%。
表3 不同實(shí)驗(yàn)的功率模擬結(jié)果對(duì)比
由于“單一風(fēng)速”實(shí)驗(yàn)沒有考慮風(fēng)電場(chǎng)內(nèi)部差異,導(dǎo)致個(gè)別天會(huì)極端誤報(bào),由此產(chǎn)生較大的考核電量。選取4月1日和4月13日典型考核天分析,如表4 所示??芍癛EML 校正”可利用各機(jī)組的差異信息,有效提高預(yù)測(cè)功率的準(zhǔn)確性,提升幅度可達(dá)3.59%。
表4 選取天的功率模擬結(jié)果情況
由此表明,對(duì)于大規(guī)模風(fēng)電場(chǎng)內(nèi)部差異信息的利用有助于提高功率模型精度,避免極端誤報(bào),保證功率預(yù)測(cè)的穩(wěn)定性,從而降低運(yùn)行成本。
考慮多位置NWP 數(shù)據(jù)構(gòu)建初始功率預(yù)測(cè)模型,風(fēng)電短期功率預(yù)測(cè)結(jié)果準(zhǔn)確度較高,結(jié)果顯示機(jī)組分類的預(yù)測(cè)功率略優(yōu)于單一風(fēng)速。
引入機(jī)組內(nèi)部差異信息,考慮機(jī)組分類的RELM 校正預(yù)測(cè)功率,有效改善極端誤報(bào)情況,降低了風(fēng)電場(chǎng)功率預(yù)測(cè)偏差考核電量,能有效降低風(fēng)電場(chǎng)運(yùn)營(yíng)成本。