黃明增,文云峰,茍 競,江 涵,胥威汀,李 婷
(1. 湖南大學(xué)電氣與信息工程學(xué)院,湖南省長沙市 410082;2. 國網(wǎng)四川省電力公司經(jīng)濟技術(shù)研究院,四川省成都市 610041;3. 全球能源互聯(lián)網(wǎng)集團有限公司,北京市 100031)
頻率衡量了有功出力和負荷平衡程度,是反映電能質(zhì)量和系統(tǒng)安全穩(wěn)定運行的重要指標(biāo)[1-2]。若擾動事故后系統(tǒng)暫態(tài)頻率偏移超出容許范圍,將觸發(fā)低頻減載、高頻切機等裝置動作,使得系統(tǒng)面臨切機、切負荷風(fēng)險[3]。隨著新能源和直流的大規(guī)模密集接入,部分電網(wǎng)常規(guī)電源“空心化”趨勢逐漸凸顯,慣性水平大幅降低,頻率調(diào)節(jié)能力弱化[4],系統(tǒng)發(fā)生嚴(yán)重頻率偏移的風(fēng)險增加[5-6]。因此,有必要加強最大頻率偏移實時感知能力,以輔助調(diào)度運行人員識別系統(tǒng)可能面臨的頻率失穩(wěn)風(fēng)險,提前做好應(yīng)急預(yù)案,提升系統(tǒng)頻率穩(wěn)定性。
目前,電力系統(tǒng)最大頻率偏移分析方法主要包括:時域仿真法[7]、解析模型法[8]和數(shù)據(jù)驅(qū)動法[9]。其中,時域仿真計及了電力系統(tǒng)詳細的數(shù)學(xué)模型,可精確模擬有功擾動后頻率響應(yīng)過程,但建模難度大、計算耗時長;解析模型法將電力系統(tǒng)等值為單機(或多機)帶集中負荷模型,計算復(fù)雜度有所降低,但由于進行了諸多簡化,應(yīng)用于實際大電網(wǎng)的適應(yīng)性仍有待加強。
隨著同步相量測量單元(synchrophasor measurement unit,PMU)的發(fā)展和廣泛應(yīng)用,調(diào)度中心積累了大量的監(jiān)測信息[10],為基于數(shù)據(jù)驅(qū)動的最大頻率偏移預(yù)測提供了強有力的數(shù)據(jù)支撐?;谙到y(tǒng)潮流數(shù)據(jù)和擾動信息,文獻[11]利用人工神經(jīng)網(wǎng)絡(luò)預(yù)測頻率極值;文獻[12]考慮發(fā)電機出力、旋轉(zhuǎn)備用容量、原動機-調(diào)速器系統(tǒng)的影響,通過支持向量機回歸估計暫態(tài)頻率最低點。區(qū)別于淺層模型,文獻[13]利用堆棧降噪自動編碼器的深層構(gòu)架挖掘極值頻率、準(zhǔn)穩(wěn)態(tài)頻率等頻率指標(biāo)信息。文獻[14]計及低頻減載控制策略的影響,并構(gòu)建集成支持向量機以預(yù)測擾動事件下的最大頻率偏移。
基于物理模型的電力系統(tǒng)頻率響應(yīng)分析復(fù)雜,上述數(shù)據(jù)驅(qū)動模型拓展了電力系統(tǒng)最大頻率偏移預(yù)測手段,但研究工作中均沒有考慮樣本分布不均勻?qū)ψ畲箢l率偏移預(yù)測的影響。電力系統(tǒng)運行過程中,所發(fā)生的有功擾動呈現(xiàn)出故障類型少、功率波動范圍窄的特點,尤其是有記錄的大容量有功擾動歷史事件的數(shù)目極少。因此,通過數(shù)據(jù)驅(qū)動建立的最大頻率偏移預(yù)測模型往往更關(guān)注小擾動樣本,而對嚴(yán)重擾動故障容易產(chǎn)生過于保守的預(yù)測,不利于調(diào)度員精準(zhǔn)感知頻率失穩(wěn)風(fēng)險。為此,文獻[15]利用度量學(xué)習(xí)和模糊K均值聚類獲取相近頻率樣本,再通過集成支持向量機預(yù)測最大頻率偏移。盡管聚類后頻率偏移差異有所縮小,但也加劇了樣本的稀缺特性,不利于模型預(yù)測精度的提高。
針對上述問題,本文提出了一種計及頻率偏移分布與懲罰代價的電力系統(tǒng)最大頻率偏移預(yù)測方法。為更精確預(yù)測最大頻率偏移,對輕梯度提升機(light gradient boosting machine,LightGBM)進行級聯(lián)處理,并在其損失函數(shù)中加入懲罰敏感機制,輔助級 聯(lián) 輕 梯 度 提 升 機(cascaded LightGBM,CasLightGBM)訓(xùn)練時自適應(yīng)調(diào)整樣本損失值。為避免維度爆炸問題,通過多源信息融合提取關(guān)鍵特征子集,并基于IEEE 118 節(jié)點標(biāo)準(zhǔn)系統(tǒng)驗證所提出方法的有效性。
基于系統(tǒng)中正運行同步機組的總旋轉(zhuǎn)動能和額定容量Ssys,可求得系統(tǒng)等效慣性時間常數(shù)如下:
式中:Hj、Sj分別為第j臺機組的慣性時間常數(shù)和額定容量;N為同步機組總數(shù)。
僅考慮同步機組慣量響應(yīng)和一次調(diào)頻作用的情況下,系統(tǒng)遭受有功擾動后的頻率動態(tài)變化過程可用等值轉(zhuǎn)子運動方程描述為:
式中:Δf為系統(tǒng)頻率偏移;ΔPm為機組機械功率增量;ΔPe為機組電磁功率增量;D為阻尼因子。
通過慣性中心頻率fCOI描述系統(tǒng)的整體頻率響應(yīng)性能:
式中:fj為發(fā)電機節(jié)點j的頻率。
參考文獻[15],本文選擇暫態(tài)過程中系統(tǒng)慣性中心的最大頻率偏移Δfmax作為頻率安全評估指標(biāo)。對高維度強非線性的電力系統(tǒng)而言,其系統(tǒng)運行特征和Δfmax之間的映射關(guān)系是極其復(fù)雜的,難以通過解析模型精確求解。數(shù)據(jù)驅(qū)動模型具有強大的復(fù)雜函數(shù)表征能力,通過對頻率數(shù)據(jù)進行挖掘?qū)W習(xí),可建立系統(tǒng)運行特征x和Δfmax之間的非線性映射關(guān)系。
數(shù)據(jù)驅(qū)動模型所選取的輸入特征應(yīng)包含系統(tǒng)運行信息,且能較為全面地刻畫有功擾動后電力系統(tǒng)頻率響應(yīng)特性。參考文獻[12-16],構(gòu)建如附錄A 表A1 所示的系統(tǒng)運行特征集,其可通過PMU 裝置直接或間接獲取,且采集速度在毫秒級內(nèi),可以滿足在線預(yù)測對數(shù)據(jù)獲取快速性的要求[17-18]。
原始運行特征集提供了豐富的頻率響應(yīng)信息,但特征間存在一定的冗余性。此外,直接將原始運行特征作為輸入,數(shù)據(jù)驅(qū)動模型容易遭遇維度災(zāi)難。為此,構(gòu)建了一種多源信息融合的關(guān)鍵特征選擇方法,可綜合考慮系統(tǒng)運行特征間的關(guān)聯(lián)信息與其在數(shù)據(jù)驅(qū)動模型建立中貢獻信息的影響。
設(shè)運行特征集為Z={z1,z2,…,zn},zi∈Z,n為運行特征維度。引入聯(lián)合互信息最大化(joint mutual information maximization,JMIM)[19]量 化 系統(tǒng)運行特征間的關(guān)聯(lián)信息,對于任意運行特征序列zi,計算其與最大頻率偏移Y之間的互信息I(zi;Y)。然后,不斷選擇能最大 化I(zi;Y)的運行特征,直至得到g個特征。當(dāng)選擇第i個特征時,特征選擇標(biāo)準(zhǔn)α(zi)應(yīng)滿足:式 中:I(zi,zg;Y)為zi、zg和Y的 聯(lián) 合 互 信 息;G為被選擇特征構(gòu)成的集合。
JMIM 從信息物理的角度出發(fā)篩選關(guān)鍵特征,其結(jié)果具有參考價值。然而,特征選擇過程忽略了運行特征在數(shù)據(jù)驅(qū)動模型中的訓(xùn)練情況,不利于模型預(yù)測性能的提升。為此,還應(yīng)考慮運行特征在數(shù)據(jù)驅(qū)動模型建立中的貢獻度。LightGBM 在訓(xùn)練過程中記錄了每個運行特征在回歸樹建立過程中的分割信息,對特征zi在所有回歸樹的分割信息進行求和即可得到其用于建立LightGBM 的貢獻度fi,L。
式中:K為回歸樹的數(shù)量;Q為回歸樹中非葉子節(jié)點的數(shù)量;z″q為與節(jié)點q相關(guān)的特征;lk,q為第k棵樹中節(jié)點q分裂后損失的減少值;P(?)為條件函數(shù)。
結(jié)合基于JMIM 的關(guān)聯(lián)信息和基于LightGBM的貢獻信息,進行歸一化處理,可獲得運行特征的綜合重要度為:
式中:fi,J為JMIM 所選取特征的互信息。為有效提取關(guān)鍵特征集,需要預(yù)先設(shè)定閾值,僅當(dāng)運行特征的綜合重要度大于預(yù)設(shè)閾值,才將其選為關(guān)鍵特征。
LightGBM 是集成學(xué)習(xí)領(lǐng)域中的一種高效算法[20],基于梯度提升樹(gradient boosting decision tree,GBDT)框架進行改進,有效提升了模型處理大數(shù)據(jù)的能力和預(yù)測精度。它的基本思想為將K個弱回歸樹fk(x)進行集成以構(gòu)建強學(xué)習(xí)器:
LightGBM 通過多弱學(xué)習(xí)器集成增加輸出多樣性,避免了低精度弱學(xué)習(xí)器的負面影響,進而在一定程度上降低了樣本依賴性。同時,借助于基于梯度的單面采樣(gradient-based one-side sampling,GOSS)和互補特征壓縮(exclusive feature bundling,EFB)等改進措施,其內(nèi)存消耗得到有效控制[20]。
為進一步提升LightGBM 表征高維度強非線性復(fù)雜電力系統(tǒng)函數(shù)的能力,實現(xiàn)對關(guān)鍵運行特征的逐層表達學(xué)習(xí),本文參考深度森林構(gòu)架,構(gòu)建了CasLightGBM。深度學(xué)習(xí)通過逐層訓(xùn)練網(wǎng)絡(luò)參數(shù)向上表達,可有效挖掘輸入特征數(shù)據(jù)的深層抽象信息,實現(xiàn)對復(fù)雜函數(shù)的映射表達。然而,其存在計算量大、耗時長和樣本數(shù)量依賴性高等缺陷。深度森林通過逐級串聯(lián)隨機森林實現(xiàn)了深度學(xué)習(xí)構(gòu)架的多層表達效果,且運算效率高,給進一步提升模型預(yù)測精度提供了新的思路[21]。LightGBM 內(nèi)存消耗低,且與隨機森林相比具有更優(yōu)異的泛化能力,故本文采用CasLightGBM 替代級聯(lián)森林結(jié)構(gòu),其結(jié)構(gòu)如圖1所示。
圖1 CasLightGBM 結(jié)構(gòu)Fig.1 Structure of CasLightGBM
構(gòu)建4 個互異的LightGBM 學(xué)習(xí)器作為CasLightGBM 的 一 個 級 聯(lián) 層,在CasLightGBM 建立過程中,采用均方誤差(mean squared error,MSE)作為是否需要繼續(xù)增加級聯(lián)層的判斷指標(biāo),具體計算方法如下:
式中:M為測試樣本數(shù)量;ym、y?m分別為第m個樣本的真實值、預(yù)測值。
當(dāng)CasLightGBM 擴展到新的級聯(lián)層T時,判斷當(dāng)前層所計算的MSE 值是否大于T?1 層,若滿足,則繼續(xù)擴展級聯(lián)層。
CasLightGBM 的損失函數(shù)可由式(10)表示。
式中:l(?)是誤差函數(shù),衡量了模型的預(yù)測誤差大小。損失函數(shù)L可基于MSE 函數(shù)進行構(gòu)建。
將CasLightGBM 應(yīng)用于電力系統(tǒng)最大頻率偏移預(yù)測時,盡管訓(xùn)練后模型對數(shù)據(jù)的整體擬合程度較優(yōu),但得到的模型也可能不具備適應(yīng)性,原因在于損失函數(shù)中忽略了頻率偏移樣本的分布差異。在電力系統(tǒng)運行過程中,大容量有功擾動事件的數(shù)量通常遠小于小擾動事件的數(shù)量,這使得最大頻率偏移的分布往往呈現(xiàn)邊緣陡峻,左邊高于右邊的帶狀分布。此時,利用頻率數(shù)據(jù)訓(xùn)練CasLightGBM,海量頻率穩(wěn)定樣本的總損失值遠大于嚴(yán)重擾動故障樣本,使得模型在訓(xùn)練過程更關(guān)注頻率穩(wěn)定樣本,而忽略了對控制裝置動作具有重要參考意義的嚴(yán)重擾動故障樣本。為此,參考交叉熵損失函數(shù)[22],在損失函數(shù)中引入敏感因子ω,以平衡頻率偏移樣本分布差異的影響。
式中:y為樣本的頻率偏移值;p為嚴(yán)重擾動故障樣本對應(yīng)的概率;ε為補償因子,用于防止頻率穩(wěn)定樣本概率過高導(dǎo)致梯度消失問題;R為頻率安全的判斷閾值,結(jié)合實際電網(wǎng)第三道防線判斷標(biāo)準(zhǔn),將R設(shè)置為0.8 Hz。當(dāng)擾動事故后頻率偏移大于0.8 Hz時,將觸發(fā)第三道防線中低頻減載或高周切機裝置自動動作,大范圍切除電網(wǎng)中的機組或負荷。因此,將擾動事故后最大頻率偏移大于0.8 Hz 的樣本劃分為嚴(yán)重擾動故障樣本,否則劃分為頻率穩(wěn)定樣本。
由式(11)可知,(1?p)值越接近1,ω值越小,避免了非嚴(yán)重擾動故障樣本總損失值過大,進而在一定程度上平衡了最大頻率偏移的分布差異的影響。
除了頻率偏移大小的分布有所不同,嚴(yán)重擾動故障樣本的預(yù)測值是否能準(zhǔn)確反映頻率失穩(wěn)風(fēng)險對應(yīng)的代價也存在顯著差異。對于超過第三道防線動作閾值的樣本,CasLightGBM 預(yù)測值略大于控制措施動作閾值并不會造成嚴(yán)重的后果,但若預(yù)測值小于控制措施動作閾值,由于無法及時采取合適的緊急控制措施,容易誘發(fā)級聯(lián)故障導(dǎo)致頻率失穩(wěn)或頻率崩潰。因此,本文在損失函數(shù)中給嚴(yán)重擾動故障樣本加入懲罰系數(shù)λ,最后得到的計及懲罰敏感機制的損失函數(shù)如下:
通過計及懲罰敏感機制的損失函數(shù),CasLightGBM 在訓(xùn)練過程中不僅平衡了頻率偏移分布差異的影響,還考慮了嚴(yán)重擾動事件預(yù)測保守所帶來的懲罰代價,在電網(wǎng)最大頻率偏移預(yù)測場景中更具實用性。
為了構(gòu)建更適應(yīng)電網(wǎng)最大頻率偏移預(yù)測場景的數(shù)據(jù)驅(qū)動模型,提出了一種計及頻率偏移分布與懲罰代價的電力系統(tǒng)最大頻率偏移預(yù)測方法。以系統(tǒng)運行信息作為輸入,并通過多源信息融合提取關(guān)鍵特征集,避免維度爆炸問題。構(gòu)建CasLightGBM 構(gòu)架,并在其損失函數(shù)中加入懲罰敏感機制,可使CasLightGBM 訓(xùn)練時自適應(yīng)調(diào)整樣本損失值,進而提升最大頻率偏移預(yù)測精度。在線應(yīng)用前,CasLightGBM 需利用預(yù)先準(zhǔn)備的數(shù)據(jù)集進行迭代訓(xùn)練,訓(xùn)練好的CasLightGBM 可在擾動事故后快速預(yù)測電力系統(tǒng)最大頻率偏移值,給后續(xù)控制措施的制定提供參考,分為5 個步驟。
1)構(gòu)建數(shù)據(jù)集。在不同運行方式下,利用時域仿真法模擬所研究系統(tǒng)在預(yù)想故障后的頻率響應(yīng)過程,進而獲取最大頻率偏移數(shù)據(jù)集。此外,若已具備豐富擾動事件下的頻率監(jiān)測數(shù)據(jù),可直接運用歷史數(shù)據(jù)構(gòu)建數(shù)據(jù)集。同時,也可兼顧仿真數(shù)據(jù)和歷史數(shù)據(jù)構(gòu)建數(shù)據(jù)集。
2)選擇關(guān)鍵特征。通過多源信息融合方法計算每個系統(tǒng)運行特征的綜合重要度,結(jié)合預(yù)設(shè)閾值,從原始高維度的運行特征中篩選g維關(guān)鍵特征子集,以矩陣形式表示為:
式中:d為所構(gòu)建數(shù)據(jù)集的樣本數(shù)量;x′g,d為第d個樣本中第g個關(guān)鍵特征的數(shù)值。
3)訓(xùn)練CasLightGBM。確定當(dāng)前數(shù)據(jù)集中頻率偏移樣本的概率分布和嚴(yán)重擾動故障樣本對應(yīng)的懲罰系數(shù)。利用關(guān)鍵特征數(shù)據(jù)及最大頻率偏移數(shù)據(jù)對CasLightGBM 進行迭代訓(xùn)練,當(dāng)級聯(lián)層所獲的MSE 值不再提升時,停止級聯(lián)層擴展,并刪除當(dāng)前級聯(lián)層,進而獲得具備復(fù)雜函數(shù)強表征能力的CasLightGBM。
4)衡量CasLightGBM 預(yù)測性能。采用最大絕對誤差值(maximum absolute error,MAE)、MSE 和均方根誤差(root mean square error,RMSE)作為衡量CasLightGBM 整體預(yù)測性能的指標(biāo),其中,MAE和RMSE 表達式分別為:
5)將CasLightGBM 用于在線預(yù)測。在PMU 持續(xù)監(jiān)測的過程中,若某一時刻量測的頻率突變量大于預(yù)定的門檻值,即認為頻率發(fā)生擾動[18]。擾動事故后,獲取電網(wǎng)PMU 在線監(jiān)測數(shù)據(jù)作為CasLightGBM 的輸入數(shù)據(jù),進而快速預(yù)測電力系統(tǒng)最大頻率偏移。若所預(yù)測的系統(tǒng)最大頻率偏移值超過電網(wǎng)第三道防線控制裝置的觸發(fā)值,及時發(fā)出預(yù)警,以便后續(xù)采取緊急控制措施維持頻率穩(wěn)定。
以上步驟具體流程如圖2 所示。
圖2 最大頻率偏移預(yù)測流程Fig.2 Flow chart of maximum frequency deviation prediction
以IEEE 118 節(jié)點標(biāo)準(zhǔn)系統(tǒng)作為測試系統(tǒng),其包含118 個節(jié)點、179 條輸電線路、54 個常規(guī)電源節(jié)點和64 個負荷節(jié)點。采用PSD-BPA 進行時域仿真,模擬擾動事故后的電力系統(tǒng)動態(tài)頻率響應(yīng)過程。采用拉丁超立方采樣在[0.7,1.1]范圍內(nèi)生成50 種負荷水平,并相應(yīng)調(diào)整系統(tǒng)發(fā)電機出力以保證潮流收斂。對所有機組進行N?1 及N?2 機組跳閘故障模擬,故障設(shè)置在0.01 s 發(fā)生,總仿真時長為120 s。最后,一共得到6 835 個最大頻率偏移樣本,以8∶2的比例將其隨機劃分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。
圖3 展示了所得最大頻率偏移樣本的擬合分布情況。從圖3 可以看出,最大頻率偏移樣本的分布是極其不均勻的,頻率偏移小的樣本占了絕大多數(shù),而大頻率偏移樣本則較為稀缺,例如,最大頻率偏移大于0.8 Hz 的樣本僅占9.39%。因而,通過數(shù)據(jù)驅(qū)動模型挖掘數(shù)據(jù)所隱藏的頻率偏移信息時,嚴(yán)重擾動故障樣本容易被忽視,導(dǎo)致訓(xùn)練后的模型傾向于對其做出過于保守的預(yù)測,這不利于調(diào)度員在擾動事故后精準(zhǔn)感知頻率失穩(wěn)風(fēng)險。
圖3 最大頻率偏移分布擬合曲線Fig.3 Fitting curve of the maximum frequency deviation distribution
基于多源信息融合方法對系統(tǒng)運行特征的綜合重要度進行計算,并降序處理,具體見附錄B 圖B1。為在降低運行特征維度的同時使所篩選的關(guān)鍵特征盡可能保留充足的頻率偏移信息,將關(guān)鍵特征選擇閾值設(shè)定為0.01,得到215 維的關(guān)鍵特征集。結(jié)合系統(tǒng)運行特征間的關(guān)聯(lián)信息與其在數(shù)據(jù)驅(qū)動模型建立中的貢獻信息,通過多源信息融合來篩選關(guān)鍵特征子集,所得關(guān)鍵特征維度為原始特征的31.30%(原始特征維度為697),有效降低模型復(fù)雜度并避免維度爆炸問題。
不同懲罰系數(shù)對CasLightGBM 預(yù)測最大頻率偏移精度的影響如附錄B 圖B2 所示??梢钥闯?模型預(yù)測所得MAE 和MSE 的變化趨勢較為相近,但并不完全相同。這是因為預(yù)測所得MAE 往往來自嚴(yán)重擾動故障樣本,而MSE 反映的是所有樣本的整體預(yù)測誤差。當(dāng)懲罰系數(shù)處于[1,3.5]時,MAE 和MSE 隨著懲罰系數(shù)的變化在一個較優(yōu)區(qū)間波動,而懲罰系數(shù)大于3.5 時,MAE 和MSE 會急劇增大。借助于懲罰系數(shù),CasLightGBM 可將更多的注意力分配給嚴(yán)重擾動故障,從而降低嚴(yán)重擾動故障的預(yù)測誤差,但懲罰系數(shù)設(shè)置過大也會破壞CasLightGBM對頻率偏移樣本信息提取的平衡,反而會降低其預(yù)測性能。綜合考慮,將懲罰系數(shù)設(shè)置為2,此時模型預(yù)測所得MAE 和MSE 均達到最優(yōu)。
為分析所構(gòu)建計及懲罰敏感機制損失函數(shù)的有效性,與采用未改進損失函數(shù)的CasLightGBM 比較嚴(yán)重擾動故障樣本的預(yù)測精度,如圖4 所示。
圖4 嚴(yán)重故障樣本的預(yù)測精度比較Fig.4 Comparison of prediction accuracy for serious fault samples
從圖4 可以看出,當(dāng)CasLightGBM 的預(yù)測結(jié)果低于真實值時,未改進損失函數(shù)使得CasLightGBM預(yù)測結(jié)果偏于保守,而計及懲罰敏感機制損失函數(shù)有助于提高模型的最大頻率偏移預(yù)測值,進而更接近于真實值。同時,由于未改進損失函數(shù)中沒有考慮頻率偏移分布差異的影響,CasLightGBM 也容易做出過于偏激的預(yù)測。當(dāng)CasLightGBM 預(yù)測結(jié)果高于真實值時,采用未改進損失函數(shù)訓(xùn)練的CasLightGBM 的預(yù)測值甚至?xí)x真實值更多。圖4 中,采用未改進損失函數(shù)訓(xùn)練的CasLightGBM的預(yù)測值大于真實值的概率為37.01%,而采用計及懲罰敏感機制損失函數(shù)后預(yù)測值大于真實值的概率上升到46.45%。由于預(yù)測保守導(dǎo)致錯判頻率安全的概率由5.5%降低到0.7%,因此,采用計及懲罰敏感機制的損失函數(shù)更有助于調(diào)度運行人員精確感知頻率失穩(wěn)風(fēng)險。
為進一步分析計及懲罰敏感機制損失函數(shù)的優(yōu)越性,對模型預(yù)測誤差的絕對值分布進行展示,見附錄B 圖B3。其中,預(yù)測誤差絕對值大于0.03 Hz 的比例下降了2.93%,預(yù)測誤差絕對值小于0.01 Hz 的比例上升了17.35%。在CasLightGBM 損失函數(shù)中加入懲罰敏感機制,也有助于提升模型的綜合性能。
為了驗證所提出CasLightGBM 的泛化能力,選取常用的機器學(xué)習(xí)方法,如LightGBM、長短期記憶(long short term memory,LSTM)網(wǎng)絡(luò)、支持向量機(support vector machine,SVM)、決策樹(decision tree,DT)進行對比分析。將多源信息融合方法選取的關(guān)鍵特征作為各機器學(xué)習(xí)模型的輸入數(shù)據(jù),采用相同的數(shù)據(jù)集進行訓(xùn)練和測試,結(jié)果如表1所示。
表1 不同方法的預(yù)測精度對比Table 1 Comparison of prediction accuracy of different methods
由表1 可以看出,相比于其他方法,本文所提方法在MAE、MSE、RMSE 上均具有最佳的性能表現(xiàn)。LightGBM 和LSTM 分別為集成學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域中的優(yōu)秀方法,具有較強的數(shù)據(jù)挖掘能力,但預(yù)測所得MAE 分別比CasLightGBM 高了21.79%、17.95%,RMSE 分 別 比 CasLightGBM 高 了28.41%、75.75%。SVM 和DT 的預(yù)測效果并不理想,這是淺層神經(jīng)網(wǎng)絡(luò)本身的局限造成的。淺層神經(jīng)網(wǎng)絡(luò)無法對關(guān)鍵特征進行深層學(xué)習(xí),大量頻率信息無法被挖掘,因而對最大頻率偏移的擬合受限。相比之下,CasLightGBM 利用級聯(lián)結(jié)構(gòu)高效挖掘隱藏在關(guān)鍵特征中的豐富頻率偏移信息,可精確表征復(fù)雜電力系統(tǒng)函數(shù),具有優(yōu)異的泛化能力。
通過改變用于訓(xùn)練CasLightGBM 的樣本數(shù)量來分析其預(yù)測精度的變化規(guī)律。固定測試樣本數(shù)量為1 366 個,分別加入1 000、2 000、…、5 000 個訓(xùn)練樣本,CasLightGBM 的預(yù)測精度如表2 所示。可見,隨著訓(xùn)練樣本數(shù)目增加,預(yù)測所得MAE、MSE 和RMSE 均有所降低,原因在于訓(xùn)練樣本數(shù)目越多,能提供的頻率偏移信息越豐富。當(dāng)訓(xùn)練樣本為3 000 時,預(yù)測所得MAE 已低于0.1 Hz,表明CasLightGBM 在稀疏樣本場景中也具有一定的適應(yīng)性。繼續(xù)增加樣本數(shù)量,各評價指標(biāo)的降幅有所遞減,直至訓(xùn)練樣本為5 000 時,CasLightGBM 達到一個較優(yōu)水平,預(yù)測所得MAE 和MSE 分別為0.08 Hz 和1.05×10-4Hz。
表2 不同樣本數(shù)量的預(yù)測精度對比Table 2 Comparison of prediction accuracy with different sample numbers
獲取電網(wǎng)運行信息時,可能會受到來自處理設(shè)備以及傳輸通道所引入噪聲的影響,為此,本文在數(shù)據(jù)集中添加信噪比在20~40 dB 范圍變化的高斯白噪聲,以驗證所提模型的抗噪聲性能,結(jié)果如表3所示。
表3 CasLightGBM 抗噪性能Table 3 Anti-noise performance of CasLightGBM
隨著噪聲干擾程度加強,CasLightGBM 的預(yù)測誤差所有增加,但增加的幅度是非常小的。噪聲強度為20 dB 時,所得MAE、RMSE 與40 dB 場景相比僅增加了0.010 3 Hz、0.002 9 Hz。此外,在信噪比為20 dB 的高噪聲強度場景中,預(yù)測所得MAE 依舊低于0.1 Hz,體現(xiàn)了CasLightGBM 優(yōu)異的抗噪性能。
除泛化能力外,模型預(yù)測的快速性對電力系統(tǒng)最大頻率偏移在線應(yīng)用而言也是至關(guān)重要的。利用時域仿真執(zhí)行1 次和1 336 次針對預(yù)想故障的最大頻率偏移計算分別需2.35 s、53.50 min。隨著系統(tǒng)規(guī)模擴大,模型愈加復(fù)雜,時域仿真計算所需時間將更長。CasLightGBM 通過數(shù)據(jù)驅(qū)動方式建立關(guān)鍵特征-最大頻率偏移之間的映射關(guān)系,訓(xùn)練所需時間為3.25 s,訓(xùn)練好的模型可在0.02 s 內(nèi)給出單個樣本或批量樣本的最大頻率偏移預(yù)測結(jié)果,更有助于調(diào)度員快速感知電力系統(tǒng)頻率態(tài)勢。應(yīng)當(dāng)指出,完全依靠離線時域仿真生成CasLightGBM 的訓(xùn)練集是非常耗時的。在具備一定的數(shù)據(jù)樣本后,可將在線評估結(jié)果添加到離線數(shù)據(jù)庫中,不斷豐富和更新數(shù)據(jù)集,減少對離線仿真數(shù)據(jù)的需求。
為驗證所提方法在不同故障類型場景的適應(yīng)性,除機組跳閘故障外,還考慮各類短路故障中最為嚴(yán)重的三相短路故障[23]。新數(shù)據(jù)集的測試結(jié)果見附錄B 表B1。在三相短路故障場景中,CasLightGBM的整體預(yù)測性能較優(yōu)異,預(yù)測所得MSE 和RMSE分別為2.5×10-5Hz 和5.02×10-3Hz。在混合機組跳閘故障和三相短路故障的場景中,盡管預(yù)測難度增大,CasLightGBM 依舊顯示出較好的泛化能力,預(yù)測所得MAE 和MSE 分別為0.088 Hz 和6.6×10-5Hz,與只含機組跳閘故障樣本的測試結(jié)果相比,MAE 僅增加了0.01 Hz,而MSE 有所下降。因而,在多故障類型場景中,CasLightGBM 也具有較好的適應(yīng)性。
此外,為驗證所提方法在新運行方式下的適應(yīng)性,新增兩種運行場景,分別為大負荷方式(基準(zhǔn)負荷的115%)和小負荷方式(基準(zhǔn)負荷的65%),考慮機組跳閘故障和三相短路故障。利用測試場景外的數(shù)據(jù)訓(xùn)練CasLightGBM,基準(zhǔn)負荷水平場景和大/小負荷方式場景的最大頻率偏移預(yù)測結(jié)果如附錄B表B2 所示。由表B2 可知,盡管大負荷方式下系統(tǒng)穩(wěn)定性問題更加突出,模型精確預(yù)測難度大,利用歷史數(shù)據(jù)訓(xùn)練的CasLightGBM 依然保持著較好的泛化能力,在機組跳閘故障和三相短路故障場景預(yù)測所得MAE 分別為0.099 Hz 和0.086 Hz。
針對現(xiàn)有最大頻率偏移預(yù)測方法對樣本非均勻性處理不足的問題,提出了一種計及頻率偏移分布與懲罰代價的最大頻率偏移預(yù)測方法,主要結(jié)論如下。
1)運用多源信息融合方法篩選關(guān)鍵特征子集,所得關(guān)鍵特征維度與原始特征維度相比顯著降低,有助于提升CasLightGBM 的運算效率,避免維度爆炸問題。
2)通過計及懲罰敏感機制的損失函數(shù),CasLightGBM 可在訓(xùn)練過程中給予嚴(yán)重擾動故障樣本更多關(guān)注,并考慮其預(yù)測保守的懲罰代價,預(yù)測效果更優(yōu)。此外,計及懲罰敏感機制的損失函數(shù)也有利于提升CasLightGBM 的綜合預(yù)測性能。
3)相較于LightGBM、LSTM、SVM、DT 等機器學(xué)習(xí)方法,所構(gòu)建的CasLightGBM 具有更優(yōu)異的預(yù)測精度、適應(yīng)性,且抗噪聲干擾能力強,可在擾動事故后快速預(yù)測電力系統(tǒng)最大頻率偏移,為后續(xù)控制措施的制定奠定基礎(chǔ)。
后續(xù)將進一步探索所提方法在實際電網(wǎng)中的應(yīng)用,提升數(shù)據(jù)驅(qū)動模型在稀疏樣本場景下的適應(yīng)性。隨著新能源滲透率逐漸提高,系統(tǒng)頻率穩(wěn)定特性變化顯著,如何進一步提高模型的繼承性和泛化能力,也需深入研究?;谶w移學(xué)習(xí)技術(shù)提升CasLightGBM 在稀缺樣本及新能源滲透率提升場景的適應(yīng)性,將是下一階段的研究重點。
本文研究得到湖湘青年科技創(chuàng)新人才項目(2020RC3015)的資助,特此致謝!
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。