賈宏陽,侯慶春,劉羽霄,張 寧,范 越
(1. 電力系統(tǒng)及大型發(fā)電設備安全控制和仿真國家重點實驗室,清華大學,北京市 100084;2. 清華大學電機工程與應用電子技術系,北京市 100084;3. 國網青海省電力有限公司,青海省西寧市 810008)
高比例可再生能源并網對電力系統(tǒng)安全穩(wěn)定運行產生巨大挑戰(zhàn)[1-3]??稍偕茉吹碾S機性和低慣性導致電力系統(tǒng)運行模式增多,各種模式下的電力系統(tǒng)運行點越來越分散,部分運行點接近于安全穩(wěn)定臨界點,連鎖故障[4]、電壓失穩(wěn)[5]、功角失穩(wěn)[6]和頻率崩潰[7]等安全穩(wěn)定事故發(fā)生的概率增加[8-10]。風光等間歇性可再生能源并網后,電力系統(tǒng)安全穩(wěn)定機理日趨復雜,傳統(tǒng)基于同步機的安全穩(wěn)定分析方法出現(xiàn)局限性。電力系統(tǒng)安全穩(wěn)定問題通常需要表達為高階微分方程或無法直接解析表達,例如靜態(tài)電壓穩(wěn)定裕度往往通過連續(xù)潮流算法多次求解潮流方程得到,難以快速、直接辨識系統(tǒng)穩(wěn)定裕度,難以給出線性安全穩(wěn)定規(guī)則指導系統(tǒng)優(yōu)化運行。
近年來,隨著人工智能技術的飛速發(fā)展,在傳統(tǒng)解析分析法與時域仿真法的基礎上,基于機器學習的電力系統(tǒng)安全穩(wěn)定辨識及規(guī)則提取方法,有望輔助解決上述難題。已有研究主要利用強化學習、神經網絡、支持向量機和單變量決策樹等算法進行電力系統(tǒng)安全穩(wěn)定辨識。文獻[11]利用強化學習進行電壓穩(wěn)定裕度辨識。文獻[12-14]使用各類神經網絡對系統(tǒng)電壓穩(wěn)定與暫態(tài)穩(wěn)定進行辨識。文獻[15-16]使用支持向量進行系統(tǒng)暫態(tài)穩(wěn)定評估。文獻[17-18]使用決策樹對系統(tǒng)暫態(tài)穩(wěn)定性進行分析。而面向規(guī)則提取的研究則主要基于結構簡單的機器學習模型。文獻[15]基于支持向量機構造能夠實時求取的穩(wěn)定裕度指標,然后利用靈敏度方法獲取切機靈敏度與切負荷靈敏度,進而構建緊急控制決策模型中的穩(wěn)定約束。文獻[19]將支持向量機的訓練結果轉化為單變量決策樹C4.5,文獻[18]直接通過單變量決策樹提取穩(wěn)定規(guī)則,但單變量決策樹提取的規(guī)則是一維的,不能精準刻畫電力系統(tǒng)的復雜安全邊界。文獻[20-21]嘗試對神經網絡的訓練結果進行解釋,但這些方法需要引入專家知識。
目前,基于機器學習的電力系統(tǒng)安全穩(wěn)定裕度辨識與規(guī)則提取算法有很多,但是缺少一種兼顧可解釋性與表示性的算法,能夠直接而快速地獲取穩(wěn)定裕度與系統(tǒng)狀態(tài)變量之間的顯式關系。傳統(tǒng)單變量決策樹模型學習容量有限,難以表示大型電力系統(tǒng)的復雜安全穩(wěn)定規(guī)則。傳統(tǒng)神經網絡或集成學習等黑箱模型提取的規(guī)則過于復雜,難以解釋并可靠地應用于電力系統(tǒng)在線安全穩(wěn)定辨識。同時,非線性模型的擬合結果難以直接應用于緊急控制決策或考慮安全約束的日前優(yōu)化調度[22-23]。
針對這一難題,本文提出了內嵌安全穩(wěn)定約束的電力系統(tǒng)優(yōu)化運行框架和用于電力系統(tǒng)安全穩(wěn)定規(guī)則提取的斜回歸樹及其集成算法,以靜態(tài)電壓穩(wěn)定問題為例驗證了算法的有效性。本文工作的創(chuàng)新性主要體現(xiàn)在以下3 個方面。
1)提出了內嵌安全穩(wěn)定約束的電力系統(tǒng)優(yōu)化運行框架,通過數據生成、決策樹學習、規(guī)則提取與內嵌,實現(xiàn)在電力系統(tǒng)優(yōu)化運行中考慮安全穩(wěn)定約束。
2)針對靜態(tài)電壓穩(wěn)定問題,提出斜回歸樹算法對穩(wěn)定裕度進行精準預測,該算法的表示能力與泛化性能相對于單變量回歸樹有了大幅提升,便于提取可靠的安全穩(wěn)定規(guī)則。
3)提出了斜回歸樹的集成方法,進一步提升算法的學習能力,引入Lasso 和Ridge 正則化項,保證安全穩(wěn)定規(guī)則簡單而有效。
本章針對電力系統(tǒng)小干擾穩(wěn)定、電壓穩(wěn)定、頻率穩(wěn)定與連鎖故障等安全問題給出內嵌安全穩(wěn)定約束的電力系統(tǒng)優(yōu)化運行一般方法,選用決策樹提取規(guī)則并將其轉化為安全穩(wěn)定約束。為了保證方法的可行性與有效性,決策樹提取規(guī)則應滿足以下要求[24]。
1)準確:算法從系統(tǒng)中提取的規(guī)則應與實際安全邊界形成精準映射。為此,決策樹必須具有強大的泛化性能,必要時能夠通過集成提高其學習能力。
2)可解釋:算法提取的每條規(guī)則必須易于電力系統(tǒng)調度人員理解。為此,決策樹的深度取值不宜太大,每次劃分既要保證刻畫安全邊界的準確性,又要保證劃分系數向量的稀疏性。
3)可嵌入優(yōu)化運行:應保證內嵌安全穩(wěn)定約束的優(yōu)化問題能夠快速求解。為此,決策樹的每次劃分必須為線性劃分,劃分系數向量應盡可能稀疏。
為了滿足上述要求,本文給出內嵌安全穩(wěn)定約束的電力系統(tǒng)優(yōu)化運行框架,如圖1 所示。
圖1 電力系統(tǒng)安全規(guī)則提取與內嵌的算法框架Fig.1 Algorithm framework for extraction and embedding of power system security rules
1)通過仿真為算法生成大容量數據集:仿真能夠獲取實際電力系統(tǒng)運行過程中較少達到的運行狀態(tài),使得決策樹算法能夠從數據集中獲取更準確的安全邊界。電力系統(tǒng)安全穩(wěn)定仿真數據集的生成過程為:給定系統(tǒng)的邊界條件;抽樣得到可再生能源機組出力與負荷大小;通過最優(yōu)潮流求解運行狀態(tài)數據;通過時域仿真或穩(wěn)定性計算判斷系統(tǒng)是否穩(wěn)定。靜態(tài)電壓穩(wěn)定仿真數據集的生成過程將在第2章中詳述。
2)訓練集成稀疏斜決策樹:充分利用稀疏斜決策樹及其集成算法的可解釋性,提取稀疏且線性的安全穩(wěn)定規(guī)則[24]。本文將以靜態(tài)電壓穩(wěn)定問題為例,介紹斜回歸樹及其集成算法,具體將在第3 章與第4 章中詳述。
3)規(guī)則提取與內嵌優(yōu)化:利用遞歸算法提取斜決策樹各葉節(jié)點的稀疏劃分矩陣,通過大M 法將其轉化為安全穩(wěn)定約束[24]。內嵌后的運行優(yōu)化問題變?yōu)榛旌险麛稻€性規(guī)劃(MILP)問題,可通過多種商業(yè)軟件求解。
由于高比例可再生能源電力系統(tǒng)的隨機性和低慣性,利用斜回歸樹及其集成算法提取靜態(tài)電壓穩(wěn)定規(guī)則時,需要解決以下2 個問題。
1)如何通過簡單而有效的抽樣方法在高比例可再生能源電力系統(tǒng)廣闊的運行狀態(tài)空間中進行采樣生成數據集?
2)如何將斜回歸樹進行高效集成并防止過擬合,以提取盡可能簡單而可靠的安全穩(wěn)定規(guī)則?
為了解決上述問題,圖2 給出了斜回歸樹用于提取靜態(tài)電壓穩(wěn)定規(guī)則的算法框架。
圖2 斜回歸樹用于提取靜態(tài)電壓穩(wěn)定規(guī)則的算法框架Fig.2 Algorithm framework for extracting static voltage stability rules using oblique regression tree
1)給出系統(tǒng)邊界條件:包括節(jié)點類型信息、負荷參數、接地導納、電壓幅值及其變化范圍、線路參數、機組所在節(jié)點和有功、無功出力的上下限等。
2)生成靜態(tài)電壓穩(wěn)定數據集:首先,采用改進拉丁超立方抽樣(LHS)對負荷大小與可再生能源機組的出力上限進行采樣,得到在高比例可再生能源電力系統(tǒng)運行狀態(tài)空間中分布均勻的樣本[25]。接著,通過最優(yōu)潮流計算得到運行狀態(tài)樣本的詳細信息,記為p,然后通過連續(xù)潮流計算得到運行狀態(tài)的電壓穩(wěn)定裕度值,記為y。電力系統(tǒng)最優(yōu)潮流和連續(xù)潮流算法較為成熟[26-27],目前已有PSASP、BPA 等商業(yè)軟件[28],以及MATPOWER、PSAT 等開源軟件能夠進行相關計算[29-30],因此具體方法不再贅述。為了體現(xiàn)電力系統(tǒng)運行狀態(tài)的關鍵信息,本文將p定義為:
式中:Pg(1×ng)和Qg(1×ng)分別為各個機組有功和無功出力;Pd(1×nd)和Qd(1×nd)分別為各個節(jié)點有功和無功負荷;Vm(1×nn)和Va(1×nn)分別為各個節(jié)點的電壓幅值和相角;常數1 為預留項,用于學習線性劃分的常數項;ng、nd、nn分別為發(fā)電機組數、負荷節(jié)點數與系統(tǒng)節(jié)點數。
最后,將電力系統(tǒng)運行狀態(tài){p}及其電壓穩(wěn)定裕度值{y}整合為靜態(tài)電壓穩(wěn)定數據集D:
式中:pi為編號為i的運行狀態(tài);yi為pi的電壓穩(wěn)定裕度值。
3)斜回歸樹的訓練:將靜態(tài)電壓穩(wěn)定數據集D輸入斜回歸樹算法中進行訓練,按照最大深度等終止條件訓練出斜回歸樹各個非葉節(jié)點的劃分系數向量θ與各個葉節(jié)點的代表值y~。斜回歸樹的訓練方法詳見第3 章。
4)斜回歸樹的集成:本文利用boosting 的思想集成斜回歸樹[31]。用新增斜回歸樹擬合已有集成斜回歸樹的擬合誤差。為了減小過擬合的風險,引入Lasso 和Ridge 正則化項[32-33],提高集成斜回歸樹泛化性能的同時,增強其可解釋性。斜回歸樹的集成方法詳見第4 章。
5)反饋:如果當前訓練結果達不到預期要求,一方面可以繼續(xù)進行樹的集成,返回步驟3);另一方面也可以判斷算法在電力系統(tǒng)運行狀態(tài)空間中泛化性能較差的位置,于該位置附近進一步采樣擴充訓練集,返回步驟2)。
本文提出的斜回歸樹算法具有兩方面的優(yōu)勢,一方面是較強的表示能力,另一方面是其提取的安全穩(wěn)定規(guī)則具有良好的可解釋性。
斜回歸樹的表示能力源于采用了線性斜劃分代替?zhèn)鹘y(tǒng)的單變量劃分,不難理解,每次劃分考慮運行方式向量p的全部特征顯然要比僅考慮單個特征承載更多信息。斜回歸樹通過線性劃分預測電壓穩(wěn)定裕度的機理為:如果電力系統(tǒng)運行狀態(tài)pi滿足線性劃分θTpi<0,pi被劃分到左側子節(jié)點,斜回歸樹就認為pi具有左側子節(jié)點代表值的穩(wěn)定裕度,反之亦然。實現(xiàn)線性斜劃分的關鍵在于如何克服指示函數I(θTpi<0)的不連續(xù)性[24],使得最優(yōu)斜劃分的尋找從離散優(yōu)化問題轉化為連續(xù)優(yōu)化問題。本文將sigmoid 函數σ(z)引入斜回歸樹訓練[34],引入σ(z)后斜劃分的指示函數變?yōu)閜i落在左右兩側子節(jié)點的概率值,本文將其命名為權重和,計算式為[34]:
斜回歸樹的可解釋性表現(xiàn)在其預測依據明確、易于調度人員理解。提取靜態(tài)電壓穩(wěn)定規(guī)則利用了斜回歸樹的可解釋性:從樹的根節(jié)點到葉節(jié)點t中間會經過若干線性劃分判斷{θTp<0?},各線性劃分的劃分系數列向量逐列排列成該葉節(jié)點的劃分矩陣Θ,此時存在一條樣本pi滿足這些線性劃分判斷,也即滿足ΘTpi<0,斜回歸樹就會將該葉節(jié)點的代表值作為該樣本的標簽預測值,各葉節(jié)點的劃分矩陣整合起來就是斜回歸樹得到的規(guī)則。
斜回歸樹的訓練目標是為了得到葉節(jié)點的代表值y~t與非葉節(jié)點的最優(yōu)劃分系數向量θ,分別對應斜回歸樹損失函數的構建與單次劃分得分的構建。
斜決策樹在訓練集D={(pi,yi)}上的加權平方損失函數為:
忽略僅與訓練集有關的常數項,不難發(fā)現(xiàn)目標函數對各個葉節(jié)點解耦。因此,對于一個葉節(jié)點而言,整棵樹達到最小損失的代表值即為該葉節(jié)點達到最小損失的代表值。根據式(4),y~t可表示為:
式中:Lmin(f)|t為落在t號葉節(jié)點上的樣本所能達到的最小損失,整棵樹的最小損失即為各個葉節(jié)點最小損失之和。
斜回歸樹單次劃分的得分Sscore如下:
最大化Sscore就能夠得到單次劃分中父節(jié)點的最優(yōu)劃分系數θ。根據式(6),算法將單次劃分后L(f)的減小量作為單次劃分的得分,即單次劃分中父節(jié)點的最小損失減去2 個子節(jié)點的最小損失之和的差。構建單次劃分的得分是為了簡化問題規(guī)模,依次優(yōu)化各節(jié)點的劃分系數。式(7)中ωi0為pi在父節(jié)點的初始權重,因為采用各節(jié)點依次優(yōu)化的方法,所以從根節(jié)點到該節(jié)點經過的劃分也已知,從而有ωi0已知。
基于上述推導,斜回歸樹的訓練方法可以總結為通過遞歸不斷在當前節(jié)點上進行劃分,直到達到最大深度。首先,根據輸入數據集D建立當前節(jié)點。然后,通過最大化Sscore得到最優(yōu)劃分系數θ,如果Sscore≤0 說明本次劃分并不能減小擬合誤差,當前節(jié)點可以作為葉節(jié)點通過式(5)給出其代表值;如果Sscore>0 說明本次劃分仍有價值,當前節(jié)點可由最優(yōu)劃分系數θ分成2 個子節(jié)點。最后,通過硬劃分獲取分入左右2 個子節(jié)點的數據集DL與DR,分別將左右2 個子節(jié)點作為當前節(jié)點繼續(xù)劃分,直到得到一顆完整的樹。
斜回歸樹應用于大型電力系統(tǒng)穩(wěn)定裕度分析時存在兩方面的不足。一方面,運行方式向量pi的維度往往很高,劃分系數向量θ往往比較稠密,不利于挖掘影響安全穩(wěn)定狀態(tài)的關鍵因素,不利于調度人員理解并應用斜回歸樹提取的規(guī)則;另一方面,需要進一步提升斜回歸樹的學習能力,確保算法能夠精準辨識大型電力系統(tǒng)更加復雜的安全穩(wěn)定邊界。
為了解決上述問題,本文提出斜回歸樹的稀疏技術與集成方法:在Sscore中引入Lasso 和Ridge 正則化項,一方面避免過擬合保證規(guī)則的有效性,另一方面保證劃分系數向量θ盡可能稀疏,使得提取規(guī)則既可靠又僅與少量關鍵特征強相關;然后,利用boosting 思想對稀疏斜回歸樹進行集成,得到集成斜回歸樹算法。
稀疏斜回歸樹的核心在于:在Sscore中同時加入Lasso 和Ridge 正則化項,每次劃分的優(yōu)化目標變?yōu)?
式中:α‖θ‖1和β分別為對單次劃分的Lasso 和Ridge 回歸懲罰項,α與β為懲罰系數;M為參與當前節(jié)點劃分系數訓練的數據集大小。加入Lasso 回歸懲罰項的作用是使得θ稀疏,降低算法提取規(guī)則的稠密性,提升算法的可解釋性;加入Ridge 回歸懲罰項的作用是增加目標函數的凸性,防止因Lasso 回歸懲罰項的加入導致單次劃分僅與單個特征相關;而M的作用為使得懲罰系數α與β不必隨M的改變做出調整。
加入Lasso 回歸懲罰項之后目標函數的一階梯度并不連續(xù),因而不能直接通過牛頓法或擬牛頓法求解其最優(yōu)值。但其一階梯度在每一個象限內卻是連續(xù)的,利用這一特性能夠通過文獻[24]提出的改進OWL-QN 算法優(yōu)化求解其最優(yōu)值。該算法只需利用Sscore的一階梯度就可以求解得到當前節(jié)點最優(yōu)且稀疏的劃分系數θ。令Sscore前兩項為lL(θ) 和lR(θ),則Sscore的一階梯度函數可以表示為:
而lL(θ)的一階梯度函數如下:
lR(θ)的一階梯度函數與lL(θ)類似,不再贅述。
目標函數經改進OWL-QN 算法優(yōu)化求解的具體過程參見文獻[24],結合第3 章的訓練方法即可得到稀疏斜回歸樹。
本文利用梯度提升的思想對稀疏斜回歸樹進行集成得到集成斜回歸樹算法。設已有集成斜回歸樹φ(p)集成了K棵稀疏斜回歸樹,則φ(p)對pi的安全穩(wěn)定裕度預測值可表示為:
如果此時φ(p)的預測精度已達到所需要求,則不需要繼續(xù)添加稀疏斜回歸樹。反之則需要將訓練集中各條數據的擬合誤差yi-y^i作為新增斜回歸樹訓練數據的新標簽值,然后訓練稀疏斜回歸樹添加到集成斜回歸樹模型中,直到獲得滿足所需精度的預測模型。值得一提的是,集成斜回歸樹的訓練過程也可以引入學習率或者特征抽樣(列采樣)等方法。
本文選取2 個高比例可再生能源電力系統(tǒng)(記為IEEE-30 和RTS-GMLC)測試本算法的性能,所選系統(tǒng)的部分關鍵參數見附錄A 表A1。IEEE-30系統(tǒng)改自IEEE-30 節(jié)點標準算例系統(tǒng),在節(jié)點10、24、28 分別添加一座50 MW 的風電場和一座50 MW的光伏發(fā)電站,可再生能源裝機容量滲透率為47%,關注可再生能源機組出力和負荷變化時節(jié)點8 的電壓穩(wěn)定情況;RTS-GMLC 系統(tǒng)是美國國家可再生能源實驗室(NREL)提出的73 節(jié)點穩(wěn)定測試系統(tǒng),可再生能源裝機容量滲透率為43%,關注節(jié)點3 的電壓穩(wěn)定情況。本節(jié)通過仿真計算在2 個系統(tǒng)上分別生成了22 000 和55 000 條數據,用于訓練和測試數據比例為10∶1。為了展示集成斜回歸樹算法(簡稱EWORT)的各方面性能,本文將該方法與已有方法中性能表現(xiàn)最佳的XGBoost 算法(簡稱XGB)進行對比。
圖3 展示了集成斜回歸樹算法訓練誤差和測試誤差隨樹集成量的變化情況。
圖3 斜回歸樹算法的集成效果Fig.3 Ensemble effect of oblique regression tree algorithm
圖3 中,平均相對誤差定義為算法在單個數據集上預測相對誤差的平均值,橫坐標是算法的集成量,1 表示只有單棵樹。當樹集成量較少時,EWORT 的誤差就遠低于XGB 的誤差,隨著樹集成量的增大,EWORT 收斂到更小的泛化誤差,說明它對電力系統(tǒng)電壓穩(wěn)定信息有更強的識別和表示能力。從趨勢上看,雖然XGB 誤差下降的幅度很大,誤差下降速度比EWORT 更快,但這是因為其初始精度較差,給集成留下了相當多的學習空間。以IEEE-30 算例結果為例,EWORT 不僅能在單棵樹時給出比XGB 集成20 棵樹更高的預測精度,還能在集成第2 棵樹時得到比XGB 集成第20 棵樹時更大的誤差下降幅度。
圖4 展示了EWORT、XGB 與人工神經網絡(ANN)在測試誤差和訓練時間方面的差別,左側縱坐標軸表示測試誤差,意義與圖3 中平均相對誤差相同,右側縱坐標軸為訓練時間,采用對數刻度。
圖4(a)為IEEE-30 算例的結果,EWORT 和XGB1 的最大深度為5,集成20 棵樹,XGB2 和XGB3 的最大深度為3,分別集成20 棵樹和200 棵樹,ANN 取三層神經網絡,隱層取200 個神經元。圖4(b)為RTS-GMLC 算例的結果,EWORT 和XGB1 的最大深度為5,集成4 棵樹,XGB2 和XGB3的最大深度為4,分別集成4 棵樹和200 棵樹,ANN取三層神經網絡,隱層取200 個神經元。在測試誤差方面,EWORT 的泛化誤差比集成度相同的XGB1 和XGB2 降低約30%;同時EWORT 能夠達到與XGB3 和ANN 接近的預測精度。在訓練時間方面,EWORT 短于ANN 而長于XGB。這是因為EWORT 引入Lasso 懲罰項導致目標函數的一階梯度不連續(xù),訓練時間比XGB 更長;而ANN 需要經過多次反向傳播才能達到最優(yōu)的擬合效果,所以在2 個算例中,ANN 的訓練時間都超過EWORT 的3 倍。這說明:在具有強可解釋性的算法中,EWORT 的學習能力超越了原本表現(xiàn)最優(yōu)的XGB,EWORT 只需少量集成就能達到XGB 大量集成的泛化性能,且在更大的系統(tǒng)中,這種效果更加顯著;在具有強學習能力的算法中,EWORT 的泛化性能與ANN 相當的同時,訓練時間更有優(yōu)勢。此外,ANN 的訓練結果是一個黑箱,調度人員難以從中獲取穩(wěn)定裕度的預測依據,其預測結果出現(xiàn)大幅偏差的情況也將無從預知。
圖4 模型測試誤差和訓練時間對比Fig.4 Comparison of model test error and training time
連續(xù)潮流與機器學習算法計算靜態(tài)電壓穩(wěn)定裕度所需時間的對比結果見附錄A 表A2。為了避免單次計算的隨機性,表中給出的時間數據是算法完成1 000 次靜態(tài)電壓穩(wěn)定裕度計算所需的總時間。從IEEE-30 與RTS-GMLC 的算例結果可以看出,相比于連續(xù)潮流算法,EWORT 等機器學習算法計算穩(wěn)定裕度所需時間幾乎可以忽略不計;相比于其他機器學習算法,EWORT 雖不具備優(yōu)勢,但是因單次平均計算時間過短,在實際應用時各種機器學習算法的裕度計算時間對調度人員而言相差不大。
電壓穩(wěn)定裕度預測值與真實值之間的對比如圖5 所示。圖5 中藍點代表數據集中的一個實例,其橫坐標是電壓穩(wěn)定裕度的真實值,縱坐標是模型對電壓穩(wěn)定裕度的預測值,中間橙色的線是理想中的預測結果:預測值恰為真實值。實例點越靠近橙線,模型預測效果越好。觀察IEEE-30 的結果,容易發(fā)現(xiàn)EWORT 的預測結果更加集中到橙線附近,而XGB 存在多個遠離橙線的點。觀察RTS-GMLC 的結果,上述對比則更加明顯,且XGB 的樣本點也更加分散。由此可見,EWORT 具有比XGB 更小的預測不確定性,隨著系統(tǒng)的增大對比更加明顯。
圖5 電壓穩(wěn)定裕度預測值分布圖Fig.5 Distribution of predicted voltage stability margin
圖6 展示了Lasso 和Ridge 懲罰系數的大小對樹稀疏度和訓練時間的影響。
圖6 懲罰值對回歸樹稀疏度和訓練時間的影響Fig.6 Effect of penalty value on sparsity and training time of regression tree
斜決策樹的稀疏度定義為劃分系數向量中零元素個數的平均占比。因為樹稀疏度只跟Lasso 懲罰系數有關,這里令Ridge 懲罰系數等于Lasso 懲罰系數,作為橫坐標,即α值的大小,從大到小排列。圖6中橙色折線的縱坐標軸在左側表示訓練時間,藍色柱的縱坐標軸在右側表示樹的稀疏度。從圖6 中可以看出,隨著懲罰系數的減小,訓練時間先增大后減小,樹的稀疏度不斷減小,說明通過增大α能夠大幅增加樹的稀疏度,減小訓練時間;α接近零時訓練時間大幅增加;α為零時并不能有效限制樹的稀疏度,但是訓練時間卻有所減小。由此可見,適當增大α能夠使劃分系數向量變得稀疏,從而使提取規(guī)則更加簡單可解釋。
單棵斜回歸樹提取IEEE-30 系統(tǒng)的靜態(tài)電壓穩(wěn)定規(guī)則示例見附錄A 圖A1。該樹精度達99.14%,在訓練時選取了較大的α,得出了極度稀疏的斜回歸樹。即便如此,該樹仍比同參數的XGB 泛化誤差降低約17%。算法可解釋性在電壓穩(wěn)定的場景下表現(xiàn)為調度人員對穩(wěn)定裕度預測依據的了解程度,斜回歸樹的預測依據在圖中表現(xiàn)為非葉節(jié)點中的不等式判斷。從圖A1 中可以看到,前兩層的不等式判斷同單變量回歸樹一樣都只與節(jié)點8 的電壓有關,斜回歸樹認為首先要根據節(jié)點8 的電壓判斷節(jié)點8 的電壓穩(wěn)定裕度。整棵樹與單變量回歸樹最大的差別在第3 層最左側的節(jié)點,其預測依據同時與多個特征量有關:距離節(jié)點8 較近的節(jié)點27 的電壓在劃分中占主導地位,節(jié)點2 的電壓和此處發(fā)電廠的有功出力起輔助作用。在這個中間節(jié)點分裂出2 個電壓穩(wěn)定裕度代表值較小的葉節(jié)點,說明斜回歸樹通過斜劃分處理好了低穩(wěn)定裕度情況下數據集的劃分,從而得到了超過XGB 的預測性能。此外,如果沒有引入正則化項,尤其是Lasso 懲罰項,非葉節(jié)點的劃分將與所有輸入特征相關,算法提取的規(guī)則不會如附錄A 圖A1 那樣簡單、易于理解。
本文提出了內嵌安全穩(wěn)定約束的電力系統(tǒng)優(yōu)化運行框架和用于電力系統(tǒng)安全穩(wěn)定規(guī)則提取的斜回歸樹及其集成算法。該算法具有較強的表示能力與良好的可解釋性。算例分析結果表明集成斜回歸樹具有超過同類算法XGBoost 的學習能力與集成效率。
斜回歸樹及其集成算法能夠用于電力系統(tǒng)安全穩(wěn)定規(guī)則提取,有望成為在電力系統(tǒng)優(yōu)化運行中考慮安全穩(wěn)定約束的突破性技術。后續(xù)將研究所提出的框架如何應用于考慮暫態(tài)電壓等穩(wěn)定問題的電力系統(tǒng)優(yōu)化運行以及所提出的線性規(guī)則如何內嵌電力系統(tǒng)優(yōu)化運行模型。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網絡全文。