曲銳,王世榮,辛文龍
(1.廣東電網有限責任公司佛山供電局,廣東 佛山 528000;2. 長春工業(yè)大學 電氣與電子工程學院,吉林 長春 130000)
暫態(tài)穩(wěn)定評估是電力系統(tǒng)安全穩(wěn)定分析方法的重要組成部分[1]。隨著我國電力系統(tǒng)規(guī)模的不斷擴展,新能源的大規(guī)模并網、電力電子設備的廣泛應用、大區(qū)域互聯系統(tǒng)的復雜程度不斷提高,給電網穩(wěn)定運行帶來嚴峻挑戰(zhàn),為避免類似美國、加拿大、西歐大停電事故的再度發(fā)生[2],尋求準確有效的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法具有重要意義[3]。
目前,暫態(tài)穩(wěn)定評估方法主要以時域仿真[4]為主、直接法[5]為輔。時域仿真法具有較高的準確性,而直接法可尋求系統(tǒng)暫態(tài)穩(wěn)定裕度等優(yōu)點,已在電力系統(tǒng)暫態(tài)穩(wěn)定評估領域得到了大量研究和應用,并取得很多研究成果[6]。隨著研究的深入,時域仿真法和直接法2項技術框架的不足也逐漸顯現出來,主要包括:①時域仿真法需要求解電力系統(tǒng)的大量代數和非線性方程,具有計算速度較慢和無法定量描述的不足,很難滿足在線實時評估的實際需求[4];②直接法在確定穩(wěn)定裕度時,極限能量的求取受非線性時變因素的影響,無法適應復雜的系統(tǒng)網絡拓撲,通用性很差。人工智能方法兼顧時域仿真和機器學習的優(yōu)勢[7-11],具有精度高、耗時短、維度低等優(yōu)點,已在電力系統(tǒng)實時評估中得到廣泛應用[12-14]。
現有支持向量機(support vector machine, SVM)[15-16]、廣義特征值近端支持向量機(generalized eigenvalue proximal support vector machine, GEPSVM)等人工智能方法為監(jiān)督學習模式,其泛化性能依賴于是否具有足夠的樣本標記信息[17-18],只采用有標記的樣本數據進行模型訓練;然而,現實世界中的許多學習問題,例如自然語言分析[19]、垃圾郵件過濾[20]等有標記數據的獲取通常較困難,而未標記數據的收集更容易,當標記信息量不足時監(jiān)督分類器的評估性能則不是很理想。電力系統(tǒng)暫態(tài)穩(wěn)定的歷史狀態(tài)信息很難表征復雜多變的穩(wěn)定狀態(tài)情況,而廣域量測信息可很好地表征系統(tǒng)運行情況,且廣域量測數據相對容易獲??;因此,電力系統(tǒng)暫態(tài)穩(wěn)定評估的標記數據不足或不準而未標記數據無法充分利用問題急需解決。
為解決大量未標記數據和較少標記數據的暫態(tài)穩(wěn)定評估模型訓練問題,可采用半監(jiān)督學習進行模型訓練[17]。流形正則化(manifold regularization,MR)具有較好的優(yōu)化結構[21],其在MR框架中引入了2個正則化項,分別用于處理分類器的復雜性和流形的平滑性。文獻[22]首先將監(jiān)督非平行近端分類器擴展到半監(jiān)督模型,并提出拉普拉斯孿生SVM,實驗結果可證明其有效性;但拉普拉斯孿生SVM的挑戰(zhàn)在于2個高維二次規(guī)劃問題的求解,計算效率較低。
針對上述問題,提出一種半監(jiān)督近似流形支持向量機(manifold proximal support vector machine,MPSVM)用于暫態(tài)穩(wěn)定評估模型,該模型不僅引入MR技術從輸入樣本數據內部捕獲盡可能多的幾何信息,并通過最大距離理論表征電力系統(tǒng)穩(wěn)定類和不穩(wěn)定類之間的差異,即:①通過求解2個特征值問題確定最優(yōu)超平面,有效避免復雜的矩陣求逆計算;②采用貝葉斯非線性分層模型進行參數優(yōu)化,有效提高評估性能;③MPSVM可充分利用無標簽進行模型訓練,有效提高數據利用率和評估性能。采用IEEE 39標準系統(tǒng)和鞍山電網的仿真分析驗證所提評估模型的有效性和準確性。
采用二維樣本來分析不同分類器的分類原理,此處每個樣本包含2個特征,橫軸為特征1取值范圍,縱軸為特征2取值范圍,如圖1所示。假設120個樣本中只有3個有標簽樣本(包括2個正類和1個負類),其余樣本為無標簽樣本,如圖1(a)。如果僅采用這3個有標簽樣本進行模型訓練,SVM和GEPSVM最優(yōu)超平面訓練結果如圖1(b)和圖1(c)所示,誤分類的幾率較大,而利用無標簽和有標簽樣本的訓練結果如圖1(d),可有效改善評估性能。
圖1 分類器SVM、GEPSVM和MPSVM的分類原理Fig.1 Classification principles of SVM, GEPSVM and MPSVM
(1)
(2)
鑒于暫態(tài)穩(wěn)定評估的模型構建為非線性優(yōu)化問題,特引入MPSVM的非線性模型。利用2個核函數構建近端超平面:
(3)
式中:X′為輸入樣本數據矩陣的轉置;x′為輸入樣本矩單個樣本的轉置;ω1和ω2為法向量分量;b1和b2為偏差分向量;K(·,·)為核函數,例如徑向基核函數K(u,v)=e-γ‖u-v‖2,核參數γ>0,進而可得如下所示MPSVM的非線性優(yōu)化問題:
(4)
(5)
式中:A∈Rm1×n和B∈Rm2×n分別為正類“+1”和負類“-1”有標簽樣本,m1+m2=l;e1、e2、e為單位矩陣;c1>0為經驗風險懲罰參數;c2>0為MR參數;L為拉普拉斯乘子。
令Hφ=[K(A,X′)e1],Gφ=[K(B,X′)e2],Jφ=[K,e],v1=[ω1;b1],v2=[ω2;b2],上述優(yōu)化問題可轉化為:
(6)
s.t.‖v2‖2=1.
(7)
可通過求解如下方程的特征值λ1、λ2和特征向量,來確定式(6)和式(7)優(yōu)化問題的解:
(8)
(9)
優(yōu)化問題的最優(yōu)解即為式(8)和式(9)最小特征值的特征向量。進而確定(ω1,b1)和(ω2,b2),當輸入測試樣本x∈Rn,類別標號為i(i=“+1”,“-1”),并可以通過如下判別函數來確定分類結果:
(10)
貝葉斯非線性分層模型可通過最大化參數分布的后驗,確定最優(yōu)參數值。貝葉斯非線性分層模型的推斷過程[23]如圖2所示。
圖2 貝葉斯非線性分層模型Fig.2 Bayesian nonlinear layered model
1.2.1 第一層推斷
第一層貝葉斯推斷可解釋為經驗風險懲罰參數c1的貝葉斯推斷。將式(6)和式(7)的分類模型定義為H,訓練數據集用D表示,D的分布為p(D|c1,c2,H),參數的先驗概率為p(D|c2,H),假設正則化參數c2給定,經驗風險懲罰參數c1的后驗概率可通過貝葉斯準則的第一層推斷獲得,若訓練樣本獨立同分布,且p(D|c1,c2,H)服從高斯分布,則貝葉斯式如下:
(11)
假設
(12)
(13)
得到:
(14)
(15)
式(11)—(15)中:yi為第i個樣本的輸出數據;Cconst為常數。
式(15)的后2項與經驗風險懲罰參數c1無關,因此式(15)的優(yōu)化訓練結果可轉化為最大化c1的后驗概率,進而獲得c1的最優(yōu)值c1MP。
1.2.2 第二層推斷
第二層貝葉斯推斷可解釋為MR參數的貝葉斯推斷,通過最大化p(c2|D,H)∝p(D|c2,H)p(c2|H)來選擇MR參數c2。假設p(c2|H)平坦,正則化參數c2可由最大化p(D|c2,H)來確定。若在c1=c1MP時,正則化參數的后驗概率服從高斯分布,則c2可通過對c1積分求得:
(16)
其中:
(17)
而Ec1,MP、ED,MP分別為Ec1、ED在c1=c1,MP時的取值,由文獻[6]可知c2的最優(yōu)值不必通過最大化lnp(D|c2,H)求解,只需令式(16)對c2偏導數為零,即
2c2Ec1,MP=γ.
(18)
式中γ=k-c2tranceΛ-1。
(19)
(20)
式中:I為單位矩陣;T為調制矩陣;φ(xi)為中繼調制矩陣。
若用ρi表示Z的特征值,通過對矩陣進行特征向量分解,可得到:
(21)
(22)
式中k為調制因子。
進一步計算p(D|c2,H)的值,并通過迭代計算得到MR參數c2的最優(yōu)取值。
1.2.3 第三層推算
第三層貝葉斯推斷可解釋為核參數的貝葉斯推斷,可通過計算模型訓練數據集D的后驗概率和貝葉斯參數估計理論對核參數進行推斷估計,獲得MPSVM核參數的最佳值。D的后驗概率為
(23)
同步相量測量單元作為現代電力系統(tǒng)的量測儀器,可持續(xù)不斷地采集系統(tǒng)運行數據,見表1[24]。
表1 同步相量測量單元數據Tab.1 Synchronization phasor measurement unit data
由故障后的實測數據,構建表征電力系統(tǒng)動態(tài)特性的原始特征集[8],并應用特征選擇方法對原始特征集進行特征壓縮,進而確定與暫態(tài)穩(wěn)定特性具有較大強相關的12維特征,見表2,其中包含故障初始時刻t0和故障清除時刻tcl的系統(tǒng)特征。
表2 數據集的輸入特征量Tab.2 Inputcharacteristic quantity of the data set
由多次故障實測數據確定的特征集,構建成電力系統(tǒng)暫態(tài)穩(wěn)定評估的樣本集,并將樣本集隨機分為用于模型訓練的訓練集和模型有效性驗證的測試集,采用第1.1節(jié)介紹的MPSVM進行電力系統(tǒng)暫態(tài)穩(wěn)定評估。
由上述分析可知,本文所提MPSVM評估方法的暫態(tài)穩(wěn)定評估流程如圖3所示,其中ROC為接受運行特性曲線。
圖3 暫態(tài)穩(wěn)定評估流程圖Fig.3 Transient stability assessment flow chart
評估流程主要分為3步:①采用特征選擇方法對原始特征集進行特征壓縮;②采用貝葉斯非線性分層模型優(yōu)化參數,改善評估性能;③基于訓練集對MPSVM進行離線訓練,構建暫態(tài)穩(wěn)定評估模型,同時計算評價指標值。
準確率指標定義為評估正確樣本數與樣本總數的比。Tij表示第i類被評估為j類樣本數,其中i={0,1},j={0,1},則準確率為
(24)
統(tǒng)計值指標D可用于評價評估分類和實際分類的一致性,即
(25)
接受運行特性曲線(receiver operating characteristic curve,ROC)指標R包括評估結果的誤報率(false positive rate,FPR)函數fFPR和評估結果的命中率(true positive rate,TPR)函數fTPR,且:
(26)
(27)
綜合評價指標可表征所提分類器模型在不同評價角度的平均性能,且
(28)
利用電力系統(tǒng)仿真軟件PSD-BPA進行仿真計算獲得電力系統(tǒng)的潮流和穩(wěn)定運行數據,發(fā)電機采用二階模型,負荷為恒阻抗負荷,故障類型為三相短路,故障開始和清除時刻分別為0.1 s和0.3 s,圖4為IEEE 39的系統(tǒng)圖,其中G表示發(fā)電機。
圖4 新英格蘭10機39節(jié)點系統(tǒng)Fig.4 New England 10-machine 39-node system
將測試系統(tǒng)的相對功角差最大值Δδmax作為暫態(tài)判據,Δδmax≥360°表示系統(tǒng)失穩(wěn);Δδmax<360°表示系統(tǒng)穩(wěn)定。把獲得的2 400個樣本構成樣本集,隨機選取樣本集中的1 200樣本用于構建評估模型,其余樣本用于暫態(tài)穩(wěn)定評估來獲得評價指標。該算例分析如下:
a)MPSVM評估模型的準確性分析。采用4種分類器進行暫態(tài)穩(wěn)定評估,4種分類器包括C-SVM、nu-SVM、GEPSVM和MPSVM,評價結果見表3。
表3 4種分類器的評價指標Tab.3 Evaluation indicators of 4 classifiers
由表3可知:對比準確率指標A、ROC指標R、D指標,可以發(fā)現MPSVM的準確率為93.83%,綜合評價指標值η為0.919 0,均分別高于其他3種分類器,但準確率指標未超過95.00%,初始參數時評估性能有待進一步提升。
b)利用貝葉斯非線性分層模型優(yōu)化參數提高評估性能。通過貝葉斯非線性分層模型的第二層推斷確定最優(yōu)MR參數及第三層推斷確定最優(yōu)核參數后MPSVM的暫態(tài)穩(wěn)定評估性能,見表4。
表4 貝葉斯參數優(yōu)化后MPSVM的評估精度Tab.4 Evaluation accuracy of MPSVM after Bayesian parameter optimization
由表4可知:經過貝葉斯非線性分層模型優(yōu)化參數后的總體評估性能有所改善,第一層優(yōu)化后由93.83%提高到94.40%,綜合指標由0.919 0提高到0.925 0,比未優(yōu)化前略有提高;第二層優(yōu)化選取最優(yōu)MR參數后,評估準確率由94.40%提高到95.25%,綜合指標由0.925 0提高到0.934 6;第三層進一步優(yōu)化選取最優(yōu)核參數后,評估準確率由95.25%進一步提高到96.83%,綜合指標由0.934 6進一步提高到0.957 6。可見不同參數對評估性能的影響較大,合理選擇參數對提高評估準確率具有重要意義。貝葉斯參數優(yōu)化后4種分類器的評估精度見表5。由表5可知經貝葉斯參數優(yōu)化后C-SVM、nu-SVM和GEPSVM的綜合評價指標都有所提高,但仍低于MPSVM的綜合評價指標,進一步說明MPSVM較現有分類器具有更高的評估性能。
c)MPSVM的核函數分析。采用3種核函數分析其對MPSVM分類器的影響,3種核函數包括多項式、線性和徑向基核函數,不同核函數的評價指標見表6。
表5 貝葉斯參數優(yōu)化后4種分類器的評估精度Tab.5 Evaluation accuracy of 4 classifiers after Bayesian parameter optimization
表6 3種核函數的MPSVM評價指標Tab.6 MPSVM evaluation indicators of three kernel functions
由表6可知:MPSVM采用多項式核函數的綜合評價指標為0.928 3,在3種核函數中的綜合評價指標最小,但也高于表3中C-SVM、nu-SVM和GEPSVM的綜合評價指標;采用徑向基核函數的綜合評價為0.957 6,具有最高的綜合評價指標,因此可選擇徑向基核函數作為MPSVM的核函數。
鞍山電網地處遼寧電網中南部,隨著遼寧電網的快速發(fā)展,網架結構不斷加強,復雜性也不斷加劇,其整體穩(wěn)定性問題不斷出現,鞍山電網的區(qū)域接線如圖5所示。
圖5 鞍山電網地區(qū)接線圖Fig.5 Anshan power grid area wiring diagram
從鞍山電網共獲得1 000樣本來構成樣本集,隨機選取樣本集的3/4作為訓練集,其余作為測試集,暫態(tài)穩(wěn)定評估結果見表7。
表7 鞍山電網的暫態(tài)穩(wěn)定評估結果Tab.7 Transient stability assessment results of Anshan power grid
由表7可知:在鞍山電網中通過貝葉斯非線性分層模型進行第一層參數優(yōu)化后,評估準確率由92.40%提高到94.02%;第二層優(yōu)化選取最優(yōu)MR參數后,評估準確率由94.02%提高到94.40%,綜合指標由0.909 1提高到0.932 6;第三層優(yōu)化選取最優(yōu)核參數后,評估準確率由94.40%提高到96.40%,綜合指標由0.932 6提高到0.949 2。可見在實際系統(tǒng)通過合理選擇參數可有效提高評估準確率。
本文提出一種基于半監(jiān)督MPSVM的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法,通過IEEE 39標準系統(tǒng)和鞍山電網的仿真分析,得出如下結論:
a)根據廣域量測信息采集的故障后信息,計算與電力系統(tǒng)穩(wěn)定性相關的原始樣本集,并采用特征選擇方法進行特征壓縮,可在原始樣本集的基礎上搜索最優(yōu)特征子集,進一步減少特征冗余信息,降低特征維數。
b)利用貝葉斯非線性分層模型確定MPSVM的最優(yōu)參數,可有效改善暫態(tài)穩(wěn)定評估的性能,分析不同核函數的評估性能,同時得出徑向基核函數具有最高的評估準確率。
c)采用半監(jiān)督學習模式,可有效利用無標簽樣本數據信息,提高評估準確率,相較于現有分類器SVM、GEPSVM等具有較高的評估性能。
本文所提的暫態(tài)穩(wěn)定評估方法可有效利用電網的無標簽數據信息來提高評估準確率,可以作為電力系統(tǒng)暫態(tài)穩(wěn)定預警的基礎。如何將所提方法應用含大規(guī)模風電并網系統(tǒng)的暫態(tài)穩(wěn)定評估,將是下一步工作的重點。