李寶琴,吳俊勇,強(qiáng)子玥,覃柳蕓,郝亮亮
(北京交通大學(xué)電氣工程學(xué)院,北京市 100044)
暫態(tài)穩(wěn)定性是指當(dāng)系統(tǒng)遭受到大擾動(dòng)時(shí),各同步發(fā)電機(jī)保持同步運(yùn)行的能力[1]。隨著高比例新能源并網(wǎng),高比例大功率電力電子裝置以及高比例新型負(fù)荷接入電網(wǎng),復(fù)雜多變的動(dòng)態(tài)特性給電力系統(tǒng)帶來(lái)諸多挑戰(zhàn)[2-3]。其中,暫態(tài)失穩(wěn)是很多大電網(wǎng)停電的主要因素[4],快速、準(zhǔn)確、可靠的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估是系統(tǒng)安全穩(wěn)定運(yùn)行的重要保障。
傳統(tǒng)的暫態(tài)穩(wěn)定分析方法包括時(shí)域仿真法、直接法等,但面對(duì)復(fù)雜電網(wǎng)時(shí)無(wú)法同時(shí)滿足計(jì)算精度和速度的要求。飛速發(fā)展的數(shù)據(jù)驅(qū)動(dòng)和深度學(xué)習(xí)技術(shù),依靠強(qiáng)大的特征提取和數(shù)據(jù)挖掘能力,為電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估提供了新的思路。目前已有很多相關(guān)的研究成果,包括支持向量機(jī)(support vector machine,SVM)[5-6]、決策樹 和隨機(jī)森林(random forests,RF)[7]、深度置信網(wǎng)絡(luò)(deep belief network,DBN)[8-10]、卷積神 經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[11-12]以及長(zhǎng)短期記憶網(wǎng)絡(luò)[13]等。
但是,電力系統(tǒng)在絕大多數(shù)情況下處于正常運(yùn)行的狀態(tài),繼電保護(hù)裝置日趨完善,暫態(tài)失穩(wěn)情況極少,給通過(guò)數(shù)據(jù)挖掘方法來(lái)進(jìn)行暫態(tài)穩(wěn)定預(yù)測(cè)帶來(lái)極大的挑戰(zhàn)。其次,對(duì)失穩(wěn)樣本的漏判與對(duì)穩(wěn)定樣本的誤判代價(jià)往往不同,在實(shí)際應(yīng)用中,更為關(guān)注失穩(wěn)樣本。為解決這一矛盾,在算法層面,文獻(xiàn)[14]提出一種代價(jià)敏感的暫態(tài)穩(wěn)定評(píng)估方法,在損失函數(shù)中增加對(duì)失穩(wěn)樣本漏判的權(quán)重系數(shù),改善了模型訓(xùn)練結(jié)果的傾向性情況,但是穩(wěn)定樣本的誤判率也會(huì)隨之提高。文獻(xiàn)[15-16]在模型訓(xùn)練過(guò)程中采用焦點(diǎn)損失函數(shù),對(duì)重疊區(qū)域的難分類樣本進(jìn)行處理,提高了暫態(tài)穩(wěn)定評(píng)估全局準(zhǔn)確率。文獻(xiàn)[17]采用2 個(gè)DBN,將判別結(jié)果不一致的樣本劃分為不確定樣本,減少了對(duì)失穩(wěn)樣本的漏判,但是隨著評(píng)估結(jié)果的細(xì)致化,響應(yīng)時(shí)間也隨之增加。在數(shù)據(jù)層面,文獻(xiàn)[18]采用自適應(yīng)合成抽樣(adaptive synthetic sampling,ADASYN)和降噪自編碼器相結(jié)合的方式改善樣本不均衡情況,但其樣本數(shù)量有限,缺乏說(shuō)服力。文獻(xiàn)[19]基于改進(jìn)條件生成對(duì)抗網(wǎng)絡(luò)(conditional generative adversarial network,CGAN)對(duì)樣本進(jìn)行增強(qiáng),提升了暫態(tài)穩(wěn)定評(píng)估的正確率,但是網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化后的繼承性并未研究。針對(duì)拓?fù)浣Y(jié)構(gòu)改變前訓(xùn)練模型在拓?fù)渥兓蠛芸赡懿辉龠m用,文獻(xiàn)[20]提出一種最小均衡樣本集的變步長(zhǎng)生成方法對(duì)預(yù)訓(xùn)練模型進(jìn)行遷移,但是當(dāng)系統(tǒng)規(guī)模增加、線路條數(shù)增多時(shí),均衡樣本集的搜索將耗費(fèi)大量時(shí)間。文獻(xiàn)[21]針對(duì)故障發(fā)生前的動(dòng)態(tài)安全穩(wěn)定評(píng)估問(wèn)題,將在一種預(yù)想故障集下得到的模型遷移至多種預(yù)想故障集,有效提高了預(yù)測(cè)效率和預(yù)測(cè)精度。文獻(xiàn)[22]采用增量學(xué)習(xí)和遷移學(xué)習(xí)方法解決了電力系統(tǒng)過(guò)渡階段的樣本匱乏問(wèn)題。
為了彌補(bǔ)上述研究中存在的不足,同時(shí)考慮樣本不均衡特性和模型的自適應(yīng)性,本文提出了一種基于改進(jìn)深度卷積生成對(duì)抗網(wǎng)絡(luò)(deep convolutional generative adversarial network,DCGAN)的穩(wěn)定評(píng)估方法。設(shè)計(jì)了由CNN 構(gòu)成的生成器和判別器結(jié)構(gòu),使用Wasserstein 距離替換原模型中的損失函數(shù)并引入譜歸一化,得到穩(wěn)定的網(wǎng)絡(luò)結(jié)構(gòu),生成符合真實(shí)失穩(wěn)樣本分布的增強(qiáng)樣本,解決了樣本不均衡問(wèn)題。拓?fù)浣Y(jié)構(gòu)變化時(shí),采用樣本遷移、模型微調(diào)和改進(jìn)DCGAN 增強(qiáng)技術(shù),解決了遷移學(xué)習(xí)的樣本選擇和生成的問(wèn)題,實(shí)現(xiàn)了電力系統(tǒng)暫態(tài)穩(wěn)定增強(qiáng)型自適應(yīng)評(píng)估。
生成對(duì) 抗網(wǎng)絡(luò)是由Goodfellow[23]在2014 年 提出的。它是一種無(wú)監(jiān)督學(xué)習(xí)算法,其基本結(jié)構(gòu)見附錄A 圖A1。
DCGAN 將CNN 和生成對(duì)抗網(wǎng)絡(luò)進(jìn)行結(jié)合。把反卷積網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)分別引入到生成器G和判別器J中進(jìn)行無(wú)監(jiān)督的訓(xùn)練,利用CNN 強(qiáng)大的特征提取能力來(lái)提高生成網(wǎng)絡(luò)的學(xué)習(xí)效果。DCGAN 的訓(xùn)練過(guò)程是一個(gè)二元零和博弈問(wèn)題[24]。博弈過(guò)程中的損失函數(shù)如式(1)所示。
式中:z為真實(shí)的輸入樣本;υ為生成器輸入的噪聲數(shù)據(jù);Pr為概率分布;Pυ為υ的概率分布;Ez~Pr(J(z))和Eυ~Pυ(J(G(υ)))分別為輸入樣本和噪聲的期望值。
通過(guò)不斷博弈抗衡,生成器可以有效地提高自身的失穩(wěn)樣本生成能力,學(xué)習(xí)到原始數(shù)據(jù)的分布,可視為一種能夠用于數(shù)據(jù)合成的非線性插值方法,適合解決基于機(jī)器學(xué)習(xí)的電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)測(cè)樣本不平衡問(wèn)題。
傳統(tǒng)DCGAN 采用的是JS(Jensen-Shannon)散度,在對(duì)抗訓(xùn)練的過(guò)程中,容易發(fā)生梯度消失、模式崩潰等問(wèn)題[25],而本文使用Wasserstein 距離替代JS散度作為優(yōu)化目標(biāo),引入梯度懲罰項(xiàng),大幅提升訓(xùn)練的穩(wěn)定性。
Wasserstein 距離的定義如式(2)所示。
式中:W(Pr,Pg)為Wasserstein 距離;y為樣本;Pg為概率分布;Π(Pr,Pg)為Pr和Pg的聯(lián)合概率分布集合;δ為Π(Pz,Py)中的元素;E(z,y)~δ(||z-y||)為樣本對(duì)距離的期望值,在所有可能的聯(lián)合概率分布中能夠?qū)@個(gè)期望值取到下界inf 就是Wasserstein 距離。
根據(jù)Kantorovich-Rubinstein 定律[26],Wasserstein距離的求解一般采用其對(duì)偶形式,如式(3)所示。
式中:f(z)為判別器的映射函數(shù);||f(z)||L為f(z)的L范數(shù);k為L(zhǎng)ipschitz 常數(shù),||f(z)||L≤k表示函數(shù)f(z)滿足k-Lipschitz 連續(xù)條件。
2.1節(jié)中為了滿足Lipschitz 連續(xù)性的條件約束,規(guī)定參數(shù)矩陣中的元素不得大于k值,這種方法簡(jiǎn)單有效,但是也導(dǎo)致參數(shù)矩陣的結(jié)構(gòu)不穩(wěn)定。而譜歸一化能夠在滿足Lipschitz 連續(xù)性的條件下,維持參數(shù)矩陣的穩(wěn)定。
對(duì)于多層神經(jīng)網(wǎng)絡(luò)而言,其輸入和輸出的關(guān)系如式(4)所示。
式中:xn、wn、bn分別為神經(jīng)網(wǎng)絡(luò)第n層的輸出、權(quán)重以及偏置;an(·)為激活函數(shù),可以采用ReLu 或者Leakey ReLu 函數(shù)。
為了便于推導(dǎo),省去偏置bn,則式(4)可表示為:
式中:Hn為對(duì)角矩陣,用來(lái)表示激活函數(shù)的作用。多層網(wǎng)絡(luò)的輸出關(guān)系如式(6)所示。
在滿足Lipschitz 連續(xù)條件時(shí)對(duì)f(x)的梯度?x(f(x))提出了新的要求,如式(7)所示。
式中:||·||2為譜范數(shù)。
σ(w)為矩陣w的最大奇異值。對(duì)于對(duì)角矩陣H,有σ(H)=max(h1,h2,…,hn),其 中h1,h2,…,hn為H的奇異值。因此式(7)可以寫成:
為了讓f(x)滿足Lipschitz 連續(xù)性的約束,需要對(duì)其梯度進(jìn)行歸一化處理,如式(9)所示。
由此可知,只要讓參數(shù)矩陣中的每個(gè)元素除以其譜范數(shù),即譜歸一化,就可以滿足Lipschitz 連續(xù)性的約束,此時(shí)Lipschitz 常數(shù)為1,從而解決了因直接限制參數(shù)帶來(lái)的波動(dòng)問(wèn)題。在算法實(shí)現(xiàn)時(shí),采用冪迭代法求解w的奇異值,可以減少計(jì)算資源的消耗。
暫態(tài)功角穩(wěn)定的實(shí)質(zhì)是發(fā)電機(jī)能否保持同步運(yùn)行。文獻(xiàn)[27]的研究結(jié)果表明,發(fā)電機(jī)的功角軌跡幾何特征具有集束性和趨同性,能夠清晰地反映系統(tǒng)的穩(wěn)定特性,并且輸入維度不會(huì)隨著系統(tǒng)規(guī)模的擴(kuò)大而增加,有利于后續(xù)遷移方案的實(shí)施。因此,本文選取故障切除后發(fā)電機(jī)的功角軌跡簇特征作為模型的輸入,其詳細(xì)的定義見附錄A 表A1。
基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評(píng)估方法,在離線訓(xùn)練時(shí)往往是針對(duì)特定拓?fù)浣Y(jié)構(gòu)進(jìn)行的。而當(dāng)拓?fù)浣Y(jié)構(gòu)或運(yùn)行方式發(fā)生較大變化時(shí),針對(duì)拓?fù)渥兓坝?xùn)練得到的分類模型很可能不再適用。實(shí)際電網(wǎng)規(guī)模十分龐大,重新生成用于模型訓(xùn)練的樣本集并訓(xùn)練得到適用于當(dāng)前拓?fù)涞姆诸惸P?,往往非常耗時(shí)。因此,本文通過(guò)遷移學(xué)習(xí)微調(diào)(fine-tuning)原分類模型的參數(shù),使其能夠在新的運(yùn)行方式下仍然具有較好的評(píng)估效果。參數(shù)微調(diào)是遷移學(xué)習(xí)的一種手段,將源域中訓(xùn)練好的原模型的網(wǎng)絡(luò)結(jié)構(gòu)和所有參數(shù)全部遷移至新的模型,即作為目標(biāo)域下新模型的初始值,可減少分類模型的訓(xùn)練時(shí)間。在上述模型遷移的基礎(chǔ)上,利用目標(biāo)域下的新訓(xùn)練集微調(diào)網(wǎng)絡(luò),快速得到適用于目標(biāo)域的分類模型。以DBN 為例,其模型遷移及微調(diào)過(guò)程見附錄A 圖A2。
遷移方案的實(shí)施離不開目標(biāo)域下的新樣本集,為了減少目標(biāo)域下的樣本生成時(shí)間,文獻(xiàn)[20]提出了一種最小均衡樣本集的生成方法。文獻(xiàn)[28]采用關(guān)鍵故障持續(xù)時(shí)間原則和關(guān)鍵故障位置原則生成新樣本,但是隨著實(shí)際系統(tǒng)規(guī)模的增加和線路條數(shù)的增多,目標(biāo)域樣本集的數(shù)量也會(huì)大大增加,不利于遷移方案的實(shí)施。因此針對(duì)目標(biāo)系統(tǒng),本文首先隨機(jī)快速生成少量的樣本,然后考慮到源域系統(tǒng)運(yùn)行時(shí)間較長(zhǎng),積累了大量的暫態(tài)穩(wěn)定樣本數(shù)據(jù),再利用樣本遷移將源系統(tǒng)中的數(shù)據(jù)處理后應(yīng)用于目標(biāo)域系統(tǒng)。從源系統(tǒng)中選擇可遷移的樣本是一個(gè)樣本距離排序問(wèn)題,其計(jì)算公式如式(10)所示。
式中:DT為可遷移的樣本集;CE(Z,l,T)為歐氏距離計(jì)算函數(shù);Z為源域樣本的輸入特征;l為源域樣本的標(biāo)簽;θ為預(yù)設(shè)值;T為目標(biāo)域少量樣本集。
當(dāng)樣本集符合所有元素和目標(biāo)域樣本集的最大歐氏距離小于閾值時(shí),該樣本集為可遷移樣本集。將DT和在線生成的少量樣本集合并,考慮到源域系統(tǒng)以及目標(biāo)域系統(tǒng)的樣本不均衡導(dǎo)致模型更新過(guò)程中的傾向性問(wèn)題,通過(guò)改進(jìn)DCGAN 對(duì)失穩(wěn)樣本進(jìn)行增強(qiáng),最終得到正負(fù)均衡的樣本集對(duì)原模型進(jìn)行微調(diào),得到適用于目標(biāo)域系統(tǒng)的暫態(tài)穩(wěn)定預(yù)測(cè)模型,有效地解決了遷移學(xué)習(xí)的樣本生成耗時(shí)和樣本選擇問(wèn)題。樣本遷移及增強(qiáng)的過(guò)程如圖1 所示。
圖1 樣本遷移及增強(qiáng)過(guò)程示意圖Fig.1 Schematic diagram of sample transfer and enhancement process
為了解決暫態(tài)穩(wěn)定評(píng)估中樣本不均衡以及遷移學(xué)習(xí)樣本的選擇和生成問(wèn)題,本文提出了一種基于改進(jìn)DCGAN 的暫態(tài)穩(wěn)定增強(qiáng)型自適應(yīng)評(píng)估方法,包括離線數(shù)據(jù)增強(qiáng)訓(xùn)練、模型更新增強(qiáng)遷移、在線評(píng)估這3 個(gè)部分,如圖2 所示。
圖2 增強(qiáng)型自適應(yīng)評(píng)估過(guò)程Fig.2 Enhanced adaptive assessment process
1)離線數(shù)據(jù)增強(qiáng)訓(xùn)練
步驟1:由于歷史運(yùn)行樣本數(shù)量有限,主要借助時(shí)域仿真生成大量樣本并貼上對(duì)應(yīng)的標(biāo)簽。對(duì)故障切除后的發(fā)電機(jī)功角提取27 個(gè)軌跡簇特征,并對(duì)其進(jìn)行最大、最小歸一化處理。
步驟2:將預(yù)處理完后的樣本按一定的比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。根據(jù)預(yù)訓(xùn)練模型在驗(yàn)證集上的性能選擇合適的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),測(cè)試集在整個(gè)訓(xùn)練過(guò)程中是未知的,僅用于模型最終性能的測(cè)試。
步驟3:從訓(xùn)練集中篩選出失穩(wěn)樣本,生成器和判別器采用交替對(duì)抗訓(xùn)練的方式,在每次訓(xùn)練中先訓(xùn)練5 次判別器,再訓(xùn)練1 次生成器。生成器的輸入為滿足高斯分布的噪聲數(shù)據(jù)υ(維度等于100),每迭代1 次即可生成1 組增強(qiáng)失穩(wěn)樣本,將其和真實(shí)失穩(wěn)樣本一起作為判別器的輸入,根據(jù)式(3)計(jì)算損失函數(shù)值,采用變步長(zhǎng)自適應(yīng)學(xué)習(xí)率的Adam 優(yōu)化算法對(duì)改進(jìn)DCGAN 模型的網(wǎng)絡(luò)權(quán)重和偏置進(jìn)行更新,初始學(xué)習(xí)率為0.000 2。采用增強(qiáng)訓(xùn)練后的分類模型對(duì)驗(yàn)證集性能進(jìn)行評(píng)價(jià),選取綜合指標(biāo)值最高的生成樣本集增強(qiáng)到原始訓(xùn)練集中,從而得到正、負(fù)樣本均衡的訓(xùn)練集對(duì)暫穩(wěn)評(píng)估模型進(jìn)行訓(xùn)練。
2)模型更新增強(qiáng)遷移
步驟1:當(dāng)系統(tǒng)發(fā)生一些預(yù)料之外的變化時(shí),針對(duì)目標(biāo)域系統(tǒng)快速生成少量樣本,并對(duì)這些樣本進(jìn)行預(yù)處理。根據(jù)式(10)計(jì)算源系統(tǒng)中的訓(xùn)練集和目標(biāo)域樣本集的距離并排序,根據(jù)需要選擇合適的閾值θ,從而確定可遷移的樣本,其和目標(biāo)域的樣本集一起構(gòu)成遷移樣本集。
步驟2:采用改進(jìn)DCGAN 方法對(duì)遷移樣本集中的失穩(wěn)樣本進(jìn)行數(shù)據(jù)增強(qiáng),同樣選取綜合指標(biāo)值最高的生成樣本增強(qiáng)到遷移樣本集上,得到均衡的增強(qiáng)遷移樣本集。利用模型遷移將源系統(tǒng)訓(xùn)練好的分類模型遷移至目標(biāo)域并對(duì)其參數(shù)進(jìn)行微調(diào),得到適用于當(dāng)前運(yùn)行方式并更新好的模型。
3)在線評(píng)估
在線應(yīng)用時(shí),讀取實(shí)時(shí)同步相量測(cè)量單元(synchrophasor measurement unit,PMU)數(shù)據(jù),采用基于可信度的分層實(shí)時(shí)預(yù)測(cè)[9]和樣本增強(qiáng)相結(jié)合的方法,進(jìn)行暫態(tài)穩(wěn)定動(dòng)態(tài)實(shí)時(shí)評(píng)估。
暫態(tài)穩(wěn)定是一個(gè)典型的非平衡分類[29]問(wèn)題,穩(wěn)定樣本的標(biāo)簽為(1,0),失穩(wěn)樣本的標(biāo)簽為(0,1)。仿真時(shí)間內(nèi),任意2 臺(tái)發(fā)電機(jī)的轉(zhuǎn)角差大于360°的樣本為失穩(wěn)樣本,反之則為穩(wěn)定樣本。采用2×2 混淆矩陣評(píng)價(jià)算法得到的分類效果,如表1 所示。其中μs和γus分別為穩(wěn)定樣本被正確或錯(cuò)誤預(yù)測(cè)的數(shù)目,μus和γs分別為不穩(wěn)定樣本被正確或錯(cuò)誤預(yù)測(cè)的數(shù)目。特別是在電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)測(cè)問(wèn)題中,更關(guān)注失穩(wěn)樣本。
表1 統(tǒng)計(jì)結(jié)果Table 1 Statistical results
評(píng)價(jià)指標(biāo)包括分類準(zhǔn)確率Acc(正確預(yù)測(cè)的樣本占所有樣本的比例)、穩(wěn)定樣本識(shí)別準(zhǔn)確率ηSR(正確判斷為穩(wěn)定的樣本占所有穩(wěn)定樣本的比例)、失穩(wěn)樣本識(shí)別準(zhǔn)確率ηUR(正確判斷為失穩(wěn)的樣本占所有失穩(wěn)樣本的比例),以及綜合指標(biāo)Omean(ηSR和ηUR的幾何平均數(shù)),具體計(jì)算公式分別如式(11)至式(14)所示。
為了驗(yàn)證本文所提增強(qiáng)型自適應(yīng)評(píng)估方法的有效性,在Tensorflow1.13 環(huán)境下搭建改進(jìn)DCGAN模型,基本結(jié)構(gòu)和參數(shù)設(shè)置見附錄B 圖B1 及表B1。PC 配置為:Intel Core i7-8565u CPU、8GB RAM,編程語(yǔ)言為Python。使用MATLAB 工具箱中Power System Too(lPST)3.0 進(jìn)行暫態(tài)穩(wěn)定樣本批仿真。算例系統(tǒng)采用IEEE 39 節(jié)點(diǎn)系統(tǒng)以及IEEE 140 節(jié)點(diǎn)系統(tǒng)。
IEEE 39 節(jié)點(diǎn)系統(tǒng)包含10 臺(tái)發(fā)電機(jī)、39 條母線和46 條線路。考慮在75%~120%負(fù)荷水平范圍內(nèi)以5%為變化步長(zhǎng)生成10 種負(fù)荷水平;在不含有變壓器的線路上設(shè)置故障,以10%為變化步長(zhǎng)在每條線路的0%~90%區(qū)間設(shè)置故障點(diǎn),故障類型設(shè)為最為嚴(yán)重的三相短路故障;故障清除時(shí)間考慮故障后0.016~0.183 s,以0.016 s 為變化步長(zhǎng)的11 種故障切除時(shí)間,仿真時(shí)間為5 s,總共生成37 400 個(gè)樣本。
IEEE 140 節(jié)點(diǎn)系統(tǒng)包含48 臺(tái)發(fā)電機(jī)、140 條母線和233 條線路,系統(tǒng)頻率為60 Hz。負(fù)荷水平依然是在75%~120%負(fù)荷水平范圍內(nèi),以5%為變化步長(zhǎng);故障清除時(shí)間考慮故障后0.083 s 清除近端故障,0.100 s 清除遠(yuǎn)端故障或者0.150 s 清除近端故障,0.167 s 清除遠(yuǎn)端故障,共生成25 045 個(gè)有效樣本。
上述樣本集覆蓋了電力系統(tǒng)可能的典型運(yùn)行工況,對(duì)分析暫態(tài)穩(wěn)定評(píng)估問(wèn)題而言是充足有效的。為模擬實(shí)際系統(tǒng)中失穩(wěn)樣本稀少的情況,隨機(jī)剔除部分失穩(wěn)樣本,保證總樣本數(shù)目和失穩(wěn)樣本數(shù)目的比例約為20∶1[30]。按3∶1∶1 劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集,各集合中穩(wěn)定、失穩(wěn)樣本的組成如表2所示。
表2 不同算例系統(tǒng)樣本集合的構(gòu)成Table 2 Composition of sample sets for different case systems
為了分析DCGAN 的改進(jìn)效果,以IEEE 39 節(jié)點(diǎn)系統(tǒng)為例,判別器和生成器的損失函數(shù)隨迭代次數(shù)的變化如圖3 所示。
圖3 改進(jìn)前后損失值的變化Fig.3 Change of loss value before and after improvement
從圖3 可以看出,改進(jìn)前采用JS 距離作為損失函數(shù),DCGAN 模型存在梯度消失和模式坍塌問(wèn)題,生成器和判別器訓(xùn)練過(guò)程中參數(shù)值難以穩(wěn)定,波動(dòng)較大,沒(méi)有收斂的趨勢(shì),此種現(xiàn)象難以訓(xùn)練出高質(zhì)量的增強(qiáng)失穩(wěn)樣本。而采用Wasserstein 距離對(duì)損失函數(shù)進(jìn)行改進(jìn)后,在迭代35 次以后,訓(xùn)練過(guò)程整體呈穩(wěn)定趨勢(shì),波動(dòng)幅度較小。說(shuō)明損失函數(shù)采用Wasserstein 距離比JS 距離在訓(xùn)練過(guò)程中更加穩(wěn)定,效果更好。進(jìn)一步對(duì)卷積層的參數(shù)進(jìn)行譜歸一化,在第10 次迭代時(shí)就可以保持穩(wěn)定,無(wú)大幅振蕩現(xiàn)象,并且其生成器的損失值最小,在0 附近波動(dòng),說(shuō)明改進(jìn)DCGAN 不斷逼近真實(shí)失穩(wěn)樣本的分布,從而驗(yàn)證了改進(jìn)DCGAN 的有效性。
為了進(jìn)一步說(shuō)明生成失穩(wěn)樣本和真實(shí)失穩(wěn)樣本之間的關(guān)系,使用弗雷歇距離(Frechet inception distance,F(xiàn)ID)來(lái)評(píng)價(jià)生成失穩(wěn)樣本和真實(shí)失穩(wěn)樣本分布間的相似度。FID 因考慮了路徑空間距離,所以對(duì)有一定空間時(shí)序性的曲線進(jìn)行相似度評(píng)價(jià)更具有原則性和綜合性。發(fā)電機(jī)功角動(dòng)態(tài)軌跡曲線具有時(shí)序性,因此采用FID 來(lái)評(píng)價(jià)生成樣本和真實(shí)樣本分布的相似度是合理的。IEEE 39 節(jié)點(diǎn)系統(tǒng)和IEEE 140 節(jié)點(diǎn)系統(tǒng)在采用DCGAN 改進(jìn)前后的FID 如表3 所示。FID 越小,表明樣本分布間的相似度越高,采用改進(jìn)DCGAN 后的FID 相較于改進(jìn)前有明顯的降低,分別降低了大約23.1%和41.3%,進(jìn)一步驗(yàn)證了改進(jìn)后的DCGAN 在提升生成失穩(wěn)樣本質(zhì)量上的有效性。
表3 改進(jìn)前后FID 對(duì)比Table 3 Comparison of FID before and after improvement
為了分析基于改進(jìn)DCGAN 的數(shù)據(jù)增強(qiáng)方法應(yīng)用于電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)測(cè)樣本不均衡問(wèn)題的效果,采用隨機(jī)過(guò)采樣(random oversampling,ROS)、合成少數(shù)類過(guò)采樣(synthetic minority oversampling,SMOTE)和自適 應(yīng)合成抽樣(adaptive synthetic sampling,ADASYN)這3 種常用的數(shù)據(jù)增強(qiáng)算法與其進(jìn)行對(duì)照,所有算法都設(shè)定為增強(qiáng)訓(xùn)練集中穩(wěn)定樣本數(shù)目等于失穩(wěn)樣本數(shù)目,因此采用改進(jìn)DCGAN 生成失穩(wěn)樣本的數(shù)目等于原始訓(xùn)練集中穩(wěn)定樣本數(shù)目減去失穩(wěn)樣本數(shù)目。分類模型采用RF 和DBN,RF 采用90 棵樹進(jìn)行集成,DBN各層神經(jīng)元的結(jié)構(gòu)為[27,200,100,50,30,2]。本文樣本的采樣時(shí)間間隔為0.016 s,以故障切除后第0.166 s 的數(shù)據(jù)集為例進(jìn)行分析和驗(yàn)證,表4 和表5給出了算法在不同模型及不同算例系統(tǒng)上的測(cè)試效果。
從表4 和表5 可以看出,由于原始訓(xùn)練集中失穩(wěn)樣本極少,導(dǎo)致模型對(duì)失穩(wěn)樣本的識(shí)別率ηUR很低。采用不同的數(shù)據(jù)增強(qiáng)算法均能在一定程度上改善模型的ηUR指標(biāo),而基于改進(jìn)DCGAN 的數(shù)據(jù)增強(qiáng)算法相比于傳統(tǒng)方法擁有更高的可靠性、更大的Omean和預(yù)測(cè)準(zhǔn)確率,同時(shí)保證了對(duì)穩(wěn)定樣本的識(shí)別率不至于太低。以DBN 為例,2 個(gè)算例系統(tǒng)在增強(qiáng)后的訓(xùn)練集比原始數(shù)據(jù)的ηUR分別提高了6.74%和8.58%,Omean分別提高了3.04% 和2.98%。這表明改進(jìn)DCGAN 合成的失穩(wěn)樣本和真實(shí)失穩(wěn)樣本的分布更相近,提高了對(duì)失穩(wěn)樣本的識(shí)別準(zhǔn)確率,實(shí)現(xiàn)了小樣本在分類器中的穩(wěn)定訓(xùn)練。
表4 IEEE 39 節(jié)點(diǎn)系統(tǒng)各種數(shù)據(jù)增強(qiáng)算法性能對(duì)比Table 4 Performance comparison of various data enhancement algorithms in IEEE 39-bus system
表5 IEEE 140 節(jié)點(diǎn)系統(tǒng)各種數(shù)據(jù)增強(qiáng)算法性能對(duì)比Table 5 Performance comparison of various data enhancement algorithms in IEEE 140-bus system
為了進(jìn)一步分析不同數(shù)據(jù)增強(qiáng)算法的效果,將各類算法的合成樣本采用t 分布隨機(jī)近鄰嵌入(tdistributed stochastic neighbor embedding,t-SNE)[31]工具降維到二維平面上進(jìn)行可視化。從圖4 可以看出,ROS 僅僅是將少數(shù)類的失穩(wěn)樣本進(jìn)行簡(jiǎn)單的復(fù)制以增加失穩(wěn)樣本的數(shù)目,樣本間大量的重疊,容易造成過(guò)擬合問(wèn)題。SMOTE 是基于線性插值的方法,在2 個(gè)失穩(wěn)樣本連線上隨機(jī)選取1 個(gè)點(diǎn)作為新的少數(shù)類樣本。ADASYN 在最近鄰分類器被錯(cuò)分類的原始樣本附近生成新的少數(shù)類樣本,自適應(yīng)合成靠近穩(wěn)定邊界的樣本,所以增強(qiáng)效果略優(yōu)于SMOTE。改進(jìn)DCGAN 并不是對(duì)原始樣本簡(jiǎn)單的復(fù)制與拼接,是一種基于分布的學(xué)習(xí)算法,學(xué)習(xí)到了真實(shí)的樣本分布規(guī)律,在狀態(tài)空間中生成了全新有效的新樣本作為原始樣本的補(bǔ)充。從增強(qiáng)后的評(píng)估性能來(lái)看,在4 種數(shù)據(jù)增強(qiáng)算法中,改進(jìn)DCGAN 的可靠性、Omean及Acc均最高,有效減少了對(duì)失穩(wěn)樣本的漏判。因此從數(shù)據(jù)合成方式和合成性能上比較,改進(jìn)DCGAN 更加適用于電力系統(tǒng)的失穩(wěn)樣本均衡問(wèn)題。
圖4 不同數(shù)據(jù)增強(qiáng)算法樣本分布對(duì)比Fig.4 Comparison of sample distribution with different data enhancement algorithms
在4.3 節(jié)中,源系統(tǒng)已經(jīng)訓(xùn)練出性能較好的暫態(tài)穩(wěn)定預(yù)測(cè)模型。當(dāng)系統(tǒng)拓?fù)浣Y(jié)構(gòu)或運(yùn)行方式發(fā)生較大變化時(shí),采用樣本遷移和改進(jìn)DCGAN 增強(qiáng)技術(shù),解決遷移學(xué)習(xí)樣本選擇和生成問(wèn)題??紤]分類模型的性能以及模型遷移的便捷性,本節(jié)分類模型采用DBN。
4.4.1 拓?fù)渥兓碌倪w移
針對(duì)IEEE 39 節(jié)點(diǎn)系統(tǒng),為了模擬系統(tǒng)實(shí)際運(yùn)行中不在調(diào)度人員預(yù)知范圍內(nèi)的變化,對(duì)其拓?fù)浣Y(jié)構(gòu)和運(yùn)行方式進(jìn)行修改,新增3 個(gè)目標(biāo)系統(tǒng),其拓?fù)渥兓胺抡嬖O(shè)置如表6 所示。
表6 源系統(tǒng)和目標(biāo)系統(tǒng)的仿真設(shè)置Table 6 Simulation settings of source system and target systems
針對(duì)不同的目標(biāo)系統(tǒng),隨機(jī)快速生成100 個(gè)樣本作為目標(biāo)域少量訓(xùn)練樣本集,其余3 200 個(gè)樣本作為測(cè)試集。設(shè)置合適的θ保證從源系統(tǒng)中遷移的樣本數(shù)為1 000,實(shí)際應(yīng)用中可以根據(jù)具體需求選擇θ。將遷移前、遷移樣本集微調(diào)模型以及本文所提的增強(qiáng)遷移樣本集微調(diào)模型效果進(jìn)行對(duì)比,測(cè)試結(jié)果如表7 所示。從表7 可以看出,由于拓?fù)渥兓蟮臉颖炯驮P偷挠?xùn)練集不再是同分布的,因此直接使用拓?fù)渥兓暗哪P瓦M(jìn)行評(píng)估,性能有所下降。采用樣本遷移微調(diào)原模型使得Acc得到了有效的提高,但是由于遷移樣本集中失穩(wěn)樣本極少,導(dǎo)致在微調(diào)過(guò)程中對(duì)失穩(wěn)樣本的學(xué)習(xí)不足,ηUR低于88%,無(wú)法進(jìn)行在線應(yīng)用。而采用改進(jìn)DCGAN 對(duì)遷移樣本集中的失穩(wěn)樣本進(jìn)行增強(qiáng),ηUR指標(biāo)相比于遷移前最高提升了6.23%,同時(shí)Omean和Acc均保持在95%以上,實(shí)現(xiàn)了拓?fù)浣Y(jié)構(gòu)變化情況下的暫態(tài)穩(wěn)定增強(qiáng)型自適應(yīng)評(píng)估。
表7 不同遷移方案性能對(duì)比Table 7 Performance comparison of different transfer schemes
將采用改進(jìn)DCGAN 合成失穩(wěn)樣本的時(shí)間和采用傳統(tǒng)方法[21]通過(guò)時(shí)域仿真延長(zhǎng)故障切除時(shí)間生成失穩(wěn)樣本的時(shí)間進(jìn)行對(duì)比,結(jié)果如表8 所示。
表8 樣本生成時(shí)間對(duì)比Table 8 Comparison of sample generation time
從表8 可以看出,采用改進(jìn)DCGAN 生成增強(qiáng)失穩(wěn)樣本的時(shí)間為2 min 左右,而時(shí)域仿真法生成同樣數(shù)量的樣本需1 h 左右,樣本生成效率提高了30 倍,顯著減少了遷移學(xué)習(xí)過(guò)程中在線樣本生成的時(shí)間,這對(duì)暫態(tài)穩(wěn)定自適應(yīng)評(píng)估的在線應(yīng)用至關(guān)重要;其次,改進(jìn)DCGAN 直接根據(jù)失穩(wěn)樣本的“軌跡簇”特征生成了全新有效的新樣本特征集用于模型更新,省去了樣本處理和特征提取的階段,在線應(yīng)用上具有更大的時(shí)間優(yōu)勢(shì)。
4.4.2 不同系統(tǒng)間的遷移
為了驗(yàn)證本文所提方法在不同系統(tǒng)間進(jìn)行遷移的有效性,定義如下2 種場(chǎng)景。
場(chǎng)景A:將IEEE 39 節(jié)點(diǎn)系統(tǒng)作為源系統(tǒng),IEEE 140 節(jié)點(diǎn)系統(tǒng)作為目標(biāo)系統(tǒng)。目標(biāo)系統(tǒng)少量樣本集的樣本數(shù)為100,測(cè)試集的樣本數(shù)為4 428,遷移樣本數(shù)為1 000。
場(chǎng)景B:將IEEE 140 節(jié)點(diǎn)系統(tǒng)作為源系統(tǒng),IEEE 39 節(jié)點(diǎn)系統(tǒng)作為目標(biāo)系統(tǒng)。目標(biāo)系統(tǒng)少量樣本集的樣本數(shù)為100,測(cè)試集的樣本數(shù)為4 780,遷移樣本數(shù)為1 000。
采用不同方法的遷移測(cè)試結(jié)果如圖5 所示。對(duì)于場(chǎng)景A,相比于遷移前,本文所提方法的預(yù)測(cè)準(zhǔn)確率Acc提高了20.76%,Omean提高了11.79%。對(duì)于場(chǎng)景B,由于樣本不均衡特性導(dǎo)致模型對(duì)失穩(wěn)樣本的識(shí)別率較低,Omean低于60%,而通過(guò)樣本遷移和改進(jìn)DCGAN 增強(qiáng)后,Omean可由57.02% 恢復(fù)至83.45%,提高了26.43%,模型可靠性得到了大幅的改善。
圖5 不同遷移方案性能對(duì)比Fig.5 Performance comparison of different transfer schemes
各階段的耗時(shí)如表9 所示,場(chǎng)景A 下由于源系統(tǒng)樣本數(shù)多于場(chǎng)景B,因此其樣本遷移過(guò)程中的距離計(jì)算耗時(shí)略長(zhǎng)于場(chǎng)景B,而場(chǎng)景A 下所需的增強(qiáng)失穩(wěn)樣本數(shù)目少于場(chǎng)景B,因此其失穩(wěn)樣本增強(qiáng)時(shí)間較少。計(jì)算3 種場(chǎng)景下的總耗時(shí),相比于傳統(tǒng)方法針對(duì)新系統(tǒng)仿真生成大量的樣本集進(jìn)行模型重新訓(xùn)練,本文所提方法的總耗時(shí)在9 min 內(nèi),而暫態(tài)穩(wěn)定預(yù)測(cè)的時(shí)間僅為0.014 ms,能夠滿足時(shí)效性的需求。采用改進(jìn)DCGAN 模型,有效解決了在線樣本生成耗時(shí)的問(wèn)題,使得預(yù)訓(xùn)練模型在短時(shí)間內(nèi)可以在規(guī)模不同的系統(tǒng)間進(jìn)行遷移,大大提高了遷移速度,實(shí)現(xiàn)了不同系統(tǒng)間的暫態(tài)穩(wěn)定增強(qiáng)型自適應(yīng)評(píng)估。
表9 模型各階段耗時(shí)Table 9 Time consumption at each stage
針對(duì)暫態(tài)穩(wěn)定預(yù)測(cè)中穩(wěn)定樣本和失穩(wěn)樣本比例失衡的問(wèn)題,同時(shí)考慮到模型的適用性,本文提出一種基于改進(jìn)DCGAN 的暫態(tài)穩(wěn)定增強(qiáng)型自適應(yīng)評(píng)估方法,在IEEE 39 節(jié)點(diǎn)系統(tǒng)和140 節(jié)點(diǎn)系統(tǒng)進(jìn)行實(shí)驗(yàn)測(cè)試,得到如下結(jié)論:
1)采用Wasserstein 距離作為DCGAN 的損失函數(shù)并對(duì)其參數(shù)進(jìn)行譜歸一化,可以有效解決對(duì)抗訓(xùn)練過(guò)程中的梯度消失和模式崩潰問(wèn)題,使得生成的增強(qiáng)失穩(wěn)樣本能夠有效逼近真實(shí)失穩(wěn)樣本的分布;
2)改進(jìn)DCGAN 的樣本增強(qiáng)效果要優(yōu)于ROS、SMOTE 和ADASYN,在狀態(tài)空間內(nèi)生成了全新有效的新失穩(wěn)樣本作為原始樣本集的補(bǔ)充,有效減少了對(duì)失穩(wěn)樣本的漏判,提高了模型的可靠性;
3)采用樣本遷移和微調(diào)技術(shù),有效解決了在系統(tǒng)拓?fù)渥兓碌臅簯B(tài)穩(wěn)定評(píng)估模型適用性問(wèn)題,進(jìn)一步采用改進(jìn)DCGAN 進(jìn)行失穩(wěn)樣本增強(qiáng),顯著減少了遷移學(xué)習(xí)過(guò)程中在線樣本生成時(shí)間,提高了遷移速度。
由于實(shí)際系統(tǒng)規(guī)模龐大,暫態(tài)穩(wěn)定特性更加復(fù)雜,為了更好地兼顧暫態(tài)穩(wěn)定預(yù)測(cè)的快速性和準(zhǔn)確性,進(jìn)一步將分層實(shí)時(shí)預(yù)測(cè)的方法和改進(jìn)DCGAN的樣本增強(qiáng)方法相結(jié)合,完善電力系統(tǒng)暫態(tài)穩(wěn)定增強(qiáng)自適應(yīng)評(píng)估模型;在實(shí)際交直流大電網(wǎng)上對(duì)所提方法進(jìn)行驗(yàn)證,將是下一步研究工作的重點(diǎn)。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。