馮 昆 徐天奇 李 琰 何兆磊 朱夢(mèng)夢(mèng)
(1.云南省高校電力信息物理融合系統(tǒng)重點(diǎn)實(shí)驗(yàn)室(云南民族大學(xué)) 昆明 650504)
(2.云南電網(wǎng)有限責(zé)任公司計(jì)量中心 昆明 650217)
(3.云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院 昆明 650217)
隨著電網(wǎng)中高鐵、電弧爐等大量非線性負(fù)荷的快速發(fā)展以及大功率電力電子設(shè)備的大規(guī)模使用,使得電網(wǎng)的負(fù)荷端變得日趨復(fù)雜。由此將降低電網(wǎng)的電能質(zhì)量,影響電網(wǎng)運(yùn)行安全。智能電網(wǎng)發(fā)展中的一個(gè)關(guān)鍵挑戰(zhàn)就是提高供電質(zhì)量。電力系統(tǒng)擾動(dòng)的監(jiān)測(cè)和分析對(duì)于查明系統(tǒng)異常運(yùn)行的原因、評(píng)估保護(hù)、制定控制方案以及確保系統(tǒng)快速恢復(fù)非常重要。并且準(zhǔn)確識(shí)別電網(wǎng)中的各類擾動(dòng)是改善電能質(zhì)量的必要前提和基礎(chǔ)[1~3]。
電能質(zhì)量擾動(dòng)的判別通常有特征提取和模式識(shí)別兩個(gè)步驟。需要通過(guò)信號(hào)處理技術(shù)對(duì)原始信號(hào)進(jìn)行初步的分析,將原始信號(hào)分解成若干子信號(hào)對(duì)每個(gè)子信號(hào)進(jìn)行特征提取[4]。主要的方法有模態(tài)分解、傅里葉變換、S 變換、短時(shí)傅里葉變換、小波變換系列等[5]??焖俑道锶~變換FFT(Fast Fourier Transform)通常用來(lái)表征平穩(wěn)信號(hào)的頻譜和諧波,但由于其固定的窗函數(shù),因此不適合識(shí)別非平穩(wěn)信號(hào)特征。短時(shí)傅里葉變換STFT(Short-Time Fourier Transform)的分解效果受窗函數(shù)的影響較大。小波變換WT(Wavelet Transform)是在STFT的基礎(chǔ)上發(fā)展而來(lái),用于改進(jìn)固定分辨率的問(wèn)題[6],但分解效果同樣受所選小波母函數(shù)的影響較大,容易出現(xiàn)模態(tài)混疊現(xiàn)象,影響特征的提取。同步提取變換SET(Synchroextracting Transform)[7]是在同步擠壓變換SST(Synchrosqueezing Transform)基礎(chǔ)上提出來(lái)的一種新的時(shí)頻分析方法。SST 僅考慮頻率/尺度方向上的系數(shù)壓縮,會(huì)出現(xiàn)能量發(fā)散,在噪聲環(huán)境下會(huì)有較大影響,而SET是利用在瞬時(shí)頻率位置的時(shí)頻系數(shù)產(chǎn)生時(shí)頻譜,使其獲得更好的噪聲魯棒性,運(yùn)算速度上也有很大的優(yōu)勢(shì)[8]。
特征提取完后使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)進(jìn)行分類。文獻(xiàn)[9]使用改進(jìn)HHT 和決策樹(shù)進(jìn)行擾動(dòng)信號(hào)的分類,僅實(shí)現(xiàn)了五種單一擾動(dòng)和兩種雙重?cái)_動(dòng)的分類,可識(shí)別的擾動(dòng)類型較少,遠(yuǎn)不能滿足電網(wǎng)的需求,并且在一定程度上受噪聲的影響較大。文獻(xiàn)[10]利用二維灰度圖和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取和分類,但神經(jīng)網(wǎng)絡(luò)在電能質(zhì)量擾動(dòng)識(shí)別中的學(xué)習(xí)速率和分類效果易受網(wǎng)絡(luò)結(jié)構(gòu)、權(quán)值自適應(yīng)算法和噪聲強(qiáng)度的影響,并且僅實(shí)現(xiàn)單一擾動(dòng),難以適應(yīng)復(fù)雜的多重?cái)_動(dòng)。文獻(xiàn)[11]用極大重疊離散小波變換和并行隱馬爾科夫模型進(jìn)行分類識(shí)別,雖然訓(xùn)練時(shí)間較短,但分類準(zhǔn)確率卻很低,并且10類事件類型沒(méi)有考慮噪聲對(duì)分類準(zhǔn)確率的影響。LightGBM(Light Gradient Boosting Machine)是一種boosting集成學(xué)習(xí)算法。在工業(yè)大數(shù)據(jù)應(yīng)用場(chǎng)景中具有運(yùn)算速度快,運(yùn)算效率高的優(yōu)勢(shì),在故障預(yù)測(cè)[12],電動(dòng)機(jī)故障診斷[13~14]等領(lǐng)域已有了很好的應(yīng)用效果。
針對(duì)信號(hào)分解出現(xiàn)的“模態(tài)混疊”和擾動(dòng)識(shí)別種類較少,分類準(zhǔn)確率較低的問(wèn)題,提出了一種基于同步提取變換,復(fù)合多尺度排列熵,PCA(Principal Component Analysis)降維和LightGBM 算法的電能質(zhì)量復(fù)合擾動(dòng)分類方法,首先對(duì)7 種單一擾動(dòng)、6種二重?cái)_動(dòng)進(jìn)行同步提取變換,提取子信號(hào)時(shí)域、頻域特征,及復(fù)合多尺度排列熵變換得到的特征矩陣,對(duì)特征矩陣進(jìn)行PCA 降維以減小運(yùn)算復(fù)雜度。用所構(gòu)造的特征集合訓(xùn)練LightGBM 分類器進(jìn)行分類。與現(xiàn)有的XGBoost,Catboost 和隨機(jī)森林算法進(jìn)行分類準(zhǔn)確率和耗時(shí)比較,驗(yàn)證所提方法的有效性。
假設(shè)一個(gè)信號(hào)s(t) ,其標(biāo)準(zhǔn)表達(dá)式為[15]
式中g(shù)(u-t) 為窗函數(shù)。令gw(u)=g(u-t)·。由Parseval定理,STFT公式可以表示為
信號(hào)s(t)傅里葉變換后為式中的為(gω(u) )傅里葉變換的復(fù)共軛。
使u-t=t′,((u) )的頻域形式則有:
即可得到:
STFT公式乘一相位因子eiωt時(shí),式(4)可表示為
令u-t=τ,則STFT可改寫為
若一信號(hào)的頻率為ω0,其頻域可表示為
將式(7)帶入式(5)中可得到:
由于窗函數(shù)在頻域中是緊支撐的,且在0 頻率處有g(shù)?(ξ)≤g?(0)。因此,在頻譜Ge(t,ω)中當(dāng)ω=ω0時(shí),時(shí)頻系數(shù)具有最大的幅值A(chǔ)·g?( )0 ,STFT 譜中時(shí)頻系數(shù)的立即頻率為
其中,?tGe(t,ω) 是Ge(t,ω) 對(duì)時(shí)間的一階導(dǎo)數(shù)。為了得到精確的立即頻率估計(jì),可進(jìn)行計(jì)算得:
在二維時(shí)頻平面中,可以得到一個(gè)新的時(shí)頻譜ω0(t,ω),并且與STFT 的譜系數(shù)Ge(t,ω)是一一對(duì)應(yīng)的。同步提取變換僅提取STFT譜在瞬時(shí)頻率位置的時(shí)頻系數(shù),公式可表示為
其中δ(ω-ω0(t,ω) )稱為同步提取算子。
為比較說(shuō)明同步提取變換的信號(hào)分解能力,設(shè)置擾動(dòng)信號(hào)包含幅值為1 的50Hz 基波、幅值為0.2的3 次、5 次、7 次、9 次、11 次諧波,并加上30dB 的噪聲分量。
利用CEEMDAN 分解擾動(dòng)信號(hào)如圖1,由圖可知基波信號(hào)被分解到IMF7中。但受到噪聲信號(hào)的干擾,諧波信號(hào)出現(xiàn)了很大程度的變形,難以區(qū)分各次諧波信號(hào),并且虛假分量較多。
經(jīng)實(shí)驗(yàn)對(duì)比,選用“db10”母小波進(jìn)行小波變換六層分解,能較好分離出基波信號(hào),分解擾動(dòng)信號(hào)如圖2。由圖可知IMF1為基波信號(hào),IMF2-IMF4為擾動(dòng)信號(hào)諧波分量,但是出現(xiàn)了嚴(yán)重的“模態(tài)混疊”現(xiàn)象,小波變換在噪聲環(huán)境下難以準(zhǔn)確分解諧波信號(hào),IMF5-IMF6為噪聲分量。
圖2 小波變換分解圖
利用SET 分解擾動(dòng)信號(hào),將分解層數(shù)設(shè)置為6層,窗長(zhǎng)度選為800,分解結(jié)果如圖3,由圖3可以觀察到基波被分解到IMF1 中,諧波信號(hào)被分解至IMF2-IMF6 中,諧波子信號(hào)不存在“模態(tài)混疊”現(xiàn)象,各個(gè)分量分解幅值也較為精準(zhǔn)。由于SET是利用在瞬時(shí)頻率位置的時(shí)頻系數(shù)產(chǎn)生時(shí)頻譜,即使在噪聲背景下,SET仍然有不錯(cuò)的分解質(zhì)量。
圖3 擾動(dòng)信號(hào)SET分解
多尺度排列熵(Multiscale Permutation Entropy,MPE)是一種度量時(shí)間序列復(fù)雜程度的方法,具有非線性單調(diào)變換不變的特點(diǎn),所以適應(yīng)于對(duì)SET分解后的子信號(hào)進(jìn)行時(shí)間復(fù)雜度排列,更好的區(qū)分不同擾動(dòng)信號(hào)的特征。具體步驟如下[16]:
1)將原始信號(hào)的時(shí)間序列{x(i),i=1,2,…,N},粗?;瘯r(shí)間序列通過(guò)式(12)進(jìn)行構(gòu)造:
其中:τ是尺度因子。τ=1時(shí)粗?;蛄袨樾盘?hào)的原時(shí)間序列;τ>1 時(shí)原始時(shí)間序列被粗?;砷L(zhǎng)度為p=[]的τ個(gè)粗粒化序列,…,[·]表示取整。
2)計(jì)算每個(gè)尺度因子τ下的排列熵值,得到給定的所有尺度因子的排列熵值。若尺度因子較大,原始序列長(zhǎng)度較小,粗?;蛄械拈L(zhǎng)度則相對(duì)較小,在尺度較大時(shí),時(shí)間序列的所包含的信息則會(huì)減少。排列熵值越小,則表明原始信號(hào)時(shí)間序列越規(guī)整。
CMPE(Composite Multiscale Permutation Entropy)將MPE 的單一粗?;倪M(jìn)為復(fù)合粗粒化。其具體計(jì)算步驟如下[17]:
1)序列{x(i),i=1,2,…,N}通過(guò)式(13)定義粗?;蛄屑矗?/p>
表示尺度因子τ下的第k個(gè)粗?;蛄校琷表示的第j個(gè)點(diǎn)。
2)對(duì)于尺度因子τ,計(jì)算該尺度因子下每個(gè)粗粒序列的排列熵(PE),再對(duì)τ個(gè)PE 值求平均,則得到CMPE在尺度因子τ下的值,即:
式中m為嵌入維數(shù);λ為延遲時(shí)間。
圖4 為原始信號(hào)時(shí)間序列被分為兩個(gè)粗?;瘯r(shí)間序列。
圖4 第二尺度因子下的粗?;^(guò)程
除復(fù)合多尺度排列熵外本文還對(duì)SET 分解后的子信號(hào)提取最大值、最小值、峰值、峰峰值、均值、平均幅值、方根幅值、方差、標(biāo)準(zhǔn)差、有效值、峭度、偏度、波形因子、峰值因子、脈沖因子、裕度因子、余隙因子中心頻率、小波能量比、過(guò)零點(diǎn)次數(shù)、希爾伯特變換后的瞬時(shí)幅值曲線能量、希爾伯特變換后的瞬時(shí)幅值曲線標(biāo)準(zhǔn)差、希爾伯特變換后的瞬時(shí)頻率曲線標(biāo)準(zhǔn)差、與標(biāo)準(zhǔn)信號(hào)分解的子信號(hào)能量分布的差異、總諧波畸變率、小波尺度熵、小波奇異熵。利用這些特征構(gòu)造信號(hào)的特征集。
傳統(tǒng)的boosting集成學(xué)習(xí)算法能提高單個(gè)模型的分類準(zhǔn)確率和模型的泛化能力,具有訓(xùn)練效果好,不易過(guò)擬合等優(yōu)點(diǎn)。但是在每一次的迭代運(yùn)算中都需要遍歷訓(xùn)練數(shù)據(jù)多次,增加了模型訓(xùn)練的時(shí)間,因此難以適應(yīng)于數(shù)據(jù)量巨大的電力系統(tǒng)。LightGBM 解決了GBDT(Gradient Boosting Decision Tree)解決海量數(shù)據(jù)時(shí)所遇到的問(wèn)題,更加適用于電能質(zhì)量擾動(dòng)分類識(shí)別。
LightGBM 用直方圖算法代替了xgboost的預(yù)排序算法,將特征值離散成K個(gè)整數(shù),并構(gòu)造寬度為K的直方圖。在遍歷時(shí),根據(jù)直方圖的離散值,找到最佳分割點(diǎn)[12],直方圖算法如圖5。同時(shí)LightGBM 還擁有帶有深度限制的按葉子生長(zhǎng)(leaf-wise)算法如圖6。數(shù)據(jù)經(jīng)過(guò)Level-wise 的同時(shí)分裂同一層的葉子,進(jìn)行多線程優(yōu)化。Histogram還可以做差加速,如圖7,父節(jié)點(diǎn)與子節(jié)點(diǎn)的直方圖做差,可以得到子節(jié)點(diǎn)兄弟節(jié)點(diǎn)的直方圖,直方圖做差僅需遍歷直方圖的k個(gè)桶。利用做差加速,LightGBM極大提高了運(yùn)算效率。
圖5 直方圖算法
圖6 Leaf-Wise生長(zhǎng)策略
圖7 直方圖做差加速
單邊梯度抽樣算法GOSS(Gradient-based One-Side Sampling)僅保留了梯度較大的樣本,并對(duì)梯度較小的樣本進(jìn)行隨機(jī)抽樣,為了不改變樣本的數(shù)據(jù)分布,在計(jì)算增益時(shí)為梯度小的樣本引入一個(gè)常數(shù)進(jìn)行平衡。通過(guò)GOSS,LightGBM 減少了樣本的數(shù)量,提升了訓(xùn)練的速度。
高維度的數(shù)據(jù)大都具有稀疏性的特點(diǎn),EFB(Exclusive Feature Bundling)將一些互斥的特征捆綁在一起,這樣兩個(gè)特征捆綁起來(lái)不會(huì)造成信息的丟失。EFB 算法利用特征和特征間的關(guān)系構(gòu)造一個(gè)加權(quán)無(wú)向圖,并將其轉(zhuǎn)換為圖著色的問(wèn)題來(lái)求解,求解過(guò)程中采用的貪心策略。EFB在保證精度的同時(shí)提升了算法的效率[18]。
參照文獻(xiàn)[5]仿真生成標(biāo)準(zhǔn)信號(hào)(C0)、暫升(C1)、中斷(C2)、暫降(C3)、諧波(C4)、暫態(tài)振蕩(C5)、暫態(tài)脈沖(C6)、電壓閃變(C7)7種單一擾動(dòng),中斷加暫態(tài)震蕩(C2+C5)、諧波加暫態(tài)振蕩(C4+C5)、諧波加暫態(tài)脈沖(C4+C6)、諧波加閃變(C4+C7)、暫態(tài)振蕩加閃變(C5+C7)、暫態(tài)脈沖加閃變(C6+C7)6 種雙重?cái)_動(dòng)。每類擾動(dòng)隨機(jī)生成600 條實(shí)驗(yàn)數(shù)據(jù),采樣頻率為6.4kHz,采樣長(zhǎng)度為2048 個(gè)采樣點(diǎn)。實(shí)驗(yàn)采用十折交叉驗(yàn)證。
將構(gòu)造的14 類信號(hào)進(jìn)行SET 分解后提取上述復(fù)合多尺度排列熵在內(nèi)的特征構(gòu)成特征集,復(fù)合多尺度排列熵的嵌入維數(shù)選擇為6,尺度因子設(shè)定為12。由于復(fù)合多尺度排列熵的維數(shù)較高,使用PCA對(duì)其進(jìn)行降維運(yùn)算,提取3 個(gè)主元分量,以減少特征的復(fù)雜程度。在LightGBM 中進(jìn)行分類實(shí)驗(yàn),為說(shuō)明本文算法的優(yōu)勢(shì)將構(gòu)造的特征集用XGboost,CATboost,隨機(jī)森林進(jìn)行對(duì)比實(shí)驗(yàn),為證明本文所提方法的在噪聲環(huán)境下的分類效果,在原始擾動(dòng)信號(hào)中分別添加30dB、40dB、50dB 噪聲,分類結(jié)果如表1。分類準(zhǔn)確率對(duì)比實(shí)驗(yàn)結(jié)果如表2。訓(xùn)練及分類總時(shí)間對(duì)比實(shí)驗(yàn)結(jié)果如表3。
表1 不同噪聲環(huán)境下本文所提方法分類準(zhǔn)確率
表2 不同分類器平均分類準(zhǔn)確率對(duì)比
表3 不同分類器不同噪聲環(huán)境下訓(xùn)練及分類耗時(shí)對(duì)比
由表1~3 可得本文所提方法的復(fù)合電能質(zhì)量擾動(dòng)可達(dá)98.571%,在30dB~50dB 的噪聲環(huán)境下準(zhǔn)確率也沒(méi)有大幅度下降,最低仍有97.381%,仍然有較高的準(zhǔn)確率,2 重和3 重?cái)_動(dòng)也有不錯(cuò)的準(zhǔn)確率。與不同的分類器對(duì)比在訓(xùn)練耗時(shí)和分類準(zhǔn)確率上有顯著的優(yōu)勢(shì)。boosting集成學(xué)習(xí)算法對(duì)比隨機(jī)森林的分類準(zhǔn)確率較高,但是CATboost 的訓(xùn)練和分類所需的時(shí)間較長(zhǎng)。
選擇使用4 種不同信號(hào)處理方法的參考文獻(xiàn)與本文所提方法做比較如表4,本文所提方法可以實(shí)現(xiàn)的分類類別更多,并且在噪聲環(huán)境下,準(zhǔn)確率沒(méi)有明顯下降。表中-表示文獻(xiàn)未提及。
表4 電能質(zhì)量擾動(dòng)分類算法性能比較
針對(duì)電力系統(tǒng)復(fù)合擾動(dòng)分類問(wèn)題,本文提出了一種基于同步提取變換、復(fù)合多尺度排列熵、Light-GBM 的新方法,利用同步提取變換能準(zhǔn)確進(jìn)行擾動(dòng)信號(hào)的分解,提取用PCA降維后的復(fù)合多尺度排列熵在內(nèi)的多種信號(hào)特征,構(gòu)造成特征集,利用LightGBM算法進(jìn)行分類試驗(yàn),所提方法對(duì)比于XGboost,CATboost,隨機(jī)森林,具有較好的分類準(zhǔn)確率,并且在運(yùn)算效率、分類耗時(shí)上也有顯著優(yōu)勢(shì)。在原始信號(hào)中加入3 種噪聲分量分類效果并沒(méi)有顯著下降,具有一定的抗噪性。與其他文獻(xiàn)相比提高了識(shí)別的種類和噪聲環(huán)境下的準(zhǔn)確率。