胡漢鋮,劉明萍,張 震,張鎮(zhèn)濤,汪慶年
(南昌大學(xué)信息工程學(xué)院,南昌 330031)
近年來隨著光伏發(fā)電、風(fēng)電等間歇式、分布式新能源的并網(wǎng)以及大量沖擊性、波動性、非線性負(fù)荷的投入,給電網(wǎng)造成一系列電能質(zhì)量的問題,例如暫態(tài)振蕩、閃變和諧波污染等。為選取妥善合理的措施改善電能質(zhì)量,必須對擾動信號進(jìn)行正確、有效的辨識,這是開展電能質(zhì)量檢測的前提和關(guān)鍵。
電能質(zhì)量擾動辨識[1]主要包括特征提取與模式識別。特征提取是指提取擾動信號的特征量,通常采用信號分析法。常用的分析方法有短時傅立葉變換(short-time Fourier transform,STFT)[2]、小波變換[3]、S變換[4]及希爾伯特黃變換(Hilbert-Huang transform,HHT)[5-6]等。這些方法擁有良好的檢測效果,但也存在某些問題。STFT由于結(jié)構(gòu)中缺少可變窗口,難以分析突變信號;小波變換的問題在于如何準(zhǔn)確選取合適的基函數(shù);S變換的難點在于如何確認(rèn)窗函數(shù)的寬度;HHT 變換由經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,EMD)[7]與HHT 構(gòu)成,其中EMD 存在較嚴(yán)重的端點效應(yīng)、模態(tài)混疊問題。Dragomiretskiy等[8]獨創(chuàng)了變分模態(tài)分解(Variational mode decomposition,VMD),相較EMD 方法,它很好地克服了端點效應(yīng)和模態(tài)混疊的缺陷,且計算效率更高、分解層數(shù)更少、魯棒性更好。因此,引進(jìn)VMD算法對HHT變換進(jìn)行改進(jìn),并應(yīng)用于特征提取。
模式識別指的是將特征選擇所產(chǎn)生的特征向量進(jìn)行識別分類。當(dāng)今主流的方法有人工神經(jīng)網(wǎng)絡(luò)[9]、支持向量機(jī)(Support vector machine,SVM)[10]和隨機(jī)森林[11]等。人工神經(jīng)網(wǎng)絡(luò)具有數(shù)學(xué)靈活性,但也存在麻痹現(xiàn)象,學(xué)習(xí)速度不快;隨機(jī)森林因為采取了集成算法,其精度比大多數(shù)單一算法高,但當(dāng)隨機(jī)森林中決策樹的數(shù)量過多時,訓(xùn)練所需的時間和空間會較大;SVM是一種有監(jiān)督的機(jī)器學(xué)習(xí)模型,具有優(yōu)良的范化能力,但輸入?yún)?shù)過多,容易發(fā)生特征混疊,導(dǎo)致誤判。因此,引入主成分分析法(Principal component analysis,PCA),該方法能夠?qū)⑻卣飨蛄窟M(jìn)行降維投影,提取更加敏感的低維特征信息,將其與SVM 結(jié)合,能有效提升辨識精度,避免特征混疊等情況。
綜上所述,文中提出一種基于VMD-PCA-SVM 的電能質(zhì)量擾動辨識方法。引入VMD 改進(jìn)HHT 算法,用于分析擾動信號,得到邊際譜作為特征向量,將特征向量用PCA降維,用SVM 分類器進(jìn)行分類識別。通過比較分析,仿真試驗表明該方法的可靠性和準(zhǔn)確性。
VMD是一種全新的以HHT、維納濾波為基礎(chǔ)的自適應(yīng)分解法。原信號通過VMD 搜索約束變分模型的最優(yōu)解,可被分解為若干組帶有稀疏特性的本征模態(tài)函數(shù)(Intrinsic mode function,IMF)分量。區(qū)別于EMD算法,IMF分量被設(shè)定為調(diào)幅-調(diào)頻信號[8]:
式中:φk為瞬時頻率的積分,即相位;Ak為瞬時幅值。假定各個IMF分量具有有限帶寬與中心頻率,且估計帶寬最小,那么可得約束模型:
式中:K為IMF 的個數(shù);δ(t)為沖激響應(yīng);f為輸入信號;ωk為中心頻率。將懲罰因子α與拉格朗日算子λ相結(jié)合,把式(2)中的約束模型轉(zhuǎn)變?yōu)榉羌s束模型:
使用交替方向乘子求解式(2)中“鞍點”,可得uk和ωk。對uk,ωk,λ在頻域上更新:
式中,τ為更新因子。
VMD算法迭代求解的過程如下:
(1)初始化{uk}、{ωk}、λn和n;
(2)根據(jù)式(4)~(6)更新{uk}、{ωk}、λn;
(3)循環(huán)更新直至:
式中,r表示閾值。經(jīng)過上述過程,VMD 分解得k個IMF分量。
VMD算法的核心在于構(gòu)造變分問題,尋找變分最優(yōu)解,明確每個IMF 分量的帶寬與中心頻率,使得分解得到的各IMF的帶寬之和最小,實現(xiàn)信號的有效分離。相比于EMD算法,它有更完整的數(shù)學(xué)理論作為支撐,從原理上克服了模態(tài)混疊與端點效應(yīng)的問題[12]。
借助HHT對VMD 分解所得的各個IMF 分量進(jìn)行有效處理,原始信號可表示為:
式中,ωi、ɑi分別為信號的瞬時頻率和瞬時振幅。
由于x(t)是關(guān)于時間和瞬時頻率的函數(shù),故可以表示為:
式中,H(ω,t)為HHT譜,對其積分,得到邊際譜:
邊際譜有效展示了電能質(zhì)量擾動信號的幅值隨瞬時頻率的變化情況[13]。常用的功率譜只是能反映信號某一頻率存在的可能性,而邊際譜則可以說明某一頻率是否真實存在,表征某特定頻率在不同時刻所對應(yīng)的幅值(或能量)之和。此外,邊際譜與常用的功率譜相比,分辨率和準(zhǔn)確性顯著提高,能夠有效地抑制能量泄漏。鑒于邊際譜的上述優(yōu)點,故將其作為特征向量。
PCA是一種使用較為廣泛的數(shù)據(jù)降維算法[14]。其目的是朝數(shù)據(jù)變動最多的方向投影,抑或是說朝重構(gòu)誤差最小的方向投影。PCA降維分析的步驟如下:
步驟1假設(shè)Xm×n是一個m×n(m≥n)矩陣,計算矩陣Xm×n樣本協(xié)方差矩陣Sn×n。
步驟2計算Sn×n的特征向量對應(yīng)特征值x1,x2,…,xn,特征值按照從大到小排列。
步驟3依據(jù)特征值大小計算Sn×n的第i列向量貢獻(xiàn)率θi以及前r維矩陣?yán)塾嬝暙I(xiàn)率Θr:
步驟4依據(jù)Θr的大小明確投影矩陣的維數(shù)r,其中Θr最少為70%,通常取85%~95%之間。
步驟5投影矩陣Sn×r由矩陣Sn×n取前r維得到,將需要降維的矩陣Xm×n與之相乘,獲得降維后的矩陣Tm×r:
PCA通過數(shù)據(jù)降維,找出變化大(即方差大)的特征向量,去除變化?。捶讲钚。┑奶卣飨蛄?,得到最有效的數(shù)據(jù)特征向量。
SVM通過核函數(shù)的引進(jìn),將低維空間中的線性不可分樣本受非線性映射投影至高維空間中,變?yōu)榫€性可分樣本。在分類時,SVM 的中心思想在于建造一個超平面用作決策曲面,使負(fù)、正樣本的邊緣距離最大化[10]。其原理如下:
定義樣本集{(xi,yi),i=1,2,…,N},xi為輸入向量,yi為類別標(biāo)記,xi∈Rn,yi∈{+1,-1}。分類時,設(shè)存在分類界面:
式中:ω為權(quán)重向量;b為偏置向量。樣本點與分類界面距離為:
最優(yōu)分界面應(yīng)該滿足D最大,因此可轉(zhuǎn)化為二次優(yōu)化問題:
引入拉格朗日函數(shù)求解:
式中,αi為拉格朗日乘子。則得到對偶問題:
最后可得最優(yōu)分類函數(shù):
當(dāng)處理非線性問題時,采用核函數(shù)K(xi,x)替代點積(xi·x),最優(yōu)分類函數(shù)為:
鑒于VMD 的優(yōu)勢,故將其代替EMD,對HHT 變換進(jìn)行改進(jìn)。邊際譜能夠準(zhǔn)確有效表征信號頻率的能量分布,故將其作為特征向量。選用PCA對邊際譜特征量開展降維處理,有效減少了邊際譜特征量的冗余信息并降低特征向量的維度,實現(xiàn)了二次特征處理。將PCA所生成的特征向量對SVM 分類器展開訓(xùn)練,建立VMD-PCA-SVM辨識模型,如圖1 所示。
圖1 VMD-PCA-SVM辨識模型
該模型的主要步驟如下:
步驟1使用仿真軟件生成電能質(zhì)量擾動信號,分成兩組用來進(jìn)行訓(xùn)練和測試。
步驟2將訓(xùn)練信號進(jìn)行改進(jìn)HHT,PCA降維,然后對SVM分類器展開訓(xùn)練。
步驟3將測試信號重復(fù)上述步驟,輸入訓(xùn)練后的SVM分類器,最后得到辨識結(jié)果。
其中,SVM 分類器選取Matlab2017a 自帶的LibSVM分類器,選擇高斯徑向基核用作其核函數(shù),即:
式中,σ 為掌管核函數(shù)高度的參數(shù)。LibSVM 可通過“交叉驗證”自動選擇最優(yōu)核參數(shù)[14]。
針對這些復(fù)雜多變的電能質(zhì)量擾動信號,國內(nèi)外的研究多數(shù)在采用限定條件后,每種擾動生成隨機(jī)的數(shù)百樣本,形成完整數(shù)據(jù)庫,然后輸入分類器進(jìn)行訓(xùn)練和試驗。參考文獻(xiàn)[5,10]中建立包括標(biāo)準(zhǔn)信號在內(nèi)的電能質(zhì)量擾動信號的仿真模型,限定范圍見表1。仿真模型中:L為信號,基頻f取50 Hz,電壓幅值A(chǔ)均歸一化為1(p.u.),u(·)為階躍函數(shù),ω為擾動信號的額定角頻率,T表示信號周期。
表1 電能質(zhì)量擾動信號模型
使用Matlab2017a,根據(jù)表中的仿真模型,采樣頻率取5.7 kHz,信號長度為9 個周波,1 024 個采樣點,隨機(jī)生成9 組仿真信號,在信噪比(Signal to noise ratio,SNR)為40 dB條件下,用改進(jìn)HHT 變換進(jìn)行分析。采用VMD對信號展開分解,默認(rèn)分解成4 階IMF分量。列舉閃變擾動信號的分解波形,如圖2 所示。對各階IMF分量采用HHT,得到各信號的邊際譜并歸一化,如圖3(a)~(i)所示。將生成的邊際譜特征向量進(jìn)行PCA降維。設(shè)定滿足Θr≥95%時的r為PCA的投影維數(shù)取值,生成的PCA 降維效果圖如圖4 所示。由圖4 可見,當(dāng)取維數(shù)r=1 的時候,Θr就超過70%;當(dāng)在維數(shù)r=4 的時候,Θr已然達(dá)到95%,滿足要求,因此PCA選取4 維作為降維投影維數(shù)。
圖2 SNR=40 dB時閃變信號的VMD分解波形
圖3 SNR=40 dB時擾動信號的歸一化邊際譜
圖4 信噪比為40 dB時PCA降維效果圖
根據(jù)表1 中的模型,使用Matlab2017a隨機(jī)產(chǎn)生包括標(biāo)準(zhǔn)信號和8 種電能質(zhì)量擾動信號在內(nèi)的9 組信號集,每組信號集生成1 000 個樣本,在疊加高斯白噪聲后,生成無噪聲和SNR分別為30、40、50 dB 的試驗信號。在同一高斯白噪聲下,取每組試驗信號800 個樣本,共7 200 個樣本進(jìn)行訓(xùn)練,剩下每組200 個樣本,共1 800 個樣本進(jìn)行測試。最后將樣本輸入VMDPCA-SVM辨識模型中。辨識結(jié)果見表2。
表2 辨識結(jié)果及對比
由表2 可知,在無噪聲的條件下平均分類準(zhǔn)確率為99.94%,在SNR等于30、40 和50 dB的條件下,平均準(zhǔn)確率分別達(dá)到99.33%、99.50%和99.67%,均超過99%,可見魯棒性和準(zhǔn)確率良好。相比其他文獻(xiàn)所用的的方法,特別是文獻(xiàn)[5-6]中提出的類似改進(jìn)HHT的方法,文中所用方法有更大的優(yōu)勢,準(zhǔn)確率和魯棒性皆有明顯提升。
文中提出了一種基于VMD-PCA-SVM的電能質(zhì)量擾動辨識方法,為電能質(zhì)量擾動辨識提供了一種新思路。經(jīng)過大量仿真試驗,文中結(jié)論如下。
(1)該方法不僅適合于單一電能質(zhì)量擾動檢測,而且能精確識別2 種復(fù)合擾動,在無噪聲和3 種信噪比的條件下,平均準(zhǔn)確率均高于99%,最高可達(dá)99.94%。
(2)VMD算法本身具有自適應(yīng)好、分解效率高及魯棒性強(qiáng)的特點,它在數(shù)學(xué)原理上克服了模態(tài)混疊和端點效應(yīng),引入VMD算法來改進(jìn)HHT算法,與其他類似文獻(xiàn)對比,其優(yōu)勢通過優(yōu)異的分類準(zhǔn)確率和魯棒性得到充分體現(xiàn)。
(3)該方法也存在一些不足,例如VMD算法計算復(fù)雜度較高,實時性差,SVM 所需訓(xùn)練樣本較多等,需要日后更多的改進(jìn)。該方法測試是通過仿真平臺實現(xiàn),是否能夠有效應(yīng)用在實際工作中,還有待進(jìn)一步探索。