路智欣 鄒璟 方勇 王清波
(云南電網(wǎng)有限責任公司昆明供電局 云南省昆明市 650000)
氣體絕緣開關裝置(Gas Insulated Switchgear,GIS)因其極具優(yōu)勢的占地面積小、運行穩(wěn)定性高等特點而被廣泛應用于電力系統(tǒng)中[1-2]。但經(jīng)驗表明,在實際運行中GIS 容易產(chǎn)生絕緣缺陷,導致絕緣故障[3]。在線監(jiān)測GIS 局部放電信號是判斷絕緣缺陷是否存在的有效方式,對局部放電信號進行診斷識別則進一步幫助識別存在的絕緣缺陷類型[4],有助于工作人員實時掌握設備狀態(tài),便于維修工作的展開。
超聲波法是最常用的局放信號檢測方法之一[5]。超聲信號中蘊含大量信息,但目前基于超聲波信號對GIS 絕緣缺陷進行診斷識別的研究較少,且準確率較低。聲紋識別是一種通過提取聲音特征以分辨聲音來源的方法[9],最初應用于說話人識別,后逐漸擴展應用于工程領域。目前主要利用的聲音特征參數(shù)有線性預測系數(shù)(Linear Prediction Coefficients,LPC)、梅爾頻率倒譜系數(shù)(Mel Frequency Cestrum Coefficients,MFCC)等[6]。其中MFCC 提取方式簡單且識別率較高[7]。
本文將聲紋識別技術應用于GIS 絕緣缺陷識別診斷中,以期獲得更高的識別準確率。以110kV GIS 在四種不同絕緣缺陷情況下的局放測試結果為例,提取超聲信號的MFCC 特征進行模式識別以驗證該方法的可行性與有效性。
梅爾頻率倒譜系數(shù)(Mel-scale Frequency Cepstral Coefficient,MFCC)是基于人耳聽覺特性從聲音信號中提取的一種特征參數(shù)。人的聽覺系統(tǒng)是一個特殊的非線性系統(tǒng),對于不同頻率響應的靈敏度不同。梅爾提出將實際頻率轉換到梅爾頻率域中以模擬人類聽覺的非線性特性[8]。梅爾頻率與實際頻率的關系如式(1)所示[9]。
式中,fmel為梅爾頻率,f 為實際頻率。圖1 中展示了0-80kHz頻率區(qū)間內實際頻率與轉換成梅爾頻率的對應關系。
MFCC 特征參數(shù)提取過程主要包括以下5 個步驟:
(1)首先對超聲信號進行分幀、加窗的預處理操作。本文中幀長取一個工頻周期的長度即20ms,重疊率設為50%以保證分幀后信號的連續(xù)性,使用漢明窗進行加窗。
(2)對加窗后信號進行FFT 變換。通過FFT 變換將原本的時域信號轉換到頻域,以便于后續(xù)進行頻域分析。
(3)使用Mel 濾波器組過濾信號。Mel 濾波器組如式(2)所示,經(jīng)過Mel 濾波器組過濾后信號從原始頻率轉換到Mel 頻率。
圖1:梅爾頻率與實際頻率對應關系
圖2:不同絕緣缺陷下GIS 局部放電超聲信號
圖3:四種缺陷模型的MFCC 參數(shù)
式中,f(m)為第m 個三角濾波器的中心頻率。
(4)對Mel 頻譜進行對數(shù)能量處理,得到對數(shù)頻譜;
式中X(k)為分幀信號的FFT,為FFT 長度。
(5)最后將對數(shù)頻譜經(jīng)過離余弦變換,得到M 個MFCC 特征參數(shù),下式中的c(i)即為MFCC 特征參數(shù)。
根據(jù)上述方法即可提取到超聲局放信號的MFCC 特征參數(shù),體現(xiàn)出不同缺陷情況下超聲信號聲紋特征的差異。
根據(jù)上述方法將會對每一幀提取一組MFCC 參數(shù),其特征向量的維數(shù)將會隨著信號的長度增加而成倍上漲。龐大的特征量不僅會大幅降低后續(xù)機器學習的運算速率,同時也將由于數(shù)據(jù)過于復雜而影響訓練和識別的準確率。因此,有必要在將特征向量輸入分類器進行訓練和測試之前,對其進行有效的降維優(yōu)化,以提高運算效率。
主成分分析法(Principle Component Analysis,PCA)通過尋找數(shù)個投影方向,使得高維特征向量投影到這些方向之后方差最大,并且各個投影方向之間互不相關[10],從而達到降維的目的:在不改變對信號描述程度的條件下降低特征向量的維數(shù)。
假設共有m 個超聲信號樣本以及其各自的n 個聲紋識別特征值,記第i 個信號的第j 個特征值為xij,即可構造特征量矩陣X=(xij)m×n,行代表樣本數(shù),列代表維數(shù)。則采用PCA 對特征向量進行降維的步驟如下:
(1)對矩陣X 的每一列進行去中心化處理,即每個元素xij減去所在列的均值pj
表1:GIS 超聲信號缺陷識別結果
(2)利用新矩陣Y 計算得出代表各特征維度之間關系的協(xié)方差矩陣
(3)計算協(xié)方差矩陣R 的特征值和其對應的單位特征向量,將特征值記作λ1,λ2,……,λn,單位特征向量記作p1,p2,……,pn。
(4)將特征值按大小由高到低進行排序,同時將其對應的特征向量按相同的序號排列。通過計算主成分累計貢獻率確定主成分個數(shù),累計貢獻率公式為
式中,λs為新排序下的第s 個特征值,εk即為前k 個主成分的累計貢獻率,當εk達到85%,則確定主成分個數(shù)為k,同時這也確定了降維后新特征量的維數(shù)為k。
(5)取新排序下的特征向量前k 行組成矩陣Q=[q1,q2,…,qk],計算新的特征量矩陣Z:
本文采用機器學習中普適性最好的支持向量機(Support Vector Machine,SVM)[11]對特征量進行識別分類。
支持向量機的分類原理為通過指定的核函數(shù)將輸入空間映射到高維空間中,從而能夠在該高維空間中使得兩類樣本被一個超平面分隔在兩側,并且樣本與超平面的距離達到最大值[12]。該超平面稱為最優(yōu)分類超平面,兩側與其相距最近的樣本稱為支持向量(support vector,SV)。
本文選擇學習能力較強且性能較穩(wěn)定的高斯徑向基函數(shù)作為核函數(shù),其表達式為[13]:
式中,||X-Y||為兩向量的距離,σ 為寬度參數(shù)。高斯徑向基核函數(shù)的學習能力可由參數(shù)σ 控制,σ 越小學習能力越強,但過擬合情況也更容易發(fā)生,因此σ 的取值需謹慎權衡。
由分類原理可見SVM 本身僅支持二分類。而GIS 常見的絕緣缺陷不只有兩種,基礎SVM 無法滿足GIS 絕緣缺陷診斷識別的需求。因此采用一對一法以拓展SVM 算法成為多分類器。其具體方法為:首先根據(jù)類別,為每兩類樣本設計一個基礎SVM 分類器,假設需分類的樣本類數(shù)為k,則需設計個基礎SVM 分類器。將待分類樣本放入N 個基礎SVM 分類器中進行識別,記錄每個分類器的識別結果,判定識別出次數(shù)最多的類別為該樣本的最終識別結果。
實驗結果與分析:
實驗涉及四種絕緣缺陷,分別是金屬微粒、懸浮電極缺陷、沿面放電和針尖電暈放電。采用超聲傳感器依次采集GIS 在不同絕緣缺陷情況下的超聲信號。采集得到的原始超聲信號如圖2所示。
根據(jù)第1 節(jié)中所述方法,提取分幀后信號的MFCC 參數(shù)。圖3 為提取超聲信號MFCC 參數(shù)的計算結果。計算過程中,超聲信號的長度為500ms,幀長為20ms,重疊率為50%。由圖可見,計算所得MFCC 特征參數(shù)的幀數(shù)和維數(shù)分別為49 幀和12 維。
完成超聲信號MFCC 特征量的提取后,使用PCA 算法對其進行降維優(yōu)化,再利用SVM 識別模型對特征量進行缺陷診斷識別。實驗中共采集160 組信號,每種缺陷模型40 組。在每種缺陷中隨機選擇50%的數(shù)據(jù)作為訓練組用以對模型進行訓練,其余數(shù)據(jù)作為測試組用以檢測識別模型的準確性。
最終得到識別結果如表1所示。表中統(tǒng)計了識別模型對每一種缺陷類型進行診斷時識別的準確率與識別所需時長。為驗證基于優(yōu)化MFCC 參數(shù)的識別模型的有效性,本文還同時對不經(jīng)PCA 算法優(yōu)化的MFCC 參數(shù)進行診斷識別,使兩種情況形成對照組,從而便于對兩種參數(shù)的識別效果進行對比分析。
由表中數(shù)據(jù)對比可知,采用PCA 優(yōu)化過的特征量對GIS 超聲信號進行識別時,識別速度與識別準確率即準確判斷出GIS 內部存在的絕緣缺陷的概率均高于未經(jīng)過優(yōu)化的情況,這表明PCA 降維優(yōu)化算法的加入有助于提升識別模型的運行速度與診斷效率。
為實現(xiàn)基于GIS 超聲信號的內部絕緣缺陷識別診斷,本文提出了一種基于優(yōu)化MFCC 參數(shù)和SVM 算法的聲紋識別模型。提取GIS 超聲信號MFCC 參數(shù)作為聲紋特征量,并采用SVM 作為模式識別算法對絕緣缺陷類別進行識別。PCA 優(yōu)化算法的加入則幫助改善特征量的冗余情況,加快模型的運算速度,提高模型的識別效率。實驗表明,本文提出的識別模型對GIS 絕緣缺陷診斷的成功率可達91.25%。