肖毓增,付新華,楊勝儀,陳文清
(1.福建華電福瑞能源發(fā)展有限公司池潭水力發(fā)電廠,福建 三明 353000;2.西北大學,陜西 西安 710100)
在電力設備中,電力變壓器作為改變電壓的重要器件,是維持電力系統(tǒng)穩(wěn)健運行的關鍵部件之一。變壓器在生產(chǎn)、安裝、維護、長時間運行等實際條件下,不可避免地受到熱力等外部因素的影響。此外,如果不及早發(fā)現(xiàn)變壓器故障,那么現(xiàn)有故障將逐步演變并惡化。最終,故障會導致火災或其他電網(wǎng)設備大面積損壞,致使配電中斷,對人們的生產(chǎn)生活產(chǎn)生巨大影響。因此,如何準確發(fā)現(xiàn)并識別故障類型,以便采取適當?shù)拇胧p輕其負面影響,是亟待解決的問題。
目前,現(xiàn)有的故障診斷方法在很大程度上依賴于接觸式傳感器等特殊設備。這種方法增加了故障診斷的成本,更重要的是,可能會受到高壓、強電磁場等復雜工作環(huán)境的影響,從而干擾系統(tǒng)的正常運行。變壓器在運行時會產(chǎn)生內(nèi)部振動,其中包括內(nèi)部硅鋼片伸縮效應導致的周期性振動等,將不同振幅和頻率的振動信號輻射到周圍。特別是在高壓和強電磁環(huán)境中,可能會發(fā)生各種故障,產(chǎn)生不同的聲音。通過聲音信號進行故障診斷是一種較好的解決方案,具有多方面優(yōu)點。首先,它支持非接觸式安裝,設備小且使用簡便,便于信號采集;聲信號不產(chǎn)生電磁場,不影響設備的正常運行。事實上,聲紋識別已被廣泛應用于聲音驗證、醫(yī)療保健、故障檢測等領域。
基于聲音信號的故障診斷通常包括聲學特征提取和分類。對于聲音特征提取,通常需要進行頻域變換提取特征參數(shù)進行識別??紤]到電力變壓器聲音信號與人語音的相似性,常用的特征參數(shù)有梅爾頻率倒譜系數(shù)(MFCC)、線性預測倒譜系數(shù)(LPCC)以及耳蝸濾波器倒譜系數(shù)(CFCC)。通常情況下,變壓器是逐漸損壞的,而不是突然發(fā)生故障。上述系數(shù)僅反映變壓器聲信號的靜態(tài)特征。但在人類聽覺系統(tǒng)上對聲音信號的動態(tài)特征更為敏感,這些靜態(tài)特征不足以表示。
分類器是聲音識別的重要組成部分,近年來,人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVMs)和決策樹等58種機器學習算法作為變壓器故障檢測的60種有前景的解決方案在文獻中得到了研究。變壓器故障檢測本質(zhì)上是一個多分類問題。本文提出了一種基于樸素貝葉斯分類器的變壓器故障檢測方法。首先,對于聲音信號進行預處理,特別使用了漢明窗函數(shù),接下來將經(jīng)過預處理的聲音信號轉換為頻域信號進行后續(xù)特征提取,最后使用樸素貝葉斯分類器對故障進行分類,采用聲學特征向量訓練的樸素貝葉斯分類器來判斷變壓器的故障類型。如果發(fā)生故障就及時通知檢修人員維修電力設備。
電廠設備中變壓器故障監(jiān)測系統(tǒng)結構如圖1所示,包含信號預處理、故障特征提取以及分類器。
圖1 系統(tǒng)結構
在電廠中利用聲學傳感器很容易采集到變壓器工作時的聲音信號,將其進行信號預處理,獲得相對平滑的變壓器聲信號,之后將該信號預先強調(diào)以增強高頻效果,并分成短時間穩(wěn)定的幀段進行預加重。設計了漢明窗對每幀進行進一步處理以減少頻譜泄漏。變壓器運行過程中產(chǎn)生的聲音信號含有豐富的信息,能在一定程度上反映變壓器的工作狀態(tài)和故障狀況。針對聲音特征提取階段,提出了一種用于聲音信號的梅爾頻率倒頻譜系數(shù)(MFCC)特征向量,特別是基于MFCC的動態(tài)特征。將提取出來的特征向量輸入樸素貝葉斯分類器即可得到變壓器工作時的狀態(tài)。
聲音識別技術是提取語音信號來判斷說話人的方法,它提取不同說話人聲音信號的特征向量組成庫,通過比較特征向量的相似度來確定說話人。由于正在運行中的變壓器所產(chǎn)生的聲音信號與人的聲音信號相似度較高,我們使用這些揭露人聲音信號的典型參數(shù)來提取變壓器的故障聲音。MFCC能有效揭示語音信號的時域和頻域特征,因此本文將其應用于變壓器聲音信號的特征提取。通過計算濾波頻譜的能量,得到的參數(shù)能夠反映各頻帶的頻譜能量分布。
MFCC的提取觀測單位為幀,它由個采樣點組成。一般情況下,變壓器故障音頻數(shù)據(jù)是一種非平穩(wěn)信號,通常在50~200 ms范圍內(nèi)保持穩(wěn)定,即為值涵蓋時間。為實現(xiàn)幀間平滑,通常相鄰幀間有50%的重疊區(qū)域。預處理的最后一步將每幀乘以漢明窗函數(shù)。在故障音頻特征提取階段,對分幀加窗后的信號進行快速傅里葉變換得到各幀頻域特征,并且對上一步得到的頻域特征取模平方得到功率譜。接下來將功率譜通過Mel濾波并計算得到其對數(shù)能量,再將對數(shù)能量帶入離散余弦變換得到MFCC特征參數(shù)。算法流程如圖2所示,其中數(shù)據(jù)預處理包括預加重、分幀和加窗。
鑒于工作中的變壓器所產(chǎn)生的聲音信號與人的聲音相似,我們使用描述人的聲音的典型參數(shù)來有效提取變壓器噪聲的特征是可行的。運行中的變壓器聲音信號包含著其工作狀態(tài)信息,這些信息與變壓器結構、運行狀態(tài)等密切相關。對復雜的變壓器音頻故障進行有效分析并識別不同的工作狀態(tài),可為電力設備狀態(tài)監(jiān)測提供依據(jù)。MFCC能有效揭示語音信號的時域和頻域特征,因此本文將其應用于變壓器聲音信號的特征提取方面。MFCC特征提取流程如圖2所示。
圖2 MFCC特征提取流程
2.2.1 數(shù)據(jù)預處理
首先,通過一階高通濾波器實現(xiàn)故障音頻預加重,用于放大輸入聲音信號的高頻分量。事實上,語音、音樂等的功率譜是隨著頻率的增加而減小的,其大部分能量集中在低頻范圍內(nèi)。因此,產(chǎn)生的信號幅值是由信號的低頻分量引起的。預加重是一種對原始信號高頻分量進行補償?shù)奶幚矸椒ā=?jīng)過預加重濾波,可以有效抑制隨機噪聲。
接下來對信號分幀,為減少每幀開始和結束時信號中斷,兩幀之間有一段50%的重疊區(qū)域。將每幀乘以漢明窗函數(shù)增加幀左右兩端的連續(xù)性。窗函數(shù)主要為了減少頻譜泄露,使得信號更好地滿足特征提取的周期性要求。漢明窗的幅頻特性為旁瓣衰減較大,主瓣峰值與第一個旁瓣峰值衰減可達40 dB,窗函數(shù)()形式如下:
式中:預加重分幀后的信號為();為幀的大小。
2.2.2 特征提取
對預處理后的各幀信號進行傅里葉變換,得到各幀的頻譜,設信號的FFT為:
對信號的頻譜取模平方得到信號的功率譜:
在Mel三角濾波器中每個三角形濾波器的跨度對應于梅爾尺度。Mel頻率與線性頻率的關系為:
將每個濾波器組乘以功率譜,然后將系數(shù)相加取對數(shù)得到濾波器組的對數(shù)能量。
最后將得到的對數(shù)能量帶入離散余弦變換中,求出MFCC參數(shù)。
式中:=1, 2,...,,為 MFCC 堵塞階數(shù);為三角濾波器的個數(shù)。
MFCC系數(shù)僅反映變壓器故障音頻的靜態(tài)特征。由于動態(tài)特征也包含大量的特征信息以及人耳對其較為敏感,因此聲譜的動態(tài)信息中也包含豐富的聲信息。一般來說,變壓器在一段時間內(nèi)會逐漸發(fā)生故障。因此,相關參數(shù)不斷向故障狀態(tài)變化。動態(tài)特征還包含豐富的變壓器狀態(tài)信息,可用于提高變壓器故障診斷的準確性。為反映變壓器故障音頻的動態(tài)信息,需要提取MFCC的一階差分ΔMFCC、二階差分 ΔΔMFCC。
式中:(+)為第+幀MFCC的特征參數(shù);值設置為2;()為MFCC一階差分;()為MFCC二階差分。
圖3中最上邊的每一條線表示提取的MFCC特征系數(shù),中間和底部的曲線為線圈松動故障音頻信號的一階差分和二階差分曲線圖。利用上述提到的MFCC特征向量、MFCC的一階差分向量和二階差分向量構建一個新的特征向量(36維),通過提出的分類模型進行進一步的特征學習。圖4為內(nèi)部短路故障時的靜態(tài)特征(MFCC),圖5和圖6為內(nèi)部短路故障時的動態(tài)特征(ΔMFCC和ΔΔMFCC)。
圖3 二維特征提取曲線
圖4 內(nèi)部短路故障時的MFCC特征
圖5 內(nèi)部短路故障時的ΔMFCC特征
圖6 內(nèi)部短路故障時的ΔΔ MFCC特征
本研究采用樸素貝葉斯分類器對4種變壓器非正常工作時的故障音頻信號進行識別,并且以識別準確率來評價識別效果。本研究共有4種變壓器常見故障類別,屬于多分類問題。在識別過程中,首先對聲音信號進行靜態(tài)和動態(tài)的特征提取,然后輸入到樸素貝葉斯分類器。樸素貝葉斯分類器是一種監(jiān)督機器學習方法,它是一個條件概率模型。樸素貝葉斯分類器是一個問題實例向量=(,,...,x),其中,是提取特征的值,使用特征向量元素之間樸素獨立的假設,即概率分類方法,該方法在文本分類、實時預測、多類預測、推薦系統(tǒng)、傳入郵件的垃圾分類、人臉識別、故障診斷、文章分類等方面都有應用。
樸素貝葉斯分類器與傳統(tǒng)分類器的不同之處是它需要計算類的后驗概率,從而降低計算的復雜度。貝葉斯定理利用先驗概率,即不含任何附加信息的假設或事件的原始概率。先驗概率用于尋找后驗概率,后驗概率是在獲得事件的附加信息后對事件進行修正的概率。
式中,表示變壓器故障種類。聯(lián)合概率模型可以表示為:
自動識別是一種機器學習技術,需要經(jīng)過訓練的數(shù)據(jù)集,該數(shù)據(jù)集記錄不同變壓器故障的聲音信號。數(shù)據(jù)集中記錄的每個聲音信號都標記了不同的變壓器故障種類。將訓練好的數(shù)據(jù)集組成分類器,并在此基礎上形成算法。故障數(shù)據(jù)集被分類為4個不同的種類,分別為高電壓、內(nèi)部短路、硅鋼片或線圈松動以及鐵芯部件松動。
樸素貝葉斯分類器的優(yōu)點是正確分類需要少量的訓練特征向量,比較易于實現(xiàn)以及對高維數(shù)據(jù)點識別率高。
本文訓練樣本數(shù)據(jù)集為4 800段故障音頻(每段持續(xù)時間為4 s),包括1 200段高電壓故障時的音頻數(shù)據(jù),1 200段內(nèi)部短路的音頻數(shù)據(jù),1 200段硅鋼片或線圈松動的音頻數(shù)據(jù),1 200段鐵芯部件松動的音頻數(shù)據(jù)。測試集數(shù)據(jù)集為2 400段音頻,每種故障分別有600段故障音頻。收集的數(shù)據(jù)來自110 kV三相干式變壓器。另外,為了討論在麥克風處于不同位置和不同數(shù)量對收集聲音信號的質(zhì)量影響,我們還在2個不同工作間收集了高電壓故障和鐵芯部件松動故障數(shù)據(jù)。
變壓器故障檢測樸素貝葉斯分類器的分類效果見表1所列。我們采用準確率、精確率以及召回率等常見描述性能的分類指標。表1中序號序列分別表示高電壓、內(nèi)部短路、硅鋼片或線圈松動的音頻數(shù)據(jù)以及鐵芯部件松動的音頻數(shù)據(jù)。實驗結果表明,該方法在診斷分類故障中具有良好的性能。
表1 4種故障的分類效果
動態(tài)特征還包含豐富的變壓器狀態(tài)信息,可用于提高變壓器故障診斷的準確性。為驗證動態(tài)特征提取的特征向量(ΔMFCC和ΔΔMFCC)的有效性,本研究分別提取了靜態(tài)和動態(tài)特征組成新的特征向量,并且將這些特征向量輸入到樸素貝葉斯分類器中。圖7為上述方法的量化分類效果對比。通過實驗結果可以得出,使用靜態(tài)和動態(tài)特征結合的特征提取方法可以充分提取聲音信號的特征。
圖7 提取不同特征參數(shù)的分類效果
我們在2個不同工作間收集了高電壓故障和鐵芯部件松動故障,見表2所列。麥克風距離變壓器0.5 m,麥克風距離變壓器1.0 m,+代表在2個位置同時收集聲音信號。實驗結果表明,不同位置和數(shù)量的麥克風收集數(shù)據(jù)對實驗結果幾乎無影響。所以我們在麥克風所在的位置進行數(shù)據(jù)收集。
表2 不同位置和數(shù)量的麥克風對性能的影響
文中提出了基于樸素貝葉斯分類器的變壓器故障監(jiān)測方法。通過分析聲音信號,提取聲音信號的靜態(tài)和動態(tài)特征。結果表明,該故障檢測方法較好地滿足了變壓器故障監(jiān)測的實際要求,識別精度高,對故障監(jiān)測和報警具有較大的應用價值。