王廣真,付德慧,杜非,于浩,蔡睿,王謙,弓艷朋
(1.中國電力科學研究院有限公司,北京 100085;2.國網(wǎng)北京市電力公司電力科學研究院,北京 100036)
電力變壓器是電力系統(tǒng)的重要設備,在其運行全壽命周期內(nèi)需要定期開展檢修工作,以維持正常運行狀態(tài)[1-2]。變壓器正常運行時會發(fā)出聲音,隨著運行狀態(tài)的變化(如發(fā)生故障或過負荷運行時),變壓器發(fā)出的聲音也會產(chǎn)生變化。變電站的工作人員可在現(xiàn)場巡檢時通過聽取變壓器運行聲判斷其運行狀態(tài),但在變壓器發(fā)出異常聲音時靠近變壓器可能威脅工作人員的人身安全。利用現(xiàn)代數(shù)字信號處理技術進行變壓器聲紋故障診斷,既可提高變壓器聲紋識別的準確度,也可確保工作人員的人身安全。
最初有關變壓器聲音的研究主要與變壓器的噪聲控制有關,近年也開始將聲紋識別應用于變壓器故障檢測。外文文獻中,A.Swedan等人提出基于模式識別的局部放電信號聲學檢測方法,模擬產(chǎn)生局部放電的不同情況,提取的聲信號特征被輸入人工神經(jīng)網(wǎng)絡用于訓練和分類;結果表明,利用信號熵等特征可顯著提高局部放電聲信號的檢測性能[3]。X.J.Dang等人提出基于Gammatone濾波器倒譜系數(shù)(Gammatone filter cepstral coefficient,GFCC)聲紋譜和卷積神經(jīng)網(wǎng)絡的故障診斷方法,利用VGG-16深度學習算法計算出聲信號GFCC的特征參數(shù),由此識別變壓器的典型故障;對額定電壓10 kV的干式變壓器進行不同工況下的負荷試驗,模擬變壓器過載運行和鐵心松動,驗證了所提方法的正確性[4]。B.Yan、G.Q.Qian等人利用梅爾頻率倒譜系數(shù)(Mel frequency cepstrum coefficient,MFCC)特征提取和矢量量化算法進行變壓器異常聲紋識別;利用10 kV干式變壓器模擬變壓器鐵心松動聲,對模擬的異常聲音信號預處理后,結合主成分分析和MFCC計算噪聲信號的特征向量,然后建立矢量量化模型來識別噪聲特性[5]。Julaiti Abulizi等人提出基于門控循環(huán)單元(gated recurrent unit,GRU)的變壓器聲紋識別方法,對實驗獲得的變壓器在非正常勵磁或鐵心松動情況下的音頻數(shù)據(jù)預處理后,利用MFCC進行特征提取,構建一個GRU結構,并將其與長短時記憶網(wǎng)絡和遞歸神經(jīng)網(wǎng)絡進行比較;結果表明,基于MFCC和GRU的聲紋識別方法能有效檢測變壓器異常聲音[6]。
國內(nèi)文獻中,華北電力大學的趙書濤課題組首次將聲紋識別應用于變壓器故障診斷。華中科技大學的陳俊武課題組主要研究變壓器放電故障聲學診斷;在實驗室模擬了不同類型的變壓器內(nèi)部放電和外部放電,分析不同放電類型的頻譜特點;用小波包算法提取能量作為特征向量,小波變換用于故障類型辨識;并研制了變壓器故障聲學診斷儀,可識別變壓器內(nèi)部放電故障[7]。上海交通大學的王豐華課題組在10 kV干式變壓器上模擬變壓器鐵心松動和繞組松動故障,分別嘗試GFCC、壓縮觀測和耳蝸濾波倒譜系數(shù)等特征提取方法,聲紋識別算法方面采用鯨魚算法優(yōu)化隨機森林[8]、判別字典學習[9]、矢量量化算法[10]和概率神經(jīng)網(wǎng)絡[11]等,對于變壓器機械故障都有較高的識別率。華北電力大學的劉云鵬課題組主要通過深度學習算法實現(xiàn)變壓器機械故障的聲紋識別,對變壓器鐵心夾件松動時的聲紋[12]、有載分接開關傳動機構卡澀及內(nèi)部組件松動故障[13]、不同運行工況下的鐵心振動時的聲紋[14]及直流偏磁[15]都進行了相應的研究。
一些文獻針對變電站干擾聲音也提供了一些處理方法。周東旭采用集合經(jīng)驗模態(tài)分解算法去除部分雜散噪聲和低頻噪聲,利用K-SVD字典和正交匹配追蹤算法從含噪信號中分離出變壓器真實聲音和干擾分量[16]。田昊洋針對變壓器冷卻風機噪聲,提出一種利用稀疏自動編碼器從含冷卻風機噪聲的聲音信號中分離出變壓器本體聲音信號的方法,但沒有考慮瞬時性干擾聲音的影響[17]。鄒亮將改進的基于勢函數(shù)的稀疏分量分析算法應用于變壓器振聲提取,現(xiàn)場實驗發(fā)現(xiàn)該方法受聲反射的影響較大,分離出的變壓器振聲信號幅值不穩(wěn)定[18]。朱柯佳將小波閾值、譜減法、FastICA算法應用于變壓器聲音的去噪,分析得到各方法的去噪效果:基于小波閾值的去噪方法對不同類型的噪聲去噪效果差別不大,但噪聲信號的輸入信噪比對其去噪效果影響較大;基于FastICA的去噪方法更適合去除瞬時干擾與混合噪聲,對持續(xù)弱干擾的效果不佳;基于譜減法的去噪方法更適合處理持續(xù)弱干擾[19]。
綜上所述,目前國內(nèi)外關于變壓器聲紋識別的研究有了一些進展,但在實際應用方面還存在問題。變電站存在的大量干擾聲音可能導致提取的變壓器聲紋特征模型產(chǎn)生變化,影響聲紋識別效果?,F(xiàn)有的聲紋識別研究主要是針對變壓器本體聲音的去噪,當變壓器出現(xiàn)放電故障或冷卻風機故障時,故障聲音會與變壓器本體聲音疊加在一起,現(xiàn)有的去噪方法對此沒有針對性;而且干擾聲音的出現(xiàn)有很大的隨機性,無法提前預知干擾聲音出現(xiàn)的時刻及類型,進而選擇合適的去噪方法。因此,本文提出一種基于重復模式提取(repeating pattern extraction technique,REPET)和高斯混合模型(Gaussian mixture model,GMM)的變壓器故障聲紋識別方法。首先,在真實的變壓器油箱中模擬不同類型放電和機械故障。其次,針對變電站內(nèi)非平穩(wěn)性干擾聲音,采用基于REPET的盲源分離算法將非穩(wěn)定干擾聲音從混合聲音中分離。然后,針對主要由變壓器冷卻風機造成的持續(xù)性干擾聲音,通過選擇魯棒性較好的MFCC特征和基于GMM的聲紋識別算法來降低風機噪聲對聲紋識別系統(tǒng)的影響。最后,采用實驗數(shù)據(jù)驗證該方法對含噪聲音的識別率。
運行中的變壓器絕緣結構復雜,可能發(fā)生的內(nèi)部放電類型很多,通常有如下幾種:繞組端部油隙放電、繞組中部油-隔板絕緣中油隙放電、絕緣紙沿面滑閃放電、接觸絕緣導線和絕緣紙的油隙放電[20]。變電站內(nèi)一些導體的尖角處也可能發(fā)生電暈放電,屬于變壓器外部放電。本文設計了3種放電模型,如圖1所示:圖1(a)為平板放電模型,模擬變壓器內(nèi)部均勻電場中的放電(如絕緣紙間放電),高壓電極和接地極均為直徑2 cm圓形電極,電極間夾著1 mm厚的絕緣紙板;圖1(b)為柱板放電模型,用于模擬電極和絕緣紙板接觸產(chǎn)生的變壓器油中沿面放電,高壓電極直徑為0.5 cm,接地極直徑為2 cm,絕緣紙板厚度為1 mm;圖1(c)為針板放電模型,用于模擬變壓器外部的電暈放電,空氣間隙長度為1 cm。
圖1 放電模型Fig.1 Discharge models
變壓器內(nèi)部放電故障的模擬如圖2所示。在變壓器油箱內(nèi)放置平板放電模型和柱板放電模型,分別模擬變壓器內(nèi)部均勻電場的放電和沿面放電。
圖2 故障模擬實驗圖片F(xiàn)ig.2 Fault simulation experiment picture
變壓器風冷系統(tǒng)啟動后,冷卻風機在運行過程中可能發(fā)出異常聲音。造成這種現(xiàn)象的原因有固定風機的螺絲松動、電動機扇葉變形或損壞、電動機軸承缺少潤滑油、電動機扇葉觸碰風罩或風道被堵等[21]。實驗室模擬3種類型的變壓器冷卻風機故障聲音:①冷卻風機消音罩振動產(chǎn)生的聲音;②固定風機的螺絲松動產(chǎn)生的聲音;③電動機扇葉觸碰風罩產(chǎn)生的聲音。
變壓器故障聲紋識別過程中,聲音的采集是非常關鍵的,采集設備的性能直接影響聲紋識別結果。本文選擇電容式麥克風作為聲信號傳感器。采樣頻率48 kHz,頻率響應范圍為20 Hz~20 kHz,最大聲壓級為120 dB,靈敏度為4.5 mV/Pa(1 kHz),信噪比為100 dB。對變電站采集的自冷變壓器聲音數(shù)據(jù)進行時域和頻域特征分析,如圖3所示??紤]到錄制故障聲音時周圍環(huán)境的噪音也會被麥克風采集,在進行以上故障聲音特征分析前,已經(jīng)減去了實驗環(huán)境的背景聲音。
圖3(a)為0.15 s長度的時域波形,可以看出正常運行的變壓器聲音時域波形有明顯的周期性。由圖3(b)可以看出,變壓器本體聲音的頻率成分主要分布在1 000 Hz范圍內(nèi),頻率成分主要是100 Hz及其倍頻分量,并含有一些50 Hz的奇次倍頻分量。
圖3 自冷變壓器聲音信號的時域圖和頻域圖Fig.3 Time domain and frequency domain diagrams of self-cooled transformer sound signals
在相對安靜的實驗室進行變壓器故障實驗,采用電容式麥克風和Adobe Audition軟件錄制音頻并進行特征分析。圖4為實驗模擬的放電故障和機械故障聲音的頻域圖??梢钥闯觯浩桨咫姌O放電聲的頻率成分主要集中在10 kHz以下;沿面放電聲的頻率成分主要集中在8 kHz以下;電暈放電聲的頻率成分在整個可聽聲頻段均有分布;3種機械故障的頻率成分主要集中在4 kHz以下。
圖4 故障聲音頻域圖Fig.4 Frequency domain diagrams of fault sound
聲紋識別尚未在變壓器故障診斷中得到廣泛應用的一個重要原因是:采集到的聲音信號中可能存在許多干擾聲音,影響聲紋診斷的效率和準確性。因此,在進行變壓器故障聲紋識別前有必要對聲音進行去噪處理。為進一步了解變電站內(nèi)干擾聲音的特點,采集了變電站常見的干擾聲音,包括腳步聲、說話聲、鳥叫聲、汽車鳴笛聲、隔離開關聲和斷路器動作聲。分析干擾聲音的時域和頻域特征,并對干擾信號進行分類,具體見表1。
腳步聲、說話聲、鳥叫聲、汽車鳴笛聲、隔離開關聲和斷路器都是隨機出現(xiàn)的干擾聲音,可歸類為非穩(wěn)定聲音;冷卻風機聲歸類為連續(xù)穩(wěn)定聲音。由表1可以看出許多干擾聲音的頻帶較寬,且不同干擾聲的頻率成分有交集。
針對變電站內(nèi)的非穩(wěn)定干擾聲音,采用基于REPET的盲源分離算法將非穩(wěn)定聲音從混合聲音中分離。實驗模擬的放電聲音響度很小,當與風冷變壓器聲混合時,放電聲音的頻域特征被變壓器本體聲和冷卻風機聲完全淹沒;因此,本文采用特征域和模型域方法處理變壓器冷卻風機聲導致的連續(xù)穩(wěn)定干擾,即通過選擇魯棒性較好的MFCC特征和GMM聲紋識別算法降低風機聲對聲紋識別系統(tǒng)的影響。
盲源分離法是指從觀測到的混合信號中恢復出無法直接觀測到的源信號的過程[11]。REPET是一種單通道盲源分離算法,可用于分離非穩(wěn)定信號和連續(xù)穩(wěn)定信號。分析發(fā)現(xiàn),非穩(wěn)定干擾聲音在變電站的干擾種類中占絕大部分,此類干擾的共同特性是持續(xù)時間短,且干擾信號的能量分布集中,而變壓器本體聲音則是連續(xù)穩(wěn)定的信號。根據(jù)這一特點,選擇REPET技術將非穩(wěn)定干擾聲音從混合聲音中分離,提高后續(xù)識別算法的準確率和效率。REPET的作用機理可以概括為3個階段:重復周期的識別、重復片段的建模和重復模式的提取?;赗EPET的盲源分離步驟如圖5所示。
圖5 基于REPET的盲源分離步驟Fig.5 Steps of blind source separation based on REPET
a)重復周期識別。首先計算混合信號x的短時傅里葉變換X,取X元素的絕對值,得到幅度譜圖V(其元素為V(i,j))。然后計算功率譜圖V2的每個頻率通道隨時間的自相關,并獲得自相關矩陣A(其元素為A(i,j))。取矩陣A每行的平均值,即可獲得混合信號x的整體自相似性b。最后將b的每一項b(l)除以其第1項b(1),得到b歸一化后的值。計算公式為:
A(i,l)=
i=1,2,…,n,l=1,2,…,m;
(1)
式中:n為頻率通道數(shù);m為時間幀數(shù);A(i,l)為A的元素,下同。為方便起見,將b稱為拍頻。如果混合信號x中存在周期性重復模式,b將形成以不同周期律重復的峰值,揭示混合信號的潛在周期性重復結構。
b)重復片段建模。估計出混合信號的重復周期p后,就可將幅度譜圖V分割成長度為p的r段。通過取r段的元素中值獲得重復段模型S。重復段模型S的計算公式為
i=1,2,…,n,j=1,2,…,p.
(2)
c)REPET。計算出重復段模型S后,就可通過取S和混合信號幅度譜圖V的r段的元素最小值來推導重復譜圖模型W。重復譜圖W的計算公式為
W(i,j+(k-1)p)=
min{S(i,j),V(i,j+(k-1)p)},
i=1,2,…,n,j=1,2,…,p,
k=1,2,…,r.
(3)
最后,通過用混合譜圖V對W中對應的元素進行歸一化處理來推導軟時頻掩模M,軟時頻掩模M的計算公式為
i=1,2,…,n,j=1,2,…,m.
(4)
設置閾值t∈[0,1],將軟時頻掩模M中高于此閾值的時頻單元設置為1,其余設置為0,進一步導出二進制時頻掩碼;然后將時頻掩模M對稱化,并按元素乘以混合信號x的短時傅里葉變換X;將得到的短時傅里葉變換X轉換為時域即獲得估計的背景信號;從混合信號中減去背景信號,即可獲得估計的前景信號。
為驗證算法有效性,分別將汽車鳴笛聲、說話聲、腳步聲、鳥鳴聲、隔離開關聲、斷路器聲與風冷變壓器聲信號混合用于REPET。本文選擇漢明窗作為窗函數(shù)。由于可聽聲的頻率范圍是20 Hz~20 kHz,根據(jù)香農(nóng)采樣定理,選用的電容式麥克風的采樣頻率為48 kHz;設置混合信號的短時傅里葉變換的幀長為40 ms,即1 920個采樣點;幀移為半個漢明窗的長度(即20 ms),960個采樣點。將盲源分離得到的前景信號、背景信號與混合信號的時頻譜圖進行對比。因篇幅有限,僅選取1種混合聲音的分離結果進行展示,如圖6所示。由于混合信號僅是變壓器正常運行聲和非穩(wěn)定干擾聲音的疊加,分離出的背景信號即為變壓器本體運行聲音。
圖6 含隔離開關聲干擾的分離結果Fig.6 Separation results containing acoustic interference of disconnector
通過比較可以看出,非穩(wěn)定性干擾聲音已經(jīng)從混合聲音中分離出來。該算法對于其他非平穩(wěn)干擾也有很好的分離效果。
MFCC在1980年由Davis和Mermelstein首次提出,是語音識別和說話人識別領域最常用到的語音特征。MFCC特征的提取流程如圖7所示。
圖7 MFCC特征提取流程Fig.7 Feature extraction flow chart of MFCC
預加重是對高頻部分的聲音信號進行加重,使聲學模型的高頻共振峰更加直觀。預加重函數(shù)
y(h)=x(h)-α·x(h-1).
(5)
式中:x(h)為時刻h的聲音采樣值;α為預加重系數(shù),一般取值0.9~1.0,本文取0.97。
分幀即將原始聲音信號分成大小固定的N段語音。如果直接分幀,幀與幀之間的連貫性就會變差,因此引入幀移的概念,本文將幀長設置為20 ms,幀移設置為10 ms。加窗的目的是消除譜泄漏,本文選擇漢明窗作為窗函數(shù)。對加窗后的每幀進行N點快速傅里葉變換,N通常取256或512。對每幀的N個數(shù)據(jù)點分別取模再取平方,然后除以N,便得到能量譜密度。梅爾頻率是一個新的量度,它更接近于人耳的聽覺機制,在低頻范圍內(nèi)增長速度很快,在高頻范圍內(nèi)增長速度很慢。每個頻率值都對應1個梅爾頻率,對應關系為
(6)
式中:m為梅爾頻率;f為頻率,單位為Hz。對能量的對數(shù)作離散余弦變換即可得到MFCC參數(shù)。
經(jīng)REPET處理后7種聲音數(shù)據(jù)的MFCC特征如圖8所示。
圖8 MFCC特征Fig.8 Features of MFCC
本文將GMM應用于變壓器故障的聲紋識別。首先對每類聲音數(shù)據(jù)訓練出一個GMM,每類聲音訓練出的GMM是由聚類后的每一類的均值、加權系數(shù)和協(xié)方差矩陣組成。然后提取待測試聲音的聲紋特征并代入各個GMM,通過極大似然估計,將最大似然值對應的GMM聲音類型作為聲紋識別結果。GMM基本框架如圖9所示,其中L為混合成分數(shù)目。
圖9 GMM基本框架Fig.9 Basic framework of GMM
GMM訓練使用的數(shù)據(jù)庫由7種類型的聲音構成,分別為變壓器正常運行聲、平板放電聲、沿面放電聲、電暈放電聲、冷卻風機消音罩振動聲、固定風機的螺絲松動聲和電動機扇葉觸碰風罩聲。每種聲音時長180 s,前60 s用于模型訓練,后120 s與不同干擾聲音混合后用于模型測試。每個聲音樣本的時長15 s。模型訓練時,設置K-means最大迭代次數(shù)為5,最大期望算法最大迭代次數(shù)為30。不同混合成分數(shù)目的GMM的識別率見表2。從表2可以看出,識別率隨混合成分數(shù)目的增加而提高,當混合成分數(shù)目為3時,識別率達到100%。
表2 不同混合成分數(shù)目GMM識別率Tab.1 Recognition rates of GMM model with different numbers of mixed components
本文提出了一種基于REPET和GMM的變壓器故障聲紋識別方法,取得的主要成果及結論如下:
a)實驗模擬了不同類型的放電故障和機械故障聲。根據(jù)變電站內(nèi)常見的放電類型,模擬了變壓器油中均勻電場放電、沿面放電和變壓器外部電暈放電;機械故障主要模擬了變壓器冷卻風機的故障聲音,分別是冷卻風機消音罩振動、固定風機的螺絲松動和電動機扇葉觸碰風罩的聲音。分析了各種故障聲音和變電站內(nèi)干擾聲音的特征。
b)針對變電站內(nèi)非平穩(wěn)性干擾聲音,采用基于REPET的盲源分離算法將非平穩(wěn)干擾聲從混合聲音中分離,排除了非平穩(wěn)干擾聲音對聲紋識別的影響。
c)針對變電站內(nèi)的持續(xù)性干擾聲音,選擇魯棒性較好的MFCC特征和基于GMM的聲紋識別算法來降低風機噪聲對聲紋識別系統(tǒng)的影響。在實驗室環(huán)境下用變壓器正常運行聲和實驗模擬的6種故障聲音構建數(shù)據(jù)庫,每類聲音時長均為180 s,前60 s用于GMM訓練,后120 s與不同干擾聲音混合后用于模型測試。K-means最大迭代次數(shù)為5,最大期望算法最大迭代次數(shù)為30。GMM混合成分數(shù)目為3時,模型識別率可達100%。