杜京義,楊寧,榮相
(1.西安科技大學(xué)電氣與控制工程學(xué)院,陜西西安 710054;2.天地(常州)自動化股份有限公司,江蘇常州 213015)
異步電機在煤礦行業(yè)應(yīng)用廣泛,是起重機、掘進(jìn)機、采煤機、給水泵、空壓機、皮帶輸送機等旋轉(zhuǎn)機械的主要動力供應(yīng)設(shè)備,電機的正常工作是確保安全連續(xù)生產(chǎn)的前提。研究電機故障診斷在生產(chǎn)生活與學(xué)術(shù)研究方面都具有積極意義。
聲音是人類獲取信息的重要來源,機器設(shè)備聲學(xué)研究有重大意義。異步電機正常運行時發(fā)出的聲音具有一定規(guī)律性,當(dāng)出現(xiàn)故障時,其聲音特征也會隨之改變。因此,可以利用聲信號,將提取的音頻特征與某一類型的故障聯(lián)系起來,對異步電機進(jìn)行故障識別與診斷。文獻(xiàn)[7]利用支持向量機的方法檢測電機異常聲音,但前期聲音信號缺乏進(jìn)一步處理。文獻(xiàn)[8]利用音頻特征對電氣設(shè)備進(jìn)行監(jiān)測,驗證了方法的可行性,但是識別模型泛化能力較弱。文獻(xiàn)[9]利用BP算法對機車牽引電機進(jìn)行了故障診斷,取得了一定結(jié)果。文獻(xiàn)[10]采用小波包分析法提取微型電機聲音信號進(jìn)行故障診斷,提取信號中的沖擊成分,對故障電機進(jìn)行了判別。隨著人工智能的進(jìn)一步發(fā)展,以深度神經(jīng)網(wǎng)絡(luò)為代表的智能算法對聲音信號的分類已經(jīng)不斷地被引入設(shè)備故障監(jiān)測與維護。目前,對于電氣設(shè)備領(lǐng)域,深度學(xué)習(xí)在聲信號模式識別領(lǐng)域的研究多集中于變壓器,尚未見到將深度學(xué)習(xí)方法應(yīng)用于異步電機異常聲音檢測。
基于此,本文作者搭建3種狀態(tài)異步電機的檢測平臺并采集每一種狀態(tài)的聲音,分別提取每一個聲音片段的Log-Mel特征、MFCC特征、GFCC特征。建立卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型,通過對輸入的音頻特征進(jìn)行卷積、池化等操作處理,實現(xiàn)對異步電機的故障分類。
針對異步電機聲音信號能量主要分布在低頻段的特點,預(yù)加重處理可以提升高頻分量,使信號頻譜變得平坦:
()=()-α(-1)
(1)
其中:0.9≤≤1.0是預(yù)加重系數(shù);()為輸入的信號;()為預(yù)加重后的信號。
考慮到聲音信號的時變特性,需要對信號進(jìn)行短時分析。首先進(jìn)行預(yù)處理,它通常包含分幀與加窗2個步驟。分幀時確保幀長略大于幀間隔。文中取幀長為25 ms、幀間隔為10 ms,保證分幀后的信號不會缺失。
分幀后的信號在幀起點和幀終點處具有高度不連續(xù)性,直接進(jìn)行傅里葉變換,會導(dǎo)致頻譜出現(xiàn)局部峰值。因此,采用漢明窗(Hamming)對每個分幀后的信號進(jìn)行處理以減小失真現(xiàn)象。漢明窗公式如下:
(2)
式中:()為窗函數(shù)對應(yīng)的權(quán)重。
加窗后的信號()為
()=()×()
(3)
預(yù)處理后,利用離散傅里葉變換算法得到每一幀的頻譜,取模平方得信號的功率譜:
(4)
(5)
其中:()為幀信號的頻譜;()為幀信號的功率譜。
將()信號通過梅爾濾波器組,梅爾濾波器組由一組等高三角形濾波器組成,如圖1所示。濾波器組對得到的功率譜進(jìn)行濾波處理,放大中低頻分量,減小高頻分量,實現(xiàn)樣本數(shù)據(jù)的降維和準(zhǔn)確的特征提取。其函數(shù)()表示為
圖1 梅爾濾波器組
(6)
其中:為濾波器組編號;()為三角濾波器的中心頻率。
(7)
式中:為信號的總幀數(shù)。
對式(6)中的()進(jìn)行對數(shù)運算,得到對數(shù)功率譜′()作為Log-Mel特征:
′()=log()
(8)
該方法與Log-Mel特征方法大致相同,在Log-Mel特征參數(shù)的基礎(chǔ)上進(jìn)行離散余弦變換(DCT)得到MFCC特征參數(shù):
(9)
式中:為MFCC的階數(shù);為濾波器的個數(shù)。
所得到的MFCC特征僅反映聲音信號靜態(tài)特性,需要求其1階差分系數(shù)和2階差分系數(shù)描述聲音信號的動態(tài)特性:
(10)
(11)
將MFCC參數(shù)、1階差分系數(shù)()和2階差分系數(shù)′()組合成特征向量,提高系統(tǒng)識別的準(zhǔn)確性。
MFCC特征提取的主要流程如圖2所示。
圖2 MFCC特征提取流程
輸入信號需要執(zhí)行相同的預(yù)加重和分幀加窗操作,使用離散傅里葉變換后信號()。因異步電機聲音信號采集環(huán)境存在背景噪聲,選用非線性Gammatone濾波器組代替梅爾濾波器組。Gammatone濾波系數(shù)計算公式為
()=-1exp(-2π)cos(2π+)()
(12)
式中:為濾波器衰減因子;為中心頻率;為濾波器相位;()為階躍函數(shù)。
如圖3所示,Gammatone濾波器組的優(yōu)點是能夠模擬人耳的頻譜分析,具有很強的抗噪性,在有背景干擾的情況下同樣表現(xiàn)良好。
圖3 Gammatone濾波器組
結(jié)合公式(12),用冪函數(shù)=代替log函數(shù)校正信號,之后利用DCT,得到GFCC特征參數(shù):
()=
(13)
得到GFCC特征參數(shù),并按公式(10)(11)求其1階差分和2階差分系數(shù),組成GFCC特征向量。
GFCC特征提取的主要流程如圖4所示。
圖4 GFCC特征提取流程
基于3-100L2-4三相異步電機,通過改造正常異步電機轉(zhuǎn)子與外殼口徑,使它出現(xiàn)轉(zhuǎn)子斷條與氣隙偏心2種故障類型。根據(jù)GB3806-81的標(biāo)準(zhǔn)和要求對電機進(jìn)行聲學(xué)測量,測試模型如圖5所示。聲傳感器距離電機最外側(cè)30 cm,垂直指向電機的軸向,采樣頻率為48 000 Hz,采樣位數(shù)為24位,傳感器頻率響應(yīng)范圍為20~20 000 Hz。數(shù)據(jù)采集實物如圖6所示。
圖5 測試模型
圖6 數(shù)據(jù)采集實物
采集后的聲音首先劃分成1 s的長度并保存為音頻文件(.wav),后續(xù)作為輸入數(shù)據(jù)進(jìn)行特征處理。樣本包含3種狀態(tài)異步電機:正常、轉(zhuǎn)子斷條和氣隙偏心,每種狀態(tài)異步電機各有2臺,樣本數(shù)如表1所示。
表1 異步電機聲音信號信息
圖7所示為采集到的音頻信號的時域波形圖和頻譜圖。可見:3種狀態(tài)異步電機的頻率成分主要分布在2 000 Hz以內(nèi),不同狀態(tài)的頻譜差別較明顯。正常異步電機頻譜分布集中在0~500 Hz;轉(zhuǎn)子斷條異步電機頻譜分布在0~1 000 Hz,且有突出的800、900 Hz分量;氣隙偏心異步電機頻譜集中,突出800 Hz的分量。上述分析表明,聲音信號能夠作為區(qū)分異步電機類型的特征量。
圖7 不同異步電機的時域圖和頻譜圖
文中對采集的聲音數(shù)據(jù)分別提取3種特征:Log-Mel特征、MFCC特征、GFCC特征,特征參數(shù)的可視化結(jié)果按8∶2的比例分為訓(xùn)練集和測試集,訓(xùn)練集輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,測試集用來驗證訓(xùn)練結(jié)果是否過擬合。
按照第1節(jié)的方法對采集的數(shù)據(jù)進(jìn)行特征提取,特征提取結(jié)果尺寸為[39×99],前者代表特征參數(shù)的個數(shù),MFCC特征提取和GFCC特征提取過程中分別選取13個特征參數(shù),與其1階差分系數(shù)和2階差分系數(shù)共同組成39個特征參數(shù),為保持維度一致,提取Log-Mel特征時選擇39個特征參數(shù);后者代表幀信號劃分后的個數(shù),由輸入信號決定。3種特征提取方法都有明顯的數(shù)據(jù)降維效果,解決了聲音數(shù)據(jù)量大且復(fù)雜的問題。將特征提取的參數(shù)可視化作為CNN網(wǎng)絡(luò)的數(shù)據(jù)集,特征提取部分結(jié)果如圖8所示。
圖8 特征提取可視化結(jié)果
卷積神經(jīng)網(wǎng)絡(luò)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),在圖像識別領(lǐng)域具有獨特的優(yōu)勢。一個完整的卷積神經(jīng)網(wǎng)絡(luò)(CNN)一般包含輸入層、卷積層、激勵層、池化層、全連接層等結(jié)構(gòu)。
輸入層的主要作用是對原始數(shù)據(jù)進(jìn)行預(yù)處理,包括:取平均和歸一化。卷積層的作用是對數(shù)據(jù)進(jìn)行卷積,提取輸入圖像的特征。池化層的作用是降低由卷積操作得到的特征圖的維數(shù),常見的操作有最大值池化和平均值池化。激活函數(shù)是多層神經(jīng)網(wǎng)絡(luò)中上層節(jié)點的輸出與下層節(jié)點的輸入之間的函數(shù)關(guān)系。常用的激活函數(shù)有sigmoid、tanh和ReLU函數(shù)。全連接層的功能是將網(wǎng)絡(luò)學(xué)習(xí)到的特征映射到樣本的標(biāo)簽空間,將卷積輸出的二維特征映射轉(zhuǎn)化為一維向量,并輸出分類結(jié)果。
根據(jù)輸入數(shù)據(jù)的特點,提出一種三層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如表2所示。網(wǎng)絡(luò)由13層組成,共有11個隱藏層,包括3個卷積層、3個rule層、3個池化層和2個全連接層。卷積層使用的卷積核大小[3×3],卷積后進(jìn)行批規(guī)范化。池化層采用最大池化模式,步長為[2×2]。Dropout函數(shù)被添加到全連接層,并根據(jù)設(shè)置的概率丟棄,以防止過度擬合。輸出層由3個神經(jīng)元組成,代表3種狀態(tài)的異步電機輸入。
表2 異步電機故障識別網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)迭代100次,每次迭代所有數(shù)據(jù)被模型學(xué)習(xí)1次。其中,模型的學(xué)習(xí)率設(shè)定為0.000 1,Dropout為0.5,批尺寸設(shè)定為32,選用ADAM優(yōu)化器與多分類交叉熵?fù)p失函數(shù)。該模型在Pytorch上建立,在配有GTX 1660 GPU的計算機上運行,網(wǎng)絡(luò)訓(xùn)練結(jié)果如圖9所示。
圖9 網(wǎng)絡(luò)訓(xùn)練準(zhǔn)確率結(jié)果
當(dāng)訓(xùn)練完成后,保存訓(xùn)練好的模型,計算測試集分類精度,結(jié)果如表3所示。其中,Log-Mel-CNN、MFCC-CNN、GFCC-CNN分別表示采用Log-Mel特征、MFCC特征以及GFCC特征的基于CNN的識別系統(tǒng)。
表3 CNN模型的識別精度 單位:%
由表3可知:文中所搭建的神經(jīng)網(wǎng)絡(luò)能夠很好地識別3種特征參數(shù),對于異步電機的測試樣本,采用MFCC和GFCC特征參數(shù)的識別系統(tǒng)都具有較高的識別準(zhǔn)確率;采用GFCC來表征聲音信號并進(jìn)行訓(xùn)練,平均識別精度最高,達(dá)到了95.4%,分別比Log-Mel、MFCC高了7.6%和4.9%。斷條故障電機會在構(gòu)造以及實驗采集過程中受到偏心信號的影響,因此Mel濾波器的2種特征識別都不太理想。結(jié)果表明:在復(fù)雜環(huán)境下,GFCC特征提取的魯棒性能更強。
分別采集了3類異步電機的聲音,分析3種狀態(tài)異步電機聲音信號頻率分布特點。參考當(dāng)前區(qū)分環(huán)境聲音的分類方法,將聲學(xué)特征提取運用到異步電機的故障分類中。分別采用Log-Mel、MFCC、GFCC 3種方法對信號進(jìn)行特征提取,最后利用卷積神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行了分類識別與比較。結(jié)果表明:3種特征提取方法能夠有效降低聲音樣本數(shù)據(jù)量和復(fù)雜程度,其中GFCC特征提取方法更適合于深度卷積神經(jīng)網(wǎng)絡(luò)的識別模型,平均識別準(zhǔn)確率達(dá)到95.4%。