劉恒 馮濤 王晶 楊偉成
1. 北京工商大學(xué) 北京 100048;
2. 中國(guó)家用電器研究院 北京 100037
異音檢測(cè)是壓縮機(jī)產(chǎn)線質(zhì)量檢測(cè)的重要工序環(huán)節(jié),許多專家學(xué)者在壓縮機(jī)檢測(cè)方向進(jìn)行了深入研究并取得了優(yōu)質(zhì)的成果[1-4]。近年來(lái),隨著機(jī)器學(xué)習(xí)的快速發(fā)展,深度學(xué)習(xí)被引入到機(jī)械故障檢測(cè)中,并取得了成果。通常,故障檢測(cè)包括特征提取和分類兩個(gè)步驟。從原始信號(hào)中提取故障特征,然后通過(guò)人工經(jīng)驗(yàn)判斷或模態(tài)識(shí)別技術(shù)進(jìn)行分類[5-7]。盡管這些方法取得了一定成果,但其良好的性能需要大量標(biāo)記數(shù)據(jù)。對(duì)于實(shí)際使用的壓縮機(jī),很難收集到足夠的標(biāo)記數(shù)據(jù)。楊斌等人[8]提出了一種基于特征的遷移神經(jīng)網(wǎng)絡(luò)(FTNN),利用實(shí)驗(yàn)室機(jī)器的診斷知識(shí)來(lái)識(shí)別實(shí)際機(jī)器的健康狀態(tài)以解決樣本數(shù)據(jù)少的問(wèn)題。李春陽(yáng)等[9]利用數(shù)據(jù)增強(qiáng)的方式開(kāi)發(fā)出一種基于卷積生成對(duì)抗網(wǎng)絡(luò)模型用以解決訓(xùn)練樣本稀少的問(wèn)題。在實(shí)際中,壓縮機(jī)大多在正常狀態(tài)下運(yùn)行,呈現(xiàn)正常信號(hào)樣本豐富,故障信號(hào)樣本稀少的特點(diǎn)。為解決冰箱壓縮機(jī)故障信號(hào)樣本稀少的難題,本文應(yīng)用自編碼器模型,以大量正常信號(hào)樣本為基礎(chǔ),研究冰箱壓縮機(jī)正常信號(hào)樣本共性特征的提取方法,進(jìn)而實(shí)現(xiàn)壓縮機(jī)的異音檢測(cè)。
自編碼器由編碼器和解碼器兩部分構(gòu)成,編碼環(huán)節(jié)通過(guò)輸入原始數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行壓縮,得到低維數(shù)據(jù)空間中的特征向量,該特征包括原始特征的本質(zhì)信息。而解碼環(huán)節(jié)通過(guò)前向傳播對(duì)自編碼器的參數(shù)進(jìn)行優(yōu)化調(diào)整,最終學(xué)習(xí)到原始數(shù)據(jù)的特征。如圖1所示。
圖1 自編碼器結(jié)構(gòu)
自編碼器編碼、解碼過(guò)程可表示為[10]:
其中,σα為激活函數(shù),在編碼階段采用的為Relu激活函數(shù),W為輸入數(shù)據(jù)的權(quán)重,b為偏置。
其中,σβ為激活函數(shù),在編碼階段采用的為Relu和Sigmoid激活函數(shù)相結(jié)合的方式,W'為輸出數(shù)據(jù)的權(quán)重,取W'=WT,b'為偏置。通過(guò)不斷更新各層的調(diào)節(jié)權(quán)重和偏置參數(shù),使重構(gòu)誤差達(dá)到最小,達(dá)到最優(yōu)網(wǎng)絡(luò)。
Adam算法(Adaptive Moment Estimation Algorithm, Adam)廣泛用于深度學(xué)習(xí)優(yōu)化的學(xué)習(xí),不僅可以采用動(dòng)量法作為參數(shù)的更新方向,還可以通過(guò)矩估計(jì)法調(diào)節(jié)每個(gè)參數(shù)的學(xué)習(xí)率。由于Adam算法對(duì)超參數(shù)具有很強(qiáng)的魯棒性,因而在深度學(xué)習(xí)領(lǐng)域被廣泛應(yīng)用。Adam算法參數(shù)的更新差值為[11]:
其中,Δθt為需要更新的參數(shù); 為對(duì)一階梯度的校正,可以提供增大學(xué)習(xí)率的參數(shù),加速訓(xùn)練能力;為對(duì)二階梯度的校正,提供減少學(xué)習(xí)率的能力;為常數(shù);α為學(xué)習(xí)率。
自編碼器聲信號(hào)共性特征提取流程如圖2所示,步驟如下:
圖2 自編碼器異常振動(dòng)檢測(cè)流程
(1)采集原始振動(dòng)信號(hào)。
(2)對(duì)采集的信號(hào)進(jìn)行預(yù)處理,圖3 a)、圖4 a)分別為采集到的正常樣本信號(hào)通過(guò)不同預(yù)處理后的頻譜圖。
圖3 經(jīng)過(guò)頻域FFT變換后的頻譜圖及提取到的自編碼器共性特征
圖4 經(jīng)過(guò)頻域FFT對(duì)數(shù)譜變換后的頻譜圖及提取到的自編碼器共性特征
(3)劃分為訓(xùn)練集和測(cè)試集。
(4)把訓(xùn)練集的樣本作為自編碼器的輸入、將解碼后的輸出當(dāng)作重構(gòu)目標(biāo),損失函數(shù)為:
(5)將正常樣本輸入到編碼器中得到的輸出即為正常信號(hào)的共性特征信息,提取到的隱藏層共性特征如圖3 b)、圖4 b)所示。
(6)將測(cè)試集中的振動(dòng)信號(hào)輸入網(wǎng)絡(luò)通過(guò)重構(gòu)誤差對(duì)比進(jìn)行故障檢測(cè)分類。
由于故障樣本較難收集,考慮到測(cè)試集數(shù)據(jù)正負(fù)樣本差距較大,需對(duì)故障樣本進(jìn)行重疊采樣以建立一個(gè)平衡的數(shù)據(jù)集,本文對(duì)原始樣本進(jìn)行一定重疊比例分割的方法。采用重疊分割的方法對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充,樣本擴(kuò)充示意圖如圖5所示,這樣做既可以保證數(shù)據(jù)信息不會(huì)損失,同時(shí)還能提高樣本數(shù)量。在選擇樣本長(zhǎng)度的問(wèn)題上,過(guò)短的信號(hào)樣本會(huì)導(dǎo)致信息量不足,過(guò)長(zhǎng)的樣本又會(huì)使整體模型學(xué)習(xí)時(shí)間過(guò)長(zhǎng),所以選擇一個(gè)適合的樣本長(zhǎng)度也是至關(guān)重要的。
圖5 樣本擴(kuò)充示意圖
樣本擴(kuò)充公式如下:
其中,N為以重疊率η分割后的樣本數(shù)量,L為一段聲信號(hào)樣本的長(zhǎng)度,len為預(yù)先設(shè)置分割后的樣本長(zhǎng)度。
以某型冰箱壓縮機(jī)為研究對(duì)象,在生產(chǎn)線上采集其殼體振動(dòng)信號(hào),振動(dòng)信號(hào)采集過(guò)程中所使用的設(shè)備主要包括帶有Pulse系統(tǒng)的計(jì)算機(jī)、采集卡及加速度傳感器。采集過(guò)程如圖6所示,將加速度傳感器貼在處于工作狀態(tài)中的壓縮機(jī)外表面,并用Pulse系統(tǒng)將壓縮機(jī)的振動(dòng)信號(hào)錄制下來(lái)。采集到的振動(dòng)信號(hào)由專業(yè)人員進(jìn)行分類,包括正常和異常兩種壓縮機(jī)振動(dòng)信號(hào)。涉及的故障類型主要包括無(wú)油、內(nèi)排氣管焊堵、閥減震彈簧與內(nèi)排氣管間隙大、吸油管脫落、內(nèi)排氣管碰殼。采集到正常數(shù)據(jù)893個(gè),故障數(shù)據(jù)52個(gè),采用預(yù)處理后得到正常信號(hào)樣本4937個(gè),故障信號(hào)樣本為532個(gè)。其中訓(xùn)練集只包括正常樣本,數(shù)量為2000個(gè);測(cè)試集包括正常和故障樣本兩類,分別取500個(gè),訓(xùn)練集與測(cè)試集的樣本并不重疊。
圖6 采集裝置連接示意圖
自編碼器模型使用正常數(shù)據(jù)訓(xùn)練得到,正常數(shù)據(jù)的重構(gòu)結(jié)果與正常原始數(shù)據(jù)相差較小;但是將故障數(shù)據(jù)代入該自編碼器模型中,所得到的重構(gòu)結(jié)果就會(huì)與故障原始數(shù)據(jù)有較大的誤差,可以對(duì)重構(gòu)誤差設(shè)置相應(yīng)的閾值以實(shí)現(xiàn)故障機(jī)的識(shí)別,通過(guò)均方差計(jì)算可確定最優(yōu)閾值作為故障分類標(biāo)準(zhǔn)。圖7為采用頻域FFT對(duì)數(shù)譜的數(shù)據(jù)處理方式得到的正常、故障樣本均方差圖,從圖中可以看出正常樣本與故障樣本的均方差分布以6100左右為界限,最后可進(jìn)行細(xì)化測(cè)試,找到最佳閾值的位置。
圖7 正常、故障樣本均方差圖
選擇合適的數(shù)據(jù)處理方式在學(xué)習(xí)模型中起到了一個(gè)關(guān)鍵的作用,考慮樣本為一維時(shí)域信號(hào),通常信號(hào)數(shù)據(jù)處理方式有時(shí)域處理、FFT頻域處理等處理方式,這里選用FFT頻域處理和FFT頻域?qū)?shù)處理兩種方式進(jìn)行不同學(xué)習(xí)率對(duì)學(xué)習(xí)模型的影響,為了消除隨機(jī)誤差的影響對(duì)每組分別進(jìn)行5次測(cè)試,并以測(cè)試集最終的平均準(zhǔn)確率為結(jié)果。表1為不同數(shù)據(jù)處理方式和學(xué)習(xí)率實(shí)驗(yàn)結(jié)果。
表1 不同數(shù)據(jù)處理方式和學(xué)習(xí)率實(shí)驗(yàn)結(jié)果
使用頻域FFT及頻域FFT對(duì)數(shù)譜的數(shù)據(jù)處理分別在不同學(xué)習(xí)率下的故障分類準(zhǔn)確率如表1所示。由表1的結(jié)果可以看出,利用頻域FFT及頻域FFT對(duì)數(shù)譜進(jìn)行數(shù)據(jù)處理時(shí),最優(yōu)的準(zhǔn)確率出現(xiàn)在學(xué)習(xí)率為1e-4和頻域?qū)?shù)譜的數(shù)據(jù)處理方式上。隨著學(xué)習(xí)率的增加,識(shí)別準(zhǔn)確率出現(xiàn)了不同程度的下降。從圖8的PR曲線來(lái)看,頻域FFT對(duì)數(shù)譜和頻域FFT均具有較好的學(xué)習(xí)性能,但使用頻域FFT對(duì)數(shù)譜要更勝一籌。分析其原因,使用頻域FFT數(shù)據(jù)處理時(shí),不僅可以避免信號(hào)的多樣性及不確定性,還可以提高頻率的分辨率。而使用頻率FFT對(duì)數(shù)譜的數(shù)據(jù)處理方式,對(duì)數(shù)譜數(shù)值小的部分差異的敏感程度要比數(shù)值大的部分的差異敏感程度更高,且信號(hào)更接近于人耳實(shí)際聽(tīng)取的聲音,所以更有利于增加其分辨能力。
圖8 不同數(shù)據(jù)處理下的PR曲線
為了在少量故障壓縮機(jī)樣本的條件下進(jìn)行故障檢測(cè),本文提出了一種共性特征提取及檢測(cè)的自編碼器系統(tǒng)。學(xué)習(xí)模型由全連接層的自編碼器網(wǎng)絡(luò)堆疊而成,并用兩種數(shù)據(jù)處理方式進(jìn)行對(duì)比分析,利用非標(biāo)記數(shù)據(jù)樣本來(lái)發(fā)掘數(shù)據(jù)中的內(nèi)部結(jié)構(gòu),根據(jù)測(cè)試結(jié)果可以得出:使用頻域FFT對(duì)數(shù)譜的數(shù)據(jù)處理方式且在學(xué)習(xí)率為1e-4的條件下,具有較好的分類結(jié)果,準(zhǔn)確率達(dá)到97.4%。
綜上所述,在選定合適的自編碼器參數(shù)和頻域FFT對(duì)數(shù)譜的條件下,自編碼器可以用于壓縮機(jī)的異常振動(dòng)監(jiān)測(cè)。本文所有的樣本數(shù)據(jù)雖然采集于往復(fù)式冰箱壓縮機(jī),但是本文所用到的自編碼器模型并不限于適用往復(fù)式冰箱壓縮機(jī),也適用于其他類型壓縮機(jī)。