陳 浩, 鄧 鵬
(1.國(guó)防科技大學(xué) 智能科學(xué)學(xué)院, 長(zhǎng)沙 410005; 2.國(guó)防科技大學(xué) 信息通信學(xué)院, 西安 710100)
軍用直升機(jī)在現(xiàn)代軍事中已經(jīng)成為一種不可或缺的武器裝備,直升機(jī)安全可靠性的研究成為一個(gè)重要課題[1]。直升機(jī)傳動(dòng)系統(tǒng)故障的機(jī)械部件一般沒(méi)有冗余結(jié)構(gòu),一旦出現(xiàn)故障,將會(huì)發(fā)生嚴(yán)重的安全事故[2-3]。飛行過(guò)程中,直升機(jī)傳動(dòng)系統(tǒng)中的軸承受到長(zhǎng)期的摩擦和疲勞應(yīng)力,極易產(chǎn)生性能退化和故障失效,對(duì)直升機(jī)軸承進(jìn)行退化特征提取和故障預(yù)測(cè),有利于提前預(yù)警,化險(xiǎn)為夷[4-5]。傳統(tǒng)方法中,通過(guò)提取機(jī)械振動(dòng)信號(hào)中的統(tǒng)計(jì)特征如均方根(Root mean square, RMS)和峭度等能較好地觀察零部件的性能退化特征[6-10]。而直升機(jī)軸承振動(dòng)信號(hào)中含有大量環(huán)境噪聲,傳統(tǒng)方法提取出的特征性能較差,難以提取出軸承的準(zhǔn)確退化特征。卷積自編碼器(Convolutional autoencoder, CAE)是深度自編碼器的一種變體,具有較強(qiáng)的無(wú)監(jiān)督特征學(xué)習(xí)能力和降噪功能,主要用于圖像降噪,較少應(yīng)用于機(jī)械振動(dòng)信號(hào)研究[11]。本文創(chuàng)新性地將CAE應(yīng)用于軸承振動(dòng)信號(hào)的自適應(yīng)多維退化特征提取,結(jié)果證明該方法非常適合軸承的退化特征提取。
卷積自編碼器借鑒了自編碼器無(wú)監(jiān)督學(xué)習(xí)的特點(diǎn),以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network, CNN)中的卷積層和池化層代替自編碼器中的全連接層,通過(guò)較少的網(wǎng)絡(luò)參數(shù)可以實(shí)現(xiàn)特征提取[12-13]。卷積自編碼器的結(jié)構(gòu)及訓(xùn)練流程簡(jiǎn)圖,如圖1所示。卷積自編碼器中的卷積核相當(dāng)于濾波器,可以用來(lái)提取數(shù)據(jù)的局部區(qū)域特征。池化層一般用來(lái)進(jìn)行特征選擇,保留顯著特征,減少參數(shù)量。
圖1 卷積自編碼器的結(jié)構(gòu)及訓(xùn)練流程
以一維卷積為例,介紹卷積運(yùn)算和池化運(yùn)算。
(1)卷積
定義w1,w2,…,wm為一組卷積核,深度學(xué)習(xí)里的卷積實(shí)現(xiàn)大部分都是互相關(guān)運(yùn)算,即卷積核不進(jìn)行翻轉(zhuǎn)操作。一維數(shù)據(jù)序列x與卷積核w的卷積操作定義為:
(1)
式中m表示卷積核長(zhǎng)度,一般卷積核尺寸m遠(yuǎn)遠(yuǎn)小于數(shù)據(jù)序列尺寸n。因此,卷積相當(dāng)于卷積核在數(shù)據(jù)序列上求移動(dòng)平均。
(2)池化
池化是下采樣方法的一種,主要是對(duì)特征進(jìn)行聚合降維。一般地,在經(jīng)過(guò)卷積層之后輸入,雖然網(wǎng)絡(luò)連接數(shù)量大幅減少,但是經(jīng)過(guò)不同卷積核特征映射后的網(wǎng)絡(luò)連接總量依舊很多,特征維度很高,所以在卷積之后需引入池化對(duì)特征進(jìn)行降維,這樣能夠有效避免過(guò)擬合,減少網(wǎng)絡(luò)參數(shù)量,提高計(jì)算速度。
池化運(yùn)算將數(shù)據(jù)劃分為若干個(gè)子區(qū)域,以子區(qū)域數(shù)據(jù)的統(tǒng)計(jì)特征作為子區(qū)域的輸出。常見(jiàn)的池化運(yùn)算有均值池化(Mean pooling)和最大池化(Maximum pooling),兩種池化運(yùn)算的數(shù)學(xué)表達(dá)式為:
均值池化:
(2)
最大池化:
(3)
式中:x表示池化運(yùn)算前輸入;yj,m表示第j個(gè)特征映射第m個(gè)子區(qū)域的池化輸出;s表示移動(dòng)步長(zhǎng);r表示子區(qū)域尺寸大小。通過(guò)調(diào)整移動(dòng)步長(zhǎng)s和子區(qū)域尺寸r的數(shù)值,子區(qū)域可以重疊,也可以不重疊。
對(duì)于輸入數(shù)據(jù)x,卷積自編碼器第k個(gè)卷積核的特征映射輸出可以表示為:
hk=s(x*Wk+bk)
(4)
式中:*表示卷積運(yùn)算;Wk和bk分別表示第k個(gè)卷積核的權(quán)重矩陣和網(wǎng)絡(luò)偏置。
通過(guò)卷積后,接下來(lái)對(duì)輸出hk進(jìn)行下采樣得到:
(5)
通過(guò)編碼—解碼過(guò)程后,最后的反卷積層重構(gòu)輸出為:
卷積自編碼器的訓(xùn)練過(guò)程一般是通過(guò)最小化損失函數(shù)對(duì)卷積核權(quán)重矩陣W和偏置b進(jìn)行尋優(yōu)求解,利用誤差反向傳播(Back propagation, BP)算法進(jìn)行參數(shù)學(xué)習(xí)調(diào)整,梯度下降算法更新網(wǎng)絡(luò)參數(shù),這與常用經(jīng)典自編碼器的訓(xùn)練過(guò)程基本一致。
基于卷積自編碼器的最優(yōu)退化特征提取方法主要思想為:將采集的原始振動(dòng)數(shù)據(jù)按監(jiān)測(cè)周期裁剪成多個(gè)樣本,依次輸入到卷積自編碼器中,利用卷積和池化運(yùn)算,自適應(yīng)提取多組編碼特征作為候選退化特征,基于退化特征評(píng)估指標(biāo)進(jìn)行評(píng)估,從中挑選評(píng)估結(jié)果最優(yōu)的候選退化特征作為最終的退化特征。
基于卷積自編碼器的最優(yōu)退化特征提取流程如圖2所示,主要有以下幾個(gè)步驟:
圖2 基于卷積自編碼器的最優(yōu)退化特征提取方法流程
(1)數(shù)據(jù)采集:通過(guò)在實(shí)驗(yàn)設(shè)備上安裝加速度傳感器采集振動(dòng)信號(hào),設(shè)定好采樣率、采樣間隔、每次采樣時(shí)長(zhǎng)及停機(jī)條件,從而獲得預(yù)測(cè)對(duì)象的全壽命數(shù)據(jù)。
(2)構(gòu)建數(shù)據(jù)集:對(duì)步驟1中數(shù)據(jù)取絕對(duì)值,根據(jù)單監(jiān)測(cè)周期內(nèi)采樣點(diǎn)數(shù),將數(shù)據(jù)裁剪成等長(zhǎng)樣本數(shù)據(jù),樣本內(nèi)數(shù)據(jù)點(diǎn)數(shù)即單監(jiān)測(cè)周期內(nèi)采樣點(diǎn)數(shù)。由于是無(wú)監(jiān)督訓(xùn)練學(xué)習(xí),所有數(shù)據(jù)集樣本數(shù)據(jù)均為訓(xùn)練集,訓(xùn)練集輸入與標(biāo)簽均為原始數(shù)據(jù),數(shù)據(jù)格式為(原始數(shù)據(jù),原始數(shù)據(jù))。
(3)網(wǎng)絡(luò)模型搭建及訓(xùn)練:根據(jù)數(shù)據(jù)集樣本數(shù)目及樣本內(nèi)數(shù)據(jù)點(diǎn)數(shù)設(shè)定CAE網(wǎng)絡(luò)模型參數(shù),包括網(wǎng)絡(luò)層數(shù)、每層卷積核數(shù)量及尺寸和池化區(qū)域尺寸等。網(wǎng)絡(luò)訓(xùn)練方式采用批量訓(xùn)練,批量訓(xùn)練尺寸在計(jì)算內(nèi)存允許的情況下可以適當(dāng)取較大值。通過(guò)事先設(shè)定迭代次數(shù)或者損失函數(shù)的閾值來(lái)判斷網(wǎng)絡(luò)模型是否完成訓(xùn)練。初次設(shè)定的網(wǎng)絡(luò)模型參數(shù)可能達(dá)不到要求,需要根據(jù)損失函數(shù)的收斂情況來(lái)逐步調(diào)整網(wǎng)絡(luò)參數(shù),從而獲得較好的網(wǎng)絡(luò)模型。
(4)輸出候選退化特征:輸入數(shù)據(jù)集樣本數(shù)據(jù),待網(wǎng)絡(luò)模型完成訓(xùn)練之后,通過(guò)編碼器輸出得到多組候選退化特征。
(5)特征評(píng)估及選擇:基于退化特征評(píng)估指標(biāo),對(duì)步驟4中得到的多組候選退化特征進(jìn)行量化評(píng)價(jià),從中選擇評(píng)價(jià)結(jié)果最好的作為最優(yōu)退化特征。
基于退化特征評(píng)估指標(biāo)進(jìn)行量化評(píng)價(jià)選出最優(yōu)退化特征,采用的評(píng)價(jià)指標(biāo)為常用的單調(diào)性(Monotonicity)、相關(guān)性(Correlation)和魯棒性(Robustness)三個(gè)指標(biāo)的加權(quán)平均[14],由于單調(diào)性是退化特征較為關(guān)鍵的屬性,設(shè)置三者權(quán)重比例為0.5∶0.25∶0.25。評(píng)估計(jì)算式為:
(7)
式中Score值越大,表明退化特征的綜合評(píng)估結(jié)果越好。
實(shí)驗(yàn)數(shù)據(jù)來(lái)源為PHM 2012數(shù)據(jù)挑戰(zhàn)賽提供的軸承加速退化全壽命數(shù)據(jù)集[15],數(shù)據(jù)由軸承垂直方向和水平方向加速度計(jì)采集,傳感器采樣頻率為25.6 kHz,監(jiān)測(cè)周期為10 s,每個(gè)檢測(cè)周期采樣0.1 s,因此,每個(gè)樣本包含2 560個(gè)數(shù)據(jù)點(diǎn)。實(shí)驗(yàn)定義:軸承振動(dòng)信號(hào)超過(guò)20 g,即認(rèn)為軸承出現(xiàn)故障失效。經(jīng)分析,軸承水平方向振動(dòng)信號(hào)時(shí)域波形普遍比垂直方向振動(dòng)信號(hào)時(shí)域波形趨勢(shì)性更好,波動(dòng)性更小。因此,退化特征提取僅使用軸承的水平方向振動(dòng)信號(hào)。
進(jìn)行特征提取的CAE網(wǎng)絡(luò)模型基本設(shè)計(jì)原則為:
(1)第一層卷積核尺寸可以適當(dāng)取大。設(shè)定為32、48和64等,這樣可以獲得更大的感受野區(qū)域,使得較深層網(wǎng)絡(luò)仍能保留輸入數(shù)據(jù)的原始信息。
(2)其余層卷積核尺寸不宜過(guò)大。一般設(shè)為3或者5,在一維卷積中小尺寸卷積核能夠更有效地平滑信號(hào)噪聲。
(3)下采樣區(qū)域尺寸不宜過(guò)大。避免過(guò)度損失數(shù)據(jù)中的原始信息。
針對(duì)網(wǎng)絡(luò)層數(shù)、下采樣區(qū)域尺寸設(shè)計(jì)了多種不同的CAE網(wǎng)絡(luò)結(jié)構(gòu),卷積核和采樣層區(qū)域移動(dòng)步長(zhǎng)均設(shè)為1,最終提取出最優(yōu)退化特征,其CAE網(wǎng)絡(luò)結(jié)構(gòu)模型參數(shù)如表1所示。
表1 CAE最優(yōu)退化特征提取方法的網(wǎng)絡(luò)結(jié)構(gòu)模型參數(shù)
該模型所提取的CAE最優(yōu)退化特征實(shí)驗(yàn)結(jié)果如圖3所示,特征結(jié)果進(jìn)行了歸一化處理。可以看出,本文所提取的退化特征具有明顯的退化趨勢(shì)。
(a)軸承1-1 (b)軸承1-2
為了驗(yàn)證CAE最優(yōu)退化特征方法的有效性,基于單調(diào)性等特征評(píng)估指標(biāo),將本文得到的CAE最優(yōu)退化特征與RMS特征、自組織映射融合特征進(jìn)行對(duì)比。其中,RMS是一種常用的表征信號(hào)能量的特征,能較好地表征機(jī)械零部件的退化過(guò)程,但在大噪聲工況下早期趨勢(shì)不明顯,效果較差[16]。RMS的數(shù)學(xué)表達(dá)式為:
(8)
式中:n表示信號(hào)長(zhǎng)度;xi表示振動(dòng)信號(hào)的幅值。
CAE-SOM融合特征是指在數(shù)據(jù)樣本輸入CAE網(wǎng)絡(luò)模型后得到n條候選退化特征曲線,將這些候選退化特征輸入SOM網(wǎng)絡(luò)進(jìn)行降維融合,計(jì)算輸入特征數(shù)據(jù)x與最佳匹配單元(Best matching unit, BMU)間的最小量化誤差(Minimum quantization error, MQE),最小量化誤差即為得到的CAE-SOM融合特征[17]。最小量化誤差的表達(dá)式為:
(9)
根據(jù)經(jīng)驗(yàn),SOM網(wǎng)絡(luò)拓?fù)鋵由窠?jīng)元總數(shù)設(shè)為4×30,迭代次數(shù)設(shè)為100,初始學(xué)習(xí)率和學(xué)習(xí)率參數(shù)分別為0.6和1 000。
4組軸承數(shù)據(jù)的3種特征性能歸一化評(píng)估結(jié)果如表2所示,表中Mon、Corr和Rob分別表示單調(diào)性、相關(guān)性和魯棒性指標(biāo),按照0.5∶0.25∶0.25的權(quán)重比值得到綜合評(píng)價(jià)值Score。評(píng)估結(jié)果表明,通過(guò)CAE網(wǎng)絡(luò)模型提取出來(lái)的退化特征的單調(diào)性和魯棒性更好,綜合評(píng)價(jià)值也更高。
表2 3種特征的特征性能評(píng)估結(jié)果
進(jìn)一步對(duì)噪聲環(huán)境下的軸承數(shù)據(jù)進(jìn)行了仿真,在原始數(shù)據(jù)上添加了高斯白噪聲,加噪信號(hào)構(gòu)造方法為:
Nosie_data =Data+Noise_factor×Randn(n)
(10)
式中:Nosie_date表示加噪仿真信號(hào);Date表示原始振動(dòng)信號(hào);Noise_factor為高斯白噪聲的信號(hào)幅值,本文取1;Rand(n)是信號(hào)序列長(zhǎng)度為n,均值為0,方差為1的高斯隨機(jī)序列。
對(duì)加噪仿真信號(hào)分別提取RMS特征、CAE-SOM融合特征和CAE最優(yōu)特征,并采用特征性能評(píng)估指標(biāo)對(duì)其性能進(jìn)行對(duì)比評(píng)估,結(jié)果如表3所示??梢钥吹?,CAE-SOM和CAE最優(yōu)退化特征的單調(diào)性和魯棒性都明顯優(yōu)于RMS特征,這表明卷積具有較好的濾波作用。其中,CAE-SOM和CAE最優(yōu)退化特征的區(qū)別在于CAE-SOM是將數(shù)據(jù)輸入CAE模型后,得到的n條候選退化特征曲線進(jìn)行降維融合,并計(jì)算MQE得到的數(shù)據(jù),而CAE最優(yōu)退化特征是從n條候選退化特征曲線中去提取最優(yōu)退化特征。表中CAE-SOM融合特征在某些組數(shù)據(jù)表現(xiàn)較差,這是因?yàn)橥ㄟ^(guò)CAE網(wǎng)絡(luò)模型得到的多組候選退化特征里有些特征并不具備表征軸承退化過(guò)程的能力,融合特征里摻雜了這些較差的特征,從而導(dǎo)致融合特征的評(píng)價(jià)結(jié)果較差。因此,在綜合評(píng)分上,CAE最優(yōu)退化特征性能是最優(yōu)的,本文所提取的最優(yōu)退化特征具有良好的特征表征效果,具備較好的特征性能。
表3 加噪下3種特征的特征性能評(píng)估結(jié)果
針對(duì)軸承加速退化振動(dòng)數(shù)據(jù),應(yīng)用卷積自編碼器開展退化特征提取方法研究,本方法提取的軸承最優(yōu)退化特征經(jīng)實(shí)驗(yàn)對(duì)比驗(yàn)證和加噪仿真對(duì)比,表現(xiàn)出良好的特征表征效果。該方法能夠自適應(yīng)提取單調(diào)性更好和更加平滑的退化特征,為狀態(tài)監(jiān)測(cè)及后續(xù)的預(yù)測(cè)工作提供幫助。