常 春, 梅檢民, 趙慧敏, 沈 虹, 王雙朋
(陸軍軍事交通學(xué)院,天津 300161)
柴油機(jī)作為重要的動(dòng)力源,快速、準(zhǔn)確診斷其故障具有重要意義。振動(dòng)信號(hào)中蘊(yùn)含了豐富的故障信息,以其不解體、易采集等優(yōu)點(diǎn),越來越廣泛的被應(yīng)用于故障診斷。但柴油機(jī)機(jī)構(gòu)復(fù)雜、振源多樣,并且振動(dòng)信號(hào)大多是非平穩(wěn)和非高斯信號(hào),淹沒在各種高斯噪聲和干擾中,利用傳統(tǒng)的二階統(tǒng)計(jì)量(功率譜、自相關(guān)等)分析方法,很難達(dá)到理想的效果[1]。高階累積量具有對(duì)高斯有色噪聲恒為零的特點(diǎn),理論上可以完全消除高斯噪聲的影響,因而可以用于提取高斯有色噪聲中的非高斯信號(hào)[2]。蔡劍華等提出了由信號(hào)高階譜恢復(fù)功率譜的方法,提取滾動(dòng)軸承故障特征,但是該方法計(jì)算量大耗時(shí)長,不便于應(yīng)用于實(shí)時(shí)監(jiān)測。沈虹等[3]利用角域四階量切片譜方法提取連桿軸承故障特征,雖然通過重采樣的辦法,克服了非平穩(wěn)信號(hào)對(duì)角切片與非對(duì)角切片不相等的問題,但是對(duì)于對(duì)角線以外的信息不能有效的反映。任金成等[4-5]分別提取振動(dòng)信號(hào)時(shí)頻分布圖和三階累積量圖的灰度共生矩陣圖像紋理特征來診斷柴油機(jī)故障,取得了一定的效果,但是這些方法要從圖像中再次提取特征用于分類識(shí)別,計(jì)算繁瑣且易遺漏有效信息,影響了故障診斷的準(zhǔn)確率。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)專門用來處理圖像等具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),具有自動(dòng)提取抽象特征的能力,避免人工提取特征的片面性[6],目前已經(jīng)應(yīng)用到機(jī)械故障診斷領(lǐng)域,并取得了一定的效果。吳春志等[7-8]將一維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于齒輪箱故障診斷,直接以振動(dòng)信號(hào)作為輸入,實(shí)現(xiàn)故障診斷,但缺乏對(duì)原始振動(dòng)信號(hào)進(jìn)行噪聲抑制,對(duì)低信噪比振動(dòng)信號(hào)的故障診斷效果還需進(jìn)一步研究。李恒等[9]將短時(shí)傅里葉變換(short-time Fourier transform,STFT)時(shí)頻圖與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,袁建虎等[10-12]將不同的小波變換(wavelet transform,WT)時(shí)頻圖與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合實(shí)現(xiàn)機(jī)械故障診斷,但因時(shí)頻圖本身沒有噪聲抑制能力,圖像識(shí)別率容易受到圖像質(zhì)量好壞的影響。
針對(duì)上述問題,本文提出了一種利用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別振動(dòng)信號(hào)三階累積量(third-order cumulant,CUM3)灰度圖的柴油機(jī)故障診斷方法。利用三階累積量抑制高斯噪聲的先天特點(diǎn),采用三階累積量對(duì)缸蓋振動(dòng)信號(hào)進(jìn)行分析,生成抑制噪聲后的灰度圖像,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,用具有動(dòng)量的隨機(jī)梯度下降優(yōu)化算法和學(xué)習(xí)率退火方法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),通過遺傳算法優(yōu)化訓(xùn)練參數(shù),用訓(xùn)練好的網(wǎng)絡(luò)對(duì)柴油機(jī)高壓油路的5種工況進(jìn)行故障診斷,取得了良好的效果。
設(shè)x(t)為零均值的隨機(jī)信號(hào),其三階累積量可表示為
(1)
式中:τ1,τ2為滯后量;E{·}為數(shù)學(xué)期望。
設(shè)隨機(jī)變量x服從高斯分布N(0,σ2),則x的概率密度函數(shù)為
(2)
從而得到x的矩函數(shù)為
(3)
則x的第二特征函數(shù)為
(4)
利用累積量ck與Ψ(ω)的關(guān)系式
ck=(-j)kΨk(0)
(5)
式中,ck為隨機(jī)變量x的k階累積量,可以得到隨機(jī)變量x的各階累積量為
c1=0,c2=σ2,ck=0,k>2
根據(jù)以上推導(dǎo)可以得出,任意一個(gè)零均值的高斯隨機(jī)過程,其高階(三階及以上)累積量恒為零。因此,對(duì)于信號(hào)中的加性高斯噪聲,通過三階累積量的計(jì)算,可以完全抑制噪聲的影響。
卷積神經(jīng)網(wǎng)絡(luò)是一種帶有卷積結(jié)構(gòu)的多層監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它使用卷積運(yùn)算代替一般的矩陣乘法。該網(wǎng)絡(luò)采用梯度下降法對(duì)網(wǎng)絡(luò)中的權(quán)重參數(shù)反向調(diào)節(jié),通過不斷的訓(xùn)練迭代提高網(wǎng)絡(luò)的精度。一個(gè)卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、歸一化層、修正線性單元(ReLU)、池化層、Dropout層、全連接層和softmax層等組成。其結(jié)構(gòu)如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
1.2.1 輸入層
輸入層是整個(gè)網(wǎng)絡(luò)的輸入,對(duì)于圖像輸入它是一個(gè)像素矩陣,一般黑白圖片深度為1,彩色圖片深度為3。
1.2.2 卷積層
卷積層通過卷積核與像素矩陣卷積,得到特征圖,卷積核會(huì)有規(guī)律的移動(dòng),與輸入特征做矩陣乘法求和并疊加偏差量
Zl+1(i,j)=[Zl?wl+1](i,j)+b=
(6)
1.2.3 修正線性單元
修正線性單元(rectified linear unit, ReLU)是一個(gè)非常簡單的非線性激活函數(shù),可表示為
yReLU(x)=max(0,x)
(7)
其導(dǎo)數(shù)可表示為
(8)
在正數(shù)區(qū)間ReLU的導(dǎo)數(shù)為1,且不會(huì)飽和,使用ReLU得到梯度下降的收斂速度要比使用sigmoid或tanh函數(shù)時(shí)快得多,能有效的避免梯度消失[13]。
1.2.4 池化層
池化層對(duì)得到的特征圖進(jìn)行特征選擇和信息過濾。池化層包含預(yù)設(shè)定的池化函數(shù),其功能是將特征圖中單個(gè)點(diǎn)的結(jié)果替換為相鄰區(qū)域的特征圖統(tǒng)計(jì)量。池化層選取的池化區(qū)域由池化大小、步長和填充控制。
Lp池化是受視覺皮層內(nèi)階層結(jié)構(gòu)啟發(fā)而建立的池化模型。其表達(dá)式如下
(9)
式中:f為卷積核大小;s0為卷積步長;p為預(yù)指定參數(shù)。當(dāng)p=1時(shí),Lp池化在區(qū)域內(nèi)取均值,被稱為均值池化;當(dāng)p→∞時(shí),Lp池化在區(qū)域內(nèi)取極大值,被稱為最大池化[6]。
1.2.5 Dropout層
Dropout可以通過直接修改神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提高網(wǎng)絡(luò)的泛化能力。在進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),每一次迭代,隨機(jī)刪除固定比例(Dropout率p)的隱藏層單元,構(gòu)建新的網(wǎng)絡(luò),用以上方法重復(fù)迭代直至訓(xùn)練結(jié)束。通過這種方法可以減少神經(jīng)元之間的依賴性,從而提高網(wǎng)絡(luò)的泛化能力[14]。
1.2.6 全連接層
全連接層中的神經(jīng)元與前一層的所有神經(jīng)元相連接,整合卷積層或池化層中具有類別區(qū)分性的局部信息,以識(shí)別較大的模式。最后一個(gè)全連接層將特征組合在一起來對(duì)圖像進(jìn)行分類。
1.2.7 softmax層
softmax激活函數(shù)對(duì)全連接層的輸出進(jìn)行歸一化。softmax層的輸出由總和為1的多個(gè)正數(shù)組成,它代表輸入樣例所屬種類的概率分布。
本文充分利用三階累積量對(duì)高斯噪聲的抗噪能力和卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取抽象特征的能力,對(duì)振動(dòng)信號(hào)進(jìn)行三階累積量計(jì)算并生成灰度圖像,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入;用小批量隨機(jī)的方法劃分訓(xùn)練樣本,采用具有動(dòng)量的隨機(jī)梯度下降算法和學(xué)習(xí)率退火方法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),通過遺傳算法優(yōu)化訓(xùn)練參數(shù),從而提高網(wǎng)絡(luò)的收斂效果和計(jì)算效率,形成準(zhǔn)確、高效的智能故障診斷方法,具體計(jì)算流程如圖2所示。
圖2 基于CUM3-CNN的故障診斷流程圖
試驗(yàn)對(duì)象為濰柴WD615.71Q-1型六缸柴油機(jī)。在柴油機(jī)的第6缸缸蓋上側(cè)和左側(cè)分別安裝振動(dòng)傳感器,采集柴油機(jī)的缸蓋振動(dòng)信號(hào),同步測取柴油機(jī)轉(zhuǎn)速信號(hào),傳感器安裝位置如圖3所示。
(a) 振動(dòng)加速度傳感器
上位機(jī)為NI PXIe-1078計(jì)算機(jī),采用PXIe-4499聲音振動(dòng)采集卡采集振動(dòng)信號(hào),采用PXIe-6361數(shù)采卡同步采集轉(zhuǎn)速信號(hào);振動(dòng)傳感器為PCB M603C01振動(dòng)加速度傳感器,轉(zhuǎn)速信號(hào)為霍爾傳感器,試驗(yàn)裝置示意圖,如圖4所示。
圖4 試驗(yàn)裝置示意圖
試驗(yàn)時(shí),柴油機(jī)轉(zhuǎn)速分別為800 r/min,1 000 r/min,1 200 r/min,1 400 r/min,1 600 r/min,1 800 r/min,對(duì)第6缸高壓油路設(shè)置了正常、漏油、斷油、噴油器壓力高和噴油器壓力低5種技術(shù)狀態(tài),同步采集柴油機(jī)空載運(yùn)轉(zhuǎn)時(shí)的缸蓋振動(dòng)信號(hào)和轉(zhuǎn)速信號(hào),各通道采樣頻率為65.5 kHz,采樣點(diǎn)數(shù)為131 072點(diǎn)。試驗(yàn)工況如表1所示。
表1 柴油機(jī)試驗(yàn)工況表
圖5為柴油機(jī)在轉(zhuǎn)速1 000 r/min時(shí)不同技術(shù)狀態(tài)下一個(gè)工作循環(huán)的缸蓋上側(cè)振動(dòng)信號(hào)時(shí)域圖和功率譜。從時(shí)域圖中可以看出,僅圖5(e)斷油工況的振動(dòng)信號(hào)在0 CA°左右的幅值稍小于其他工況,時(shí)域圖無法分辨各個(gè)工況;從功率譜圖來看,各工況振動(dòng)信號(hào)的能量都集中在5 kHz附近,幅值區(qū)別不明顯且沒有規(guī)律,說明功率譜也不能有效分辨各個(gè)工況。因此,從原始信號(hào)的時(shí)域和頻域,很難提取出區(qū)別不同工況的故障特征。
(a) 正常時(shí)域圖
根據(jù)式(1),對(duì)柴油機(jī)在轉(zhuǎn)速1 000 r/min時(shí)不同技術(shù)狀態(tài)下一個(gè)工作循環(huán)的缸蓋上側(cè)振動(dòng)信號(hào)進(jìn)行三階累積量分析,取其滯后量為-50≤τ1,τ2≤50,將結(jié)果歸一化到0~1的灰度值內(nèi)。結(jié)果如圖6所示。
(a) 正常
從圖6中可以看出,不同工況三階累積量的分布和灰度值有所不同,正常狀態(tài)下,其振動(dòng)信號(hào)的三階累積量分布較為集中且能量較大,隨著燃燒情況的變化,三階累積量的分布也越來越分散,在斷油工況下其分布最為分散,雖然通過人為觀察,能在一定程度上發(fā)現(xiàn)不同工況下的微弱差別,說明三階累積量能有效抑制信號(hào)中的噪聲干擾,突出信號(hào)中的有效特征。但不同信號(hào)的特征不同,人為觀察效率低、主觀影響大,要提供故障診斷的效率和精度,需要自動(dòng)提取特征并能智能識(shí)別故障的方法。
將一個(gè)工作循環(huán)缸蓋上側(cè)振動(dòng)信號(hào)的三階累積量灰度圖作為一個(gè)樣本,對(duì)5種工況下的每個(gè)轉(zhuǎn)速分別取60組樣本,每種工況組成360個(gè)樣本的數(shù)據(jù)集,從中取240個(gè)樣本作為訓(xùn)練集,其余120個(gè)樣本作為測試集。數(shù)據(jù)集的劃分情況如表2所示。
表2 數(shù)據(jù)集劃分情況
本文所用卷積神經(jīng)網(wǎng)絡(luò)模型,如表3所示。輸入圖像為101×101大小的灰度圖像;卷積層設(shè)置4個(gè)3×3大小的卷積核,步長為1;在卷積層之后使用批量歸一化層,來加速網(wǎng)絡(luò)訓(xùn)練并降低對(duì)網(wǎng)絡(luò)初始化的敏感度;批量歸一化層后接一個(gè)非線性激活函數(shù)——修正線性單元(ReLU);池化層采用最大池化層,核大小為2×2,步長為2;之后連接一個(gè)Dropout層,其Dropout率用參數(shù)p表示,全連接層輸出為5,通過softmax層輸出5種分類的概率。
表3 卷積神經(jīng)網(wǎng)絡(luò)參數(shù)
本文采用具有動(dòng)量的隨機(jī)梯度下降優(yōu)化算法(stochastic gradient descent with momentum,SGDM)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)速率采用退火的方法動(dòng)態(tài)調(diào)節(jié),將學(xué)習(xí)速率乘以一個(gè)小于1的系數(shù),每10輪減小一次學(xué)習(xí)率。為了降低計(jì)算成本,用隨機(jī)小批量的方法劃分訓(xùn)練樣本,批量大小為32,每次用一個(gè)小批量來訓(xùn)練網(wǎng)絡(luò),完成整個(gè)訓(xùn)練數(shù)據(jù)集所有批量的訓(xùn)練為一輪完整訓(xùn)練周期,最大的訓(xùn)練輪數(shù)為20輪,每輪訓(xùn)練都會(huì)打亂數(shù)據(jù),并在每輪訓(xùn)練結(jié)束計(jì)算基于驗(yàn)證數(shù)據(jù)集的準(zhǔn)確度,驗(yàn)證數(shù)據(jù)不用于更新網(wǎng)絡(luò)權(quán)重。
網(wǎng)絡(luò)有3個(gè)重要的超參數(shù)需要調(diào)節(jié),分別是初始學(xué)習(xí)速率r、學(xué)習(xí)速率退火系數(shù)f和Dropout率p。為了提高模型的精度,降低泛化誤差,本文采用遺傳算法優(yōu)化訓(xùn)練參數(shù)。遺傳算法個(gè)體數(shù)目取10,最大進(jìn)化代數(shù)50代,交叉概率取0.4,變異概率取0.2,以網(wǎng)絡(luò)對(duì)原測試集和分別混有-3 dB,0,3 dB噪聲的測試集的驗(yàn)證誤差平均值作為適應(yīng)度函數(shù),其適應(yīng)度曲線如圖7所示。
圖7 適應(yīng)度曲線
經(jīng)過50代進(jìn)化,最終進(jìn)化出的最優(yōu)參數(shù)組合為:初始學(xué)習(xí)速率r=0.004 5、學(xué)習(xí)速率退火系數(shù)f=0.688 5和Dropout率p=0.468 9。
采用訓(xùn)練集對(duì)本文提出的方法(CUM3-CNN)訓(xùn)練,并通過測試集檢驗(yàn)訓(xùn)練后模型的準(zhǔn)確率,訓(xùn)練進(jìn)度如圖8所示。從圖8中可以看出,經(jīng)過兩輪的訓(xùn)練,模型的驗(yàn)證準(zhǔn)確度就達(dá)到了95%以上,20輪訓(xùn)練過后,最終的訓(xùn)練準(zhǔn)確度和驗(yàn)證準(zhǔn)確度都達(dá)到了99.5%,表明該方法收斂速度快、泛化能力強(qiáng)。
圖8 訓(xùn)練進(jìn)度圖
缸體上側(cè)信號(hào)和缸蓋左側(cè)振動(dòng)信號(hào)訓(xùn)練網(wǎng)絡(luò)模型對(duì)5種工況的最終驗(yàn)證準(zhǔn)確度如表4所示。
表4 不同部位采集信號(hào)的最終驗(yàn)證準(zhǔn)確度
從表4可以看出,對(duì)每個(gè)工況的60組測試集數(shù)據(jù),CUM3-CNN方法具有較高的準(zhǔn)確率,缸蓋上側(cè)信號(hào)比缸蓋左側(cè)信號(hào)的準(zhǔn)確率更高,說明缸蓋上側(cè)振動(dòng)信號(hào)對(duì)5種工況蘊(yùn)藏的故障特征更加敏感,更適合用來進(jìn)行故障診斷;缸蓋上側(cè)振動(dòng)信號(hào)的CUM3-CNN方法能準(zhǔn)確區(qū)分傳統(tǒng)方法難以分辨的5種工況,并且保持了較高的計(jì)算效率,實(shí)現(xiàn)了柴油機(jī)多故障工況的準(zhǔn)確、高效故障診斷。
為了檢驗(yàn)本文方法的故障診斷性能,分別對(duì)比了本文所提出的CUM3-CNN方法和吳春志等和周奇才等所用的1D-CNN方法、李恒等所用的STFT-CNN方法、袁建虎等、陳仁祥等、卓德兵等所用的WT-CNN方法在原測試集和噪聲環(huán)境下的故障診斷準(zhǔn)確率,驗(yàn)證本方法的有效性。
3.5.1 不同方法的故障診斷性能對(duì)比
用不同的方法對(duì)原始信號(hào)生成尺寸相同的灰度圖數(shù)據(jù)集,訓(xùn)練集和測試集都按照表1進(jìn)行劃分,所用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練參數(shù)完全相同,對(duì)比4種方法故障診斷性能,各方法在其對(duì)應(yīng)的測試集的驗(yàn)證準(zhǔn)確度如圖9所示。
圖9 不同方法的驗(yàn)證準(zhǔn)確度對(duì)比
從圖9中可以看出,CUM3-CNN方法的收斂速度比1D-CNN方法、STFT-CNN方法和WT-CNN方法都要快。表5列出了不同方法在各自對(duì)應(yīng)測試集的最終驗(yàn)證準(zhǔn)確度和訓(xùn)練時(shí)間。
表5 不同方法的最終驗(yàn)證準(zhǔn)確度和訓(xùn)練時(shí)間對(duì)比
從表5可以看出,CUM3-CNN方法的最終驗(yàn)證準(zhǔn)確度為99.50%,比1D-CNN方法(90.67%)、STFT-CNN方法(96.17%)和WT-CNN方法(97.50%)的最終驗(yàn)證準(zhǔn)確度高。以上結(jié)果說明,CUM3-CNN方法比STFT-CNN方法和WT-CNN方法用于柴油機(jī)故障診斷的準(zhǔn)確率更高。
3.5.2 噪聲環(huán)境下的故障診斷性能對(duì)比
在實(shí)際診斷過程中,所采集到的信號(hào)中難免會(huì)受到噪聲的干擾。為了驗(yàn)證噪聲環(huán)境下上述3種方法的故障診斷性能,在測試集中加入信噪比為-5~5 dB的高斯白噪聲,分別用不同的方法生成灰度圖數(shù)據(jù)集,輸入到3.5.1節(jié)中訓(xùn)練好的對(duì)應(yīng)的卷積神經(jīng)網(wǎng)絡(luò),各方法在噪聲環(huán)境下的故障診斷準(zhǔn)確度如圖10和表6所示。
圖10 不同方法在噪聲環(huán)境下的故障診斷性能對(duì)比
表6 不同方法在噪聲環(huán)境下的故障診斷準(zhǔn)確度對(duì)比
從圖10中可以看出,在噪聲環(huán)境下CUM3-CNN方法的故障診斷性能明顯優(yōu)于1D-CNN方法、STFT-CNN方法和WT-CNN方法。從表5中可以看出,隨著信噪比的提高CUM3-CNN方法、1D-CNN方法和STFT-CNN方法的故障診斷性能也總體在提高,CUM3-CNN方法的故障診斷準(zhǔn)確度在83%~99%,1D-CNN方法的故障診斷準(zhǔn)確度在23.17%~63.50%,而STFT-CNN方法的故障診斷準(zhǔn)確度不足50.00%,WT-CNN方法的故障診斷準(zhǔn)確度只有20.00%左右。以上結(jié)果說明,CUM3-CNN方法有良好的噪聲抑制能力,在噪聲環(huán)境下用于柴油機(jī)故障診斷,診斷準(zhǔn)確度明顯高于1D-CNN方法、STFT-CNN方法和WT-CNN方法。
(1) 本文采用隨機(jī)小批量方法劃分訓(xùn)練樣本,用SGDM算法和學(xué)習(xí)率退火方法訓(xùn)練CUM3-CNN方法,通過遺傳算法優(yōu)化訓(xùn)練參數(shù),提高了模型的診斷精度和泛化能力。
(2) 缸蓋上側(cè)振動(dòng)信號(hào)比缸蓋左側(cè)振動(dòng)信號(hào)更適合用于柴油機(jī)高壓油路故障診斷。
(3) CUM3-CNN方法有良好的噪聲抑制能力,在柴油機(jī)故障診斷的應(yīng)用中比1D-CNN方法、STFT-CNN方法和WT-CNN方法的診斷準(zhǔn)確率更高,特別是在噪聲環(huán)境下有明顯的性能優(yōu)勢(shì)。