杜文遼,侯緒坤,王宏超,鞏曉赟
(鄭州輕工業(yè)大學(xué)機(jī)電工程學(xué)院,河南鄭州 450000)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械中重要的零部件之一,同時(shí)也是最易受損的零部件。據(jù)不完全統(tǒng)計(jì),在旋轉(zhuǎn)機(jī)械中,約有1/3的機(jī)械故障源于滾動(dòng)軸承。為了避免軸承故障帶來的經(jīng)濟(jì)損失和安全隱患,對(duì)滾動(dòng)軸承進(jìn)行監(jiān)測(cè)、分析,并及時(shí)進(jìn)行診斷故障就顯得尤為重要。
目前軸承故障診斷過程主要包括3個(gè)方面:數(shù)據(jù)預(yù)處理、特征提取及模式識(shí)別。傳統(tǒng)的故障診斷主要通過時(shí)域、頻域以及時(shí)頻域分析將信號(hào)映射到統(tǒng)計(jì)參數(shù)來獲得特征,基于快速傅里葉變換的頻域特征會(huì)丟失時(shí)域的變化信息,而基于時(shí)域方法的特征會(huì)丟失頻域的變化特征。此外,信號(hào)被簡單地用作故障診斷的單一維度向量,難以保證診斷精度。為了解決這一問題,主要通過局部特征尺度分解、經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)、小波變換(WT)等時(shí)頻域分析方法提取故障多維特征并將其作為模式識(shí)別的依據(jù)。其中小波變換可以對(duì)非平穩(wěn)、非線性的振動(dòng)信號(hào)進(jìn)行多尺度分解,從而準(zhǔn)確提取時(shí)頻域中所蘊(yùn)含的不同尺度的故障特征信息,已被大量學(xué)者使用。WANG等使用離散小波變換和稀疏表示獲得了新的稀疏小波能量特征來識(shí)別滾動(dòng)軸承故障;SHEN等描述了一種基于小波變換、距離評(píng)估技術(shù)和支持向量回歸的智能故障診斷方案,并將其用于軸承的故障模式分類。以上方法均取得一定的診斷效果,但這些基于信號(hào)處理的故障診斷方法僅針對(duì)特定問題,而且需要人工提取特征,存在依賴于經(jīng)驗(yàn)、自適應(yīng)能力和泛化能力差的問題。對(duì)于模式不明且多變、多故障信息耦合的“大數(shù)據(jù)”,用這些方法難以提取出能有效表征故障的特征信息。
近年來,機(jī)械的復(fù)雜度和集成化不斷提高,依靠人工知識(shí)和經(jīng)驗(yàn)的傳統(tǒng)故障診斷方法已經(jīng)不適用現(xiàn)代智能化診斷。同時(shí),深度學(xué)習(xí)(Deep Learning,DL)在圖像處理、計(jì)算機(jī)視覺、語言識(shí)別等領(lǐng)域應(yīng)用十分廣泛。深度學(xué)習(xí)模型可以直接從原始信號(hào)中提取抽象特征,而無需人工提取特征,深度學(xué)習(xí)憑借其強(qiáng)大的非線性建模以及特征表征能力,在諸多方面表現(xiàn)出極大的潛力,已有許多學(xué)者將深度學(xué)習(xí)應(yīng)用到機(jī)械設(shè)備的故障診斷中。雷亞國等利用去噪自編碼器準(zhǔn)確診斷了多級(jí)齒輪傳動(dòng)系統(tǒng)故障。DUONG、KIM構(gòu)建了一種基于堆疊降噪自動(dòng)編碼器(Stacked Denoising Auto Encoder,SDAE)非互斥分類器(Non Mutually Exclusive Classifier,NMEC)方法的DNN(Dynamic Neural Network)結(jié)構(gòu),用于組合模式以實(shí)現(xiàn)軸承故障診斷;LI等利用深度信念網(wǎng)絡(luò)直接從軸承原始信號(hào)中取得故障特征并對(duì)其進(jìn)行了準(zhǔn)確診斷。雖然這些方法均能從機(jī)械“大數(shù)據(jù)”中自動(dòng)提取出機(jī)械設(shè)備不同故障特征,但都是針對(duì)單一的時(shí)域或頻域信號(hào)進(jìn)行特征學(xué)習(xí),難以提取到更具表征性的時(shí)頻域特征信息。為了避免僅學(xué)習(xí)單一維度的特征而影響診斷精度,故有必要利用小波變換對(duì)原始信號(hào)進(jìn)行多尺度分解,對(duì)得到的信號(hào)的各尺度成分進(jìn)行重構(gòu),構(gòu)建利于特征學(xué)習(xí)的頻譜表示,以從中學(xué)習(xí)到更為有用的故障特征信息。
深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種典型的深度學(xué)習(xí)模型,最早由LECUN提出,目的是處理己知網(wǎng)格狀形狀的數(shù)據(jù),如二維圖像數(shù)據(jù)或一維時(shí)間序列數(shù)據(jù)。CNN通過卷積、池化和非線性激活函數(shù)映射逐層提取信號(hào)的特征。與其他深度學(xué)習(xí)模型相比,CNN具有更強(qiáng)的魯棒性和更好的泛化能力。同時(shí),CNN通過權(quán)重共享和池化操作提高了網(wǎng)絡(luò)性能并降低了訓(xùn)練成本,并且與其他深度學(xué)習(xí)模型相比不容易出現(xiàn)過擬合問題。目前,CNN已經(jīng)應(yīng)用在故障診斷中,主要包括一維卷積神經(jīng)網(wǎng)絡(luò)和二維卷積神經(jīng)網(wǎng)絡(luò)。在軸承的故障診斷中,由于輸入信號(hào)是一維的,經(jīng)典的二維CNN模型需要先將一維信號(hào)轉(zhuǎn)換為二維圖像,在一維信號(hào)下可能會(huì)失去優(yōu)勢(shì),因此針對(duì)軸承的一維振動(dòng)信號(hào)采用一維卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行診斷。
針對(duì)滾動(dòng)軸承振動(dòng)信號(hào)的非平穩(wěn)、非線性的特征,利用小波變換對(duì)其進(jìn)行多尺度分析,從而準(zhǔn)確提取時(shí)頻域中所蘊(yùn)含的不同故障狀態(tài)特征信息,然后將其代入構(gòu)建的一維卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行特征學(xué)習(xí)和分類,實(shí)現(xiàn)故障的智能診斷。
小波變換是一種數(shù)據(jù)分析方法,可以對(duì)原始信號(hào)局部分析,其窗口大小可以隨頻率變化而變化,達(dá)到在時(shí)頻域自適應(yīng)分析信號(hào)的目的。
在平方可積實(shí)數(shù)空間()中,如果函數(shù)()滿足容許條件:
(1)
則()可選作基本小波。()通過伸縮和平移產(chǎn)生一個(gè)函數(shù)族{,()},稱為小波函數(shù)。
(2)
其中:是尺度因子;是位移因子。信號(hào)()的小波變換定義為
(3)
其中:()是小波函數(shù)()的共軛。
當(dāng)機(jī)器發(fā)生故障時(shí),采集到的振動(dòng)信號(hào)波形復(fù)雜且不穩(wěn)定,小波變換能夠把任何信號(hào)映射到由一個(gè)母小波伸縮(變換頻率)、平移(刻劃時(shí)間)組成的一組基函數(shù)上去,實(shí)現(xiàn)信號(hào)在不同頻帶的自適應(yīng)分解。
圖1所示為一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),它由輸入層、卷積層、批量歸一化(Batch Normalization,BN)層、池化層、全連接層、Dropout層以及輸出層組成。
圖1 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.2.1 輸入層
輸入層作為一維卷積神經(jīng)網(wǎng)絡(luò)的第一層,用來接收訓(xùn)練和預(yù)測(cè)的樣本。
1.2.2 卷積層
卷積層可以有效地進(jìn)行圖像特征提取,卷積運(yùn)算本身就是滑動(dòng)卷積核與Feature Map 進(jìn)行卷積運(yùn)算。一維卷積運(yùn)算是指使用一維卷積核對(duì)輸入的一維信號(hào)進(jìn)行局部卷積計(jì)算,生成一維卷積特征圖。
1.2.3 批量歸一化層
批量歸一化(BN)是指對(duì)每一批數(shù)據(jù)做均值和方差歸一化。它可以解決在訓(xùn)練過程中,中間層數(shù)據(jù)分布發(fā)生改變的問題,防止梯度消失或爆炸、加快訓(xùn)練速度。
1.2.4 池化層
經(jīng)過卷積層之后,參數(shù)往往會(huì)較多,因此需要降采樣操作,即池化操作,以減少神經(jīng)網(wǎng)絡(luò)的參數(shù);同時(shí)池化層還具有特征不變性的特性,即減少數(shù)據(jù)的同時(shí)還能夠保留原始數(shù)據(jù)的特征。常用的池化過程有均值池化(Average Pooling)和最大值池化(Max Pooling)。如圖2所示,A為均值池化過程,B為最大池化過程。
圖2 池化過程
1.2.5 全連接層
經(jīng)過池化層之后,需要將數(shù)據(jù)展平為特征向量,將這些向量輸入到全連接(Fully Connected,F(xiàn)C)層中。全連接層是指該層的每一節(jié)點(diǎn)都與其上層的所有神經(jīng)元結(jié)點(diǎn)進(jìn)行連接,其下層可以為Dropout層或者輸出層,如圖3所示。全連接層通常位于網(wǎng)絡(luò)的最后幾層,其作用是整合上層網(wǎng)絡(luò)中區(qū)分度較高的類別信息。該層中常用的激活函數(shù)為ReLU函數(shù)。
圖3 全連接過程
1.2.6 Dropout層
Dropout層通常需要加在全連接層之后,其作用是防止過擬合現(xiàn)象的發(fā)生,減少網(wǎng)絡(luò)中的參數(shù),提高網(wǎng)絡(luò)的泛化能力和魯棒性。Dropout層分為前向傳播和反向傳播。前向傳播是指給定每個(gè)神經(jīng)元一個(gè)隨機(jī)值(0~1之間),設(shè)定采樣閾值,若該神經(jīng)元對(duì)應(yīng)的隨機(jī)值小于采樣閾值,則將該神經(jīng)元設(shè)置為0,反之將該神經(jīng)元設(shè)置為,并保留每個(gè)神經(jīng)元對(duì)應(yīng)的所有隨機(jī)值和設(shè)置值。反向傳播是指讀取前向傳播中的隨機(jī)值,對(duì)數(shù)據(jù)進(jìn)行和前向傳播相同的操作,通常將采樣閾值設(shè)置為0.5。
1.2.7 輸出層
輸出層主要實(shí)現(xiàn)了分類。隱含層經(jīng)過訓(xùn)練后,最終通過輸出層中Softmax分類器進(jìn)行分類。
一維卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中更新權(quán)值可以分為兩個(gè)部分:前向傳播為神經(jīng)網(wǎng)絡(luò)根據(jù)樣本計(jì)算預(yù)測(cè)值;反向傳播則通過預(yù)測(cè)值與真實(shí)值之間的差異,采用梯度下降法進(jìn)行權(quán)值更新。
(1)前向傳播計(jì)算過程
一維卷積過程可用式(4)表示:
(4)
其中:表示卷積核;表示卷積核的個(gè)數(shù);為卷積計(jì)算區(qū)域;表示第個(gè)數(shù)據(jù);-1為第層卷積輸入;為卷積輸出;Conv1D()為一維卷積計(jì)算;為偏置;()為激活函數(shù)。激活函數(shù)為ReLU函數(shù),表示為
()=max{0,}
(5)
其中:為卷積層激活值。
(2)誤差反向傳播過程
(6)
(7)
其中:為目標(biāo)函數(shù);-1為上一層原始值;為需要更新的參數(shù)。
基于小波變換和一維卷積神經(jīng)網(wǎng)絡(luò)的診斷模型進(jìn)行滾動(dòng)軸承故障智能診斷可以分為以下8個(gè)步驟,如圖4所示。
圖4 故障診斷流程
(1)通過傳感器采集滾動(dòng)軸承工作狀態(tài)的振動(dòng)信號(hào);
(2)對(duì)信號(hào)進(jìn)行小波變換,得到信號(hào)的多尺度表示;
(3)對(duì)每層小波信號(hào)進(jìn)行單支重構(gòu);
(4)對(duì)重構(gòu)的信號(hào)進(jìn)行快速傅里葉變換,得到信號(hào)的幅值譜;
(5)將得到的幅值數(shù)據(jù)進(jìn)行歸一化處理,并將各尺度數(shù)據(jù)構(gòu)造成一維特征向量作為特征樣本;
(6)將得到的特征樣本按照一定的比例分配為測(cè)試樣本、驗(yàn)證樣本及訓(xùn)練樣本;
(7)構(gòu)建一維卷積神經(jīng)網(wǎng)絡(luò)。利用訓(xùn)練樣本對(duì)1DCNN進(jìn)行訓(xùn)練,并用驗(yàn)證樣本驗(yàn)證,最后得到診斷模型;
(8)將測(cè)試樣本輸入網(wǎng)絡(luò)進(jìn)行驗(yàn)證,得到最終的診斷精度。
實(shí)驗(yàn)數(shù)據(jù)來自于凱斯西儲(chǔ)大學(xué)滾動(dòng)軸承數(shù)據(jù)集。加速度傳感器安裝在電機(jī)驅(qū)動(dòng)端的軸承座來獲得軸承的振動(dòng)信號(hào),采樣頻率為12 kHz。電機(jī)驅(qū)動(dòng)端軸承型號(hào)是6205-2RS JEM SKF深溝球軸承,其故障通過電火花加工。故障直徑共有3種,分別為:0.18、0.36、0.53 mm,故障深度均為0.28 mm。軸承在轉(zhuǎn)頻為大約為30 Hz、4種載荷(0,735 W,1 470 W,2 205 W)下實(shí)驗(yàn),分為4種狀態(tài):正常狀態(tài)(N),外圈故障(OF),內(nèi)圈故障(IF),球故障(BF);每種故障狀態(tài)有3個(gè)故障程度:輕微故障(0.18 mm),中度故障(0.36 mm),嚴(yán)重故障(0.53 mm)。將數(shù)據(jù)集共分為10種健康狀態(tài),每種健康狀態(tài)共有400個(gè)數(shù)據(jù)樣本,共計(jì)4 000個(gè)數(shù)據(jù)樣本,隨機(jī)抽取70%數(shù)據(jù)樣本作為訓(xùn)練樣本,剩余30%作為測(cè)試樣本,將訓(xùn)練樣本的30%作為驗(yàn)證集,如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)樣本
對(duì)上述滾動(dòng)軸承數(shù)據(jù)樣本采用db5小波進(jìn)行3層分解,然后將每層的小波系數(shù)進(jìn)行單支重構(gòu);對(duì)重構(gòu)后的信號(hào)進(jìn)行快速傅里葉變換,得到FFT頻譜表示;將得到的頻譜數(shù)據(jù)做歸一化處理,作為1DCNN模型的輸入,其中激活函數(shù)選用ReLu函數(shù)。
此次實(shí)驗(yàn)使用的編程語言為Python3.6,解釋器為PyCharm,神經(jīng)網(wǎng)絡(luò)框架為Keras。在構(gòu)造1DCNN模型時(shí),共設(shè)置有11層網(wǎng)絡(luò),包括輸入層、3個(gè)卷積層、3個(gè)BN層、池化層、Dropout層、全連接層、輸出層,如表2所示。
表2 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖5所示為訓(xùn)練集和驗(yàn)證集的正確率和損失隨著訓(xùn)練次數(shù)遞增的變化情況,可以看出:當(dāng)訓(xùn)練次數(shù)達(dá)到5次時(shí),網(wǎng)絡(luò)已經(jīng)趨于穩(wěn)定,訓(xùn)練集和驗(yàn)證集的正確率已經(jīng)達(dá)到100%,可以看出此次1DCNN模型具有良好的效率。
圖5 損失率(a)和正確率(b)隨著訓(xùn)練次數(shù)的變化
取10次實(shí)驗(yàn)過程中準(zhǔn)確率最高的一次,將其分類結(jié)果用混淆矩陣表示出來,如圖6所示??梢钥闯觯捍舜螌?shí)驗(yàn)共有10種故障類型,每種故障類型都有120個(gè)樣本,每種故障類型都能準(zhǔn)確地分類出來,準(zhǔn)確率高達(dá)100%。
圖6 訓(xùn)練樣本混淆矩陣
將最后一層分類結(jié)果用分布隨機(jī)鄰居嵌入(-SNE)可視化表示,經(jīng)過WT-1DCNN模型進(jìn)行處理之后,可以將每種的故障類型正確分類,10種顏色分別代表10種故障類型,每種故障類型都能夠聚集在一個(gè)區(qū)域內(nèi)。
圖7 分類結(jié)果的t-SNE可視化
針對(duì)測(cè)試樣本,為了避免一次實(shí)驗(yàn)數(shù)據(jù)帶來的誤差,共進(jìn)行10次實(shí)驗(yàn),每次實(shí)驗(yàn)正確率如圖8所示。經(jīng)計(jì)算得到10次實(shí)驗(yàn)的平均正確率為99.94%。從圖8中可以看出測(cè)試集準(zhǔn)確率在99.74%~100%內(nèi),說明此次實(shí)驗(yàn)選取的模型具有良好的穩(wěn)定性。
圖8 WT-1DCNN模型10次實(shí)驗(yàn)準(zhǔn)確率
為了說明小波變換能夠針對(duì)非平穩(wěn)振動(dòng)信號(hào)準(zhǔn)確提取故障特征,將原始信號(hào)直接輸入1DCNN進(jìn)行特征分類與經(jīng)過小波變換后的特征樣本輸入相同的1DCNN模型進(jìn)行特征分類并將兩種方法的故障診斷準(zhǔn)確率進(jìn)行對(duì)比。同樣進(jìn)行10次實(shí)驗(yàn),計(jì)算出直接輸入1DCNN模型軸承故障診斷準(zhǔn)確率的平均值為98.02%,而經(jīng)過小波變換后輸入WT-1DCNN模型的平均診斷精準(zhǔn)確率為99.94%,結(jié)果如圖9所示??梢钥闯?10次實(shí)驗(yàn)過程中每次實(shí)驗(yàn)1DCNN模型的診斷精度都明顯低于WT-1DCNN模型的精度,證明小波變換可以準(zhǔn)確提取信號(hào)多尺度特征,提高軸承故障診斷的精度。
圖9 1DCNN與WT-1DCNN準(zhǔn)確率對(duì)比
為了驗(yàn)證文中所提方法的優(yōu)越性,針對(duì)相同的數(shù)據(jù)集,分別與不同的方法進(jìn)行對(duì)比。DU等提出了一種基于小波領(lǐng)導(dǎo)多重分形特征的滾動(dòng)軸承故障診斷方法(Wavelet Leaders),得到88.9%的正確率;李恒等人提出了基于短時(shí)傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)的故障診斷方法(STFE-CNN),實(shí)現(xiàn)了端到端的故障模式識(shí)別,診斷正確率為97.93%。XIA等提出了基于CNN的多傳感器融合方法(MCNN),將多個(gè)傳感器的信號(hào)進(jìn)行融合再輸入到CNN中,對(duì)軸承10種故障狀態(tài)進(jìn)行診斷,得到99.41%的正確率;DING、HE提出一種基于小波包能量(WPE)圖像和二維深度卷積網(wǎng)絡(luò)的新型能量波動(dòng)多尺度特征挖掘方法(WPE-2DCNN),用于軸承故障診斷,正確率達(dá)到了98.8%。 將5種方法進(jìn)行比較,結(jié)果如圖10所示,可以看出文中所用WT-1DCNN方法的故障診斷準(zhǔn)確率最高。
圖10 不同方法診斷準(zhǔn)確率
為了解決軸承故障診斷中人工特征提取依賴經(jīng)驗(yàn)和準(zhǔn)確提取一維信號(hào)中蘊(yùn)含故障特征難度大的問題,提出一種多尺度一維卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)軸承進(jìn)行故障診斷。與其他診斷方法相比,該方法有如下優(yōu)點(diǎn):
與傳統(tǒng)的智能診斷方法相比,利用小波變換對(duì)信號(hào)進(jìn)行多尺度分析,可以更有效地挖掘故障數(shù)據(jù)中隱藏的特征分布,準(zhǔn)確地提取信號(hào)中蘊(yùn)含的軸承故障特征,提高故障診斷的精度。
采用一維卷積神經(jīng)網(wǎng)絡(luò)對(duì)輸入的一維信號(hào)進(jìn)行訓(xùn)練,無需將一維信號(hào)轉(zhuǎn)換為二維圖像,有效地融合了特征自動(dòng)學(xué)習(xí)和故障分類,避免了人工提取特征,簡化了軸承診斷過程,獲得了優(yōu)于其他方法的診斷效果。