吳冬梅,王福齊,李賢功,唐潤,張新建
(1. 永城職業(yè)學(xué)院 電子信息工程系,河南 永城 476600;2. 中國礦業(yè)大學(xué) 礦業(yè)工程學(xué)院,江蘇 徐州 221116;3. 南京財經(jīng)大學(xué) 管理科學(xué)與工程學(xué)院,江蘇 南京 210023;4. 河南能源化工集團(tuán)永煤公司 陳四樓煤礦,河南 永城 476600)
目前大多采用信號處理與機(jī)器學(xué)習(xí)相結(jié)合的方法對軸承故障進(jìn)行智能診斷,首先利用信號處理技術(shù)對輸入信號進(jìn)行特征提取,然后對提取的特征進(jìn)行篩選,最后利用分類器進(jìn)行故障分類[3-4]。文獻(xiàn)[5]使用小波包變換提取煤礦主要通風(fēng)機(jī)軸承能量特征,采用深度隨機(jī)森林進(jìn)行故障分類。文獻(xiàn)[6]分別對原始信號進(jìn)行經(jīng)驗?zāi)B(tài)分解和時域分析,得到奇異值和時域特征參數(shù),然后利用主成分分析(Principal Component Analysis,PCA)對奇異值和時域特征參數(shù)進(jìn)行降維處理,獲得去除冗余的特征,最后將特征輸入到多分類支持向量機(jī)(Support Vector Machine,SVM)中進(jìn)行分類。上述方法在一定條件下能夠取得較好的分類效果,但是其特征提取主要依賴專家知識。
深度學(xué)習(xí)依據(jù)標(biāo)簽確定的損失函數(shù)能夠在訓(xùn)練過程中自適應(yīng)學(xué)習(xí)與任務(wù)相關(guān)的深度特征,不需要依賴領(lǐng)域的先驗知識[7]。文獻(xiàn)[8]提出了一種基于短時傅里葉變換(Short-time Fourier Transform,STFT)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的軸承故障診斷方法,利用STFT將故障振動信號轉(zhuǎn)換為時頻圖,將時頻圖輸入CNN得到故障分類結(jié)果,實現(xiàn)了軸承故障的智能診斷。文獻(xiàn)[9]建立了一維CNN聯(lián)合分類器模型,在沒有任何預(yù)先確定轉(zhuǎn)換的情況下直接將原始一維振動信號作為網(wǎng)絡(luò)輸入得到分類結(jié)果,并在凱斯西儲大學(xué)軸承數(shù)據(jù)集上進(jìn)行了驗證。文獻(xiàn)[10]構(gòu)建了CNN結(jié)合殘差模塊的深度殘差網(wǎng)絡(luò),并利用采煤機(jī)搖臂實驗臺獲得5種狀態(tài)下的振動信號對模型進(jìn)行驗證,發(fā)現(xiàn)模型擁有較好的特征提取能力和故障診斷精度。文獻(xiàn)[11]利用格拉姆角場對原始一維振動信號進(jìn)行轉(zhuǎn)換,得到了保存時間信息的二維圖像,并利用密集連接卷積網(wǎng)絡(luò)進(jìn)行特征提取和故障診斷。
上述方法均只使用了CNN網(wǎng)絡(luò)結(jié)構(gòu),但CNN提取的只是感受野中的空間特征(如振幅的變化),而軸承振動信號作為一種時間序列數(shù)據(jù),其時間維度特征在分類中起著關(guān)鍵作用。單獨(dú)使用CNN進(jìn)行故障診斷會造成時間維度信息的丟失,導(dǎo)致診斷精度下降。門控循環(huán)單元(Gated Recurrent Unit,GRU)具有建模時間維度依賴關(guān)系的能力,在許多涉及時間序列數(shù)據(jù)的任務(wù)建模中取得了很好的效果,且在軸承數(shù)據(jù)集上得到應(yīng)用[12-13],雙向門控循環(huán)單元(Bidirectional Gated Recurrent Unit,Bi GRU)作為GRU的變體可以更好地捕捉過去和未來的信息,能夠更加全面地從軸承數(shù)據(jù)中提取時間特征[14]。
為了從軸承振動信號中提取空間和時間特征,本文提出了一種結(jié)合一維CNN、Bi GRU和注意力機(jī)制[15]的深度故障診斷模型。首先將一維振動信號作為輸入,利用一維CNN和Bi GRU從原始信號中提取故障相關(guān)特征。然后由注意力模塊動態(tài)給予不同時刻特征權(quán)重。最后利用Softmax分類器得到診斷結(jié)果,實現(xiàn)軸承故障診斷。
CNN一般由卷積層、池化層和全連接層組成。卷積層利用卷積核對輸入進(jìn)行卷積運(yùn)算,從而實現(xiàn)故障特征的提取。池化層緊隨卷積層之后,對卷積層提取的特征進(jìn)行進(jìn)一步降維。全連接層起到分類作用。卷積過程表示如下:
式中:為 第l層輸出的第j個通道;g ()為激活函數(shù);m為通道總數(shù);為第l-1層輸出的第d個通道;為第l層輸出的第j個通道對應(yīng)的卷積核;為第l層輸出的第j個通道對應(yīng)的偏置。
GRU作為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Net,RNN)的一種特殊變體,具有較強(qiáng)時間記憶能力,能夠獲取隱藏的依賴關(guān)系。與長短期記憶網(wǎng)絡(luò)[16]相比,GRU結(jié)構(gòu)更加簡單,模型訓(xùn)練時間更短。GRU單元主要由重置門和更新門共同控制細(xì)胞的狀態(tài),如圖1所示,其中,σ為sigmoid激活函數(shù),Tanh為tanh函數(shù)。GRU的各個單元共享權(quán)重,能減少參數(shù)數(shù)量。從GRU單元首先將t-1 時刻的隱藏狀態(tài)ht-1和t時刻特征xt結(jié)合并分別輸入到重置門和更新門,從而得到重置門的輸出rt和 更新門的輸出zt。其中更新門和重置門都擁有sigmoid激活函數(shù),這使得zt和rt的 值限制在0到1之間。接著將rt,xt和ht-1結(jié)合輸入到以tanh為激活函數(shù)的全連接層中,得到t時刻的候選隱藏狀態(tài), 最后重置門的輸出zt分別與ht-1和相乘進(jìn)行狀態(tài)信息更新和丟棄,從而得到t時刻的隱藏狀態(tài)ht。
多年來,兩大流派的研究呈現(xiàn)此消彼長的態(tài)勢。從2001年理論創(chuàng)始到2012年之間,工作重塑理論處于建構(gòu)和摸索階段。創(chuàng)始人的理論文章及其追隨者的研究都基于“工作意義”視角,以敘事訪談和案例研究為主。自2012年出現(xiàn)了Tims等和Petrou開發(fā)的工作重塑量表后,定量研究得以推廣,實證研究逐漸轉(zhuǎn)向“人崗匹配”視角,關(guān)注對組織管理者的作用和意義。雖然這種趨勢讓該理論逐漸成為組織行為學(xué)研究領(lǐng)域的新熱點,但針對員工工作重塑動機(jī)、認(rèn)知重塑行為、工作重塑與工作意義的相關(guān)研究卻很有限,理論自創(chuàng)立以來的創(chuàng)造性進(jìn)展和系統(tǒng)性完善始終緩慢。
圖1 GRU單元Fig. 1 GRU unit
Bi GRU由前向GRU和后向GRU構(gòu)成,能夠同時考慮過去和未來的時間狀態(tài),通過獲得2個時間序列相反的隱藏狀態(tài),將隱藏狀態(tài)連接得到同1個輸出。因此,Bi GRU在處理時間序列數(shù)據(jù)時能夠更好地掌握完整信息,Bi GRU結(jié)構(gòu)如圖2所示。
圖2 Bi GRU結(jié)構(gòu)Fig. 2 Bi GRU structure
注意力機(jī)制類似于人類視覺注意力工作機(jī)制,它會有意識地從各種復(fù)雜多樣的故障信息中獲得與分類任務(wù)相關(guān)的重要信息。注意力結(jié)構(gòu)構(gòu)造如下:
式中:st為t時刻特征經(jīng)過全連接層的輸出;W和b分別為全連接層的權(quán)重和偏置;αt為t時刻隱藏狀態(tài)的權(quán)重;n為時間步長;o為加權(quán)融合后的特征。
注意力機(jī)制結(jié)構(gòu)如圖3所示??煽闯雒總€時刻的隱藏狀態(tài)經(jīng)過全連接層和Softmax激活函數(shù)后輸出對應(yīng)時刻權(quán)重,它代表對每個時刻隱藏狀態(tài)的關(guān)注度,通過給予每個時刻特征不同的關(guān)注度能夠進(jìn)一步增強(qiáng)故障特征。
圖3 注意力機(jī)制結(jié)構(gòu)Fig. 3 Attention mechanism structure
結(jié)合CNN、Bi GRU和注意力機(jī)制的深度故障診斷模型結(jié)構(gòu)如圖4所示。將一維原始信號輸入至2個交替連接的卷積層和池化層,其中第1個卷積層使用較大卷積核,以獲得較大感受野,第2個卷積層使用較小卷積核,盡可能全面捕捉局部特征,選用2個最大池化層對特征進(jìn)行降維。將提取的特征作為Bi GRU的輸入,利用多個GRU單元來引入時間維度信息,從而捕獲特征中時間依賴性。利用注意力機(jī)制對Bi GRU輸出的多個時刻特征進(jìn)行加權(quán)融合,利用全連接層和Softmax函數(shù)完成最后的分類。
圖4 故障診斷模型結(jié)構(gòu)Fig. 4 Fault diagnosis model structure
故障診斷模型的具體參數(shù)見表1,其中卷積層的填充都基于same的方式實現(xiàn)。
表1 故障診斷模型結(jié)構(gòu)參數(shù)Table 1 Parameters of the fault diagnosis model structure
結(jié)合CNN、Bi GRU和注意力機(jī)制的深度故障診斷模型診斷流程如圖5所示。首先,對多種狀態(tài)下的數(shù)據(jù)信號進(jìn)行歸一化處理,并將歸一化后的數(shù)據(jù)切割成固定長度的段,得到預(yù)處理后的數(shù)據(jù)樣本,將整個樣本劃分成為訓(xùn)練集和測試集。其次,將訓(xùn)練集數(shù)據(jù)經(jīng)過CNN特征提取、Bi GRU融合特征和注意力特征加權(quán)得到最終的特征,通過Softmax故障分類得到分類結(jié)果。然后,經(jīng)由梯度反向傳播訓(xùn)練模型,得到最終訓(xùn)練后的模型。最后,將測試集輸入訓(xùn)練完成的模型中,得到故障診斷結(jié)果,并由診斷結(jié)果得到評價指標(biāo),如準(zhǔn)確率。
圖5 故障診斷流程Fig. 5 Fault diagnosis process
本文使用凱斯西儲大學(xué)提供的軸承公開數(shù)據(jù)集進(jìn)行實驗驗證。軸承為驅(qū)動端軸承,采樣頻率為12 kHz,在0,0.75,1.5,2.25 kW 4種不同電動機(jī)負(fù)載下采集實驗軸承數(shù)據(jù),對應(yīng)轉(zhuǎn)速分別為1 797,1 772,1 750,1 730 r/min。選取0 負(fù)載、轉(zhuǎn)速為1 797 r/min的軸承數(shù)據(jù)訓(xùn)練模型,其余工況數(shù)據(jù)被用來驗證模型在變工況診斷的泛化能力。該軸承數(shù)據(jù)包括正常狀態(tài)、內(nèi)圈故障、滾動體故障和外圈故障4種狀態(tài)的軸承振動信號,其中每種故障下又包含3種不同損傷程度,共計10種運(yùn)行狀態(tài)。將各運(yùn)行狀態(tài)下采集到的軸承數(shù)據(jù)進(jìn)行歸一化處理,并采用重疊采樣方式對歸一化后的數(shù)據(jù)進(jìn)行分段處理,每段樣本振動信號包含2 048個數(shù)據(jù)點,軸承每種運(yùn)行狀態(tài)包含500個樣本,數(shù)據(jù)集總計5 000個樣本,使用獨(dú)熱碼編碼技術(shù)對樣本數(shù)據(jù)進(jìn)行標(biāo)簽化處理,同一標(biāo)簽下隨機(jī)選擇樣本并劃分訓(xùn)練集和測試集,構(gòu)成最終數(shù)據(jù)集,具體描述見表2。
表2 實驗樣本劃分Table 2 Experimental sample division
實驗環(huán)境為i7-7500U CPU(雙核 3.50 GHZ)、英偉達(dá)GEFORCE 940MX、python3.8、Pytorch1.2。采用Adam優(yōu)化器對模型進(jìn)行訓(xùn)練,設(shè)學(xué)習(xí)率為0.001,批尺寸為64,迭代次數(shù)為100。測試集每次迭代的準(zhǔn)確率和損失曲線如圖6所示。可看出在迭代40次后達(dá)到最優(yōu)結(jié)果,擁有較小損失和較高的診斷精度。
圖6 準(zhǔn)確率和損失曲線Fig. 6 Accuracy and loss curves
測試集得到的混淆矩陣如圖7所示??煽闯龈鞣N運(yùn)行狀態(tài)基本都分類正確,只有L0,L2,L4,L5沒有被完全分類正確,但是召回率(在實際為正的樣本中被預(yù)測為正樣本的概率)也都達(dá)到了95%以上,只有幾個樣本被分錯??偟墓收献R別準(zhǔn)確率為99.3%,這表明模型能夠很好地識別出每種狀態(tài)下的軸承。
圖7 混淆矩陣Fig. 7 Confusion matrix
為驗證模型的特征提取能力,將測試集輸入到訓(xùn)練好的模型中,使用t-SNE技術(shù)[17]對注意力層的輸出進(jìn)行降維處理,并將其分別映射為三維空間和二維空間進(jìn)行可視化,如圖8所示??煽闯?0種運(yùn)行狀態(tài)的數(shù)據(jù)分別在二維和三維空間的各自區(qū)域內(nèi)聚集,只有L0,L2,L4,L5等有非常少的混雜。這說明本文模型可有效地對軸承不同運(yùn)行狀態(tài)的特征進(jìn)行提取,具有較強(qiáng)的特征提取能力。
圖8 t-SNE降維可視化圖Fig. 8 t-SNE dimension reduction visualization
為進(jìn)一步驗證模型的診斷優(yōu)勢,選取0負(fù)載下的數(shù)據(jù)集,將本文模型與SVM(利用經(jīng)過PCA處理后的時域特征和基于包絡(luò)譜和倒頻譜的頻域特征訓(xùn)練的)、一維CNN、Bi GRU和具有注意力機(jī)制的CNN進(jìn)行比較。為降低其他因素干擾,隨機(jī)進(jìn)行5次訓(xùn)練集和測試集的劃分,在每次劃分情況下進(jìn)行多個模型的對比實驗。將5次實驗的故障診斷結(jié)果作為分析指標(biāo)。5種模型的測試集準(zhǔn)確率見表3。
表3 5種故障診斷模型的準(zhǔn)確率對比Table 3 Accuracy comparison of five kinds of fault diagnosis models
從表3可看出,利用人工提取特征進(jìn)行訓(xùn)練的SVM模型平均準(zhǔn)確率最低,只有90.3%,這是因為人為地挖掘特征難以保證得到具有豐富故障信息的特征。一維CNN和Bi GRU模型的平均準(zhǔn)確率相差不大。注意力機(jī)制CNN模型的平均準(zhǔn)確率能夠達(dá)到99.0%,這是因為具有注意機(jī)制的CNN能夠動態(tài)給予特征不同的權(quán)重,更加有效地關(guān)注與故障模式相關(guān)的重點特征,忽略無關(guān)特征,因此擁有較高的準(zhǔn)確率。本文模型準(zhǔn)確率較一維CNN、Bi GRU和注意力CNN模型平均準(zhǔn)確率分別提高了0.8%,0.6%和0.3%,能夠更加準(zhǔn)確地實現(xiàn)軸承的故障診斷。這是因為本文模型既具有一維CNN局部特征提取能力,又具有Bi GRU時間依賴信息的建模能力,能夠在獲取軸承信號局部復(fù)雜特征后進(jìn)一步融入特征之間時間維度信息,這些信息是分類特征的關(guān)鍵。同時其具備的注意力機(jī)制能進(jìn)一步關(guān)注與故障更相關(guān)的特征,因此具有最高的精度。
實際情況下的軸承經(jīng)常運(yùn)行在變負(fù)載環(huán)境中,為了驗證模型的泛化能力,選取0負(fù)載下軸承數(shù)據(jù)訓(xùn)練的模型,利用0.75,1.5,2.25 kW的軸承數(shù)據(jù)來驗證測試。與0負(fù)載下的測試樣本一致,其余負(fù)載各選取1 000個樣本作為測試集,診斷結(jié)果如圖9所示。
從圖9可看出,以上模型隨著負(fù)載的增加,診斷準(zhǔn)確率不斷下降。SVM模型準(zhǔn)確率最低,當(dāng)負(fù)載為2.25 kW時,準(zhǔn)確率僅為65%。因此該模型并不適應(yīng)于變工況下的故障診斷。本文模型具有更好的穩(wěn)定性,當(dāng)負(fù)載為2.25 kW時,準(zhǔn)確率達(dá)85%以上。
圖9 變負(fù)載準(zhǔn)確率Fig. 9 Accuracy under variable load
(1) 利用一維卷積神經(jīng)網(wǎng)絡(luò)和Bi GRU聯(lián)合提取特征,在獲得CNN提取的局部故障特征后,利用Bi GRU和注意力機(jī)制在特征中融入時間依賴性信息并動態(tài)給予特征不同權(quán)重。模型訓(xùn)練過程穩(wěn)定,在迭代40次后達(dá)到最優(yōu)結(jié)果,擁有較小損失和較高的診斷精度。
(2) 在測試集混淆矩陣上,總的故障識別準(zhǔn)確率為99.3%,表明模型能夠很好地識別出每種運(yùn)行狀態(tài)下的軸承狀態(tài)。
(3) 利用t-SNE技術(shù)對降維處理后的數(shù)據(jù)進(jìn)行可視化,軸承各運(yùn)行狀態(tài)的數(shù)據(jù)能很好地聚集在各自的空間內(nèi),只有少量數(shù)據(jù)被混雜到其他區(qū)域,說明基于一維CNN、Bi GRU和注意力機(jī)制的軸承故障診斷模型可有效地對軸承不同狀態(tài)的特征進(jìn)行提取,具有較強(qiáng)的特征提取能力。
(4) 在恒定負(fù)載情況下,基于一維CNN、Bi GRU和注意力機(jī)制的軸承故障診斷模型的故障分類平均準(zhǔn)確率達(dá)99%以上,在變負(fù)載情況下,故障分類準(zhǔn)確率達(dá)85%以上,較傳統(tǒng)的深度學(xué)習(xí)模型擁有良好的診斷精度。
(5) 由于實際的礦用軸承數(shù)據(jù)大多缺少標(biāo)簽,難以利用,因此文中選擇實驗?zāi)M軸承數(shù)據(jù)進(jìn)行模型驗證。未來將在此基礎(chǔ)上結(jié)合半監(jiān)督方式開發(fā)一種適用于擁有大量無標(biāo)簽軸承數(shù)據(jù)的故障診斷方法,以更好貼近實際。