趙志宏, 李春秀, 竇廣鑒, 楊紹普
(1. 石家莊鐵道大學(xué) 信息科學(xué)與技術(shù)學(xué)院,石家莊 050043; 2. 石家莊鐵道大學(xué) 省部共建交通工程結(jié)構(gòu)力學(xué)行為與系統(tǒng)安全國家重點(diǎn)實(shí)驗(yàn)室,石家莊 050043)
智能生產(chǎn)的發(fā)展加強(qiáng)了對早期故障診斷的需要,在機(jī)械設(shè)備中滾動軸承的運(yùn)行狀態(tài)往往直接影響機(jī)器能否正常工作。因此,精確的檢測和診斷軸承的狀態(tài)對于機(jī)械設(shè)備安全運(yùn)行占有重要地位[1]。
一直以來,研究者提出多種故障診斷算法對軸承故障進(jìn)行分類。Cai等[2]提出了能夠進(jìn)行診斷的面向?qū)ο筘惾~斯網(wǎng)絡(luò)復(fù)雜系統(tǒng)。Dong等[3]使用k-最近鄰方法來完成軸承的故障診斷。Konar等[4]通過小波去噪對原始信號進(jìn)行處理并提取特征,然后采用支持向量機(jī)進(jìn)行軸承故障診斷。張鈺等[5]從軸承振動信號中提取時(shí)域統(tǒng)計(jì)指標(biāo)作為特征向量,然后利用隨機(jī)森林進(jìn)行診斷。這些方法不能直接從原始信號中提取特征,因此,研究直接從軸承振動信號中提取特征并自動識別軸承健康狀態(tài)的診斷方法具有重要的研究價(jià)值。
近年來,深度學(xué)習(xí)(deep learning,DL)方法受到研究者的關(guān)注,DL方法克服了無法從大量數(shù)據(jù)中自動提取故障特征的難題,許多DL模型已被應(yīng)用于故障診斷并取得良好的效果。曲建嶺等[6]提出基于端到端的自適應(yīng)一維卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)模型來實(shí)現(xiàn)軸承故障診斷。趙敬嬌等[7]提出一種基于雙向長短期記憶網(wǎng)絡(luò)(BiLSTM)的診斷模型,通過BiLSTM自動提取軸承原始振動信號特征,從而實(shí)現(xiàn)軸承故障診斷。張西寧等[8]提出一種具有復(fù)雜特征提取能力的深度卷積自編碼器,以原信號和重構(gòu)信號差值最小為目標(biāo),通過對卷積核優(yōu)化和樣本微調(diào)達(dá)到良好的故障診斷效果。
一維CNN在檢測信號局部相關(guān)性存在不足,Wu等[9]通過卷積神經(jīng)網(wǎng)絡(luò)中一維信號輸入與二維信號輸入的分類性能進(jìn)行對比,得到二維信號有更高的分類精度和魯棒性。因此,將一維振動信號轉(zhuǎn)換為二維圖像進(jìn)行軸承故障診斷得到研究者的重視。Wen等[10]提出將振動信號轉(zhuǎn)換為二維灰度矩陣然后進(jìn)行故障診斷。李恒等[11]將振動信號進(jìn)行短時(shí)傅里葉變換得到時(shí)頻譜,然后輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷。袁建虎等[12]利用復(fù)Morlet小波將軸承振動信號轉(zhuǎn)換為二維時(shí)頻圖像后進(jìn)行故障診斷。上述方法忽略了振動信號不同時(shí)間間隔內(nèi)信息的相關(guān)性,不能很好地體現(xiàn)信號之間的長期依賴關(guān)系。
馬爾可夫變遷場(Markov transition field,MTF)利用馬爾可夫轉(zhuǎn)移概率來保留時(shí)域之間的信息關(guān)系[13]。首先,通過對振動信號的值域進(jìn)行劃分,并計(jì)算劃分后值域之間的轉(zhuǎn)移概率;然后,按照振動信號采樣點(diǎn)的順序,通過當(dāng)前采樣點(diǎn)所在值域和下一采樣點(diǎn)所在值域之間的轉(zhuǎn)移概率得到MTF矩陣,從而保留了振動信號的時(shí)間依賴關(guān)系和頻率特征。基于此,本文提出一種基于MTF-CNN的軸承故障診斷方法,利用MTF對軸承振動信號進(jìn)行編碼生成二維圖像,之后將其輸入到CNN實(shí)現(xiàn)故障特征的提取,進(jìn)而實(shí)現(xiàn)故障診斷,通過與其他幾種關(guān)于振動信號編碼方式的對比,本文模型可以更有效的提取軸承故障特征,得到更好的故障診斷效果。
MTF可將振動信號轉(zhuǎn)換成二維圖像,主要通過構(gòu)造MTF矩陣來保留信號時(shí)域中的信息。其編碼過程如下:
步驟1將軸承振動信號以N個(gè)采樣點(diǎn)為一組進(jìn)行劃分;
步驟2對劃分的采樣點(diǎn)進(jìn)行序列標(biāo)注,序列記為Xi(0
步驟3根據(jù)馬爾可夫鏈原理[14]計(jì)算振動點(diǎn)所在的值域qj之間的轉(zhuǎn)移概率,以此構(gòu)造一個(gè)Q×Q加權(quán)鄰接矩陣W,其元素Wij的值由值域qi中的所有振動點(diǎn)轉(zhuǎn)移到值域qj中的概率給出
(1)
步驟4為了很好地顯示時(shí)間序列特征,按照振動點(diǎn)的順序來構(gòu)建一個(gè)N×N的MTF矩陣,MTF中的mij表示xi所在的值域qi到xj所在的值域qj的轉(zhuǎn)移概率。
(2)
為了使MTF編碼圖像更好地突出信息特征,采用像素平均法來改變圖像的大小。將長度為64的軸承振動信號編碼為不同圖像大小的過程,如圖1所示。由圖1可知,采用像素平均法對圖像進(jìn)行壓縮可以略去微小的信息差異,更好地突出數(shù)據(jù)之間的規(guī)律性。
圖1 MTF編碼圖Fig.1 MTF coding diagram
卷積神經(jīng)網(wǎng)絡(luò)是DL的一個(gè)重要分支,CNN由具有可學(xué)習(xí)的權(quán)重和偏置常量的神經(jīng)元組成,是一種前饋神經(jīng)網(wǎng)絡(luò),它主要由卷積層、池化層和全連接層組成。Zhao等[15]提出了由一個(gè)卷積層和一個(gè)池化層組成局部特征學(xué)習(xí)塊來收集輸入數(shù)據(jù)的局部相關(guān)性。通過卷積層和池化層的疊加來提取輸入數(shù)據(jù)特征并減少網(wǎng)絡(luò)參數(shù),提高網(wǎng)絡(luò)性能。其中:卷積層通過卷積核按照指定的步長對輸入的數(shù)據(jù)進(jìn)行局部特征的提?。煌ㄟ^池化層對輸入數(shù)據(jù)進(jìn)行降維,減少網(wǎng)絡(luò)參數(shù)量并降低復(fù)雜度,減少冗余特征[16]。
為了更好地比較MTF的性能 ,本文采用基本的CNN模型結(jié)構(gòu)。具體的模型結(jié)構(gòu)如圖2所示,圖2由Conv1、Pool1、Conv2、Pool2、FC1、FC2組成,利用全連接層進(jìn)行分類,輸入圖像的大小為32×32,通道數(shù)為3,激活函數(shù)使用softmax函數(shù)[17],并使用交叉熵?fù)p失函數(shù)計(jì)算故障預(yù)測概率分布和真實(shí)故障概率分布之間的距離,具體的網(wǎng)絡(luò)參數(shù)如表1所示。
圖2 模型結(jié)構(gòu)圖Fig.2 Model structure diagram
表1 網(wǎng)絡(luò)參數(shù)Tab.1 Network parameters
基于MTF編碼方式和CNN網(wǎng)絡(luò)的軸承故障診斷模型可直接從原始振動信號中提取特征。首先,進(jìn)行振動信號MTF編碼生成二維圖像;然后,建立CNN模型,通過輸入圖像進(jìn)行訓(xùn)練?;贛TF-CNN的軸承故障診斷方法的具體步驟為:
步驟1按照一定的數(shù)據(jù)長度對軸承振動信號進(jìn)行劃分,并劃分訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;
步驟2將劃分好的數(shù)據(jù)按照MTF編碼方式編碼為二維圖像;
步驟3將轉(zhuǎn)換的圖像作為特征圖輸入構(gòu)建好的卷積網(wǎng)絡(luò)模型中并對參數(shù)調(diào)優(yōu),使其能夠提取故障特征信息;
步驟4通過Softmax分類器將其與故障類型建立映射關(guān)系實(shí)現(xiàn)故障診斷。
試驗(yàn)采用凱斯西儲大學(xué)軸承數(shù)據(jù)集[18]對MTF-CNN模型進(jìn)行驗(yàn)證,選取6205-2RS JEM SKF型號的DE驅(qū)動端軸承數(shù)據(jù),采樣頻率是12 kHz,故障直徑為0.177 8 mm,故障類型包括內(nèi)圈故障、滾動體故障以及外圈故障,試驗(yàn)數(shù)據(jù)樣本構(gòu)造如表2所示,其中數(shù)據(jù)集A是轉(zhuǎn)速為1 797 r/min的4類軸承數(shù)據(jù),數(shù)據(jù)集B是轉(zhuǎn)速為1 772 r/min的4類軸承數(shù)據(jù),數(shù)據(jù)集C是轉(zhuǎn)速為1 750 r/min的4類軸承數(shù)據(jù)。
表2 軸承數(shù)據(jù)集Tab.2 Bearing dataset
對數(shù)據(jù)進(jìn)行MTF編碼前需要將振動信號按一定的長度進(jìn)行劃分,MTF編碼圖的矩陣行數(shù)和列數(shù)的選擇依據(jù)是:一方面可以充分提取振動信號中的特征信息;另一方面便于后續(xù)處理,MTF編碼過程中使用步長為2的像素平均法,因此行數(shù)和列數(shù)選取2的冪次大小。綜合考慮之后,本文矩陣行數(shù)和列數(shù)的大小設(shè)置為512。在試驗(yàn)中,每一類故障構(gòu)造300個(gè)樣本,按照8∶2的比例進(jìn)行訓(xùn)練集和測試集劃分,劃分后分別為不同軸承故障類型標(biāo)簽進(jìn)行One-hot 編碼[19]。
根據(jù)MTF編碼原理可知,數(shù)據(jù)長度的選取對編碼圖像有一定的影響,這里研究不同數(shù)據(jù)長度對故障識別率的影響。試驗(yàn)數(shù)據(jù)采用表2的數(shù)據(jù)集A,按照128,256,512和1 024不同的長度對軸承信號進(jìn)行MTF編碼,然后采用CNN進(jìn)行故障診斷。設(shè)置學(xué)習(xí)率為0.001,試驗(yàn)結(jié)果如圖3所示。由圖3可知:當(dāng)數(shù)據(jù)長度為128時(shí),故障診斷準(zhǔn)確率較低,這是因?yàn)檎駝有盘柌蓸狱c(diǎn)太少,不能很好地反映故障特征;隨著數(shù)據(jù)長度的增加,模型的診斷準(zhǔn)確率上升,當(dāng)數(shù)據(jù)長度為512時(shí),故障診斷準(zhǔn)確率最高,達(dá)到99.11%;當(dāng)數(shù)據(jù)長度增加到1 024時(shí),模型的準(zhǔn)確率又有所降低,這是因?yàn)镸TF編碼是以振動信號數(shù)值劃分的值域之間的轉(zhuǎn)移概率來進(jìn)行編碼。所以當(dāng)數(shù)據(jù)長度過大時(shí),轉(zhuǎn)移概率值的相似度會越來越高,降低了不同特征數(shù)據(jù)之間的區(qū)分性。試驗(yàn)結(jié)果表明,在不采用像素平均法改變MTF矩陣大小的前提下,數(shù)據(jù)長度為512的MTF編碼效果最好。
圖3 不同數(shù)據(jù)長度對故障識別率的影響Fig.3 Influence of different data length on fault recognition rate
當(dāng)數(shù)據(jù)長度為512時(shí),生成的MTF圖像大小為512×512,使用像素平均法將圖像縮小為256×256,2種不同大小的圖像如圖4所示,以故障直徑為0.177 8 mm的3種故障類型和正常信號為例,圖4(a)所示圖像大小為512×512,圖4(b)所示圖像大小為256×256,從
圖4中可知,兩組圖像的4種特征都比較明顯,但是圖4(b)中4種類型之間的差異性更大,更容易進(jìn)行軸承類別區(qū)分。對比圖4(a)與圖4(b)可以看出,經(jīng)過像素平均值改變圖像大小后,其故障特征規(guī)律性更明顯。
圖4 數(shù)據(jù)長度512的MTF軸承編碼圖Fig.4 MTF bearing coding diagram with data length 512
對圖像大小為256×256的數(shù)據(jù)集進(jìn)行故障診斷試驗(yàn),得到的分類混淆矩陣如圖5所示。圖5中:0~3分別表示軸承的4種類別;對角線上深色區(qū)域數(shù)值是每類故障的準(zhǔn)確率;其余部分的數(shù)值為誤分類率。從圖5可知,每一類故障識別準(zhǔn)確率都達(dá)到100%。
圖5 分類混淆矩陣Fig.5 Classification confusion matrix
進(jìn)一步分析卷積神經(jīng)網(wǎng)絡(luò)對MTF編碼圖的特征提取與故障識別能力,模型訓(xùn)練過程中的準(zhǔn)確率和損失率曲線,如圖6所示。從圖6中可知,收斂速度很快,30代之后便趨于穩(wěn)定狀態(tài)。訓(xùn)練集和測試集的準(zhǔn)確率都達(dá)到100%,損失率呈下降趨勢直至趨于0,模型學(xué)習(xí)效果比較好。
圖6 數(shù)據(jù)長度為512模型準(zhǔn)確率及損失率曲線Fig.6 Accuracy and loss rate curve with data length of 512
進(jìn)一步研究圖像大小對模型準(zhǔn)確率的影響,對128,256,512和1 024等4種不同的數(shù)據(jù)長度進(jìn)行試驗(yàn)研究,試驗(yàn)結(jié)果如表3所示。由表3可知,采用像素平均法壓縮圖像的大小后,模型的診斷準(zhǔn)確率均得到提升。當(dāng)數(shù)據(jù)長度為1 024時(shí),生成的MTF圖像大小為1 024×1 024,模型的準(zhǔn)確率為97.76%;采用像素平均后,圖像大小為512×512,模型的準(zhǔn)確率提高到99.1%;再次采用像素平均進(jìn)行圖像壓縮,圖像大小為256×256,模型準(zhǔn)確率得到99.55%;進(jìn)一步像素平均后,圖像大小為128×128,此時(shí)模型的診斷準(zhǔn)確率為100%。試驗(yàn)結(jié)果表明,MTF編碼圖經(jīng)過像素平均壓縮圖像大小后可以得到更好的故障診斷效果。其中數(shù)據(jù)長度為512,圖像大小為256×256和數(shù)據(jù)長度為1 024,圖像大小為128×128得到的故障診斷正確率最好。
表3 不同圖像大小的模型準(zhǔn)確率Tab.3 Model accuracy of different image sizes 單位:%
為了進(jìn)一步驗(yàn)證軸承振動信號MTF編碼的模型診斷效果,與其他振動信號圖像編碼方式進(jìn)行比較試驗(yàn)。軸承振動信號編碼為二維圖像的方式主要有格拉姆角場(GAF)和遞歸圖,其中格拉姆角場包括格拉姆角和場(GASF)和格拉姆角差場(GADF)2種。文獻(xiàn)[20]的研究結(jié)果表明,數(shù)據(jù)長度為300的GADF編碼效果最好。為了便于比較,同樣設(shè)置長度為300對軸承數(shù)據(jù)進(jìn)行劃分,之后將不同方式編碼后的圖像作為特征圖輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取與分類,得到的試驗(yàn)結(jié)果如圖7所示。由圖7可知,MTF編碼的故障識別效果最好,GADF編碼方式也得到較高的故障診斷率,遞歸圖效果相對較差。試驗(yàn)結(jié)果表明,與其他編碼方式相比MTF具有更好的軸承故障特征提取能力。
圖7 不同圖像編碼方式對比Fig.7 Comparison of different image coding methods
為了驗(yàn)證該模型在不同載荷條件下的診斷效果,將表1中不同的數(shù)據(jù)集分別作訓(xùn)練集和測試集來對模型的泛化能力進(jìn)行驗(yàn)證,試驗(yàn)A→B代表在A數(shù)據(jù)集上進(jìn)行訓(xùn)練,B數(shù)據(jù)集上進(jìn)行測試。分別對數(shù)據(jù)長度1 024圖像大小為128和數(shù)據(jù)長度512圖像大小為256這兩組圖像數(shù)據(jù)進(jìn)行泛化試驗(yàn),試驗(yàn)結(jié)果如圖8所示。由圖8可知,兩組試驗(yàn)都取得了較高的準(zhǔn)確率,診斷識別率都達(dá)到了98%以上,表明本文模型有較好的泛化能力。
圖8 載荷改變時(shí)故障識別率Fig.8 Fault recognition accuracy when the load changes
本文提出一種基于MTF-CNN的軸承故障診斷方法并進(jìn)行了試驗(yàn)研究,從中可以得到以下結(jié)論:
(1) 正常軸承、內(nèi)圈故障、外圈故障、滾動體故障的MTF編碼有明顯不同,從軸承振動信號的MTF編碼圖像中可以有效提取故障特征信息。
(2) MTF編碼圖的數(shù)據(jù)長度和圖像大小對軸承故障診斷效果影響比較大,需要根據(jù)應(yīng)用的不同場合確定合適的數(shù)據(jù)長度和圖像大小。
(3) 通過與其他編碼方式進(jìn)行比較試驗(yàn),結(jié)果表明,MTF編碼方式在軸承故障診斷中的準(zhǔn)確率高于GAF和遞歸圖編碼方式。
(4) 為了驗(yàn)證模型的泛化性能,選用不同載荷的數(shù)據(jù)作為訓(xùn)練集和測試集進(jìn)行試驗(yàn)。結(jié)果表明,該模型在載荷發(fā)生改變時(shí),依舊取得了較高的試驗(yàn)準(zhǔn)確率,具有較好的泛化能力。