周陳林 董紹江 李玲
摘要: 針對現(xiàn)有滾動軸承故障診斷模型中人工選取特征的不確定性,診斷模型不具有針對性的難題,提出一種針對滾動軸承多狀態(tài)特征信息的改進型卷積神經(jīng)網(wǎng)絡故障診斷方法。首先,該方法針對滾動軸承故障的多狀態(tài)特征信息,提出一種改進型卷積神經(jīng)網(wǎng)絡設計基本準則(BPDICNN);再次,利用提出的BPDICNN設計了卷積神經(jīng)網(wǎng)絡模型,直接在滾動軸承原始振動信號上進行“端到端”的學習訓練,從原始信號中挖掘出包括故障類型、故障位置、故障損傷程度、故障檢測時負載狀態(tài)等多個特征;最后,利用實驗數(shù)據(jù)進行了驗證,實現(xiàn)了30個滾動軸承故障狀態(tài)的有效診斷,準確率為100%,實驗結果驗證了方法的有效性。
關鍵詞: 故障診斷; 滾動軸承; 改進型卷積神經(jīng)網(wǎng)絡; 多狀態(tài)
中圖分類號: TH165+.3; TH133.33 ?文獻標志碼: A ?文章編號: 1004-4523(2020)04-0854-07
DOI:10.16385/j.cnki.issn.1004-4523.2020.04.024
引 言
滾動軸承作為旋轉機械的重要零部件之一,其健康狀態(tài)影響著整個機械設備的正常運行。由于現(xiàn)代化機電裝備規(guī)模大,檢測點多,傳感器采樣頻率高,設備服役周期長,檢測系統(tǒng)將獲得海量的數(shù)據(jù),機電裝備的狀態(tài)檢測正邁入“大數(shù)據(jù)”的時代[1]。如何從海量數(shù)據(jù)中自動挖掘特征,構建針對性的故障診斷模型,對軸承等重要零件進行實時監(jiān)測,并保障機械系統(tǒng)的安全運行具有重要意義。
目前對于滾動軸承故障檢測的傳統(tǒng)診斷算法大都預先經(jīng)過小波變換、傅里葉變換等復雜的信號特征提取,然后通過PCA、自編碼器等方式約簡數(shù)據(jù),最后使用SVM等分類器分類。這種人工特征選取方式耗時、不確定,并且容易在數(shù)學上割裂軸承信號的原始物理屬性。
近幾年,將深度神經(jīng)網(wǎng)絡應用在軸承智能診斷領域已經(jīng)成為熱門課題。Tan等[2]利用小波變換對軸承時域振動信號進行降噪,然后使用堆疊式的稀疏自編碼器構建深度神經(jīng)網(wǎng)絡,對滾動軸承進行故障診斷。Gan等[3]利用深度置信網(wǎng)絡,提出了分層診斷網(wǎng)絡(Hierarchical Diagnosis Network,HDN),對滾動軸承的10類故障達到了 99.03%的診斷準確率。Sun等[4]利用降噪稀疏自編碼器構建了一個3層的深度神經(jīng)網(wǎng)絡,達到了 97.61%的軸承故障識別率。He 等[5]提出了大內存存儲檢索網(wǎng)絡 (Large Memory Storage Retrieval,LAMSTAR),實現(xiàn)了在不同轉速下故障診斷率達到96%以上。Jia等[6]對軸承原始數(shù)據(jù)進行快速傅里葉變換,然后使用一個4層深度神經(jīng)網(wǎng)絡進行故障診斷,識別率達到99.68%±0.22%。袁建虎等[7]提取滾動軸承信號的時頻圖作為卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)輸入,實現(xiàn)對4類軸承故障診斷,平均正確識別率為97%。曲建嶺等[8]提出了“端到端”自適應一維卷積神經(jīng)網(wǎng)絡,對10類軸承故障狀態(tài)達到99%診斷準確率。
以上包括CNN在內的深度神經(jīng)網(wǎng)絡算法大多仍然使用人工提取的特征作為網(wǎng)絡輸入,少數(shù)研究也使用CNN對原始振動數(shù)據(jù)直接“端到端”訓練,進而實現(xiàn)診斷。但是由于在軸承故障診斷領域中,CNN模型設計沒有合適的設計準則,導致沒能最大限度地利用CNN的提取特征自學習特點,限制了模型對軸承多狀態(tài)特征信息的提取和表征能力,進而導致軸承故障狀態(tài)能夠被有效診斷的數(shù)量較少。
本文提出一種針對滾動軸承多狀態(tài)特征信息的改進型卷積神經(jīng)網(wǎng)絡故障診斷方法。首先針對滾動軸承的多狀態(tài)特征信息提出改進型卷積神經(jīng)網(wǎng)絡設計基本準則(Basic Principles for Designing Improved Convolutional Neural Network,BPDICNN),其次按照BPDICNN設計了卷積神經(jīng)網(wǎng)絡診斷模型,對西儲大學軸承數(shù)據(jù)庫的原始數(shù)據(jù)進行“端到端”學習訓練,然后進行故障診斷,實驗結果驗證了本文方法的有效性。
1 針對軸承多狀態(tài)信息的CNN構建[*2]1.1 BPDICNN設計準則 ?CNN由 Yann Le Cun在1989年提出,在模式分類領域有著廣泛的應用,CNN中卷積運算具有稀疏連接、權值共享的特性,可以在 CNN 的輸入端直接輸入原始信號,在輸出端輸出結果。CNN這種“端到端”的特點,可以讓CNN完成特征提取、數(shù)據(jù)約簡與分類器分類整套過程。但是如何針對多狀態(tài)的軸承特征信息進行診斷,最大限度的利用CNN的提取特征自學習特點,還需要對現(xiàn)有的CNN模型進一步改進,構建合理的CNN模型設計準則。
為了實現(xiàn)CNN模型設計準則的構建,張偉[9]提出了在軸承時域信號設計CNN時,第一層應采用大卷積核[9],目的是為了提取短時特征,其作用與短時傅里葉變換類似,只不過將短時傅里葉變換的正弦函數(shù)更改為第一層的大卷積核。Krizhevsky等[10]提出了在圖像識別領域深度卷積神經(jīng)網(wǎng)絡AlexNet,該模型設計為步長比池化層的尺寸小,使得池化層的輸出之間有重疊和覆蓋,提升特征表達的豐富性,為了實現(xiàn)對多狀態(tài)軸承特征信息的表征,這種模型設計方式可以應用到軸承故障診斷領域的CNN設計中。軸承的時域故障信號是一維信號,在設計模型卷積層時,保證有效提取特征的同時,應適當縮小數(shù)據(jù)尺寸。這樣設計可以有效防止模型結構變得復雜冗長,減小模型訓練難度。
基于以上分析,針對多狀態(tài)特征信息的滾動軸承故障診斷,本文提出一種改進型卷積神經(jīng)網(wǎng)絡設計基本準則(BPDICNN),具體原則描述如下:
1)第一層卷積層使用大卷積核,以便有效提取滾動軸承時域信號短時特征。
2)池化核的尺寸大于池化步長,增加對滾動軸承特征信息表達的豐富性,以便對多狀態(tài)特征信息的滾動軸承故障診斷。
3)卷積層移動步長大于1,以便卷積層提取特征的同時適當縮小尺寸,避免模型復雜冗長。
1.2 卷積神經(jīng)網(wǎng)絡模型
按照BPDICNN設計了如圖1所示的CNN結構。輸入層的尺寸為1×4096;在圖像識別領域大多采用尺寸為3×3或者5×5的卷積核,該層相當于獲取9或25像素的感受野,為了更好地提取原始信號的特征,此處模型第1層卷積層的大卷積核尺寸設計為1×32,同時使用步長為1×4,讓卷積層在提取特征的同時適當縮小尺寸,加速網(wǎng)絡學習訓練過程;第2層池化層尺寸為1×10,移動步長為1×4,交叉采樣可以使得模型表達的特征更加豐富;第3層卷積層的卷積核尺寸為1×5, 步長為1×3; 第4層池化層尺寸為1×10,步長為1×4;第5層卷積層的卷積核尺寸為1×5,步長為1×3;第6層為全連接層有120節(jié)點;經(jīng)過第7層Softmax層后完成30個故障狀態(tài)分類。模型結構參數(shù)如表1所示。
1.3 模型的訓練
模型采用Adam優(yōu)化器,動態(tài)調整每一個參數(shù)的學習率,增強模型對超參數(shù)的魯棒性。為防止訓練過擬合,模型采用Dropout正則化。CNN能夠實現(xiàn)對輸入的滾動軸承時域信號和輸出的診斷結果之間的高維非線性映射,能夠在不需要任何輸入輸出之間的精確表達式的前提下,利用已經(jīng)標記的數(shù)據(jù)進行訓練,提取特征,建立輸入輸出的映射關系。模型訓練流程如圖2所示。
2 軸承診斷結果與分析
2.1 數(shù)據(jù)集和數(shù)據(jù)增強 ?本文的試驗數(shù)據(jù)來自于美國凱斯西儲大學(CWRU)滾動軸承數(shù)據(jù)中心[11]。本試驗的對象為驅動端軸承,被診斷的軸承型號為深溝球軸承SKF6205,有故障的軸承由電火花加工制作而成,系統(tǒng)的采樣頻率為12 kHz。試驗中有3種故障類型:滾動體故障、內圈故障、外圈故障。其中外圈故障有3處位置,分別是:外圈3點鐘部位、外圈6點鐘部位、外圈12點鐘部位。同時每一處故障分別對應不同損傷程度:0.007,0.014,0.021,0.028 inch。每一處故障對應不同的負載狀態(tài):1HP,3HP。一共有30種待診斷的故障狀態(tài)。包含故障的類型、外圈故障的具體位置、故障的損傷程度、故障檢測時的負載狀態(tài)。30種故障狀態(tài)如表2所示,其中B表示滾動體故障,IR表示軸承內圈故障,OR@3表示軸承外圈3點鐘部位故障。
增強機器學習模型泛化能力最好的辦法是使用更多的訓練樣本[12],數(shù)據(jù)集增強技術即通過增加訓練樣本,以達到增強深度神經(jīng)網(wǎng)絡泛化性能的目的。在計算機視覺領域中對圖片進行鏡像、旋轉、平移、修剪縮放等操作實現(xiàn)數(shù)據(jù)集增強。對于一維故障診斷信號,由于其特有的時變性和周期性,圖片的數(shù)據(jù)集增強技術并不完全適用,這里使用如圖3所示的重疊采樣方法。
2.2 模型測試結果
采用表3中數(shù)據(jù)集生成算法,得到訓練集樣本數(shù)為4288,測試集樣本數(shù)為200。實驗采用Google公司的Tensorflow深度學習框架,運行環(huán)境為Windows10,設備配置為Intel公司的Core i3-5010U CPU。設計的CNN模型對滾動軸承故障30類狀態(tài)進行4000輪迭代訓練,訓練過程的損失和測試準確率如圖4所示。
模型4000輪迭代一共訓練0.95 h。如圖4(a)中A點是在訓練時間為0.096 h時,第一次達到測試準確率100%。測試準確率曲線在訓練時間0.3 h后逐漸穩(wěn)定。實驗結果表明:按照BPDICNN設計的CNN模型能夠從原始信號中挖掘出包括故障類型、故障位置、故障損傷程度、故障檢測時負載狀態(tài)等多個特征,實現(xiàn)對滾動軸承故障多狀態(tài)信息精準診斷。
卷積層使用隨機正態(tài)分布初始化,經(jīng)過4000次訓練迭代,各卷積層權值分布隨著時間的變化如圖5所示。結果表明,卷積層1的卷積核的權重分布隨著迭代次數(shù)的增加改變最明顯,學到的特征最多,卷積層2、卷積層3學到的特征逐層減少。
卷積層1使用32個尺寸為1×32的卷積核,圖6為第1層卷積核的時頻域特征。卷積層1的卷積核中存在頻域特征相似的卷積核,學到了重復的特征??梢酝ㄟ^去掉相似的卷積核使模型結構得到優(yōu)化。
2.3 卷積核數(shù)量分析
圖7為卷積層1不同數(shù)量的卷積核對模型訓練速度的影響。
實驗中的損失為一個批次的平均交叉熵。如圖7所示,48個卷積核的模型收斂得最慢,訓練時間最長,其次是32個卷積核,4,8和16個卷積核的曲線收斂速度相差不大。經(jīng)過4000次迭代后,8,16,32個卷積核的測試準確率均為100%,4個卷積核的測試準確率為96.5%,48個卷積核的測試準確率為96.98%。對比訓練時間、收斂速度以及測試準確率,第1層卷積核選取8個或者16個。
2.4 不同訓練量分析
對于10%,20%,40%,60%,80%,100%的訓練集數(shù)據(jù)量進行4000輪迭代訓練,診斷表2中的30類故障狀態(tài)。圖8為不同的數(shù)據(jù)量經(jīng)過4000輪迭代訓練,測試準確率隨著時間的變化。
60%,80%,100%的數(shù)據(jù)量迭代4000輪中都出現(xiàn)了100%最好測試準確率。20%數(shù)據(jù)量最好測試準確率為99.5%;10%數(shù)據(jù)量的最好測試準確率為86.66%。20% ,40%,60%,80%,100%的數(shù)據(jù)量測試準確率曲線差距很小,只有10%數(shù)據(jù)量的曲線相差較大,結果表明:按照BPDICNN設計的CNN模型在滾動軸承故障信號診斷中,數(shù)據(jù)增強對訓練的準確率會有所提升。20%數(shù)據(jù)量和100%數(shù)據(jù)量的測試結果差距不大,此模型能很好地提取滾動軸承故障的有效特征,對訓練數(shù)據(jù)量有很好的魯棒性。
2.5 模型訓練結果對比驗證
在相同的數(shù)據(jù)集下,不經(jīng)過任何特征預處理,進行“端到端”的故障診斷,對比全連接深度神經(jīng)網(wǎng)絡(DNN)和基于BPDICNN的CNN分別經(jīng)過4000次迭代訓練,對不同數(shù)目的滾動軸承故障狀態(tài)進行故障診斷。其中設計的DNN含有3個隱藏層,每層結點為500個,輸出層的結點分別為5,10,20,30個,使用ReLU函數(shù)作為激活函數(shù)。例如診斷數(shù)目10對應著表2中的編號1-10的故障狀態(tài)。實驗結果如表4所示。
[10] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks [C].Proceedings of the 25th International Conference on Neural Information Processing System,2012: 1097-1105.
[11] http://csegroups.case.edu/bearingdatacenter/pages/welco me-case-western-reserve-university-bearing-data-center-website[EB/OL].
[12] Goodfellow I, Bengio Y, Courville A. Deep Learning [M]. Cambridge:MIT Press, 2016.
Abstract: An improved fault diagnosis model for multi-state faulty bearings by using convolutional neural network is proposed in this paper, aiming at the problems of the uncertainty in manual feature selection and the unspecific of existed fault diagnosis models. At first, according to the multi-state feature of the faulty bearings, a basic principle for designing an improved convolutional neural network (BPDICNN) is proposed by taking advantage of the sparse connection and weight sharing of convolutional neural network. Secondly, a convolutional neural network model is designed by using the BPDICNN design principle, and the “end-to-end” learning and training is carried out directly on the original vibration signal of faulty bearing. Multiple features including fault types, fault positions, fault damage degree and load state are extracted from the original signals. Finally, test data are used to verify the fault diagnosis of 30 types of faulty bearings with 100% accuracy. Test results verified the effectiveness of the proposed method.
Key words:fault diagnosis; rolling bearing; improved convolutional neural network; multi-state