黃克康,武 兵,2,張志偉
(1.太原理工大學機械電子工程研究所,山西 太原 030024;2.太原理工大學新型傳感器與智能控制教育部重點實驗室,山西 太原 030024)
行星齒輪箱是旋轉(zhuǎn)機械的重要部件之一,在實際運行過程中,行星齒輪箱承受動態(tài)重載、復雜的運行環(huán)境和條件,這些環(huán)境和條件會導致太陽齒輪、行星齒輪、齒圈和其他關鍵部件發(fā)生故障[1]。而行星齒輪箱的振動信號復雜,通常受到噪聲和干擾的污染。此外,行星齒輪箱故障診斷的故障樣本也很少。這些都增加了行星齒輪箱故障診斷的難度[2]。因此,針對行星齒輪箱故障采取有效診斷方法非常重要。
自深度學習方法被提出以來[3],其中最經(jīng)典的卷積神經(jīng)網(wǎng)絡,由于其特征提取性能較好,所以被廣泛應用在機械故障診斷領域。但是,卷積神經(jīng)網(wǎng)絡也存在一定的問題;診斷輸出不穩(wěn)定。為了解決這個問題,我們引入了集成學習。在集成學習中Boosting[4]算法運用最廣泛,而AdaBoost[5]算法讓Boosting從理論方法變成具有實踐意義的實用算法,可以應用于各種實際問題,是集成學習技術中非常重要的算法之一。
因此,為了適應原始時域振動故障信號的處理以及解決卷積神經(jīng)網(wǎng)絡診斷輸出不穩(wěn)定,提出了一種基于AdaBoost集成學習的一維深度卷積神經(jīng)網(wǎng)絡故障診斷模型。首先,使用一維卷積從齒輪的原始時域振動信號中提取特征,然后通過使用兩個弱學習器分類的性能來更新權重,根據(jù)調(diào)整權重集后的訓練來訓練弱分類器,如此重復,最后通過集合策略整合弱分類器,形成集成卷積神經(jīng)網(wǎng)絡;來建立一個穩(wěn)定的用于行星齒輪箱的智能故障診斷的模型。
該模型由特征提取部分由輸入層,一維卷積層以及池化層三個部分組成。通過多個卷積層和池化層的交替來提取原始信號的特征信息,之后連接兩部分全連接層來進行弱學習器的故障分類。實驗結果表明:集成卷積神經(jīng)網(wǎng)絡能夠行星齒輪原始振動信號進行快速診斷。
相對于傳統(tǒng)卷積神經(jīng)網(wǎng)絡對齒輪原始故障的診斷,集成卷積神經(jīng)網(wǎng)絡具有更強的辨識能力和更快的收斂速度;所建立的智能診斷模型可以有效地診斷齒輪不同的故障狀態(tài)。
由于原始時域振動信號是一維數(shù)據(jù),而一般卷積網(wǎng)絡所處理的數(shù)據(jù)是二維圖片數(shù)據(jù)。所以采用一維卷積網(wǎng)絡減少了信號預處理的工作量并可以更好地完成的特征提取工作[6]。該模型通過三個交替的卷積層來完成特征提取過程,最終通過全連接層來完成行星齒輪箱的故障診斷。
該模型由特征提取部分,以及分類器部分組成。由輸入層,一維卷積層以及池化層三個部分組成特征提取部分。之后全連接層部分連接softmax分類器作為分類器部分,如圖1所示。
圖1 基于集成學習的一維深度卷積神經(jīng)網(wǎng)絡故障診斷模型Fig.1 One-Dimensional Deep Convolutional Neural Network Fault Diagnosis Model Based on Ensemble Learning
其針對振動信號主要改進如下:
(1)為了更好的提取一維振動時域信號的特征,采用一維卷積網(wǎng)絡。一方面可以減少原始信號的特征丟失,另一方面不需對原始信號進行其它的預處理。
(2)由于所提出的模型為三層一維卷積,所以通過對卷積網(wǎng)絡選用不同的卷積核尺寸情況下的分類性能分析進行篩選;以找到最適合的尺寸。
(3)采用Batch Normalization[7],而Batch Normalization就是通過一定的規(guī)范化手段,把各層網(wǎng)絡的特征輸入值的數(shù)值范圍縮放到標準正態(tài)分布(均值為0方差為1),使線性函數(shù)對輸入更加敏感,從而對輸入信號的變化更加敏感。一方面能加快訓練速度,另一方面可以解決梯度消失問題。
2.1.1 Dropout
使用Dropout[8]是防止模型過擬合。我們隨機讓50%的神經(jīng)元停止工作,降低對局部特征的依賴,增強模型的泛化性,可以明顯地減少過擬合現(xiàn)象。
2.1.2 小批量隨機算法和歸一化
這里模型使用小批量隨機算法和歸一化處理策略,先用小批量隨機算法進行訓練,把數(shù)據(jù)分為若干個批次,并且參數(shù)按批次更新,使得相同批次中的一組數(shù)據(jù)共同決定了本次梯度的方向,降低了局部最優(yōu)的可能性,也降低了計算量。批量歸一化使用歸一化步驟來確定訓練期間確定的各層輸入的均值和方差,從而減輕了內(nèi)部協(xié)變量偏移的問題,同時減少了梯度對參數(shù)的依賴性,降低了梯度發(fā)散的可能性,并且改善這提高了學習速度并減少了Dropout的需求。
2.1.3 softmax分類器
所提出的模型使用softmax[9]回歸方法。softmax分類器是多分類任務中邏輯回歸的擴展,分類標簽為yi∈{1,2,…,k},K—要分的類別數(shù);hk—全連接層的激活值;Wki—連接softmax層和全連接層的權重,則softmax的輸入表示為:
概率的定義為:
在做多分類問題時,通過計算各個類別占全部的比例,輸出向量的第幾維最大,就表示屬于哪個類別的概率最大,由此分類。
將原始振動信號輸入第一層卷積網(wǎng)絡。為了使網(wǎng)絡可以初始化權重和偏差。該層網(wǎng)絡使用卷積加上池化層對輸入信息特征進行采樣,執(zhí)行小批量和歸一化處理后,使用激活函數(shù)RELU。三層卷積網(wǎng)絡原始參數(shù)相同,使用核函數(shù)大小都為為(3×1)、步長為1,池化層核函數(shù)大小為(3×1)、步長為1的卷積核對輸入數(shù)據(jù)進行特征提取。
第二部分是由兩個分別更新參數(shù)的全連接部分(兩部分設置相同),來自池化之后的8192個神經(jīng)元輸入第一層全連接層,同時輸出節(jié)點數(shù)3072個,上一層的3072個神經(jīng)元輸入第二層全連接層,同時輸出節(jié)點數(shù)2048個,上一層的2048個神經(jīng)元輸入第三層全連接層,同時輸出節(jié)點數(shù)10個,形成緊湊和穩(wěn)健的特征。之后將降維后的特征輸入到softmax分類函數(shù)中,最終完成分類工作。網(wǎng)絡結構中使用的參數(shù),如表1所示。
表1 網(wǎng)絡結構Tab.1 Network Structure
我們訓練一個一維卷積網(wǎng)絡C,該網(wǎng)絡接收輸入樣本數(shù)據(jù),以及分類器網(wǎng)絡F1和F2,這些網(wǎng)絡從C獲取特征。F1和F2將它們分類為K類,為它們輸出對數(shù)的維數(shù)向量。我們通過將softmax函數(shù)應用于向量來獲得分類概率。我們使用公式p1=(y|x),p2=(y|x)分別表示由F1和F2獲得的輸入x的K維概率輸出。
為了對樣本數(shù)據(jù)正確分類,首先我們假設這兩個分類器可以正確分類源樣本。然后我們利用兩個分類器在目標樣本預測上的差異來同時更新參數(shù)。我們通過測量兩個分類器之間的差異并將其最大化。
在這里,我們考慮使用以下等式d(p1(y|x),p2(y|x))測量目標樣本的差異,其中d表示測量兩個概率輸出之間的差異的函數(shù)。此后,我們稱該術語為差異。我們的目標是獲得一個可以將目標樣本分類效果最大化的分類器。
在這里我們將網(wǎng)絡分為兩個模塊:卷積部分(C)和分類器(F1,F(xiàn)2)。分類器學會在目標樣本上最大化差異步驟B,而生成器學會在目標步驟最小化差異步驟C。請注意,我們采用了訓練步驟A,以確保源樣本具有區(qū)別特征。
對于集成學習來說,我們有兩個目標:
(1)我們訓練該模型對齒輪數(shù)據(jù)集進行正確的診斷,我們訓練網(wǎng)絡以最小化softmax交叉熵。如下:
(2)我們將F1、F2訓練為C的分類器。其中我們將F1、F2之間的概率輸出的差的絕對值用作差異損失。通過增加F1、F2的差異損失,我們可以對兩個分類器進行不同優(yōu)化,獲取不同的參數(shù),使F1、F2同時進行不同權重的診斷;以提高準確率和診斷速度。優(yōu)化目標如下:
式中:p1k、p2k—類別K的F1和F2的概率輸出。
所以,總來說,我們需要訓練兩個分類器,它們從一維卷積中獲取輸入并最大化d(p1(y/x),p2(y/x))。其中分類器F1和F2都必須正確地對測試集樣本進行分類。所以我們總的優(yōu)化目標如下:
實驗中采用試驗臺為HD-CL-012X行星齒輪箱,如圖2所示。
圖2 HD-CL-012X行星齒輪箱Fig.2 HD-CL-012X Planetary Gear Box
在實驗過程中,選用1500r/min的轉(zhuǎn)速,負載設為3N·m,采集頻率設為5kHz,傳感器安裝在軸承座豎直徑向上。
本次試驗所采集的狀態(tài)數(shù)據(jù)樣本齒輪的狀態(tài)共分四種:(1)正常;(2)點蝕;(3)磨損;(4)裂紋。
其中裂紋狀態(tài)各包含寬度為0.01mm、0.02mm 和0.05mm 三種程度的故障,深度均為0.1mm.磨損和點蝕都為輕度,中度以及重度三種狀態(tài)[11]。
采樣時間設為70s,最終獲取了齒輪在穩(wěn)定工況下對應4種狀態(tài)下的x、y、z方向上的原始振動信號,如圖3所示。
圖3 不同缺陷的齒輪Fig.3 Gears with Different Defects
實驗需要多次更換故障件,單次數(shù)據(jù)采集時間70s,采集完成后修改電機以及負載參數(shù),再次采集。
采集完故障齒輪再不同運行情況的數(shù)據(jù)后,更換下一組故障齒輪,重復上述步驟。采集到的數(shù)據(jù)共有四種健康狀況,如表2所示。
表2 行星齒輪箱齒輪健康狀態(tài)數(shù)據(jù)集Tab.2 Planetary Gearbox Gear Health Data Set
本實驗菜蔬的數(shù)據(jù)一共有10組,從每組數(shù)據(jù)中取2000個樣本,共計樣本集20000個樣本,如表2所示。利用分層采樣原理來將各部分樣本分成相同的10個等分數(shù)據(jù)集集,每個子集取80%用于訓練,20%用于測試。
實驗過程為以下幾個步驟:
首先,安裝傳感器,完成信號傳輸通路的構建。第二步,完成對軟件相關參數(shù)的設置。第三步,啟動電機,設置電機參數(shù)。第四步,采集數(shù)據(jù),并存儲數(shù)據(jù)。第五步,更改負載參數(shù),重復第四步第五步,直至三種負載信號采集完成。第六步,更改電機轉(zhuǎn)速,重復第三、四、五、六步,直至所需多種轉(zhuǎn)速遍歷。第七步,設置負載為空載,停止電機工作,切斷電源,更換不同狀態(tài)零件,重復上述操作,最后完成行星齒輪箱所有故障模式下的數(shù)據(jù)采集工作,如圖4所示。
圖4 實驗步驟流程圖Fig.4 Experimental Procedure Flowchart
通過分析在同一數(shù)據(jù)集下,卷積核的大小和對模型分類結果影響的實驗,并將各種實驗數(shù)據(jù)分類數(shù)據(jù)整理如下。其中通過多次診斷后,將學習率設定為0.0005,并測試卷積核的大小對集成卷積神經(jīng)網(wǎng)絡的分類效果的影響,將三層卷積核的采樣寬度設置為1,3,5,7,9,其中以分類準確度和迭代次數(shù)作為算法的評價標準[12]。先預設三層卷積網(wǎng)絡的卷積核為都為3,并分別測試十次后取平均值。并將第一層卷積收集到的數(shù)據(jù)整理,如圖5所示。
圖5 第一層卷積核對比Fig.5 The First Layer of Convolution Kernel Comparison
經(jīng)過對比可知,隨著卷積核大小先減小而后增大。其中第一層卷積核為7時,準確率可在76 epoch時達到99%.所以取第一層卷積核大小為7。同上,將第二層卷積以及第三層卷積收集到的數(shù)據(jù),如圖6、圖7所示。
圖6 第二層卷積核對比Fig.6 The Second Layer of Convolution Kernel Comparison
圖7 第三層卷積核對比Fig.7 Comparison of the Third Layer Convolution Kernel
經(jīng)過對比可知,隨著卷積核大小先減小而后增大。其中第二層卷積核為5時,準確率可在38epoch時達到99%.所以取第一層卷積核大小為5。訓練樣本數(shù)據(jù)的分類準確率均可達到99%以上,說明分類器的診斷能力很強,能夠?qū)X輪的不同故障模式及程度做出區(qū)分,如圖7所示。通過對實驗結果的分析,為了達到更好的分類效果和更少的訓練時間,將三層卷積核按照順序分別設為7、5、3。
最終模型診斷結果,如圖8所示。
圖8 診斷準確率和差異損失Fig.8 Diagnostic Accuracy and Loss of Variance
由圖8可知,相對于單個分類器F1和F2的收斂速度以及診斷的穩(wěn)定性較差,相對于總的分類準確率來說,由基于集成學習的一維卷積神經(jīng)網(wǎng)絡診斷的速度更快,且更加穩(wěn)定,具有更好的診斷能力。
為了比較本研究算法與一維卷積分類算法的診斷效果,通過實驗數(shù)據(jù)對比本研究方法與一維卷積分類算法的識別性能,如圖9所示。
圖9 算法診斷正確率及損失對比Fig.9 Algorithmic Diagnosis Accuracy and Loss Comparison
對比算法同所提模型同樣將原始振動信號作為一維卷積神經(jīng)網(wǎng)絡的輸入特征,通過對比兩種算法在相同振動數(shù)據(jù)集下的診斷情況,分別進行10次實驗,并將故障診斷率和較穩(wěn)定的診斷時epoch的數(shù)值的均值作為評價標準,得到的對比結果。
由圖9可知,本研究算法故障識別率高達98%,優(yōu)于對比算法。對比算法診斷性能表現(xiàn)一般,在收斂速度和正確率方面識別效果與所提算法有一定差距。這說明本研究算法比對比算法更穩(wěn)定。考慮到本研究算法的故障診斷率波動較小,進一步驗證了本研究算法應用于齒輪故障診斷的優(yōu)越性。
針對行星齒輪箱診斷中,所存在的采集的數(shù)據(jù)需要預處理,準確率低、耗費時間過長的問題,給出了一種基于集成學習一維卷積神經(jīng)網(wǎng)絡的故障診斷方法。
通過分析卷積核大小、學習率對集成卷積神經(jīng)網(wǎng)絡準確度的影響,得出最終模型。實驗結果表明一維卷積集成學習神經(jīng)網(wǎng)絡模型能夠較好地應用于原始振動數(shù)據(jù)故障診斷領域,故障診斷的平均準確率達98%,顯著提高了齒輪箱原始振動數(shù)據(jù)集的故障診斷的準確率和可操作性。
這里所設計的卷積神經(jīng)網(wǎng)絡模型具有以下優(yōu)點:(1)去除了原始信號處理的步驟,直接對原始振動信號行處理,避免了信號預處理的復雜過程;(2)進行算法優(yōu)化后的模型有了較好的收斂能力,能夠較好地完成特征提取及智能故障診斷,實用性強。