龐新宇,仝鈺,魏子涵
(1. 太原理工大學 機械與運載工程學院,山西,太原 030024;2. 煤礦綜采裝備山西省重點實驗室,山西,太原 030024)
由于行星齒輪箱同步齒輪數(shù)量多,傳動結構復雜,傳統(tǒng)的診斷技術往往面臨魯棒性差的缺陷,因此行星齒輪箱中齒輪的故障診斷一直是故障診斷領域中一個特有的難題. 行星齒輪箱的故障診斷大多采用振動分析的方法,觀察狀態(tài)監(jiān)測指標的變化和趨勢[1],或利用經(jīng)驗模態(tài)分解[2]、小波分析等信號分解技術[3],對缺陷頻率進行檢測,以揭示頻率特征. 近年來,各種智能診斷方法逐漸被用于機械設備的故障診斷,其中卷積神經(jīng)網(wǎng)絡(CNN)在語音以及圖像分類任務中已得到成功應用[4],與深度信念網(wǎng)絡(DBN)[5]、深度自編碼(DAE)[6]和限制玻爾茲曼機(RBM)[7]等深度學習方法相比,由于CNN采用權值共享、接受域和子采樣策略,使得待優(yōu)化參數(shù)的數(shù)量顯著減少,在故障診斷領域的應用也日益增加.
一維數(shù)據(jù)和二維圖像均可作為數(shù)據(jù)集輸入至CNN執(zhí)行分類任務. Wu等[8]比較了卷積神經(jīng)網(wǎng)絡中1D輸入和2D輸入的分類性能在ECG數(shù)據(jù)集上的表現(xiàn). 在1D-CNN中,Swish激活較其他激活函數(shù)具有更高的準確性和魯棒性,可用于ECG的分類. 在相似的2D-CNN模型中,使用在ImageNet上預先訓練的權值來初始化模型,有效地緩解了模型過擬合的問題. 與1D-CNN中的信號輸入法相比,2D-CNN可以對大數(shù)據(jù)庫進行微調(diào),實現(xiàn)了更高的精度和魯棒性. 此外,大多數(shù)已知的CNN架構需要輸入2D圖像才能充分發(fā)揮該算法的性能,因此在使用該算法時,一個重要的問題是如何將原始的1D信號轉換為清晰且良好的2D圖像表示. Lü等[9]采用模糊函數(shù)將不同狀態(tài)下的齒輪振動信號表示為二維時頻圖像,之后通過改進的Hu不變矩對圖像特征進行提取完成故障診斷. Zheng等[10]將原始振動信號轉換為灰度圖像后,利用FAST-Uniented-SIFT直接提取特征,并根據(jù)提取的特征建立字袋模型,實現(xiàn)故障分類.
基于以上分析,本文采用一種新的2D圖像編碼手段,即格拉姆角場(GAF)時間序列編碼方式,并與CNN結合,構造GAF-CNN模型用于行星齒輪箱齒輪故障診斷,最終通過調(diào)整模型參數(shù)達到較高的識別精度.
(1)
(2)
通過上述變換可將原始時間序列轉換為沿對角線對稱的特征圖,由于特征圖像蘊含時間相關信息,因此也可利用特征圖對時間序列進行重構. GAF可以通過不同的方程生成兩幅圖像. 式(3)定義了格拉姆角和場(GASF),式(4)定義了格拉姆角差場(GADF),其區(qū)別在于三角函數(shù)的轉換,其中GASF基于余弦函數(shù),GADF基于正弦函數(shù).
(3)
(4)
為了進一步說明該方法的優(yōu)點,對采集到的振動信號進行GAF圖像編碼,如圖1所示.在時域波形中存在兩個較為明顯的波峰,在波形初始振幅較小,當出現(xiàn)第一個波峰時在GADF與GASF特征圖呈現(xiàn)出顏色較淺的交叉特征(見圖1中標注位置),而峰值較大的部分呈現(xiàn)的特征更為明顯. 此外,時域波形中的振蕩部分均在編碼后的特征圖中進行了完整的表示. 在波形圖結尾部分同時出現(xiàn)兩組連續(xù)振幅值較大的信號特征,而在特征圖中也可獲得準確表示. 因此,在二維圖像中,可以通過GADF與GASF中相應位置的顏色、點、線等不同特征對振動信號進行完整映射.
卷積神經(jīng)網(wǎng)絡(CNN)是一種分層神經(jīng)網(wǎng)絡,將輸入與其內(nèi)核按照指定步長進行滑動卷積,提取輸入局部區(qū)域的特征. 然后對卷積后的特征圖進行池化,以減少網(wǎng)絡參數(shù),通過構建若干“卷積池化”層完成對目標的特征提取.
卷積層利用不同大小的卷積核將輸入圖像進行卷積. 加入偏置后,通過激活函數(shù)提取輸入圖像的抽象紋理特征,實現(xiàn)特征增強. 卷積運算可以表示為
(5)
池化層又稱子采樣層,通常位于卷積層之后,利用子采樣功能可以減少冗余特征,進一步避免過擬合,降低網(wǎng)絡參數(shù). 數(shù)學模型可以描述為
(6)
式中down(.)表示子采樣函數(shù). 通常,此函數(shù)對輸入圖像中每個不同的n×n塊求和,這樣輸出圖像在兩個空間維度上都要小n倍. 每個輸出映射都有自己的乘法偏置β和加法偏置b. 文中選用的子采樣函數(shù)為最大采樣,其主要原理是將輸入圖像分割成一組不重疊的矩形,對于每個這樣的子區(qū)域輸出最大值.
全局均值池化[12]的思想是在執(zhí)行分類任務時,在最后一個卷積層執(zhí)行結束后,為每個對應類別生成一個特征圖. 不同于全連接層添加在特征層頂部,全局均值池化是取每個特征圖的平均值,然后將所得的向量直接輸入Softmax層.
使用ADADELTA優(yōu)化算法[13]訓練CNN. 該方法只使用一階信息,隨時間動態(tài)調(diào)整,計算量小,僅次于隨機梯度下降法. 該方法不需要手動調(diào)整學習速率,并且對噪聲梯度信息、不同的模型架構選擇、不同的數(shù)據(jù)模式和超參數(shù)的選擇具有很強的魯棒性. 本文所采用的網(wǎng)絡結構如圖2所示.
GAF-CNN故障診斷方法為:①對所采集的振動信號進行分割,將每段信號按照GADF或GASF編碼方式轉換為2D圖像,并劃分訓練集與測試集;②將特征圖輸入構建好的CNN模型并進行參數(shù)調(diào)優(yōu),使其可以自適應提取圖片特征中的相關信息,獲取不同類型的齒輪故障信息;③通過Softmax分類器將其與相應故障類型建立映射關系,實現(xiàn)故障診斷.
采用DDS型動力傳動故障診斷綜合試驗臺進行試驗,如圖3所示. 試驗所用行星齒輪箱為單排行星齒輪機構,其中有4個行星輪,內(nèi)齒圈固定,太陽輪為輸入件,行星架為輸出件,整個行星輪系的減速比為4.571. 表1為行星齒輪箱及平行軸齒輪箱的相關參數(shù),其中Zs,Zp,Zr,Z1,Z2,Z3和Z4分別表示太陽輪、行星輪、齒圈以及平行軸齒輪箱中二級減速器相關齒輪的齒數(shù). 采用行星輪預設5種不同的齒輪狀態(tài)(正常、齒根裂紋、磨損、斷齒、缺齒)進行試驗. 利用振動加速度傳感器采集齒輪箱振動信號,采樣頻率10 kHz,設置2種扭矩(0,40 N·m)、2種轉速(1 800,2 400 r·min-1)組成4種運行工況進行試驗.
表1 行星齒輪箱及平行軸齒輪箱相關參數(shù)
將振動信號順序等分截取為不同的小段,每個片段的長度確定為500個樣本. 每類信號特征構造1 200個樣本,之后采用One-hot編碼方式分別為5種不同行星齒輪工作狀態(tài)進行標簽,設置隨機種子數(shù)為20 000,并按照7∶3的比例劃分為訓練集與測試集.
傳統(tǒng)的時域分析難以準確識別行星齒輪的損傷程度和故障類型的特征,因此,利用GAF編碼方式在時間序列上映射的唯一性,對原始振動信號進行編碼,產(chǎn)生特征明顯的故障圖,如圖4所示.之后再結合CNN對5種故障特征圖進行分類.
在進行GADF-CNN與GASF-CNN對比試驗前,首先分析GADF與GASF在行星齒輪數(shù)據(jù)集上的表現(xiàn). 采用“卷積-池化-卷積-池化-卷積-池化-全局均值池化-Softmax分類器”結構的模型,其中卷積核的數(shù)量分別為8,16,32,大小為3;每個卷積層后統(tǒng)一連接最大池化層,其大小為2,步長為2. 在CNN迭代了100輪后獲得準確率曲線如圖5所示.
分析圖5數(shù)據(jù)可知,GADF-CNN在訓練集上準確率達到了0.991,測試集也達到0.985,而GASF-CNN雖然在訓練集上數(shù)據(jù)表現(xiàn)為0.997,但其在測試集的表現(xiàn)較差,在迭代100輪后達到0.931. 觀察損失值曲線可知,GASF-CNN在迭代10輪后,測試損失值曲線不再收斂,由0.2增加至0.4,導致GASF-CNN模型產(chǎn)生過擬合現(xiàn)象. 鑒于GADF-CNN模型在對行星齒輪數(shù)據(jù)分析時所取得的效果明顯優(yōu)于GASF-CNN模型,因此在后續(xù)試驗中,主要針對GADF-CNN模型進行分析.
為探究網(wǎng)絡參數(shù)、不同網(wǎng)絡層以及不同診斷方法對故障診斷模型的影響,設置一系列不同的參數(shù)值研究模型的最優(yōu)組合. 模型運行的軟件環(huán)境均為PyCharm,硬件環(huán)境為Intel Core i5-8300H處理器和GTX 1050Ti顯卡,準確率為5次結果的平均值.
3.3.1網(wǎng)絡參數(shù)對模型效果的影響
針對影響模型診斷準確率的三個核心參數(shù)進行對比分析,探究該模型的最優(yōu)超參數(shù). 對5種行星齒輪狀態(tài)進行診斷,試驗整體識別率結果如表2所示.
表2 網(wǎng)絡參數(shù)對模型識別率的影響
不同參數(shù)對模型的運算效率、梯度下降方向以及權重更新次數(shù)均產(chǎn)生重要影響. 從表2看出,采用GADF作為輸入樣本并結合CNN網(wǎng)絡所達到的診斷效果良好,準確率均保持在97%以上. 當Batch Size=6,Epoch=110以及Kernel Size=6時模型效果最好,當前的CNN網(wǎng)絡以Kernel Size=3為主,多數(shù)開發(fā)框架均對卷積核大小為3時進行主要優(yōu)化,因而忽略了偶數(shù)型內(nèi)核對網(wǎng)絡效果的發(fā)展,根據(jù)文獻[14]建議,設置一系列不同的卷積核值,并采用對稱填充的方式對卷積后的特征圖進行增補,當卷積核參數(shù)為6時所達到的準確率最高(98.82%),模型在此時具有較為滿意的診斷效果與泛化能力.
3.3.2不同網(wǎng)絡層對模型效果的影響
根據(jù)上述試驗獲得的最優(yōu)網(wǎng)絡參數(shù),為了探究將全連接層分別替代為全局均值池化層和全局最大池化后GADF-CNN模型的效果,本節(jié)將主要從計算效率(采用單步計算時長確定)、網(wǎng)絡參數(shù)、準確率以及是否發(fā)生過擬合等方面進行分析,具體結果如表3所示.
表3 全連接層替換結果
分析表3數(shù)據(jù),將全連接層替換為全局均值池化層后計算效率更高,網(wǎng)絡參數(shù)大幅減少,準確率相比前者提高約1%,且無過擬合情況發(fā)生,表明將全連接層替換后模型泛化性能進一步提高. 究其原因,全局均值池化是將每個特征圖取平均值,得到的向量直接輸入Softmax層. 與全連接層相比,全局均值池化層不僅可通過加強特征映射和類別之間的對應以更適合于卷積結構,而且沒有需要優(yōu)化的參數(shù),有效避免了模型過擬合. 而將全連接層替換為全局最大池化層后,雖然網(wǎng)絡參數(shù)較少,但其準確率低,且存在過擬合現(xiàn)象,并不適用于該模型.
3.4.1與其他圖像編碼方式對比
為了表明該編碼方法的先進性,基于傳統(tǒng)圖像編碼方式[15]將1D信號轉化為灰度特征圖,并利用CNN進行特征提取與故障分類. 與本文方法相比,該方法將振動信號中每個樣本的振幅歸一化為0~1,并將振動信號第i個樣本轉化為像素點(j,k),其中j=i/M,k=i/N,M為M×N數(shù)據(jù)的列數(shù),N為M×N數(shù)據(jù)的行數(shù),每個樣本的歸一化振幅為對應像素的強度. 根據(jù)該方法將長度為484的數(shù)據(jù)轉化為22×22的灰度圖(見圖6),每類行星齒輪故障生成1 200張?zhí)卣鲌D,訓練集與測試集仍按7∶3比例進行分割. 將灰度特征圖輸入同等規(guī)模的CNN進行分析后發(fā)現(xiàn)其準確率為97%,明顯低于GADF圖像編碼方式的識別精度.
3.4.2不同診斷方法對模型效果的影響
為驗證所提出算法的有效性,本節(jié)將采用不同診斷方法進行對比試驗. 試驗數(shù)據(jù)依然采用編碼后的GADF特征圖作為輸入,增加BP網(wǎng)絡、堆棧自動編碼器(SAE)以及支持向量機(SVM)算法進行測試,同樣把訓練集與測試集按7∶3的比例進行分割,識別率如圖7所示.
分析圖7可知GADF編碼方式在與CNN相結合時達到最高的識別率為98.8%,而SAE作為一種優(yōu)秀的深度學習算法,雖然也能自適應地提取出故障特征進行分類,但針對該特定分類任務所取得的識別率略低于CNN. 而BP網(wǎng)絡與SVM所取得的分類精度不足90%,且在算法運行時收斂速度慢,易于陷入局部最優(yōu)解,因而不適于行星齒輪箱的故障診斷問題.
文中提出了一種GAF-CNN模型,并將其應用于行星齒輪箱故障診斷. 該模型在對行星齒輪信號編碼時考慮了不同時間間隔相關性的綜合集成,因此在利用CNN自適應地提取信號特征與故障分類時可以更加全面地進行分析,克服了淺層特征對故障信號表征能力不足的問題.
進一步研究發(fā)現(xiàn)GADF對原信號特征的表達能力優(yōu)于GASF與灰度編碼方式. 在對CNN模型進行優(yōu)化時,將CNN中的全連接層替換為全局均值池化層使得參數(shù)量大幅降低,計算效率顯著提高,有效減少了過擬合狀況,通過參數(shù)調(diào)優(yōu),模型最終達到較高的診斷準確率. 對比分析結果表明GADF與CNN結合的故障診斷模型在行星齒輪故障分類中具有良好的可行性與可靠性.