王長華,蔣云剛,李保,吳珂,朱凱
(1. 浙江省機電設計研究院有限公司,浙江 杭州 310051; 2. 浙江大學 平衡建筑研究中心,浙江 杭州 310007; 3. 杭州運河集團建設管理有限公司,浙江 杭州 310000; 4. 中國計量大學 質量與安全工程學院,浙江 杭州 310018)
隨著自動控制的快速發(fā)展,工業(yè)物聯網也獲得了廣泛應用,可以高效收集大量的牽引設備運行故障,但無法繼續(xù)通過傳統故障分析方法來及時處理這種大數據故障信息[1-4]。采用深度學習方法因具備數據自我迭代處理及對多種復雜數據都能夠達到快速準確提取的效果,這使其成為大數據處理領域的一項重要應用技術,已被用于語音信號處理、圖像分析等方面[5-8]。石鑫等[9]選擇深度自編碼網絡診斷電力變壓器的運行故障;王惠中等[10]則根據LTSM方法在時間序列提取的獨特優(yōu)勢,綜合運用LTSM與Softmax分類器方法對各類故障信號進行診斷分析。
國內學者胡蔦慶等[11]也開展了智能診斷方面的研究工作,利用經驗模態(tài)分解方法度數據進行處理,再通過深度卷積神經網達到診斷的要求。步驟是先對信號實施EMD處理完成分解過程,將其轉換成多個 IMF分量后計算每個分量的峭度,再以DCNN對其中峭度較大的6個分量進行特征融合,接著繼續(xù)測定行星齒輪泵齒的振動信號并驗證了該方法實際診斷效果。WU C Z等[12]則利用一維卷積神經網絡來判斷齒輪箱形成的振動信號,結果發(fā)現該診斷方法能夠達到高精度的判斷要求。本文測試在行星齒輪泵故障診斷前進行,采用經驗模態(tài)分解(ensemble empirical mode decomposition, EEMD)和雙向記憶網絡(bi-directionallong short-time memory, BLSTM)相結合的模式,對本實驗中4種不同的齒輪泵進行故障測試。采用EEMD方法實施信號分解生成相應的IMF分量,將上述參數輸入模型內進行訓練得到準確的分類結果。
循環(huán)神經網絡(recurrent neural network, RNN)屬于一類遞歸神經網絡,時間序列輸出取決于前一時刻與當前輸入的共同影響。
t時刻的RNN網絡輸出為:
st=f(uxt+wst-1)
(1)
yt=g(vst)
(2)
式中:t-1是上個時刻;t是現有時刻;w為之前隱藏層相對目前隱藏層所占的權重;x為RNN網絡輸入;u表示輸入層至隱藏層權重;y為RNN網絡預測結果;s為隱藏層狀態(tài)輸出。
以E表示網絡在t時的總損失,如式(13)所示。
(3)
對網絡進行訓練時通過參數優(yōu)化算法來完成u、w、v參數的更新。式(4)給出了參數w在t時梯度誤差計算式。
(4)
在處理深層次網絡的時候,當選擇參數優(yōu)化模式實施更新時,將會出現局部梯度彌散的結果,嚴重時還會引起梯度爆炸,從而導致產生差異很大的網絡權重,表現為網絡狀態(tài)的大幅波動。
為得到更加準確的信息,構建得到雙向長短時記憶網絡,圖1顯示了BLSTM通過時間展開計算的結果。
圖1 BLSTM網絡結構
顯然,當前輸出受到前向層和反向層輸出綜合作用,式(5)-式(7)給出了網絡在t時的輸出ot。
(5)
(6)
(7)
式中:w為權重;ht為正向隱藏層輸出;→為網絡正向輸入;←為網絡反向輸入。
齒輪泵測試平臺如圖2所示。分別對齒輪泵處于不同的運行狀態(tài)下形成的信號數據進行采集分析,采集的齒輪泵4種故障數據集描述如表1所示,齒輪泵故障時域圖如圖3所示。本實驗將采樣頻率設定在10kHz,電機轉速2500r/min,依次對各齒輪狀態(tài)采集得到300組振動加速度信號,每組中存在900點數據。
圖2 現場測試圖片
表1 齒輪泵4種故障數據集描述
圖3 齒輪泵故障時域圖
對本實驗采集得到的初始數據進行EEMD分解獲得IMF分量,再以頻率由高往低的順序排序后,將高斯白噪聲加入,其標準偏差為0.2,迭代次數上限為25,后續(xù)分量信息造成的影響可以忽略。本次共確定6個IMF分量,對齒輪不同運行狀態(tài)下的信號實施分解,結果見圖4。
圖4 不同故障的EEMD分解
利用BLSTM網絡對初始6個模態(tài)分量識別,進行模型訓練時,由于分量包含了太長的數據,需要花費更長時間才能完成訓練。為提升訓練效率并改善精度,選擇15個時域和16個頻域特征進行分析,再將模型輸入維度由1000降低至30,進一步優(yōu)化了故障特征。
本研究構建的雙向長短時記憶模型包含了1個Softmax層、1個全連接層、1個分類輸出層、1個BLSTM層。為全連接層設置了Dropout隨機失活層,避免模型發(fā)生過擬合的問題,控制失活值保持在恒定的0.65,并設置更多ReLU激活層來達到加快網絡訓練的效果。本次模型運行環(huán)境為Matlab2019a,具體參數見表2。
表2 BLSTM網絡
測試時設定批量為100,學習率0.01,選擇Adam算法完成尋優(yōu)計算。通過控制梯度閾值=1以防止梯度爆炸的情況;以輪數代表訓練次數,共訓練50次,每個周期結束后再對網絡開展1次迭代計算。表3為本實驗的網絡超參數。
表3 BLSTM網絡超參數設置
以上述實驗實測獲得信號處理后數據為研究對象,隨機選擇比例為80%的數據實施訓練,再測試剩余30%比例的數據。圖5給出了模型訓練與驗證過程,可以看到在不同迭代次數下驗證誤差變化情況。通過測試發(fā)現該模型精度達到95.3%,進行迭代計算時形成了波動變化的訓練曲線,可以推斷該模型并沒有達到穩(wěn)定預測的效果。以圖6的混淆矩陣模型準確識別齒面形成的磨損缺陷和缺齒情況,斷齒識別率94.1%,最低的是齒根裂紋故障識別率,只達到86.5%。同時發(fā)現齒根裂紋只達到了一個較低的識別率,這是由于齒根裂紋會被誤判為斷齒而引起結果偏差。
圖5 BLSTM網絡訓練損失隨迭代次數的變化
圖6 BLSTM網絡驗證數據混淆矩陣
圖7顯示了未進行EEMD處理和經過EEMD處理的兩種不同模型對應的迭代精度??梢钥吹?,未經EEMD處理的模型表現出了不穩(wěn)定的測試結果,實際精度只有70%,EEMD處理后模型精度與穩(wěn)定性都發(fā)生了大幅上升。因此,BLSTM模型在時序信號處理方面具有明顯優(yōu)勢,本次測試的初始信號呈現相對紊亂的時序特性,不能達到準確識別的效果。先對信號EEMD分解后,可以促進所有分量都獲得更優(yōu)的時序性,促使模型診斷精度得到顯著提升。
圖7 EEMD處理前后網絡精度隨迭代次數的變化
1)本網絡損失<1%,可以推斷該網絡滿足良好穩(wěn)定性的條件,可以實現精確識別齒面磨損和缺齒的問題,斷齒、正常齒的輪識別率都達到了93%以上,齒根裂紋故障識別率達到了87.2%。
2)經過EEMD處理的網絡穩(wěn)定性與精度顯著提升。到達后期迭代階段時,BLSTM網絡擬合速度開始變快,精度也獲得提升。