梁敏健, 彭曉軍, 劉德陽
(廣東省特種設(shè)備檢測研究院珠海檢測院,廣東 珠海 519002)
近年來,自動扶梯數(shù)量逐年攀升,老舊扶梯的安全形勢嚴峻,定期檢驗和監(jiān)督檢驗往往不容易發(fā)現(xiàn)扶梯內(nèi)部的潛在風險和故障,如梯級滾輪磨損、曳引鏈磨損、減速箱齒輪箱磨損、驅(qū)動鏈條過松、減速箱油量不足等。這些故障勢必會影響扶梯乘坐人員的安全,提高扶梯的維護成本,降低扶梯的使用年限。目前上述故障往往借助定期檢驗和維護保養(yǎng)階段扶梯的拆解才得以被發(fā)現(xiàn),且目的性差、效率低下、成本高昂、自動化程度低。
電梯含有大量的振動信號,目前常常采用振動加速度傳感器來監(jiān)測扶梯部件以反映其運行狀態(tài),進而人工提取故障特征,用于安全隱患的識別。例如,徐金海等[1]利用小波包和經(jīng)驗?zāi)B(tài)分解的方法提取故障特征,實現(xiàn)了對扶梯機械部件在不拆機條件下的狀態(tài)監(jiān)測和潛在故障源識別。簡龍藝[2]利用時頻域分析法提取振動信號的頻譜圖,找到電梯異常振動的根本原因。
隨著機器學習算法的發(fā)展,研究人員開始應(yīng)用機器學習的方法進行電梯的故障診斷研究。例如,孟慶宇[3]利用集合經(jīng)驗?zāi)B(tài)分解提取自動扶梯主驅(qū)動軸軸承的振動信號,并構(gòu)建支持向量機模型對故障信號進行診斷。易士琳[4]利用時頻域分析法提取反映電梯故障的特征向量,并利用PSO-LSSVM識別故障類型??梢姶蠖鄶?shù)傳統(tǒng)的智能診斷是采用“信號處理的特征提取+機器學習”的方法。雖然識別率有一定的提高,本質(zhì)上仍然依賴人工設(shè)計與選擇特征,難以獲得最接近故障屬性特征的自然表達,導致訓練時間長且誤差率較高,沒有實現(xiàn)真正意義上的智能診斷。
隨著Hilton提出深度學習理論,人工智能技術(shù)得到了進一步地發(fā)展,最著名的就是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN),它通過引入局部連接、權(quán)值共享、最大池化、非線性激活等方法,允許神經(jīng)網(wǎng)絡(luò)從圖像中自動學習特征,避免對圖像進行復(fù)雜的邊緣檢測、閾值分割等前期預(yù)處理,比傳統(tǒng)機器學習方法具有更強大的特征學習和表達能力,因而在圖像分類、目標檢測等方面得到了越來越廣泛的應(yīng)用。近年來,越來越多的學者將該種深度學習方法引入到故障診斷領(lǐng)域[5-6],例如,羅鵬等[7]利用AFDCNN算法,無需提取時頻域特征即可實現(xiàn)對齒輪故障的診斷。胡蔦慶等[8]采用經(jīng)驗?zāi)B(tài)分解和深度CNN實現(xiàn)了對行星齒輪故障的診斷。邵思羽[9]利深度學習理論同樣實現(xiàn)了對旋轉(zhuǎn)機械的故障診斷的識別。這類方法在旋轉(zhuǎn)機械中獲得了較好的效果,但是CNN的提出主要針對的是二維圖像數(shù)據(jù),而旋轉(zhuǎn)機械的故障數(shù)據(jù)多是一維時域信號,并不能完全應(yīng)用于深度CNN。因此,本研究擬基于一維深度卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)的自動扶梯機械故障分類模型,以期實現(xiàn)通過直接輸入原始振動信號,便能快速獲得自動扶梯機械故障的分類結(jié)果。
由于平時收集故障扶梯的數(shù)據(jù)比較困難,采用公開的故障數(shù)據(jù)集和現(xiàn)場收集的數(shù)據(jù)相融合的方式進行故障數(shù)據(jù)集的準備。公開的數(shù)據(jù)集采用凱斯西儲大學軸承數(shù)據(jù)集和東南大學嚴如強團隊整理的齒輪故障數(shù)據(jù)集,之所以融合3種故障診斷的數(shù)據(jù)集是因為,凱斯西儲大學軸承數(shù)據(jù)集所使用的軸承故障相對損傷比較大,故障特征比較顯著,容易實現(xiàn)診斷,而且其只包含軸承故障,不含齒輪故障,故而為了增加對扶梯齒輪和扶梯梯級滾輪的診斷能力,進一步提高所提出模型的泛化能力,融合了包含軸承、齒輪和扶梯滾輪3種類型的數(shù)據(jù)。上述數(shù)據(jù)集提供了豐富的故障類型,涉及齒輪、軸承兩種元件的故障,總共包含齒輪的磨損、斷齒、裂紋故障,軸承的內(nèi)圈、外圈、滾動體等類型的故障。凱斯西儲大學軸承故障數(shù)據(jù)集平臺如圖1所示[9],故障數(shù)據(jù)取自軸承內(nèi)圈、外圈、滾動體3個位置。每類故障在1730 r/min、1750 r/min、1772 r/min、1797 r/min 4種負載工況下進行數(shù)據(jù)采集。東南大學齒輪故障數(shù)據(jù)集的實驗平臺包括齒輪箱、驅(qū)動電機、電機控制器和制動器控制器,如圖2所示[10]。實驗設(shè)置有五類齒輪故障,每類故障在轉(zhuǎn)速1200 r/min且空載、1800 r/min低載兩種工況下進行振動信號的采集。仿照該試驗數(shù)據(jù)的采集方式利用開發(fā)出的基于LabVIEW的自動扶梯機械振動數(shù)據(jù)采集系統(tǒng)采集某市區(qū)大型商場的自動扶梯的故障信號,采集現(xiàn)場如圖3所示[11]。
圖1 CWRU滾動軸承數(shù)據(jù)采集系統(tǒng)
圖2 東南大學齒輪箱數(shù)據(jù)采集系統(tǒng)
圖3 labVIEW自動扶梯機械振動數(shù)據(jù)采集系統(tǒng)
選取凱斯西儲大學的正常信號、軸承滾子故障、軸承內(nèi)圈故障、軸承外圈故障和東南大學齒輪裂紋故障以及采集的某自動扶梯滾輪磨損故障,各類型的振動信號如圖4所示。
樣本的數(shù)量和質(zhì)量直接影響深度神經(jīng)網(wǎng)絡(luò)的檢測精度,為獲得具有更好泛化能力的模型,提高分類的準確率,CNN需要大量的訓練樣本,而目前扶梯故障并沒有諸如ImageNet等龐大的公共圖像數(shù)據(jù)庫,僅有一些著名的公開旋轉(zhuǎn)機械數(shù)據(jù)集,而且未包含扶梯一些特有的故障:如梯級滾輪的磨損、梯級鏈輪的松動。因此為提高模型的泛化能力對試驗數(shù)據(jù)集進行數(shù)據(jù)集增強,以擴充數(shù)據(jù)樣本。
本研究采用現(xiàn)場試驗所收集與東南大學和凱斯西儲大學的機械故障數(shù)據(jù)集的振動數(shù)據(jù)作為用于模型訓練和測試的原始數(shù)據(jù)集,包括正常與齒輪故障、軸承內(nèi)/外圈/滾動體故障、梯級滾輪磨損故障。圖像增強的方法為幾何變換(包括旋轉(zhuǎn)、翻轉(zhuǎn)和平移等)、像素調(diào)整(亮度調(diào)節(jié)、對比度調(diào)節(jié)和添加噪聲等),通過增加數(shù)據(jù)樣本來提高模型的魯棒性與泛化能力,仿照圖像增強的方式采取重疊采樣的方法對扶梯振動信號進行如圖5所示的數(shù)據(jù)增強[12],即用相等長度的窗口對振動信號劃分,得到樣本信號,當窗口移動步長小于單個樣本的信號長度時,樣本之間就會有重疊,長度為Lsignal的振動信號被劃分為Nsample=(Lsignal-Nin)/s個樣本,樣本長度為Nin,切片窗口的移動距離為s。最后按照通用數(shù)據(jù)集劃分策略,將數(shù)據(jù)集隨機分配成訓練集(70%)、測試集(10%)和驗證集(20%)。
圖4 各故障類型的振動信號
圖5 數(shù)據(jù)增強方式示意圖
最終融合每類數(shù)據(jù)8000個共48000個數(shù)據(jù)樣本,其中訓練樣本個數(shù)為每類5600個共33600個樣本,驗證樣本為每類1600個共9600個樣本,測試樣本為每類800個共4800個樣本。 各類樣本個數(shù)和標簽如表1所示。
表1 6種不同故障的樣本個數(shù)組成
根據(jù)自動扶梯振動信號的特點以及現(xiàn)場檢驗所需的快速高精度要求,本研究采用1DCNN的網(wǎng)絡(luò)用于特征提取,構(gòu)建自動扶梯機械故障診斷系統(tǒng)。該網(wǎng)絡(luò)在東南大學和凱斯西儲大學數(shù)據(jù)集和現(xiàn)場采集的扶梯振動信號融合的數(shù)據(jù)集上獲得了95%的精度。
CNN是深度學習領(lǐng)域應(yīng)用最多的網(wǎng)絡(luò)類型,其典型的結(jié)構(gòu)如圖6所示。
圖6 典型CNN的結(jié)構(gòu)圖
典型的CNN模型包括:輸入層、卷積和池化層、全連接層和輸出層等。輸入層一般是某一尺寸的二維數(shù)據(jù),通常是三通道的彩色圖像或單通道的灰度圖像;卷積層和池化層是CNN的核心層,卷積層通過一系列的卷積核對輸入層的圖像進行卷積從而獲得相應(yīng)數(shù)量的特征圖,即特征提取。池化層對卷積層得到的特征圖進行最大值池化或平均值池化等操作,從而大幅減少卷積層的空間維度,降低計算成本,控制過擬合;經(jīng)過若干次的卷積和池化層,緊接著將池化操作后的數(shù)據(jù)展開并輸入到全連接層,全連接層連接一個隱藏層,最后由softmax函數(shù)將數(shù)據(jù)映射到輸出層。
softmax函數(shù)的定義如下。
softmax(zi)=yi
(1)
因為振動信號是一維數(shù)據(jù),圖像數(shù)據(jù)是二維數(shù)據(jù),常見的二維卷積如圖7所示。常用的VGGNET、ResNet和谷歌的Inception,都是3×3或5×5的較小的卷積核。
圖7 二維卷積示意圖
而CNN是針對二維圖像數(shù)據(jù)提出來的,所以要將CNN的模型適當改造為一維CNN。如圖8所示將二維卷積核改為一維[13],即卷積核的行數(shù)和信號的行數(shù)要保持一致,均為一維,且卷積核的移動方向只沿著序列前進的方向。具體卷積層的運算方式如式(2)所示。
(2)
圖8 一維卷積示例圖
另外改進了卷積核的寬度,常規(guī)二維卷積核一般均為3×3或5×5的小卷積核,卷積核寬度為20,以獲取較大的感受野,達到提取短時特征的效果,其目的和STFT(短時傅里葉變換)相似。區(qū)別在于,STFT的窗函數(shù)是sin函數(shù),設(shè)計的寬卷積核是通過優(yōu)化算法獲取的,能自適應(yīng)學習故障信號的特征。
改造后的1DCNN的結(jié)構(gòu)如圖9所示。
圖9 改造后的1DCNN模型結(jié)構(gòu)
該網(wǎng)絡(luò)包括輸入層、特征提取層(卷積和池化)、全連接層、輸出層等部分,輸入層是經(jīng)過重疊采樣增強處理過的振動信號,每個樣本1024個點,重疊滑移步長設(shè)為14。特征提取單元中的卷積層的卷積核的大小為20×1,增大了模型輸入的感受野,增大了輸入的信息量。卷積后進行批歸一化處理,具體參數(shù)如表2所示。
表2 1DCNN的網(wǎng)絡(luò)參數(shù)
1DCNN扶梯機械故障診斷模型使用Python編程語言及Keras深度學習框架實現(xiàn),模型訓練的硬件環(huán)境為Intel i5 CPU,16GB RAM,NVIDIA GTX1050 GPU。
設(shè)置模型訓練的超參數(shù)學習率為0.0001,批尺寸為128,最大迭代數(shù)為40。訓練的損失值及準確率曲線如圖10、圖11所示。
圖10 訓練損失值曲線
圖11 驗證集準確率曲線
從圖10、圖11中可以看出,訓練的損失值在迭代10次之后就已收斂并且毛刺波動較小,經(jīng)過5輪訓練后準確率也達到了95%,這也進一步證明了該模型能有效提高訓練效率。
為準確分析評級模型的性能,除使用準確率A(Accuracy)作為評價指標外,針對每一類采用精確率P(Precision)、召回率R(Recall)以及F1值對評價結(jié)果進行全面評估,具體計算標準如式(3)~式(5)所示,其中F1值是精確率和召回率的調(diào)和均值。上述指標的取值范圍均在0%~100%之間,并且越大越好。
(3)
(4)
(5)
式中:TPi為樣本實際屬于第i類且模型將其分到第i類;FPi為樣本實際不屬于第i類但模型錯將其分到第i類;FNi為樣本實際屬于第i類但模型未正確將其分到第i類。
將測試集樣本輸入分類模型,根據(jù)分類結(jié)果得到混淆矩陣如圖12所示,進而計算出模型處理振動信號的性能指標如表3所示。
圖12 自動扶梯機械故障診斷分類結(jié)果的混淆矩陣
表3 自動扶梯機械故障診斷模型的精度性能指標
通過表3可以發(fā)現(xiàn),各類扶梯機械故障的預(yù)測精確率在85%以上,召回率在75%之上,整體準確率達到了95%,滿足扶梯故障診斷現(xiàn)場檢測的精度要求。
表4總結(jié)了基于相同數(shù)據(jù)集、本研究方案與傳統(tǒng)機器學習算法SVM、決策樹、K近鄰等算法的試驗對比結(jié)果。其中對于傳統(tǒng)機器學習算法,人工提取了平均值、均方根、峰值因子、脈沖因子、裕度因子、峭度因子、波形因子、偏度等14種時域波形特征。其中SVM使用了RBF作為核函數(shù),決策樹的最大深度為3,K近鄰的節(jié)點數(shù)為3。
表4 提出的方法與SVM/決策樹/K近鄰性能比較結(jié)果
可以看出,提出的基于1DCNN的診斷方法明顯優(yōu)于傳統(tǒng)的機器學習算法。
針對自動扶梯機械故障診斷問題,基于一維卷積卷積神經(jīng)網(wǎng)絡(luò)設(shè)計了應(yīng)用于扶梯振動信號的自動分類模型。借助凱斯西儲大學的軸承數(shù)據(jù)集和東南大學齒輪箱數(shù)據(jù)集以及現(xiàn)場采集的扶梯振動數(shù)據(jù),建立了自動扶梯機械故障數(shù)據(jù)集。通過數(shù)據(jù)增強的方法對數(shù)據(jù)集進行預(yù)處理。采用測試數(shù)據(jù)集對模型的精度與復(fù)雜度進行評價,實驗結(jié)果顯示,在僅需2.4 MB內(nèi)存的情況下,該模型能夠?qū)崿F(xiàn)自動扶梯機械故障分類的準確率達到95%以上,能夠準確對自動扶梯機械故障進行準確分類。設(shè)計的算法比人工提取特征+傳統(tǒng)機器學習方式有著更高的準確率,省去了人工提取特征的過程,降低了扶梯機械故障診斷的專業(yè)性,節(jié)約了時間和設(shè)計成本。在下一步的工作中,將繼續(xù)收集扶梯其他部位的故障數(shù)據(jù)集,提高模型識別準確率,同時將探究如何研制基于移動終端的扶梯機械故障智能診斷系統(tǒng),提升模型的實用價值。