劉云飛,張楷,菅紫倩,鄭慶,張越宏,袁昭成,焦子一,丁國富
(1.西南交通大學機械工程學院,四川成都 610031;2.西南交通大學唐山研究院,河北唐山 063003;3.西南交通大學軌道交通運維技術(shù)與裝備四川省重點實驗室,四川成都 610031;4.成都市特種設(shè)備檢驗檢測研究院,四川成都 610299)
滾動軸承是旋轉(zhuǎn)機械中最重要的部件之一[1-2],苛刻的工作環(huán)境易使它發(fā)生損壞,因此對軸承的狀態(tài)進行監(jiān)測,及時發(fā)現(xiàn)故障并發(fā)出警報,能有效避免裝備運行災(zāi)難性事故的發(fā)生,具有重要的研究和工程意義[3]。
近年來,數(shù)據(jù)驅(qū)動的軸承故障檢測方法由于無需構(gòu)建復雜的動力學模型和不依賴先驗經(jīng)驗而迅速發(fā)展[4]。在實際工程中,由于故障數(shù)據(jù)獲取困難而導致異常數(shù)據(jù)不足,僅采用正常數(shù)據(jù)進行訓練的數(shù)據(jù)重構(gòu)故障檢測法受到相關(guān)研究者的廣泛關(guān)注[5]。尤其是基于自編碼器(Autoencoder,AE)的無監(jiān)督軸承故障檢測方法,該類方法采用正常數(shù)據(jù)訓練自編碼器進行數(shù)據(jù)重構(gòu),以重構(gòu)誤差作為異常評分來設(shè)定閾值。其優(yōu)勢是僅依靠正常數(shù)據(jù)便能完成模型訓練并取得較高的檢測精度。例如,HUANG等[6]提出了記憶殘差回歸自編碼器模型(Memory Residual Regression Autoencoder,MRRAE),將記憶模塊和參數(shù)密度估計器集成在一起,利用模型的重構(gòu)誤差和意外值對軸承異常狀態(tài)進行檢測;張聰?shù)热薣7]構(gòu)建了復雜系統(tǒng)多變量耦合關(guān)系網(wǎng)絡(luò),并用無監(jiān)督學習的變分圖自編碼模型(Variational Graph Autoencoder,VGAE)提取其特征,以重構(gòu)概率作為評價指標進行故障檢測。
上述方法在僅有正常數(shù)據(jù)訓練的條件下,取得了一定的故障檢測效果。但除了模型特征提取和預(yù)測能力外,故障閾值的確定對此類方法的檢測精度也有著極大的影響。如何準確定義故障閾值在基于數(shù)據(jù)重構(gòu)誤差的故障檢測方法中至關(guān)重要。為此,一些學者基于自適應(yīng)閾值的軸承故障檢測方法進行了研究。王雷、孫習習[8]提出了基于時序分解和一維深度卷積自編碼網(wǎng)絡(luò)的無監(jiān)督軸承故障檢測方法,在實現(xiàn)充分提取軸承故障特征的同時自適應(yīng)地確定了樣本臨界閾值。但是在這些方法中模型的優(yōu)化與故障檢測器的設(shè)計是分離的,以致不能充分提高故障檢測準確率。
ZHOU等[9]提出集模型的優(yōu)化與故障檢測器一體設(shè)計的深度SVDD-VAE模型,并在手寫數(shù)字集中驗證了自適應(yīng)閾值的可行性。針對上述滾動軸承故障信號稀缺和故障閾值自適應(yīng)困難的問題,受ZHOU等[9]研究的啟發(fā),本文作者提出基于卷積長短期記憶網(wǎng)絡(luò)變分自編碼器的深度支持向量數(shù)據(jù)描述(ConvlstmVAE based Deep Suport Vector Data Descrition,SVDD-CVAE)的軸承自適應(yīng)閾值故障檢測方法。首先針對時序信號特征增強提取構(gòu)建以卷積長短期記憶網(wǎng)絡(luò)(Convolution Long Short Term Memory,ConvLSTM)為基礎(chǔ)單元的VAE特征壓縮提取框架,有效提取軸承故障微弱特征。然后,結(jié)合支持向量數(shù)據(jù)描述(SVDD)自適應(yīng)學習特征空間超球面,以實現(xiàn)故障檢測閾值的自適應(yīng)確定。最后通過全局誤差損失反向傳播對深度SVDD-CVAE框架進行迭代優(yōu)化。
變分自編碼器(Variational Autoencoder,VAE)是基于自編碼器演化而來的一種無監(jiān)督學習方法[10-11]。VAE通過對樣本分布的學習,可以實現(xiàn)估計分布近似逼近樣本真實分布,進而由估計分布生成原始樣本的重構(gòu)樣本。VAE的結(jié)構(gòu)如圖1所示。
圖1 VAE結(jié)構(gòu)
圖1中:z是潛在變量;μ和θ是通過編碼器(Encoder)計算得到的隱變量均值和標準差,它將z約束為一個根據(jù)標準正態(tài)分布pθ(z)的隨機變量。VAE的損失函數(shù)為
L(θ,φ;xi)=Eqφ(z|x)[logpθ(xi|z)]-
(1)
其中:qφ(z|xi)為近似后驗分布;pθ(xi|z)為解碼過程需要學習的條件分布;pθ(z)為先驗分布;DKL為KL散度。第一項根據(jù)實際需要可選擇二值交叉熵或者平方誤差,第二項KL散度為
(2)
VAE巧妙地利用變分推理和重參數(shù)化技巧實現(xiàn)了生成過程,既通過對隱藏變量的采樣保證其生成能力,又通過反向傳播提高生成質(zhì)量。
長短期記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),它由1個細胞單元與3個門控組成,分別是遺忘門、輸入門和輸出門。細胞單元是核心計算能力,可以記錄當前計算狀態(tài),而遺忘門、輸入門和輸出門調(diào)節(jié)進出存儲單元的信息流[12-14],其結(jié)構(gòu)如圖2所示。
圖2 LSTM結(jié)構(gòu)
LSTM的計算原理可以概括為:通過遺忘細胞狀態(tài)信息和記憶新的信息使得對后續(xù)計算有用的信息得以傳遞,而無用的信息被丟棄,其前向傳播可以表示為
ft=σ(Wf×[ht-1,xt]+bf)
(3)
it=σ(Wi×[ht-1,xt]+bi)
(4)
Ct=ft×Ct-1+it×tanh(WC×[ht-1,xt]+bC)
(5)
ot=σ(Wo×[ht-1,xt]+bo)
(6)
ht=ot×tanh(Ct)
(7)
式中:ft為遺忘門;it為輸入門:ot為輸出門;ht、ht-1為LSTM的輸出和上一個單元的輸出:xt為當前的輸入;σ為Sigmoid函數(shù);Wf、bf為遺忘門權(quán)重矩陣和偏置項;Wi、bi為輸入門的權(quán)重矩陣和偏置項;Wc、bc為狀態(tài)值計算的權(quán)重矩陣和偏置項;Wo、bo為輸出門的權(quán)重矩陣和偏置項。
ConvLSTM是LSTM的一種變體[15],它在原始LSTM每個單元的3個門之前添加一次卷積操作,使用卷積計算代替權(quán)值計算,提取多維數(shù)據(jù)中隱含的關(guān)聯(lián)信息,在多維數(shù)據(jù)中通過卷積提取特征,可以更適合空間序列,具體結(jié)如圖3所示。
圖3 ConvLSTM結(jié)構(gòu)
其前向傳播可以表示為
ft=σ(Wf?ht-1+Wf?xt+Wf⊙Ct-1+bf)
(8)
it=σ(Wi?ht-1+Wi?xt+Wi⊙ht-1+bi)
(9)
Ct=ft⊙Ct-1+it⊙tanh(WC?ht-1+WC?xt+bC)
(10)
ot=σ(Wo?ht-1+Wo?xt+Wo⊙Ct+bo)
(11)
ht=ot⊙tanh(Ct)
(12)
式中:?為卷積算子;⊙為哈達瑪積。
SVDD的基本思想是尋找一個球心為a、半徑為R且能夠包含全部或大部分目標樣本數(shù)據(jù)的最小超球體[16-17]。假設(shè)有一組正常訓練數(shù)據(jù)H∈Rn×d,其中n為樣本數(shù),d為變量數(shù),則SVDD原始優(yōu)化問題可表述為
(13)
ξi≥0,i=1,2,…,n
(14)
式中:ξi為松弛變量;C為懲罰因子??紤]到核函數(shù)對分類器的影響,選擇使用最為廣泛的高斯核函數(shù),即:
(15)
代替映射后的樣本間內(nèi)積運算為<Φ(hi),Φ(hj)>,引入拉格朗日乘數(shù)a=[α1,α2,…,αi]轉(zhuǎn)換為其對偶問題:
(16)
(17)
SVDD算法是經(jīng)典的單分類算法,訓練時只關(guān)注正常樣本,尤其適合在缺少異常樣本的情況下使用。
文中提出模型(如圖4所示)由TCVAE的數(shù)據(jù)重構(gòu)和作為故障檢測器的SVDD組成。TCVAE是針對時序信號特征增強提取構(gòu)建的以ConvLSTM為基礎(chǔ)單元的CVAE特征壓縮提取框架。深度SVDD-CVAE首先通過VAE編碼器中的ConvLSTM提取特征,提取的特征被轉(zhuǎn)移到后續(xù)的SVDD中學習超球面,最后VAE解碼器利用被約束后的特征重建輸入實例,深度SVDD-CVAE共同優(yōu)化這2個過程。在檢測階段,將脫離學習超球的實例視為異常。
圖4 基于深度SVDD-CVAE的軸承自適應(yīng)閾值故障檢測原理
在第1.3節(jié)中所介紹的SVDD旨在構(gòu)建一個分離正常實例和異常實例的超球。而訓練集中所有實例都是正常樣本的情況下,可以采用改進的SVDD構(gòu)建深度SVDD-CVAE模型。改進后的SVDD中,原損失函數(shù)可以簡化為
(18)
其中:φ(xi;W)是數(shù)據(jù)點xi的潛在表示;中心c是神經(jīng)網(wǎng)絡(luò)學習到的參數(shù)。在修改后的SVDD問題中,訓練的不再是半徑R,而是所有數(shù)據(jù)點xi到學習中心c的平均距離。由于訓練集中不再包含異常數(shù)據(jù),所以原始和修改后的SVDD的主要區(qū)別是松弛變量不再被懲罰,需要用網(wǎng)絡(luò)φ(·)映射所有靠近中心c的實例。
深度SVDD-CVAE首先通過TCVAE有效提取軸承故障微弱特征,編碼后再將提取的特征用SVDD映射到希爾伯特空間進行約束,然后將約束后的特征進行CVAE重參數(shù)化,最后輸入到解碼器中完成數(shù)據(jù)重構(gòu),解碼器和編碼器成鏡像對立設(shè)置。CVAE特征壓縮提取框架由4個基礎(chǔ)單元組成,每個單元包含ConvLSTM2d、SeLU激活函數(shù)和批處理歸一化(Batch Normalization,BN)層,其中最后一個單元多包含一個Flatten層,以減少特征空間的維數(shù)。時頻圖可以很好地表征微弱故障信息,ConvLSTM2d可以更好地將每一張時頻圖的時間序列微弱故障特征提取出來。
文中提出方法的目的是最小化所有數(shù)據(jù)表示與中心c之間的平均距離,同時保持重構(gòu)輸入數(shù)據(jù)的能力。給定一個訓練數(shù)據(jù)集Dn=[x1,x2.…,xn],定義深度SVDD-CVAE目標函數(shù)為
(19)
式中:φ為CVAE編碼器參數(shù);θ為CVAE解碼器參數(shù)。α是一個可調(diào)參數(shù),在訓練階段設(shè)定數(shù)值,可以平衡CVAE和SVDD對整個模型的影響,如果將所有的輸入實例映射到潛在空間的一個點上,那么提取出的所有輸入實例所擁有的特征對不同的輸入實例進行重構(gòu)的幫助就會降低,從而導致模型重構(gòu)損失較大。理論上,最優(yōu)解需要將所有的輸入映射到潛在空間中的不同輸出上,不同的輸出可以支持超球不崩潰。因此將故障檢測器放置在重參數(shù)之前可以有效避免噪聲帶來的影響,提升模型對于早期軸承故障點的敏感程度,降低誤報率。
該模型需要找到一個將潛在表示映射到盡可能靠近中心的解決方案,并盡可能重構(gòu)輸入數(shù)據(jù)。將SVDD納入CVAE網(wǎng)絡(luò)的編碼器之后,提升了網(wǎng)絡(luò)模型的檢測準確率,在評估階段,正常數(shù)據(jù)的表示比異常數(shù)據(jù)的表示更接近中心。
根據(jù)輸出類型的不同,故障檢測可以分為基于評分的方法和基于標簽的方法。深度SVDD-CVAE是一種基于評分的方法。異常評分定義為表示到訓練后的超球中心的距離。給定的測試點xi的異常分數(shù)如下:
(20)
式中:zi為x進行編碼學習后的表示;c是訓練好的超球的中心。s(xi)值越高,點xi越可能是反常的。半徑R*是所有訓練實例異常評分的第98百分位。
深度 SVDD-CVAE模型工作流程構(gòu)造算法:
輸入:數(shù)據(jù)表示Dn={x1,x2,…,xn},訓練輪次k;
初始化:模型參數(shù)φ,θ和中心c;
(1)當i≤k時進行循環(huán);
(2)x?從訓練數(shù)據(jù)集中隨機選擇小批量Dn;
(3){μ,θ}?Encoderφ(x);
(5)z?樣本的重參數(shù)化N{μ,θ2};
(7)計算R*;
(9)結(jié)束循環(huán);
(10)Return:迭代優(yōu)化模型參數(shù)φ*?φk,θ*?θk,c*?ck
(12)R*?所有訓練實例的排序異常評分98百分比;
(13)提取每個測試樣本的特征ztest?Encoderφ*(xtest);
(15)比較s(xtest)和R*:如果s(xtest)>R*,則xtest為故障。
所提方法的目的是在潛在空間中找到一個最小體積的封閉超球,描述所有訓練數(shù)據(jù)。在該方法中,所有訓練數(shù)據(jù)都是正常的。因此,理論上可以將半徑定義為訓練數(shù)據(jù)特征與超球中心之間的最大距離。然而,在訓練集中也有一些正態(tài)樣本偏離了大多數(shù)正態(tài)數(shù)據(jù)。選擇R*的最大距離可能不合適,會導致故障檢測性能不佳。文中考慮到這種情況,并在精度和半徑之間進行權(quán)衡。因此,將半徑定義為所有訓練實例的異常分數(shù)(數(shù)據(jù)特征與中心之間的距離)的第98百分位。如果異常分數(shù)大于半徑,則認為該實例異常。
為了證明所提方法在軸承故障檢測中的有效性,使用一組全生命周期軸承實驗數(shù)據(jù)集進行驗證。
3.1.1 IMS軸承數(shù)據(jù)集
該數(shù)據(jù)集由美國辛辛那提大學NSF I/UCR智能維護系統(tǒng)中心支持,被廣泛應(yīng)用于機械狀態(tài)監(jiān)測的研究[18]。實驗系統(tǒng)如圖5所示,Rexnord ZA-2115雙列軸承安裝在軸上,交流電機耦合軸通過摩擦帶保持旋轉(zhuǎn)速度在2 000 r/min,彈簧機構(gòu)施加到軸和軸承上徑向載荷為6 000 N,采樣頻率設(shè)置為20 000 Hz。數(shù)據(jù)包中包含3個數(shù)據(jù)集,此實驗中以第2個數(shù)據(jù)集為代表進行分析。此數(shù)據(jù)集為20 480個數(shù)據(jù)點采集長度的振動信號,記錄間隔為10 min,在軸承壽命期內(nèi)共存儲984個樣本。在失效實驗結(jié)束時,軸承1發(fā)生外齒圈失效。
圖5 IMS實驗系統(tǒng)
3.1.2 數(shù)據(jù)處理
數(shù)據(jù)集分為訓練集和測試集。訓練集只包含正常樣本,推薦的正常樣本數(shù)量約為所有正常樣本的75%。由于實際工業(yè)故障檢測所使用的監(jiān)測數(shù)據(jù)既包括正常樣本,也包括故障樣本,因此在測試集中適當添加少量正常樣本。所有振動信號都以同樣的方式進行預(yù)處理。因為時頻域的信號比時域的信號對故障更敏感,所以對每一個原始振動信號進行短時傅里葉變換(Short-Time Fourier Transform,STFT)算法處理。為了減少網(wǎng)絡(luò)的計算時間,每個樣本通過滑窗取得4 096個點,采用STFT算法將振動信號變換為64×64的時頻域信號。對于IMS數(shù)據(jù)集前400個正常樣本作為訓練集,其余584個樣本作為測試集。
3.1.3 模型構(gòu)建
文中實驗軟件、硬件環(huán)境如表1所示。
表1 實驗軟件、硬件環(huán)境
深度SVDD-CVAE的模型參數(shù)如表2所示。
表2 深度SVDD-CVAE的模型參數(shù)
3.1.4 評價指標
故障檢測可以簡單理解為二元分類。對其結(jié)果的正確預(yù)測有2種可能:本來正確的預(yù)測本身就是正確的(TP),本來錯誤的預(yù)測本身就是錯誤的(TN)。對于結(jié)果產(chǎn)生的錯誤也有2種可能:最初正確的預(yù)測隨后就是錯誤的(FN),而最初錯誤的預(yù)測在其他方面則是正確的(FP)。這4種可能性構(gòu)成了二元分類模型的4個基本要素。為了評價所提方法和比較方法的性能,選擇常用的指標:精確度、準確度、召回率、F1、AUC,作為故障檢測任務(wù)的標準指標[19]。各指標定義如下式:
(21)
(22)
(23)
(24)
受試者工作特征曲線(Receiver Operating Characteristic,ROC)主要關(guān)注2個指標:真陽性率(TPR)和假陽性率(FPR)。在ROC空間中,橫坐標為FPR,縱坐標為TPR。
(25)
(26)
在故障檢測領(lǐng)域中,需設(shè)置一個閾值將實例分為正類或負類。因此,可以改變閾值,并根據(jù)分類結(jié)果計算出ROC空間中相應(yīng)的點。ROC曲線可以很直觀地表達分類器的性能,而且易于使用。曲線下面積(Area Under Curve,AUC)是ROC曲線下面積的大小。一般AUC值在0.5~1.0之間,AUC越大,性能越好。
IMS數(shù)據(jù)集的異常評分變化趨勢可用于反映軸承退化趨勢,在軸承運行的早期階段,即健康狀態(tài)下,異常值始終保持在一個相對穩(wěn)定的范圍內(nèi)。隨著運行時間的延長,IMS軸承的異常評分在5 320 min時開始超過設(shè)置的閾值,而且當軸承開始退化時,隨著振動的加劇,異常評分顯著增加。相應(yīng)的故障起始點可以很好地指示退化時間,也可以作為剩余壽命預(yù)測的第一個預(yù)測時間。
各方法的異常評分如圖6所示。AE模型的異常評分雖然也具有一定的退化趨勢,但是整體的變化幅度比較大,模型精度較低,誤判率高;雖然VAE-LSTM模型精度有所提升,但是整體的變化幅度比較大,沒有很好地反映整體退化趨勢;SVDD-VAE對于軸承開始出現(xiàn)退化的時間節(jié)點有著一定的敏感度,但是由于在重參數(shù)階段加入了一定的噪聲,使得模型精度降低,誤判率高。而文中方法對于軸承開始出現(xiàn)退化的時間節(jié)點有著更強的敏感度,很好地反映了軸承的退化趨勢,模型的精度更高。
圖6 各方法IMS數(shù)據(jù)異常評分曲線
根據(jù)分類結(jié)果和標簽的比較,計算出Accuracy、Precision score、Recall score、Fl score和Accuracy score,可用于定量描述不同方法的性能。各方法的評價指標見表3。所提出的方法在故障檢測上表現(xiàn)出良好的性能,準確率為0.976 6,說明錯分類樣本很少,該方法的綜合指標AUC得分達到0.998 5。在所有方法中最大。
表3 各方法的性能評價指標
在第1、3個數(shù)據(jù)集上也進行了同樣的實驗,由于第1、3數(shù)據(jù)集包含了更多的噪聲,所以診斷準確率略微下降,分別為0.942 8、0.936 7。
為解決滾動軸承故障信號匱乏和故障閾值自適應(yīng)困難的問題,文中提出一種基于深度SVDD-CVAE的軸承自適應(yīng)閾值故障檢測方法。與現(xiàn)有方法相比,該方法的優(yōu)點如下:
(1)構(gòu)建ConvLSTM作為基礎(chǔ)單元的CVAE特征壓縮提取框架,有效地提取軸承故障微弱特征,提高了對軸承微弱故障的敏感度。
(2)將故障檢測模塊與模型優(yōu)化進行聯(lián)合設(shè)計,實現(xiàn)了軸承故障檢測中自適應(yīng)閾值的確定,并取得了更高的檢測準確率。