尹愛軍, 王 昱, 戴宗賢, 任宏基
(1.重慶大學(xué)機(jī)械傳動國家重點(diǎn)實(shí)驗(yàn)室 重慶,400044) (2.重慶市計(jì)量質(zhì)量檢測研究院 重慶,401120)
軸承運(yùn)行健康狀態(tài)評估(prognostics and health management,簡稱PHM)及其退化性能的偵測在現(xiàn)代機(jī)械設(shè)備中具有越來越重要的作用。近年來,學(xué)者們提出了諸多軸承運(yùn)行健康狀態(tài)評估方法[1-5]。張朝林等[6]提出了一種基于本征時(shí)間尺度分解(intrinsic time-scale decomposition,簡稱ITD)多尺度熵和極限學(xué)習(xí)機(jī)的軸承健康狀態(tài)識別模型。朱朔[7]針對冗余特征降維問題,提出了一種基于改進(jìn)局部保留投影算法的滾動軸承特征向量降維方法。劉小勇[8]提出了一種基于長短時(shí)記憶網(wǎng)絡(luò)的評估方法,對軸承和渦輪的退化性能進(jìn)行預(yù)測。Qiu等[9]通過使用自組織映射方法將提取到的特征融合構(gòu)建為軸承健康狀態(tài)檢測指標(biāo)。
以上方法均通過人為提取數(shù)據(jù)特征或?qū)?shù)據(jù)的真實(shí)概率分布和組織形式進(jìn)行某種假設(shè),進(jìn)而再通過實(shí)驗(yàn)對假設(shè)進(jìn)行驗(yàn)證。該方法有如下限制:①基于人為假設(shè)數(shù)據(jù),使用數(shù)據(jù)驅(qū)動構(gòu)建模型的方法,評估效果依賴于模型的參數(shù)調(diào)校,難以在同類數(shù)據(jù)上具備較好的魯棒性;②基于人工提取低維特征的方法損失了原始數(shù)據(jù)的信息量,冗余無法確定,且所提取的特征對狀態(tài)評估的貢獻(xiàn)度難以定量描述,造成評估模型只能在特定工況下才能達(dá)到理想的效果,且大多數(shù)特征提取一般是基于某種特定的假設(shè)下;③基于支持向量機(jī)(support vector machine,簡稱SVM),深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,簡稱DNN)等智能學(xué)習(xí)方法完全由數(shù)據(jù)驅(qū)動,缺乏理論背景且對數(shù)據(jù)的數(shù)量較為依賴。軸承在復(fù)雜多變的工況下運(yùn)行并伴隨大量環(huán)境噪聲,在數(shù)據(jù)量較為缺失的情況下,使得該評估方法難以在軸承狀態(tài)偵測方面具備較好的通用性。
由于信號頻域幅值譜在其特征空間具有更為穩(wěn)定的概率分布,提出了一種面向高熵特征的變分自編碼器軸承健康狀態(tài)評估模型。通過建立振動信號頻譜在特征空間的概率分布量化模型并最大化其邊緣似然概率,實(shí)現(xiàn)對振動信號頻譜高維空間中真實(shí)復(fù)雜概率分布的精確逼近,完成對振動信號狀態(tài)的定量評估。通過實(shí)驗(yàn)及對比,證明了變分自編碼器在軸承運(yùn)行健康狀態(tài)評估上具有較好的準(zhǔn)確性和魯棒性。
(1)
其中:P(x(i))為觀測數(shù)據(jù)x(i)的概率密度函數(shù)。
VAE試圖極大化P(x(i))的似然概率,從而估計(jì)觀測數(shù)據(jù)的真實(shí)分布。
對于隱空間先驗(yàn)分布P(z),VAE指定其服從標(biāo)準(zhǔn)正態(tài)分布N(0,I)。其中:I為z空間中的單位陣。同時(shí),變分自編碼器使用后驗(yàn)分布P(z|x(i))對具體觀測數(shù)據(jù)的隱空間分布進(jìn)行度量。VAE使用變分推斷方法,構(gòu)造可優(yōu)化函數(shù)Q(z|x(i);φ),通過優(yōu)化參數(shù)φ,逼近真實(shí)后驗(yàn)分布P(z|x(i))。根據(jù)變分理論并考慮易優(yōu)化性,優(yōu)化目標(biāo)通過Kullback-Leibler(簡稱KL)散度進(jìn)行度量,即
(2)
對式(2)運(yùn)用貝葉斯定理變形可得
logP(x(i))-KL[Q(z|x(i))‖P(z|x(i))]=
Ez~Q[logP(x(i)|z)]-KL[Q(z|x(i))‖P(z)]
(3)
式(3)包含了最初式(1)的優(yōu)化目標(biāo)P(x(i)),由于KL[Q(z|x(i))‖P(z|x(i))]≥0且無法直接計(jì)算,因此優(yōu)化目標(biāo)可變?yōu)闃O大化logP(x(i))的變分證據(jù)下界(evidence lower bound,簡稱ELBO),即
(4)
VAE通過最大化變分下界來實(shí)現(xiàn)最大化邊緣似然概率P(x(i))。對于Pθ和Qφ,一般可采用多層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。在VAE中,Q(z|x(i);φ)被指定為一個(gè)具有對角協(xié)方差矩陣的多維高斯分布
Q(z|x(i);φ)=N(z;μ(i),σ(i)°Ι)
(5)
其中:μ(i),σ(i)可由一個(gè)多層神經(jīng)網(wǎng)絡(luò)輸出,即VAE假設(shè)觀測數(shù)據(jù)后驗(yàn)分布服從高斯分布。
對于Ez~Q[logP(x(i)|z;θ)]項(xiàng),為避免其對Qφ梯度過大而引起計(jì)算不穩(wěn)定問題,VAE使用基于蒙特卡洛采樣的隨機(jī)梯度變分貝葉斯評估器(stochastic gradient variational Bayes,簡稱SGVB)對優(yōu)化目標(biāo)進(jìn)行估計(jì),同時(shí)使用自編碼變分貝葉斯(auto-encoding variational Bayes,簡稱AEVB)算法[10]進(jìn)行訓(xùn)練,并在實(shí)際模型中采用重參數(shù)技巧解決后驗(yàn)分布采樣過程中梯度不可計(jì)算的問題,最終變分下界的估計(jì)值可表示為
L(θ,φ;x(i))=-KL[Qφ(z|x(i))‖P(z)]+
(6)
其中:L為隱變量z的采樣次數(shù);z(i,l)=μ(i)+σ(i)°∈(l);∈(l)~Ν(0,I)。
變分自編碼器實(shí)現(xiàn)采用最小化解碼數(shù)據(jù)和觀測數(shù)據(jù)L2范數(shù),從而間接優(yōu)化logPθ(X(i)|z),所以式(6)的優(yōu)化目標(biāo)為
L(θ,φ;x(i))=-KL[Qφ(z|x(i))‖P(z)]-
(7)
其中:fθ為解碼器。
為使基于蒙特卡洛采樣的SGVB優(yōu)化器[10]獲得收斂,VAE對觀測數(shù)據(jù)采用小批量多批次方式進(jìn)行優(yōu)化,使L(θ,φ;x(i))達(dá)到最終穩(wěn)定解。
基于VAE的軸承健康狀態(tài)評估模型實(shí)質(zhì)是健康狀態(tài)下振動信號x(t)頻譜X(f)的邊緣概率分布P(X(f)),對于軸承運(yùn)行狀態(tài)下頻譜X(f),評估模型P(X(f)),計(jì)算X(f)所表征健康狀態(tài)的概率值,從而實(shí)現(xiàn)對軸承健康狀態(tài)的定量評估。由式(3)得
(8)
評估模型通過對P(X(f))進(jìn)行最大似然估計(jì),從而使P(X(f))逼近真實(shí)邊緣概率分布。由于KL[Q(z|X(f))‖P(z|X(f))]≥0且無法計(jì)算,因此采用變分下界L(θ,φ;X(f))作為logP(X(f))的估計(jì)。由于AEVB算法采用小批量多批次方式進(jìn)行訓(xùn)練,若單批次訓(xùn)練數(shù)量達(dá)到一定規(guī)模(100以上),根據(jù)均值場論[14],L(θ,φ;X(f))中蒙特卡洛采樣次數(shù)可降為一次[10]。筆者指定評估模型單批次訓(xùn)練數(shù)量為128,每批次訓(xùn)練采樣一次。因此,變分下界L(θ,φ;X(f))表示為
P(z)]-‖fθ(z(i))-X(f)(i)‖2}
(9)
在訓(xùn)練階段,VAE將軸承振動信號頻譜解碼為連續(xù)三維隱空間中后驗(yàn)分布參數(shù),同時(shí)使后驗(yàn)分布與先驗(yàn)分布的KL散度及編解碼前后頻譜間L2范數(shù)最小化,以此實(shí)現(xiàn)對所有訓(xùn)練數(shù)據(jù)的邊緣似然概率最大化。圖1為基于VAE的軸承健康狀態(tài)評估模型及其訓(xùn)練,具體訓(xùn)練步驟如下。
圖1 基于VAE的軸承健康狀態(tài)評估模型Fig.1 Model architecture for the bearing health status evaluation with VAE
1) 從訓(xùn)練集數(shù)據(jù)中隨機(jī)選取128個(gè)觀測數(shù)據(jù)點(diǎn),組成單批訓(xùn)練集{X(f)(i)|i=0,1,…,127}。
2) 將單批訓(xùn)練集中每個(gè)數(shù)據(jù)點(diǎn)X(f)(i)送入編碼器,得到對應(yīng)后驗(yàn)分布N(z;μ(i),σ2(i)°I)。
3) 從三維標(biāo)準(zhǔn)正態(tài)分布中采樣128個(gè)噪聲{∈(i)|i=0,1,…,127},結(jié)合對應(yīng)后驗(yàn)分布生成隱變量{z(i)|z(i)=∈(i)°σ2(i)+μ(i)}。
5) 重復(fù)步驟1~4,直至模型總體損失函數(shù)值低于設(shè)定值,保存模型參數(shù)Qφ及Pθ。
軸承健康狀態(tài)評估指標(biāo)即為對應(yīng)頻譜X(f)的邊緣似然概率響應(yīng)值P(X(f))。由分析可知,P(X(f))無法直接計(jì)算,而是通過其變分下界L(θ,φ;X(f))對其對數(shù)值logP(X(f))進(jìn)行估計(jì),且由于高斯后驗(yàn)分布的簡化假設(shè)導(dǎo)致變分推斷存在一定誤差[15],因此P(X(f))不能直接作為軸承健康狀態(tài)評估指標(biāo)。L(θ,φ;X(f))作為logP(X(f))的一個(gè)下界逼近,同樣可作為預(yù)測階段的健康狀態(tài)評價(jià)指標(biāo),由此得出的評價(jià)結(jié)果是偏嚴(yán)格的,即真實(shí)退化程度不會高于評估退化程度,這對發(fā)現(xiàn)軸承運(yùn)行早期故障是有益的。
為了避免計(jì)算解碼器解碼期望而帶來的額外采樣運(yùn)算,直接使用后驗(yàn)高斯分布期望值作為采樣隱變量。設(shè)某時(shí)間段軸承振動信號為x(t),頻譜為X(f),則基于變分下界的健康狀態(tài)評估指標(biāo)E表示為
(10)
其中:u(X(f))為X(f)后驗(yàn)分布期望值。
E(x(t))值越大,表明其退化程度越嚴(yán)重。對軸承振動頻譜X(f),首先通過解碼器Qφ(X(f))得到其高斯后驗(yàn)分布期望u及方差σ,通過u,σ構(gòu)建后驗(yàn)分布N(u,σ),并計(jì)算其和先驗(yàn)分布的KL散度KL[N(u,σ)‖N(0,I)]。同時(shí),將期望u送入解碼器fθ,得到解碼值fθ(u),并計(jì)算解碼值與真實(shí)值間L2范數(shù)‖fθ(u)-X(f)‖2,最終KL[N(u,σ)‖N(0,I)]與‖fθ(u)-X(f)‖2之和即為軸承健康狀態(tài)評估指標(biāo)。
為了驗(yàn)證變分自編碼器對軸承振動信號狀態(tài)評估效果,筆者選取辛辛那提大學(xué)智能維護(hù)系統(tǒng)實(shí)驗(yàn)室開源滾動軸承加速退化實(shí)驗(yàn)數(shù)據(jù)集[16]。試驗(yàn)臺傳動軸由交流電機(jī)通過皮擦帶輪驅(qū)動測試軸旋轉(zhuǎn),轉(zhuǎn)速恒定為2 kr/min。實(shí)驗(yàn)共有4個(gè)數(shù)據(jù)采集通道,均采用加速度傳感器收集對應(yīng)軸承振動信號,采樣頻率為20 kHz。筆者使用軸承1振動數(shù)據(jù)作為數(shù)據(jù)集。實(shí)驗(yàn)歷時(shí)9 840 min后,軸承1出現(xiàn)外圈故障,停止實(shí)驗(yàn)。
在軸承運(yùn)行全過程9 840 min內(nèi),選取前100個(gè)數(shù)據(jù)集(前1 000 min)作為訓(xùn)練數(shù)據(jù)集,其余數(shù)據(jù)均作為測試集。為了降低訓(xùn)練數(shù)據(jù)維度,每個(gè)數(shù)據(jù)集選取轉(zhuǎn)子旋轉(zhuǎn)一圈時(shí)間(5 s)的采樣信號作為訓(xùn)練數(shù)據(jù)維度,對模型進(jìn)行隨機(jī)多批次訓(xùn)練。訓(xùn)練完畢后對軸承全退化過程健康狀態(tài)進(jìn)行評估,圖2為VAE軸承健康狀態(tài)評估結(jié)果。區(qū)域Ⅰ為早期訓(xùn)練數(shù)據(jù)狀態(tài)評估結(jié)果,區(qū)域Ⅱ?yàn)檩S承后續(xù)運(yùn)行狀態(tài)評估結(jié)果??梢?,在1 000~5 000 min時(shí)間段內(nèi),軸承未表現(xiàn)出退化跡象,其健康狀態(tài)評估值和訓(xùn)練階段的評估值具有相同的變化波動趨勢,這說明基于VAE的軸承健康狀態(tài)評估指標(biāo)在測試集同類數(shù)據(jù)上具有良好的泛化能力。
圖2 VAE軸承健康狀態(tài)評估結(jié)果Fig.2 Evaluation results of bearing health status with VAE
基于VAE的軸承健康狀態(tài)評估模型通過隱變量來表征振動信號的潛在狀態(tài),隱變量蘊(yùn)含解碼器對原始信號特征的有效轉(zhuǎn)化和提取。因此,對于一個(gè)有效的評估模型,其隱變量的分布狀態(tài)及變化趨勢應(yīng)當(dāng)和評價(jià)指標(biāo)結(jié)果相似。為了驗(yàn)證VAE對軸承振動信號狀態(tài)的隱變量解碼分布,在軸承運(yùn)行全過程中每間隔10 min對解碼后隱變量進(jìn)行可視化分析。
圖3為全退化過程振動信號頻譜隱變量分布。圖中,三維坐標(biāo)系建立在三維先驗(yàn)標(biāo)準(zhǔn)正態(tài)分布空間,坐標(biāo)原點(diǎn)位于先驗(yàn)高斯分布均值處。由于VAE使用標(biāo)準(zhǔn)正態(tài)分布作為先驗(yàn)分布,因此前1 000 min內(nèi)測試數(shù)據(jù)隱變量分布符合高斯分布先驗(yàn)假設(shè),且在1 000 min至軸承開始退化前時(shí)間段內(nèi),隱變量分布仍符合高斯分布,這進(jìn)一步說明了模型在測試數(shù)據(jù)集同類數(shù)據(jù)上具有良好的泛化能力。隨著軸承退化性能逐漸加重,隱變量開始逐漸偏離先驗(yàn)分布,且偏離程度基本和退化性能成正比。這說明VAE正是通過調(diào)整隱變量在其空間分布,從而達(dá)到表征軸承振動信號頻譜有效特征的目的,而不是強(qiáng)行通過編解碼器對訓(xùn)練數(shù)據(jù)進(jìn)行強(qiáng)行記憶,由此也證實(shí)了解碼器學(xué)習(xí)到了從高維原始特征空間到低維有效特征空間的平滑映射。
圖3 全退化過程振動信號頻譜隱變量分布Fig.3 Embedding hidden space of vibration spectrum point overall test time
為驗(yàn)證基于VAE的軸承健康狀態(tài)評估模型對軸承退化性能評估的準(zhǔn)確性和敏感性,將其評估結(jié)果分別與傳統(tǒng)健康狀態(tài)評估指標(biāo)的結(jié)果進(jìn)行對比,所有評估指標(biāo)的評估值均被歸一化到0~1區(qū)間,結(jié)果如圖4所示。
圖4 VAE狀態(tài)評估歸一化值及對比Fig.4 Normalized evaluation value and comparison with other methods
從圖4可以看出,基于VAE的軸承健康狀態(tài)評價(jià)方法對退化數(shù)據(jù)的評估結(jié)果與傳統(tǒng)健康狀態(tài)評估結(jié)果的曲線走勢基本一致,證明了其對軸承退化性能評估的準(zhǔn)確性。圖4表明,基于VAE的評價(jià)方法在軸承退化早期狀態(tài)評估敏感度上大大優(yōu)于其他評估方法,在軸承開始進(jìn)入退化時(shí),評估值發(fā)生了明顯變化,這有利于盡早對軸承退化狀態(tài)進(jìn)行判斷,避免進(jìn)入二次突變惡化造成更嚴(yán)重的事故。
VAE通過建立軸承振動數(shù)據(jù)的概率模型從而對其健康狀態(tài)進(jìn)行定量評估?;陔[馬爾科夫模型(hidden Markov model,簡稱HMM)、深度信念網(wǎng)絡(luò)(deep belief network,簡稱DBN)等代表性概率推斷模型在軸承狀態(tài)評估方面得到廣泛研究[17-20]。
圖5為VAE,HMM和DBN評估結(jié)果對比,評估值被歸一化在0~1區(qū)間。為了量化不同評價(jià)方法下的臨界退化時(shí)間點(diǎn),采用3σ原則[21]確定出4 000 min前軸承的健康狀態(tài)評估值上界,并以此上界作為健康狀態(tài)至退化狀態(tài)的評估值轉(zhuǎn)變點(diǎn),由此確定不同方法下軸承退化的臨界時(shí)間點(diǎn),結(jié)果如表1所示。
圖5 VAE,HMM和DBN評估結(jié)果對比Fig.5 Evaluation results in comparison with VAE, HMM, and DBN
表1 VAE,DBN和HMM臨界退化時(shí)間Tab.1 Threshold degradation time of VAE,DBN and HMM min
可見,基于HMM的評估方法對軸承早期故障的偵測較為遲滯,在后期退化狀態(tài)的偵測上敏感度也較弱。基于DBN的評估方法在軸承健康狀態(tài)轉(zhuǎn)變臨界時(shí)間點(diǎn)判斷上稍落后于VAE評估方法,退化后期對軸承退化狀態(tài)的評估敏感度也不及VAE方法強(qiáng)?;赩AE的評估方法僅需要少量樣本進(jìn)行訓(xùn)練,其狀態(tài)評估結(jié)果不僅在進(jìn)入軸承退化臨界點(diǎn)時(shí)具有敏感的變化趨勢,且在相同退化狀態(tài)下的評估敏感度均高于HMM和DBN。因此,基于VAE的軸承健康狀態(tài)評估方法相比其他概率推斷方法更為準(zhǔn)確、高效。
提出了一種基于變分自編碼器的軸承狀態(tài)評估方法。通過變分推斷的方式,從振動信號頻域中自動學(xué)習(xí)潛在的狀態(tài)概率分布,并將其應(yīng)用于軸承運(yùn)行狀態(tài)評估中,取得了較好的效果。證明了變分自編碼器在處理軸承運(yùn)行狀態(tài)評估方面具有良好的準(zhǔn)確度,對異常狀態(tài)更為敏感,且無需人為提取特征和復(fù)雜的參數(shù)設(shè)置,不需要對特定的系統(tǒng)進(jìn)行針對性的參數(shù)設(shè)置和調(diào)校。在小容量訓(xùn)練數(shù)據(jù)集上具備良好的魯棒性,工程應(yīng)用上具有一定的推廣價(jià)值。