魏 衛(wèi),王 磊,張 鑫
(武漢理工大學(xué) 機電工程學(xué)院,湖北 武漢 430070)
滾動軸承作為旋轉(zhuǎn)機械的重要組成元件,已被廣泛應(yīng)用于工業(yè)領(lǐng)域。據(jù)統(tǒng)計,旋轉(zhuǎn)機械中約有45%的故障源于軸承的失效[1]。為避免因軸承失效造成生產(chǎn)線停止甚至人員傷亡等不必要的損失,需要對軸承健康狀態(tài)進(jìn)行實時有效的監(jiān)測。
近年來,隨著人工智能的發(fā)展,基于數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)算法被廣泛應(yīng)用于故障的異常檢測。文獻(xiàn)[2]將軸承的異常檢測當(dāng)作一個二分類問題,通過選擇合適的小波基函數(shù)對原始信號進(jìn)行小波分解,將得到的小波系數(shù)作為特征輸入,利用支持向量機對正常數(shù)據(jù)和故障數(shù)據(jù)進(jìn)行分類。文獻(xiàn)[3]則將軸承全壽命周期劃分為正常、早期故障、嚴(yán)重故障3個階段,應(yīng)用經(jīng)驗?zāi)J椒纸鈱⒄駝有盘柗纸鉃楣逃心B(tài)函數(shù),并結(jié)合10個時域特征作為人工神經(jīng)網(wǎng)絡(luò)的輸入,找出了各階段的時間區(qū)間。
然而,在實際生產(chǎn)中,由于工況的多樣性和滾動軸承失效形式的不確定性,很難將軸承的所有故障數(shù)據(jù)收集完備,因此不能簡單的將軸承異常檢測作為一個分類問題來處理。筆者提出了一種基于自編碼網(wǎng)絡(luò)(auto-encoder network,AEN)重構(gòu)誤差的異常檢測方法。該方法主要包括3個步驟:①對滾動軸承的正常振動信號進(jìn)行頻譜包絡(luò)線特征提取,然后利用AEN的自學(xué)習(xí)能力,對包絡(luò)線進(jìn)行編碼和解碼,通過分析正常樣本重構(gòu)誤差的分布情況,確定重構(gòu)誤差閾值;②獲取測試樣本同樣進(jìn)行頻譜包絡(luò)線特征提取,輸入AEN模型進(jìn)行訓(xùn)練,求解測試樣本重構(gòu)誤差;③對兩個重構(gòu)誤差進(jìn)行比較分析,從而判定滾動軸承是否發(fā)生異常。
自編碼網(wǎng)絡(luò)AEN是一種無監(jiān)督式神經(jīng)網(wǎng)絡(luò),包含輸入層、隱藏層和輸出層。與用于分類及回歸問題的深度神經(jīng)網(wǎng)絡(luò)相比,其主要區(qū)別是該網(wǎng)絡(luò)采用對稱式結(jié)構(gòu)[4],即輸入層神經(jīng)元個數(shù)等于輸出層神經(jīng)元個數(shù),如圖1所示。AEN由編碼器和解碼器兩部分組成,編碼器將輸入層數(shù)據(jù)從高維空間映射到低維特征空間,再由解碼器對低維特征空間進(jìn)行特征重構(gòu)得到近似于輸入層的輸出結(jié)果。
圖1 自編碼網(wǎng)絡(luò)結(jié)構(gòu)
首先,編碼器函數(shù)fθ對數(shù)據(jù)集{x1,x2,…,xT}中輸入向量xt進(jìn)行編碼,得到特征向量ht,編碼過程可表示為:
ht=fθ(xt)
(1)
式中:ht為編碼得到的特征向量;fθ為編碼器函數(shù);θ為編碼器網(wǎng)絡(luò)參數(shù)向量;xt為輸入向量。
然后,解碼器函數(shù)gθ′對特征向量ht進(jìn)行特征重構(gòu),通過解碼,將低維空間的ht重新映射到高維空間,解碼過程可表示為:
(2)
(3)
式中:T為訓(xùn)練樣本個數(shù);L為平方誤差。
(4)
一般情況下,函數(shù)fθ,gθ′的映射過程為仿射映射,可通過向量和矩陣進(jìn)行表示:
fθ(x)=sf(Wx+b)
(5)
gθ′(x)=sg(WTx+d)
(6)
式中:sf,sg分別為編碼器和解碼器的激活函數(shù);W,WT為權(quán)值矩陣;b,d為偏差向量,且參數(shù)θ={W,b},θ′={WT,d}。
當(dāng)滾動軸承處于正常狀態(tài)下時,其振動信號對應(yīng)的特征值應(yīng)滿足其在物理意義上的相關(guān)性,當(dāng)異常發(fā)生時,特征值之間的內(nèi)部相關(guān)性將被破壞[5],對應(yīng)的自編碼重構(gòu)誤差會偏離原來的分布范圍,可通過比較其與閾值的大小判定滾動軸承是否存在異常,如圖2所示。
(7)
(8)
圖2 基于AEN重構(gòu)誤差的異常檢測模型
(1)offline線下模型訓(xùn)練
步驟1:訓(xùn)練樣本采集。獲取滾動軸承正常狀態(tài)下的原始信號{x1,x2,…,xN}。
步驟4:確定邊界閾值。通過分析{e1,e2,…,eN}的分布規(guī)律,確定訓(xùn)練樣本重構(gòu)誤差的邊界閾值eth。
(2)online在線異常檢測
步驟1:測試樣本采集。獲取滾動軸承受檢時的實時信號x′。
步驟2:特征提取。應(yīng)用“offline線下模型訓(xùn)練”中步驟2的頻帶劃分窗口提取信號x′頻譜包絡(luò)線f′e。
步驟3:AEN模型訓(xùn)練。將f′e輸入“offline線下模型訓(xùn)練”中的步驟3已經(jīng)訓(xùn)練好的自編碼網(wǎng)絡(luò),求解相應(yīng)的重構(gòu)誤差e′。
(3)異常判定
比較重構(gòu)誤差e′與設(shè)定閾值eth,進(jìn)而判定滾動軸承是否存在異常。
實驗數(shù)據(jù)來自美國NSFI/UCR智能維護(hù)系統(tǒng)中心(IMS)[6],裝置如圖3所示。該實驗將4個同型號的雙列滾柱軸承安裝于同一主軸上。主軸由交流電機以2 000 r/min的轉(zhuǎn)速通過同步帶耦合驅(qū)動。以10 min為間隔進(jìn)行一次數(shù)據(jù)采樣,每一次采樣持續(xù)1 s,采樣頻率為20 kHz,并生成一個包含20 480個數(shù)據(jù)點的記錄文件。實驗一共進(jìn)行3次,每次測試以任一軸承失效為終止條件。
筆者選用第二次測試中軸承1為研究對象,實驗過程中共采集到984個記錄文件,且該軸承最終因嚴(yán)重外圈故障而失效。
圖3 軸承測試實驗平臺示意圖
圖4給出了軸承1振動信號的峭度值K隨時間的變化曲線。當(dāng)記錄文件采集至第703次時,即t=703時,峭度值開始出現(xiàn)明顯波動,表明軸承已處于退化狀態(tài),直到t=984時,軸承完全失效。峭度值K作為高階時域特征,因其對沖擊信號的敏感特性,常用于對軸承早期異常的檢測[7]。通常將K=3作為異常檢測的判斷依據(jù),當(dāng)K>3時,則認(rèn)為軸承存在某種異常。由于該理論是對理想環(huán)境下做出的假設(shè),在實際應(yīng)用中仍存在較大差異。
圖4 峭度變化曲線圖
2.2.1 樣本獲取
為方便構(gòu)建基于滾動軸承正常樣本的異常檢測模型,選取t=[0,100]區(qū)間的振動信號作為offline線下模型的訓(xùn)練樣本,并將t=[101,984]區(qū)間的振動信號作為online在線異常檢測的測試樣本。
當(dāng)訓(xùn)練樣本量較少時可能導(dǎo)致檢測模型出現(xiàn)欠擬合問題,需要對樣本進(jìn)行適度的切片處理,以便增大正常樣本量。已知軸承缺陷(內(nèi)圈故障、外圈故障、滾動體故障)的固有頻率通常處于低頻范圍內(nèi),且小于500 Hz[8],因此在對信號進(jìn)行頻譜分析時只需保證頻帶范圍大于500 Hz即可。
對單個訓(xùn)練樣本進(jìn)行20等分的切分處理,共得到N=20×100的訓(xùn)練樣本{x1,x2,…,xN},其中xn包含1 024個數(shù)據(jù)點,經(jīng)快速傅里葉變換之后的頻帶范圍為0~512 Hz。
2.2.2 特征提取
滾動軸承產(chǎn)生故障時,伴有尖銳不連續(xù)的脈沖振動信號產(chǎn)生,這種振動信號具有特定的振動頻率,通過頻譜分析能有效的進(jìn)行識別[9]。
快速傅里葉變換因其計算量小,響應(yīng)時間快,作為頻譜分析手段被廣泛應(yīng)用于信號處理及特征提取[10]。由于軸承早期頻帶成分易受噪聲信號干擾,其頻譜圖會在一定程度上進(jìn)行波動。為魯棒性地得到軸承早期頻譜圖特征,通過對0~512 Hz頻帶進(jìn)行等間距劃分,提取區(qū)間幅值最高點,將頻譜包絡(luò)線作為自編碼AEN模型的特征輸入。
在對頻譜圖進(jìn)行包絡(luò)線提取時,需要選擇合適的劃分窗口,如圖5所示。窗口寬度較小,對頻譜圖的分辨率高,但不能魯棒性地表示軸承正常狀態(tài)下的頻譜固有特征結(jié)構(gòu)。同時,包絡(luò)線的繪制點直接影響了模型輸入層的大小,當(dāng)輸入層過大,會使基于BP(back propagation)算法優(yōu)化的網(wǎng)絡(luò)權(quán)值陷入局部最優(yōu);當(dāng)輸入層過小,則不利于提取頻譜圖局部特征。
圖5 原始信號頻譜圖(t=10)
(9)
表2 各窗口大小對應(yīng)的包絡(luò)線整體相似度值
從表2可知,劃分窗口寬度越大,訓(xùn)練樣本包絡(luò)線之間的整體相似度越高,但對于故障頻率的分辨率也會隨之下降。綜合考慮,選擇d=4作為包絡(luò)線劃分窗口,利用上述方法提取的頻譜包絡(luò)線圖如圖6所示。
圖6 頻譜包絡(luò)線圖(t=10)
2.2.3 AEN模型訓(xùn)練
為防止模型訓(xùn)練過程中產(chǎn)生過擬合問題,將50%的訓(xùn)練集作為交叉驗證集。根據(jù)網(wǎng)絡(luò)層構(gòu)建的一般原則,并經(jīng)過反復(fù)實驗,選擇128-64-32-16-32-64-128作為自編碼網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)選擇tanh函數(shù)。模型的迭代曲線如圖7所示,訓(xùn)練集和驗證集雖然表示的是軸承同一生命周期的頻譜狀態(tài),但由于軸承早期易受噪聲信號的干擾,兩者之間不可避免的存在頻譜差異性,導(dǎo)致訓(xùn)練集和驗證集的迭代曲線無法同步擬合,當(dāng)?shù)螖?shù)大于35時,訓(xùn)練集重構(gòu)誤差開始不斷上升,產(chǎn)生過擬合。為防止過擬合現(xiàn)象的產(chǎn)生,以及保證模型的魯棒性,迭代次數(shù)取35。模型訓(xùn)練之后,得到驗證集的重構(gòu)誤差{e1,e2,…,eN},N=1 000。
圖7 訓(xùn)練樣本迭代曲線
利用箱線圖對該重構(gòu)誤差進(jìn)行統(tǒng)計分析,并將箱線圖的上限值作為判斷軸承異常的閾值指標(biāo)。如圖8所示,當(dāng)數(shù)據(jù)集N=1 000時,部分重構(gòu)誤差因大于箱線圖的上限而誤判為異常值。這是因為滾動軸承在裝配之后存在一定的磨合期,該時期振動幅度較大,其頻譜包絡(luò)線與軸承穩(wěn)定時期存在一定差異,在模型訓(xùn)練中,由于其重構(gòu)誤差較大而被視為異常點。
圖8 重構(gòu)誤差箱線圖(N=50,N=1 000)
在訓(xùn)練樣本獲取的過程中,由于對同一時刻的振動信號進(jìn)行了20等分的切片處理,故同一時刻擁有20個頻譜包絡(luò)線重構(gòu)誤差值,其平均值可代表該時刻軸承的整體狀態(tài),在一定程度上,減少了誤差干擾。對驗證集中單個記錄文件的重構(gòu)誤差進(jìn)行了平均處理,由圖8可知,當(dāng)N=50時,重構(gòu)誤差分布在0.8~1.0范圍內(nèi),沒有異常值產(chǎn)生。重構(gòu)誤差對應(yīng)箱線圖的具體邊界值如圖9所示,上限閾值為0.948 2。
圖9 箱線圖各邊界值(N=50)
2.2.4 online在線異常檢測
如前所述,將t=[101,984]區(qū)間的信號記錄文件作為測試樣本數(shù)據(jù)逐個在線檢測,通過提取相應(yīng)的頻譜包絡(luò)線,將特征向量輸入offline訓(xùn)練好的AEN模型,并將單個記錄文件所對應(yīng)的20個重構(gòu)誤差進(jìn)行均值處理。
測試一共得到884個重構(gòu)誤差值,重構(gòu)誤差值變化曲線如圖10所示。由圖10可知,t=[101,533]時重構(gòu)誤差保持平穩(wěn)狀態(tài),可判定軸承處于正常運行狀態(tài)。
圖10 重構(gòu)誤差曲線圖(t=[101,700])
當(dāng)t≥533時,重構(gòu)誤差大于箱線圖的上限閾值0.948 2,且開始隨時間推移逐漸增大,因此,可以判定軸承在t=533時,產(chǎn)生了早期異常。
為更好地驗證筆者提出的異常檢測方法,分別應(yīng)用樣本熵[11],動態(tài)路徑規(guī)劃理論[12]對滾動軸承的振動信號進(jìn)行了平穩(wěn)性分析。
軸承樣本熵隨時間的變化趨勢如圖11所示。在t=[500,600]區(qū)間,樣本熵值開始呈現(xiàn)下降趨勢,即信號的復(fù)雜性開始降低。這是因為在此階段軸承產(chǎn)生了某種早期異常,導(dǎo)致了振動信號的周期性開始增加。
根據(jù)動態(tài)路徑規(guī)劃理論得到的軸承平穩(wěn)度變化趨勢如圖12所示。在t=[0,532]區(qū)間,平穩(wěn)度穩(wěn)定在0.4左右,且隨著時間的推移,平穩(wěn)度逐漸上升;在t=533左右,開始出現(xiàn)拐點,說明此刻的軸承狀態(tài)發(fā)生了改變。
圖12 振動信號平穩(wěn)度變化趨勢圖
由于樣本熵和動態(tài)路徑規(guī)劃方法需要對信號進(jìn)行持續(xù)監(jiān)控,通過繪制連續(xù)的變化曲線圖,才能有效地捕捉曲線拐點處信息。且利用樣本熵的方式并不能準(zhǔn)確判斷異常點的發(fā)生時刻,同時,雖然動態(tài)路徑規(guī)劃方法確定了軸承早期的穩(wěn)定度在0.4范圍內(nèi)波動,但其并沒有明確給出判斷異常的閾值指標(biāo),文獻(xiàn)[12]從直觀的角度推測了軸承在t=533左右產(chǎn)生了某種異常。
為進(jìn)一步驗證,對t=532和t=533時刻的滾動軸承狀態(tài)進(jìn)行了頻譜分析,如圖13所示。當(dāng)t=533時,振動信號的頻譜圖出現(xiàn)了一定程度的譜峰,與筆者提出的方法檢測出的軸承早期異常發(fā)生時刻相吻合,從而驗證了筆者提出方法的準(zhǔn)確性。
圖13 頻譜圖(t=532,t=533)
針對實際工業(yè)環(huán)境下因樣本不平衡,及標(biāo)簽類樣本易缺失的問題,提出了一種基于AEN重構(gòu)誤差的異常檢測方法。實驗結(jié)果表明,該方法避免了因樣本熵和動態(tài)路徑規(guī)劃理論需持續(xù)進(jìn)行信號監(jiān)測的要求,且相比于基于時域分析方法和樣本熵方法具有更高的靈敏性。同時,該方法避免了因輸入新數(shù)據(jù)而需重構(gòu)模型的情況,減少了異常檢測的響應(yīng)時間,因而能更好地服務(wù)于實際工業(yè)場景。