苗中華,周廣興,劉海寧,劉成良
(1.上海大學(xué) 機(jī)電工程與自動(dòng)化學(xué)院,上海 200072;2. 上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,上海 200240)
重大裝備的安全服役與智能維護(hù)是我國裝備制造業(yè)面臨的重要課題。相比定期維護(hù)及事后維修,基于狀態(tài)的設(shè)備維護(hù)(Condition-Based Maintenance, CBM)被認(rèn)為是目前最有效的維護(hù)策略[1]。然而,基于狀態(tài)的設(shè)備維護(hù)需要采集多路傳感信息,尤其在低轉(zhuǎn)速條件下連續(xù)長時(shí)間采樣,將造成海量冗余數(shù)據(jù)。如何在海量冗余數(shù)據(jù)中進(jìn)行信號(hào)有效特征提取是智能維護(hù)領(lǐng)域亟需探索的基礎(chǔ)理論和關(guān)鍵技術(shù)難題。
在鐵路系統(tǒng)的常規(guī)維護(hù)中,工人用鐵錘敲擊機(jī)車車輪,根據(jù)敲擊聲音來判斷車輪是否有裂紋;工程領(lǐng)域中經(jīng)驗(yàn)豐富的維護(hù)人員根據(jù)機(jī)器工作時(shí)發(fā)出的聲音就能夠判斷機(jī)器是否運(yùn)行正常。上述現(xiàn)象潛在的物理原理是由于零部件損傷改變了其特征頻率,進(jìn)而改變了聲音的音色。然而,工程應(yīng)用領(lǐng)域?qū)@種僅憑聽力系統(tǒng)所實(shí)現(xiàn)的生物本能診斷能力的運(yùn)作原理,包括耳朵對(duì)聲音信號(hào)的處理及大腦中診斷知識(shí)的建立,卻鮮有解釋。
Barlow[2]開創(chuàng)性地提出了視神經(jīng)系統(tǒng)信息處理的一個(gè)基本原則是:冗余度壓縮(Redundancy Reduction)。進(jìn)一步地,F(xiàn)?ldiák[3]將稀疏編碼(Sparse Coding)的概念與冗余度壓縮建立了聯(lián)系。基于上述假設(shè)性研究,Olshausen等[4-5]首先在《Nature》雜志上發(fā)表論文指出:從自然圖像中學(xué)習(xí)出了與哺乳動(dòng)物初級(jí)視覺皮層神經(jīng)元具有相同特性的基函數(shù),并進(jìn)一步將稀疏編碼解釋為諸多生物傳感系統(tǒng)信息處理的基本策略。Smith等[6]也在《Nature》上發(fā)表論文驗(yàn)證了移不變稀疏編碼(Shift-Invariant Sparse Coding)是生物聽覺系統(tǒng)的有效建模手段,并提出了相應(yīng)的基函數(shù)學(xué)習(xí)方法。上述研究表明:移不變稀疏編碼可以作為維護(hù)人員僅憑聽力系統(tǒng)所實(shí)現(xiàn)的生物本能診斷能力的一種有效解釋,其必然也應(yīng)具有在機(jī)械旋轉(zhuǎn)設(shè)備故障診斷中應(yīng)用的潛力。
本文借鑒神經(jīng)科學(xué)研究的相關(guān)進(jìn)展,在前人探索研究的基礎(chǔ)上[7-8],從模擬人耳對(duì)聲音信號(hào)處理原理的角度,研究利用稀疏編碼進(jìn)行信號(hào)有效特征提取的若干問題,并進(jìn)行實(shí)驗(yàn)驗(yàn)證。
稀疏編碼的概念源于視神經(jīng)網(wǎng)絡(luò)的研究,是對(duì)只有小部分神經(jīng)元同時(shí)處于活躍狀態(tài)的多維數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)的表示方法。就生物神經(jīng)學(xué)而言,稀疏編碼是指:生物感知系統(tǒng)進(jìn)化極度高效的編碼策略來最大化傳遞到大腦的信息,同時(shí)最小化能量的消耗與對(duì)神經(jīng)資源的占用——感知信息由海量存在的神經(jīng)元中極少數(shù)激活神經(jīng)元所表示。從數(shù)學(xué)的角度講,稀疏編碼被假設(shè)為是對(duì)多維數(shù)據(jù)進(jìn)行線性分解的一種表示方法。一個(gè)輸入信號(hào)X=[x1,x2,…,xM]T可以被表示成基函數(shù)的加權(quán)和,再加上附加噪聲:
(1)
式中,矩陣D∈RM×K被稱作字典(Dictionary),其中列向量為基函數(shù)dk,又稱作原子(Atoms),s=[s1,s2,…,sK]T是輸入信號(hào)x的稀疏表示(Sparse Representation),ε通常假設(shè)為高斯噪聲。
稀疏編碼即是基于給定信號(hào)x與字典D求解稀疏表示s。在式(1)所示的模型中,基函數(shù)的個(gè)數(shù)可以大于輸入信號(hào)的維數(shù),即:M (2) 從本質(zhì)上講,稀疏性是上述兩個(gè)問題的共同優(yōu)化目標(biāo)。對(duì)字典學(xué)習(xí)而言,稀疏性能夠促進(jìn)基函數(shù)對(duì)數(shù)據(jù)特征模式的捕捉;對(duì)系數(shù)求解來說,稀疏性從模式識(shí)別的簡約原則(Parsimony Principle)[9]上能夠使得后續(xù)推理過程變得簡單。 基于給定字典精確求解信號(hào)的稀疏表示被證明是一個(gè)NP-Hard問題[10],通常采用匹配追蹤算法[11-12]或者最大后驗(yàn)概率估計(jì)(Maximum A Posterior, MAP)[13-14]近似求解。 (3) (4) (5) (6) (7) 同時(shí),每一個(gè)樣本的似然可以被表示成: (8) 根據(jù)式(4)中的似然函數(shù),并假設(shè)系數(shù)的先驗(yàn)概率分布為Laplace分布,則似然式(8)可被推導(dǎo)為: (9) (10) 式中第一項(xiàng)可以看作逼近誤差,第二項(xiàng)可以看作具有懲罰參數(shù)β=2σ2θ的稀疏約束,從而將字典的最大似然估計(jì)轉(zhuǎn)換成求解最優(yōu)化問題。根據(jù)式(10)和式(5)可以完成字典D的學(xué)習(xí)以及稀疏表示s的求解。 在信號(hào)處理過程中經(jīng)常將一個(gè)較長信號(hào)分割成若干固定長度信號(hào)段。在分割過程中,時(shí)間序列中的特征模式會(huì)由于信號(hào)段長度的不同而被“移動(dòng)”到信號(hào)段內(nèi)的不同時(shí)間位置。由于稀疏編碼將時(shí)間序列表示成基函數(shù)的加權(quán)和,而為了表示被移動(dòng)的特征模式,就必須在字典中構(gòu)造同一基函數(shù)在不同時(shí)間位置的若干實(shí)例。然而,同一基函數(shù)在不同時(shí)間位置的實(shí)例仍然對(duì)應(yīng)于同一信號(hào)事件。因此,需要引入移不變稀疏編碼算法來解決同一基函數(shù)在不同時(shí)間位置的實(shí)例仍對(duì)應(yīng)相同事件的難題。 移不變稀疏編碼模型通過在原稀疏編碼模型中引入附加參數(shù)來滿足其“移不變”的特性: (11) 式中:Tl為移位算子,將基函數(shù)在位置范圍l∈[-L,L]內(nèi)移動(dòng);sk,j是移動(dòng)到位置l處的基函數(shù)dk的系數(shù);向量ε仍舊假設(shè)為高斯噪聲。 移不變稀疏編碼的系數(shù)求解與字典學(xué)習(xí)算法可從標(biāo)準(zhǔn)稀疏編碼的對(duì)應(yīng)算法得到。給定有限數(shù)據(jù)集X={x1,x2,…,xN},并假設(shè)基函數(shù)服從均勻分布,基函數(shù)與其對(duì)應(yīng)系數(shù)的最大后驗(yàn)概率估計(jì)器為: (12) Subject to C (13) 式中,卷積算子 *是式(11)中移位算子Tl的一個(gè)特例;sk,j∈RM-K+1是基函數(shù)dk在信號(hào)xi中的稀疏激活;C定義了一個(gè)約束,防止求解的dk太大而sk,j太小。當(dāng)設(shè)定變量d不變時(shí),可以基于凸優(yōu)化方法求解s,同理,當(dāng)設(shè)定變量s不變時(shí),可基于凸優(yōu)化求解d。字典學(xué)習(xí)可通過迭代地交替求解這兩個(gè)問題來實(shí)現(xiàn);當(dāng)目標(biāo)函數(shù)收斂后,基于學(xué)習(xí)的基函數(shù)可求得稀疏解[15]。 從信號(hào)處理角度來講,稀疏編碼受益于字典學(xué)習(xí)來保證稀疏表示的稀疏性。通過字典學(xué)習(xí),信號(hào)的特征模式被基函數(shù)捕捉;然后通過系數(shù)求解將信號(hào)中以一段時(shí)間序列表示的特征模式代之以一個(gè)非零系數(shù)表示,從而構(gòu)成原信號(hào)的稀疏表示。因此,從理論上講,稀疏編碼可以作為設(shè)備狀態(tài)監(jiān)測(cè)中的一種有效特征提取方法。下面以軸承故障數(shù)據(jù)為例,驗(yàn)證稀疏編碼在振動(dòng)信號(hào)分析中的可行性。 振動(dòng)數(shù)據(jù)取自美國凱斯西儲(chǔ)大學(xué)(Case Western Reserve University, CWRU)的開放數(shù)據(jù)集[16]。該數(shù)據(jù)集被國內(nèi)外基于狀態(tài)維護(hù)的學(xué)者廣泛使用,被認(rèn)為是測(cè)試和驗(yàn)證設(shè)備狀態(tài)識(shí)別新方法的一個(gè)基準(zhǔn)。軸承試驗(yàn)裝置示意如圖1所示。左側(cè)是一個(gè)2 HP的三相感應(yīng)電動(dòng)機(jī)(型號(hào):Reliance Electric 2HP IQPreAlert),右側(cè)是用于產(chǎn)生額定負(fù)載的測(cè)力計(jì),二者通過扭矩傳感器自動(dòng)對(duì)準(zhǔn)配合,測(cè)試軸承安裝在電機(jī)驅(qū)動(dòng)端,振動(dòng)傳感器安裝在電機(jī)的驅(qū)動(dòng)端上側(cè)。 圖1 軸承試驗(yàn)裝置示意圖 為了模擬軸承故障,分別在軸承的內(nèi)圈、外圈(6∶00, 3∶00,12∶00方向)及滾動(dòng)體上采用電火花加工的方式引入單點(diǎn)缺陷。缺陷尺寸分別為0.007、0.014、0.021、0.028 英寸,其中前三種尺寸采用SKF6205-2RS JEM型軸承,最后一種尺寸采用NTN 軸承。分別在0、1、2、3 hp 四種負(fù)載下獲取振動(dòng)數(shù)據(jù),采集頻率取12 kHz。 表1 軸承正常狀態(tài)振動(dòng)數(shù)據(jù)列表 軸承正常狀態(tài)下采集的信號(hào)如表1所示,不同故障狀態(tài)下采集的振動(dòng)數(shù)據(jù)如表2所示。為了便于信號(hào)分析,每種軸承狀態(tài)下的振動(dòng)數(shù)據(jù)被分割成包含1 024個(gè)采樣點(diǎn)的數(shù)據(jù)樣本,并對(duì)數(shù)據(jù)樣本邊緣做光滑處理以減少信號(hào)分析中邊緣效應(yīng)。經(jīng)過數(shù)據(jù)分割,表1中每種工況下的正常數(shù)據(jù)樣本為236個(gè),表2中不同工況及故障類型下的數(shù)據(jù)樣本為128個(gè),共計(jì)8024個(gè)數(shù)據(jù)樣本。不失一般性地,負(fù)載為0 hp的正常及不同故障類型下的樣本數(shù)據(jù)中隨機(jī)抽取一半用于振動(dòng)數(shù)據(jù)字典學(xué)習(xí),所抽取數(shù)據(jù)樣本標(biāo)號(hào)末尾以“?”符號(hào)標(biāo)記,剩余數(shù)據(jù)樣本標(biāo)號(hào)末尾以“”符號(hào)標(biāo)記。 表2 故障狀態(tài)下的軸承振動(dòng)數(shù)據(jù)列表 從機(jī)械診斷學(xué)角度講,瞬時(shí)振動(dòng)脈沖波動(dòng)攜帶了重要的診斷信息,是設(shè)備狀態(tài)識(shí)別的重要依據(jù)。因此,捕捉和分析瞬時(shí)振動(dòng)脈沖是振動(dòng)信號(hào)處理和特征提取的目的之一。如果能夠通過字典學(xué)習(xí)出振動(dòng)信號(hào)中的瞬時(shí)脈沖作為基函數(shù),無疑會(huì)促進(jìn)稀疏編碼對(duì)振動(dòng)信號(hào)的特征提取。分別對(duì)表1與表2所抽取的振動(dòng)樣本數(shù)據(jù)(末尾以“?”符號(hào)標(biāo)記)進(jìn)行字典學(xué)習(xí)。指定基函數(shù)長度為80,每個(gè)字典中基函數(shù)個(gè)數(shù)為10??紤]到信號(hào)分割瞬時(shí)脈沖可能出現(xiàn)在信號(hào)段內(nèi)的任意位置,采用基于移不變稀疏編碼模型算法[14]進(jìn)行字典學(xué)習(xí),并進(jìn)行稀疏求解。所學(xué)習(xí)出的振動(dòng)信號(hào)字典如圖2所示,從每一類振動(dòng)數(shù)據(jù)中學(xué)習(xí)出的10個(gè)函數(shù)被標(biāo)記為子字典Di(i∈[1,15]) 圖2 從每一類軸承振動(dòng)數(shù)據(jù)中學(xué)習(xí)出的字典(圖中每一個(gè)子字典Di,從對(duì)應(yīng)的數(shù)據(jù)樣本學(xué)習(xí)得到) 圖3 原始振動(dòng)信號(hào)及其時(shí)域頻譜圖 從圖2可以看出:從軸承正常狀態(tài)振動(dòng)數(shù)據(jù)中學(xué)習(xí)出的基函數(shù)明顯有別于從故障狀態(tài)振動(dòng)數(shù)據(jù)中學(xué)習(xí)出的基函數(shù),且沒有明顯的劇烈瞬時(shí)脈沖;從內(nèi)外圈故障振動(dòng)數(shù)據(jù)學(xué)習(xí)到的基函數(shù)波形比球故障振動(dòng)數(shù)據(jù)的基函數(shù)波形更集中一些。這些不同可以從脈沖產(chǎn)生的機(jī)理來解釋: (1) 軸承在正常狀態(tài)下,滾動(dòng)體在內(nèi)外圈包圍的滾道內(nèi)平穩(wěn)滾動(dòng),沒有沖擊產(chǎn)生。因而,軸承正常狀態(tài)下的振動(dòng)信號(hào)無明顯的瞬時(shí)脈沖波動(dòng),但可能存在軸承剛性非線性、不同滾動(dòng)體承載非線性或電機(jī)其他干擾源等因素,故會(huì)有均勻的微弱振動(dòng)脈沖產(chǎn)生; (2) 當(dāng)內(nèi)圈或外圈出現(xiàn)損傷時(shí),均勻排列的滾動(dòng)體在滾道內(nèi)滾動(dòng)過程中會(huì)依次循環(huán)撞擊損傷部位,因此,振動(dòng)信號(hào)中會(huì)周期性地產(chǎn)生瞬時(shí)脈沖波動(dòng)。 (3) 當(dāng)損傷部位是在滾動(dòng)體上時(shí),每次損傷部位與內(nèi)外圈滾道的撞擊時(shí)間、撞擊角度都是隨機(jī)的,因此,振動(dòng)信號(hào)雖然幅值較大,但無明顯規(guī)律。不同軸承狀態(tài)下的振動(dòng)信號(hào)的波形特點(diǎn)決定了學(xué)習(xí)出的基函數(shù)具有不同的結(jié)構(gòu)特點(diǎn)。 為了驗(yàn)證所學(xué)習(xí)出的字典的有效性,我們采用這些字典來求解振動(dòng)信號(hào)的稀疏表示。不失一般性地,從內(nèi)圈故障數(shù)據(jù)樣本集I070中抽取一個(gè)信號(hào)樣本進(jìn)行稀疏表示的求解。該信號(hào)樣本原始波形和時(shí)頻譜如圖3所示。采用從同類振動(dòng)數(shù)據(jù)I070中學(xué)習(xí)出的字典Di求解該信號(hào)的稀疏表示,結(jié)果如圖4所示。字典Di中的10個(gè)基函數(shù)依次豎直排列在圖4中左側(cè),與之水平對(duì)應(yīng)的右側(cè)是各個(gè)基函數(shù)在原振動(dòng)信號(hào)中的稀疏激活。稀疏激活中的每個(gè)尖峰表示對(duì)應(yīng)的基函數(shù)在橫軸所示的位置被激活,尖峰的幅值大小表示基函數(shù)的強(qiáng)度。由圖4不難看到,稀疏表示中僅有少量的非零脈沖。 圖4 基函數(shù)及其稀疏激活 根據(jù)式(1)所示的稀疏編碼模型可知,一個(gè)原始振動(dòng)信號(hào)可由基函數(shù)及其稀疏激活進(jìn)行重構(gòu),結(jié)果見圖5。對(duì)比圖3和圖5,不難看到:振動(dòng)信號(hào)被很好的復(fù)原,時(shí)域波形上的瞬時(shí)脈沖更加突出,時(shí)頻譜上的高頻信號(hào)成分的周期性也更加明顯。這一結(jié)果與稀疏編碼模型中的高斯噪聲假設(shè)有關(guān),由于信號(hào)重構(gòu)僅利用基函數(shù)與稀疏激活,假設(shè)噪聲的成分被剔除,這在一定程度上起到了噪聲抑制的作用。上述信號(hào)分析過程驗(yàn)證了從振動(dòng)信號(hào)中學(xué)習(xí)出的字典有效性。 圖5 重構(gòu)振動(dòng)信號(hào)及其時(shí)頻譜圖 上述稀疏編碼算法以及針對(duì)振動(dòng)信號(hào)的稀疏表示,可以直接用于基于狀態(tài)的設(shè)備狀態(tài)監(jiān)控以及故障診斷。以美國凱斯西儲(chǔ)大學(xué)公開的數(shù)據(jù)集為例,進(jìn)行基于稀疏編碼的人工軸承故障診斷實(shí)驗(yàn)分析研究。 將圖4中基函數(shù)的稀疏激活取絕對(duì)值并在沿縱軸方向進(jìn)行疊加,從而得到所有基函數(shù)在振動(dòng)信號(hào)時(shí)間段內(nèi)的激活統(tǒng)計(jì),如圖6所示。從圖中下側(cè)可以看到,在橫軸方向上尖峰出現(xiàn)的位置對(duì)應(yīng)于上側(cè)的原始信號(hào)中的瞬時(shí)脈沖,并且其周期性更加明顯。從稀疏激活的絕對(duì)值統(tǒng)計(jì)圖中可以很容易地估計(jì)出脈沖出現(xiàn)的周期,經(jīng)實(shí)際計(jì)算所得平均周期為0.006 2 s。這一周期對(duì)應(yīng)著軸承內(nèi)圈損傷時(shí)的通過頻率162.2 Hz。 圖6 基函數(shù)稀疏激活絕對(duì)值之和(內(nèi)圈損傷) 圖7 基函數(shù)稀疏激活絕對(duì)值之和(外圈損傷) 圖8 基函數(shù)稀疏激活絕對(duì)值之和(滾動(dòng)體損傷) 以上分析說明,稀疏編碼在振動(dòng)信號(hào)分析中的應(yīng)用與常規(guī)的人工機(jī)械設(shè)備診斷方法相一致,從而進(jìn)一步驗(yàn)證了稀疏編碼可以作為一種有效的振動(dòng)信號(hào)分析工具。 受設(shè)備維護(hù)人員憑借聽覺系統(tǒng)所實(shí)現(xiàn)的生物本能診斷能力的啟發(fā),本文借鑒生物感知系統(tǒng)“冗余度壓縮”的信息處理原則,引入神經(jīng)科學(xué)研究中的稀疏編碼算法,提出了連續(xù)長時(shí)間采樣時(shí)振動(dòng)信號(hào)有效特征提取方法。詳細(xì)闡述了稀疏編碼的理論背景、算法和模型,特別對(duì)稀疏編碼相關(guān)的字典學(xué)習(xí)與稀疏表示求解進(jìn)行了深入的分析總結(jié)。通過將稀疏編碼應(yīng)用于軸承振動(dòng)信號(hào)分析,驗(yàn)證了其在挖掘振動(dòng)信號(hào)中設(shè)備狀態(tài)信息的有效性。基于人工軸承故障數(shù)據(jù)集進(jìn)行的實(shí)驗(yàn)驗(yàn)證表明:基于稀疏編碼的振動(dòng)信號(hào)特征提取算法不僅能有效提取設(shè)備狀態(tài)特征,而且稀疏特征具有良好的可分性。該方法可用于設(shè)備故障診斷,為基于狀態(tài)的設(shè)備智能維護(hù)提供有效工具。 [1]Jardine A K S, Lin D, Banjevic D. A review on machinery diagnostics and prognostics implementing condition-based maintenance[J]. Mechanical systems and signal processing, 2006, 20(7): 1483-1510. [2]Barlow H B. Possible principles underlying the transformation of sensory messages [J]. Sensory communication, 1961: 217-234. [3]F?ldiák P. Forming sparse representations by local anti-hebbian learning [J]. Biological cybernetics, 1990, 64(2): 165-170. [4]Olshausen B A. Emergence of simple-cell receptive field properties by learning a sparse code for natural images [J]. Nature, 1996, 381(6583): 607-609. [5]Olshausen B A, Field D J. Sparse coding of sensory inputs [J]. Current opinion in Neurobiology, 2004, 14(4): 481-487. [6]Smith E C, Lewicki M S. Efficient auditory coding [J]. Nature, 2006, 439(7079): 978-982. [7]尚麗.稀疏編碼算法及其應(yīng)用研究[D]. 合肥:中國科學(xué)技術(shù)大學(xué), 2004. [8]劉海寧. 基于稀疏編碼的設(shè)備狀態(tài)識(shí)別及其重型軋輥磨床監(jiān)測(cè)應(yīng)用[D].上海交通大學(xué),2011. [9]Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2009, 31(2): 210-227. [10]Davis G, Mallat S, Avellaneda M. Adaptive greedy approximations [J]. Constructive approximation, 1997, 13(1): 57-98. [11]Mallat S G, Zhang Z. Matching pursuits with time-frequency dictionaries [J]. Signal Processing, IEEE Transactions on, 1993, 41(12): 3397-3415. [12]Pati Y C, Rezaiifar R, Krishnaprasad P. Orthogonal matching pursuit: recursive function approximation with applications to wavelet decomposition[C]1993, IEEE. 40-44 vol. 1. [13]Lewicki M S, Sejnowski T J. Learning overcomplete representations [J]. Neural Computation, 2000, 12(2): 337-365. [14]Lewicki M S, Olshausen B A. Probabilistic framework for the adaptation and comparison of image Codes [J]. JOSA A, 1999, 16(7): 1587-1601. [15]Grosse R, Raina R, Kwong H, et al. Shift-invariant sparse coding for audio classification [J]. Cortex, 2007, 9: 8. [16]Loparo K, Bearings vibration data set[D]. Case Western Reserve University, 2003.1.2 系數(shù)求解與字典學(xué)習(xí)
1.3 移不變稀疏編碼
2 基于稀疏編碼的振動(dòng)信號(hào)分析
2.1 軸承振動(dòng)數(shù)據(jù)獲取
2.2 軸承振動(dòng)信號(hào)字典學(xué)習(xí)
2.3 振動(dòng)信號(hào)的稀疏編碼分解與重構(gòu)
3 基于稀疏編碼的人工軸承故障診斷實(shí)驗(yàn)研究
4 結(jié) 論