朱會杰, 王新晴, 芮挺, 李艷峰, 王東
(1.解放軍理工大學 野戰(zhàn)工程學院, 江蘇,南京 210007; 2.總裝工程兵科研一所, 江蘇,無錫 214035)
?
多尺度移不變稀疏編碼及其在機械故障診斷中的應用
朱會杰1,2, 王新晴1, 芮挺1, 李艷峰1, 王東1
(1.解放軍理工大學 野戰(zhàn)工程學院, 江蘇,南京 210007; 2.總裝工程兵科研一所, 江蘇,無錫 214035)
提出了一種融合多尺度信息的高效移不變稀疏編碼算法,并用于機械故障診斷. 將移不變稀疏編碼作為分類器應用于故障診斷,直接對振動信號進行訓練和識別,不需要提取特征和預處理. 為進一步提升效果,將不同尺度的移不變稀疏編碼分類器融合在一起. 經實驗驗證,即使在訓練樣本和測試樣本負載不同的情況下,文中方案仍然能夠以較高的準確率識別出軸承的故障位置和程度. 與其他方法相比,文中方法的準確率、魯棒性更高,具有一定的工程應用價值.
移不變稀疏編碼;多尺度;故障診斷;字典學習
故障診斷對提高生產效率、經濟效益,防止事故發(fā)生具有重要意義. 在機械故障診斷中,特征提取與模式識別是核心. 人工選取特征是一件非常費時和困難的工作,往往需要專業(yè)知識才能提取較好的特征[1]. 若能讓機器直接使用原始振動信號自動學習一個分類器并進行故障診斷,將會大大降低實際操作的難度. 此外,測試樣本的負載與訓練樣本的負載往往是不同的,還要求診斷方法對負載變化具有魯棒性,給常規(guī)方法帶來巨大挑戰(zhàn).
為了提高機械故障診斷效果,近幾年研究人員嘗試了不少新方法. Xu等[1]使用EMD和能量熵來提取特征,之后采用粒子群優(yōu)化的支持向量機對軸承故障進行診斷. 由于隱馬爾可夫模型(hidden Markov models, HMM)對復雜隨機序列具有良好的描述能力;Boutros等[2]使用HMM和K-均值算法對機械振動信號進行識別;Zhao等[3]使用補充的集成經驗模態(tài)分解算法和時間序列算法對振動信號建模,然后使用HMM對機器狀態(tài)識別. 盡管這些方法都有不錯的表現(xiàn),但仍需要人工提取特征和設計合適的分類器,需要大量的人工工作、專業(yè)知識.
近些年來,由壓縮感知所發(fā)展而來的稀疏編碼將信號表示成一組過完備基的稀疏線性組合,通過自學習實現(xiàn)對信號的最簡潔表達. 稀疏編碼已經成為神經學、信號處理、圖像識別等領域的一種基礎而且有效的技術[4]. 經Wright等[5]的實驗驗證,稀疏編碼還是一種魯棒性強、直觀性好的模式識別方法. 基于稀疏編碼的模式識別可以直接對原始樣本進行學習,不需要挑選特征,減輕了操作者的工作量,而且往往能取得更優(yōu)的結果.
對于時間序列信號,比如機械振動信號、人聲、音樂等,每次截取的信號片段中的特征分布位置是隨機的,使用常規(guī)的稀疏編碼算法對同一特征進行學習,需要考慮該特征位于不同位置的情況,如果樣本不充足則給學習帶來困難[6]. 一些學者通過使用一種移不變稀疏編碼(shift invariant sparse coding,SISC)的技術,將信號稀疏地表示成基與系數(shù)的卷積,解決了時間序列信號稀疏表示的問題. Liu等[7]首次將SISC應用于機械故障診斷,驗證了該方法優(yōu)于常規(guī)算法. 但他的方案還需要設計合適的分類器,而且計算效率和準確率還有提高的空間.
針對此,文中提出了一種多尺度SISC的故障診斷方案. 通過依次對每個基進行優(yōu)化[8],將復雜的優(yōu)化問題轉化為一個小規(guī)模線性方程組,加快了計算. 由生物學和神經學可知,人類在模式識別時綜合利用了不同尺度的信息以提高識別準確率和魯棒性. 受此啟發(fā),文中通過提取多尺度的信息,然后使用證據(jù)理論(evidential theory,ET)[9]進行信息融合,以期得到更優(yōu)的故障診斷結果.
1.1 SISC簡介
(1)
式中:*表示卷積,編碼系數(shù)xm,k∈P是稀疏的;ε為高斯白噪聲;Q 根據(jù)最大后驗概率估計求取sk最稀疏的表達,評價sk稀疏程度的代價函數(shù)為 (2) 然而,SISC中的基可以在整個信號中平移,相對于常規(guī)稀疏編碼,SISC的系數(shù)矩陣增加了一個維度,給求解增加了難度. 許多學者研究了求解SISC的方法,Smith[6]和Blumensath[10]直接基于梯度對基進行更新,Tang等[11]先將信號轉化到頻域,再利用梯度求解最優(yōu)的基. 但這些優(yōu)化算法精度較低,迭代步長難以精確選擇. 1.2 高效SISC算法 吸取K-SVD依次更新每個基的思想,文中使用的SISC在字典學習階段也依次更新各個基,并抽取非零系數(shù)項,可以進一步縮小問題規(guī)模. 通過轉化為一個小規(guī)模線性方程組進行求解,加快了收斂速度. 在系數(shù)更新階段,采用了高效的OMP算法,此外,還可以借助于batch-OMP進一步提高計算效率. 下面主要介紹字典更新方法. 在字典更新階段保持系數(shù)不變,僅對基進行更新,由于系數(shù)項不參與更新,該稀疏代價函數(shù)可以簡化為 (3) 式中Ei,k為第k個信號除去第i個基外的所有誤差. 由于di*xi,k=xi,k*di,首先僅分析只有第k個信號時的優(yōu)化問題,相當于求解式(4)的解 (4) (5) 將式(5)簡寫為Xdi=E,則根據(jù)最小二乘法可得di=(XTX)-1(XTE),而矩陣XTX∈Q×Q,從而將問題轉化為一個小規(guī)模的線性方程組的解. 這一求解過程可以通過Cholesky分解、LU分解等方法直接求取最優(yōu)值. 1.3 移不變稀疏編碼分類器 稀疏編碼還是一種魯棒性強、直觀性好的模式識別方法,該方法已經在人臉識別、聲音識別中得到了成功的應用.Wright等[5]將分類問題轉化為最優(yōu)稀疏表示問題,首次把稀疏表示分類方法用于人臉識別并取得了良好的效果;Yang等[5]基于字典學習提出了一個更高效更穩(wěn)健的稀疏識別方法:Metaface方法.Metaface分別對每類樣本學習一組字典,從而減少字典規(guī)模且降低了噪聲干擾.Metaface將所有類別的字典合并為一個大的冗余字典,使用該冗余字典求解測試樣本的稀疏編碼系數(shù),并求取樣本在各個類別的子字典上的重構誤差,把與測試樣本具有最小誤差的子字典的類別作為目標類別. 雖然文中是基于移不變稀疏編碼,但仍采用了類似Metaface的思路. 為了不破壞各個子字典構成的空間,沒有將子字典進行合并,而是限定稀疏度T0下,依次使用各個子字典對測試樣本進行稀疏表示. 當樣本的類別與子字典的類別一致時,重構誤差應該最小,即將具有最小重構誤差的字典類別作為測試樣本的類別. 將該分類器稱之為移不變稀疏編碼分類器(SISCclassification,SISCC). 1.4 融合多尺度的SISCC 實測的機械振動信號常受到大量噪聲污染,并且可供訓練的樣本數(shù)量有限,有必要進一步提高稀疏編碼的分類能力. 一些學者在字典學習的優(yōu)化準則中添加了辨別性的限制條件,增大不同類別信號之間的編碼分布. 但這導致一些快速的字典學習方法無法使用,大幅增加了計算量. 由精神學和神經學領域的一些研究表明,面對未知對象時,人和其他高等動物會自動提取出目標最有意義的不同尺度的特征,然后把它們組合起來作為識別的依據(jù). 這種融合多尺度特征的思想已在故障診斷上得到了應用,提升了識別效果. 對于振動信號而言,不同長度的基具有不同的物理意義. 當旋轉機械中的某個部件發(fā)生單點故障時,會引起周期性的沖擊振蕩. 當基的長度等價于一個沖擊衰減時,則該基主要包含單個沖擊振蕩的特性. 而當基的長度等價于兩個沖擊衰減時,則基不僅包含單個沖擊振蕩的特性,還包含沖擊周期的相關信息. 文中選擇不同長度的基來構造多個不同的SISCC,一組長度相同的基對應于一個分類器,每個分類器都要分別對每類樣本單獨進行字典學習,得到該類對應的子字典. 定義第q(1≤q≤Q)個SISCC分類器中第l(1≤l≤L)個子字典Dl對測試樣本sk的重構率為 (6) 式中:1≤l≤L為類別;L為類別總數(shù). 然后將同一個分類器的所有重構率進行歸一化: (7) (8) 從而根據(jù)最大概率判斷出測試樣本的類別. 融合多尺度的SISCC步驟如下. ① 初始化參數(shù). 設定每個SISCC中基的長度hl,每類字典基的個數(shù)L和稀疏度T,并將訓練樣本的能量歸一化. ② 字典學習. 針對每個SISCC,按照訓練樣本的類別依次進行子字典學習,為每類樣本學習到一個子字典. ③ 依次使用各個SISCC對測試樣本進行識別. 對于第q個SISCC,使用該分類器的L個子字典依次對測試樣本進行編碼和重構,并將所有重構率進行歸一化. 最終得到每個分類器的每個子字典所對應的重構率: ④ 使用證據(jù)理論融合Q個分類器的判斷,并輸出最終判別結果. 2.1 在軸承故障診斷中的應用2.1.1 實驗介紹 文中使用西儲大學軸承數(shù)據(jù),該數(shù)據(jù)被認為是檢驗機械故障診斷方法的基準. 使用電火花加工技術分別在軸承外圈(3點鐘、6點鐘、12點鐘方向)、內圈、滾動體上布置了單點故障,故障直徑分別為0.007,0.014,0.021,0.028 in(1 in=2.54 cm),每種狀態(tài)都分別在負載為0,1,2,3 hp(1 hp=746 W)的工況下分別測試,轉速分別對應于1 797,1 772,1 750,1 730 r/min. 信號的采樣頻率為12 kHz. 為了能夠同時區(qū)分出故障類型和故障程度,將數(shù)據(jù)分為16類,每一類數(shù)據(jù)都包含負載為0,1,2,3 hp 4種工況,數(shù)據(jù)與類別的對應關系見表1. 表1中IR、B與OR分別為內圈、球和外圈故障,其后的數(shù)字代表了故障程度,@表示故障點所處方位. 比如,OR007@6表示軸承外圈故障,故障直徑為0.007 in,故障點位于6點鐘方向. 將每個數(shù)據(jù)無重疊地分割為長度為2048點的樣本,正常狀態(tài)下的一個數(shù)據(jù)大約可以分割為118個樣本,故障工況的每個數(shù)據(jù)大約可以分割為59個樣本. 表1 數(shù)據(jù)與類別的對應關系 2.1.2 實驗分析 共使用3個尺度的SISCC,3個SISCC中基的長度分別為80、160和240點,稀疏度T分別26、19和15,每個子字典學習15個基. 首先從負載為0 hp的每類數(shù)據(jù)中隨機抽取20個樣本作為訓練樣本,依次使用3個SISCC進行字典學習,每個SISCC學習到16個類別的子字典. 圖1為不同狀態(tài)、不同尺度的部分基的波形,由于篇幅有限,這里僅列出了正常、外圈故障(OR007@6)、內圈故障(IR007)和球故障(B007)4類,同一類同一個尺度僅畫出了一個基的波形. 由圖1可知,不同狀態(tài)下基的波形有明顯的差異,不同尺度的基也有很大的差異. 尺度1(80點)的基僅包含單個沖擊的特性,隨著基的長度的增加,還包含了沖擊的周期信息,但對單個基刻畫的細致程度不如尺度1. 此外還使用尺度2(160點)下的上述4類字典對4類測試樣本分別進行了重構,重構的時域波形如圖2所示,方框內的信號重構效果最優(yōu). 這說明使用相同類別的子字典對測試樣本進行重構時,重構效果比較好,也說明了文中方案的合理性. 2.1.3 與其他方法的識別結果對比 Liu[7]使用常規(guī)的SISC也分析了相同的數(shù)據(jù),他將SISC的系數(shù)作為特征輸入分類器進行故障識別. 但他使用的測試樣本較多,即從負載為0 hp的每類數(shù)據(jù)中抽取1/2的樣本. 文中僅從負載為0 hp的每類數(shù)據(jù)中抽取20個樣本進行訓練. 使用多尺度SISCC對0 hp負載下的全部的樣本進行識別,結果如圖3. 多尺度SISCC能夠在穩(wěn)定負載下準確地識別軸承的故障位置和程度,僅對球故障數(shù)據(jù)B021的識別有誤差,其余全部達到了100%的準確率. 而Liu的方法的穩(wěn)定性和準確率都較低. 此外,同樣在處理器為dual-core 2.2 GHz和內存為 DDR 667 2 G的電腦上實驗,Liu的方法對樣本訓練的時間大約為16 h,而文中方案需要5 h,在效率上有明顯的提高. 此外,Zhao[3]曾經使用補充的集成EMD算法和時間序列研究了該數(shù)據(jù)庫中負載為0 hp的數(shù)據(jù),但他僅把所有數(shù)據(jù)分為正常、外圈故障、內圈故障、球故障4類,沒有區(qū)分故障的程度,平均準確率為97.5%. 而SISCC雖然對故障位置和程度同時進行了識別,但最低準確率都高于Zhao實驗中的平均準確率. 可見,文中方案是具有一定優(yōu)勢的. 為了滿足實際診斷,還在負載和轉速變化的情況下,測試了文中方案的性能. 分別從0 hp和2 hp負載下的每個信號中隨機抽取15個樣本放入訓練集,共有15×16×2=640個樣本,然后對所有負載下(0,1,2,3 hp,轉速分別為1 797,1 772,1 750,1 730 r/min)共4 379個樣本進行測試. 總體上看,多尺度SISCC能夠在不同負載及轉速下準確地識別出軸承的故障位置和故障程度,滿足了實際需求. Dong等[12]也分析了該數(shù)據(jù)庫的相關數(shù)據(jù),他使用主成分分析提取信號特征,然后使用Morlet核支持向量機進行分類. 他對數(shù)據(jù)Normal、IR007、IR014、IR021和IR028進行了識別,在最好的參數(shù)下準確率能達到100%,與本實驗中對這幾個數(shù)據(jù)的識別準確率一樣. 但本實驗中同時識別了16類狀態(tài),難度更大. 本方案最突出的優(yōu)勢在于可以直接對原始樣本進行訓練并識別,不需要人工挑選特征,減輕了使用者的工作量,不易受人的主觀影響. 為了更全面地評價多尺度SISCC的性能,還使用單一尺度的SISCC做了上面的實驗,平均識別結果如圖4所示. 可以看出,多尺度SISCC準確率最高. 2.2 在液壓泵故障實驗中的應用 實驗采用的液壓泵為25MCY14-1B型軸向柱塞泵,通過采集端蓋振動信號對其進行狀態(tài)識別,共設正常、配流盤磨損、缸體磨損和柱塞松靴4種狀態(tài),配流盤是實際磨損的配流盤,缸體故障尺寸為0.5 mm深、0.2 mm寬,松靴間隙約為0.25 mm. 泵轉速約為900 r/min,采樣頻率為10 kHz,柱塞個數(shù)為7個,每個樣本長度為2 048個點. 由于柱塞一次沖擊約相當于95個點,SISCC中基的長度分別選為90、135、180個點,3個尺度的稀疏度分別為25、18、13. 從每類信號中隨機選擇20個樣本作為訓練樣本,選擇100個樣本作為測試樣本. 實驗10次做平均,正常、配流盤磨損、缸體磨損和柱塞松靴4種狀態(tài)的準確率分別為100.0%,90.25%,93.25%和98.5%. 可見,多尺度SISCC仍然有不錯的表現(xiàn),再次驗證了該方案適用于機械故障診斷. 針對機械振動信號的性質,通過選擇不同長度的基來構造具有不同物理含義的SISCC,然后使用證據(jù)理論融合多尺度的信息以提高診斷魯棒性和準確率. 經實驗驗證,融合多尺度的SISCC能夠準確地識別出軸承的故障,即使負載發(fā)生變化時也依然有比較好的效果. 與其他學者的結果比較來看,文中方案提高了準確率,減少了人工工作量,降低了診斷難度,具有一定的應用價值. [1] Xu H, Chen G. An intelligent fault identification method of rolling bearings based on LSSVM optimized by improved PSO[J]. Mechanical Systems and Signal Processing, 2013,35(1):167-175. [2] Boutros T, Liang M. Detection and diagnosis of bearing and cutting tool faults using hidden markov models[J]. Mechanical Systems and Signal Processing, 2011,25(6):2102-2124. [3] Zhao L, Yu W, Yan R. Rolling bearing fault diagnosis based on CEEMD and time series modeling[J]. Mathematical Problems in Engineering, 2014, 2014: 13. [4] Olshausen B A. Emergence of simple-cell receptive field properties by learning a sparse code for natural images[J]. Nature, 1996,381(6583):607-609. [5] Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227. [6] Smith E C, Lewicki M S. Efficient auditory coding[J]. Nature, 2006,439(7079):978-982. [7] Liu H, Liu C, Huang Y. Adaptive feature extraction using sparse coding for machinery fault diagnosis[J]. Mechanical Systems and Signal Processing, 2011,25(2):558-574. [8] Aharon M, Elad M, Bruckstein A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation[J]. Signal Processing, IEEE Transactions on, 2006,54(11):4311-4322. [9] Jousselme A L, Maupin P. Distances in evidence theory: comprehensive survey and generalizations[J]. International Journal of Approximate Reasoning, 2012,53(2):118-145. [10] Blumensath T, Davies M. Sparse and shift-invariant representations of music[J]. Audio, IEEE Transactions on Speech, and Language Processing, 2006,14(1):50-57. [11] Tang H, Chen J, Dong G. Sparse representation based latent components analysis for machinery weak fault detection[J]. Mechanical Systems and Signal Processing, 2014,46(2):373-388. [12] Dong S, Sun D, Tang B, et al. A fault diagnosis method for rotating machinery based on PCA and morlet kernel SVM[J]. Mathematical Problems in Engineering, 2014:8. (責任編輯:孫竹鳳) Multi Scale Shift Invariant Sparse Coding for Robust Machinery Diagnosis ZHU Hui-jie1,2, WANG Xin-qing1, RUI Ting1, LI Yan-feng1, WANG Dong1 (1.PLA University of Science and Technology, Nanjing, Jiangsu 210007, China; 2.The First Engineering Scientific Research Institute of General Armaments Department, Wuxi, Jiangsu 214035, China) An efficient shift invariant sparse coding (SISC) algorithm which combined multi scale information was proposed for machinery fault diagnosis. The SISC was applied as a classifier for fault diagnosis, and it could directly train and recognize the vibration signals without feature extraction or pre-processing. What’s more, multi scale SISC classifiers were combined for better performance. Validated by experiments, although the loads of training samples and testing samples were not the same, this scheme could still precisely determine the fault location as well as the severity of fault for bearings. Compared with other methods, the proposed algorithm shows high accuracy , strong robustness and a certain value for engineering application. shift invariant sparse coding; multi scale; fault diagnosis; dictionary learning 2014-09-29 國家自然科學基金資助項目(61472444,61472392) 朱會杰(1987—),男,博士,E-mail:zhuhuijiehao@163.com. 芮挺(1972—),男,副教授,E-mail:rtinguu@sohu.com. TN 165.3 A 1001-0645(2016)01-0019-06 10.15918/j.tbit1001-0645.2016.01.0042 融合多尺度的SISCC在機械故障中的應用
3 結束語