郭家昕 程軍圣 楊 宇
1.湖南大學(xué)機(jī)械與運(yùn)載工程學(xué)院,長沙,4100822.汽車車身先進(jìn)設(shè)計(jì)制造國家重點(diǎn)實(shí)驗(yàn)室,長沙,410082
滾動軸承作為關(guān)鍵零部件被廣泛應(yīng)用于機(jī)電設(shè)備,滾動軸承出現(xiàn)故障常會造成嚴(yán)重的事故和經(jīng)濟(jì)損失,因此,開展?jié)L動軸承故障診斷研究具有重要意義。
滾動軸承的傳統(tǒng)智能診斷方法普遍存在依靠專家知識以及人工提取數(shù)據(jù)特征工作量大的問題,近年來,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為一種經(jīng)典深度學(xué)習(xí)模型[1],可以自主深度挖掘數(shù)據(jù)特征,成為了滾動軸承智能診斷領(lǐng)域的研究熱點(diǎn)。然而,CNN模型在訓(xùn)練過程中存在參數(shù)爆炸、梯度擴(kuò)散和反向傳播計(jì)算成本高的缺點(diǎn)[2-7],這導(dǎo)致其在滾動軸承故障診斷領(lǐng)域的應(yīng)用中存在訓(xùn)練時間較長、訓(xùn)練小樣本數(shù)據(jù)易出現(xiàn)過擬合的問題[8]。針對以上問題,CHAN等[9]提出了一種基于CNN的簡單深度學(xué)習(xí)模型,即主成分分析網(wǎng)絡(luò)(principal component analysis network,PCAnet)模型,該模型由卷積層中的PCA濾波器組、非線性處理層中的哈希編碼以及輸出層中的級聯(lián)塊狀直方圖組成。PCAnet模型相比于CNN模型,結(jié)構(gòu)有所簡化,無需反向傳播,訓(xùn)練參數(shù)大大減少,一定程度上解決了梯度消失、梯度擴(kuò)散、訓(xùn)練時間長的問題以及訓(xùn)練樣本少時效果不佳的問題。
滾動軸承故障診斷領(lǐng)域中,絕大多數(shù)振動信號的各類時頻圖均是彩色圖像,即列、行、色彩模式的三階張量,其中蘊(yùn)含了豐富的原始信號空間結(jié)構(gòu)信息。傳統(tǒng)的PCAnet模型及其同類方法對圖像進(jìn)行分類時,均先將多維張量對象轉(zhuǎn)化成一維向量,再對其進(jìn)行特征提取,而一維向量則會不可避免地破壞多維圖像中的空間結(jié)構(gòu),同時也可能造成維度災(zāi)難[10],因此這種方法在對多維圖像進(jìn)行自動特征提取時表現(xiàn)欠佳。針對PCAnet模型的這一缺點(diǎn),WU等[11]提出了多線性主成分分析網(wǎng)絡(luò)(mutilinear principle component analysis networks,MPCAnet)模型,該模型是對PCAnet的張量擴(kuò)展,它從多維空間中提取了圖像的高級語義特征,有效地利用了多維圖像空間結(jié)構(gòu)關(guān)系,從而使自動提取的特征盡可能最小化張量對象的類內(nèi)不變性。MPCAnet卷積層中的MPCA濾波器組對高階張量對象進(jìn)行處理時不需要對其進(jìn)行向量化展開,直接輸出低維的同階張量,保留了高階結(jié)構(gòu),需要估計(jì)的參數(shù)更少且計(jì)算要求更低[12],同時越來越多的學(xué)者也證明了張量形式更適合對多維圖像進(jìn)行分類識別[13]。實(shí)踐證明,MPCAnet在多維圖像的分類中取得了更好的效果,僅一層的MPCAnet的分類準(zhǔn)確率就超過了兩層的PCAnet[11]。
目前絕大多數(shù)基于圖像分類的滾動軸承故障診斷方法,其分類對象都是由運(yùn)行設(shè)備的原始振動信號經(jīng)過時頻分析產(chǎn)生的時頻圖,工程實(shí)際中的原始振動信號通常存在噪聲干擾,具有非平穩(wěn)和非線性的特點(diǎn),而MPCAnet在提取數(shù)據(jù)深層特征時忽略了特征間的非線性關(guān)系,不能保證原數(shù)據(jù)特征線性可分,特征聚類性一般。由于非線性擬合能力較差,所以模型需要更多的訓(xùn)練樣本數(shù)據(jù),而工程實(shí)際中滾動軸承的故障樣本往往很難獲得。針對這一問題,本文在MPCAnet的基礎(chǔ)上引入核(Kernel)變換,將原始數(shù)據(jù)特征映射到了高維核空間實(shí)現(xiàn)高度線性可分[14],同時進(jìn)行降維并訓(xùn)練得到濾波器組。改進(jìn)后的模型僅需要少量樣本數(shù)據(jù)就可以提取到聚類性較強(qiáng)的高維圖像深層特征,泛化能力進(jìn)一步增強(qiáng),一定程度上解決了工程實(shí)際應(yīng)用中故障樣本難以獲取的問題。與此同時很大程度上增大了樣本特征之間的差異度,模型的非線性擬合能力得到提高,較原方法的分類精度有所提高。本文提出的改進(jìn)多線性核主成分分析網(wǎng)絡(luò)(multilinear kernal principle component analysis network,MKPCAnet)模型由多線性主成分分析(MPCA)、核主成分分析(KPCA)、二值化哈希層和分塊直方圖四部分組成。將該方法運(yùn)用到不同類型的滾動軸承故障診斷實(shí)例中,結(jié)果表明本文提出的基于MKPCAnet的滾動軸承故障診斷方法具有較高的準(zhǔn)確性和魯棒性。
MPCA是PCA從向量到高階張量的一個延伸[15],PCA是將向量投影到向量,MPCA是將張量投影到張量。MPCA可以比PCA捕獲更多原始張量的變化信息和局部特征,通過多線投影進(jìn)行輸入張量的特征提取。它將原始問題分解為一系列多投影子問題,具有投影結(jié)構(gòu)相對簡單、運(yùn)算量較少的優(yōu)勢,適合處理旋轉(zhuǎn)機(jī)械振動信號三維時頻圖像。
將N階張量表示為X∈RI1×I2×…×IN,由N個指標(biāo)In(n=1,2,…,N)表示,每個指標(biāo)In都是張量X的n-mode。
張量X與矩陣U∈RJn×In的n-mode積定義為
(1)
通過投影矩陣{(V(n))T∈RPn×In,n=1,2,…,N},可以將一組(M個)張量對象{Xm∈RI1×I2×…×IN,m=1,2,…,M}映射為另一組(M個)張量對象{Ym∈RP1×P2×…×PN,m=1,2,…,M},其中Pn Ym=Xm×1(V(1))T×2(V(2))T×…×N(V(N))T (2) m=1,2,…,M 式(2)也可以用矩陣的形式表示如下: Xm(n)=V(n)Ym(n)(V(n+1)?V(n+2)?… ?V(N)?V(1)?V(2)?…?V(n-1))T (3) 式中,?表示kronecker積;Xm(n)為張量Xm的n-mode的展開矩陣;Ym(n)為張量Ym的n-mode展開矩陣。 MPCA的目標(biāo)是確定滿足總張量散射ψY最大化條件的N個投影矩陣{V(n)∈RPn×In,n=1,2,…,N},即 {V(n)}=argmaxV(1),V(2),…,V(N)(ψY) (4) 式(4)的解法如下。令{V(n),n=1,2,…,N}為式(4)的解,其他投影矩陣為V(1),…,V(n-1),V(n+1),…,V(N),矩陣V(n)由Pn個特征向量組成,對應(yīng)于如下矩陣的最大的Pn個特征值: (5) Vφ(n)=V(n+1)?V(n+2)?…V(N)? V(1)?V(2)?…?V(n-1) (6) Xm(n)由式(3)給出。 最終得到了投影矩陣{V(n),n=1,2,…N}和投影后的張量Ym。 本文提出的改進(jìn)多線性主成分分析網(wǎng)絡(luò)模型由MPCA濾波器組、KPCA濾波器組、二值化哈希層以及分塊直方圖層四部分組成,模型結(jié)構(gòu)示意圖見圖1。 圖1 改進(jìn)主成分分析網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖Fig.1 Flowchart of impoved multilinear principal component analysis network 1.2.1第一層卷積:MPCA層 MPCA層對應(yīng)卷積神經(jīng)網(wǎng)絡(luò)中的第一層卷積層,類似于神經(jīng)元局部感受野,起權(quán)值共享的作用。 (7) (8) 1.2.2第二層卷積:KPCA層 MPCA層只進(jìn)行線性變換,非線性擬合能力較差,故引入KPCA算法,當(dāng)其核函數(shù)是非線性核時,能將線性不可分的數(shù)據(jù)映射到高維空間的線性子空間中,使得數(shù)據(jù)線性可分。輸入張量數(shù)據(jù)在MPCA層進(jìn)行卷積操作后得到第一層特征并輸出到第二層,在第二層被映射到高維核空間中進(jìn)行特征學(xué)習(xí)。 KPCA層對應(yīng)卷積神經(jīng)網(wǎng)絡(luò)中的第二層卷積層。所有輸入圖像經(jīng)過第一層變換后得到的特征值矩陣可以看作L1×M幅大小為I1×I2的“圖像”,接著用第二層設(shè)置的大小為k1×k2的濾波器滑塊遍歷每幅圖像Fi∈RI1×I2,i=1,2,…,L1×M,上述k1和k2均為奇數(shù)且1 yi,1,yi,2,…,yi,I1I2∈Rk1k2 (9) 中心化式(9)中的列向量值,得 (10) (11) i=1,2,…,L1M 分別求局部特征矩陣Yi的協(xié)方差矩陣: (12) 接著求取L1M個協(xié)方差矩陣的平均矩陣: (13) (14) 其中,σ是實(shí)參數(shù)。接著對矩陣K取均值可得 (15) (16) Zi,j,h∈RI1×I2 (17) i=1,2,…,M;j=1,2,…,L1;h=1,2,…,L2 1.2.3輸出層:哈希和直方圖 fm= (18) 將網(wǎng)絡(luò)輸出得到的特征向量fm作為SVM分類器的輸入,訓(xùn)練分類器,進(jìn)一步輸入測試圖像進(jìn)行分類。 基于改進(jìn)多線性主成分分析網(wǎng)絡(luò)的滾動軸承故障診斷具體步驟如下: (1)采用加速度傳感器采集滾動軸承原始振動信號,本文選取小波變換的方法將振動信號轉(zhuǎn)化為小波時頻圖。由其他方法變換得到的時頻圖像也可以作為本模型的輸入對象。由于morlet小波的沖擊適應(yīng)性好[17],故本文選用morlet小波作為小波基函數(shù)進(jìn)行連續(xù)小波變換來獲得一維時間振動信號的時頻圖,為減少運(yùn)算量,時頻圖大小統(tǒng)一處理為64×64×3,如圖2所示。 圖2 三階張量小波時頻圖Fig.2 Third-order tensor wavelet time-frequency images (2)根據(jù)不同輸入數(shù)據(jù)集的特性,對比分析確定模型的參數(shù)。MKPCAnet模型參數(shù)包括:每層濾波器數(shù)目、模型層數(shù)、輸出層中局部直方圖塊大小、塊重疊區(qū)域比率以及KPCA層中的高斯核參數(shù)σ。 (3)將三維彩色小波時頻圖作為模型輸入,樣本劃分為訓(xùn)練集和測試集,通過訓(xùn)練集來構(gòu)建最優(yōu)MKPCAnet故障診斷模型,驗(yàn)證測試集識別精度,達(dá)到故障診斷的目的。 實(shí)驗(yàn)1數(shù)據(jù)來自美國凱斯西儲大學(xué)軸承數(shù)據(jù)中心。采用型號為6205-2RS SKF的深溝球軸承,采樣頻率為48 kHz,每4800個采樣點(diǎn)劃分為一個樣本。將樣本進(jìn)行連續(xù)小波變換所用尺度序列的長度設(shè)置為256,尺度范圍為6~1536,得到每個樣本的小波時頻圖。為保證模型性能評價(jià)的客觀全面,數(shù)據(jù)集A用來識別故障類型及故障程度,負(fù)載設(shè)置為0HP,共1000個樣本;數(shù)據(jù)集B只用來識別故障類型,每類故障由不同故障程度樣本組合而成,負(fù)載設(shè)置為3HP,共1000個樣本。故障類型見表1。 表1 軸承數(shù)據(jù)樣本 將樣本的三維彩色小波時頻圖作為CNN、PCAnet、MPCAnet以及本文提出方法MKPCAnet的輸入。其中,CNN網(wǎng)絡(luò)結(jié)構(gòu)選取經(jīng)典的AlexNet框架,包括5層卷積層和3層全連接層,輸入圖片大小設(shè)置為AlexNet網(wǎng)絡(luò)固定輸入格式227×227×3。PCAnet、MPCAnet以及MKPCAnet的輸入圖片大小統(tǒng)一處理為64×64×3。通過對比分析確定各自分類效果最優(yōu)時的模型參數(shù):三者均采用2層結(jié)構(gòu),每層濾波器數(shù)目均為8,兩層濾波器的大小均為7×7。PCAnet輸出層中局部直方圖塊大小為7×7,MPCAnet和MKPCAnet輸出層中局部直方圖塊大小為24×32,三者塊重疊區(qū)域比率均為50%。MPCAnet第一層為MPCA濾波層,第二層為PCA濾波層;MKPCAnet中的KPCA濾波層選擇高斯核函數(shù),通過對比分析確定效果最佳時的高斯核參數(shù)σ=6。 為了直觀地展示本文提出模型的優(yōu)越性能,使用t分布隨機(jī)嵌入(t-SNE)算法對每種網(wǎng)絡(luò)模型學(xué)習(xí)后的樣本特征進(jìn)行可視化處理。選取數(shù)據(jù)集B的四種故障類型(每類故障90個樣本)進(jìn)行展示。對比方法包括CNN學(xué)習(xí)特征、PCAnet學(xué)習(xí)特征、MPCAnet學(xué)習(xí)特征和本文提出方法的學(xué)習(xí)特征,特征可視化結(jié)果如圖3所示。結(jié)果表明,相比CNN、PCAnet和MPCAnet,本文提出的MKPCAnet模型深度學(xué)習(xí)得到的特征在同類故障樣本中聚類性更強(qiáng),異類故障樣本間的距離更遠(yuǎn),可以更清晰地描述和區(qū)分不同故障狀態(tài)下的軸承信號。 (a) CNN 分別在數(shù)據(jù)集A、B上進(jìn)行實(shí)驗(yàn),每種故障類型均取20%作為訓(xùn)練集,剩余樣本作為測試集。取10次獨(dú)立實(shí)驗(yàn)的平均準(zhǔn)確率進(jìn)行展示,結(jié)果見表2。 表2 識別準(zhǔn)確率 由表2可以看出,PCAnet較傳統(tǒng)使用隨機(jī)梯度下降(SGD)優(yōu)化算法進(jìn)行梯度反向傳播的CNN相比,可以在輸入圖像尺寸更小、網(wǎng)絡(luò)層數(shù)更淺的情況下更精準(zhǔn)地識別不同的故障類型和不同程度的故障?;赑CAnet模型進(jìn)行改進(jìn)的MPCAnet模型的分類準(zhǔn)確率進(jìn)一步提高。而本文提出的MKPCAnet在數(shù)據(jù)集A、數(shù)據(jù)集B中均取得了最高的識別準(zhǔn)確率,這是由于MPCA層更有效地利用了多維圖像的空間結(jié)構(gòu)關(guān)系,加強(qiáng)了對圖像高級語義特征的提取,KPCA層則提高了模型的非線性擬合能力,這一效果在設(shè)置負(fù)載的數(shù)據(jù)集B的測試結(jié)果中尤為明顯。 為了驗(yàn)證本文提出方法的泛化能力,將數(shù)據(jù)集A采用不同數(shù)量的樣本作為訓(xùn)練集,其余樣本作為測試集,觀察測試集的準(zhǔn)確率。每種模型進(jìn)行獨(dú)立重復(fù)10次實(shí)驗(yàn),平均分類精確率如圖4所示。 圖4 識別精度隨訓(xùn)練集樣本量變化Fig.4 Recognition accuracy changes with the sample size of training set 由圖4可以看出,本文提出方法的準(zhǔn)確率高于其他同類方法,同時優(yōu)于CNN。在小樣本訓(xùn)練的情況下,KPCA的引入對模型的改善尤為明顯。本文提出的方法準(zhǔn)確率較PCAnet提高了8.63%,較MPCAnet提高了3.03%,在每類僅有5%訓(xùn)練樣本的情況下也能保證測試集達(dá)到93%以上的準(zhǔn)確率,每類15%訓(xùn)練樣本時測試集準(zhǔn)確率達(dá)到了98%以上。說明該方法在小樣本訓(xùn)練下表現(xiàn)優(yōu)異且有著良好的泛化能力,一定程度上緩解了工程實(shí)際中故障樣本難以獲取的問題。 實(shí)驗(yàn)2數(shù)據(jù)來自湖南大學(xué)旋轉(zhuǎn)機(jī)械故障試驗(yàn)臺的滾動軸承數(shù)據(jù),試驗(yàn)臺架如圖5所示。在試驗(yàn)臺上,滾動軸承型號為6205-2RS SKF,通過激光切割技術(shù)模擬了內(nèi)圈故障、外圈故障和滾動體故障。故障尺寸分別為0.2 mm、0.4 mm、0.6 mm,轉(zhuǎn)速為986.1 r/min,采樣頻率為10 kHz,每條信號的長度為10 000個采樣點(diǎn),連續(xù)小波變換參數(shù)與實(shí)驗(yàn)1相同。 圖5 旋轉(zhuǎn)機(jī)械故障試驗(yàn)臺Fig.5 Rotating machinery failure test device 為更真實(shí)地模擬工程實(shí)際運(yùn)行條件,統(tǒng)一將施加載荷設(shè)置為2 kN。為驗(yàn)證本文提出方法在非平穩(wěn)工況下的診斷魯棒性,統(tǒng)一給所有信號樣本添加10 db高斯白噪聲,獲取的樣本描述見表3。 表3 軸承數(shù)據(jù)樣本 各模型參數(shù)設(shè)置與實(shí)驗(yàn)1相同。每一類故障類型取5%的樣本量作為訓(xùn)練集,剩余樣本作為測試集。在處理器型號為IntelCorei7-8550U CPU @1.80 GHz的PC機(jī)上,基于MATLAB2018b平臺記錄訓(xùn)練時間和測試時間,實(shí)驗(yàn)結(jié)果如表4所示。 表4 識別準(zhǔn)確率及平均運(yùn)行時間 由表4可以看出,本文提出的MKPCAnet方法依舊表現(xiàn)出最高的識別準(zhǔn)確率。值得一提的是,所有方法的訓(xùn)練時間相較CNN都有大幅縮短。雖然MKPCAnet的訓(xùn)練時間相較于結(jié)構(gòu)更為簡單的PCAnet和MPCAnet有所增長,但測試時間均在0.3 s左右,能夠滿足工程實(shí)踐中的診斷要求。 進(jìn)行10次隨機(jī)獨(dú)立重復(fù)實(shí)驗(yàn),觀察測試集準(zhǔn)確率隨訓(xùn)練集樣本量變化的趨勢,訓(xùn)練集樣本量從每類故障樣本量的1%到10%依次遞增,結(jié)果如圖6所示。本文提出方法仍擁有最好的識別效果,不僅識別精度最高而且表現(xiàn)穩(wěn)定,具有較好的魯棒性。對于本文提出的方法,當(dāng)每類故障僅取2%的樣本量作為訓(xùn)練集時,測試集就可以達(dá)到99.96%以上的準(zhǔn)確率,遠(yuǎn)高于其他方法,滿足工程實(shí)際應(yīng)用需求。 圖6 識別精度隨訓(xùn)練集樣本量變化Fig.6 Recognition accuracy changes with the sample size of training set 本文提出一種改進(jìn)的多線性主成分分析網(wǎng)絡(luò)并用于滾動軸承故障診斷。改進(jìn)后的模型由MPCA濾波器組、KPCA濾波器組、二值化哈希層以及分塊直方圖層組成。該網(wǎng)絡(luò)使用張量對高維圖像進(jìn)行自動特征提取,充分利用了高維圖像的空間結(jié)構(gòu)關(guān)系,有效提取了圖像的高級語義特征。在此基礎(chǔ)上引入了核主成分分析的方法,提高了模型的非線性擬合能力,進(jìn)一步提高了分類精度,在小樣本訓(xùn)練和有噪聲干擾的情況下,模型在分類性能和泛化能力上的提高尤為突出,有效緩解了工程實(shí)際中故障樣本難以獲取、信號采集過程振動噪聲干擾等問題帶來的診斷壓力。實(shí)驗(yàn)結(jié)果表明本文提出的方法識別性能和魯棒性均高于傳統(tǒng)方法,對傳統(tǒng)基于CNN模型的深度學(xué)習(xí)識別方法提出了挑戰(zhàn),對實(shí)際工程應(yīng)用有重要參考意義。 本研究仍有一部分工作尚可繼續(xù)深入研究,例如:可進(jìn)一步研究模型中不同層數(shù)、不同濾波器尺寸和不同濾波器個數(shù)等參數(shù)對模型性能的影響,分析原因;可采用多種時頻分析方法處理得到不同類別的時頻圖像,分別輸入本模型橫向?qū)Ρ仍\斷效果,找到更合適的信號預(yù)處理方法;可嘗試將多源異構(gòu)信號、多通道信號組成的張量對象作為本模型的輸入進(jìn)行故障診斷等。1.2 改進(jìn)多線性主成分分析網(wǎng)絡(luò)
2 MKPCAnet模型滾動軸承故障診斷
3 實(shí)驗(yàn)數(shù)據(jù)分析
4 結(jié)論