張超,秦敏敏 ,張少飛
(1.內(nèi)蒙古科技大學(xué)機(jī)械工程學(xué)院,內(nèi)蒙古包頭 014010;2.內(nèi)蒙古自治區(qū)機(jī)電系統(tǒng)智能診斷與控制重點(diǎn)實(shí)驗(yàn)室,內(nèi)蒙古包頭 014010)
機(jī)械設(shè)備廣泛用于現(xiàn)代社會的各行各業(yè),軸承是機(jī)械設(shè)備中最通用的組成部件,一旦發(fā)生故障,很可能引發(fā)嚴(yán)重的事故。近幾十年來,由機(jī)械設(shè)備故障而引發(fā)的嚴(yán)重經(jīng)濟(jì)損失和人員傷亡事故的例子很多。如陜西秦嶺發(fā)電廠發(fā)生了由軸系斷裂引起的5號發(fā)電機(jī)組故障停機(jī),導(dǎo)致了巨大的經(jīng)濟(jì)損失。因此,全面了解軸承運(yùn)行狀態(tài)是保證設(shè)備正常運(yùn)轉(zhuǎn)的必要一環(huán)。
在滾動軸承故障診斷領(lǐng)域中,常用的分類算法有支持向量機(jī)(SVM)和人工神經(jīng)網(wǎng)絡(luò)(ANN)。但SVM和ANN都存在著缺陷。SVM對缺失數(shù)據(jù)十分敏感,且對于非線性問題沒有固定的解決方法,因此核函數(shù)的選擇變得尤為重要。ANN的使用需要大量的參數(shù),如網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、權(quán)值等,且學(xué)習(xí)時間過長。XGBoost是由CHEN和GUESTRIN提出的一種新型提升決策樹算法,能夠利用CPU的多線程實(shí)現(xiàn)多行并行運(yùn)算,大大減少了運(yùn)算時間,且算法的精度更高,這些優(yōu)點(diǎn)使得XGBoost被廣泛應(yīng)用于工程領(lǐng)域。
當(dāng)XGBoost應(yīng)用在軸承故障診斷時,首先需要使用合適的方法從時序信號中提取出相關(guān)的特征信息,然后將這些特征數(shù)據(jù)作為輸入。當(dāng)前軸承信號特征提取的方法主要有時域分析法、頻域分析法和時頻域分析法。張鈺等人提出使用時域分析提取特征,把最大值、峭度、歪度等指標(biāo)做為特征向量輸入到XGBoost中進(jìn)行訓(xùn)練和分類,但是該方法忽略了信號中的頻域信息和時頻域信息,分類效果較差。針對上述問題,吳定會等提出從信號的時域、頻域、時頻域中共同提取特征,將多特征融合向量輸入XGBoost中進(jìn)行訓(xùn)練和分類,雖然該方法充分挖掘了信號的特征信息,但是步驟過于繁瑣容易出現(xiàn)錯誤,且自適應(yīng)性差?;谳S承信號的非線性特點(diǎn),還可以使用小波包變換法進(jìn)行特征提取,但是使用單一方法會使得特征的提取不充分,容易造成有用信息的丟失。與上述的特征提取方法相比,一維卷積神經(jīng)網(wǎng)絡(luò)(One Dimensional Convolutional Neural Network,1D CNN)解決了人工手動提取信號特征的弊端,可以自適應(yīng)地對軸承信號特征信息進(jìn)行深度挖掘,得到更完整的特征信息。
綜合以上分析,本文作者利用一維卷積神經(jīng)網(wǎng)絡(luò)和XGBoost的優(yōu)勢,提出混合模型1D CNN-XGBoost,以實(shí)現(xiàn)滾動軸承信號的自適應(yīng)特征提取,縮短故障分類時長,得到具有較高準(zhǔn)確率和良好泛化性能的故障分類模型。
卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)算法,其基本結(jié)構(gòu)如圖1所示。該算法的本質(zhì)是對多個卷積核進(jìn)行不斷學(xué)習(xí),再使用卷積核對數(shù)據(jù)進(jìn)行卷積和池化操作,從而達(dá)到提取數(shù)據(jù)相關(guān)特征的目的。一維卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與CNN相似,但是其輸入為一維向量,卷積核和特征圖也是一維的,因此一維卷積神經(jīng)網(wǎng)絡(luò)更加適合處理時序信號。
圖1 CNN基本結(jié)構(gòu)
卷積層是卷積神經(jīng)網(wǎng)絡(luò)的核心部分,卷積層通過卷積核對前一層的特征圖進(jìn)行卷積得到相應(yīng)特征,再使用合適的激活函數(shù)進(jìn)行非線性變換獲得新的特征圖,具體過程如下:
(1)
下采樣層也叫池化層,深度學(xué)習(xí)中存在許多不同的池化函數(shù),如最大池化函數(shù),其作用是通過卷積核將輸入的特征圖劃分為許多矩形區(qū)域,并且輸出每個區(qū)域的最大值。池化層通過不斷地減小數(shù)據(jù)的空間大小,使得相關(guān)的參數(shù)隨之減少,在一定程度上防止過擬合的發(fā)生。池化過程如下:
(2)
式中:()表示最大池化函數(shù)。
輸出層包含了全連接層和分類層兩部分,其中全連接層的作用是將上一層的分布式特征映射到一維空間中,再通過分類層進(jìn)行分類輸出。全連接層轉(zhuǎn)化過程如下:
(3)
XGBoost算法是對GBDT算法的一種改進(jìn)。XGBoost與GBDT的最大區(qū)別是XGBoost對代價(jià)函數(shù)進(jìn)行了二階泰勒展開,并加入了正則項(xiàng),使得過擬合的情況不易發(fā)生。并且XGBoost使用多線性并程計(jì)算,使得訓(xùn)練速度得到了巨大的提升。其算法模型如下:
(4)
該模型的目標(biāo)函數(shù)包括損失函數(shù)和正則項(xiàng)兩部分:
(5)
采用加法分布的策略對該模型進(jìn)行優(yōu)化,可以確保損失函數(shù)不斷降低,直到優(yōu)化完所有的棵樹。
1D CNN-XGBoost算法的流程如圖2所示。該模型主要由1D CNN特征提取器和XGBoost分類器兩部分組成。首先將軸承信號劃分為訓(xùn)練集和測試集,再將訓(xùn)練集數(shù)據(jù)輸入到一維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,待訓(xùn)練完成時,保存該網(wǎng)絡(luò)模型并使用該網(wǎng)絡(luò)提取特征,再將特征向量輸入到XGBoost進(jìn)行訓(xùn)練,最后使用訓(xùn)練好的XGBoost模型進(jìn)行故障分類。
圖2 1D CNN-XGBoost算法流程
采用凱斯西儲大學(xué)軸承數(shù)據(jù)中心提供的數(shù)據(jù)集作為實(shí)驗(yàn)的數(shù)據(jù)來源。實(shí)驗(yàn)臺如圖3所示,該實(shí)驗(yàn)臺由1.5 kW的電動機(jī)、扭矩傳感器和一個功率測試計(jì)組成。使用電火花加工技術(shù)分別對軸承內(nèi)外圈和滾動體引入故障,故障尺寸為0.177 8 mm。在軸承的驅(qū)動端和風(fēng)扇端分別安裝加速度傳感器進(jìn)行數(shù)據(jù)的采集,由于風(fēng)扇端受到的外部干擾較多,選用驅(qū)動端采集的數(shù)據(jù),采樣頻率為12 kHz。
圖3 CWRU實(shí)驗(yàn)臺
采集到的驅(qū)動端的4種不同的軸承狀態(tài)數(shù)據(jù)分別為正常狀態(tài)數(shù)據(jù)、內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)、滾動體故障數(shù)據(jù)。每種狀態(tài)取300個樣本,樣本長度為400;在每種狀態(tài)的300個樣本中,取210個樣本作為訓(xùn)練集,剩下的樣本作為測試集,具體劃分如表1所示。
表1 數(shù)據(jù)集構(gòu)建
本文作者使用的一維卷積神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)如表2所示,主要包含2個卷積層、2個池化層和2個全連接層,每個卷積層的激活函數(shù)都為ReLU函數(shù)(),并且加入了一個dropout層防止過擬合;學(xué)習(xí)率設(shè)為0.01,迭代次數(shù)設(shè)為20,batch_size設(shè)置為32。將訓(xùn)練集的數(shù)據(jù)代入模型中進(jìn)行訓(xùn)練,訓(xùn)練過程中準(zhǔn)確率曲線和損失函數(shù)曲線分別如圖4和圖5所示??梢钥闯觯涸撃P蜎]有發(fā)生過擬合,訓(xùn)練效果較好。當(dāng)訓(xùn)練完成時保存該模型,用該模型作為特征提取器提取特征,再將特征數(shù)據(jù)集代入到XGBoost模型中。
表2 網(wǎng)絡(luò)結(jié)構(gòu)
圖4 準(zhǔn)確率曲線(數(shù)據(jù)集1) 圖5 損失函數(shù)曲線(數(shù)據(jù)集1)
在使用XGBoost算法時,首先需要通過經(jīng)驗(yàn)對一些參數(shù)進(jìn)行設(shè)置。決策樹的深度設(shè)置為6,若設(shè)置過大易發(fā)生過擬合;葉節(jié)點(diǎn)的最小權(quán)重為0.572 6;最小損失分裂值為0.811 6,;學(xué)習(xí)率為0.1,過大易發(fā)生過擬合,其余參數(shù)選擇默認(rèn)值。參數(shù)設(shè)置完成后,再將一維卷積神經(jīng)網(wǎng)絡(luò)提取的特征向量數(shù)據(jù)集代入XGBoost模型中進(jìn)行訓(xùn)練和測試,各種分類結(jié)果如圖6所示??芍撼齼?nèi)圈故障分類準(zhǔn)確率為99%,其他類型準(zhǔn)確率均為100%。該結(jié)果充分顯示了文中模型在故障分類精度上的優(yōu)越性。
圖6 混淆矩陣(數(shù)據(jù)集1)
為進(jìn)一步體現(xiàn)1D CNN-XGBoost模型的優(yōu)勢,分別與XGBoost以及1D CNN模型進(jìn)行比較,其中XGBoost模型使用的數(shù)據(jù)集并沒有進(jìn)行特征提取,而是直接使用第4.2節(jié)中的數(shù)據(jù)集。在機(jī)器學(xué)習(xí)中,常常使用準(zhǔn)確率、召回率以及準(zhǔn)確率和召回率的調(diào)和平均數(shù)作為指標(biāo)對模型分類效果進(jìn)行評估。這些指標(biāo)的計(jì)算公式如下:
(6)
(7)
(8)
式中:表示預(yù)測正確的標(biāo)簽數(shù)量;表示預(yù)測標(biāo)簽中錯誤的標(biāo)簽數(shù)量;表示實(shí)際標(biāo)簽中分類錯誤的標(biāo)簽數(shù)量。
分類結(jié)果對比如表3所示??梢钥吹剑?D CNN-XGBoost模型的各個指標(biāo)均高于XGBoost和1D CNN模型,其性能有了很大的提升,同時發(fā)現(xiàn)沒有使用特征提取數(shù)據(jù)集的XGBoost的模型分類效果較差,準(zhǔn)確率只有90.81%。更證明了在使用XGBoost前,使用合適的方法對數(shù)據(jù)進(jìn)行特征提取的必要性。
表3 分類結(jié)果對比 單位:%
為驗(yàn)證1D CNN-XGBoost的泛化性,使用一組新的滾動軸承數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。該數(shù)據(jù)來源于內(nèi)蒙古科技大學(xué)機(jī)械工程學(xué)院的HZXT-DS-003雙跨雙轉(zhuǎn)子滾動軸承實(shí)驗(yàn)臺,如圖7所示。
圖7 HZXT-DS-003 滾動軸承實(shí)驗(yàn)臺結(jié)構(gòu)簡圖
滾動軸承的型號為6205-2RS,用電火花在軸承滾動體外圈、內(nèi)圈溝道上加工直徑為0.178 mm的單點(diǎn)損傷。軸承數(shù)據(jù)通過加速度傳感器從軸承座上采集,軸的轉(zhuǎn)動速度為1 000 r/min,采樣頻率為1.2 kHz。每種軸承狀態(tài)數(shù)據(jù)取樣本600組,樣本大小為1 024,每組樣本打上標(biāo)簽,取400組作為訓(xùn)練集,其余作為測試集,數(shù)據(jù)的劃分如表4所示。
表4 構(gòu)建的數(shù)據(jù)集2
將訓(xùn)練集數(shù)據(jù)代入一維卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,該一維卷積網(wǎng)絡(luò)的結(jié)構(gòu)與第4.3節(jié)中的結(jié)構(gòu)相同,其訓(xùn)練過程的準(zhǔn)確率曲線和損失率曲線分別如圖8、圖9所示??梢钥吹剑呵€的波動幅度不大,測試集的準(zhǔn)確率略低于訓(xùn)練集,損失率略高于訓(xùn)練集,模型未發(fā)生過擬合的情況,訓(xùn)練效果較好。
圖8 準(zhǔn)確率曲線(數(shù)據(jù)集2) 圖9 損失函數(shù)曲線(數(shù)據(jù)集2)
將訓(xùn)練好的模型提取特征輸入到XGBoost模型中進(jìn)行訓(xùn)練,其中決策樹的深度設(shè)置為7;葉節(jié)點(diǎn)的最小權(quán)重為0.572 6;最小損失分裂值為0.611 6;學(xué)習(xí)率為0.1,其余參數(shù)設(shè)置為默認(rèn)值。將訓(xùn)練好的模型進(jìn)行故障分類,結(jié)果如圖10所示??芍狠S承正常狀態(tài)的分類準(zhǔn)確率為100%,內(nèi)圈和滾動體的分類準(zhǔn)確率為99%,外圈的分類準(zhǔn)確率為97%。結(jié)果表明:1D CNN-XGBoost模型在其他數(shù)據(jù)集上依舊適用,且分類的準(zhǔn)確率較高,普適性和泛化性得到了充分的證明。
圖10 混淆矩陣(數(shù)據(jù)集2)
XGBoost模型的輸入數(shù)據(jù)若不進(jìn)行特征提取處理,其分類的準(zhǔn)確率較低。因此,需要合適的方法對數(shù)據(jù)進(jìn)行自適應(yīng)特征提取。傳統(tǒng)的手動提取特征的方法較為繁瑣且丟失信息嚴(yán)重,本文作者提出的1D CNN-XGBoost模型可以自適應(yīng)地提取特征,特征信息挖掘程度高。通過實(shí)驗(yàn)對比可知所提模型的分類準(zhǔn)確率高,具有很好的分類性能和泛化性,為軸承故障分類研究提供了參考。