阮宇豪
(三峽大學(xué)機械與動力學(xué)院,湖北 宜昌 443002)
農(nóng)業(yè)機械是農(nóng)業(yè)發(fā)展的加速器,農(nóng)業(yè)機械的使用既降低了農(nóng)業(yè)人力成本,又提高了農(nóng)業(yè)經(jīng)濟效益[1]。安全維護對于農(nóng)業(yè)機械有著重要作用。在現(xiàn)代農(nóng)業(yè)機械生產(chǎn)管理過程中,一旦發(fā)生意外事件就會降低生產(chǎn)和工作的效率[2]。滾動軸承是農(nóng)業(yè)機械的重要零部件,農(nóng)業(yè)機械長期在強沖擊、高負載、高溫高壓的環(huán)境下運行,導(dǎo)致軸承時常發(fā)生損壞,因此,對農(nóng)業(yè)機械的軸承狀態(tài)進行監(jiān)控和故障診斷十分必要。
在軸承故障診斷領(lǐng)域,由軸承產(chǎn)生的數(shù)據(jù)量巨大,有效信息稀少,導(dǎo)致傳統(tǒng)的信號處理方法難以對其進行有效和快速的處理。深度學(xué)習(xí)在處理大數(shù)據(jù)方面具有廣泛的應(yīng)用,許多學(xué)者將其應(yīng)用于軸承故障診斷,取得了良好的效果。Ye等提出了一種采取雙通道形態(tài)濾波,結(jié)合峭度篩選的信號融合方法,成功應(yīng)用于齒輪箱故障診斷中[3]。Wang等將振動數(shù)據(jù)和聲學(xué)數(shù)據(jù)同時輸入一維卷積神經(jīng)網(wǎng)絡(luò),并對其進行數(shù)據(jù)融合,實現(xiàn)對軸承的故障診斷[4]。
然而,在實際情況中,大量數(shù)據(jù)是無標(biāo)簽的,使得監(jiān)督學(xué)習(xí)方法效果較差。為適應(yīng)工業(yè)情況,Zhang等提出了一種以長短時記憶單元為基礎(chǔ)的自編碼器,用于提取數(shù)據(jù)中的時間特征信息,通過對其特征信息進行空間嵌入表達,成功進行化學(xué)設(shè)備的故障診斷[5]。Tanha等提出了一種結(jié)合有監(jiān)督訓(xùn)練和自訓(xùn)練的半監(jiān)督方法,通過比較兩個序列的輸出,對符合要求的數(shù)據(jù)進行偽標(biāo)簽轉(zhuǎn)化,實現(xiàn)數(shù)據(jù)集的擴充和數(shù)據(jù)分類[6]。本文提出了一種結(jié)合空間嵌入和對比學(xué)習(xí)策略的半監(jiān)督學(xué)習(xí)方法,將軸承故障特征通過對比學(xué)習(xí)的方式進行深度訓(xùn)練,提高不同軸承故障類型的辨識度,再充分利用少量有標(biāo)簽數(shù)據(jù)對整個模型進行調(diào)整,提高網(wǎng)絡(luò)精度,最終實現(xiàn)對軸承的故障診斷。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)采取權(quán)重共享和核函數(shù)平滑移動的方式,能夠有效提取故障特征,相較于全連接神經(jīng)網(wǎng)絡(luò),極大地減少了參數(shù)量,提高了運算效率和網(wǎng)絡(luò)性能。
本文網(wǎng)絡(luò)由兩個特征提取層、兩個全連接層以及一個分類層組成,其中特征提取層由卷積層、池化層和歸一化層組成,投影層由兩個全連接層組成,具體結(jié)構(gòu)和參數(shù)如表1所示。
表1 網(wǎng)絡(luò)結(jié)構(gòu)與超參數(shù)
模型通過對數(shù)據(jù)的深度挖掘,在特征層面對網(wǎng)絡(luò)進行訓(xùn)練,提高了數(shù)據(jù)利用率,促使網(wǎng)絡(luò)生成更具有代表性的特征。最終模型對空間嵌入模塊輸出的嵌入特征zi和由分類層輸出的分類概率向量pi進行優(yōu)化,實現(xiàn)網(wǎng)絡(luò)的訓(xùn)練。
式中,f(xi,θ)為空間嵌入模塊,由特征提取層和投影層組成,xi和θ分別為訓(xùn)練數(shù)據(jù)和訓(xùn)練參數(shù);g(zi,φ)為分類層,φ為分類層的參數(shù)。
少量的有標(biāo)簽數(shù)據(jù)用于對網(wǎng)絡(luò)的初步訓(xùn)練和網(wǎng)絡(luò)的調(diào)整,并采用交叉熵損失函數(shù)Cross Entory,對網(wǎng)絡(luò)預(yù)測輸出pi進行優(yōu)化,使其更貼合真實標(biāo)簽,最終有標(biāo)簽數(shù)據(jù)訓(xùn)練采用交叉熵損失函數(shù),具體公式如下:
式中,labeli為有標(biāo)簽數(shù)據(jù)xi的真實標(biāo)簽。
無標(biāo)簽數(shù)據(jù)因其缺乏對應(yīng)的標(biāo)簽信息,無法直接用于故障診斷,故需要對其進行一定的數(shù)據(jù)增強,從而獲取樣本間關(guān)系。
對比學(xué)習(xí)方法通過對無標(biāo)簽數(shù)據(jù)進行數(shù)據(jù)增強,獲取同一樣本多視圖下的不同表征,再將數(shù)據(jù)表征進行組合,形成樣本對。樣本對中,兩個表征同源的樣本對為正對,表征來源不同的樣本對為負對。
為獲取樣本對中樣本間的相似程度,采取余弦距離函數(shù)計算樣本間相似度,相似度取值范圍為[-1, 1],即同源樣本對取值為1,異源樣本對取值為-1。對于兩個樣本,余弦相似度計算如下:
為提高正對樣本間相似度,降低負對樣本間相似度,促使網(wǎng)絡(luò)提高樣本類別鑒別能力。結(jié)合實際數(shù)據(jù)情況,參考對比學(xué)習(xí)方法[7],采用優(yōu)化噪聲對比估計(Noise Contrastive Estimation, Info NCE)損失函數(shù),用于實現(xiàn)正對和負對間的優(yōu)化。最終對比損失函數(shù)構(gòu)造如下:
式中,t為溫度系數(shù),取t=0.02。
為實現(xiàn)對模型的整體優(yōu)化,將有標(biāo)簽損失函數(shù)與無標(biāo)簽損失函數(shù)進行求和,再通過Adam優(yōu)化器對網(wǎng)絡(luò)的參數(shù)進行優(yōu)化,提高網(wǎng)絡(luò)特征表達能力和網(wǎng)絡(luò)訓(xùn)練準(zhǔn)確率。最終整體網(wǎng)絡(luò)的損失函數(shù)如下:
式中,λ為權(quán)重系數(shù),且隨訓(xùn)練周期衰減,衰減系數(shù)α=0.015。
本文利用對比學(xué)習(xí)方法,充分利用無標(biāo)簽數(shù)據(jù)中各樣本間關(guān)系,促進網(wǎng)絡(luò)更好地鑒別樣本類別,最終實現(xiàn)對軸承的故障診斷。損失函數(shù)計算流程如圖1所示。具體的診斷流程如下:
圖1 損失函數(shù)計算流程
1)利用有標(biāo)簽數(shù)據(jù)訓(xùn)練模型,獲取交叉熵損失;
2)將無標(biāo)簽數(shù)據(jù)進行數(shù)據(jù)增強;
3)將無標(biāo)簽數(shù)據(jù)和增強后的數(shù)據(jù)輸入模型,通過特征提取模塊獲取數(shù)據(jù)特征;
4)依據(jù)樣本來源,構(gòu)建正負對,計算對比損失;
5)將1)和4)中的損失加權(quán)求和,并通過梯度下降算法優(yōu)化模型;
6)循環(huán)1)至5)步,直至訓(xùn)練完成,并用測試集測試模型性能。
在軸承故障診斷中,凱斯西儲大學(xué)軸承數(shù)據(jù)集[8]是得到廣泛認可和應(yīng)用的軸承數(shù)據(jù)集,試驗臺由驅(qū)動電機、扭矩傳感器、測功機和電子控制設(shè)備組成,試驗臺具體結(jié)構(gòu)如圖2所示。
圖2 凱斯西儲大學(xué)軸承試驗臺
對數(shù)據(jù)集進行切斷劃分,并使用12 kHz采樣頻率,故障深度為0.007英寸,負載為0 HP下的軸承數(shù)據(jù),包含外圈故障、內(nèi)圈故障、滾動體故障和正常四種軸承狀態(tài),每種軸承故障類型含100條樣本,樣本長度為1 024個采樣點。并將數(shù)據(jù)按照2∶7∶1的比例劃分為有標(biāo)簽數(shù)據(jù)、無標(biāo)簽數(shù)據(jù)和測試數(shù)據(jù)。
為了構(gòu)造對比學(xué)習(xí)樣本,選擇對無標(biāo)簽數(shù)據(jù)進行裁剪并打亂順序,然后進行拼接,從而增強數(shù)據(jù),產(chǎn)生正對和負對,具體拼接方法如圖3所示。
圖3 數(shù)據(jù)裁剪拼接
為了評估本文方法在軸承故障診斷上的有效性,選擇與CNN這種在故障診斷上具有良好效果的有監(jiān)督網(wǎng)絡(luò)和noise-student[9]與self-train[10]這兩種經(jīng)典的半監(jiān)督學(xué)習(xí)方法在訓(xùn)練50個周期下進行對比,最終診斷結(jié)果如圖4所示。
圖4 各方法準(zhǔn)確率對比
通過對比可以看出,相較于其他網(wǎng)絡(luò),本文提出的方法在最終測試集準(zhǔn)確率和準(zhǔn)確率達到峰值的速度方面均為第一,體現(xiàn)出本文方法的有效性和診斷快速性。同時,其他三個網(wǎng)絡(luò)在訓(xùn)練過程中準(zhǔn)確率提升不平穩(wěn),難以適用于工業(yè)領(lǐng)域。
相較于農(nóng)業(yè)機械的實際工作環(huán)境,由試驗臺所獲得的數(shù)據(jù)噪聲干擾小,信號辨識度高,無法真正應(yīng)用于農(nóng)業(yè)機械的故障診斷。故選擇在數(shù)據(jù)集中添加一定比例的高斯白噪聲,用于模擬真實的農(nóng)業(yè)機械工作環(huán)境,同時檢驗網(wǎng)絡(luò)的抗噪性。各網(wǎng)絡(luò)取5次平均測試集準(zhǔn)確率作為最終結(jié)果,各網(wǎng)絡(luò)準(zhǔn)確率隨數(shù)據(jù)信噪比(SNR)變化結(jié)果如表2所示。
由表2可知,進行對比的四種方法在信噪比較高的情況下,均取得了較高的準(zhǔn)確率,本文方法達到了97.5%的診斷準(zhǔn)確率。同時,隨著信噪比不斷降低,信號中噪聲加大,所有方法的準(zhǔn)確率呈現(xiàn)下降趨勢,在信噪比為-2的強噪聲下,本文所提出的方法依舊具有67.5%的準(zhǔn)確率,證明其抗噪能力強。
表2 抗噪性對比
針對農(nóng)業(yè)機械的軸承故障診斷過程中,無標(biāo)簽數(shù)據(jù)多、對數(shù)據(jù)進行標(biāo)記困難的問題,本文提出了一種結(jié)合對比學(xué)習(xí)的半監(jiān)督故障診斷方法,通過對比學(xué)習(xí)方法在特征層面對神經(jīng)網(wǎng)絡(luò)的標(biāo)簽預(yù)測進行修正,充分利用了無標(biāo)簽數(shù)據(jù)中的信息,促使網(wǎng)絡(luò)能更準(zhǔn)確地進行分類。此外,相較于其他方法,本文所提出的結(jié)合對比學(xué)習(xí)的半監(jiān)督方法,具有較強的抗噪能力,能更好地適應(yīng)農(nóng)業(yè)機械工作環(huán)境,具有較強的適應(yīng)性。