周永慶
(長(zhǎng)安大學(xué)工程機(jī)械學(xué)院,陜西 西安 710016)
滾動(dòng)軸承是現(xiàn)代機(jī)械設(shè)備中的關(guān)鍵零部件, 廣泛應(yīng)用于數(shù)控機(jī)床、船舶、航空發(fā)動(dòng)機(jī)等各種設(shè)備中,起著不可或缺的作用[1]。 滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械中的核心支撐回轉(zhuǎn)部件, 其運(yùn)行精度和安全可靠性直接影響旋轉(zhuǎn)機(jī)械的總體性能[2]。 在滾動(dòng)軸承故障診斷的過(guò)程中,快速有效識(shí)別出軸承故障的類型, 對(duì)于機(jī)械設(shè)備的安全和維修成本具有至關(guān)重要的作用[3]。
近年來(lái),隨著深度學(xué)習(xí)和人工智能的快速發(fā)展[4],機(jī)械設(shè)備在檢測(cè)、故障診斷和維護(hù)方面越來(lái)越智能化[5]。 傳統(tǒng)的軸承故障診斷方法通常包含選擇和提取原始信號(hào)的時(shí)頻域特征,通過(guò)傅里葉變換[6]、小波變換[7]等方法,對(duì)軸承故障進(jìn)行分類。 這些方法要求工作人員具備比較高的專業(yè)知識(shí)和經(jīng)驗(yàn),存在一定的局限性。 傳統(tǒng)的智能軸承故障診斷方法主要包含三個(gè)部分:特征提取、特征選擇和特征故障診斷。 目前常用的主要有支持向量機(jī)[8]、BP 神經(jīng)網(wǎng)絡(luò)[9]等,這些方法篩選出的特征比較單一,特征綜合能力不強(qiáng)。
針對(duì)以上不足, 本文提出了一種基于多尺度卷積神經(jīng)網(wǎng)絡(luò)(Multiscale convolution neural network,MCNN)的軸承故障診斷方法, 以軸承運(yùn)行時(shí)采集的故障信號(hào)為研究對(duì)象,使用多個(gè)尺寸的卷積核提取原始信號(hào),使提取到的信號(hào)更加豐富,有效解決特征提取能力不強(qiáng)的問(wèn)題,無(wú)需人工提取故障特征。 試驗(yàn)結(jié)果表明,該方法具有較高的軸承故障診斷準(zhǔn)確率。
卷積神經(jīng)網(wǎng)絡(luò)(Convolution neural network,CNN)在結(jié)構(gòu)和功能上與視覺(jué)皮層相似, 具有強(qiáng)大的從原始數(shù)據(jù)中提取特征的能力,主要用于處理網(wǎng)狀結(jié)構(gòu)數(shù)據(jù),它通過(guò)構(gòu)建多個(gè)能夠提取輸入數(shù)據(jù)特征的濾波器, 并運(yùn)用這些濾波器逐層提取隱藏在輸入數(shù)據(jù)中的代表特征, 經(jīng)過(guò)非線性變換輸出判斷結(jié)果。
卷積層是CNN 的基本單元, 卷積核采用參數(shù)共享機(jī)制。 幾個(gè)具有不同權(quán)重向量的過(guò)濾器在輸入體積的寬度和高度上滑動(dòng),在每個(gè)位置提取多個(gè)特征。
式中:S 表示圖像卷積后的結(jié)果,K 為卷積核,m,n 表示卷積核的尺寸寬和高,A 為圖像的輸入矩陣。
在多層神經(jīng)網(wǎng)絡(luò)中,上層節(jié)點(diǎn)的輸出和下層節(jié)點(diǎn)的輸入之間具有一個(gè)函數(shù)關(guān)系,這個(gè)函數(shù)稱為激活函數(shù)。 下面公式為網(wǎng)絡(luò)模型中經(jīng)常使用的激活函數(shù)。
上述公式(2)、(3)和(4)分別是Sigmoid 函數(shù)、tanh 函數(shù)和ReLu 函數(shù)的數(shù)學(xué)表達(dá)式, 其中ReLu 是CNN 經(jīng)常使用的激活函數(shù),ReLu 存在以下優(yōu)勢(shì), 不存在梯度消失問(wèn)題、收斂速度較快。在輸入是負(fù)值的情況下,它會(huì)輸出0,神經(jīng)元就不會(huì)被激活, 同一時(shí)間只有部分神經(jīng)元會(huì)被激活,從而使得網(wǎng)絡(luò)很稀疏,進(jìn)而對(duì)計(jì)算來(lái)說(shuō)是非常有效率的。
如圖1 所示, 多尺度卷積神經(jīng)網(wǎng)絡(luò)模型主要有輸入、特征提取模塊、信息融合模塊和分類模塊等組成,其中特征提取層包含依次堆疊的卷積層、歸一化層、池化層和激活函數(shù)層, 分類模塊包含全連接層、Dropout 層和Softmax分類器層。
圖1 多尺度卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖
圖2 中的網(wǎng)絡(luò)模型是有多個(gè)特征提取模塊和信息融合模塊組成,將提取到的抽象特征經(jīng)過(guò)分類模塊最終輸出軸承故障類型。 圖2 左側(cè)是特征提取模塊的參數(shù)設(shè)計(jì),特征提取模塊一共有4 個(gè)通道, 第一個(gè)通道是名稱Conv1,包含卷積層、歸一化層和激活函數(shù)層,后面連接一個(gè)名稱為Conv1_1 的小模塊,以此類推,第二個(gè)和第三個(gè)通道和第一個(gè)類似,第四個(gè)通道是先經(jīng)過(guò)最大池化,然后經(jīng)過(guò)卷積、歸一化和ReLu 激活函數(shù),最終將這四個(gè)通道提取到的不同信息經(jīng)過(guò)信息融合模塊匯聚更加豐富的數(shù)據(jù)特征。 經(jīng)過(guò)全連接層、Dropout 和Softmax 層輸出預(yù)測(cè)結(jié)果。
對(duì)于原始數(shù)據(jù)我們采用了數(shù)據(jù)增強(qiáng)( Data Augment)算法技術(shù),如圖2 所示,對(duì)原始數(shù)據(jù)進(jìn)行重疊采樣,從而增加訓(xùn)練樣本數(shù)量,增強(qiáng)模型的泛化能力。
圖2 數(shù)據(jù)增強(qiáng)技術(shù)
滾動(dòng)軸承多故障診斷實(shí)驗(yàn)的數(shù)據(jù)來(lái)源于凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)數(shù)據(jù)中心公布的軸承試驗(yàn)故障數(shù)據(jù),此數(shù)據(jù)在學(xué)術(shù)界被廣泛應(yīng)用,該軸承故障實(shí)驗(yàn)平臺(tái)如圖3 所示。
圖3 軸承故障實(shí)驗(yàn)平臺(tái)
本實(shí)驗(yàn)每次使用4 096 個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)樣本, 設(shè)置步長(zhǎng)為20, 每種軸承故障類型取得樣本數(shù)量為6 000,10種不同程度的狀態(tài)共計(jì)60 000 個(gè)樣本, 標(biāo)簽分別從0 到9 表示不同的軸承故障狀態(tài), 從每種故障狀態(tài)隨機(jī)取600個(gè)樣本作為測(cè)試集, 余下的5 400 個(gè)樣本作為訓(xùn)練集,測(cè)試集共6 000 個(gè)樣本,樣本劃分詳情如表1 所示。
表1 實(shí)驗(yàn)數(shù)據(jù)集劃分詳情
在訓(xùn)練模型時(shí), 以交叉熵作為損失函數(shù); 首選采用Adam 優(yōu)化器, 將學(xué)習(xí)率設(shè)置為0.001, 同時(shí)將訓(xùn)練輪數(shù)(Epochs)設(shè)置為100 輪。
由圖4 可知,訓(xùn)練集輸入到MCNN 模型,經(jīng)過(guò)40 輪數(shù)訓(xùn)練后,模型基本達(dá)到穩(wěn)定,準(zhǔn)確率接近100%左右并且趨于穩(wěn)定,損失趨近于0 左右;驗(yàn)證集在MCNN 模型的表現(xiàn)接近訓(xùn)練集,準(zhǔn)確率也趨于100%,損失函數(shù)趨于0,說(shuō)明該模型的性能表現(xiàn)良好,并無(wú)過(guò)擬合和欠擬合現(xiàn)象發(fā)生。
圖4 MCNN 模型訓(xùn)練準(zhǔn)確率和損失曲線圖
為了驗(yàn)證本文提出的MCNN 模型的有效性,本文使用了CNN 網(wǎng)絡(luò)模型和BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)了對(duì)比試驗(yàn),試驗(yàn)結(jié)果如下表2 所示。
表2 不同模型故障識(shí)別準(zhǔn)確率
由表2 可知,各個(gè)模型經(jīng)過(guò)120 輪訓(xùn)練后,本文所提出的MCNN 網(wǎng)絡(luò)模型的準(zhǔn)確率達(dá)到了99.97%,比CNN 網(wǎng)絡(luò)模型和BP 神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確率都高,說(shuō)明該模型具有良好的軸承故障診斷性能。
本文所提出的算法模型,通過(guò)應(yīng)用于軸承的故障數(shù)據(jù)集進(jìn)行診斷,驗(yàn)證了該方法的有效性與優(yōu)越性,得到的結(jié)論如下:
1)MCNN 算法模型具有更好的軸承故障診斷準(zhǔn)確率,通過(guò)應(yīng)用于軸承的故障數(shù)據(jù)集診斷, 獲得了高達(dá)99.97%的準(zhǔn)確率,比CNN 模型和BP 神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率更高,說(shuō)明該模型具有較好的準(zhǔn)確性和有效性。
2)MCNN 模型能夠通過(guò)不同的卷積核尺寸提取不同的原始信號(hào)特征,使提取到的抽象特征更加豐富。