張洪亮, 余其源, 秦超群, 王 銳, 張宇騰
(1.安徽工業(yè)大學(xué) 管理科學(xué)與工程學(xué)院,安徽 馬鞍山 243032; 2.蘇州大學(xué) 軌道交通學(xué)院,江蘇 蘇州 215131)
軸承作為旋轉(zhuǎn)機(jī)械的關(guān)鍵部件,一旦發(fā)生故障直接影響設(shè)備性能,甚至?xí)斐砂踩鹿?。因?精確地診斷軸承健康狀態(tài)對(duì)設(shè)備平穩(wěn)運(yùn)行有著重要意義。
隨著信息化技術(shù)的廣泛應(yīng)用,各種工業(yè)場(chǎng)景下收集的振動(dòng)數(shù)據(jù),被越來(lái)越多地應(yīng)用到故障監(jiān)測(cè)中,這使得基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷技術(shù)得到了快速發(fā)展,并在實(shí)際生產(chǎn)中得到廣泛應(yīng)用。傳統(tǒng)的故障診斷方法主要包含振動(dòng)信號(hào)的預(yù)處理、特征提取和故障狀態(tài)分類3個(gè)部分。信號(hào)的預(yù)處理包括對(duì)采集到的信號(hào)進(jìn)行降噪、頻域或時(shí)頻域轉(zhuǎn)換、數(shù)據(jù)的重采樣等;特征提取則是從預(yù)處理完成的數(shù)據(jù)中,提取不同類別的特征信息;故障分類多采用人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹(shù)、隨機(jī)森林等典型分類技術(shù)。傳統(tǒng)方法雖然對(duì)提升故障診斷效果有一定價(jià)值,但存在數(shù)據(jù)預(yù)處理需要大量先驗(yàn)知識(shí)、特征提取不充分、不同場(chǎng)景下的泛化性能差等不足。
近些年,由于深度學(xué)習(xí)的廣泛應(yīng)用,診斷網(wǎng)絡(luò)往往可以表示為復(fù)雜目標(biāo)函數(shù)與變量關(guān)系的深層結(jié)構(gòu),這使軸承故障診斷研究得到進(jìn)一步發(fā)展。利用深度學(xué)習(xí)理論,研究者開(kāi)發(fā)出了多種深層網(wǎng)絡(luò)模型用于故障數(shù)據(jù)的自適應(yīng)學(xué)習(xí),實(shí)現(xiàn)數(shù)據(jù)間非線性關(guān)系的深度挖掘,從而擺脫對(duì)專家知識(shí)的依賴。故障診斷中采用的經(jīng)典深度學(xué)習(xí)方法主要包括自動(dòng)編碼器、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)、深度殘差網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)及長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)。在上述方法中,CNN作為一種典型的多級(jí)前饋式神經(jīng)網(wǎng)絡(luò)[1],有著利于模型訓(xùn)練的稀疏連接結(jié)構(gòu)和權(quán)值共享特性,因此被學(xué)者們引入故障診斷領(lǐng)域并開(kāi)展了深入研究。Wen等[2]提出基于LeNet-5的CNN故障診斷方法,將原始信號(hào)轉(zhuǎn)換成二維圖像,消除了手工提取特征的不足。Zhang等[3]針對(duì)深度學(xué)習(xí)方法不能提取有效特征的問(wèn)題,提出了利用短時(shí)傅里葉變換將原始信號(hào)轉(zhuǎn)換成二維時(shí)頻域輸入的方法,并采用改進(jìn)的CNN完成高效分類。Xue等[4]提出從一維和二維結(jié)合的CNN并行結(jié)構(gòu)中提取深度特征,然后采用融合策略進(jìn)行連接,獲得了更可靠的診斷效果。Zhang等[5]提出一種基于深度CNN的多模型集成深度學(xué)習(xí)方法,實(shí)現(xiàn)了高維樣本的故障識(shí)別。
由文獻(xiàn)分析可知,軸承故障診斷研究多采用基于CNN及其改進(jìn)的方法。該類方法通過(guò)構(gòu)建深層次的診斷模型增強(qiáng)特征提取能力,在一定程度上提高了分類準(zhǔn)確率,但隨著網(wǎng)絡(luò)深度的增加,模型訓(xùn)練變得困難,難以進(jìn)一步提高分類效果。一方面,深度網(wǎng)絡(luò)在訓(xùn)練時(shí)會(huì)發(fā)生梯度彌散,出現(xiàn)過(guò)擬合;另一方面,該類網(wǎng)絡(luò)模型僅學(xué)習(xí)來(lái)自一個(gè)傳感器收集的信號(hào)數(shù)據(jù),而其中包含的故障特征信息有限,使得模型難以適應(yīng)恒定狀態(tài)以外的負(fù)載或轉(zhuǎn)速改變下的工作條件,這些因素使CNN在故障診斷領(lǐng)域的深入發(fā)展受到了限制。針對(duì)上述問(wèn)題,He等[6]提出的殘差網(wǎng)絡(luò)通過(guò)在正向傳播中添加快捷連接,對(duì)深層網(wǎng)絡(luò)反向傳播時(shí)的梯度消失問(wèn)題進(jìn)行改善,增強(qiáng)了模型對(duì)深層特征的提取能力。Yang等[7]在卷積自動(dòng)編碼器中引入殘差學(xué)習(xí),提出殘差寬核深度卷積自動(dòng)編碼器,提升了模型的去噪和特征提取能力。袁彩艷等[8]針對(duì)深度CNN中的信息傳遞差異,設(shè)計(jì)出卷積注意力改進(jìn)的殘差密集網(wǎng)絡(luò),實(shí)現(xiàn)了提取特征的重要性區(qū)分。此外,基于一維或二維CNN的多傳感器信息融合策略也被逐漸應(yīng)用于故障診斷領(lǐng)域,以解決故障信號(hào)中包含的特性信息不足。Bai等[9]利用短時(shí)傅里葉變換得到不同傳感器采集信號(hào)的時(shí)頻圖像,然后將其融合并作為模型的多通道輸入。Zhang等[10]把來(lái)自不同傳感器的信號(hào)按一定長(zhǎng)度切分為子序列,再將對(duì)應(yīng)位置的序列疊加,轉(zhuǎn)換成多傳感器數(shù)據(jù)的灰度圖像作為CNN的輸入。Peng等[11]利用融合嵌入層,將每個(gè)傳感器的高級(jí)特征變?yōu)榈途S特征,實(shí)現(xiàn)了傳感器信號(hào)在特征維度的信息融合。由此可知,傳感器信號(hào)可在輸入層與特征層進(jìn)行信息融合,不同的信號(hào)融合方式,可以體現(xiàn)模型數(shù)據(jù)流特征信息的差異性。
基于上述文獻(xiàn)的啟發(fā),本文提出了一種多傳感器信息融合與雙連接注意力殘差網(wǎng)絡(luò)(multi-sensor signal fusion and double-connected attention residual network,MSF-DARN)的故障診斷方法。首先,以不同位置的傳感器為信號(hào)源,采用數(shù)據(jù)信息融合策略將單傳感器對(duì)應(yīng)時(shí)間收集的振動(dòng)信號(hào),融合成多通道輸入。然后,設(shè)計(jì)了雙連接注意力殘差模塊,實(shí)現(xiàn)網(wǎng)絡(luò)對(duì)特征信息的差異性劃分,使提取到的故障特征更具有鑒別力,并通過(guò)堆疊該模塊加深網(wǎng)絡(luò),實(shí)現(xiàn)模型對(duì)融合信號(hào)中隱含故障特征的深度挖掘。最后,利用全局平均池化來(lái)減緩深層網(wǎng)絡(luò)所帶來(lái)的梯度消失問(wèn)題。通過(guò)兩個(gè)數(shù)據(jù)集下的變工況試驗(yàn),驗(yàn)證了所提方法的有效性。
CNN是一種多隱層的前饋神經(jīng)網(wǎng)絡(luò),擁有強(qiáng)大的表示學(xué)習(xí)和特征提取能力,其基本結(jié)構(gòu)包含卷積層、池化層、全連接層和輸出層。其中,卷積層與池化層構(gòu)成了網(wǎng)絡(luò)的特征提取器,擁有共享權(quán)值和稀疏連接的特性;全連接層與傳統(tǒng)的前饋式神經(jīng)網(wǎng)絡(luò)類似,通過(guò)處理在輸入數(shù)據(jù)中提取到的高維特征,實(shí)現(xiàn)具體的分類任務(wù)。
卷積層是整個(gè)CNN的核心模塊,它將卷積核與特征圖覆蓋重合的區(qū)域進(jìn)行加權(quán)求和,然后使用激活函數(shù)進(jìn)行非線性變換,得到對(duì)應(yīng)的輸出特征值,同時(shí)利用稀疏連接和權(quán)值共享機(jī)制,遍歷整個(gè)輸入特征圖。具體數(shù)學(xué)表示如下
xi+1=f(wi?xi+bi)
(1)
式中:f(·)為卷積操作中使用的激活函數(shù);?為卷積運(yùn)算;wi為卷積核的權(quán)重系數(shù);bi為當(dāng)前卷積操作中的偏置;xi為卷積層的輸入;xi+1為經(jīng)卷積運(yùn)算后得到的輸出。
全連接層中,輸入與輸出的神經(jīng)元相互連接,最終的輸出節(jié)點(diǎn)個(gè)數(shù)等于分類任務(wù)的類別數(shù)。為了實(shí)現(xiàn)多分類任務(wù),選用softmax作為激活函數(shù)
(2)
式中:n為類別數(shù);x為最后一層的輸出。通過(guò)softmax的處理,使得最后的輸出滿足分類任務(wù)類別個(gè)數(shù)且概率分布和為1。
全局平均池化(global average pooling,GAP)是對(duì)網(wǎng)絡(luò)最后一層卷積得到的特征圖,按通道計(jì)算每個(gè)特征圖平均值的操作,最終輸出維度與最后一層的特征圖相同。相比于全連接層,GAP直接實(shí)現(xiàn)了降維,大大減少了網(wǎng)絡(luò)訓(xùn)練參數(shù)的數(shù)量,可以減少過(guò)擬合的發(fā)生的概率。計(jì)算過(guò)程見(jiàn)參考文獻(xiàn)[12]。
故障模式的判別往往需要利用信號(hào)數(shù)據(jù)的深層特征,而單一化的網(wǎng)絡(luò)結(jié)構(gòu)很難完成對(duì)融合信號(hào)的深度特征學(xué)習(xí)。因此,針對(duì)多傳感器融合的數(shù)據(jù)輸入,有必要構(gòu)建一個(gè)利于特征學(xué)習(xí)的深層網(wǎng)絡(luò)。但隨著網(wǎng)絡(luò)層數(shù)的增加,訓(xùn)練過(guò)程會(huì)因深層結(jié)構(gòu)出現(xiàn)梯度彌散導(dǎo)致失敗,而構(gòu)成殘差結(jié)構(gòu)的跳躍連接緩解了梯度消失問(wèn)題,加快了訓(xùn)練速度?;诖?本文采用殘差模塊作為加深診斷網(wǎng)絡(luò)的基本結(jié)構(gòu)。同時(shí),針對(duì)殘差網(wǎng)絡(luò)提取的通道特征進(jìn)行差異性劃分,從而區(qū)別出不同通道特征信息的重要性,進(jìn)一步提升故障判別的效果。
融合多傳感器信息的輸入數(shù)據(jù)包含大量故障特征信息,為了能有效提取其中的故障特征,本文采用可以對(duì)信號(hào)數(shù)據(jù)進(jìn)行逐級(jí)學(xué)習(xí)的深度網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)特征學(xué)習(xí),從而挖掘出更豐富的抽象特征。此外,通過(guò)簡(jiǎn)單的堆疊特征提取操作來(lái)加深網(wǎng)絡(luò)結(jié)構(gòu),容易導(dǎo)致訓(xùn)練過(guò)程出現(xiàn)過(guò)擬合。因此,本文基于跳躍連接的思想構(gòu)建出一個(gè)帶有雙連接的殘差模塊,利用該模塊來(lái)加深診斷網(wǎng)絡(luò)的深度。
如圖1所示,不同于傳統(tǒng)殘差網(wǎng)絡(luò)僅把輸入添加到與其同維度的卷積結(jié)果中,雙連接殘差網(wǎng)絡(luò)利用跳躍連接1將原始輸入并聯(lián)至第一層卷積的輸出,再利用逐點(diǎn)卷積擴(kuò)充輸入維度,最后采用跳躍連接2與第二層卷積輸出相融合。通過(guò)反復(fù)重用前次的信息,克服單向信息流動(dòng)帶來(lái)的梯度彌散,以此實(shí)現(xiàn)對(duì)輸入信息的深層次挖掘。
圖1 雙連接殘差網(wǎng)絡(luò)
設(shè)該模塊的輸入為x,并聯(lián)后的輸出為y,整個(gè)網(wǎng)絡(luò)的輸出為Y,則
y=f1(w1*x+b1)∪x,
Y=f2(w2*y+b2)⊕f3(w3*x+b3)
(3)
式中:f1,f2,f3為卷積操作的激活函數(shù);w1,w2,w3及b1,b2,b3分別為對(duì)應(yīng)的權(quán)重系數(shù)和偏置項(xiàng)。
由雙連接殘差模塊構(gòu)成的診斷網(wǎng)絡(luò)可以提取大量的故障特征信息,但并不是所有的信息都有利于故障判別,為了區(qū)別所提取特征的重要性,本文引入了SE(sequeeze-and-excitation networks)注意力機(jī)制模塊[13],以獲取不同通道特征的權(quán)重系數(shù),進(jìn)而使學(xué)習(xí)到的特征更有利于故障識(shí)別。
SE模塊的結(jié)構(gòu)如圖2所示,主要包括壓縮、激勵(lì)和乘積3個(gè)步驟。對(duì)于輸入特征圖U,SE首先在每個(gè)通道上執(zhí)行GAP,即壓縮操作Fsq(·),它使H×W×C的輸入特征沿通道方向變成1×1×C的特征圖,計(jì)算過(guò)程如下
圖2 通道注意力機(jī)制
(4)
式中:c為壓縮的通道序號(hào);zc為第c個(gè)通道壓縮后的值;uc(i,j)是i×j維的二維矩陣,i=1,2,…,H,j=1,2,…,H。
然后,利用激活操作Fex(·,·)學(xué)習(xí)每個(gè)通道的特征權(quán)值。該步驟是SE模塊建立通道特征與訓(xùn)練效果相互關(guān)系的關(guān)鍵一步,目的在于使學(xué)習(xí)到的權(quán)值能夠激勵(lì)重要的特征映射,抑制不重要的特征映射。具體操作是在壓縮之后使用了兩層全連接構(gòu)成的門(mén)機(jī)制來(lái)學(xué)習(xí)不同通道的權(quán)值,門(mén)控單元計(jì)算方法為
sc=σ[W2δ(W1zc)]
(5)
式中:δ為Relu激活函數(shù);σ為sigmoid激活函數(shù);W1,W2分別為兩個(gè)全連接層的網(wǎng)絡(luò)參數(shù);sc是激活操作后得到的門(mén)控單元。
最后,通過(guò)乘積操作Fscale(·,·)輸出門(mén)控單元與輸入特征圖子圖uc的向量積
(6)
通過(guò)在雙連接殘差網(wǎng)絡(luò)的輸出中加入SE注意力機(jī)制,構(gòu)成雙連接注意力殘差模塊(double-connected attention residual module,DARM),使模塊獲得對(duì)不同通道特征的重要性區(qū)分,提高特征學(xué)習(xí)的效率。
由于滾動(dòng)軸承的實(shí)際運(yùn)行環(huán)境復(fù)雜,數(shù)據(jù)的采集通常會(huì)受到強(qiáng)噪聲等不利因素的影響,從而導(dǎo)致CNN在特征提取過(guò)程中具有一定局限性。為了充分利用采集的振動(dòng)信號(hào)以及CNN強(qiáng)大的特征提取能力,本文提出了傳感器信息融合與雙連接注意力殘差網(wǎng)絡(luò)相結(jié)合的滾動(dòng)軸承故障診斷方法。利用傳感器信息融合策略可以收集更多的故障特征信息,同時(shí),經(jīng)注意力機(jī)制改進(jìn)的雙連接殘差模塊,能有效挖掘融合信號(hào)中更抽象的深層故障特征,并改善深層網(wǎng)絡(luò)的梯度彌散與退化問(wèn)題,有效實(shí)現(xiàn)網(wǎng)絡(luò)在復(fù)雜工況環(huán)境下的故障分類。
數(shù)據(jù)處理是故障診斷中的關(guān)鍵一步,為了盡可能地消除該環(huán)節(jié)對(duì)專家知識(shí)的依賴,本文采用多傳感器信息融合策略來(lái)提高模型輸入中包含的特征信息量。
3.1.1 數(shù)據(jù)轉(zhuǎn)換
試驗(yàn)采集的數(shù)據(jù)均為一維時(shí)序數(shù)據(jù),而由于CNN特殊的網(wǎng)絡(luò)結(jié)構(gòu),其在處理二維數(shù)據(jù)時(shí)更具有優(yōu)勢(shì)[14]。因此,本文采用按固定長(zhǎng)度截取一維信號(hào),并逐行填充到二維數(shù)據(jù)中的方法來(lái)實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換。
(1) 歸一化操作。將原始數(shù)據(jù)歸一化到無(wú)量綱的同一范圍,可以防止訓(xùn)練過(guò)程中的梯度消失,加快網(wǎng)絡(luò)收斂速度。歸一化操作具體方式為
(7)
(2) 數(shù)據(jù)格式轉(zhuǎn)換。一維原始數(shù)據(jù)轉(zhuǎn)換成二維格式的過(guò)程,如圖3所示。將長(zhǎng)度為1 024的原始信號(hào),按照32個(gè)采樣點(diǎn)為一段的方式進(jìn)行截取,得到32個(gè)等長(zhǎng)的片段。然后將截取的信號(hào)依次進(jìn)行堆疊,最終得到一個(gè)3232的二維重構(gòu)信號(hào)。
圖3 數(shù)據(jù)重構(gòu)示意圖
3.1.2 多傳感器數(shù)據(jù)融合
本文中的振動(dòng)信號(hào)來(lái)自3個(gè)放置在不同位置的傳感器,每個(gè)傳感器收集到的信號(hào)按照上述轉(zhuǎn)換方式得到數(shù)據(jù)格式為[32,32,1]的二維重構(gòu)信號(hào),其中1表示單通道。為有效利用來(lái)自不同傳感器的信息,本文將同一時(shí)刻收集的信息轉(zhuǎn)換成二維數(shù)據(jù)后,再由并聯(lián)方式實(shí)現(xiàn)不同位置所收集信號(hào)的融合,形成多通道輸入,從而增加模型輸入包含的故障特征信息。融合后的輸入數(shù)據(jù)格式為[32,32,3],其中3表示三通道。
本文提出的傳感器信息融合與雙連接注意力殘差模塊相結(jié)合的軸承故障診斷模型結(jié)構(gòu),如圖4所示。該方法對(duì)原始數(shù)據(jù)的處理不依靠專家經(jīng)驗(yàn)和手工特征提取,只要將原始數(shù)據(jù)輸入診斷模型,網(wǎng)絡(luò)通過(guò)學(xué)習(xí)數(shù)據(jù)特征就能自動(dòng)地輸出診斷結(jié)果,實(shí)現(xiàn)了“端到端”的故障診斷流程。在圖4中,經(jīng)預(yù)處理后的多通道輸入,首先經(jīng)過(guò)兩個(gè)寬核卷積神經(jīng)網(wǎng)絡(luò),以提取故障信號(hào)中的淺層特征;然后將提取的特征輸入由3個(gè)DARM堆疊組成的深層特征提取結(jié)構(gòu),利用注意力機(jī)制優(yōu)化的雙連接殘差網(wǎng)絡(luò),逐層提取多通道輸入的高級(jí)特征信息,并將得到的高級(jí)特征映射圖輸入GAP網(wǎng)絡(luò)層,以減少網(wǎng)絡(luò)訓(xùn)練參數(shù)、防止過(guò)擬合;最后,利用softmax層完成故障類別輸出。
圖4 所提診斷模型結(jié)構(gòu)
本文提出的基于傳感器信息融合及雙連接注意力殘差網(wǎng)絡(luò)的診斷方法的應(yīng)用流程如圖5所示,主要分為訓(xùn)練和測(cè)試兩個(gè)部分,具體如下:
圖5 診斷流程圖
(1) 利用多個(gè)傳感器收集不同位置的軸承振動(dòng)信號(hào),將其進(jìn)行歸一化,并分為訓(xùn)練集和測(cè)試集;
(2) 將訓(xùn)練集中的數(shù)據(jù)融合成多通道輸入,然后利用搭建的診斷模型學(xué)習(xí)故障特征,并通過(guò)交叉熵?fù)p失函數(shù)計(jì)算模型訓(xùn)練過(guò)程中的損失值;
(3) 根據(jù)得到的損失值,利用誤差反向傳播算法對(duì)整個(gè)網(wǎng)絡(luò)的權(quán)重參數(shù)進(jìn)行更新,降低損失函數(shù)值,提高診斷精度,直至達(dá)到網(wǎng)絡(luò)設(shè)置的最大更新次數(shù);
(4) 利用測(cè)試集測(cè)試訓(xùn)練完成的診斷模型,輸出分類結(jié)果。
為了驗(yàn)證所提方法有效性,本文以凱斯西儲(chǔ)大學(xué)(CWRU)與安徽工業(yè)大學(xué)自制試驗(yàn)平臺(tái)采集的軸承數(shù)據(jù)集為試驗(yàn)對(duì)象,分別進(jìn)行試驗(yàn)驗(yàn)證。
所提方法模型在Inter i7-10750H處理器、8 GB運(yùn)行內(nèi)存、GTX 1650TI 顯卡的Windows10電腦環(huán)境下,使用Python語(yǔ)言在Pycharm平臺(tái)中編寫(xiě),利用pytorch深度學(xué)習(xí)框架實(shí)現(xiàn)。
本文所提方法利用兩層寬核卷積來(lái)提取大局域的淺層特征,但考慮到深層網(wǎng)絡(luò)模型更有利于特征學(xué)習(xí)以及由此帶來(lái)的梯度消失問(wèn)題,因此在設(shè)計(jì)DARM時(shí)采用大小為33的卷積核,因?yàn)檩^小的卷積核在相同感受野下能提升網(wǎng)絡(luò)深度[15],同時(shí)小尺寸的卷積核會(huì)增加網(wǎng)絡(luò)內(nèi)部非線性,使網(wǎng)絡(luò)更具鑒別力,從而改善模型效果。此外,網(wǎng)絡(luò)中每增加一個(gè)DARM,輸出的特征圖數(shù)目就會(huì)增加一倍,為了減輕網(wǎng)絡(luò)訓(xùn)練的參數(shù),在每個(gè)DARM后添加了一個(gè)池化層。最后,為避免訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合,加入全局平均池化層以進(jìn)一步減少網(wǎng)絡(luò)參數(shù)。所提方法具體參數(shù)如表1所示。
表1 所提模型結(jié)構(gòu)參數(shù)
所提方法的模型輸入為多通道的融合信號(hào),其中:32×32×3中的3表示通道數(shù),32×32表示特征圖的大小;卷積層的參數(shù)5×5×32,表示在卷積過(guò)程中的核尺寸為5×5,數(shù)目為32個(gè);步長(zhǎng)中的零補(bǔ)表示在卷積過(guò)程中將參數(shù)padding的值設(shè)置為1,以保證卷積后的輸出尺寸與輸入相同。
本文提出的基于傳感器信息融合及雙連接注意力殘差網(wǎng)絡(luò)的故障診斷方法,增加了輸入信號(hào)中故障特征的數(shù)量,改善了模型的特征學(xué)習(xí)效果,從而提高了故障診斷精度。為了能從多方面對(duì)本文所提模型在復(fù)雜工況環(huán)境下的診斷效果進(jìn)行評(píng)價(jià),將其與寬核卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural networks with wide first-layer kernel,WDCNN)、普通殘差網(wǎng)絡(luò)(Resnet)、雙連接殘差網(wǎng)絡(luò)(double-connected residual network,DRN)以及采用本文所提診斷模型的單傳感器輸入方法(single sensor input and double-connected attention residual network,SSI-DARN)進(jìn)行比較。所選對(duì)比模型的參數(shù)如表2所示。
表2 對(duì)比模型結(jié)構(gòu)參數(shù)
CWRU的軸承數(shù)據(jù)集是利用電火花向測(cè)試軸承的內(nèi)圈、滾動(dòng)體和外圈引入單點(diǎn)故障,故障尺寸分別為0.177 8 mm,0.355 6 mm和0.533 4 mm。因此,軸承的故障狀態(tài)可分為9種,加上正常狀態(tài)就產(chǎn)生了10種不同的軸承運(yùn)行狀態(tài)。對(duì)采集到的數(shù)據(jù)以1 024為一個(gè)樣本長(zhǎng)度進(jìn)行無(wú)重疊采樣,其中80%作為訓(xùn)練集,20%作為測(cè)試集,得到的試驗(yàn)數(shù)據(jù)描述如表3所示。
表3 CWRU數(shù)據(jù)描述
實(shí)驗(yàn)中數(shù)據(jù)采集頻率為12 kHz,分別在負(fù)載為0,1 kW,2 kW,對(duì)應(yīng)轉(zhuǎn)速為1 797 r/min,1 772 r/min,1750 r/min的狀態(tài)下,對(duì)風(fēng)扇端、基座端和驅(qū)動(dòng)端進(jìn)行振動(dòng)信號(hào)收集。由于故障軸承的振動(dòng)信號(hào)在不同位置可以體現(xiàn)出同一故障類型的不同故障特征,因此當(dāng)振動(dòng)信號(hào)采集的位置不同時(shí),能收集到的軸承故障特性也不相同,因此可以為故障診斷模型提供更豐富、全面的數(shù)據(jù)輸入。為了驗(yàn)證所提方法在復(fù)雜工況條件下的有效性,創(chuàng)建了A,B,C,3個(gè)數(shù)據(jù)集,如表4所示。
表4 實(shí)驗(yàn)數(shù)據(jù)集描述
為了使采集的數(shù)據(jù)盡可能接近實(shí)際工況環(huán)境下采集到的樣本,本文在測(cè)試數(shù)據(jù)中加入不同信噪比(signal noise radio, SNR)的高斯白噪聲,以模擬在實(shí)際工作環(huán)境中采集到的含有噪聲的樣本。計(jì)算SNR的方式如下
(8)
式中:RSN為噪聲強(qiáng)弱;Ps為信號(hào)功率;Pn為噪聲功率。
4.2.1 網(wǎng)絡(luò)主要參數(shù)選擇
網(wǎng)絡(luò)參數(shù)設(shè)置影響到模型對(duì)數(shù)據(jù)的學(xué)習(xí)效果以及最終的試驗(yàn)結(jié)果,因此選擇合適的參數(shù)會(huì)對(duì)整個(gè)故障診斷流程有重要影響。研究中發(fā)現(xiàn)診斷網(wǎng)絡(luò)的深度以及訓(xùn)練過(guò)程中采用的批處理數(shù)目,對(duì)故障判別的準(zhǔn)確率有較大影響,因此本文通過(guò)試驗(yàn)來(lái)確定兩者合理的參數(shù)。為減少隨機(jī)因素的影響,本文中的試驗(yàn)采用恒定負(fù)載下的數(shù)據(jù)集C進(jìn)行訓(xùn)練和測(cè)試,測(cè)試過(guò)程中為了模擬實(shí)際環(huán)境下采集的信號(hào),在測(cè)試集中添加了SNR=2的高斯白噪聲。
(1) 網(wǎng)絡(luò)深度
在CNN構(gòu)成的診斷網(wǎng)絡(luò)中,不同的網(wǎng)絡(luò)深度對(duì)于診斷結(jié)果的精度以及訓(xùn)練過(guò)程的難易程度有直接影響。為了選擇合適的診斷網(wǎng)絡(luò)結(jié)構(gòu),本文構(gòu)建了4種不同深度的診斷模型,分別包含DARM的數(shù)目為1,2,3,4,以下簡(jiǎn)稱DARM1,DARM2,DARM3、DARM4。上述4種模型均在相同條件下進(jìn)行10次試驗(yàn),結(jié)果如圖6所示。
圖6 不同深度網(wǎng)絡(luò)診斷精度
由圖6可知,相比于更深層次的網(wǎng)絡(luò),只包含一個(gè)DARM的網(wǎng)絡(luò)結(jié)構(gòu)的故障識(shí)別準(zhǔn)確率明顯較低,因此網(wǎng)絡(luò)結(jié)構(gòu)的深度對(duì)于故障診斷結(jié)果有明顯影響。當(dāng)網(wǎng)絡(luò)深度逐漸加深時(shí),由圖6可知,DARM3的精度總體上好于DARM2,但DARM4相比于DARM3卻在結(jié)果上有較大波動(dòng),且總體結(jié)果并不優(yōu)于DARM3,因此當(dāng)網(wǎng)絡(luò)深度增加到一定程度時(shí),若繼續(xù)加深網(wǎng)絡(luò)結(jié)構(gòu),診斷結(jié)果并不會(huì)繼續(xù)得到優(yōu)化,反而出現(xiàn)了較大的波動(dòng)。綜上,本文選擇DARM3作為診斷模型的網(wǎng)絡(luò)深度。
(2) 批處理數(shù)目
在深度學(xué)習(xí)的訓(xùn)練過(guò)程中,采用小批量梯度下降算法可以加快模型的收斂速度,同時(shí)能避免訓(xùn)練過(guò)程陷入局部最優(yōu)。然而批量值過(guò)小會(huì)使模型參數(shù)更新緩慢,訓(xùn)練時(shí)間過(guò)長(zhǎng);批量值過(guò)大則會(huì)使梯度更新朝全局最優(yōu)方向更新緩慢。因此為模型確定合適的批處理數(shù)值對(duì)診斷結(jié)果有重要影響。在確定DARM3為所提方法的網(wǎng)絡(luò)深度基礎(chǔ)上,本文分別對(duì)批量大小為16,32,64,128的批處理數(shù)目進(jìn)行試驗(yàn),相同條件下運(yùn)行10次的結(jié)果如圖7所示。由圖7可知當(dāng)批量大小為64時(shí)的診斷精度明顯高于其他對(duì)比試驗(yàn),且診斷結(jié)果的穩(wěn)定性最好,因此本文選取64為模型訓(xùn)練時(shí)的批量值。
圖7 不同批量處理數(shù)目診斷精度
4.2.2 變負(fù)載試驗(yàn)分析
滾動(dòng)軸承通常運(yùn)行在變負(fù)載環(huán)境中,因此需要故障診斷方法具有良好的泛化能力,以解決負(fù)載變化時(shí)的故障判別。為了驗(yàn)證所提方法在負(fù)載變化時(shí)的實(shí)際診斷效果,本文以某一恒定負(fù)載的數(shù)據(jù)集作為訓(xùn)練集,不同負(fù)載的數(shù)據(jù)集作為測(cè)試集,以此模擬負(fù)載變化。例如,A-B表示在數(shù)據(jù)集A上進(jìn)行訓(xùn)練,采用數(shù)據(jù)集B來(lái)測(cè)試。每組試驗(yàn)進(jìn)行10次,取其平均值作為實(shí)驗(yàn)結(jié)果。最終在負(fù)載變化條件下,得到不同方法的診斷結(jié)果,如圖8所示。
圖8 變負(fù)載診斷精度結(jié)果
由圖8可知,WDCNN在負(fù)載變化下的診斷精度最低,平均診斷精度僅為84.5%,本文所提方法在每種負(fù)載變化下的診斷精度均高于對(duì)比方法,平均診斷精度在94%以上。其次,對(duì)于Resnet與DRN,兩者保持了相似的網(wǎng)絡(luò)結(jié)構(gòu),主要區(qū)別在于殘差模塊的不同,但相比采用普通殘差模塊的雙連接殘差網(wǎng)絡(luò),后者的平均診斷精度為90.2%,優(yōu)于前者的87.9%,驗(yàn)證了所設(shè)計(jì)的雙連接殘差網(wǎng)絡(luò)相比普通殘差結(jié)構(gòu)更有利于挖掘隱層特征信息。同時(shí),所提方法的識(shí)別準(zhǔn)確率均高于DRN,表明經(jīng)注意力機(jī)制改進(jìn)的雙連接殘差網(wǎng)絡(luò)可以獲得不同通道特征重要性,挖掘出更具有鑒別性的故障特征。此外,對(duì)于以單傳感器信號(hào)作為模型輸入的SSI-DARN,雖然在診斷模型上采用了本文方法,但是在變負(fù)載條件下的平均診斷精度為89.7%,明顯低于多傳感器信息融合的方法,表明傳感器信息融合策略可以使輸入信號(hào)包含更多的特征信息。
4.2.3 抗噪性試驗(yàn)分析
為了驗(yàn)證所提方法在復(fù)雜工況條件的抗噪性能,在數(shù)據(jù)集B的測(cè)試集中加入0~8 dB的高斯白噪聲,用來(lái)測(cè)試不同方法抗噪能力。每組試驗(yàn)進(jìn)行5次,試驗(yàn)結(jié)果的均值對(duì)比如圖9所示。
圖9 噪聲變化診斷精度結(jié)果
由圖9可知,當(dāng)噪聲強(qiáng)度為0~8 dB時(shí)所提方法的診斷精度高于其他診斷模型,其平均識(shí)別準(zhǔn)確率超過(guò)了98%??傮w而言,不同診斷模型的識(shí)別準(zhǔn)確率與噪聲強(qiáng)弱均成正向變化關(guān)系,且當(dāng)SNR超過(guò)6 dB時(shí),各模型的診斷精度趨于穩(wěn)定,這是由于在噪聲較小情形下,識(shí)別精度主要取決于模型自身在特征提取上的設(shè)計(jì)。此外,當(dāng)SNR從0~8 dB變化時(shí),只有本文的診斷模型能始終保持在93%以上的診斷精度,說(shuō)明所提方法在噪聲環(huán)境下仍具有較強(qiáng)的故障特征提取能力。
為了進(jìn)一步驗(yàn)證所提方法的有效性,本文選用如圖10所示的自制試驗(yàn)平臺(tái)采集的數(shù)據(jù)[16]進(jìn)行試驗(yàn)。試驗(yàn)軸承型號(hào)為SKF6206-2RS1,采用電火花分別對(duì)軸承的內(nèi)圈、外圈和滾動(dòng)體加工出不同的故障尺寸。通過(guò)放置在不同位置的加速度傳感器對(duì)轉(zhuǎn)速為900 r/min,1 200 r/min和1 500 r/min 3種工況,進(jìn)行軸承振動(dòng)信號(hào)的數(shù)據(jù)采集,采樣頻率為10.24 kHz,分別得到數(shù)據(jù)集A,B,C。對(duì)采集到的振動(dòng)信號(hào),按每個(gè)樣本長(zhǎng)度1 024進(jìn)行無(wú)重合切分,其中80%作為訓(xùn)練集,20%作為測(cè)試集,每個(gè)數(shù)據(jù)集的構(gòu)成如表5所示。
表5 安徽工業(yè)大學(xué)數(shù)據(jù)描述
圖10 安徽工業(yè)大學(xué)自制試驗(yàn)平臺(tái)
4.3.1 噪聲環(huán)境下的變轉(zhuǎn)速試驗(yàn)分析
考慮到軸承工作時(shí)的轉(zhuǎn)速變換以及噪聲環(huán)境的干擾,本文設(shè)計(jì)了帶有噪聲變化的變轉(zhuǎn)速試驗(yàn)。該試驗(yàn)具體過(guò)程為將診斷模型在一個(gè)轉(zhuǎn)速下收集的數(shù)據(jù)進(jìn)行訓(xùn)練,然后利用另一個(gè)轉(zhuǎn)速下采集的數(shù)據(jù)來(lái)測(cè)試訓(xùn)練完成的模型。例如,A-B為在數(shù)據(jù)集A中進(jìn)行訓(xùn)練,訓(xùn)練完成的模型在數(shù)據(jù)集B中進(jìn)行測(cè)試。同時(shí),為了測(cè)試診斷模型在變工況下的抗噪性能,在測(cè)試數(shù)據(jù)集中分別加入不同SNR的高斯白噪聲。試驗(yàn)采用的診斷模型結(jié)構(gòu)與表1相同,將在CWRU數(shù)據(jù)集中采用的SSI-DARN,DRN以及WDCNN作為對(duì)比方法。
為了避免試驗(yàn)過(guò)程中的隨機(jī)性,對(duì)每一個(gè)噪聲環(huán)境下的工況變化重復(fù)進(jìn)行5次試驗(yàn),然后取其平均值。試驗(yàn)結(jié)果如圖11所示。圖11中0,2,4,6表示在測(cè)試集中加入高斯白噪聲的信噪比。由圖11可知,轉(zhuǎn)速變化相同條件下,本文所提方法在SNR為0~6 dB的噪聲環(huán)境中,故障類型識(shí)別的平均準(zhǔn)確率均高于其他方法。同時(shí)在相同SNR的噪聲環(huán)境下,所提方法在轉(zhuǎn)速變化時(shí)的識(shí)別平均準(zhǔn)確率也高于對(duì)比方法。特別在SNR=0的高噪聲環(huán)境下,相比于SSI-DARN和DRN,所提方法的識(shí)別準(zhǔn)確率都高于90%,進(jìn)一步說(shuō)明了本文構(gòu)建的診斷方法在不依賴人工提取特征情形下?lián)碛休^強(qiáng)的特征學(xué)習(xí)能力。此外,測(cè)試軸承在SNR為0~6 dB、轉(zhuǎn)速改變條件下,本文模型的平均準(zhǔn)確率可達(dá)96.46%,表明所提方法在復(fù)雜工況條件下具有良好的故障識(shí)別準(zhǔn)確率和抗干擾性能。
圖11 有噪聲變化的變轉(zhuǎn)速試驗(yàn)診斷精度
4.3.2 所提方法診斷過(guò)程可視化
為了直觀地展示所提方法的診斷過(guò)程,本文采用t-SNE(t-distributed stochastic neighbor embedding)降維算法,分別將輸入的振動(dòng)信號(hào)、雙層寬核卷積層的輸出、模型中3個(gè)DARM的輸出以及全連接網(wǎng)絡(luò)最后一層輸出中的高維特征降到二維,從而實(shí)現(xiàn)診斷方法的特征提取可視化。試驗(yàn)中采用的訓(xùn)練集為A,然后利用添加了噪聲強(qiáng)度SNR為0的測(cè)試集B來(lái)得出訓(xùn)練完成的診斷模型在特征提取不同階段的可視化結(jié)果,如圖12所示。
圖12 診斷過(guò)程降維可視化
由圖12可知,診斷模型對(duì)于不同故障類型特征的可分性隨著網(wǎng)絡(luò)的加深逐漸增強(qiáng)。特別是,經(jīng)過(guò)3個(gè)DARM模塊的學(xué)習(xí)后,模型對(duì)于故障類型的區(qū)分能力明顯增強(qiáng),說(shuō)明本文采用的DARM有良好的特征提取能力,能夠從振動(dòng)信號(hào)中提取出能反映軸承運(yùn)行狀態(tài)的故障特征。同時(shí),由處于不同深度的DARM輸出的高維特征可視化結(jié)果可知,本文在診斷模型中所采用的3個(gè)DARM模塊堆疊而成的深層網(wǎng)絡(luò),更有利于模型對(duì)不同類別故障的區(qū)分。此外,由整個(gè)診斷流程的可視化結(jié)果看出,通過(guò)數(shù)據(jù)集A訓(xùn)練完成的模型,在SNR為0的噪聲環(huán)境中使用數(shù)據(jù)集B進(jìn)行測(cè)試時(shí),仍能清晰地得出不同類型故障之間的界限,進(jìn)一步說(shuō)明了所提方法在有噪聲干擾的變工況環(huán)境下有較好的識(shí)別性能。
考慮復(fù)雜工況條件下變負(fù)載、變轉(zhuǎn)速以及環(huán)境噪聲干擾等影響因素,本文提出了傳感器信息融合與雙連接注意力殘差網(wǎng)絡(luò)相結(jié)合的軸承故障診斷方法。該方法在兩個(gè)不同的數(shù)據(jù)集中表現(xiàn)良好,主要結(jié)論如下:
(1) 本文采用的傳感器信息融合策略,簡(jiǎn)化了數(shù)據(jù)處理過(guò)程,提高了輸入數(shù)據(jù)中包含的故障特征信息。
(2) 由DARM堆疊而成的深層網(wǎng)絡(luò),可以有效挖掘融合信號(hào)中包含的深層特征信息,且利用DARM的SE機(jī)制可以使模型學(xué)習(xí)到更具有判別性的故障特征,從而提升模型在復(fù)雜環(huán)境下的識(shí)別性能。
(3) 針對(duì)兩個(gè)不同的試驗(yàn)數(shù)據(jù)集,所提方法在不同工況環(huán)境下均取得了較高的故障識(shí)別準(zhǔn)確率。特別是在有噪聲變化的變轉(zhuǎn)速試驗(yàn)中,所提方法的平均診斷精度可達(dá)96.46%,表明本文方法在變工況復(fù)雜運(yùn)行條件下具有較好的診斷性能。