霍天龍 梁耀方 張博 覃帥興
(桂林航天工業(yè)學(xué)院 電子信息與自動(dòng)化學(xué)院,廣西 桂林 541004)
旋轉(zhuǎn)機(jī)械設(shè)備已遍布于工業(yè)生產(chǎn)及日常生活,如航空發(fā)動(dòng)機(jī)、高檔數(shù)控機(jī)床、風(fēng)力發(fā)電機(jī)、軌道交通等。這些裝備的安全運(yùn)行對(duì)工業(yè)穩(wěn)定生產(chǎn)起著舉足輕重的作用[1]。運(yùn)行中如發(fā)生故障,輕者停機(jī)停產(chǎn),重者則會(huì)造成巨大的經(jīng)濟(jì)損失和惡劣的社會(huì)影響。因此,必須依靠有效的故障診斷方法為其保駕護(hù)航[1-3]。實(shí)際應(yīng)用中,機(jī)械裝備的結(jié)構(gòu)復(fù)雜,用于狀態(tài)監(jiān)測(cè)和故障診斷的傳感器數(shù)量較多,僅使用單一傳感器采集的信號(hào)進(jìn)行故障判別易導(dǎo)致誤判。故充分利用多傳感器采集的多信息數(shù)據(jù)集實(shí)施智能故障診斷已獲得“大數(shù)據(jù)”背景下學(xué)術(shù)界和工業(yè)界的共識(shí)[1,4-5]。傳統(tǒng)的用于故障診斷的數(shù)據(jù)融合算法大多是淺層網(wǎng)絡(luò)模型,如BP 神經(jīng)網(wǎng)絡(luò)(back propagation neural work,簡(jiǎn)稱 BPNN)、支持向量機(jī)(support vector machine,簡(jiǎn)稱 SVM)等,但這些模型都需要復(fù)雜的信號(hào)處理和較為全面的數(shù)據(jù)特征提取作為模型的樣本輸入,同時(shí)因其淺層的網(wǎng)絡(luò)結(jié)構(gòu)難以提取到深層的特征信息而降低了故障診斷的準(zhǔn)確率[6]。
近年來(lái),人工智能技術(shù)的迅猛發(fā)展帶動(dòng)著相關(guān)技術(shù)的長(zhǎng)足進(jìn)步。傳統(tǒng)的需依賴專家經(jīng)驗(yàn)的基于信號(hào)處理、特征提取、數(shù)據(jù)降維和故障分類技術(shù)的診斷方法逐步向以數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)為核心的智能故障診斷技術(shù)發(fā)展[7]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN )作為深度學(xué)習(xí)的一種重要模型已廣泛應(yīng)用于圖像處理、語(yǔ)音識(shí)別、目標(biāo)檢測(cè)等領(lǐng)域。在故障診斷領(lǐng)域,CNN以其強(qiáng)大的非線性特征提取和模式識(shí)別能力已取得豐碩的科研成果[3]。文獻(xiàn)[8]利用集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)對(duì)信號(hào)進(jìn)行降噪等處理,將處理后的信號(hào)轉(zhuǎn)化為二維信號(hào),應(yīng)用CNN進(jìn)行故障診斷,提高了診斷準(zhǔn)確率。文獻(xiàn)[9]對(duì)轉(zhuǎn)子振動(dòng)信號(hào)進(jìn)行特征提取,構(gòu)建了一種利用深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,簡(jiǎn)稱 DCNN)融合多傳感器信號(hào)特征的機(jī)械故障診斷方法,模型具有較好的魯棒性和泛化性。文獻(xiàn)[10]提出了一種基于深度時(shí)頻特征的機(jī)車軸承故障診斷新方法,具有一定的工程價(jià)值。文獻(xiàn)[11] 對(duì)齒輪箱故障振動(dòng)信號(hào)采用連續(xù)小波變換構(gòu)造其時(shí)頻圖,以其為輸入構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,通過(guò)多層卷積池化形成深層分布式故障特征表達(dá),獲得了較高的故障識(shí)別準(zhǔn)確率。雖然上述研究在故障辨識(shí)方面取得了優(yōu)異成績(jī),但均使用了信號(hào)特征提取或單一傳感器的數(shù)據(jù)作為網(wǎng)絡(luò)的數(shù)據(jù)輸入。一方面,特征提取需要根據(jù)信號(hào)特點(diǎn)依賴專家經(jīng)驗(yàn)開展,增加了故障診斷數(shù)學(xué)模型的復(fù)雜度。另一方面,單一或少數(shù)幾種特征提取方法不能全面反映數(shù)據(jù)的特征,造成故障診斷模型的泛化性能變差。
針對(duì)以上不足,本文提出了一種融合多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法,把轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上各種狀態(tài)下采集的多通道傳感器振動(dòng)信號(hào)直接送入1D-CNN進(jìn)行模型訓(xùn)練,應(yīng)用模型辨識(shí)轉(zhuǎn)子實(shí)驗(yàn)臺(tái)的實(shí)際運(yùn)行狀態(tài)。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN )是一類包含卷積運(yùn)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一[12]。研究表明,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的特征相對(duì)于人工設(shè)計(jì)的特征具有更強(qiáng)的判別能力和泛化能力[13]。卷積神經(jīng)網(wǎng)絡(luò)一般由輸入層、卷積層、池化層、全連接層和輸出層組成,其內(nèi)部通過(guò)梯度下降算法最小化損失函數(shù)對(duì)網(wǎng)絡(luò)的權(quán)重進(jìn)行反向調(diào)節(jié),同時(shí)不斷迭代訓(xùn)練來(lái)提高網(wǎng)絡(luò)的精度。一維卷積神經(jīng)網(wǎng)絡(luò)有類似的結(jié)構(gòu)且原理相同,更適合用于處理時(shí)間序列。
卷積層由多個(gè)卷積核組成,卷積核的數(shù)量是根據(jù)數(shù)據(jù)特點(diǎn)及模型結(jié)構(gòu)人為設(shè)定的。卷積核運(yùn)算是將核函數(shù)與局部的時(shí)間序列進(jìn)行運(yùn)算,從而實(shí)現(xiàn)數(shù)據(jù)的特征提取與降維處理,數(shù)學(xué)公式如下:
(1)
在卷積層后一般都需設(shè)置池化層,它由多個(gè)特征面組成,且一一對(duì)應(yīng)于上一卷積層輸出的特征面。通過(guò)人為設(shè)定的“窗口”大小對(duì)局部接受域進(jìn)行下采樣,池化層不改變特征面的數(shù)量,但會(huì)根據(jù)“窗口”大小縮小特征面的大小。常用的池化方法有最大池化、均值池化等,最大池化運(yùn)算的數(shù)學(xué)描述為:
(2)
全連接層一般位于“卷積+池化”模塊后,用于特征的再次提取與匯總,該層的每一個(gè)神經(jīng)元均與上一層的所有神經(jīng)元連接并對(duì)提取的特征進(jìn)行組合,然后映射到樣本標(biāo)記空間,最后使用softmax分類器輸出最終分類結(jié)果。Softmax分類過(guò)程的數(shù)學(xué)模型為:
(3)
式中:yj是樣本的分類值,zj是第j個(gè)神經(jīng)元的節(jié)點(diǎn)值,M是類別總數(shù)。
使用激活函數(shù)可以對(duì)上一層的輸出結(jié)果進(jìn)行非線性變換,將網(wǎng)絡(luò)的線性模型轉(zhuǎn)化為非線性模型,使得網(wǎng)絡(luò)能夠解決數(shù)據(jù)線性不可分問(wèn)題,提升網(wǎng)絡(luò)的學(xué)習(xí)和分類能力。常用的激活函數(shù)有sigmoid、tanh、ReLU和Maxout等。ReLU函數(shù)的計(jì)算公式為:
ReLU=max(0,x)
(4)
式中:x是時(shí)間序列。
本文要處理的是從轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上采集的多通道一維時(shí)間振動(dòng)信號(hào),如圖1所示,采用1D-CNN設(shè)計(jì)了多源傳感器信號(hào)故障診斷模型。該模型大致可分為3個(gè)部分,依據(jù)采集的振動(dòng)信號(hào)構(gòu)造一維數(shù)據(jù)集,利用數(shù)據(jù)集對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練與驗(yàn)證,使用訓(xùn)練好的模型對(duì)未知標(biāo)簽的振動(dòng)信號(hào)進(jìn)行故障診斷。
圖1 多源傳感器信號(hào)故障診斷模型
在多種工作狀態(tài)下采集轉(zhuǎn)子實(shí)驗(yàn)臺(tái)的多通道振動(dòng)信號(hào)并進(jìn)行歸一化數(shù)據(jù)處理,在n個(gè)傳感器通道上分別按照長(zhǎng)度l截取隨機(jī)截取數(shù)據(jù),獲得k個(gè)樣本,得到形狀為k×(n×l)的數(shù)據(jù)集,再對(duì)數(shù)據(jù)中的每個(gè)樣本進(jìn)行標(biāo)簽。打亂數(shù)據(jù)和標(biāo)簽一一對(duì)應(yīng)的k樣本,按6∶2∶2的比例劃分出訓(xùn)練集、驗(yàn)證集和測(cè)試集。把訓(xùn)練集數(shù)據(jù)送入1D-CNN模型進(jìn)行訓(xùn)練。
一維卷積神經(jīng)網(wǎng)絡(luò)的超參數(shù)主要包括學(xué)習(xí)率設(shè)置、批次數(shù)量、循環(huán)次數(shù)等。網(wǎng)絡(luò)參數(shù)主要包括卷積層的卷積核大小、數(shù)量和移動(dòng)步長(zhǎng),池化層的核大小及步長(zhǎng),網(wǎng)絡(luò)的深度等。欲使得網(wǎng)絡(luò)具有更強(qiáng)的魯棒性和泛化性,核心思想是獲得更大的感受野[14]。
轉(zhuǎn)子的運(yùn)動(dòng)是周期性轉(zhuǎn)動(dòng),運(yùn)行過(guò)程中難免會(huì)受到周圍環(huán)境和設(shè)備自身的噪聲干擾,故傳感器采集到的“真實(shí)”信號(hào)中混合了大量噪聲,有些噪聲是線性疊加的平穩(wěn)隨機(jī)噪聲,有些則以強(qiáng)脈沖干擾形式出現(xiàn)。因此,計(jì)算出傳感器在一個(gè)轉(zhuǎn)動(dòng)周期內(nèi)采集的數(shù)據(jù)長(zhǎng)度對(duì)1D-CNN的模型設(shè)計(jì)是至關(guān)重要的。設(shè)轉(zhuǎn)子的轉(zhuǎn)速為v/r·min-1,采樣頻率為f/Hz,則單周期的數(shù)據(jù)長(zhǎng)度N的計(jì)算公式如下:
(5)
一維卷積神經(jīng)網(wǎng)絡(luò)的卷積層從本質(zhì)上說(shuō)是信號(hào)消噪濾波和數(shù)據(jù)特征提取的過(guò)程,故希望第一卷積層的卷積核大小應(yīng)大于N。且為了獲取更多的故障信息,最后的池化層的單位神經(jīng)元至少可以獲得N個(gè)點(diǎn)的數(shù)據(jù)。
考慮上述討論,設(shè)計(jì)1D-CNN模型時(shí),第n層池化層的感受野Fn與上一層池化層的感受野Fn-1的計(jì)算關(guān)系如下式:
(6)
式中:kn是第n層卷積層中卷積核的大小,sn是第n層的卷積層移動(dòng)的步長(zhǎng),pn是第n層池化層核的大小。由上式可知,對(duì)最后池化層感受野的影響因素主要是上一層卷積層的步長(zhǎng)核池化層核的大小。
確定最后池化層參數(shù)后還應(yīng)考慮網(wǎng)絡(luò)深度的設(shè)計(jì),網(wǎng)絡(luò)過(guò)深易導(dǎo)致學(xué)習(xí)時(shí)間過(guò)程,在樣本數(shù)量較少時(shí)還會(huì)出現(xiàn)過(guò)擬合問(wèn)題,網(wǎng)絡(luò)過(guò)淺會(huì)出現(xiàn)模型分類精度低。經(jīng)多次探索和實(shí)驗(yàn)確定該模型由4層卷積層、4層池化層、2層全連接層和1層分類層組成。參數(shù)優(yōu)化方面使用了結(jié)合SGDM和RMSProp魯棒性能更好的 Adam的優(yōu)化器,能夠?yàn)椴煌瑓?shù)產(chǎn)生自適應(yīng)的學(xué)習(xí)速率。網(wǎng)絡(luò)參數(shù)如表1所示。
表1 1D-CNN網(wǎng)絡(luò)參數(shù)
通過(guò)布置在轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上的傳感器獲得的多通道振動(dòng)信號(hào),根據(jù)圖1的模型結(jié)構(gòu)設(shè)計(jì)融合多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法流程如圖2所示,詳細(xì)診斷流程如下:
1)使用多通道傳感器采集轉(zhuǎn)子實(shí)驗(yàn)臺(tái)多種工作狀態(tài)的振動(dòng)信號(hào);
2)對(duì)信號(hào)進(jìn)行歸一化處理;
3)構(gòu)造多通道一維數(shù)據(jù)集;
4)按上文比例劃分出訓(xùn)練集、驗(yàn)證集和測(cè)試集樣本;
5)初始化1D-CNN網(wǎng)絡(luò)模型參數(shù);
6)把訓(xùn)練集數(shù)據(jù)輸入至模型,通過(guò)前向傳播,計(jì)算誤差,使誤差最??;
7)通過(guò)反向傳播,更新網(wǎng)絡(luò)參數(shù);
8)使用驗(yàn)證集數(shù)據(jù)判斷誤差是否最小,如最小,則輸出訓(xùn)練完成的網(wǎng)絡(luò)模型;如不是,則返回步驟6);
9)使用得到的網(wǎng)絡(luò)模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行故障分類。
圖2 多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法流程
本研究所使用的故障模擬實(shí)驗(yàn)裝置如圖3所示,圖(a)是轉(zhuǎn)子實(shí)驗(yàn)臺(tái)的外觀全貌,圖(b)是結(jié)構(gòu)示意圖,顯示了采集轉(zhuǎn)子系統(tǒng)振動(dòng)響應(yīng)的13個(gè)通道電渦流傳感器的布置情況。其中的ch1-ch12通道用于拾取轉(zhuǎn)子振動(dòng)信號(hào),ch0通道用于采集轉(zhuǎn)速信號(hào)。實(shí)驗(yàn)過(guò)程中,分別模擬了轉(zhuǎn)子正常、動(dòng)靜碰磨、轉(zhuǎn)子不平衡、支座松動(dòng)和軸系不對(duì)中5中狀態(tài)。在轉(zhuǎn)速為2 800 r/min,采樣頻率為5 000 Hz的情況下分別采集5種工作狀態(tài)的數(shù)據(jù)。
圖3 轉(zhuǎn)子試驗(yàn)臺(tái)及其結(jié)構(gòu)示意圖
根據(jù)式(5)計(jì)算出當(dāng)前參數(shù)下轉(zhuǎn)子轉(zhuǎn)動(dòng)一個(gè)周期的數(shù)據(jù)長(zhǎng)度為107,考慮輸入網(wǎng)絡(luò)的數(shù)據(jù)應(yīng)至少大于一個(gè)周期數(shù)據(jù)長(zhǎng)度,并結(jié)合網(wǎng)絡(luò)模型大小、深度等因素,確定時(shí)間序列數(shù)據(jù)長(zhǎng)度應(yīng)大于4個(gè)周期。最終按數(shù)據(jù)長(zhǎng)度512采樣點(diǎn)在轉(zhuǎn)子實(shí)驗(yàn)臺(tái)各工作狀態(tài)下隨機(jī)采集12個(gè)通道的振動(dòng)信號(hào),共獲得包含了各種狀態(tài)下的5 000組數(shù)據(jù),與轉(zhuǎn)子運(yùn)行狀態(tài)一一對(duì)應(yīng)對(duì)每組數(shù)據(jù)進(jìn)行標(biāo)簽,隨機(jī)打亂數(shù)據(jù)后按2.1節(jié)提到的比例劃分?jǐn)?shù)據(jù),得到3 000×12×512數(shù)據(jù)形狀的訓(xùn)練集、1 000×12×512數(shù)據(jù)形狀的驗(yàn)證集和1 000×12×512數(shù)據(jù)形狀的測(cè)試集。
把訓(xùn)練集數(shù)據(jù)輸入到表1參數(shù)下的1D-CNN模型中,實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn)學(xué)習(xí)率設(shè)置太大,模型驗(yàn)證集的損失值下降迅速,下降過(guò)程中損失值震蕩嚴(yán)重,最終訓(xùn)練出的模型不穩(wěn)定,泛化性能不好;設(shè)置太小,經(jīng)過(guò)數(shù)輪次的訓(xùn)練后損失值不下降或下降很小,網(wǎng)絡(luò)收斂速度慢,驗(yàn)證集識(shí)別準(zhǔn)確率不高。批次設(shè)置太大,影響模型訓(xùn)練速度的同時(shí),驗(yàn)證集的識(shí)別準(zhǔn)確率不能達(dá)到最優(yōu)值,批次設(shè)置太小,訓(xùn)練集和驗(yàn)證集的識(shí)別準(zhǔn)確率很高,但測(cè)試集識(shí)別準(zhǔn)確率很低,模型容易陷入局部最優(yōu)。
經(jīng)反復(fù)實(shí)驗(yàn)選取最優(yōu)超參數(shù),最終設(shè)置學(xué)習(xí)率為0.000 1,批次為16,迭代次數(shù)為40,循環(huán)迭代訓(xùn)練網(wǎng)絡(luò)模型。為防止網(wǎng)絡(luò)訓(xùn)練過(guò)程發(fā)生過(guò)擬合現(xiàn)象,在Adam優(yōu)化器中設(shè)置權(quán)重衰減為0.000 01,在每個(gè)卷積層后使用了Batch Normalization進(jìn)行批標(biāo)準(zhǔn)化,在2個(gè)全連接層后使用Dropout隨機(jī)丟棄20%的神經(jīng)元連接,同時(shí)采用Early-stop-ping機(jī)制,在驗(yàn)證集損失值經(jīng)過(guò)5個(gè)循環(huán)后不再下降時(shí)停止網(wǎng)絡(luò)的訓(xùn)練。訓(xùn)練集和驗(yàn)證集的損失值和識(shí)別準(zhǔn)確率曲線如圖4所示。圖4(a)中訓(xùn)練集和驗(yàn)證集的損失值隨著迭代次數(shù)的增加下降相對(duì)較為平穩(wěn),最終驗(yàn)證集損失值為0.000 996;同時(shí)圖4(b)中訓(xùn)練集和驗(yàn)證集的識(shí)別準(zhǔn)確率也在不斷上升,最終驗(yàn)證集識(shí)別準(zhǔn)確率為99.57%,整個(gè)迭代學(xué)習(xí)訓(xùn)練過(guò)程表明卷積神經(jīng)網(wǎng)絡(luò)模型收斂速度快,識(shí)別準(zhǔn)確率高,模型參數(shù)設(shè)計(jì)合理。
圖4 訓(xùn)練集和驗(yàn)證集的損失值與精度曲線
把測(cè)試集數(shù)據(jù)隨機(jī)抽選500個(gè)樣本輸入至訓(xùn)練好的模型中進(jìn)行測(cè)試,最終的識(shí)別準(zhǔn)確率為99.4%,僅有3個(gè)標(biāo)記為支座松動(dòng)的樣本被誤識(shí)別為正常,其余497個(gè)樣本均被正確識(shí)別。測(cè)試結(jié)果表明模型對(duì)從未見過(guò)的數(shù)據(jù)也具有較高的識(shí)別準(zhǔn)確率,證明了模型具有較強(qiáng)的泛化能力。為清楚的展示識(shí)別效果,使用混淆矩陣可視化測(cè)試集的識(shí)別結(jié)果,如圖5所示。
圖5 測(cè)試集數(shù)據(jù)識(shí)別混淆矩陣
為了更清晰的展示多源傳感器數(shù)據(jù)與1D-CNN模型集成的轉(zhuǎn)子故障診斷識(shí)別過(guò)程和結(jié)果,采用非線性降維算法t-SNE(t-distributed stochastic neighbor embedding)把模型中各層數(shù)據(jù)降為2維并對(duì)數(shù)據(jù)進(jìn)行可視化。模型中各層數(shù)據(jù)可視化結(jié)果如圖6所示,圖6(a)為原始信號(hào)降維后可視化結(jié)果,由于未對(duì)信號(hào)進(jìn)行處理,轉(zhuǎn)子各工作狀態(tài)下信號(hào)類別很難區(qū)分。圖6(b)數(shù)據(jù)經(jīng)過(guò)1D-CNN模型的第1卷積+池化層后,支座松動(dòng)類別基本能夠和其余類別區(qū)分,表明這種故障狀態(tài)信號(hào)特征較其他類別明顯,但其余類別仍然混疊在一起無(wú)法區(qū)分。圖6(c)為數(shù)據(jù)通過(guò)第2卷積+池化層后,軸系不對(duì)中樣本聚類效果明顯,支座松動(dòng)類別聚集范圍也進(jìn)一步縮小,其余類別雖難以區(qū)分,但數(shù)據(jù)逐漸在聚集。圖6(d)為經(jīng)過(guò)第3卷積+池化層后,5種類別樣本數(shù)據(jù)基本被區(qū)分開,但數(shù)據(jù)聚集面積較大,分界面也不夠明顯。圖6(e)為數(shù)據(jù)經(jīng)過(guò)最后的卷積+池化層后,每種類別數(shù)據(jù)聚集面積縮小,類與類之間的間距增大,但仍有部分標(biāo)記為正常和動(dòng)靜碰磨的樣本數(shù)據(jù)被錯(cuò)誤聚類。圖6(f)為數(shù)據(jù)進(jìn)入最終分類層后,5種類別樣本已完全分開,聚集面積進(jìn)一步縮小,類別間的間距進(jìn)一步增大,可視化結(jié)果與圖5的混淆矩陣吻合。實(shí)驗(yàn)結(jié)果表明所設(shè)計(jì)的模型能夠高精準(zhǔn)地對(duì)測(cè)試集數(shù)據(jù)進(jìn)行辨識(shí)。
圖6 模型中各層數(shù)據(jù)可視化結(jié)果
為了驗(yàn)證所設(shè)計(jì)的1D-CNN模型具有良好的抗噪性,對(duì)多源傳感器采集到的信號(hào)進(jìn)行了降噪處理,對(duì)比了信號(hào)消噪前后模型的訓(xùn)練過(guò)程和對(duì)測(cè)試集的分類準(zhǔn)確率。如圖7所示,圖7(a)為布置在轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上的3#傳感器采集的振動(dòng)信號(hào)原始波形圖,信號(hào)中包含了大量的強(qiáng)脈沖干擾和平穩(wěn)隨機(jī)噪聲,采用文獻(xiàn)[15 ]中的濾波消噪算法得到圖7(b)的信號(hào)波形圖。把降噪后的12個(gè)通道數(shù)據(jù)按3.2節(jié)的實(shí)驗(yàn)方法輸入到本文設(shè)計(jì)的1D-CNN模型中進(jìn)行訓(xùn)練,模擬擬合后,用測(cè)試集數(shù)據(jù)測(cè)得模型的分類準(zhǔn)確率為99.36%。
圖7 振動(dòng)信號(hào)時(shí)域波形圖
模型參數(shù)學(xué)習(xí)過(guò)程的損失曲線和精度曲線如圖8所示,對(duì)比上文圖4可知,經(jīng)過(guò)消噪濾波后的數(shù)據(jù)送入模型后,除訓(xùn)練迭代次數(shù)由14次減少至10次外,損失值衰減曲線和識(shí)別準(zhǔn)確率曲線隨迭代次數(shù)的變化趨勢(shì)基本相同。實(shí)驗(yàn)結(jié)果證明了卷積神經(jīng)網(wǎng)絡(luò)對(duì)模型輸入信號(hào)是否需消噪預(yù)處理不敏感,同時(shí)也驗(yàn)證了其強(qiáng)大的非線性數(shù)據(jù)處理能力。
圖8 信號(hào)消噪后訓(xùn)練集和驗(yàn)證集的損失值與精度曲線
為驗(yàn)證融合多源傳感器數(shù)據(jù)能夠全方位的反應(yīng)設(shè)備實(shí)際運(yùn)行狀態(tài),為診斷模型設(shè)計(jì)提供完整的數(shù)據(jù),保證模型具有更高精度的識(shí)別率。使用單通道傳感器數(shù)據(jù)作為對(duì)比進(jìn)行實(shí)驗(yàn),把采集到的數(shù)據(jù)按3.1節(jié)進(jìn)行預(yù)處理,構(gòu)建出12個(gè)數(shù)據(jù)集。不同點(diǎn)在于所構(gòu)建的數(shù)據(jù)集通道數(shù)是1,即由5 000×12×512變?yōu)? 000×1×512。把12個(gè)數(shù)據(jù)集分別輸入至模型中進(jìn)行訓(xùn)練,并使用測(cè)試集數(shù)據(jù)對(duì)模型分類準(zhǔn)確率性能進(jìn)行測(cè)試,每個(gè)實(shí)驗(yàn)重復(fù)30次,實(shí)驗(yàn)結(jié)果如圖9所示。
圖中橫坐標(biāo)代表單獨(dú)使用布置在轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上的傳感器1~12的數(shù)據(jù)輸入至模型進(jìn)行訓(xùn)練集測(cè)試,記為方法1~12??v坐標(biāo)代表每種實(shí)驗(yàn)方法下測(cè)試集數(shù)據(jù)的分類準(zhǔn)確率。從圖中可以看出,單獨(dú)使用1個(gè)傳感器在本文模型中進(jìn)行測(cè)試,平均識(shí)別準(zhǔn)確率最高為方法7,達(dá)到了96.52%。準(zhǔn)確率最低的是單獨(dú)使用傳感器9,僅為78.03%。本文所提的方法識(shí)別準(zhǔn)確率為99.48%,均高于其他方法。因此,證明了融合多傳感器數(shù)據(jù)能夠?yàn)槟P偷挠?xùn)練和診斷提供更全面的信息。
圖9 多源傳感器數(shù)據(jù)與單傳感器數(shù)據(jù)診斷結(jié)果對(duì)比
使用數(shù)據(jù)增強(qiáng)技術(shù)擴(kuò)充數(shù)據(jù)集樣本,使得總樣本數(shù)分別為500,1 000,2 000,5 000,10 000和20 000組,打亂數(shù)據(jù)后統(tǒng)一按照2.1節(jié)比例劃分樣本。分別把樣本數(shù)不同的訓(xùn)練集數(shù)據(jù)輸入至本文設(shè)計(jì)的1D-CNN模型中進(jìn)行訓(xùn)練,并使用測(cè)試集數(shù)據(jù)對(duì)模型的分類能力進(jìn)行測(cè)試。鑒于樣本制作過(guò)程是通過(guò)計(jì)算機(jī)程序隨機(jī)在時(shí)間序列上進(jìn)行的,且網(wǎng)絡(luò)模型參數(shù)的初始化也是隨機(jī)的,為保證驗(yàn)證樣本數(shù)量對(duì)模型測(cè)試結(jié)果的穩(wěn)定性,每個(gè)實(shí)驗(yàn)重復(fù)30次,實(shí)驗(yàn)結(jié)果如表2所示。
表2 樣本數(shù)量對(duì)模型識(shí)別準(zhǔn)確的對(duì)比
通過(guò)表2可以看出,隨著數(shù)據(jù)樣本數(shù)量的增加,模型對(duì)驗(yàn)證集和測(cè)試集數(shù)據(jù)的識(shí)別準(zhǔn)確率逐漸上升,當(dāng)總數(shù)據(jù)超過(guò)5 000組后,模型的總體識(shí)別準(zhǔn)確率趨于平穩(wěn),且對(duì)驗(yàn)證集和測(cè)試集的識(shí)別準(zhǔn)確率幾乎相同,說(shuō)明模型的泛化性能優(yōu)良。但當(dāng)總數(shù)據(jù)樣本數(shù)為500組時(shí),模型對(duì)驗(yàn)證集的識(shí)別準(zhǔn)確率可達(dá)90%以上,但在測(cè)試集上的準(zhǔn)確率僅為82.45%,說(shuō)明驗(yàn)證集數(shù)據(jù)在模型驗(yàn)證時(shí)有一部分也參與了模型的學(xué)習(xí),但對(duì)從未見過(guò)的測(cè)試集數(shù)據(jù)準(zhǔn)確率卻很低,實(shí)驗(yàn)結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)模型的辨識(shí)性能和泛化能力受數(shù)據(jù)樣本數(shù)量大小的影響較大。
本文提出了一種融合多源傳感器數(shù)據(jù)與1D-CNN集成的轉(zhuǎn)子故障診斷方法。實(shí)驗(yàn)結(jié)果表明,該方法所設(shè)計(jì)的模型易于網(wǎng)絡(luò)訓(xùn)練、識(shí)別準(zhǔn)確率高,為轉(zhuǎn)子故障診斷研究提供了有價(jià)值的參考。通過(guò)多方面的對(duì)比實(shí)驗(yàn),得到以下結(jié)論:
1)通過(guò)模型輸入層采用大于4個(gè)周期長(zhǎng)度的數(shù)據(jù),第一層使用至少可以覆蓋1個(gè)周期數(shù)據(jù)長(zhǎng)度的較大卷積核,可以獲取更多的數(shù)據(jù)信息并傳遞給網(wǎng)絡(luò)的輸出層,保證最后池化層的單位神經(jīng)元至少可以獲得1個(gè)周期的數(shù)據(jù)長(zhǎng)度。同時(shí)使用了BN、Dropuot、Early-stop-ping及在Adam優(yōu)化器中增加權(quán)重等策略防止過(guò)擬合現(xiàn)象的發(fā)生,提升了模型的魯棒性和分類準(zhǔn)確率。
2)所設(shè)計(jì)的模型可直接作用于多傳感器采集的一維時(shí)間序列,無(wú)須專家經(jīng)驗(yàn)的信號(hào)消噪和人工特征提取過(guò)程。
3)使用多傳感器數(shù)據(jù)同時(shí)輸入至網(wǎng)絡(luò)與單傳感器數(shù)據(jù)相比,其更能完整、全面的表征機(jī)械設(shè)備實(shí)際工作狀態(tài),提高了模型的故障診斷精度。