亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于VAE-GAN和FLCNN的不均衡樣本軸承故障診斷方法

        2022-05-16 11:08:02張永宏張中洋趙曉平王麗華呂凱揚
        振動與沖擊 2022年9期
        關鍵詞:故障診斷軸承卷積

        張永宏,張中洋,趙曉平,王麗華,邵 凡,呂凱揚

        (1.南京信息工程大學 自動化學院,南京 210044;2.南京信息工程大學 計算機與軟件學院,南京 210044;3.南京信息工程大學 江蘇省網(wǎng)絡監(jiān)控中心,南京 210044)

        滾動軸承是旋轉(zhuǎn)機械設備中的核心部件之一,由于長時間的運行和復雜的系統(tǒng)環(huán)境,其常常發(fā)生損壞,甚至會導致事故發(fā)生。因此,精準地診斷出滾動軸承的健康狀態(tài)對于監(jiān)測設備健康,及時排除安全隱患具有重大意義[1]。經(jīng)典的軸承故障診斷方法大多基于故障信號的分解、變換,通過人工手段提取故障特征,例如經(jīng)驗模態(tài)分解[2]、小波變換[3]等。近年來,不少學者開始將神經(jīng)網(wǎng)絡方法和信號處理技術結(jié)合進行軸承故障診斷。常見的有支持向量機[4]、深度置信網(wǎng)絡[5]、卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)[6]等。然而這些方法需要大量分布均衡的故障數(shù)據(jù)作為支撐才能獲得較好的診斷效果。在實際生產(chǎn)中,機械設備發(fā)生故障是低概率事件,并且采集故障數(shù)據(jù)時設備可能已經(jīng)無法運行,這導致采集到的故障類樣本常常遠少于正常類樣本,產(chǎn)生樣本分布不均衡問題。

        目前,國內(nèi)外專家、學者針對樣本不均衡問題主要從數(shù)據(jù)擴充和算法改進兩個方面進行研究。Chawla等[7]提出了經(jīng)典的合成少數(shù)類過采樣技術(synthetic minority oversampling technique,SMOTE),通過在少數(shù)類樣本間進行線性隨機插值生成新的樣本,從而使原始數(shù)據(jù)分布均衡。Douzas等[8]對SMOTE方法進行改進,提出了Kmeans-SMOTE算法,并將其應用到實際問題中。姚培等[9]提出一種基于代價敏感度框架的Boosting故障診斷方法,通過建立一個新的代價敏感損失函數(shù),賦予正樣本和負樣本不同的懲罰因子,在轉(zhuǎn)子故障數(shù)據(jù)不足的情況下,明顯提高了故障診斷性能。盡管上述方法在解決樣本不均衡問題時能夠產(chǎn)生一定的效果,但過采樣方法在合成新樣本的同時也可能造成過生成、過泛化或者改變原始數(shù)據(jù)分布的問題[10];代價敏感算法需要對代價參數(shù)進行合理設置,并且當數(shù)據(jù)不均衡比過大時,由于缺少少數(shù)類樣本的特征信息,算法的提升效果有限。

        深度學習模型以其可以自動學習數(shù)據(jù)特征的優(yōu)點,在圖像分類、目標識別等領域已經(jīng)取得了巨大成功[11]。其中生成對抗網(wǎng)絡(generative adversarial networks,GAN)[12]和變分自編碼器(variational auto-encoder,VAE)[13]是近年來興起的最具潛力的生成模型,經(jīng)過研究者的不斷改進,已被廣泛應用于圖像修復[14]、風格遷移[15]、超分辨率重建[16]以及故障診斷等領域。王威等[17]研究了一種少樣本信息情況下的行星齒輪箱故障診斷方法,利用生成對抗網(wǎng)絡產(chǎn)生補充的故障樣本,提高了樣本不均衡條件下的診斷準確率。Cabrera等[18]提出一種基于GAN的往復式機械故障診斷方法,通過試驗證明了在數(shù)據(jù)失衡情況下該方法的有效性。張周磊等[19]針對同步電機樣本稀少引起的診斷偏差問題,提出一種基于變分自編碼的故障樣本快速擴展策略,豐富了訓練數(shù)據(jù)集。盡管如此,GAN在實際應用中還存在訓練不穩(wěn)定、梯度消失等問題,容易造成生成圖像失真;VAE生成的圖像會出現(xiàn)邊緣模糊,缺少紋理細節(jié)的問題。兩種方法各有不足,一定程度上限制其在各領域中進一步的發(fā)展和應用。

        總體來說,在故障診斷領域,針對樣本不均衡問題的研究還較少,應用于軸承故障診斷的方法更加屈指可數(shù)。此外,現(xiàn)有方法大多是針對二分類診斷問題進行建模,且不均衡比例單一,適用范圍有限?;谝陨戏治?,為了解決故障類樣本與正常類樣本分布不均衡情況下的軸承故障診斷問題,本文提出一種基于VAE-GAN+FLCNN的故障診斷模型。首先,對采集到的振動信號進行快速傅里葉變換并切分為訓練集和測試集;其次,將樣本量少的故障類數(shù)據(jù)輸入到VAE-GAN模型訓練,生成相應的故障樣本;然后把生成的樣本混合到真實樣本中進行數(shù)據(jù)增廣,使各類樣本分布均衡;最后將增廣后的訓練數(shù)據(jù)輸入FLCNN樣本分類模型中,利用卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的特征提取能力和焦點損失(focal loss,FL)對故障類樣本的關注實現(xiàn)軸承故障的精準分類。試驗結(jié)果表明,提出的VAE-GAN+FLCNN方法與其他3種經(jīng)典方法(SMOTE+CNN、VAE+CNN、GAN+CNN)相比能夠取得更好的故障診斷效果。

        1 相關原理介紹

        1.1 變分自編碼器

        VAE是一種基于變分推斷的隱空間生成模型,被廣泛應用于數(shù)據(jù)生成。與普通自編碼器相比,VAE能夠?qū)W習到隱含變量的近似概率分布,并通過采樣生成新的數(shù)據(jù)。假設訓練數(shù)據(jù)集為X,隱含變量為Z,由貝葉斯公式可推斷出Z的概率分布,如式(1)所示。

        (1)

        式中:P(Z|X)為給定X時Z的概率分布,即可以通過觀測大量的數(shù)據(jù)樣本來計算隱變量的分布情況。但在實際應用中,真實數(shù)據(jù)X一般為高維連續(xù)變量,難以用公式直接求解出Z的分布。因此,VAE使用神經(jīng)網(wǎng)絡訓練一個簡單的分布Q(Z)來近似P(Z|X),并通過KL(Kullback Leibler)散度[20]來度量二者的接近程度。

        由于任意復雜的分布都可由簡單分布經(jīng)過函數(shù)映射而成,為了簡化求解過程,一般假定Q(Z)服從于高斯分布,隱變量Z服從于標準正態(tài)分布,即Q(Z)~N(μ,σ2),P(Z)~N(0,1)。μ和σ2表示均值和方差,可以通過網(wǎng)絡學習得到。為了能使用梯度下降法優(yōu)化網(wǎng)絡,在采樣操作時,VAE運用重參數(shù)方法[21],通過一個高斯噪聲e將μ和σ2組合成隱變量Z,即Z=μ+e×σ,VAE的網(wǎng)絡結(jié)構(gòu)如圖1所示。

        圖1 VAE網(wǎng)絡結(jié)構(gòu)圖

        VAE的網(wǎng)絡結(jié)構(gòu)主要包含隱變量編碼部分和解碼生成部分,模型的優(yōu)化目標是盡可能使學習到的隱變量分布逼近標準正態(tài)分布,并且不斷縮小生成樣本和原始真實樣本間的重構(gòu)誤差,其損失函數(shù)如式(2)所示。

        (2)

        1.2 生成對抗網(wǎng)絡

        GAN由兩個部分組成,即生成器(generator,G)和判別器(discriminator,D),模型基本結(jié)構(gòu)如圖2所示。其中,G的作用是學習真實數(shù)據(jù)的潛在分布,并生成新的數(shù)據(jù)樣本,其輸入是一定維度的隨機向量。D相當于一個二分類器,訓練目標是最大程度判斷出輸入網(wǎng)絡的是真實樣本還是G生成的假樣本。

        圖2 GAN網(wǎng)絡結(jié)構(gòu)圖

        網(wǎng)絡優(yōu)化過程中,生成器G和判別器D二者交替訓練,相互對抗。G不斷提高網(wǎng)絡的生成能力,D不斷提高網(wǎng)絡的判別能力,最終達到平衡狀態(tài)。此時,G生成的樣本接近于真實樣本,而D也難以判斷數(shù)據(jù)的真假,GAN的損失函數(shù)如式(3)所示。

        Ez~Pz(z)[log2(1-D(G(z)))]

        (3)

        式中:x為真實樣本;z為隨機向量;Pdata為真實樣本的分布;G(z)為生成器生生成的數(shù)據(jù),網(wǎng)絡的訓練目標是最小化生成器損失和最大化判別器的輸出值。

        1.3 焦點損失

        焦點損失(focal loss,F(xiàn)L)是由Lin等[22]針對目標檢測中的類別不平衡問題提出的,由標準交叉熵損失函數(shù)改進而來。其主要思想是通過降低易分樣本的權重,使模型在訓練時更加關注難分樣本。

        (4)

        傳統(tǒng)交叉熵損失對每個樣本的預測標簽進行計算疊加,在各類樣本數(shù)量不一致時會降低少數(shù)類樣本的損失比率。FL在交叉熵的基礎上引入兩個可調(diào)節(jié)的參數(shù),對訓練數(shù)據(jù)中的難分樣本和少樣本類別分配更大的權重,表達式如式(5)所示。

        (5)

        式中:(1-pj)γ為調(diào)制系數(shù);αj和γ為超參數(shù),用來調(diào)節(jié)不同類別的樣本在損失中占的權重。當某類樣本難分時,預測標簽pj的值會偏小,通過設置γ為大于1的整數(shù),(1-pj)γ將變大,從而增加分類權重。

        2 VAE-GAN+FLCNN故障診斷模型的構(gòu)建

        針對軸承故障診斷中故障類樣本和正常類樣本分布不均衡的問題,本文從數(shù)據(jù)和算法兩個方面入手,采用VAE-GAN樣本增廣模型來增加故障類樣本,然后通過FLCNN分類模型對軸承故障進行識別,將兩個模型融合,從而構(gòu)建VAE-GAN+FLCNN故障診斷模型。

        2.1 VAE-GAN樣本增廣模型

        盡管VAE和GAN模型在數(shù)據(jù)生成方面已經(jīng)取得了良好的效果,但傳統(tǒng)VAE生成的數(shù)據(jù)往往比較模糊,對復雜模型的表達能力差;傳統(tǒng)GAN訓練困難,生成器和判別器很難同時收斂,且容易出現(xiàn)梯度消失問題?;诖?,本文同時借鑒了VAE對數(shù)據(jù)的特征編碼能力和GAN的對抗學習機制,提出VAE-GAN樣本增廣模型。

        VAE-GAN模型在GAN的基礎上增加了真實樣本的特征編碼部分,用編碼后得到的隱變量代替隨機向量來改進網(wǎng)絡,具體結(jié)構(gòu)包含3個部分,即編碼網(wǎng)絡、生成網(wǎng)絡和判別網(wǎng)絡,如圖3所示。

        圖3 VAE-GAN網(wǎng)絡結(jié)構(gòu)

        編碼網(wǎng)絡由3個全連接層組成,其作用是將輸入的高維真實樣本映射為2個低維的特征參數(shù),即數(shù)據(jù)分布的均值和方差。編碼網(wǎng)絡的優(yōu)化目標是最小化隱變量分布與標準正態(tài)分布之間的KL散度,其損失函數(shù)如式(6)所示。

        (6)

        式中:μ和σ2為編碼網(wǎng)絡輸出的均值和方差;KL(·)為計算兩個數(shù)據(jù)分布之間的散度。

        生成網(wǎng)絡由5個反卷積層組成,除最后一層外,對每一層輸出進行批標準化,激活函數(shù)采用Relu。生成網(wǎng)絡將輸入的低維隱變量逐層進行特征放大,最終生成和真實樣本尺寸相同的新樣本,其優(yōu)化目標除了盡可能生成逼真的樣本去欺騙判別網(wǎng)絡,還包括最小化生成樣本和真實樣本間的特征誤差,損失函數(shù)為

        (7)

        式中:Z為由μ和σ2采樣合成的隱變量;G(Z)為生成的樣本;D(·)為判別網(wǎng)絡將輸入數(shù)據(jù)判斷為真實樣本的概率;Dl(·)為判別網(wǎng)絡第l層輸出的特征向量;X為輸入的真實樣本。

        判別網(wǎng)絡由4個卷積層和2個全連接層組成,每個卷積層后面加入了批標準化層,除了最后的輸出層,其余層激活函數(shù)采用LeakyRelu。判別網(wǎng)絡將輸入的真實樣本和生成網(wǎng)絡生成的樣本進行特征提取和降維,最后通過Sigmoid激活后輸出真?zhèn)螛撕?,其?yōu)化目標是盡可能地區(qū)分出輸入的是真實樣本還是生成樣本,損失函數(shù)如式(8)所示。

        LD=log2D(X)+log2(1-D(G(Z)))

        (8)

        VAE-GAN模型將VAE的解碼部分和GAN的生成器合為一體,綜合兩個模型的優(yōu)點,使二者相互促進,既能改善生成數(shù)據(jù)的質(zhì)量,也能緩解模型訓練不夠穩(wěn)定、難以收斂問題。訓練生成網(wǎng)絡時,利用真實樣本編碼后的隱變量代替原始GAN中的隨機向量,提升生成網(wǎng)絡中初始參數(shù)與真實樣本間的關聯(lián)性,并且將判別網(wǎng)絡從生成樣本和真實樣本中提取到的特征向量進行誤差優(yōu)化,能夠使生成網(wǎng)絡更快地學習到真實數(shù)據(jù)的分布,不至于在對抗訓練中輕易被判別網(wǎng)絡擊敗。此外,在判別網(wǎng)絡和生成網(wǎng)絡的搭建上,借鑒了DCGAN(deep convolutional generative adversarial networks)[23]的結(jié)構(gòu)設計,通過一些經(jīng)驗性的結(jié)構(gòu)設計使得對抗訓練更加穩(wěn)定,采用了卷積和反卷積結(jié)構(gòu)以及批歸一化層,并去掉了池化層,VAE-GAN的訓練步驟如下:

        步驟1輸入N個真實樣本X={x(1),x(2),…,x(N)};

        步驟2對輸入樣本進行編碼(μ,σ2)=Encoder(X);

        步驟3對(μ,σ2)采樣合成隱變量,Z=μ+e×σ;

        步驟4將隱變量輸入生成網(wǎng)絡生成樣本;

        步驟5將生成樣本和真實樣本輸入判別網(wǎng)絡;

        步驟6用梯度下降法更新LE、LG、LD中的參數(shù);

        步驟7重復步驟1~步驟6,直到滿足最大訓練次數(shù)。

        2.2 FLCNN樣本分類模型

        CNN具有強大的特征表征能力,在特征提取方面展現(xiàn)出巨大的優(yōu)勢,其網(wǎng)絡結(jié)構(gòu)主要包含卷積層、池化層和全連接層[24],能夠自主提取故障信號中的不同特征,從而完成故障分類。根據(jù)學習任務的不同,通常將不同數(shù)量的卷積層和池化層堆疊起來組成不同深度的卷積網(wǎng)絡結(jié)構(gòu)。

        傳統(tǒng)CNN在分類時一般采用平方誤差或交叉熵作為損失函數(shù),將數(shù)據(jù)集中每個類別平等看待,無法適應類別不均衡和樣本難易程度不一致的分類問題。在文中,為了適應軸承信號的一維特性,采用一維卷積結(jié)構(gòu)搭建故障識別模型。此外,盡管前期已經(jīng)通過VAE-GAN方法解決了故障類樣本數(shù)量的不足問題,但其只是在數(shù)據(jù)層面上的處理,并且由于生成模型本身的限制,生成的樣本并不能完全替代真實樣本。因此,為了進一步提升識別模型對故障類樣本的分類準確性,在損失計算部分采用FL函數(shù)代替?zhèn)鹘y(tǒng)的交叉熵損失,增加故障類樣本的錯分權重,減小正常類樣本的錯分權重,從而在算法層面上加強模型對故障類樣本的關注度。在此基礎上,提出FLCNN樣本分類模型,結(jié)構(gòu)如圖4所示。

        由圖4可知,F(xiàn)LCNN樣本分類模型包含3個卷積模塊和2個全連接層,每個卷積模塊由1個卷積層和1個池化層組成。其中,卷積層通過不同尺寸的卷積核與訓練數(shù)據(jù)進行卷積運算來提取局部特征;池化層通過下采樣方式減少特征維數(shù),加快訓練速度和避免模型過度擬合;全連接層將最終提取到的特征圖映射為一維向量然后送入分類器。模型的輸入是包含真實樣本和生成樣本的均衡數(shù)據(jù)集,輸出是每個樣本的識別結(jié)果。計算分類損失時,通過設置Focal Loss中參數(shù)α和γ的值以賦予故障類樣本和正常類樣本不同的分類權重。

        圖4 樣本分類模型

        2.3 VAE-GAN+FLCNN模型訓練流程

        VAE-GAN+FLCNN故障診斷模型的整體框架包含數(shù)據(jù)預處理、故障樣本增廣和樣本分類3個部分,訓練流程如圖5所示。

        圖5 軸承故障診斷流程

        (1)數(shù)據(jù)預處理

        試驗采集的軸承故障數(shù)據(jù)為時域振動信號,其存在采樣點密集、故障特征不明顯、信息冗余的問題。相比之下,頻域信號的規(guī)律性更強,包含的有用信息和特征也更加明顯。因此,把時域信號按照每2 000點為一段切分成多個樣本,然后進行快速傅里葉變換,將得到的頻域樣本劃分為訓練集和測試集,隨機去除一定數(shù)量的故障樣本使訓練集樣本分布不均衡。

        (2)故障樣本增廣

        將各訓練集中數(shù)量少的故障類樣本分別輸入VAE-GAN模型進行訓練,然后把生成的樣本混合到原始分布不均衡的訓練集中實現(xiàn)故障樣本的增廣。

        (3)樣本分類

        將經(jīng)過故障樣本增廣后的均衡訓練集輸入搭建好的FLCNN樣本分類模型訓練,然后用訓練完成的模型對測試集數(shù)據(jù)進行診斷,通過CNN強大的特征提取能力和Focal Loss對故障類樣本的關注實現(xiàn)對各類樣本的準確識別。

        3 試驗與分析

        3.1 試驗數(shù)據(jù)

        本文的試驗數(shù)據(jù)采集自Spectra Quest公司制造的動力傳動故障診斷試驗臺(drivertrain diagnostics simulator,DDS),試驗裝置如圖6所示。試驗共采集到5種狀態(tài)的故障軸承數(shù)據(jù),除去正常狀態(tài),其余4種故障軸承的實物,如圖7所示。每個故障軸承不區(qū)分損傷位置和損傷程度,框內(nèi)標注的字母表示軸承的故障類型:Ball為滾動體故障,Combine為復合故障(滾動體、內(nèi)圈和外圈均發(fā)生損傷),Inner為內(nèi)圈故障,Outer為外圈故障。

        圖6 動力傳動故障診斷試驗臺

        圖7 軸承的4種故障狀態(tài)

        為了使采集到的軸承數(shù)據(jù)更具多樣化和普遍性,能夠包含多種條件下的軸承數(shù)據(jù),更加貼近實際情況,試驗設置了4種電機轉(zhuǎn)速(1 700 r/min、1 800 r/min、3 400 r/min、3 800 r/min)和4種負載(負載電壓為0、4 V、6 V、8 V),共16種工況狀態(tài)。采用單向加速度傳感器獲取振動信號,采樣頻率設置為20 kHz,采樣時間20 s。每種故障狀態(tài)下得到16個振動信號文件(16種工況,每種工況得到1個文件),每個文件包含409 600個點。按照每2 000點為一段進行切分,每個文件得到200個樣本,最終共獲取16 000個樣本,其中每類故障有3 200個樣本(包含各種工況數(shù)據(jù)),通過快速傅里葉變換得到頻域數(shù)據(jù)樣本。取每類故障樣本的25%作為測試集,為了制造樣本分布不均衡的訓練集,在剩余的75%樣本中,把正常狀態(tài)之外的4類故障樣本隨機去除一定的數(shù)量,使其滿足故障樣本與正常樣本的比例分別為1∶2,1∶5,1∶10和1∶40,將這4種類別的數(shù)據(jù)集定義為訓練集A、B、C、D,每個訓練集中均包含了各種工況的軸承數(shù)據(jù),數(shù)據(jù)集具體切分情況如表1所示。

        表1 試驗數(shù)據(jù)集

        3.2 試驗過程及結(jié)果分析

        3.2.1 試驗參數(shù)設置

        編程環(huán)境為i7-4790 CPU、英偉達GTX1050Ti、python3.7、Pytorch1.3。試驗分為VAE-GAN增廣故障樣本和FLCNN樣本分類兩個部分,訓練樣本增廣模型時,Batch-size設置為60,采用Adam優(yōu)化器,學習率均設置為0.000 2,迭代500次;訓練分類模型時,Batch-size設置為100,采用Adam優(yōu)化器,學習率設置為0.001,迭代300次,F(xiàn)ocal Loss中參數(shù)α的值設為1,γ大小參照經(jīng)驗值設為2,能夠增加難分樣本的錯分權重。

        VAE-GAN和FLCNN模型中的具體參數(shù),如表2和表3所示。其中神經(jīng)元個數(shù)括號中的數(shù)值分別表示前一層的節(jié)點個數(shù)和當前層的節(jié)點個數(shù),卷積參數(shù)括號中的數(shù)值分別表示輸入通道、輸出通道、卷積核尺寸、步長和padding的大小,池化參數(shù)括號中的數(shù)值分別表示池化窗口大小和步長。

        表2 VAE-GAN模型的參數(shù)設置

        表3 FLCNN模型的參數(shù)設置

        3.2.2 VAE-GAN樣本增廣效果分析

        為了驗證VAE-GAN模型對故障樣本的生成效果,將訓練集A、B、C、D中的真實樣本(見表1)分別輸入模型訓練,通過生成網(wǎng)絡生成一定數(shù)量的故障樣本。不均衡比為1∶10(即使用訓練集C訓練模型)情況下4種故障軸承的真實樣本和生成樣本的頻域圖,如圖8所示。

        圖8中,實線代表真實故障樣本,虛線代表VAE-GAN模型生成的樣本,為了量化二者的接近程度,借鑒文獻[25]中的相似度計算法,求解真實樣本和生成樣本的均方根誤差并進行歸一化處理,得到的結(jié)果越接近1表明二者的相似度越高。相似度計算方法如式(9)所示。

        (a)滾動體故障樣本對比

        (9)

        為從整體上驗證生成樣本與真實故障樣本在空間分布上的近似程度,對原始不均衡數(shù)據(jù)集和增廣后分布均衡的數(shù)據(jù)集進行T-SNE可視化。同樣以1∶10不均衡情況為例,提取數(shù)據(jù)的前3個主要特征,可視化結(jié)果如圖9所示。

        (a)原始真實數(shù)據(jù)的特征散點

        圖9(a)為原始真實數(shù)據(jù)的分布情況,從圖9中可以明顯看出:正常類樣本數(shù)量多且集中,包含的特征信息更為全面;而故障類樣本分布稀疏,各故障類之間重疊也較多。圖9(b)為增廣后的數(shù)據(jù)分布情況,可以看出:用VAE-GAN生成的樣本有效地補充了故障樣本的數(shù)量,使各類故障樣本與正常類樣本在數(shù)量上保持一致;同時,生成樣本基本都聚集在真實故障樣本周圍,使每類故障的特征點更加豐富和集中,從而大大增加了類間的可區(qū)分性。從以上分析可以得出,提出的VAE-GAN樣本增廣模型有效解決了故障樣本不足問題。

        3.2.3 VAE-GAN+FLCNN故障診斷效果分析

        在一般的分類問題中,通常采用準確率作為模型的評價指標,但這對于數(shù)據(jù)分布不均衡的情況并不適用[26]。本文選擇更能反映各種故障類型分類情況的Recall和F1-score作為試驗的評價指標,并通過可視化混淆矩陣,給出了每一類故障的分類情況。Recall也被稱為查全率,能夠反映每類故障被分類正確的比重;F1-score反映的是精確率(Precision)和Recall的綜合水平,其值越高說明分類模型越穩(wěn)健。

        為驗證提出的VAE-GAN+FLCNN模型在樣本不均衡條件下對各類軸承故障的診斷效果,對采集的5種軸承故障數(shù)據(jù),設置3組試驗進行階段性對比:第一組將原始分布不均衡的數(shù)據(jù)直接輸入CNN進行訓練;第二組先通過VAE-GAN模型生成故障樣本,然后將增廣后分布均衡的數(shù)據(jù)集輸入CNN進行訓練;第三組采用改進完全的VAE-GAN+FLCNN方法進行訓練。使用測試集驗證各組試驗的診斷結(jié)果,對Recall和F1-score值進行對比,結(jié)果如表4所示。

        從表4可知,當直接采用CNN進行診斷,Recall值和F1-score值都比較低,并且不均衡程度越高,診斷結(jié)果越差,尤其是使用訓練集D訓練網(wǎng)絡時,Recall值和F1-score值僅有0.51和0.44;而采用VAE-GAN進行樣本增廣后,CNN的診斷結(jié)果有明顯的提升,Recall值和F1-score值在訓練集D上仍然可以達到0.83和0.82,使用訓練集A時,兩個指標的值都達到了0.96;采用VAE-GAN+FLCNN方法后,即首先進行數(shù)據(jù)增廣,并將Focal Loss應用到CNN模型,診斷效果得到進一步的改善,兩個指標在使用訓練集A作為訓練數(shù)據(jù)時的值都為0.98,即使在訓練集D上也能達到0.86和0.84。

        表4 VAE-GAN+FLCNN方法不同改進階段診斷結(jié)果的Recall、F1-score值對比

        為了清晰地展示VAE-GAN+FLCNN方法對每類樣本的識別情況,將其與CNN方法進行對比,以訓練集A和訓練集D作為訓練數(shù)據(jù)為例,診斷結(jié)果的混淆矩陣如圖10所示。

        圖10 不均衡比為1∶2和1∶40時CNN方法和VAE-GAN+FLCNN方法診斷結(jié)果的混淆矩陣對比

        縱坐標表示樣本的真實類別,橫坐標表示預測的類別。當不均衡比為1∶2時,從圖10可知,用CNN進行診斷,只有正常類樣本被準確識別,其他故障類均有不同數(shù)量的樣本被錯分。在圖10(a)中,800個正常類樣本都被預測正確,而外圈故障僅有638個被預測正確;采用VAE-GAN+FLCNN方法后,各類樣本均能被準確識別;在圖10(b)中,正常類樣本都被預測正確,外圈故障也有782個被預測正確,比CNN增加了144個。當不均衡比為1∶40時,從圖10(c)和圖10(d)可知,用CNN進行診斷,4種故障的分類情況很差,有大量樣本被識別錯誤。在圖10(c)中,滾動體故障和外圈故障分別僅有350個和441個樣本被預測正確;采用VAE-GAN+FLCNN方法后,錯分的故障樣本數(shù)大大減少;在圖10(d)中,滾動體故障和外圈故障分別有578個和664個樣本被預測正確,其他故障類別被正確預測的樣本也顯著增多。綜合來看,無論訓練數(shù)據(jù)的不均衡程度低或高,提出的VAE-GAN+FLCNN方法均能提升故障診斷效果。

        3.3 與其他方法對比分析

        為了進一步驗證VAE-GAN+FLCNN方法對不均衡樣本故障診斷的有效性,選取SMOTE+CNN方法、VAE+CNN方法和GAN+CNN方法作為對比。SMOTE方法通過在真實樣本間進行隨機插值來擴充數(shù)據(jù),VAE和GAN方法即1.1節(jié)、1.2節(jié)介紹的標準變分自編碼網(wǎng)絡和生成對抗網(wǎng)絡,試驗結(jié)果的Recall值和F1-score值如表5所示。

        表5 不同故障診斷方法的Recall、F1-score對比

        從表5可知,在不同的訓練數(shù)據(jù)集下,SMOTE+CNN方法的故障診斷效果均是最差的,使用訓練集D作為訓練數(shù)據(jù)時,Recall值和F1-score值只有0.69和0.67,表明通過簡單插值方法增加訓練樣本數(shù)量并不能使模型學到更多的特征信息,提高模型對測試樣本的泛化性;GAN+CNN方法的診斷效果在3種對比方法中表現(xiàn)最好,在使用訓練集A作為訓練數(shù)據(jù)時,Recall值和F1-score值達到0.92和0.94,但當使用訓練集D作為訓練數(shù)據(jù)時效果仍然不理想,Recall值和F1-score值分別只有0.73和0.72;而VAE-GAN+FLCNN方法在使用訓練集D作為訓練數(shù)據(jù)時兩個指標仍然能達到0.86和0.84,相較于其他3種方法有明顯的提升,可以對各類軸承數(shù)據(jù)進行準確診斷。

        為了更直觀地展示VAE-GAN+FLCNN方法在樣本分布不均衡情況下與其他3種方法相比有更好的故障診斷效果,以1∶10不均衡比(訓練集C)為例,將訓練數(shù)據(jù)分別輸入4種模型,然后用訓練好的模型診斷測試集樣本,對最終的分類結(jié)果進行可視化,結(jié)果如圖11所示。

        圖11 不同方法故障診斷結(jié)果可視化

        從圖11(a)可知,SMOTE+CNN方法在幾種方法中分類效果較差,各故障種類之間均有不同程度的重疊,例如內(nèi)圈故障的部分樣本混合到了滾動體故障和外圈故障中,正常類樣本也混合到了滾動體故障中;從圖11(b)可知,GAN+CNN方法的錯分樣本數(shù)量較少,滾動體故障、內(nèi)圈故障和正常類樣本都被很好地區(qū)分開了,分類結(jié)果相對較好。從圖11(c)可知,VAE+CNN方法的診斷效果一般,內(nèi)圈故障和正常類樣本均有部分被錯分到了滾動體故障中,復合故障和外圈故障重疊較多。從圖11(a)、圖11(b)、圖11(c)的對比可知,3種對比方法對各類樣本均有不同程度的錯分,并且對復合故障和外圈故障產(chǎn)生了較高的錯分率,樣本間重疊嚴重。從圖11(d)可知,使用VAE-GAN+FLCNN方法后,不同類別樣本之間有較大的間隔,復合故障和外圈故障之間也能看到明顯界限,僅有少量外圈故障樣本被分類錯誤,總體而言,VAE-GAN+FLCNN方法對軸承的故障診斷效果明顯優(yōu)于其他3種方法。

        4 結(jié) 論

        本文提出一種基于VAE-GAN+FLCNN的不均衡樣本軸承故障診斷方法,通過VAE-GAN樣本增廣模型生成少數(shù)類故障樣本,實現(xiàn)訓練數(shù)據(jù)的均衡化;然后將增廣后的數(shù)據(jù)輸入FLCNN分類模型進行特征提取和故障識別。設置了4種不均衡比例的訓練數(shù)據(jù)進行試驗驗證,主要結(jié)論如下:

        (1)VAE-GAN模型能有效學習真實故障樣本的分布特點,從而生成大量故障樣本以增廣原始不均衡數(shù)據(jù)集。

        (2)通過將Focal Loss應用到CNN分類網(wǎng)絡,提高了FLCNN模型對故障類樣本的診斷精度。

        (3)通過和其他3種方法(SMOTE+CNN、VAE+CNN、GAN+CNN)的試驗對比可知,在不同的訓練數(shù)據(jù)集下,提出的VAE-GAN+FLCNN方法都能有效提高診斷結(jié)果的Recall值和F1-score值。

        本文的貢獻在于將VAE和GAN結(jié)合,彌補各自的缺點,改善了樣本生成能力,從而實現(xiàn)故障樣本的增廣;通過多次試驗對比,驗證了VAE-GAN+FLCNN方法對樣本不均衡下軸承故障診斷的有效性。

        猜你喜歡
        故障診斷軸承卷積
        軸承知識
        哈爾濱軸承(2022年2期)2022-07-22 06:39:32
        軸承知識
        哈爾濱軸承(2022年1期)2022-05-23 13:13:24
        基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
        軸承知識
        哈爾濱軸承(2021年2期)2021-08-12 06:11:46
        軸承知識
        哈爾濱軸承(2021年1期)2021-07-21 05:43:16
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標跟蹤算法
        因果圖定性分析法及其在故障診斷中的應用
        一種基于卷積神經(jīng)網(wǎng)絡的性別識別方法
        電視技術(2014年19期)2014-03-11 15:38:20
        基于LCD和排列熵的滾動軸承故障診斷
        97日日碰曰曰摸日日澡| 国产熟女精品一区二区| 国产无卡视频在线观看| 国产欧美日韩中文久久| 欧美巨大巨粗黑人性aaaaaa| 老色鬼永久精品网站| 人妻av中文字幕精品久久| 77777亚洲午夜久久多喷| 国产无人区码一码二码三mba| 国产精品美女久久久久久大全| 免费高清日本一区二区| 国产一品二品三品精品在线| 欧美xxxx色视频在线观看| 亚洲欧美中文在线观看4| 日韩精品一级在线视频| 成人av片在线观看免费| 日韩人妻无码免费视频一区二区三区 | 免费视频爱爱太爽了| 亚洲精品免费专区| 国产三级国产精品国产专区| 久久久精品人妻一区二区三区妖精 | 久久久精品国产三级精品| 欧美成人www在线观看| 亚洲欧美综合在线天堂| 日韩一区二区三区中文字幕| 精品国产一区二区三区av免费| 国产男小鲜肉同志免费| 欧美亚洲综合激情在线| 久草视频在线播放免费| 久久成人成狠狠爱综合网| 婷婷丁香五月中文字幕| 精品人妻av区乱码| av手机在线观看不卡| 激情综合色综合啪啪五月丁香| 五月婷婷六月激情| 久久久精品久久久国产| 国产精品久久久亚洲| 黑人巨大videos极度另类| 亚洲人妻有码中文字幕| 亚洲国产果冻传媒av在线观看 | 中国无码人妻丰满熟妇啪啪软件|