亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Triplet Network的小樣本軸承、齒輪故障診斷方法*

        2022-08-25 02:00:18謝由生
        機電工程 2022年8期
        關鍵詞:故障診斷特征故障

        謝由生,張 軍

        (安徽理工大學 人工智能學院,安徽 淮南 232001)

        0 引 言

        作為現代工業(yè)中的關鍵設備,智能機械設備在電力、航空和工業(yè)生產等眾多領域發(fā)揮著至關重要的作用。

        但是智能機械設備中的典型部件,如軸承、齒輪的故障,嚴重威脅著智能機械設備的安全、可靠運行。故障診斷是確保這些智能機械設備長期、穩(wěn)定運行的重要手段之一[1]。

        近些年,隨著深度學習在自然語言處理(natural language processing, NLP)[2]、計算機視覺(computer vision,CV)[3]等領域取得的重大成功,眾多學者把深度學習方法應用到機械設備故障診斷中,并取得了一定的成果。

        CHEN L等人[4]提出了一種非線性頻譜與堆棧降噪自編碼相結合的方法,采用該方法對永磁同步電機進行故障診斷時,取得了較高的診斷準確率。KONG X等人[5]使用了基于深度自編碼器的多集成方法,用于軸承的故障診斷,取得了較好的診斷精度,并且該方法還具有較強的泛化能力。ZARE S等人[6]提出了一種基于多通道卷積神經網絡的故障診斷方法,采用該方法可以較好地對風力發(fā)電機的常見故障進行診斷。趙凱輝等人[7]采用Inception模型和雙向長短時記憶模型(bi-directional long short-term memory,Bi-LSTM)相結合的方法,在多負載下的軸承故障診斷中取得了較好的結果,且該方法的抗干擾能力較強。

        這些基于深度神經網絡的故障診斷方法極大地提高了故障診斷的精度,但是這些方法的高準確率往往依賴大量的故障樣本來訓練模型。而在實際的生產活動中,想要獲得充足的故障樣本,需要花費大量的人力和物力。因此,針對小樣本條件下的故障診斷是當前故障診斷領域的一大挑戰(zhàn)。

        面對小樣本下故障診斷精度不高的問題,不少學者提出了解決方法。

        SHAO S等人[8]提出了一種基于輔助分類器生成對抗網絡模型(auxiliary classifier generative adversarial networks, ACGAN),用以學習真實的原始數據特征;該模型通過學習的特征,生成帶有標簽的偽故障樣本,用來填充真實的小樣本故障數據。LUO J等人[9]結合了深度卷積網絡、條件生成對抗網絡(conditionalgenerative adversarial networks, CGAN)這二者的優(yōu)點,提出了一種條件深度卷積對抗網絡模型,用于生成故障樣本,對小樣本故障數據集進行數據增強。HAN H等人[10]將生成對抗網絡和層疊自動編碼器相結合,首先利用生成對抗網絡對小樣本數據進行了增強,然后使用層疊自動編碼器提取信號的特征,在對給水泵故障進行診斷時取得了較好的結果。LIU S等人[11]開發(fā)了一種LOSGAN(latent optimized stable GAN)模型,在沒有先驗知識的情況下,自適應地增強小樣本數據,并且使用分布差異距離來約束模型的優(yōu)化目標,采用自注意力和譜歸一化來穩(wěn)定訓練過程,在小樣本軸承故障診斷中表現出了較優(yōu)的性能。馬波等人[12]將健康狀態(tài)數據反映的設備個性特征和故障機理反映的設備共性特征相結合,提出了一種基于GAN理論的模型,用于生成樣本,對小樣本故障數據進行了數據增強。

        綜上所述,現有提高小樣本故障診斷精度的方法,多是先采用生成對抗網絡生成偽樣本,再對小樣本故障數據進行數據增強。但是,訓練一個優(yōu)秀的生成對抗模型同樣需要大量的樣本,在實際的小樣本故障診斷中存在一定的局限性。

        因此,筆者提出一種基于Triplet Network[13]的故障診斷方法,即首先將原始故障信號轉換為二維時頻信號,然后對比時頻信號故障樣本特征的相似度,以此來改善模型提取的特征,最后通過比較未知樣本與已知樣本特征的相似度,實現對未知樣本的故障識別。

        1 模型結構與故障診斷流程

        由于傳統的深度學習模型很難從有限的故障樣本中學習到故障的特征,基于此訓練出來的模型往往是欠擬合的,故障診斷的效果較差。

        筆者提出一種基于Triplet Network的方法,用于提高小樣本故障診斷精度。

        基于Triplet Network方法的結構圖如圖1所示。

        圖1 基于Triplet Network的方法結構圖

        1.1 特征提取模型

        借鑒Triplet Network模型的思想,特征提取模型構建了一個具有3個共享權值的子網絡模型,通過提取同一故障狀態(tài)樣本間和不同故障狀態(tài)樣本間的特征,通過度量相同和不同故障狀態(tài)樣本特征的相似度,以此來優(yōu)化模型抽取的特征,進而實現對不同故障的甄別。

        特征提取模型結構如圖2所示。

        圖2 特征提取模型結構

        圖2中,模型的輸入是錨點、正樣本和負樣本組成的樣本對;錨點是從故障樣本中隨機選取的一個樣本,正樣本是與錨點同一故障狀態(tài)的樣本,負樣本是與錨點不同故障狀態(tài)的樣本;輸出是樣本對低維特征向量間的相似度度量,即損失值;損失值通過反向傳播更新模型的參數,優(yōu)化模型學習的故障樣本類內和類間特征,使模型提取的錨點與正樣本低維特征向量的相似度越來越高,錨點與負樣本低維特征向量的相似度越來越低。

        模型的子網絡中包含1個卷積塊、3個殘差塊和1個池化層,通過這些模塊組成的模型,實現樣本對低維特征的提取。

        1.1.1 卷積塊

        模型的卷積塊由卷積層、批歸一化層、激活函數和池化層構成。

        卷積層。卷積計算是現在深度神經網絡的主要組成部分,卷積可以有效地提取輸入對象的特征,因此也稱為特征提取層。卷積中的卷積核每次提取的特征是輸入對象的局部特征,但是卷積核通過滑動遍歷整個輸入對象,實現對整個對象的特征提取。卷積核的大小由人為設置,卷積核中的參數由梯度反向傳播自動更新,解決了人工設置的繁瑣。

        卷積計算可以表示為:

        Xi=Wi*Xi-1+bi

        (1)

        式中:*—卷積運算;Wi—第i層的卷積核;bi—第i層的偏置值;Xi-1—第i-1層的輸出特征。

        批歸一化層。在模型訓練過程中,參數一直處于變化狀態(tài),模型中間層的數據分布變化較大。IOFFE S等人[14]提出了批歸一化方法,在模型中間層對數據進行歸一化處理。批歸一化可以改善模型反向傳播時的梯度爆炸或梯度消失問題,同時也可以起到正則化作用,一定程度上緩解了模型的過擬合現象。

        激活函數。激活函數將非線性因素引入神經網絡中,使神經網絡可以逼近任意非線性函數。在提高模型的表示能力和學習能力上,激活函數起到了至關重要的作用。常用的激活函數有Sigmoid函數、Tanh函數和ReLU函數等,筆者所提模型使用的激活函數有ReLU函數和Sigmoid函數。

        激活函數的表達式為:

        (2)

        (3)

        池化層。池化層對輸入對象進行特征選擇,降低輸入對象的維度,可以大幅度地減少模型參數數據,在避免模型過擬合上有一定效果。

        筆者所提模型的卷積塊中采用最大池化層,殘差塊后的池化層為平均池化層。池化層可以表示為:

        y=Pool(xi)(i=1,2,…,d)

        (4)

        式中:y—輸出;xi—輸入對象的第i個區(qū)域。

        其中:最大池化層的Pool(·)為max(·),即取該區(qū)域中的最大值;平均池化層的Pool(·)為mean(·),即取該區(qū)域的平均值。

        1.1.2 殘差塊

        2016年,HE K[15]提出了深度殘差網絡(deep residual network, ResNet),ResNet模型在構建深度神經網絡上取得了巨大成功。

        筆者將ResNet模型中的殘差結構引入到模型中,殘差塊結構如圖3所示。

        圖3 殘差結構

        圖3中,輸入x需要經過主線和支線,其中,主線由兩個卷積層、批歸一化層和激活函數組成;

        此處x經過主線表示為F(x);輸入x經過支線可表示為S(x),S(·)進行何種計算需要根據該殘差塊中輸入x與F(x)的維度決定,若x與F(x)的維度相同,則S(·)不進行任何操作,直接將輸入x輸出;若x與F(x)維度不相同,則S(·)為卷積核為1的卷積層,對輸入x進行維度調整,使S(x)的維度與F(x)的維度保持一致;

        輸入x經過主線和支線后,將輸出S(x)和F(x)相加,然后再作為后期操作的輸入。

        殘差塊可以表示為:

        R(x)=F(x)+S(x)

        (5)

        1.1.3 損失函數

        筆者所提模型的損失函數是度量錨點、負樣本和正樣本低維特征間的相似度,指導模型的優(yōu)化方向,使模型提取的錨點與正樣本低維特征向量的相似度越來越高,錨點與負樣本的低維特征向量的相似度越來越低。

        損失函數如下:

        Loss=max(D(a,p)-D(a,n)+margin,0)

        (6)

        式中:a—錨點的低維特征;p—正樣本的低維特征;n—負樣本的低維特征;D(·)—衡量低維樣本間的距離。

        筆者使用的是歐式距離,距離越小相似度越高;margin是人為設定的閾值,控制模型的優(yōu)化進程,若D(a,p)+margin>D(a,n),則模型繼續(xù)優(yōu)化,否則模型停止優(yōu)化。

        特征提取模型的具體結構和參數如表1所示。

        表1 模型詳細結構參數

        模型采用的是自適應平均池化,輸出為1x1@128;支線中的直連為不進行操作,直接輸出。模型中每個卷積計算后均加有批歸一化和激活函數,激活函數為ReLU函數,平均池化層后的激活函數為Sigmoid函數。

        1.2 故障診斷流程

        模型故障診斷流程如圖4所示。

        圖4 故障診斷流程

        圖4中,診斷流程分為3個部分:數據預處理與數據集劃分、訓練模型、未知樣本故障診斷。

        (1)數據預處理與數據集劃分。筆者所提模型的輸入為二維數據,訓練模型前需要將原始一維數據轉換為二維數據。筆者采用短時傅里葉變換,將原始時序信號轉換為時頻信號,并將其保存為圖片,取原始時序信號中1 024個點轉換為一張時頻信號圖,依次選擇樣本點,并將其轉換為時頻圖,直至轉換結束。

        劃分數據集時,按時間順序將樣本劃分為訓練集和測試集,如圖5所示;

        圖5 數據預處理與數據集劃分

        (2)訓練模型。從訓練集中隨機選擇一個樣本作為錨點,隨機選擇一個與錨點具有相同故障狀態(tài)的樣本作為正樣本,隨機選擇一個與錨點具有不同故障狀態(tài)的樣本作為負樣本。錨點、負樣本和正樣本組成的樣本對輸入模型得到損失值,損失值經過梯度反向傳播優(yōu)化模型參數。如此迭代一定次數,并保存訓練完成的模型;

        (3)未知樣本故障診斷。使用訓練好的模型將訓練集中各類故障樣本轉化為低維特征,并求各類故障樣本低維特征的均值。

        未知樣本故障診斷如圖6所示。

        圖6 未知樣本故障診斷

        圖6中,當診斷未知樣本故障狀態(tài)時,對比未知樣本的低維特征到各類故障樣本低維特征均值的距離,距離最小者,則判定未知樣本為該類。使用歐式距離測量樣本間低維特征的距離。

        2 實驗與結果分析

        筆者使用江南大學軸承數據集和美國康涅狄格大學齒輪數據集,測試模型在小樣本情況下的故障診斷性能。

        2.1 軸承數據

        江南大學軸承數據集[16]有4種故障狀態(tài):健康、內圈故障、外圈故障和滾動體故障。振動信號的采集頻率為50 kHz,在轉速600 r/min、800 r/min和1 000 r/min下分別采集軸承的故障信號。將轉速為800 r/min的軸承信號進行預處理和劃分數據集(預處理和劃分數據集方式見第1.2節(jié))。

        各類故障劃分數據集的結果如表2所示。

        表2 軸承數據集劃分結果

        2.1.1margin值的選擇

        margin作為一個人為設定的閾值,它決定了模型是否繼續(xù)優(yōu)化,當故障樣本的類間距離小于故障樣本的類內距離加margin的和時,模型需要繼續(xù)優(yōu)化;相反,則模型停止優(yōu)化。由于故障樣本的類內距離小于類間距離時,模型才能做出正確的判斷,所以margin值應該大于0。但是,margin值并不是越大越好,當模型可以分辨不同故障時,若再拉遠不同故障類間的距離,模型的故障診斷精度不會提高。

        因此,筆者在0到1之間取了多個margin值,測試margin取值對故障診斷精度的影響;從訓練集中選取各類故障30個樣本作為本實驗訓練集,以表2中的測試集作為測試樣本,計算模型故障診斷精度;

        訓練的學習率為0.01,每批次64個樣本,優(yōu)化器為Adam,并且采用學習率衰減策略動態(tài)調整學習率大小,總共迭代40次,并且重復實驗5次,取其平均值。

        margin值對故障診斷的影響實驗結果如圖7所示。

        圖7 margin值對故障診斷的影響

        圖7中,當margin為0.2時,故障診斷精度最高,所以后續(xù)實驗的margin值均為0.2。

        2.1.2 訓練樣本數量對診斷精度的影響

        為探究筆者所提模型在小樣本下的故障診斷精度,該實驗從表2訓練集各類故障中分別隨機選取了5、10、15、30、50、80和100個作為模型訓練集,對比訓練樣本數量對模型診斷精度的影響;同時,將其與1DCNN模型和2DCNN模型作對比。

        其中,1DCNN模型是由4層一維卷積和全連接層組成的一維卷積神經網絡,2DCNN與筆者所提模型的結構參數相同,不同之處是2DCNN模型在輸出低維特征后直接連接全連接層對故障進行分類。各模型使用相同的訓練參數,詳細參數見2.1.1節(jié)。

        各模型共迭代40次,重復實驗5次,取其平均值,得到不同模型在軸承數據中的故障診斷實驗結果,如圖8所示。

        圖8 不同模型在軸承數據中的故障診斷結果

        從圖8中可知:

        3種模型整體的診斷精度隨著訓練樣本數量的增加而提高,2DCNN模型和筆者所提模型的診斷準確率明顯高于1DCNN模型,筆者模型和2DCNN模型在每類故障樣本量大于30時,兩個模型的診斷精度較為接近,并且都大于80%;

        在訓練樣本量較少時,筆者模型的診斷精度明顯大于其他兩個模型;在每類故障樣本量為15時,筆者模型的故障識別率比2DCNN模型高14.33%,比1DCNN模型高33.83%;即使是在每類故障樣本只有5個時,筆者模型的故障識別率也有68%,比2DCNN模型高15.33%,比1DCNN模型高33.5%。

        2.2 齒輪數據

        美國康涅狄格大學齒輪數據集[17]共有9種故障狀態(tài):健康、缺齒、根裂、剝落和5種不同程度的齒削尖。故障信號的采樣頻率為20 kHz。

        此處的實驗選取了健康、缺齒、根裂、剝落和1種齒削尖共5類故障樣本作為訓練集和測試集,故障信號的預處理和數據劃分方式與江南大學軸承數據集相同。

        數據集劃分結果如表3所示。

        表3 齒輪數據集劃分結果

        從訓練集的各類故障中,筆者隨機選擇5、10、15、30、50、80和100個樣本,對比模型在不同訓練集數量下的故障識別率,并將其與1DCNN模型和2DCNN模型對比。

        1DCNN模型和2DCNN模型結構、實驗的訓練參數與江南大學軸承數據集實驗相同,重復實驗5次,并取平均值,得到的實驗結果如表4所示。

        表4 不同模型在齒輪數據中的故障診斷結果

        由表4可知:模型故障診斷識別率與訓練樣本數量呈正相關,2DCNN模型和筆者模型明顯優(yōu)于1DCNN模型;在每類故障樣本為10訓練的3個模型中,筆者模型故障識別率高出2DCNN模型14%,高出1DCNN模型28.13%;甚至在每類故障樣本只有5個的情況下,筆者模型的故障識別率依舊可以達到96.8%,高出2DCNN模型26%。

        綜合筆者模型在江南大學軸承數據集和康涅狄格大學齒輪數據集上的表現,筆者模型在訓練集樣本較為充足的情況下,故障診斷精度與其他模型相差無幾;但是在訓練樣本不足時,筆者模型的故障識別率明顯優(yōu)于其他模型,并且仍具有較高的故障識別率。

        3 特征可視化

        深度神經網絡的可解釋性仍然是當前的研究熱點和難點,其工作原理讓人難以理解。但是,其可視化部分模型的特征層可以加深對模型的理解。筆者選用在康涅狄格大學齒輪數據集中,每類故障樣本為10訓練好的2DCNN模型和筆者模型,把測試集樣本輸入模型,使用T-SNE(T-distributed stochastic neighbor embedding)[18]可視化兩個模型在平均池化層后輸出的低維特征,其中,T-SNE可以將高維數據映射到低維空間。

        筆者將模型輸出的低維特征映射到二維空間,并將其可視化,如圖9所示。

        圖9 不同模型低維特征可視化對比結果

        0、1、2、3、4和5分別與表3中的標簽相對應,表示不同的齒輪故障。

        從圖9中可以觀察到:2DCNN模型中的故障1與其他故障交織在一起,與不同故障的分界不明顯,容易產生錯誤的故障分類結果;相對于2DCNN模型,筆者模型中相同故障樣本的分布更加緊湊,不同故障樣本的分布區(qū)別明顯。

        為了解2DCNN模型和筆者模型在齒輪數據中的分類情況,筆者繪制了混淆矩陣,如圖10所示。

        圖10 不同模型混淆矩陣對比結果

        混淆矩陣的標簽軸為真實的故障標簽,預測值為模型的預測的故障類別。

        從圖10中可知:筆者模型在各類故障上的識別率高于2DCNN模型,2DCNN模型對于故障1的識別誤差較大。

        4 結束語

        筆者提出了一種在小樣本數據集下機械設備典型部件的故障診斷方法,該方法可分為故障特征提取和故障診斷兩個階段。首先采用度量故障樣本特征相似度的方法,來優(yōu)化模型提取的特征;再通過比較未知樣本與已知樣本特征的相似度,實現對未知樣本的故障識別。

        研究結論如下:

        (1)采用短時傅里葉變換,將原始時序信號轉換為時頻域信號,充分挖掘原始數據信息;同時,將一維信號轉換為二維圖像,充分利用卷積神經網絡在圖像特征提取上的優(yōu)勢,使模型的特征提取能力得到顯著提升;

        (2)利用基于Triplet Network搭建的模型提取故障樣本時頻信號低維特征,通過度量錨點與正樣本低維特征和錨點,以及負樣本低維特征的相似度,優(yōu)化模型的特征提取策略;

        (3)通過軸承故障數據集和齒輪故障數據集驗證筆者所提方法,結果表明,該方法在小樣本數據下的故障診斷性能明顯優(yōu)于1DCNN和2DCNN;在每類齒輪故障樣本只有5個的情況下,該方法的故障識別率依舊可以達到96.8%,比2DCNN高26%,比1DCNN高33.5%。

        綜上所述,筆者所提方法在小樣本數據集下機械設備典型部件的故障診斷中具有較優(yōu)的性能。

        下一步,筆者考慮將該方法應用于變工況場景下旋轉機械典型部件的故障診斷中,以提高該方法的泛化能力和魯棒性。

        猜你喜歡
        故障診斷特征故障
        故障一點通
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        奔馳R320車ABS、ESP故障燈異常點亮
        因果圖定性分析法及其在故障診斷中的應用
        故障一點通
        江淮車故障3例
        基于LCD和排列熵的滾動軸承故障診斷
        基于WPD-HHT的滾動軸承故障診斷
        機械與電子(2014年1期)2014-02-28 02:07:31
        国产一区二区三区18p| 99在线精品免费视频| 亚洲热线99精品视频| 无码国产精品一区二区免费16| 久久青草伊人精品| 久久这里有精品国产电影网| 91久久精品一二三区色| 91中文人妻熟女乱又乱| 亚洲av无一区二区三区久久| 色偷偷久久一区二区三区| 久久精品国产亚洲av瑜伽| 久久99老妇伦国产熟女高清| 国产亚洲中文字幕一区| 白白色白白色视频发布| 极品成人影院| 无码aⅴ在线观看| 亚洲欧美成人在线免费| 男女打扑克视频在线看| 福利视频一区二区三区| 高潮毛片无遮挡高清视频播放| 怡红院免费的全部视频| 国产午夜成人久久无码一区二区| 欧美人与物videos另类| 一道之本加勒比热东京| 精品久久人妻av中文字幕| 久久精品国产一区二区电影| 麻豆成年视频在线观看| 亚洲国产精品区在线观看| 欧美午夜刺激影院| 久久国产偷| 精品人妻夜夜爽一区二区| 黄色av一区二区在线观看| 乱人伦中文无码视频在线观看| 亚洲另类激情综合偷自拍图| 91精品福利一区二区三区| 国产情侣真实露脸在线| 丰满爆乳无码一区二区三区| 一区五码在线| 久久狼人国产综合精品| 久久久久人妻精品一区三寸| 久久国产精品久久精品国产|