亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于Bi-LSTM和自注意力機制的旋轉(zhuǎn)機械故障診斷方法研究

2022-07-21 10:45:14高玉才付忠廣王詩云謝玉存

中國工程機械學報 2022年3期

高玉才，付忠廣，王詩云，謝玉存

（華北電力大學電站能量傳遞轉(zhuǎn)化與系統(tǒng)教育部重點實驗室，北京 102206）

旋轉(zhuǎn)機械的功能主要通過旋轉(zhuǎn)動作來實現(xiàn)，廣泛應(yīng)用于各大工業(yè)領(lǐng)域中，在現(xiàn)代工業(yè)生產(chǎn)中發(fā)揮著重要作用。隨著機械加工制造技術(shù)的進步和自動化程度的提高，旋轉(zhuǎn)機械系統(tǒng)各設(shè)備之間的聯(lián)系也越發(fā)緊密，一旦設(shè)備某一部件發(fā)生故障，會導致連鎖反應(yīng)，最終造成重大經(jīng)濟損失，甚至對工作人員的生命安全造成嚴重威脅。因此，利用智能化方法快速定位旋轉(zhuǎn)機械故障類型成為故障診斷領(lǐng)域的主要研究方向［1］。

旋轉(zhuǎn)機械的故障診斷方法主要包括傳統(tǒng)的故障診斷方法和新興的故障診斷方法。早期傳統(tǒng)的旋轉(zhuǎn)機械故障診斷技術(shù)需要借助專業(yè)知識手動提取故障特征，效率較低。隨著旋轉(zhuǎn)設(shè)備向著大型化、高速化、精密化的方向發(fā)展，基于信號處理的故障診斷方法難以滿足故障診斷精度的需要。如今，大數(shù)據(jù)和人工智能技術(shù)方興未艾，基于數(shù)據(jù)驅(qū)動的神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)應(yīng)用于故障診斷領(lǐng)域之中［2-4］。例如，針對風機運行過程中可能發(fā)生的故障，文獻［5］首先對風機的振動信號進行預處理，然后利用經(jīng)驗?zāi)B(tài)分解（ensemble empirical mode decomposition，EEMD）技術(shù)獲取故障信息，最后利用長短時記憶網(wǎng)絡(luò)（LSTM）進行故障診斷。實驗表明，LSTM網(wǎng)絡(luò)能夠準確監(jiān)測風機的運行狀態(tài)。

綜上所述，針對采用傳統(tǒng)方法進行旋轉(zhuǎn)機械故障診斷時效率低、精度低的問題，本文提出一種新型智能化故障診斷方法。首先，利用Bi-LSTM 對時序數(shù)據(jù)超強的感知能力自動提取原始振動信號中的故障特征；然后，在Bi-LSTM 網(wǎng)絡(luò)模型輸出結(jié)果的基礎(chǔ)上施加自注意力，從而獲得深層的特征表示；最后，利用全連接神經(jīng)網(wǎng)絡(luò)和softmax 分類器預測旋轉(zhuǎn)機械的運行狀態(tài)，實現(xiàn)旋轉(zhuǎn)機械故障的智能化診斷。

1 循環(huán)神經(jīng)網(wǎng)絡(luò)原理

大部分前饋神經(jīng)網(wǎng)絡(luò)只能映射數(shù)據(jù)之間的靜態(tài)關(guān)系，不擅于處理時間序列信號之間的動態(tài)關(guān)系，往往對時間序列信號所蘊含的信息產(chǎn)生不合理的預測。

循環(huán)神經(jīng)網(wǎng)絡(luò)是一種深層神經(jīng)網(wǎng)絡(luò)，與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)最大的不同之處在于循環(huán)神經(jīng)網(wǎng)絡(luò)中加入了反饋連接，允許內(nèi)部狀態(tài)信息在網(wǎng)絡(luò)自身中傳遞，從而建立數(shù)據(jù)之間的依賴關(guān)系。正是由于循環(huán)神經(jīng)網(wǎng)絡(luò)具有這種長程依賴性的建模能力，使得循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語言處理、語音識別等領(lǐng)域取得巨大成功，在時間序列信號的處理問題中具有廣闊的應(yīng)用前景。

1.1 循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）

循環(huán)神經(jīng)網(wǎng)絡(luò)繼承于Hopfield 網(wǎng)絡(luò)［6］，通過建立網(wǎng)絡(luò)內(nèi)部前后節(jié)點之間的聯(lián)系，可以實現(xiàn)神經(jīng)元內(nèi)部的反饋連接，因此特別適用于處理具有時間依賴性的信號。

循環(huán)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖1 所示。在t時刻，主體結(jié)構(gòu)A 以當前時刻的輸入Xt和上一時刻的隱含狀態(tài)信息ht-1為輸入，通過非線性映射后得到輸出Ot，主體結(jié)構(gòu)A 的內(nèi)部參數(shù)在不同時刻保持共享，并隨網(wǎng)絡(luò)模型的更新不斷變化。因此，循環(huán)神經(jīng)網(wǎng)絡(luò)某一時刻的輸出受到當前信息和歷史狀態(tài)信息的雙重影響，能夠充分挖掘時間序列信號中所蘊含的信息，做出與時序數(shù)據(jù)相關(guān)聯(lián)的預測。

圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Schematic diagram of cyclic neural network structure

1.2 長短時記憶網(wǎng)絡(luò)LSTM

2 基于Bi-LSTM 和自注意力機制的旋轉(zhuǎn)機械故障診斷模型

雙向循環(huán)神經(jīng)網(wǎng)絡(luò)由Schuster 等［7］首次提出，其可以同時使用時序數(shù)據(jù)中某個輸入的歷史和未來的信息，從而增加循環(huán)神經(jīng)網(wǎng)絡(luò)中可以利用的信息，具有更加強大的特征提取能力。本文構(gòu)建雙向長短時記憶網(wǎng)絡(luò)（Bi-LSTM）模型，并在此基礎(chǔ)上引入自注意力機制捕捉數(shù)據(jù)的內(nèi)部相關(guān)性，從而進一步提高模型的性能。本文所提模型架構(gòu)由下而上分為4 部分：Bi-LSTM 層、自注意力層、全連接層和Softmax層。

2.1 Bi-LSTM層

Bi-LSTM 網(wǎng)絡(luò)的結(jié)構(gòu)如圖2 所示。由圖可知，Bi-LSTM 網(wǎng)絡(luò)由2 個正、反方向的LSTM 網(wǎng)絡(luò)拼接而成。假設(shè)X=[x1，x2，…，xn]為某段振動信號的輸入，xt為t時刻轉(zhuǎn)子的徑向振動位移值，將X輸入Bi-LSTM 網(wǎng)絡(luò)模型分別得到t時刻前向LSTM 網(wǎng)絡(luò)的輸出和后向LSTM 網(wǎng)絡(luò)的輸出為Bi-LSTM 在t時刻的輸出，所有時刻的輸出構(gòu)成狀態(tài)集合H=[h1，h2，…，hn]。

圖2 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Schematic diagram of Bi-LSTM network structure

2.2 自注意力層

本文首先建立Bi-LSTM模型，然后在狀態(tài)集合H上施加注意力，通過自注意力機制學習內(nèi)部節(jié)點之間的權(quán)重矩陣［8］為所有內(nèi)部節(jié)點輸出信息的加權(quán)求和形式，代表整個序列狀態(tài)表示信息。自注意力層循環(huán)神經(jīng)網(wǎng)絡(luò)層如圖3所示。

圖3 自注意力循環(huán)神經(jīng)網(wǎng)絡(luò)層Fig.3 Self-attention recurrent neural network layer

為自注意力層t時刻的輸出，自注意力層的計算式為

式中：hk為Bi-LSTM 在k時刻的輸出；注意力權(quán)重矩陣

t時刻自注意力層的輸出為Bi-LSTM 各時刻輸出的加權(quán)求和，即

2.3 全連接層和Softmax輸出層

全連接層的輸入由H中的各個向量拼接而成，輸出節(jié)點個數(shù)為5，分別對應(yīng)旋轉(zhuǎn)機械的5 種運行狀態(tài)，選擇Softmax 激活函數(shù)對全連接層的輸出進行概率歸一化［9］。振動信號輸入模型后產(chǎn)生的輸出應(yīng)該與目標值具有相近的概率分布，可以用交叉熵損失衡量目標概率分布p(x)與網(wǎng)絡(luò)模型輸出概率分布q(x)之間的差異，網(wǎng)絡(luò)模型的訓練以降低交叉熵損失為目標。交叉熵損失函數(shù)為

3 實驗驗證

實驗設(shè)備為INV1612型柔性轉(zhuǎn)子系統(tǒng)如圖4所示。轉(zhuǎn)子模型系統(tǒng)由直流電機、數(shù)顯式調(diào)速器、等直徑轉(zhuǎn)軸、圓盤、軸承等配件組成，轉(zhuǎn)子的轉(zhuǎn)速可以通過改變電機的電壓實現(xiàn)，模型可模擬旋轉(zhuǎn)機械質(zhì)量不平衡、碰摩、支承松動、油膜失穩(wěn)故障，測量振動位移的傳感器安裝在轉(zhuǎn)軸徑向位置的固定支架上。

“56歲”的美加凈和“59歲”的大白兔奶糖跨界合作，前一段時間在網(wǎng)上的討論度是盛況空前。兩者推出聯(lián)名款——美加凈牌大白兔奶糖味潤唇膏，完美保留大白兔奶糖的經(jīng)典味道。9月20號十點整在天貓旗艦店限量銷售920套，不到半秒被搶空。據(jù)悉，這款潤唇膏10月正式推出，“雙十一”之前面市。

圖4 INV1612型多功能柔性轉(zhuǎn)子實驗臺上的轉(zhuǎn)子模型Fig.4 Rotor model on the INV1612 multifunctional flexible rotor experiment platform

3.1 數(shù)據(jù)集

本文采集轉(zhuǎn)子系統(tǒng)正常運行狀態(tài)和以下4 種故障的振動信號：質(zhì)量不平衡故障、碰摩故障、支撐松動故障和油膜失穩(wěn)故障。

轉(zhuǎn)子系統(tǒng)運行頻率為50 Hz，實驗臺采樣頻率為1 000 Hz，共分為5種運行狀態(tài)：正常狀態(tài)、質(zhì)量不平衡故障、碰摩故障、支承松動故障和油膜失穩(wěn)故障。數(shù)據(jù)集包含每種運行狀態(tài)下的數(shù)據(jù)樣本各400個，每個數(shù)據(jù)樣本包含100個數(shù)據(jù)點（5個信號周期）和一個獨-熱向量（one-hot）表示的標簽編碼。

3.2 參數(shù)選擇

本文采用Tensorflow 設(shè)計了基于Bi-LSTM 和自注意力機制的旋轉(zhuǎn)機械故障診斷模型［10］，優(yōu)化算法采用自適應(yīng)動量法，即Adam 算法，隨著網(wǎng)絡(luò)模型訓練次數(shù)的增加，Adam 算法能夠自適應(yīng)地調(diào)整每個參數(shù)的學習率，從而減小模型陷入局部最優(yōu)解的可能［11］。模型的超參數(shù)選擇如下：設(shè)置初始學習率為0.01，每批訓練樣本數(shù)量batch_size=256，最大迭代次數(shù)為300，LSTM 輸出層神經(jīng)元數(shù)目為16，注意力權(quán)重矩陣wα∈R16×32。

3.3 診斷結(jié)果

本文將轉(zhuǎn)子系統(tǒng)運行狀態(tài)識別準確率作為模型的評價指標，其定義為轉(zhuǎn)子系統(tǒng)運行狀態(tài)被正確識別的樣本數(shù)與樣本總數(shù)之比。模型訓練前，需要將模型參數(shù)進行隨機初始化，為消除隨機初始化帶來的影響，本文采用5 折交叉驗證法測試模型的診斷效果，最終評價結(jié)果為5次實驗結(jié)果的平均值。

為探究自注意力機制對Bi-LSTM 模型的優(yōu)化作用，將本文方法與未引入自注意力機制的Bi-LSTM 模型進行對比分析。參數(shù)設(shè)置和實驗方法均與本文方法相同，區(qū)別在于Bi-LSTM 模型最后一個時間步的輸出直接與最終輸出層相連接。某次試驗2 種模型訓練過程中，訓練集數(shù)據(jù)和測試集數(shù)據(jù)的識別準確率的變化情況如圖5 所示。通過觀察可知，與未引入自注意力機制的Bi-LSTM 模型相比，本文所提出的方法收斂速度更快、穩(wěn)定性更好、故障識別準確率更高，能夠比較準確地識別出旋轉(zhuǎn)機械的各種運行狀態(tài)。

圖5 模型訓練過程中識別準確率的變化情況Fig.5 Changes in recognition accuracy during model training

為進一步反映本文所提方法的優(yōu)越性，利用Python 中的Sklearn 工具，建立K近鄰模型和決策樹模型，進行旋轉(zhuǎn)機械的故障診斷。模型輸入為原始振動信號的14 個時域特征參數(shù)指標，包括最大值、最小值、平均幅值、峰值、方差、均方根幅值、方根幅值、歪度、峭度、裕度因子、波形因子、峰值因子、歪度因子、峭度因子。通過遺傳算法搜索最佳超參數(shù)，使得2 種模型在測試集上的故障識別準確率達到最高，其中K近鄰方法中超參數(shù)K=2，決策樹的最大深度max_depth=7。為防止過擬合，采用CART 算法對決策樹進行剪枝處理［12］。各種方法在測試集上的故障診斷精度見表1，表中數(shù)據(jù)均為5次實驗結(jié)果的平均值。

表1 不同模型在測試集上平均計算結(jié)果Tab.1 Average calculation results for different models on the test set %

3.4 數(shù)據(jù)可視化

為更加直觀地展示本文所提方法的有效性，探索模型的性能和學習過程，本文采用T-SNE（T-stochastic neighbor embedding）算法［3］對原始信號、時域特征參數(shù)、Bi-LSTM 方法分類器的輸入特征和本文方法分類器的輸入特征進行降維，降維后的數(shù)據(jù)在二維平面上的顯示結(jié)果如圖6 所示。

圖6 特征可視化圖Fig.6 Diagram of the feature visualization

從圖中可以看出，對原始信號圖6（a）和時域特征參數(shù)圖6（b）進行降維后，正常狀態(tài)、碰摩故障和油膜失穩(wěn)故障的數(shù)據(jù)樣本緊密地聚集在一起，因此，直接利用這些數(shù)據(jù)建立分類器模型，不能有效實現(xiàn)旋轉(zhuǎn)機械的故障診斷。通過圖6（c）和圖6（d）的對比分析可知，相比于Bi-LSTM 方法，本文方法全連接層輸出的特征使得數(shù)據(jù)樣本具有更小的類內(nèi)距離和更大的類間距離，因此，本文所提出的模型能夠更加有效地提取故障特征信息，從而提高旋轉(zhuǎn)機械故障診斷的精度。

4 結(jié)論

本文針對旋轉(zhuǎn)機械故障診斷問題提出了一種基于Bi-LSTM網(wǎng)絡(luò)和自注意力機制的故障診斷方法，實驗結(jié)果表明該方法切實可行，并得出以下結(jié)論：

（1）相比于基于信號處理技術(shù)的傳統(tǒng)機器學習方法，如K近鄰、決策樹模型，本文方法無需依賴專家經(jīng)驗人工提取信號中的特征參數(shù)，能夠通過有監(jiān)督學習自動提取原始信號中反映旋轉(zhuǎn)機械運行狀態(tài)的信息，并進行故障分類，具有更高的診斷精度，能夠?qū)崿F(xiàn)快速、高效的智能化故障診斷。

（2）在傳統(tǒng)的Bi-LSTM 網(wǎng)絡(luò)模型輸出結(jié)果的基礎(chǔ)上施加自注意力，能夠更加有效地捕捉數(shù)據(jù)的內(nèi)部相關(guān)性，模型訓練過程中收斂速度和穩(wěn)定性得到大幅度提高，整體故障識別準確率提高了2%。

（3）本文提出的方法能夠監(jiān)測旋轉(zhuǎn)機械的運行狀態(tài)，具有較高的診斷精度，能夠及時發(fā)現(xiàn)并反饋故障類型，避免發(fā)生安全事故。