高玉才,付忠廣,王詩云,謝玉存
(華北電力大學電站能量傳遞轉(zhuǎn)化與系統(tǒng)教育部重點實驗室,北京 102206)
旋轉(zhuǎn)機械的功能主要通過旋轉(zhuǎn)動作來實現(xiàn),廣泛應(yīng)用于各大工業(yè)領(lǐng)域中,在現(xiàn)代工業(yè)生產(chǎn)中發(fā)揮著重要作用。隨著機械加工制造技術(shù)的進步和自動化程度的提高,旋轉(zhuǎn)機械系統(tǒng)各設(shè)備之間的聯(lián)系也越發(fā)緊密,一旦設(shè)備某一部件發(fā)生故障,會導致連鎖反應(yīng),最終造成重大經(jīng)濟損失,甚至對工作人員的生命安全造成嚴重威脅。因此,利用智能化方法快速定位旋轉(zhuǎn)機械故障類型成為故障診斷領(lǐng)域的主要研究方向[1]。
旋轉(zhuǎn)機械的故障診斷方法主要包括傳統(tǒng)的故障診斷方法和新興的故障診斷方法。早期傳統(tǒng)的旋轉(zhuǎn)機械故障診斷技術(shù)需要借助專業(yè)知識手動提取故障特征,效率較低。隨著旋轉(zhuǎn)設(shè)備向著大型化、高速化、精密化的方向發(fā)展,基于信號處理的故障診斷方法難以滿足故障診斷精度的需要。如今,大數(shù)據(jù)和人工智能技術(shù)方興未艾,基于數(shù)據(jù)驅(qū)動的神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)應(yīng)用于故障診斷領(lǐng)域之中[2-4]。例如,針對風機運行過程中可能發(fā)生的故障,文獻[5]首先對風機的振動信號進行預處理,然后利用經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)技術(shù)獲取故障信息,最后利用長短時記憶網(wǎng)絡(luò)(LSTM)進行故障診斷。實驗表明,LSTM網(wǎng)絡(luò)能夠準確監(jiān)測風機的運行狀態(tài)。
綜上所述,針對采用傳統(tǒng)方法進行旋轉(zhuǎn)機械故障診斷時效率低、精度低的問題,本文提出一種新型智能化故障診斷方法。首先,利用Bi-LSTM 對時序數(shù)據(jù)超強的感知能力自動提取原始振動信號中的故障特征;然后,在Bi-LSTM 網(wǎng)絡(luò)模型輸出結(jié)果的基礎(chǔ)上施加自注意力,從而獲得深層的特征表示;最后,利用全連接神經(jīng)網(wǎng)絡(luò)和softmax 分類器預測旋轉(zhuǎn)機械的運行狀態(tài),實現(xiàn)旋轉(zhuǎn)機械故障的智能化診斷。
大部分前饋神經(jīng)網(wǎng)絡(luò)只能映射數(shù)據(jù)之間的靜態(tài)關(guān)系,不擅于處理時間序列信號之間的動態(tài)關(guān)系,往往對時間序列信號所蘊含的信息產(chǎn)生不合理的預測。
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種深層神經(jīng)網(wǎng)絡(luò),與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)最大的不同之處在于循環(huán)神經(jīng)網(wǎng)絡(luò)中加入了反饋連接,允許內(nèi)部狀態(tài)信息在網(wǎng)絡(luò)自身中傳遞,從而建立數(shù)據(jù)之間的依賴關(guān)系。正是由于循環(huán)神經(jīng)網(wǎng)絡(luò)具有這種長程依賴性的建模能力,使得循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語言處理、語音識別等領(lǐng)域取得巨大成功,在時間序列信號的處理問題中具有廣闊的應(yīng)用前景。
循環(huán)神經(jīng)網(wǎng)絡(luò)繼承于Hopfield 網(wǎng)絡(luò)[6],通過建立網(wǎng)絡(luò)內(nèi)部前后節(jié)點之間的聯(lián)系,可以實現(xiàn)神經(jīng)元內(nèi)部的反饋連接,因此特別適用于處理具有時間依賴性的信號。
循環(huán)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖1 所示。在t時刻,主體結(jié)構(gòu)A 以當前時刻的輸入Xt和上一時刻的隱含狀態(tài)信息ht-1為輸入,通過非線性映射后得到輸出Ot,主體結(jié)構(gòu)A 的內(nèi)部參數(shù)在不同時刻保持共享,并隨網(wǎng)絡(luò)模型的更新不斷變化。因此,循環(huán)神經(jīng)網(wǎng)絡(luò)某一時刻的輸出受到當前信息和歷史狀態(tài)信息的雙重影響,能夠充分挖掘時間序列信號中所蘊含的信息,做出與時序數(shù)據(jù)相關(guān)聯(lián)的預測。
圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Schematic diagram of cyclic neural network structure
雙向循環(huán)神經(jīng)網(wǎng)絡(luò)由Schuster 等[7]首次提出,其可以同時使用時序數(shù)據(jù)中某個輸入的歷史和未來的信息,從而增加循環(huán)神經(jīng)網(wǎng)絡(luò)中可以利用的信息,具有更加強大的特征提取能力。本文構(gòu)建雙向長短時記憶網(wǎng)絡(luò)(Bi-LSTM)模型,并在此基礎(chǔ)上引入自注意力機制捕捉數(shù)據(jù)的內(nèi)部相關(guān)性,從而進一步提高模型的性能。本文所提模型架構(gòu)由下而上分為4 部分:Bi-LSTM 層、自注意力層、全連接層和Softmax層。
Bi-LSTM 網(wǎng)絡(luò)的結(jié)構(gòu)如圖2 所示。由圖可知,Bi-LSTM 網(wǎng)絡(luò)由2 個正、反方向的LSTM 網(wǎng)絡(luò)拼接而成。假設(shè)X=[x1,x2,…,xn]為某段振動信號的輸入,xt為t時刻轉(zhuǎn)子的徑向振動位移值,將X輸入Bi-LSTM 網(wǎng)絡(luò)模型分別得到t時刻前向LSTM 網(wǎng)絡(luò)的輸出和后向LSTM 網(wǎng)絡(luò)的輸出為Bi-LSTM 在t時刻的輸出,所有時刻的輸出構(gòu)成狀態(tài)集合H=[h1,h2,…,hn]。
圖2 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Schematic diagram of Bi-LSTM network structure
本文首先建立Bi-LSTM模型,然后在狀態(tài)集合H上施加注意力,通過自注意力機制學習內(nèi)部節(jié)點之間的權(quán)重矩陣[8]為所有內(nèi)部節(jié)點輸出信息的加權(quán)求和形式,代表整個序列狀態(tài)表示信息。自注意力層循環(huán)神經(jīng)網(wǎng)絡(luò)層如圖3所示。
圖3 自注意力循環(huán)神經(jīng)網(wǎng)絡(luò)層Fig.3 Self-attention recurrent neural network layer
為自注意力層t時刻的輸出,自注意力層的計算式為
式中:hk為Bi-LSTM 在k時刻的輸出;注意力權(quán)重矩陣
t時刻自注意力層的輸出為Bi-LSTM 各時刻輸出的加權(quán)求和,即
全連接層的輸入由H中的各個向量拼接而成,輸出節(jié)點個數(shù)為5,分別對應(yīng)旋轉(zhuǎn)機械的5 種運行狀態(tài),選擇Softmax 激活函數(shù)對全連接層的輸出進行概率歸一化[9]。振動信號輸入模型后產(chǎn)生的輸出應(yīng)該與目標值具有相近的概率分布,可以用交叉熵損失衡量目標概率分布p(x)與網(wǎng)絡(luò)模型輸出概率分布q(x)之間的差異,網(wǎng)絡(luò)模型的訓練以降低交叉熵損失為目標。交叉熵損失函數(shù)為
實驗設(shè)備為INV1612型柔性轉(zhuǎn)子系統(tǒng)如圖4所示。轉(zhuǎn)子模型系統(tǒng)由直流電機、數(shù)顯式調(diào)速器、等直徑轉(zhuǎn)軸、圓盤、軸承等配件組成,轉(zhuǎn)子的轉(zhuǎn)速可以通過改變電機的電壓實現(xiàn),模型可模擬旋轉(zhuǎn)機械質(zhì)量不平衡、碰摩、支承松動、油膜失穩(wěn)故障,測量振動位移的傳感器安裝在轉(zhuǎn)軸徑向位置的固定支架上。
“56歲”的美加凈和“59歲”的大白兔奶糖跨界合作,前一段時間在網(wǎng)上的討論度是盛況空前。兩者推出聯(lián)名款——美加凈牌大白兔奶糖味潤唇膏,完美保留大白兔奶糖的經(jīng)典味道。9月20號十點整在天貓旗艦店限量銷售920套,不到半秒被搶空。據(jù)悉,這款潤唇膏10月正式推出,“雙十一”之前面市。
圖4 INV1612型多功能柔性轉(zhuǎn)子實驗臺上的轉(zhuǎn)子模型Fig.4 Rotor model on the INV1612 multifunctional flexible rotor experiment platform
本文采集轉(zhuǎn)子系統(tǒng)正常運行狀態(tài)和以下4 種故障的振動信號:質(zhì)量不平衡故障、碰摩故障、支撐松動故障和油膜失穩(wěn)故障。
轉(zhuǎn)子系統(tǒng)運行頻率為50 Hz,實驗臺采樣頻率為1 000 Hz,共分為5種運行狀態(tài):正常狀態(tài)、質(zhì)量不平衡故障、碰摩故障、支承松動故障和油膜失穩(wěn)故障。數(shù)據(jù)集包含每種運行狀態(tài)下的數(shù)據(jù)樣本各400個,每個數(shù)據(jù)樣本包含100個數(shù)據(jù)點(5個信號周期)和一個獨-熱向量(one-hot)表示的標簽編碼。
本文采用Tensorflow 設(shè)計了基于Bi-LSTM 和自注意力機制的旋轉(zhuǎn)機械故障診斷模型[10],優(yōu)化算法采用自適應(yīng)動量法,即Adam 算法,隨著網(wǎng)絡(luò)模型訓練次數(shù)的增加,Adam 算法能夠自適應(yīng)地調(diào)整每個參數(shù)的學習率,從而減小模型陷入局部最優(yōu)解的可能[11]。模型的超參數(shù)選擇如下:設(shè)置初始學習率為0.01,每批訓練樣本數(shù)量batch_size=256,最大迭代次數(shù)為300,LSTM 輸出層神經(jīng)元數(shù)目為16,注意力權(quán)重矩陣wα∈R16×32。
本文將轉(zhuǎn)子系統(tǒng)運行狀態(tài)識別準確率作為模型的評價指標,其定義為轉(zhuǎn)子系統(tǒng)運行狀態(tài)被正確識別的樣本數(shù)與樣本總數(shù)之比。模型訓練前,需要將模型參數(shù)進行隨機初始化,為消除隨機初始化帶來的影響,本文采用5 折交叉驗證法測試模型的診斷效果,最終評價結(jié)果為5次實驗結(jié)果的平均值。
為探究自注意力機制對Bi-LSTM 模型的優(yōu)化作用,將本文方法與未引入自注意力機制的Bi-LSTM 模型進行對比分析。參數(shù)設(shè)置和實驗方法均與本文方法相同,區(qū)別在于Bi-LSTM 模型最后一個時間步的輸出直接與最終輸出層相連接。某次試驗2 種模型訓練過程中,訓練集數(shù)據(jù)和測試集數(shù)據(jù)的識別準確率的變化情況如圖5 所示。通過觀察可知,與未引入自注意力機制的Bi-LSTM 模型相比,本文所提出的方法收斂速度更快、穩(wěn)定性更好、故障識別準確率更高,能夠比較準確地識別出旋轉(zhuǎn)機械的各種運行狀態(tài)。
圖5 模型訓練過程中識別準確率的變化情況Fig.5 Changes in recognition accuracy during model training
為進一步反映本文所提方法的優(yōu)越性,利用Python 中的Sklearn 工具,建立K近鄰模型和決策樹模型,進行旋轉(zhuǎn)機械的故障診斷。模型輸入為原始振動信號的14 個時域特征參數(shù)指標,包括最大值、最小值、平均幅值、峰值、方差、均方根幅值、方根幅值、歪度、峭度、裕度因子、波形因子、峰值因子、歪度因子、峭度因子。通過遺傳算法搜索最佳超參數(shù),使得2 種模型在測試集上的故障識別準確率達到最高,其中K近鄰方法中超參數(shù)K=2,決策樹的最大深度max_depth=7。為防止過擬合,采用CART 算法對決策樹進行剪枝處理[12]。各種方法在測試集上的故障診斷精度見表1,表中數(shù)據(jù)均為5次實驗結(jié)果的平均值。
表1 不同模型在測試集上平均計算結(jié)果Tab.1 Average calculation results for different models on the test set %
為更加直觀地展示本文所提方法的有效性,探索模型的性能和學習過程,本文采用T-SNE(T-stochastic neighbor embedding)算 法[3]對 原始信號、時域特征參數(shù)、Bi-LSTM 方法分類器的輸入特征和本文方法分類器的輸入特征進行降維,降維后的數(shù)據(jù)在二維平面上的顯示結(jié)果如圖6 所示。
圖6 特征可視化圖Fig.6 Diagram of the feature visualization
從圖中可以看出,對原始信號圖6(a)和時域特征參數(shù)圖6(b)進行降維后,正常狀態(tài)、碰摩故障和油膜失穩(wěn)故障的數(shù)據(jù)樣本緊密地聚集在一起,因此,直接利用這些數(shù)據(jù)建立分類器模型,不能有效實現(xiàn)旋轉(zhuǎn)機械的故障診斷。通過圖6(c)和圖6(d)的對比分析可知,相比于Bi-LSTM 方法,本文方法全連接層輸出的特征使得數(shù)據(jù)樣本具有更小的類內(nèi)距離和更大的類間距離,因此,本文所提出的模型能夠更加有效地提取故障特征信息,從而提高旋轉(zhuǎn)機械故障診斷的精度。
本文針對旋轉(zhuǎn)機械故障診斷問題提出了一種基于Bi-LSTM網(wǎng)絡(luò)和自注意力機制的故障診斷方法,實驗結(jié)果表明該方法切實可行,并得出以下結(jié)論:
(1)相比于基于信號處理技術(shù)的傳統(tǒng)機器學習方法,如K近鄰、決策樹模型,本文方法無需依賴專家經(jīng)驗人工提取信號中的特征參數(shù),能夠通過有監(jiān)督學習自動提取原始信號中反映旋轉(zhuǎn)機械運行狀態(tài)的信息,并進行故障分類,具有更高的診斷精度,能夠?qū)崿F(xiàn)快速、高效的智能化故障診斷。
(2)在傳統(tǒng)的Bi-LSTM 網(wǎng)絡(luò)模型輸出結(jié)果的基礎(chǔ)上施加自注意力,能夠更加有效地捕捉數(shù)據(jù)的內(nèi)部相關(guān)性,模型訓練過程中收斂速度和穩(wěn)定性得到大幅度提高,整體故障識別準確率提高了2%。
(3)本文提出的方法能夠監(jiān)測旋轉(zhuǎn)機械的運行狀態(tài),具有較高的診斷精度,能夠及時發(fā)現(xiàn)并反饋故障類型,避免發(fā)生安全事故。