谷 晟,別鋒鋒,郭 越,彭 劍,趙 威
(常州大學(xué) 機械與軌道交通學(xué)院,江蘇 常州 213164)
管道作為重要的流體輸送工具,其在石油石化、供給排水、天然氣等其他流體輸送領(lǐng)域中占有非常重要的地位。一旦管道發(fā)生故障,將會造成巨大的經(jīng)濟損失,甚至還會引發(fā)安全事故,因此對管道狀態(tài)進行檢測與診斷尤為必要[1-2]。但是由于現(xiàn)場環(huán)境的復(fù)雜性,采集到的管道振動信號往往是非線性,非平穩(wěn)的。針對如何從非線性,非平穩(wěn)的管道信號中提取表征管道缺陷類型的故障特征并進行有效的模式識別,國內(nèi)外學(xué)者進行了大量的研究分析。目前,針對管道故障特征提取,最常用的方法是對振動信號進行時頻分析。一般,時頻分析方法主要包括經(jīng)驗?zāi)B(tài)分解[3]、小波分析[4]、局部均值分解[5]、核主元分析[6]等。其中,經(jīng)驗?zāi)B(tài)分解方法[3](EMD, empirical mode decomposition)是處理非線性振動信號的強有力的工具,但是該方法計算效率較低,易造成模態(tài)混疊和虛假分量等問題。為了降低模態(tài)混疊,文獻[7]提出了集合經(jīng)驗?zāi)B(tài)分解(EEMD, ensemble empirical mode decomposition)方法,雖然該方法可以在一定程度上抑制模態(tài)混疊,但計算效率依舊相對較低。隨后,文獻[8]提出了一種帶有自適應(yīng)白噪聲的完全集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN, complete ensemble empirical mode decomposition with adaptive noise)算法,該算法在EEMD的基礎(chǔ)上,既減少了模態(tài)混疊又提高了信號的分解效率。
深度學(xué)習(xí)理論作為機器學(xué)習(xí)領(lǐng)域的最新研究成果,自提出以來已經(jīng)在圖像識別[9]、語音識別[10]、故障診斷[11]等領(lǐng)域得到了廣泛的應(yīng)用。深度學(xué)習(xí)方法以數(shù)據(jù)為驅(qū)動,相比于傳統(tǒng)的機器學(xué)習(xí)方法具有更強的特征學(xué)習(xí)能力,對于分析復(fù)雜多變,非結(jié)構(gòu)化的模型具有顯著的優(yōu)勢[12]。其中,長短時記憶網(wǎng)絡(luò)(LSTM, long short term memory)作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它很好的彌補了一般RNN模型中的梯度爆炸及消失等不足,并且對于一些時間序列信息的處理具有較高的自適應(yīng)性[13]。于洋等[14]針對不同工況下軸承故障聲發(fā)射信號的辨識問題,基于長短時記憶網(wǎng)絡(luò)與遷移學(xué)習(xí)方法構(gòu)建模型,充分挖掘不同工況下軸承聲發(fā)射信號之間的關(guān)系,從而實現(xiàn)了多工況下軸承故障聲發(fā)射信號的智能辨識。王鑫等[15]從復(fù)雜系統(tǒng)的歷史故障數(shù)據(jù)出發(fā),提出一種基于LSTM的故障時間序列預(yù)測模型,并且通過實驗證明,該模型在故障時間序列分析中具有更強的適用性以及更高的準確性。陳偉等[16]利用LSTM對時間序列優(yōu)異的處理能力,將軸承的振動信號數(shù)據(jù)作為深層LSTM的輸入,取得了很好的辨識準確率。王維鋒等[17]提出基于LSTM的齒輪故障診斷模型,成功解決了在診斷過程中數(shù)據(jù)量大、提取特征困難等問題。
本文采用ICEEMDAN-LSTM深度神經(jīng)網(wǎng)絡(luò)方法,改進的完全集合經(jīng)驗?zāi)B(tài)分解方法[10](ICEEMDAN)通過對加入的噪聲作進一步優(yōu)化,可有效的減少信號在分解過程中分量產(chǎn)生的殘余噪聲和虛假分量等問題。LSTM深度神經(jīng)網(wǎng)絡(luò)算法則在分類過程中具有更強的學(xué)習(xí)和分類能力。因此,針對管道故障特征微弱難以提取的問題,本文提出了一種基于LSTM深度神經(jīng)網(wǎng)絡(luò)的管道缺陷模式識別方法。首先利用ICEEMDAN對管道振動信號進行分解生成一系列本征模態(tài)分量(IMF),隨后根據(jù)相關(guān)峭度準則篩選有效IMF分量并計算近似熵作為特征向量集合,然后基于深度神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)構(gòu)造LSTM深度神經(jīng)網(wǎng)絡(luò)模型并對其進行參數(shù)優(yōu)化,最后將特征向量集合導(dǎo)入進行訓(xùn)練和識別。
ICEEMDAN作為CEEMDAN的改進算法,其主要在CEEMDAN的基礎(chǔ)上,在信號進行分解迭代時加入高斯白噪聲并且對生成的新的信號求平均。相比較CEEMDAN信號分解方法該方法極大的抑制了信號在分解過程中產(chǎn)生的殘余噪聲及虛假分量的現(xiàn)象并且有效提高了信號分解效率[18]。其具體的信號分解過程如下:
步驟1:原始信號加入高斯白噪聲
(1)
其中:x為原始信號;ω(n)為被添加的第n個高斯白噪聲;e1為第一次信號分解時信號的期望信噪比;E1(·)為計算信號的第1個IMF的算子。
步驟2:計算第一次分解的殘差r1
(2)
其中:[·]為計算N個信號平均的算子。
步驟3:計算原始信號的第一階模態(tài)分IMF1
IMF1=x-r1
(3)
步驟4:構(gòu)造第k(k≥2)組加入高斯白噪聲的信號
(4)
其中:ek為第k次信號分解時信號的期望信噪比;Ek(·)為計算信號的第1個IMF的算子。
步驟5:計算第K階殘差rk
(5)
步驟6:計算K階模態(tài)分量
IMFk=rk-1-rk
(6)
步驟7:迭代終止條件
(7)
其中:σ為相鄰兩次IMF分量之間的標準差。令k=k+1,返回步驟4計算下一k值,直至殘差滿足迭代終止條件。本文采用Cauchy收斂準則,即當相鄰兩次IMF分量之間的標準差σ<0.2時,迭代終止。
LSTM是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它很好地彌補了一般RNN模型中的梯度爆炸及消失等不足。LSTM的主要特征是包含3個門選擇結(jié)構(gòu)和一個記憶存儲單元結(jié)構(gòu),其中3個門選擇結(jié)構(gòu)分別是遺忘門、輸入門和輸出門。LSTM靠這些“門”結(jié)構(gòu)讓輸入特征有選擇性的影響神經(jīng)網(wǎng)絡(luò)每個時刻的狀態(tài)[19]。所謂的“門”結(jié)構(gòu)就是使用一個sigmoid作為激活函數(shù)的全連接神經(jīng)網(wǎng)絡(luò)輸出一個0~1間的數(shù)值。當一個特征向量輸入到LSTM神經(jīng)網(wǎng)絡(luò)中訓(xùn)練時,可以根據(jù)規(guī)則來判斷是否有用。只有符合算法認證的信息才會留下,不符的信息則通過遺忘門被遺忘。LSTM的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖
遺忘門用于判斷記憶單元內(nèi)容是否保留,從而實現(xiàn)對記憶內(nèi)容的篩選,其輸出為:
ft=σ(Wxfxt+Whfht-1+bf)
(8)
式中,ft為遺忘門的輸出;σ為激活函數(shù)sigmoid;wxf為輸入和遺忘門之間的權(quán)重;whf為歷史輸出和遺忘門之間的權(quán)重;bf為遺忘門偏置;xt表示t時刻的輸入向量;ht-1為前一時刻的輸出狀態(tài)。
輸入門用于特征導(dǎo)入并且更新單元狀態(tài),當神經(jīng)網(wǎng)絡(luò)的其他部分想要寫入存儲單元的時候,必須先通過輸入門。若輸入門關(guān)閉,則其他神經(jīng)元就無法把值寫入。其輸出為:
it=σ(Wxixt+Whiht-1+bi)
(9)
式中,it為遺忘門的輸出;wxi為輸入和輸入門之間的權(quán)重;whi為歷史輸出和輸入門門之間的權(quán)重;bi為輸入門偏置。
另外,在獲得遺忘門的輸出和輸入門輸出之后,可以得到當前的記憶單元狀態(tài)為:
(10)
(11)
輸出門用于控制單元狀態(tài)的最終輸出,并且決定外界的神經(jīng)元能否把值從存儲單元中讀出來。單元輸出由輸出門輸出和當前單元
狀態(tài)信息相乘并經(jīng)過tanh激活函數(shù)得到。故,輸出門和單元輸出為:
ot=σ(Wxoxt+Whoht-1+bo)
(12)
ht=ottanh(ct)
(13)
式中,ot為遺忘門的輸出;wxo為輸入和輸出門之間的權(quán)重;who為歷史輸出和輸出門之間的權(quán)重;bo為輸出門偏置;ht為當前時刻的單元輸出。
本文提出基于LSTM深度學(xué)習(xí)模型對管道缺陷模式的識別方法,主要分為3個部分:首先,對管道振動數(shù)據(jù)進行特征提?。黄浯?,建立LSTM模型并對其參數(shù)進行優(yōu)化;最后,利用LSTM模型進行故障識別。具體故障診斷步驟如下:
1)通過多傳感器分別采集孔洞、凹坑、裂紋及正常4種不同類型管道在運行狀態(tài)下的振動信號。
2)對采集到的信號進行ICEEMDAN分解,并提取近似熵作為表征管道運行狀態(tài)的特征值特征構(gòu)造特征向量集合。選取其中的80%作為訓(xùn)練樣本數(shù)據(jù),把剩余的作為測試樣本數(shù)據(jù)。
3)基于深度神經(jīng)網(wǎng)絡(luò)理論基礎(chǔ)建立LSTM深度神經(jīng)網(wǎng)絡(luò)模型,并運用該模型對訓(xùn)練樣本數(shù)據(jù)進行訓(xùn)練,不斷調(diào)整優(yōu)化模型中的epoch、batch等參數(shù)使訓(xùn)練準確率保持在較高的區(qū)間。
4)將測試樣本數(shù)據(jù)輸入到訓(xùn)練好的LSTM深度神經(jīng)網(wǎng)絡(luò)模型中,實現(xiàn)管道故障的識別。
為了驗證該方法的有效性,利用實驗室的管道故障模擬實驗平臺,分別對管道進行銼刀摩擦,打開泄漏閥,紗布摩擦來模擬工程實際中凹坑、孔洞、裂紋3種管道故障模式以及利用完整的管道來模擬正常模式,并利用水泵向管道通水,當管道處于穩(wěn)定狀態(tài)時分別采集管道在這4種運行狀態(tài)下的振動信號數(shù)據(jù)。另外考慮到在實際工業(yè)過程中,因為長輸管線的缺陷位置一般不確定,所以在測試振動信號時傳感器的放置位置離缺陷處的位置往往是不確定的,進而導(dǎo)致傳感器在不同測點所采集到的管道振動信號特征也會有所不同。在遠離缺陷位置如在管道接頭處及管卡固定處,由于信號在傳遞過程中會受其影響,此時所采集到的振動信號特征就會比較微弱。因此,本次實驗充分考慮這些實際因素的影響,主要在靠近管卡處、離缺陷位置較遠處、靠近激勵處等位置布置測點,進行管道振動信號的采集。管道振動信號檢測如圖2所示。如圖所示,實驗儀器包括接觸式激振器,掃頻發(fā)生器,壓電式加速度傳感器、動態(tài)信號采集儀及相應(yīng)的采集軟件。首先通過激振器和掃頻發(fā)生器加強管道運行工況下的振動情況,然后利用加速度傳感器在管道上隨機布置測點,通過動態(tài)信號采集儀及操作PC端采集軟件采集管道振動信號。實驗室管道系統(tǒng)及3種故障模式如圖3所示。
圖2 管道振動信號檢測示意圖
圖3 實驗室管道平臺及故障模式
本次實驗采集了凹坑,孔洞,裂紋和正常運行4種工況下的管道振動信號,對振動信號進行ICEEMDAN分解。以凹坑管道的一組振動信號為例,如圖4所示,為管道振動信號ICEEMDAN分解波形圖(前7個分量),從圖4中可以看出,將原始振動信號進行ICEEMDAN處理后的信號沖擊特征明顯,有利于故障特征的提取。
圖4 信號分解結(jié)果圖
基于ICEEMDAN方法對4種工況下的管道振動信號進行分解共得到12個IMF分量和一個余量。但是,一般在分解過程中得到的IMF分量可能會包含不能夠表征管道狀態(tài)的偽分量,若直接進行特征提取不僅會導(dǎo)致向量集合的維數(shù)過多,而且會影響最終的辨識準確率。因此,篩選有效的IMF分量是特征提取的關(guān)鍵。本文根據(jù)峭度準則計算峭度值以此來篩選出最能表征不同工況下管道運行狀態(tài)的IMF分量。如圖5所示,為各階IMF分量峭度值變化趨勢。一般,正常平穩(wěn)運行且噪聲干擾小的信號,其峭度值大于3。從圖5中可以看出,前七階IMF分量的峭度值呈逐漸降低的趨勢且數(shù)值大小都大于3,因此選取IMF1-IMF7分量進行后續(xù)的特征提取分析。
圖5 各階IMF峭度值變化趨勢
針對管道缺陷信息的特征提取,本文預(yù)從時頻域特征進行分析處理,從而構(gòu)造特征樣本集合。信息熵是一種非線性估計方法,主要通過量化的熵值對非穩(wěn)態(tài)信號的復(fù)雜性程度進行衡量。信息熵理論作為特征提取的方法之一,廣泛應(yīng)用在對有噪聲夾雜信號中有效信息的提取。它實際上是一個描述如設(shè)備運行的復(fù)雜程度、診斷的難易程度等無法明確量化確定的指標。故本文最終選取信息熵論中的近似熵作為表征4種工況下管道狀態(tài)的特征集合。另外,本次實驗所采集的管道振動信號樣本共計4個類別,分別為正常、裂紋、孔洞及凹坑。在樣本數(shù)據(jù)采集過程中,采樣時間設(shè)置為60 s。每種工況下的管道振動信號為1 000組,總樣本數(shù)為4 000組。以每種工況下管道振動信號樣本數(shù)據(jù)中的一組數(shù)據(jù)為代表,圖6分別展示了4種工況下管道振動信號的近似熵在空間上的特征分布情況。
為了直觀地顯示特征提取的效果,選取ICEEMDAN分解的前3個IMF分量來分析特征向量在三維空間上的聚類情況。選取特征近似熵的三維空間特征分布如圖6所示,從圖中可以看出4種工況下管道振動信號的特征分布均呈現(xiàn)云狀分布,其中有部分樣本特征發(fā)生重疊現(xiàn)象。這是因為近似熵作為信息熵的一種,主要用來對信號特征的無序性與復(fù)雜性進行描述。一般正常運行的管道其在運行過程中受到的沖擊較少,因此正常管道的振動信號的熵值較大,無序性也較高。當管道中出現(xiàn)諸如孔洞、凹坑、裂紋等缺陷時,其在運行過程中的沖擊特征就會增強,相應(yīng)的管道振動信號的無序性就會變低。反應(yīng)到特征值的空間分布上,雖然可以初步達到聚類的效果,但是樣本特征重疊較多,尤其是針對凹坑、裂紋、孔洞管道的樣本特征值。因此,對管道振動信號進行特征提取后,需要做進一步的深層次的分析處理才能實現(xiàn)對管道狀態(tài)的有效識別。
針對不同缺陷類型管道微弱特征難以識別的問題,本文建立了LSTM深度神經(jīng)網(wǎng)絡(luò)分類模型。整個神經(jīng)網(wǎng)絡(luò)由輸入層(Input);隱含層(LSTM層,full connect layer層)和輸出層(Loss)組成。數(shù)據(jù)由輸入層流入,經(jīng)過LSTM神經(jīng)網(wǎng)絡(luò)并使用Tanh激活函數(shù)非線性化,再流入全連接層并使用Sotfmax函數(shù)激活,最后輸出。本文主要按照以下3個步驟設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)。
第一步:構(gòu)建LSTM深度神經(jīng)網(wǎng)絡(luò)模型。LSTM深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計如圖7所示,LSTM層激活函數(shù)(activate function)選擇Relu函數(shù),全連階層激活函數(shù)選取Softmax函數(shù),輸入層即特征處理的特征向量。
圖7 基于LSTM的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計
第二步:計算損失函數(shù)(loss function)大小。損失函數(shù)描述的是神經(jīng)網(wǎng)絡(luò)計算結(jié)果和實際結(jié)果之間的誤差,最終的目標是通過梯度下降使得找到一組合適的權(quán)值和偏置值使得損失函數(shù)的值最小。常見的損失函數(shù)有均方差損失函數(shù)和交叉熵損失函數(shù)[20-21]。本文將會比較均方差損失函數(shù)和交叉熵損失函數(shù)的訓(xùn)練結(jié)果,最后選擇適合管道缺陷深度學(xué)習(xí)模型的損失函數(shù)。
第三步:尋找一種方法快速確定各個神經(jīng)元的權(quán)值和偏置值,即通過優(yōu)化器(optimiter)確定合適的參數(shù),使得整個網(wǎng)絡(luò)模型得到一個相對滿意的結(jié)果。在損傷識別過程中,本文比較了4種優(yōu)化器(adagrad、adadelta、mini batch gradient descent、momentum)對于損失函數(shù)收斂性和最后識別準確率的影響,最后選擇出合適的優(yōu)化器。
本文針對對凹坑、孔洞、裂紋和正常4種狀態(tài)的管道振動信號各提取了1 000組,共4 000組數(shù)據(jù)。每組數(shù)據(jù)采樣2 048個點。訓(xùn)練樣本為在每種狀態(tài)中選取800組樣本數(shù)據(jù),剩余的200組作為測試樣本。另外,比較均方差損失函數(shù)與交叉熵損失函數(shù)對于訓(xùn)練模型的影響,最終分析選擇交叉熵損失函數(shù)。為了防止訓(xùn)練過程中出現(xiàn)過擬合問題加入了Dropout。其他的具體參數(shù)如表1所示。
表1 編程參數(shù)
圖8和圖9分別展示了深度神經(jīng)網(wǎng)絡(luò)的識別準確率和損失函數(shù)的大小。從圖8及圖9中可以看出,損失函數(shù)的值前20步迅速下降,此時模型距離全局最小值較遠,梯度快速下降,反應(yīng)到準確率圖上就是前20步迭代過程準確率迅速提高,迭代了20步左右整個神經(jīng)網(wǎng)絡(luò)模型就有一個不錯的識別準確率,損失函數(shù)逼近于全局的最小值,此時梯度下降變緩,在整個模型的全局最小值附近做一個緩慢的調(diào)整,在準確率識別圖的反應(yīng)就是迭代多個周期以后準確率才有一個緩慢的提升。當?shù)?0步時整個模型相對穩(wěn)定趨于全局最小值處,因此本模型的迭代步數(shù)設(shè)置為100。另外,單獨從圖8中可以看出參數(shù)優(yōu)化過后的神經(jīng)網(wǎng)絡(luò)識別準確率達到了95%。而且分類的準確率隨著訓(xùn)練不斷提高的過程中沒有出現(xiàn)明顯的振蕩,這說明本模型的學(xué)習(xí)率設(shè)置合理。從圖9中可以看出,損失函數(shù)在快速下降后趨于一個收斂的值,說明模型結(jié)構(gòu)和參數(shù)設(shè)置合理。
圖8 LSTM深度學(xué)習(xí)模型準確率
圖9 LSTM深度學(xué)習(xí)模型損失函數(shù)
將特征樣本集輸入LSTM深度神經(jīng)網(wǎng)絡(luò)分類模型中,得到如圖10所示的分類結(jié)果圖,其中1、2、3、4分別代表孔洞、凹坑、裂紋、正常4類標簽。從圖10可以看出,訓(xùn)練集、測試集及驗證集對4種不同缺陷類型的管道識別準確率基本達到了95%左右。而且該模型總的分類效果從圖10中所有混淆矩陣中可以看出達到了95.3%,其中對于標簽4即正常管道運行狀態(tài)的辨識準確率達到了100%,標簽1的識別率達到了99.2%,因此本模型的誤差主要集中在標簽2(識別準確率為92.5%)和標簽3(識別準確率為89.6%)的分類識別上。
圖10 訓(xùn)練集、測試集和驗證集混淆矩陣
本模型的誤差的區(qū)間為[-1,1],將誤差區(qū)間均分為20份,作出模型的數(shù)據(jù)誤差直方圖,如圖11所示。圖中展示了模型訓(xùn)練完后樣本訓(xùn)練集、樣本測試集和樣本驗證集的誤差。從圖11中可以看出誤差主要分布在[-0.05,0.05],這說明了該神經(jīng)網(wǎng)絡(luò)模型對于分類識別處于一個較小的誤差水平,同時也進一步表明所提出模型的結(jié)構(gòu)穩(wěn)定且對不同工況下管道故障檢測具有很好的識別效果。
圖11 誤差分析
針對管道振動信號特征微弱難以提取的問題,本文提出了一種基于LSTM的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模式識別方法。首先利用ICEEMDAN信號分解方法分解管道振動信號,該方法很好地克服了管道振動信號在分解過程中產(chǎn)生虛假分量和模態(tài)混疊的問題,對復(fù)雜的振動信號具有很好的分解效果。然后根據(jù)峭度準則選取前7階IMF分量并且構(gòu)造近似熵特征向量集合。最后根據(jù)LSTM深度學(xué)習(xí)理論構(gòu)造LSTM分類模型并對該模型中的參數(shù)進行優(yōu)化,將特征向量集合導(dǎo)入LSTM深度神經(jīng)網(wǎng)絡(luò)中進行模式識別。實驗結(jié)果表明:基于LSTM的深度神經(jīng)網(wǎng)絡(luò)模型能夠較好的應(yīng)用于管道故障檢測領(lǐng)域,而且故障識別準確率可達95%,顯著提高了對不同工況下管道故障檢測的辨識準確率。