張瑞程,王新穎,胡磊磊,林振源,黃旭安,趙 斌
(常州大學(xué) 環(huán)境與安全工程學(xué)院,江蘇 常州 213164)
城市燃?xì)夤艿雷鳛槌鞘心茉粗匾€,一旦發(fā)生泄漏,將引發(fā)火災(zāi)爆炸等安全事故,造成人員傷亡與財產(chǎn)損失[1-2]。由于管網(wǎng)建設(shè)標(biāo)準(zhǔn)、時間、規(guī)格不同,輸送介質(zhì)多為易燃易爆氣體,大部分管網(wǎng)深埋地下導(dǎo)致日常檢修困難,使城市燃?xì)夤艿婪€(wěn)定、安全運營面臨巨大考驗[3]。
目前,國內(nèi)外主要通過采集管道故障產(chǎn)生的聲發(fā)射信號,人為提取管道故障特征參數(shù),并采用人工神經(jīng)網(wǎng)絡(luò)或支持向量機等模式識別法診斷管道故障,但故障診斷模型仍存在數(shù)據(jù)預(yù)處理繁瑣,欠擬合及難以收斂等問題[4-6];卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域的成功應(yīng)用,為故障診斷提供新的研究思路[7];文獻(xiàn)[8-9]通過將故障信號進(jìn)行時頻變換,滿足二維卷積神經(jīng)網(wǎng)絡(luò)對二維輸入的要求,可實現(xiàn)較高準(zhǔn)確率的故障診斷,但沒有最大化發(fā)揮卷積神經(jīng)網(wǎng)絡(luò)對原始信號的特征自提取優(yōu)勢[8-9];Cho等[10]通過測試數(shù)據(jù)銳化,利用高斯濾波器提高活動識別精度,并采用一維卷積核處理一維數(shù)據(jù);Ince等[11]將一維卷積用于通用智能軸承故障診斷系統(tǒng),以原始時間序列傳感器數(shù)據(jù)作為輸入,通過適當(dāng)訓(xùn)練學(xué)習(xí)最優(yōu)特征;劉星辰等[12]針對旋轉(zhuǎn)機械智能診斷方法計算量大與抗噪能力差等問題,在經(jīng)典LeNet-5基礎(chǔ)上提出基于一維卷積神經(jīng)網(wǎng)絡(luò)的故障診斷算法;吳春志等[13]提出基于一維卷積神經(jīng)網(wǎng)絡(luò)的齒輪箱故障診斷模型,該模型可直接從原始振動信號中學(xué)習(xí)特征并完成故障診斷,且對于單一與復(fù)合故障診斷的準(zhǔn)確率均高于傳統(tǒng)診斷方法。已有故障診斷模型測試集較少,測試集樣本豐富度較低,測試結(jié)果不能充分反應(yīng)故障診斷模型的穩(wěn)定與普適性[14]。
卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型準(zhǔn)確率較高,部分診斷準(zhǔn)確率可達(dá)100%,但應(yīng)用于管道聲發(fā)射信號預(yù)測識別方面的研究較少[15-17]。因此,在前人研究成果基礎(chǔ)上提出基于一維卷積神經(jīng)網(wǎng)絡(luò)的燃?xì)夤艿拦收显\斷模型,將一維卷積核與池化層直接作用于原始聲發(fā)射信號,利用偏移采樣技術(shù)擴充測試數(shù)據(jù)集,并通過生成器的方式讀取訓(xùn)練樣本,減少訓(xùn)練時間,實現(xiàn)端到端的燃?xì)夤艿拦收显\斷。
20世紀(jì)60年代,Hubel和Wiesel通過研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元發(fā)現(xiàn),其獨特的網(wǎng)絡(luò)結(jié)構(gòu)可有效降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,并提出卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[18]的概念。卷積神經(jīng)網(wǎng)絡(luò)是前饋神經(jīng)網(wǎng)絡(luò),人工神經(jīng)元可響應(yīng)周圍單元,處理大型圖像,尤其在模式分類領(lǐng)域表現(xiàn)突出。
卷積神經(jīng)網(wǎng)絡(luò)除全連接層外還包括卷積層和池化層。卷積層用于提取特征,關(guān)鍵參數(shù)為步長和padding:步長用于控制卷積核移動距離,padding用于對數(shù)據(jù)進(jìn)行操作。padding包括2種:1種是不進(jìn)行操作,另外1種是補0,使卷積后的激活映射保持不變。池化層用于減少參數(shù)量。卷積神經(jīng)網(wǎng)絡(luò)可分為一維卷積神經(jīng)網(wǎng)絡(luò)、二維卷積神經(jīng)網(wǎng)絡(luò)和三維卷積神經(jīng)網(wǎng)絡(luò):一維卷積神經(jīng)網(wǎng)絡(luò)用于分析傳感器數(shù)據(jù)時間序列;二維卷積神經(jīng)網(wǎng)絡(luò)用于計算機視覺與圖像處理;三維卷積神經(jīng)網(wǎng)絡(luò)主要用于醫(yī)學(xué)圖像及視頻類數(shù)據(jù)識別。針對管道泄漏產(chǎn)生的一維聲發(fā)射信號,采用一維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分析。
在計算機視覺領(lǐng)域,卷積適用于邊緣查找、特征檢測、運動檢測、圖像匹配等任務(wù)。在信號處理領(lǐng)域,卷積是執(zhí)行平滑或銳化的任何物理設(shè)備或計算程序的核心。對于連續(xù)變量x的函數(shù)f(x)和g(x),卷積定義如式(1)所示:
(1)
式中:*表示卷積運算;τ表示時間常數(shù);f(τ),g(τ)為時間常數(shù)τ的函數(shù);g(x-τ)為g(τ)經(jīng)翻轉(zhuǎn)平移后的結(jié)果。對于所有實數(shù)x,上述積分是存在的。
隨x取值不同,積分定義新的函數(shù)即f(x)和g(x)的卷積。卷積是2個變量在某范圍內(nèi)相乘然后求和的結(jié)果。對于離散變量x的函數(shù),卷積定義如式(2)所示:
(2)
式中:k為時序;f[x]和g[x]表示不同序列;f[k]為時序k的序列;當(dāng)x=0時,序列g(shù)[-k]為g[k]時序k取反的結(jié)果;g[x-k]為x使g[-k]位移的量,x取值不同,卷積結(jié)果不同。
一維卷積神經(jīng)網(wǎng)絡(luò)能識別序列中局部模式。對每個序列段執(zhí)行相同輸入變換,在序列中某個位置學(xué)到的模式可以在其他位置被識別,使一維卷積神經(jīng)網(wǎng)絡(luò)具有平移不變性(針對時間平移而言)。一維卷積神經(jīng)網(wǎng)絡(luò)工作原理如圖1所示。利用一維卷積,從時間序列中提取局部一維序列段,進(jìn)行卷積和池化操作,提取序列特征。
圖1 一維卷積神經(jīng)網(wǎng)絡(luò)工作原理Fig.1 Working principle of one-dimensional convolution neural network
傳統(tǒng)故障診斷技術(shù)采用聲發(fā)射等監(jiān)測儀器獲取一維故障數(shù)據(jù),通過對故障數(shù)據(jù)時域與能量域進(jìn)行分析,得到單變量與多變量特征,并利用人工神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機等模式識別技術(shù)對故障進(jìn)行分類識別。但傳統(tǒng)故障診斷技術(shù)存在準(zhǔn)確率低、魯棒性差、特征提取困難及數(shù)據(jù)預(yù)處理過程復(fù)雜等問題。卷積神經(jīng)網(wǎng)絡(luò)能有效提高故障診斷準(zhǔn)確率,其中二維卷積神經(jīng)網(wǎng)絡(luò)需要將一維信號通過時頻變換轉(zhuǎn)換為二維時頻圖,以實現(xiàn)二維卷積神經(jīng)網(wǎng)絡(luò)的圖像識別優(yōu)勢。本文提出的一維卷積神經(jīng)網(wǎng)絡(luò),直接從原始一維數(shù)據(jù)出發(fā)分類識別故障數(shù)據(jù),讓一維卷積核對一維數(shù)據(jù)進(jìn)行特征自提取,省略復(fù)雜的數(shù)據(jù)預(yù)處理過程。一維卷積與其他故障診斷方法對比如圖2所示。
圖2 一維卷積與其他故障診斷方法對比Fig.2 Comparison of one-dimensional convolution and other fault diagnosis methods
VGGNet是牛津大學(xué)計算機視覺組和Google DeepMind公司研究員共同研發(fā)的深度卷積神經(jīng)網(wǎng)絡(luò),用來探索神經(jīng)網(wǎng)絡(luò)深度與性能間相關(guān)關(guān)系。通過對大小相同卷積核和最大池化核重復(fù)堆疊方式加深網(wǎng)絡(luò)結(jié)構(gòu),并進(jìn)行性能對比,最終構(gòu)建出16~19層深層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的加深能有效提升模型性能,而網(wǎng)絡(luò)參數(shù)量并沒有顯著增加,因為最后3個全連接層占據(jù)大量參數(shù)。
VGGNet網(wǎng)絡(luò)深度由11層到19層不等,其中VGGNet-16和VGGNet-19較常用。VGGNet把網(wǎng)絡(luò)劃分為5段,每段由多個3*3卷積網(wǎng)絡(luò)串聯(lián)組成,每段卷積后面連接1個最大池化層,其次為3個全連接層和1個Softmax層。
本文實驗?zāi)P驮赩GG-16模型基礎(chǔ)上做了部分改進(jìn):共有4段卷積,每段卷積由2層卷積層和1個最大池化層構(gòu)成;同段卷積層的卷積核長度相同,前3段卷積步長均為2,即卷積核每次移動步長為2,經(jīng)過3段卷積,數(shù)據(jù)長度不斷減小,所以將第4段卷積步長設(shè)置為1,確保能夠更好地提取樣本特征。Padding方式為same,即在數(shù)據(jù)外層補0,避免數(shù)據(jù)邊緣特征遺失;激活函數(shù)均設(shè)置為Relu,加快收斂速度;全連接層采用4分類的Softmax Classifier,設(shè)置Dropout為0.3,隨機去除30%神經(jīng)元,防止模型過度擬合。
一維卷積神經(jīng)網(wǎng)絡(luò)燃?xì)夤艿拦收显\斷流程如圖3所示。首先采集管道聲發(fā)射信號,將數(shù)據(jù)集分為訓(xùn)練集和測試集;在Keras上建立一維卷積神經(jīng)網(wǎng)絡(luò)模型,根據(jù)數(shù)據(jù)集大小選擇網(wǎng)絡(luò)參數(shù),訓(xùn)練完成后輸出準(zhǔn)確率與損失函數(shù)變化曲線;將400組測試數(shù)據(jù)集與經(jīng)偏移采樣技術(shù)擴充后的4 004組數(shù)據(jù)集輸入訓(xùn)練好的模型中,輸出故障診斷結(jié)果,并通過混淆矩陣、召回率、精準(zhǔn)度等多個指標(biāo)評價模型效果。
圖3 燃?xì)夤艿拦收显\斷流程Fig.3 Flow chart of fault diagnosis on gas pipeline
燃?xì)夤艿拦收夏M實驗?zāi)P椭饕ü艿垒斶\、數(shù)據(jù)采集和儀表儀器3個單元,故障模擬實驗臺如圖4所示。
圖4 燃?xì)夤艿拦收夏M實驗臺Fig.4 Simulation test bench of gas pipeline fault
管道輸運單元包括閥門、空氣壓縮機和輸運管道。其中,無縫鋼管用來模擬燃?xì)夤艿?,輸運管道上設(shè)4個模擬故障點(泄漏閥)模擬管道故障,空氣壓縮機提供的空氣代替燃?xì)?。?shù)據(jù)采集單元由工業(yè)計算機、聲發(fā)射卡、濾波范圍為20~120 kHz的聲發(fā)射前置放大器、聲發(fā)射傳感器以及對應(yīng)處理軟件組成。儀器儀表單元主要由壓力表、轉(zhuǎn)子流量計、溫度傳感器組成。
由空氣壓縮機為燃?xì)夤艿捞峁┻M(jìn)口壓力,模擬燃?xì)夤艿肋\行情況。通過調(diào)節(jié)泄漏閥開度模擬管道正常、輕微故障、中度故障及重度故障4種運行狀態(tài):泄漏閥全閉,管道為正常運行狀態(tài),采集數(shù)據(jù)為背景噪聲信號;泄漏閥打開,采集數(shù)據(jù)為背景噪聲和泄漏引發(fā)聲發(fā)射信號。4種運行狀態(tài)下采集到的部分實驗數(shù)據(jù)如圖5所示。
圖5 4種運行狀態(tài)下部分實驗數(shù)據(jù)Fig.5 Partial experimental data under four operating states
每種狀態(tài)選取200個樣本,樣本集共包含800個樣本。每個樣本包含5 000個采樣點,對應(yīng)一維卷積神經(jīng)網(wǎng)絡(luò)輸入維度為5 000,輸出維度為4,將70%樣本作為模型訓(xùn)練集,30%樣本作為模型驗證集。
為保證測試結(jié)果可靠性,利用偏移采樣技術(shù)對長度為505 000的聲發(fā)射信號進(jìn)行擴充,每次偏移500個單位長度,最終生成1 001個樣本,4種故障類型原始聲發(fā)射信號,共生成4 004個樣本。
改進(jìn)后的一維卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),見表1。數(shù)據(jù)經(jīng)預(yù)處理,每條聲發(fā)射數(shù)據(jù)包含有5 000個時間點,得到1個5 000×1的矩陣,設(shè)置卷積核大小為16,移動的步長為2,第1個卷積層輸出矩陣2 497×16;第2個卷積層步長與卷積核大小與第1層相同,輸出矩陣大小為1 249×16。為降低輸出復(fù)雜度,在2個卷積后添加1個大小為2的最大池化層,輸出矩陣的大小變?yōu)檩斎刖仃嚨?/2。為提取更多特征,減少卷積核長度增大卷積核個數(shù),以同樣方式堆疊3層,并在第4個最大池化層之后添加1個均值池化層和Dropout層,避免過擬合的發(fā)生,最終輸出矩陣的大小為1×512,最后1層向量長度由512降為4。Softmax作為激活函數(shù),由于強制神經(jīng)網(wǎng)絡(luò)4個輸出值和為1,所以,輸出值可代表4種運行情況出現(xiàn)概率。
表1 模型結(jié)構(gòu)參數(shù)Table 1 Structure parameters of model
實驗共采集800組數(shù)據(jù),其中,560組作為模型訓(xùn)練集,240組作為模型驗證集。將所有數(shù)據(jù)輸入一維卷積神經(jīng)網(wǎng)絡(luò)模型,批處理量20,共執(zhí)行50個訓(xùn)練周期。訓(xùn)練完成后,用Matplotlib對訓(xùn)練數(shù)據(jù)集與驗證數(shù)據(jù)集準(zhǔn)確率和損失函數(shù)做可視化處理,準(zhǔn)確率和損失函數(shù)變化曲線如圖6所示。
圖6 準(zhǔn)確率和損失函數(shù)變化曲線Fig.6 Variation curves of accuracy and loss function
由圖6可知,當(dāng)訓(xùn)練處于第6世代時,訓(xùn)練集與驗證集準(zhǔn)確率第1次同時達(dá)到90%以上;當(dāng)大于第10世代,小于第30世代時,模型基本趨于穩(wěn)定,準(zhǔn)確率與損失函數(shù)在最大值附近小幅度波動;當(dāng)訓(xùn)練處于31、39、48世代時,驗證集準(zhǔn)確率和損失函數(shù)曲線波動幅度較大,擬合程度相對較低,驗證集準(zhǔn)確率約為80%,損失函數(shù)值約為0.6。原因是批處理量值過小,網(wǎng)絡(luò)收斂不穩(wěn)定,收斂速度慢。將批處理量由20調(diào)整為30,優(yōu)化后的模型準(zhǔn)確率和損失函數(shù)變化曲線如圖7所示。
圖7 優(yōu)化后的模型準(zhǔn)確率和損失函數(shù)變化曲線Fig.7 Variation curves of accuracy and loss function after model optimization
由圖7可知,5世代之后曲線逐漸趨于穩(wěn)定,準(zhǔn)確率保持在98%左右,模型擬合程度較高,訓(xùn)練集與驗證集基本持平;損失函數(shù)值在0~0.2小范圍波動,魯棒性較高;根據(jù)數(shù)據(jù)集大小適當(dāng)增大批處理量值,使大矩陣乘法并行化效率提高,損失函數(shù)下降趨勢明確,能有效解決驗證集曲線波動幅度過大的問題。訓(xùn)練集和驗證集準(zhǔn)確率均大于98%。因此,采用以VGG16為基礎(chǔ)的一維卷積神經(jīng)網(wǎng)絡(luò)識別管道原始聲發(fā)射信號,可有效提高燃?xì)夤艿拦收显\斷準(zhǔn)確率。將未經(jīng)訓(xùn)練的400組測試數(shù)據(jù)集輸入保存好的一維卷積神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行故障識別,得到混淆矩陣如圖8所示。
圖8 400組測試集的混淆矩陣Fig.8 Confusion matrix of 400 groups test sets
由圖8可知,一維卷積神經(jīng)網(wǎng)絡(luò)模型對管道4種運行狀態(tài)識別準(zhǔn)確率較高;其中,對于正常、重度故障的識別準(zhǔn)確率達(dá)到100%;僅在輕微故障、中度故障之間發(fā)生混淆。但由于測試數(shù)據(jù)集樣本量較少,不能充分驗證模型的泛化性與普適性。因此,將經(jīng)過偏移采樣技術(shù)的4 004組數(shù)據(jù)輸入一維卷積神經(jīng)網(wǎng)絡(luò)模型中,得到混淆矩陣如圖9所示。
圖9 4 004組測試集的混淆矩陣Fig.9 Confusion matrix of 4 004 groups test sets
由圖9可知,模型對管道正常運行情況的識別準(zhǔn)確率達(dá)到100%,混淆主要發(fā)生在輕微故障、中度故障和重度故障之間,且相鄰故障之間更容易發(fā)生混淆,僅有少量輕微故障和重度故障之間發(fā)生混淆。模型故障診斷準(zhǔn)確率平均值達(dá)98%,對比小樣本測試集并沒有發(fā)生明顯變化,說明一維卷積神經(jīng)網(wǎng)絡(luò)能夠有效診斷燃?xì)夤艿拦收希也恍柽M(jìn)行復(fù)雜的數(shù)據(jù)預(yù)處理。
為進(jìn)一步評價模型性能,根據(jù)混淆矩陣計算得到模型對管道4種運行狀態(tài)識別的精準(zhǔn)率、召回率、特異度以及F1分?jǐn)?shù)等指標(biāo),見表2。其中,精準(zhǔn)率表示預(yù)測為該類故障樣本中實際為該類故障樣本的概率;召回率表示實際為該類故障的樣本中被預(yù)測為該類故障的概率;特異度表示實際不是該類故障樣本中預(yù)測為不是該類故障樣本的概率;F1分?jǐn)?shù)指標(biāo)綜合精準(zhǔn)率與召回率的產(chǎn)出結(jié)果。F1分?jǐn)?shù)指標(biāo)取值范圍為0~1,1表示模型輸出結(jié)果最好,0表示模型輸出結(jié)果最差。
由表2可知,一維卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型的精準(zhǔn)率、召回率、特異度均大于96%;F1分?jǐn)?shù)均趨近于1。其中管道正常運行指標(biāo)最高,其次是輕微故障和重度故障,中度故障相較于其他3種運行情況指標(biāo)較低,但F1分?jǐn)?shù)高達(dá)0.97。結(jié)果表明:一維卷積神經(jīng)網(wǎng)絡(luò)的燃?xì)夤艿拦收显\斷模型,不僅能準(zhǔn)確判斷管道是否出現(xiàn)故障,對管道運行過程中的故障程度也能準(zhǔn)確區(qū)分。
表2 模型評價指標(biāo)Table 2 Evaluation indexes of model
1)通過適當(dāng)調(diào)整批處理量值,可有效解決模型在訓(xùn)練過程中驗證集曲線波動幅度較大問題;在一定范圍內(nèi),批處理量值越大,下降趨勢越明確,訓(xùn)練波動幅度越小。
2)一維卷積神經(jīng)網(wǎng)絡(luò)模型可直接將原始聲發(fā)射信號作為輸入項,進(jìn)行訓(xùn)練與測試,有效解決燃?xì)夤艿拦收显\斷過程中數(shù)據(jù)預(yù)處理復(fù)雜、特征提取困難等問題,實現(xiàn)端到端的準(zhǔn)確故障診斷。
3)采用偏移采樣技術(shù)對測試數(shù)據(jù)集進(jìn)行擴充,解決傳統(tǒng)模式識別方法局限于較小數(shù)據(jù)集的問題,并采用準(zhǔn)確率、損失函數(shù)、混淆矩陣、精準(zhǔn)率、召回率等多種評價指標(biāo)對故障診斷模型評估,提高模型測試結(jié)果的可信度。
中國安全生產(chǎn)科學(xué)技術(shù)2021年2期