李 鵬陸 一楊佳康徐永凱
(1.南京信息工程大學(xué),江蘇省氣象探測(cè)與信息處理重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210044;2.南京信息工程大學(xué),江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044;3.無(wú)錫學(xué)院自動(dòng)化學(xué)院,江蘇 無(wú)錫 214105)
危化氣體是工業(yè)生產(chǎn)、存儲(chǔ)和運(yùn)轉(zhuǎn)必不可少的組成部分,一旦發(fā)生?;瘹怏w泄漏,將對(duì)生命、財(cái)產(chǎn)、環(huán)境產(chǎn)生重大影響[1],如何對(duì)氣體泄漏進(jìn)行檢測(cè),及時(shí)發(fā)現(xiàn)并消除泄漏故障是減少此類事故發(fā)生的途徑之一。因此,研究人員提出各種檢測(cè)氣體泄漏技術(shù),如D-S 證據(jù)理論微小孔檢測(cè)[2]、紅外圖像檢測(cè)[3]和聲學(xué)檢測(cè)方法[4],其中聲學(xué)檢測(cè)方法具有較高的靈敏度、效率和精度。
在聲學(xué)檢測(cè)方法中,氣體逸出壓力容器的聲音信號(hào)通常是非平穩(wěn)的,采用時(shí)頻分析方法能夠有效分析非平穩(wěn)信號(hào)。Yan 等[5]提出一種新的時(shí)頻分析方法-頻率切片小波變換(Frequency Slice Wavelet Transform,FSWT),從頻域的角度引入了頻率切片函數(shù)(Frequency Slice Function,FSF),實(shí)現(xiàn)時(shí)頻分析功能。近年來(lái),該分析方法被應(yīng)用到軸承故障診斷[6]、大地電磁信號(hào)去噪[7]、生物信號(hào)分析[8]等領(lǐng)域,引入該方法對(duì)泄漏聲信號(hào)進(jìn)行時(shí)頻分析,并依據(jù)該方法提取相應(yīng)的特征做后續(xù)處理。此外,在實(shí)際應(yīng)用過(guò)程中,僅判斷出有無(wú)氣體泄漏往往不能給工程維修人員提供有效的故障維修信息,因此有必要提出氣體泄漏程度的判斷方法。隨著人工智能的發(fā)展,研究人員已經(jīng)使用機(jī)器學(xué)習(xí)的方法來(lái)檢測(cè)泄漏并對(duì)其進(jìn)行分類。其中,支持向量機(jī)(Support Vector Machine,SVM)作為分類問(wèn)題的監(jiān)督學(xué)習(xí)方法被廣泛使用。Mandal 等[9]提出了基于粗糙集理論和SVM 的泄漏檢測(cè)方案,實(shí)驗(yàn)結(jié)果表明精度達(dá)到95.19%。El-Zahab 等[10]提出一種用于泄漏檢測(cè)的線性SVM 模型,其準(zhǔn)確率為96.44%。在實(shí)際應(yīng)用中,用于建立SVM 分類器的特征或者指標(biāo)受到噪聲影響、壓力容器內(nèi)部壓力變化等影響較大,魯棒性不強(qiáng),鑒于聲學(xué)信號(hào)的非平穩(wěn)特性,將時(shí)域、頻域和時(shí)頻域特征相結(jié)合更加合理。
針對(duì)上述不足,將FSWT 與SVM 相結(jié)合,提出了一種判斷氣體容器是否存在泄漏和泄漏程度識(shí)別的綜合方法。首先,使用FSWT 對(duì)容器泄漏聲信號(hào)進(jìn)行去噪,研究泄漏聲信號(hào)的優(yōu)化基礎(chǔ)和特征。其次,基于變換結(jié)果,提出了一種高質(zhì)量的時(shí)頻特征來(lái)識(shí)別不同泄漏程度,采用一種特征選擇方法來(lái)減少冗余特征,提高預(yù)測(cè)性能,減少訓(xùn)練和利用時(shí)間。然后利用所選擇的特征建立SVM 分類器,以網(wǎng)格搜索的方式搜索適合的SVM 值,使檢測(cè)準(zhǔn)確率達(dá)到最大。最后通過(guò)實(shí)驗(yàn)驗(yàn)證該方法的有效性。
假設(shè)信號(hào)f(t)∈L2(R),為f(t)的傅里葉變換,為頻率切片函數(shù)p(t)的傅里葉變換,則從頻域上定義的FSWT 為[5]:
式中:t為觀測(cè)時(shí)間;w為觀測(cè)頻率;λ為能量系數(shù),通常取1;u為評(píng)估頻率;σ為尺度因子或w、t、u的函數(shù);*表示共軛;i 為虛數(shù)單位。
根據(jù)Parseval 能量守恒關(guān)系和傅里葉變換對(duì)偶關(guān)系列出:
求得其時(shí)域表達(dá)式為:
為了便于分析,引入新的尺度參數(shù)κ=w/σ,則頻率分辨率η可以表示為[11]:
式中:Δw=σΔwp為頻窗寬度;Δwp為頻率切片函數(shù)的窗寬;w為中心頻率。此時(shí)公式可表示為:
頻率切片函數(shù)有多種構(gòu)造方式,可以把它看作是時(shí)頻域上的帶通濾波器[11],其構(gòu)造方式需滿足以下4 個(gè)條件:
FSF 通常具有波動(dòng)性、衰減性等特征[12],根據(jù)其性質(zhì)列出如下6 種函數(shù)以供選擇:
式(10)為高斯函數(shù),由于Heisenberg 不等式只在高斯函數(shù)處取等號(hào),高斯函數(shù)也是短時(shí)傅里葉變換(Short-Time Fourier Transform,STFT)最優(yōu)時(shí)間局部化的窗函數(shù),因此式(10)相比其他的FSF 具有較好的時(shí)頻分辨率,FSWT 本質(zhì)上可以理解為STFT 的延伸發(fā)展。
FSWT 在進(jìn)行逆變換時(shí),可對(duì)任意時(shí)頻區(qū)間(t1,t2,w1,w2)內(nèi)的需求信號(hào)分量進(jìn)行重構(gòu),重構(gòu)后的信號(hào)fx(t)為[13]:
SVM 是由Vapnic 和Cortes 引入的有監(jiān)督的機(jī)器學(xué)習(xí)方法,目前被廣泛應(yīng)用于分類和回歸中[14]。SVM 是一個(gè)二分類算法,圖1 所示,通過(guò)在正和負(fù)之間尋找一個(gè)超平面將它們區(qū)分開。假設(shè)給定一組帶有標(biāo)簽yi=±1 的訓(xùn)練集數(shù)據(jù)x1,x2,…,xn∈?d,SVM 尋找一個(gè)最合適的超平面使支持向量之間有最大的函數(shù)間隔,這個(gè)超平面被定義為:
圖1 SVM 數(shù)據(jù)分類
式中:w 是權(quán)重向量;x 是提取的信號(hào)特征,b是偏差。
SVM 通過(guò)解決以下最優(yōu)化問(wèn)題進(jìn)行二分類:
式中:n是樣本個(gè)數(shù),‖ ‖是范數(shù)矩陣??紤]到實(shí)際存在異常離群點(diǎn),引入松弛變量ξ解決因離群點(diǎn)導(dǎo)致不滿足分類條件的問(wèn)題,則SVM 數(shù)學(xué)模型可優(yōu)化為:
式中:C是離群點(diǎn)權(quán)重,C越大表示離群點(diǎn)對(duì)目標(biāo)函數(shù)影響越大,ξi是松弛變量。根據(jù)統(tǒng)計(jì)學(xué)方法和最優(yōu)化理論,最終的最優(yōu)解問(wèn)題為:
式中:λi,yi是拉格朗日乘子[15]。
所提出的基于FSWT 和SVM 的氣體泄漏診斷主要包括3 個(gè)部分:①數(shù)據(jù)預(yù)處理,②特征提取,③泄漏分類,圖2 為泄漏檢測(cè)方法流程。
圖2 檢測(cè)流程
采集信號(hào)必然會(huì)存在干擾信號(hào),進(jìn)一步分析前要進(jìn)行濾波處理,采用FSWT 方法對(duì)信號(hào)從時(shí)頻域進(jìn)行濾波處理,其步驟如下:
(1)采用FSWT 對(duì)氣體泄漏信號(hào)進(jìn)行分解,得到在全頻帶下的時(shí)頻分布;
(2)采用時(shí)頻域閾值濾波的方式對(duì)信號(hào)進(jìn)行處理:
式中:κ為尺度參數(shù),tn=,σ為噪聲的標(biāo)準(zhǔn)差;N是信號(hào)長(zhǎng)度[16];
(3)對(duì)濾波后的時(shí)頻域選擇性進(jìn)行逆變換重構(gòu),分離出有效氣體泄漏聲信號(hào)進(jìn)行分析;
(4)進(jìn)一步對(duì)去噪后的信號(hào)進(jìn)行特征提取。
特征提取的目的是從數(shù)據(jù)集中確定、量化和描述與待研究問(wèn)題相關(guān)的對(duì)象特征。將不同嚴(yán)重程度的去噪信號(hào)分割成一系列長(zhǎng)度相同的子信號(hào),從中提取時(shí)域、頻域和時(shí)頻域特征來(lái)檢測(cè)是否存在泄漏以及泄漏的程度。傳統(tǒng)時(shí)域特征包含最大值、最小值、峰峰值、絕對(duì)平均值、方差、標(biāo)準(zhǔn)差、峭度、均方根、波形因子、峰值因子、峭度因子、裕度因子,頻域特征包括中心頻率、總諧波失真。利用FSWT 將信號(hào)擴(kuò)展到時(shí)頻域分析,經(jīng)過(guò)分析觀察可以發(fā)現(xiàn)氣體泄漏產(chǎn)生的聲信號(hào)具有寬頻帶、分散性等特點(diǎn),在超聲范圍內(nèi)的30 kHz 和50 kHz 內(nèi)擁有高于可聽聲范圍的能量,其能量集中程度隨著泄漏孔徑的變化而變化,因此可以用平均頻率表示能量集中程度的特征,可以表示為:
式中:W(t,f)是信號(hào)的FSWT 后每一個(gè)時(shí)頻點(diǎn)的值,f是信號(hào)頻率。提取30 kHz~50 kHz 之間的信號(hào)分成128 個(gè)時(shí)間間隔ti(i=1,2,…,128),選取均勻泄漏的時(shí)間段,求Ωf(ti)分別在觀測(cè)范圍為30k~40k、40k~50k、30k~50k 的平均值,獲取均勻泄漏時(shí)不同頻帶信號(hào)的能量集中程度用于后續(xù)的分析。
為了提高SVM 分類能力、減小運(yùn)算量,采用Relief-F 算法[17],根據(jù)不同的特征區(qū)分它們對(duì)應(yīng)特征向量的能力進(jìn)行權(quán)重估計(jì)。根據(jù)各個(gè)不同類別特征數(shù)據(jù)之間的相關(guān)性,其計(jì)算公式如下:
式中:diff(A,R1,R2)表示樣本R1和樣本R2在特征A上的差值,體現(xiàn)各樣本之間的特征距離的大小,可表示為:
式中:Ri表示從隨機(jī)信號(hào)中選取的一個(gè)特征向量;A表示某一特征;Hj表示和Ri同類樣本集中的k個(gè)鄰近樣本(nearest Hits);Mj表示和Ri不同類別樣本集中的k個(gè)鄰近樣本(nearest Misses);P(C)表示C類樣本占樣本總數(shù)比例;m表示抽樣次數(shù)。根據(jù)Relief-F 算法結(jié)果,將具有較大權(quán)重值的特征作為SVM 輸入。
在眾多的分類器中,SVM 能夠處理異常值求得全局最優(yōu)解,具備選取非線性邊界能力[18]。然而大多數(shù)情況下的特征空間是高維的,需要大量的計(jì)算工作,因此使用核函數(shù)(Kernal Function)能夠?qū)⑻卣饔成溆?jì)算轉(zhuǎn)換成特征空間的點(diǎn)積運(yùn)算:
所以式(20)變成:
通過(guò)以下決策規(guī)則可對(duì)x進(jìn)行分類:
采用一對(duì)一法(one-versus-one)進(jìn)行多分類,其核心思想是在任意兩類樣本之間插入SVM,因此對(duì)n類樣本需要設(shè)計(jì)n(n-1)/2 個(gè)SVM,對(duì)測(cè)試集數(shù)據(jù)分別進(jìn)行二分類并投票計(jì)數(shù),將得票數(shù)多的類別歸為該測(cè)試數(shù)的類別。本文將氣體泄漏歸為4 個(gè)嚴(yán)重程度:無(wú)泄漏、輕微泄漏、中度泄漏和嚴(yán)重泄漏,通過(guò)模擬泄漏環(huán)境進(jìn)行實(shí)驗(yàn)論證。
所設(shè)計(jì)的氣體泄漏數(shù)據(jù)采集系統(tǒng)如圖3 所示。
圖3 數(shù)據(jù)采集方案
在這套實(shí)驗(yàn)方案圖中,1 是產(chǎn)生氣體的氮?dú)馄浚? 是氮?dú)馄康某鰵獠糠譃閹в袎簭?qiáng)刻度的減壓閥;3 是有著不同尺寸孔徑的小帽,用于模擬不同嚴(yán)重程度的氣體泄漏故障;4 是寬頻帶的麥克風(fēng)傳感器,其性能指標(biāo)如表1 所示;5 是Analog Discovery 2-NI Edition 采集卡;6 是waveforms 軟件,用于記錄采集數(shù)據(jù)。
表1 麥克風(fēng)參數(shù)
考慮到氣體泄漏聲信號(hào)能量主要集中在超聲范圍,因此選取寬頻帶麥克分探頭觀測(cè)超聲信號(hào),將采集卡采樣頻率設(shè)置為200 kHz 保證采樣信號(hào)質(zhì)量。結(jié)合實(shí)際,將0.5 mm、1.5 mm、3.0mm 泄漏孔徑定義為輕微泄漏、中度泄漏、嚴(yán)重泄漏,圖4 是對(duì)3 種不同泄漏孔徑下的聲信號(hào)從時(shí)域、頻域的分析,可以發(fā)現(xiàn)不論何種孔徑,泄漏聲信號(hào)能量都集中在超聲部分;隨著泄漏孔徑的增大,頻譜開始出現(xiàn)能量分散的趨勢(shì),并且在超聲部分逐步地向50 kHz 集中。因此從超聲范圍內(nèi)對(duì)聲信號(hào)特征進(jìn)行分析和提取是很有必要的。
圖4 不同孔徑泄漏信號(hào)頻譜圖
選取適當(dāng)?shù)某叨纫蜃尤≈的軌颢@取較好的時(shí)域分辨率和頻域分辨率,減少圖像端點(diǎn)處的邊界效應(yīng),根據(jù)文獻(xiàn)[5],選取Δw·Δt=0.5,η=0.05,κ=23.54以獲取較好的分辨率,圖7 分別為不同孔徑泄漏聲信號(hào)進(jìn)行FSWT 變換和降噪后的結(jié)果,其中圖7 的第1 列a 和b 為0.5 mm 孔徑氣體泄漏聲信號(hào)時(shí)頻圖、c 為降噪后的時(shí)頻圖、d 為選取觀測(cè)頻率為30 kHz~50 kHz 進(jìn)行重構(gòu)后的時(shí)域圖,同理第2 列、第3 列分別是1.5 mm 和3.0 mm 泄漏孔徑聲信號(hào)對(duì)應(yīng)的降噪前后的時(shí)頻圖和重構(gòu)后的時(shí)域圖。從圖7中可以發(fā)現(xiàn),在泄漏伊始最先產(chǎn)生超聲信號(hào)且超聲部分信號(hào)幅值較大,將重構(gòu)后的時(shí)域信號(hào)和原始信號(hào)進(jìn)行比對(duì),發(fā)現(xiàn)濾波后的信號(hào)更為平滑,減少了毛刺。按照前文的特征提取方法,對(duì)信號(hào)各類特征進(jìn)行Relief-F 權(quán)重分析,其結(jié)果如表2所示。
表2 各特征權(quán)重值
圖5 是采集信號(hào)的三維散點(diǎn)圖,每一個(gè)點(diǎn)代表一次泄漏信息,將選取的3 個(gè)典型特征作為坐標(biāo)軸,錄入三維視圖中可以清晰的看出,這3 個(gè)特征有明顯的聚類行為,說(shuō)明分析篩選后的特征具有較強(qiáng)的魯棒性,可以作為鑒別泄漏程度的泄漏特征使用。
圖5 前三個(gè)權(quán)重特征的散點(diǎn)圖
選取判別能力最強(qiáng)的前6 個(gè)特征作為SVM 的特征輸入,將70%的數(shù)據(jù)用于訓(xùn)練集,剩余的數(shù)據(jù)用于測(cè)試集,選取高斯核函數(shù)作為核函數(shù),采用十字交叉驗(yàn)證對(duì)分類性能進(jìn)行估計(jì)。由于此方法需要對(duì)懲罰系數(shù)c和高斯核函數(shù)自帶參數(shù)g進(jìn)行確定,為了最大限度地提高驗(yàn)證精度,使用網(wǎng)絡(luò)搜索的方法對(duì)參數(shù)進(jìn)行優(yōu)化處理,將c、g變化范圍設(shè)置為-10~10 進(jìn)行遍歷搜索[19]。
先建立二分類SVM 進(jìn)行識(shí)別泄漏狀態(tài)和非泄漏狀態(tài),當(dāng)c=0.435 3,g=0.164 9 時(shí)的SVM 對(duì)泄漏狀態(tài)和無(wú)泄漏狀態(tài)判斷準(zhǔn)確率達(dá)到99.75%,表明該方法具有較強(qiáng)的泄漏有無(wú)的判準(zhǔn)能力。然后對(duì)泄漏狀態(tài)的嚴(yán)重程度進(jìn)行分類,圖6 表明了按照權(quán)重排列的不同輸入特征數(shù)量和分類結(jié)果的關(guān)系,按照排序依次選取不同數(shù)量的特征送入SVM,結(jié)果表明輸入特征數(shù)隨著數(shù)量增加而增加,當(dāng)特征數(shù)為6 時(shí),準(zhǔn)確率達(dá)到了最高94.68%,此時(shí)c=1.319 5,g=0.435 3,當(dāng)特征數(shù)繼續(xù)增加時(shí),準(zhǔn)確率略微下降,結(jié)果與輸入6 個(gè)特征時(shí)相近,表明經(jīng)過(guò)Relief-F 算法篩選出的特征能夠較好地代表氣體泄漏聲信號(hào)。
圖6 SVM 輸入特征數(shù)量和準(zhǔn)確率關(guān)系
圖7 不同孔徑氣體泄漏聲信號(hào)分析
由此可知,在這項(xiàng)研究中提出的方法能夠保證泄漏檢測(cè)的精確度和泄漏程度識(shí)別的準(zhǔn)確性,這就意味著選擇的FSWT 算法分析信號(hào)、閾值濾波能夠?qū)υ夹盘?hào)進(jìn)行有效的降噪,提出對(duì)重構(gòu)后的信號(hào)從時(shí)頻域不同的頻段、時(shí)間段求取平均頻率能夠有效地代表氣體泄漏聲音信號(hào)的明顯特征。
采用基于聲信號(hào)特征分析方法有助于提高SVM的預(yù)測(cè)性能。表3 給出了部分研究者的方法、特征選取和研究結(jié)果以及采用決策樹、BP 神經(jīng)網(wǎng)絡(luò)作為參照組的算法比對(duì),可以看出所采用的基于FSWT 的去噪方法、提出平均頻率特征、基于Relief-F 的特征篩選能夠有效地提高SVM 的分類準(zhǔn)確度。
表3 部分方法、所選特征和準(zhǔn)確度的比較
本文提出了一種基于FSWT 和SVM 的氣體泄漏檢測(cè)方法,從聲音的角度去分析和判斷氣體泄漏。FSWT 能夠精確地呈現(xiàn)氣體泄漏聲信號(hào)的時(shí)頻能量分布特征,可用于研究氣體泄漏的時(shí)頻特征。對(duì)聲音信號(hào)進(jìn)行閾值濾波和逆變換重構(gòu),有效地去除了噪聲信號(hào)的干擾。在此基礎(chǔ)上,通過(guò)時(shí)域、頻域和時(shí)頻域提取去噪后的聲信號(hào)特征,并進(jìn)行權(quán)重排序,選取權(quán)重值較大的6 個(gè)特征輸入到SVM 進(jìn)行分類,對(duì)泄漏與否判斷準(zhǔn)確率達(dá)到99.75%,對(duì)無(wú)泄漏、泄漏孔徑為0.5 mm 的輕微泄漏、1.5 mm 的中度泄漏、3 mm 的嚴(yán)重泄漏分類識(shí)別準(zhǔn)確率達(dá)到94.68%。結(jié)果表明該方法有良好的檢測(cè)泄漏的性能,不僅可以判斷是否存在泄漏事故,同時(shí)可以診斷出泄漏程度,因此本文提出的氣體泄漏診斷方案具有應(yīng)用價(jià)值,有助于檢測(cè)泄漏和泄漏孔定位研究。