王秀芳 王 昕
(1. 東北石油大學電氣信息工程學院,黑龍江 大慶 163318;2.黑龍江省油氣信息與控制工程重點實驗室,黑龍江 大慶 163318)
隨著管道運輸業(yè)的發(fā)展,管道泄漏檢測技術(shù)越來越受到人們的重視。在過去的幾十年里,人們研究了多種管道泄漏檢測定位方法,如超聲波檢測法[1]、光纖傳感器檢測法[2]及負壓波法[3]等。雖然檢測方法、技術(shù)越來越成熟,但管道泄漏檢測中仍存在誤報、錯報及漏報等問題,針對這種現(xiàn)象,周旭提出將支持向量機SVM模式分類方法應用到實際天然氣管道泄漏檢測研究中[4]。白亞紅和王奉濤提出將經(jīng)驗模態(tài)分解EMD特征提取算法應用到齒輪磨損故障診斷研究中[5]。郭小薈和馬小平提出將EMD和近似熵相結(jié)合的特征提取算法應用到滾動軸故障診斷研究中[6]。但EMD分解過程會造成模態(tài)混疊和端點效應,并且該特征提取方法并未用到管道泄漏檢測中,所以,筆者將改進經(jīng)驗模態(tài)分解EEMD近似熵特征提取方法應用到天然氣管道泄漏檢測研究中,并進行SVM泄漏類型判斷,最終實現(xiàn)智能分類。
EMD分解方法由于其在處理非平穩(wěn)信號中表現(xiàn)出的諸多優(yōu)點,在諸多領(lǐng)域中得到了廣泛應用。但EMD分解也存在不足之處[7],主要有端點效應和模態(tài)混疊:
a. 在EMD分解的篩選過程中要對信號的極值點利用三次樣條函數(shù)擬合得到上下包絡(luò)線,但是在端點處的擬合存在不確定性,這樣使得數(shù)據(jù)序列的兩端會出現(xiàn)擬合誤差,并且這種誤差會隨著篩選過程循環(huán)次數(shù)而累加,這就是端點效應。
b. 當數(shù)據(jù)不是純粹白噪聲時,EMD會出現(xiàn)模態(tài)混疊,即有可能是一個相似尺度的信號出現(xiàn)在不同的IMF分量中或者是一個IMF分量包含了尺度差異很大的幾種信號等混疊現(xiàn)象。
但是在實際采集的信號中都會包含不規(guī)則的信號信息,因此,EMD的模態(tài)混疊現(xiàn)象是不可避免的。針對這種不足,筆者提出總體經(jīng)驗模態(tài)分析方法,即EEMD分析方法[8]。
為了消弱EMD中的模態(tài)混疊程度,EEMD利用全體噪聲的均值對噪聲進行相互抵消。EEMD對原始信號加上均勻分布的白噪聲,不同尺度的信號區(qū)域?qū)⒆詣佑成涞脚c其相關(guān)的適合尺度上。全體的均值最后就被認為是所要的理想結(jié)果。為了保持信號本身穩(wěn)定,消除附加噪聲,需要進行多次試驗。每次加入不同的白噪聲序列,得到不同的IMF值,對重復以上過程得到的所有IMF值求均值即得到最終結(jié)果。
對實驗室管道進行信息采集。首先,對管道運行狀況分類,包括:正常狀態(tài)、過路狀態(tài)、開閥狀態(tài)、泄漏狀態(tài)和敲擊狀態(tài),分別用字母a、b、c、d、e來代表;然后,對這5種狀態(tài)進行管道信息采集,每種狀態(tài)采集10組數(shù)據(jù)?,F(xiàn)以過路狀態(tài)b1為例進行EMD和EEMD分解,圖1a、b分別為b1狀態(tài)的EMD、EEMD分解圖。
圖1 過路狀態(tài)b1分解效果對比
由圖1可以明顯看出EEMD分解圖比EMD分解圖更能體現(xiàn)出泄漏信號的特征。在EMD分解圖中前4層固有模態(tài)分量比較明顯地體現(xiàn)出信號的泄漏特征,而在EEMD分解圖中前7個固有模態(tài)分量都可以明顯看出泄漏特征,說明EEMD削弱了EMD中的模態(tài)混疊程度。
模態(tài)分解方法分解出的各個內(nèi)稟模態(tài)函數(shù)突出了數(shù)據(jù)的局部特征,每一個內(nèi)稟模態(tài)函數(shù)都隨著信號本身的變化而變化,近似熵ApEn主要度量每個內(nèi)稟模態(tài)信號中產(chǎn)生新模式的概率:
a. 信號進行EEMD分解,得到若干個基本模式分量,選擇包含故障信息最多的前m個基本模式分量進行特征提??;
b. 按照上述算法求這m個基本模式分量的近似熵值;
c. 將這m個基本模式分量的近似熵組成故障特征向量T=[ApEn1,ApEn2,…,ApEnm]。
對管道該狀態(tài)某一信號x(t)進行EMD分解可以得到若干個IMF,從圖1可知前7個基本固有模態(tài)分量能充分體現(xiàn)泄漏信號特征,故取前7個基本模式分量的近似熵值A(chǔ)pEni(i=1,…,7),將這7個基本模式分量的近似熵組成故障特征向量T=[ApEn1,ApEn2,…,ApEn7]。下面以狀態(tài)數(shù)據(jù)a1、b1、c1、d1、e1為例,得到近似熵特征值(表1)。
表1 EMD提取近似熵特征值表
對管道該狀態(tài)某一信號x(t)進行EEMD分解可以得到7個IMF,算法求這7個基本模式分量的近似熵值A(chǔ)pEni(i=1,…,7),組成故障特征向量T=[ApEn1,…,ApEn7]。下面以狀態(tài)數(shù)據(jù)a1、b1、c1、d1、e1為例,得到近似熵特征值(表2)。
表2 EEMD提取近似熵特征值表
經(jīng)驗模態(tài)分解后的各個內(nèi)稟模態(tài)函數(shù)突出了數(shù)據(jù)的局部特征,每一個內(nèi)稟模態(tài)函數(shù)都隨著信號本身的變化而變化,相應的近似熵也會隨之變化。從表1、2中可以看出,各狀態(tài)近似熵特征值的差異比較大,可以很好地表征管道狀態(tài),因此,將近似熵特征值作為SVM判斷管道狀態(tài)輸入。
由于實驗數(shù)據(jù)較少,因此采用多分類方法中的一對一多值分類器構(gòu)造方法,對經(jīng)驗分解采集到的能量熵和近似熵進行SVM分類。用7組進行訓練,3組進行測試。分別采用線性核函數(shù)、多項式核函數(shù)、高斯徑向基函數(shù)RBF和多層感知器Sigmoid核函數(shù)方式對管道泄漏信號EEMD近似熵特征進行分類訓練和測試。保證其他參數(shù)不變,僅修改核函數(shù)的類型。
選擇不同核函數(shù)時訓練集和測試集的預測準確率見表3。
表3 各核函數(shù)訓練集和測試集預測準確率對比
從表3中可以看到,線性核函數(shù)和Sigmoid核函數(shù)預測準確率較低,而RBF核函數(shù)和多項式核函數(shù)訓練集預測準確率相當,但從模型的泛化能力考慮,即同時衡量測試集預測準確率,則RBF核函數(shù)性能最佳。因此,筆者采用RBF核函數(shù)進行建模。
支持向量機分類中應用RBF核函數(shù),懲罰因子C設(shè)為1,核函數(shù)的參數(shù)g設(shè)為0.1。將EMD和EEMD近似熵提取的特征向量組成特征向量組,分別作為SVM模式分類的輸入。EMD近似熵、EEMD近似熵特征提取方法效果對比見表4。
表4 EMD近似熵、EEMD近似熵特征提取方法效果比較
對表4分析可知,EEMD近似熵特征提取方法,無論在訓練、還是在分類過程中,準確率比EMD近似熵方法的要高。說明消弱模態(tài)混疊效應后進行近似熵提取特征,分類效果更佳。
本設(shè)計主要針對天然氣管道因泄漏檢測技術(shù)的不完善而引起的誤報、錯報及漏報等問題,提出了一種管道泄漏檢測高準確率的檢測方案。該方案主要將泄漏信號進行EEMD固有模態(tài)分解,對各固有模態(tài)分量進行近似熵提取特征,組成EEMD近似熵特征向量組作為SVM模式分類輸入進行模式分類,實現(xiàn)可以檢測管道泄漏類型的專家系統(tǒng)。實驗結(jié)果表明,改進經(jīng)驗模態(tài)分解和近似熵相結(jié)合對管道泄漏信號進行提取特征的方法,分類效果更佳。
[1] 李東升,王昌明,施祖康,等.管道壁缺陷超聲波在役檢測的量化分析研究[J].儀器儀表學報,2002,23(2):119~122.
[2] Alistair M,Chris M,Walter J,et al.Detection of Hydrocarbon Fuel Spills Using a Distributed Fiber Optic Sensor[J]. Sensors and Actuators A,2003,109 (1):60~67.
[3] Wike A.SCADA Based Leak Detection System [J]. Pipeline& Gas Journal,1986,213(6):16~20.
[4] 周旭.基于SVM的天然氣管道泄漏次聲波檢測技術(shù)研究[J].中國石油和化工標準與質(zhì)量,2014,34(6):17.
[5] 白亞紅,王奉濤.EMD分解和支持向量機技術(shù)在風電齒輪箱早期齒輪磨損故障診斷中的應用[J].工業(yè)控制計算機,2010,23(2):70~71.
[6] 郭小薈,馬小平.基于EMD近似熵特征提取和支持向量機的故障診斷方法[C].第30屆中國控制會議論文集.煙臺:中國自動化學會控制理論專業(yè)委員會,2011:4275~4279.
[7] 劉芽.基于EEMD和支持向量機的刀具狀態(tài)監(jiān)測方法研究[D].成都:西南交通大學,2012.
[8] Wu Z,Huang N E.Ensemble Empirical Mode Decomposition:a Nosie-assisted Data Analysis Method[J]. Advances in Adaptive Data Analysis,2009,1(1):1~41.