常振磊,崔永建,荊 琳,王婷婷,王 平,楊青霄
中國石油華北油田公司,河北任丘 062552
隨著社會經(jīng)濟(jì)的發(fā)展,我國對石油和天然氣等一次能源的戰(zhàn)略需求不斷提升,管道作為油氣資源的主要運(yùn)輸方式近年來發(fā)展迅猛。在管道服役的同時,因腐蝕、人員誤操作、第三方破壞、材料失效/斷裂、地質(zhì)災(zāi)害等造成的管道事故頻繁發(fā)生,引發(fā)環(huán)境污染,并給國家和人民造成巨大損失[1-2]。因此,對油氣管道的泄漏信息及運(yùn)行狀態(tài)進(jìn)行定量識別,提高檢測系統(tǒng)的準(zhǔn)確率顯得尤為重要。
目前,管道泄漏檢測的方法已逐步發(fā)展成熟,但尚沒有一種檢測方法適用于所有介質(zhì)和工況[3]。負(fù)壓波法對流體介質(zhì)無要求,適用于液體和氣體管道,只需在管道兩端增加壓力變送器即可,是油氣田應(yīng)用最為廣泛的泄漏檢測技術(shù),但基于油氣管道運(yùn)行工況的復(fù)雜性,負(fù)壓波采集到的有效信號會淹沒在噪聲中,因此如何對檢測信號進(jìn)行預(yù)處理、特征提取和工況識別是負(fù)壓波法應(yīng)用的難點(diǎn)[4]。為此,已有研究人員將經(jīng)驗?zāi)B(tài)分解(EMD)[5]、總體經(jīng)驗?zāi)B(tài)分解(EEMD)[6]、小波閾值去噪(WT)[7]、局部均值分解(LMD)[8]、快速傅里葉變換(FFT)[9]等方法應(yīng)用在信號預(yù)處理上,但這些算法均存在一定不足,EMD算法存在模態(tài)混疊和端點(diǎn)效應(yīng)的缺陷,EEMD算法分解時添加的高斯白噪聲信號無法完全消除,WT算法對小波基函數(shù)的選取和分解層數(shù)要求較高,LMD算法在信號解調(diào)的過程中易出現(xiàn)信號突增或突減現(xiàn)象,F(xiàn)FT算法在時頻域轉(zhuǎn)換的過程中對于高頻信號無法屏蔽,導(dǎo)致頻域特征無法識別。變分模態(tài)分解(VMD)算法由Dragomiretskiy在2014年提出[10],屬于自適應(yīng)分解算法,通過迭代計算不斷搜索中心頻率和帶寬,從而獲得模態(tài)分量,可有效抑制模態(tài)混疊?;诖?,采用VMD算法對負(fù)壓波信號進(jìn)行去噪處理,采用最小巴氏距離法確定分解層數(shù),并通過計算各固有模態(tài)分量(IMF)與原始信號概率密度函數(shù)間的歐氏距離確定有效信號數(shù)量,提取重構(gòu)信號的云模型熵值作為特征參數(shù),并輸入支持向量機(jī)(SVM)進(jìn)行工況識別,從而形成基于VMD-ED-云模型熵的管道運(yùn)行狀態(tài)定量識別技術(shù)。
VMD是一種自適應(yīng)、完全非遞歸的分解算法,可通過控制帶寬避免模態(tài)混疊,每個分解模態(tài)在解調(diào)成基帶信號后是平穩(wěn)的,因此算法在采樣和噪聲處理方面具有更強(qiáng)的魯棒性[11]。將原始信號分解為多個IMF分量之和,需滿足IMF的估計信號帶寬和最小,約束變分公式如下:
式中:?t為函數(shù)對時間的導(dǎo)數(shù);δ(t)為單位時間脈沖函數(shù);vk(t)={v1,…,vK},為分解得到的K個IMF分量;ωk為每個模態(tài)分量的頻率中心點(diǎn);*為卷積運(yùn)算;f為原始信號;j為虛部;min為最小化函數(shù);s.t.為約束條件。
引入拉格朗日算子λ和二次懲罰因子a對式(1)進(jìn)行求解,將約束變分問題轉(zhuǎn)化為非約束變分問題,引入增廣Lagrangian函數(shù)F。
利用交替方向乘子算法不斷更新vk(t)、wk和λ,求解非約束變分問題,并進(jìn)行中心頻率更新。
式中:n為迭代次數(shù);為第n+1次迭代的vk統(tǒng)計學(xué)估計量。
在迭代計算的過程中,當(dāng)收斂閾值滿足終止條件時,停止更新模態(tài)分量的帶寬和中心頻率,循環(huán)結(jié)束。根據(jù)實(shí)際頻域特征得到IMF分量,但在去噪的過程中,分解數(shù)K值的設(shè)置和分解后有效模態(tài)的選取將直接影響去噪效果。
K值過大,VMD分解后同一頻率的信號易分解到不同的IMF分量中,出現(xiàn)模態(tài)混疊;K值過小,同一IMF分量中易出現(xiàn)不同頻率信號,出現(xiàn)有用信號缺失。最佳K值應(yīng)保證IMF分量與頻率信號一一對應(yīng)。在此,通過循環(huán)計算不同K值下各IMF分量的最小巴氏距離(BD)確定最優(yōu)K值[12]。
對于同一時域信號中的兩個序列樣本M和N,BD的計算公式為:
式中:BC(M,N)為兩樣本間的巴氏系數(shù)。
BD值越小,說明兩個模態(tài)之間越相似,當(dāng)BD小于閾值時,認(rèn)為存在過分解和模態(tài)混疊現(xiàn)象。
確定K值后,每個IMF分量中包含的原始信號信息有所不同,通常認(rèn)為與原始信號相關(guān)性較大的IMF分量為有效分量,反之為無效分量。管道泄漏信號屬連續(xù)隨機(jī)變量,其概率密度函數(shù)(pdf)可用于描述信號分解后的完全特征。通過計算歐氏距離(ED)對比不同IMF分量與原始信號pdf間的相似程度,從而確定有效信號數(shù)量,相似函數(shù)L:
式中:ED為歐氏距離函數(shù);pdf(f(t))為原始信號的概率密度函數(shù);pdf(IMFk(t))為第k個IMF分量的概率密度函數(shù)。
通過定義公式(5)的最大增量θ確定有效分量和無效分量的分界點(diǎn):
特征選擇和提取是影響管道運(yùn)行狀態(tài)識別的主要因素,在此采用云模型熵值進(jìn)行特征提取,通過逆向云發(fā)生器將定向數(shù)據(jù)轉(zhuǎn)化為定性語言[13],根據(jù)采樣頻率和截取的負(fù)壓波信號,計算采樣時間內(nèi)的期望,隨后計算特征熵值,公式如下:
式中:p為采樣點(diǎn)個數(shù);yi為信號幅值;Ex為數(shù)學(xué)期望;En為特征熵值。
SVM分類算法屬于有監(jiān)督學(xué)習(xí),通過在特征空間上定義間隔最大的線性分類器實(shí)現(xiàn)求解凸二次規(guī)劃問題。由于SVM算法本質(zhì)是一個二值分類器,在此采用一對一法實(shí)現(xiàn)多分類,g個類別對應(yīng)g(g-1)/2個分類器,通過投票器獲得不同樣本的類別。其算法原理參照文獻(xiàn)[14-15]。
根據(jù)對VMD、最小巴氏距離、歐氏距離、云模型特征熵和SVM算法的研究,提出了基于VMDED-云模型熵模型的管道運(yùn)行狀態(tài)識別方法,流程見圖1,步驟分為四個。
圖1 模型流程
(1)在現(xiàn)場采氣井和集氣站分別安裝負(fù)壓波傳感器、北斗定位系統(tǒng)和采集器進(jìn)行信號采集,在中間測試點(diǎn)安裝不同孔徑的放空管件模擬管道泄漏,在測試點(diǎn)用管鉗擊打管道外壁模擬敲擊,獲得管道不同運(yùn)行狀態(tài)下的負(fù)壓波信號。
(2)通過計算最小巴氏距離確定VMD算法模態(tài)分解的K值。
(3)計算各pdf之間的歐氏距離獲得有效信號與無效信號的分界點(diǎn),并提取有效信號進(jìn)行重構(gòu)。
(4)提取重構(gòu)信號的En值作為信號的特征變量,將樣本特征變量輸入SVM分類器中實(shí)現(xiàn)運(yùn)行狀態(tài)的有效識別。
選擇某區(qū)塊采氣井為上游,集氣站為下游,管徑60 mm,壁厚5~6 mm,采集器采樣頻率為1 000 Hz,井口壓力0.2~0.5 MPa,采集器將負(fù)壓波信號攜帶北斗時間標(biāo)簽上傳至監(jiān)測中心,監(jiān)測中心負(fù)責(zé)收集采氣井和集氣站的聲波信號,并進(jìn)行綜合分析和診斷。實(shí)驗共獲得正常、敲擊、小孔泄漏、大孔泄漏4種信號,定義泄漏孔徑/管徑≤0.2為小孔泄漏,小孔泄漏取10 mm,大孔泄漏取管徑的80%為50 mm,每種信號類型獲得50組實(shí)驗數(shù)據(jù),其中一組的時域波形及頻譜圖見圖2~圖5,圖中顯示的為上游波形信號。其中敲擊信號表現(xiàn)為幅值突變,但持續(xù)時間較短;泄漏信號中小孔泄漏呈緩慢下降趨勢,壓力突變點(diǎn)較難識別,大孔泄漏先快速下降隨后又上升至較之前較小的幅值,兩者的頻譜圖中除低頻段信息較豐富外,還存在一定的高頻噪聲信息。
圖2 正常信號
圖3 敲擊信號
圖4 小孔泄漏信號
圖5 大孔泄漏信號
以大孔泄漏信號為例,設(shè)置初始K=2,二次懲罰因子a=2 000,依次取K=K+1進(jìn)行VMD算法分解,并計算不同K值下各IMF分量的最小BD距離,見圖6。設(shè)置閾值為0.001,當(dāng)K值取9、10、11時,最小BD距離趨于0,說明有部分IMF分量存在相似情況,VMD分解出現(xiàn)了過分解,故最佳K值取8。
圖6 不同K值下的最小BD距離
計算原始信號與IMF1~I(xiàn)MF8之間pdf的歐氏距離,見圖7。根據(jù)式(6),IMF4和IMF5之間的增量最大,故選擇IMF4為有效分量和無效分量的分界點(diǎn),IMF1~I(xiàn)MF3作為有效分量,IMF4~I(xiàn)MF8作為噪聲分量。
圖7 不同IMF的歐氏距離
對IMF1~I(xiàn)MF3進(jìn)行信號重構(gòu),得到濾波信號,時域波形及頻譜圖見圖8。濾波后的信號完好保存了低頻信息,有效信息集中在50 Hz以內(nèi),高頻信號明顯被平滑去除。
圖8 濾波后的大孔泄漏信號
采用逆向云發(fā)生器求解濾波后采樣周期內(nèi)正常、敲擊、小孔泄漏、大孔泄漏信號的云模型特征熵值En,見圖9。其中每種工況下的云模型特征熵值均不同,且差異較大,大泄漏信號的En值最大且波動較大,正常和敲擊信號的En值較小且較平穩(wěn),正常信號與小孔泄漏的En值不足敲擊信號的一半且差異較小,但兩者尚無交叉現(xiàn)象。
圖9 不同工況下的云模型特征熵值
采用Matlab R2021a中的libsvm工具箱進(jìn)行運(yùn)行狀態(tài)識別,每種狀態(tài)取40組作為訓(xùn)練集,10組作為測試集,將正常、敲擊、小孔泄漏、大孔泄漏信號分別設(shè)置為0、1、2、3的標(biāo)簽,將云模型特征熵值輸入到SVM模型中,SVM的核函數(shù)選擇RBF徑向基核函數(shù),采用網(wǎng)格搜索法對SVM超參數(shù)的范圍進(jìn)行初始設(shè)定,核函數(shù)寬度范圍為[0,10],懲罰因子范圍為[0,5],對預(yù)估超參數(shù)的組合通過5折交叉驗證確定得分平均值,確定最優(yōu)參數(shù),最大迭代次數(shù)200,迭代軌跡過程見圖10。最終得到核函數(shù)寬度為6.72,懲罰因子為1.04,測試集的分類結(jié)果見圖11。敲擊和大孔泄漏信號的分類準(zhǔn)確率為100%,而正常和小孔泄漏信號分別有一個分類錯誤,其中一個正常信號錯分為小孔泄漏信號,一個小孔泄漏信號錯分為正常信號,小孔泄漏屬緩慢泄漏,其信號幅值的下降緩慢,當(dāng)外界存在較多噪聲時,有效信號會直接淹沒在背景噪聲中,故辨認(rèn)效果有限。
圖10 SVM模型超參數(shù)迭代過程
圖11 測試集樣本分類結(jié)果
本文模型主要將VMD、ED和SVM算法相結(jié)合,為驗證本文組合模型的優(yōu)勢,從信號預(yù)處理、特征提取和工況識別等三個方面進(jìn)行對比驗證。首先,固定ED和SVM算法,在信號預(yù)處理上選取原始信號和EEMD算法進(jìn)行對比;其次,固定VMD和SVM算法,在特征提取上選取信息熵(IE)、排列熵(PE)、樣本熵(SE)進(jìn)行對比,其中每組信號的尺度因子取20,取樣本熵值的平均值計算;最后,固定VMD和ED算法,選擇廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)、極限學(xué)習(xí)機(jī)(ELM)進(jìn)行對比,GRNN和ELM算法的隱含層節(jié)點(diǎn)數(shù)采用試湊法,確定GRNN算法的網(wǎng)絡(luò)結(jié)構(gòu)為1-5-4型,ELM算法的網(wǎng)絡(luò)結(jié)構(gòu)為1-7-4型,模型超參數(shù)采用窮舉法確定。不同模型的對比結(jié)果見表1。
表1 不同模型在數(shù)據(jù)集上的分類結(jié)果
當(dāng)信號不進(jìn)行降噪預(yù)處理時,分類效果最差,且訓(xùn)練集和測試集上的分類準(zhǔn)確率相差較多;采用EEMD算法的降噪效果不及VMD算法,說明采用VMD算法進(jìn)行信號預(yù)處理的必要性。對比不同特征提取方式,本文方法與IE、PE、SE相比,分類準(zhǔn)確度均有所提升,其中IE在計算過程中過度依賴數(shù)據(jù)長度,PE未考慮不同頻段信號幅值之間的關(guān)系,SE易受突變點(diǎn)信號的影響,出現(xiàn)計算偏差,而云模型特征熵?zé)o需設(shè)置尺度因子、嵌入維數(shù)和相似容限等參數(shù),避免了參數(shù)不確定性帶來的計算偏差,其熵值中包含重要的運(yùn)行狀態(tài)信息,且信息不重疊、不交叉。對比工況識別方法,SVM算法較GRNN和ELM算法的分類準(zhǔn)確度有所提升,這可能與神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)結(jié)構(gòu)有關(guān),而SVM算法只需將數(shù)據(jù)映射到超平面即可實(shí)現(xiàn)分類,其實(shí)現(xiàn)方法較為簡單,魯棒性較好。綜上所述,本文提出的組合模型可對不同運(yùn)行狀態(tài)進(jìn)行定量識別,該方法具有可行性和合理性。
(1)針對管道運(yùn)行狀態(tài)在檢測過程中識別困難的問題,提出一種新的負(fù)壓波信號處理方法,分別采用VMD、ED和SVM模型進(jìn)行信號預(yù)處理、特征提取和工況識別,其中VMD算法在信號去噪上具有明顯的優(yōu)越性,可獲得平滑度更高、失真度更小的低頻有效信號,有利于提高后續(xù)工況識別的準(zhǔn)確性。
(2)基于VMD-ED-云模型熵模型的管道運(yùn)行狀態(tài)識別方法在訓(xùn)練集上的分類準(zhǔn)確率為100%,測試集上的分類準(zhǔn)確率為95%,明顯高于其余對比模型,說明了組合模型具有可行性和合理性。
(3)在實(shí)際運(yùn)行中,多孔泄漏也是常見的工況條件,下一步應(yīng)針對不同泄漏孔徑下多孔泄漏進(jìn)行信號處理,提高模型對復(fù)雜工況的適用性。