吳 國 超
(中石化重慶涪陵頁巖氣勘探開發(fā)有限公司, 重慶 涪陵 408000)
基于光纖傳感技術(shù)的周界安防技術(shù),近年來得到了快速發(fā)展。光纖傳感具有能抗電磁干擾、易于遠(yuǎn)傳等優(yōu)點(diǎn),可以克服電類傳感器的不足。利用干涉技術(shù)制成的分布式光纖,在周界安防系統(tǒng)中已得到廣泛應(yīng)用。
對(duì)入侵事件的識(shí)別算法是周界安防系統(tǒng)的核心部分。目前,光纖周界安防系統(tǒng)中常用的信號(hào)特征提取方法,是提取入侵信號(hào)的時(shí)域、頻域特征[1-2]。實(shí)踐中,入侵信號(hào)源多變,且不同入侵事件的信號(hào)之間存在相似的部分,僅提取時(shí)域、頻域特征,往往不能完全區(qū)分真實(shí)入侵事件和環(huán)境干擾信號(hào)。為彌補(bǔ)光纖周界安防系統(tǒng)識(shí)別算法的不足,使系統(tǒng)能夠正確區(qū)分真實(shí)入侵事件和環(huán)境干擾信號(hào),我們提出了一種基于小波分析與支持向量機(jī)的入侵事件分類方法。
分布式光纖傳感器具有較強(qiáng)的魯棒性,能夠在惡劣環(huán)境下長(zhǎng)時(shí)間工作,且保持性能穩(wěn)定。在周界安防系統(tǒng)中,分布式光纖傳感器的工作原理是:光源發(fā)出的光線通過耦合器C1后分成兩束光,沿著參考光路和測(cè)試光路傳播;當(dāng)光纖受外力作用(入侵事件或環(huán)境干擾)而振動(dòng)時(shí),兩束光的相位發(fā)生改變,產(chǎn)生相位差,在耦合器C2處發(fā)生干涉光;光電元件將干涉光強(qiáng)物理信號(hào)轉(zhuǎn)換為電信號(hào),上位機(jī)通過采集此電信號(hào)而獲取入侵信息(見圖1)。
圖1 分布式光纖傳感器的工作原理
對(duì)上位機(jī)采集到的電信號(hào)進(jìn)行預(yù)處理,一般是手動(dòng)將入侵信號(hào)從背景信號(hào)中截取出來。截取出來的信號(hào)都為一個(gè)樣本,但每個(gè)入侵信號(hào)的長(zhǎng)度不等,需對(duì)光纖信號(hào)進(jìn)行分幀處理。
我們認(rèn)為,應(yīng)該事先設(shè)置好幀長(zhǎng)截取信號(hào),并保證相鄰兩幀信號(hào)之間有一定的重疊率(通常幀移的長(zhǎng)度為幀長(zhǎng)的12~13),這樣可以避免入侵事件信號(hào)丟失。分幀過程如圖2所示,其中,X為原始信號(hào),Xn為分幀后得到的若干條信號(hào)。幀數(shù)的計(jì)算公式如式(1)。
n=(x-l+w)w
(1)
式中:n為幀數(shù);x為信號(hào)長(zhǎng)度;l和w分別為事先設(shè)置好的幀長(zhǎng)和幀移。
小波變化常用于提取信號(hào)的多分辨率特征。其基本思想是:通過一組由小波基函數(shù)C(t)經(jīng)伸縮和位移構(gòu)成的小波函數(shù)系C(a,τ)來逼近原始信號(hào)[3]。這些函數(shù)可定義為:
(2)
式中:a為尺度因子;τ為平移量;C(t)為小波基函數(shù),t為伸縮因子。
圖2 分幀過程示意
當(dāng)a、τ連續(xù)變換時(shí),小波變換包含的信息是冗余的。為了防止信息丟失并去除冗余信息,可離散小波變換。離散小波基函數(shù)如式(3)。
φj,k(t)=a0-j2φ(a0-j-kb0)
(3)
式中:a0為尺度因子;b0為平移因子;j為a離散化后的對(duì)數(shù)坐標(biāo);k為b離散化后的倍數(shù);φ為離散小波函數(shù)。
在分析非平穩(wěn)信號(hào)時(shí),為了使小波函數(shù)能夠具有可變的時(shí)間和頻率分辨率功能,需要對(duì)尺度因子和平移因子的大小進(jìn)行調(diào)整。當(dāng)a0=2,b0=1,離散小波函數(shù)稱為二進(jìn)小波基函數(shù),如式(4)。
φj,k(t)=2-j2φ(a-j-k)
(4)
將信號(hào)表示為一個(gè)低頻部分和不同頻率下的高頻部分,低頻部分能夠表示信號(hào)整體信息,高頻部分能夠表示細(xì)節(jié)信息。按多分辨率分析的塔式算法,可得近似系數(shù)aj,k和細(xì)節(jié)系數(shù)dj,k。
(5)
由式(5)可以看出,近似系數(shù)和細(xì)節(jié)系數(shù)是由上一級(jí)近似系數(shù)經(jīng)過濾波器h(低通)和g(高通)得到。塔式算法多級(jí)分解框圖如圖3所示。
圖3 塔式算法多級(jí)分解框圖
小波重構(gòu)的過程是分解的逆向過程,下一級(jí)分解結(jié)果的近似系數(shù)和細(xì)節(jié)系數(shù)經(jīng)過h′和g′后進(jìn)行求和,得到本級(jí)的分解近似級(jí)數(shù)。計(jì)算公式如式(6),其中,aj′和dj′表示分解得到的系數(shù),經(jīng)過h′和g′得到上一級(jí)近似系數(shù)aj+1。
aj+1,k=aj′*h(k)+dj′*g(k)
(6)
基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(SVM)已被廣泛應(yīng)用于模式分類問題。按SVM的方法,能夠通過非線性變化將線性不可分的原始特征x映射到高維空間,z=φ(x),實(shí)現(xiàn)線性可分。在這個(gè)新空間中構(gòu)造最優(yōu)線性超平面,使兩個(gè)類別的分離度最大化[4]。這種映射通??梢酝ㄟ^核函數(shù)實(shí)現(xiàn)。
(7)
式中:W表示最大間距,是關(guān)于拉格朗日乘子α的函數(shù);n為支持向量的數(shù)目;αi為拉格朗日乘子;y是不同類別的標(biāo)簽;K為核函數(shù);C為懲罰因子。
現(xiàn)場(chǎng)采集得到的實(shí)驗(yàn)數(shù)據(jù),每組信號(hào)長(zhǎng)度不同。為了使輸入信號(hào)滿足SVM等長(zhǎng)的條件,需要根據(jù)1.1中描述的方法,對(duì)原始數(shù)據(jù)進(jìn)行分幀操作。本次實(shí)驗(yàn)設(shè)置的幀長(zhǎng)為512,幀移的長(zhǎng)度為256。這樣的參數(shù)設(shè)置可保證每一條信號(hào)的幀信號(hào)有一定的重復(fù)率,不會(huì)造成數(shù)據(jù)信息的丟失。分幀完成之后,可得所有信號(hào)的樣本矩陣。然后對(duì)樣本矩陣的每一幀信號(hào)進(jìn)行小波特征提取,得到其小波域信息。小波特征提取包含了信號(hào)的多分辨率信息,能夠?qū)r(shí)域信號(hào)中的隱藏信息挖掘出來,為分類入侵信號(hào)打下基礎(chǔ)。最終將小波處理的數(shù)據(jù)分為測(cè)試集和訓(xùn)練集。訓(xùn)練數(shù)據(jù)輸入SVM進(jìn)行訓(xùn)練,使用測(cè)試數(shù)據(jù)對(duì)訓(xùn)練好的SVM模型進(jìn)行測(cè)試?;谛〔ǚ治雠c支持向量機(jī)(WT-SVM)的入侵信號(hào)識(shí)別系統(tǒng)框圖如圖4所示。
原始信號(hào)經(jīng)過數(shù)據(jù)處理,得到總體樣本。將總體樣本分為訓(xùn)練樣本和測(cè)試樣本,數(shù)據(jù)處理包括分幀和小波變換。在訓(xùn)練階段包括訓(xùn)練數(shù)據(jù)不斷輸入SVM模型和檢測(cè)模型內(nèi)部參數(shù)的預(yù)測(cè)輸出;而反向傳播則根據(jù)正向傳播的效果,不斷更新內(nèi)部參數(shù),使其達(dá)到最優(yōu)。然后SVM模型參數(shù)保留,使用測(cè)試數(shù)據(jù)對(duì)SVM進(jìn)行測(cè)試。根據(jù)測(cè)試集效果對(duì)模型的超參數(shù)進(jìn)行調(diào)節(jié),例如訓(xùn)練樣本與總體樣本的比例、核函數(shù)的選取。
圖4 WT-SVM入侵信號(hào)識(shí)別系統(tǒng)框圖
為了驗(yàn)證上述方法的有效性,以重慶涪陵頁巖氣井場(chǎng)的分布式光纖入侵檢測(cè)系統(tǒng)為例,進(jìn)行了實(shí)驗(yàn)研究。涪陵頁巖氣井場(chǎng)的周界安防系統(tǒng)中,圍欄上安裝有U形分布式振動(dòng)光纖(見圖5)。實(shí)驗(yàn)中,在圍欄上制造落石、攀爬、擊打3種入侵情況,采集相應(yīng)的入侵信號(hào)。
圖5 涪陵頁巖氣井場(chǎng)的周界安防系統(tǒng)現(xiàn)場(chǎng)
采集到的信號(hào)中包含背景信號(hào)和入侵信號(hào)。將入侵信號(hào)從背景信號(hào)里截取出來,獲得入侵信號(hào)樣本。
如圖6所示,每一次導(dǎo)出的數(shù)據(jù)含有大量的背景信號(hào),需要將入侵信號(hào)從背景信號(hào)中分離出來。圖中虛線為入侵信號(hào)的起點(diǎn)和終點(diǎn)。所有信號(hào)截取操作完成之后,得到3種入侵信號(hào)的樣本數(shù)據(jù),包括110個(gè)落石入侵事件樣本,119個(gè)攀爬入侵事件樣本和109個(gè)擊打入侵事件樣本。
圖6 入侵信號(hào)波形圖和截取波段
支持向量機(jī)的模型為本次實(shí)驗(yàn)設(shè)置的分類器。為找出最優(yōu)的支持向量機(jī)結(jié)構(gòu),分別以常見的多項(xiàng)式核函數(shù)(POL)、高斯徑向基核函數(shù)(RBF)和sigmoid函數(shù)(G)進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示,高斯徑向基核函數(shù)的識(shí)別率較高。高斯徑向基核函數(shù)能夠較好地構(gòu)造最優(yōu)超平面,將各類入侵事件的特征向量以最大間隔分隔開。高斯徑向基核函數(shù)對(duì)應(yīng)的高維特征空間是無限的,因此有限分類問題必然在其特征空間中線性可分。后續(xù)實(shí)驗(yàn),均采用高斯徑向基核函數(shù)。
實(shí)驗(yàn)比較了3種特征提取方法與2種分類器的組合對(duì)入侵信號(hào)分類的效果。3種特征即信號(hào)的時(shí)域特征(TD)、頻域特征(DFT)和小波域特征(WT);2種分類器即支持向量機(jī)(SVM)與最近零分類器(NNC)。
(4)在原鐵液S含量較低的情況下,即使是厚大球墨鑄鐵件,也沒必要必須保證較高的殘余Mg含量,對(duì)于球墨鑄鐵而言,低S情況下殘余Mg衰退并不嚴(yán)重。
從各種入侵信號(hào)樣本中,都隨機(jī)選?、?0%、②60%、③80%作為訓(xùn)練集,樣本的剩余部分作為測(cè)試集。每組進(jìn)行10次實(shí)驗(yàn),將10次實(shí)驗(yàn)結(jié)果平均后統(tǒng)計(jì)識(shí)別率,統(tǒng)計(jì)數(shù)據(jù)見表1。
表1 對(duì)入侵信號(hào)的正確識(shí)別率 %
從表1可以看出,在訓(xùn)練樣本較少的情況下,難以通過特征提取進(jìn)行正確識(shí)別,分類器算法內(nèi)部的參數(shù)沒有達(dá)到最優(yōu)值,算法的優(yōu)勢(shì)不能體現(xiàn),因此所有方法的正確識(shí)別率都較低。隨著訓(xùn)練樣本數(shù)量的增加,每種方法的正確識(shí)別率都有明顯提升。從分類器角度來看,SVM的分類正確率明顯高于NNC的分類正確率。從提取特征角度來看,無論在哪種情況下,通過提取小波域特征所獲得的正確識(shí)別率都是最高的。
單從識(shí)別正確率來評(píng)估模型,不能完全反映算法的優(yōu)越性。下面,對(duì)預(yù)測(cè)結(jié)果的Precision(準(zhǔn)確率)、Recall(召回率)、TPR、F-score、FPR、TNR、FNR等指標(biāo)進(jìn)行比較。
根據(jù)上述實(shí)驗(yàn)結(jié)果,從各種入侵信號(hào)樣本中隨機(jī)選取80%作為訓(xùn)練集,剩余部分作為測(cè)試集。在MATLAB編程環(huán)境下進(jìn)行測(cè)試,測(cè)試10次,取均值進(jìn)行比較。最后計(jì)算總體正確率(Accuracy),以此衡量模型對(duì)所有入侵信號(hào)數(shù)據(jù)的分類能力。
(8)
式中:TPi為對(duì)每種入侵信號(hào)樣本預(yù)測(cè)正確的數(shù)量;m為測(cè)試樣本總數(shù)。
測(cè)試結(jié)果(見表2)表明,小波分析與支持向量機(jī)相結(jié)合的入侵事件分類方法,能夠?qū)θ肭中盘?hào)進(jìn)行識(shí)別,并且能夠區(qū)分真實(shí)入侵信號(hào)(攀爬、擊打)和干擾信號(hào)(落石)。整體測(cè)試樣本的識(shí)別正確率達(dá)94.2%,對(duì)于危險(xiǎn)程度較高的入侵事件(攀爬)能夠100%識(shí)別。
表2 多重指標(biāo)比較
對(duì)入侵信號(hào)特征的分類識(shí)別方法,直接影響到光纖周界安防系統(tǒng)的性能。先將傳感器采集得到的信號(hào)進(jìn)行分幀處理,然后根據(jù)小波變換得到其特征向量,最后利用支持向量機(jī)建立分類模型,實(shí)現(xiàn)對(duì)入侵事件的分類,這種方法可以改善光纖周界安防系統(tǒng)的性能?,F(xiàn)場(chǎng)測(cè)試結(jié)果表明,采用基于小波分析與支持向量機(jī)的入侵事件分類方法,能夠?qū)θ肭中盘?hào)特征進(jìn)行正確識(shí)別,對(duì)落石、攀爬、擊打3種入侵信號(hào)的正確識(shí)別率都在90%以上,并且能夠區(qū)分真實(shí)入侵信號(hào)和環(huán)境干擾信號(hào),可以有效降低系統(tǒng)的虛假報(bào)警率。