關(guān)鍵詞: 微地震監(jiān)測(cè),事件檢測(cè),數(shù)據(jù)增廣,殘差網(wǎng)絡(luò),深度學(xué)習(xí)
0 引言
近年來(lái),水力壓裂技術(shù)被廣泛用于頁(yè)巖氣、煤層氣等非常規(guī)油氣資源開(kāi)發(fā)[1?5]。在水力壓裂過(guò)程中,通過(guò)檢測(cè)巖石破裂產(chǎn)生的微地震信號(hào),可以反演震源位置、震源機(jī)制解、震級(jí)等參數(shù),從而監(jiān)測(cè)裂縫的發(fā)育過(guò)程并評(píng)估壓裂效果[6?11]。地面監(jiān)測(cè)和井中監(jiān)測(cè)是兩種常用的監(jiān)測(cè)方式。與地面監(jiān)測(cè)相比,井中監(jiān)測(cè)的檢波器記錄具有較高的信噪比,可通過(guò)拾取P 波和S 波到時(shí)進(jìn)行微地震定位[12]。野外記錄通常為連續(xù)的波形,對(duì)微地震信號(hào)的識(shí)別直接決定了微地震定位的準(zhǔn)確度和可靠性。
目前,微地震事件自動(dòng)檢測(cè)主要應(yīng)用于天然地震領(lǐng)域,方法包括基于振幅的長(zhǎng)短時(shí)窗比法(Short TermAverage/Long Term Average , STA/LTA)[13?16]、基于Akaike 信息準(zhǔn)則(Akaike Information Criteria,AIC)的方法[17?18]以及基于波形相似性的波形互相關(guān)法[19?22]等。目前,應(yīng)用較為廣泛的為STA/LTA 算法,其基本原理是通過(guò)計(jì)算短、長(zhǎng)時(shí)間窗內(nèi)波形的平均能量值比值來(lái)評(píng)估信號(hào)的能量變化。該方法原理簡(jiǎn)單、計(jì)算效率高,地震學(xué)家對(duì)該方法做了一系列的改進(jìn)。例如,Withers 等[13]實(shí)現(xiàn)了一種自適應(yīng)窗口的STA/LTA 算法,結(jié)合地震圖頻譜特性滿(mǎn)足事件檢測(cè)與定位的要求。宋維琪等[14]在STA/LTA 算法的基礎(chǔ)上,討論了基于特征值分析且抗噪能力較強(qiáng)的識(shí)別方法。邱磊等[15]通過(guò)建立閾值和背景噪聲之間的關(guān)系,提出了兩種基于參考閾值拾取地震波初至的方法,拾取結(jié)果的正確率比傳統(tǒng)STA/LTA 方法有所提高。劉晗等[16]對(duì)STA/LTA 算法和改進(jìn)的加權(quán)系數(shù)法、多窗口算法和修正能量比法進(jìn)行了對(duì)比,了解了時(shí)窗長(zhǎng)度、觸發(fā)閾值和特征函數(shù)對(duì)算法性能的影響特征及其選取規(guī)律。STA/LTA 法具有較好的通用性且高效,但其拾取結(jié)果受閾值影響較大,依賴(lài)人工經(jīng)驗(yàn),同時(shí)該方法對(duì)中強(qiáng)度背景噪聲十分敏感,容易出現(xiàn)漏檢事件。
近年來(lái),隨著計(jì)算機(jī)領(lǐng)域人工智能的發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別、醫(yī)學(xué)圖像處理等多個(gè)領(lǐng)域取得了巨大的成功[23?24]。機(jī)器學(xué)習(xí)算法也被廣泛地應(yīng)用在地震勘探領(lǐng)域,尤其是地震信號(hào)的檢測(cè)和拾取,發(fā)展了一系列的智能算法[25?35]。例如,Mousavi 等[36]采用卷積神經(jīng)網(wǎng)絡(luò)以及循環(huán)神經(jīng)網(wǎng)絡(luò)搭建模型,形成了CRED 模型,用于噪聲與地震事件分類(lèi),該模型對(duì)于背景噪聲、非地震脈沖有著極高魯棒性,能夠高效地處理海量地震數(shù)據(jù)。趙明等[37]使用汶川地震余震事件構(gòu)建訓(xùn)練數(shù)據(jù)集,利用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行訓(xùn)練,并用未參與模型訓(xùn)練的汶川余震事件作為檢測(cè)數(shù)據(jù)集,其訓(xùn)練和檢測(cè)準(zhǔn)確率均達(dá)到95% 以上。Zhao 等[38]采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)連續(xù)數(shù)據(jù)進(jìn)行時(shí)窗分割并分類(lèi),其輸入為一維的地震數(shù)據(jù),驗(yàn)證集精度達(dá)到93%。Zhang 等[39]構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的微地震檢測(cè)網(wǎng)絡(luò),通過(guò)比較分析多種微地震檢測(cè)分類(lèi)方法,論證了深度學(xué)習(xí)算法在微地震事件檢測(cè)中具有較高的準(zhǔn)確度,展示了在微地震實(shí)時(shí)監(jiān)測(cè)領(lǐng)域中良好的應(yīng)用前景。王維波等[40]利用卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建微地震檢測(cè)二分類(lèi)模型,通過(guò)水力壓裂實(shí)際監(jiān)測(cè)的微地震信號(hào)構(gòu)建訓(xùn)練樣本集,訓(xùn)練得到的網(wǎng)絡(luò)模型具有較好的抗噪性。隨后,王維波等[41]又提出利用殘差網(wǎng)絡(luò)對(duì)微地震監(jiān)測(cè)數(shù)據(jù)的地震發(fā)射層析成像數(shù)據(jù)進(jìn)行處理, 實(shí)現(xiàn)微地震事件自動(dòng)識(shí)別。
深度學(xué)習(xí)算法可以直接從訓(xùn)練數(shù)據(jù)中挖掘地震事件特征。預(yù)測(cè)新的數(shù)據(jù)時(shí),只需要將微震事件分割成相互獨(dú)立的窗口,然后輸入到訓(xùn)練好的模型中即可迅速進(jìn)行事件檢測(cè),節(jié)省大量的計(jì)算時(shí)間?,F(xiàn)有的基于深度學(xué)習(xí)的微地震事件檢測(cè)方法通常把事件檢測(cè)看作圖像二分類(lèi)問(wèn)題,需要對(duì)連續(xù)監(jiān)測(cè)的波形數(shù)據(jù)按照一定時(shí)窗長(zhǎng)度進(jìn)行分割。通常,相鄰時(shí)窗會(huì)有部分重疊以盡量減少漏檢。這種處理方法不僅增加了計(jì)算時(shí)間,降低了運(yùn)算效率,同時(shí)如何選取重疊時(shí)窗大小也決定了分類(lèi)結(jié)果的準(zhǔn)確度。因此,本文提出一種基于深度學(xué)習(xí)的微震事件五分類(lèi)檢測(cè)方法。首先,把野外采集的連續(xù)記錄波形等分,人工標(biāo)定為噪聲、完整的P 波和S 波、只含有P 波、只含有S 波和多個(gè)微震事件五類(lèi); 其次,通過(guò)研究數(shù)據(jù)增廣方法,利用較少的原始標(biāo)定樣本獲得多樣性的訓(xùn)練集數(shù)據(jù)進(jìn)行模型訓(xùn)練; 最后,將訓(xùn)練得到的五分類(lèi)模型應(yīng)用于實(shí)際微震數(shù)據(jù)檢測(cè),通過(guò)對(duì)檢測(cè)得到的微震事件進(jìn)行到時(shí)拾取和震源定位評(píng)估檢測(cè)精度,并與二分類(lèi)算法結(jié)果進(jìn)行對(duì)比驗(yàn)證。
1 數(shù)據(jù)處理
本文使用了東方地球物理公司(BGP)提供的一套單井監(jiān)測(cè)的水力壓裂數(shù)據(jù),共有12 個(gè)三分量檢波器分布在深度為2800~3020 m 的監(jiān)測(cè)井中,間隔為20 m,檢波器位于壓裂井段的上方。圖1 為本文使用的P 波和S 波速度模型,參數(shù)經(jīng)測(cè)井?dāng)?shù)據(jù)提取并利用射孔事件校正。數(shù)據(jù)的時(shí)間采樣率為0. 5 ms。
1. 1 樣本標(biāo)定
本文把微地震事件檢測(cè)視為五分類(lèi)問(wèn)題:圖2a為噪聲,被歸為第一類(lèi),簡(jiǎn)稱(chēng)C1;圖2b 為一個(gè)完整的微震事件,包含完整的P 波和S 波信息,被歸為第二類(lèi),簡(jiǎn)稱(chēng)C2;圖2c 只含有完整的P 波信息,被歸為第三類(lèi),簡(jiǎn)稱(chēng)C3;圖2d 只含有完整的S 波信息,被歸為第四類(lèi),簡(jiǎn)稱(chēng)C4;第五類(lèi)較為復(fù)雜,定義為在一個(gè)樣本窗口中包含多個(gè)微震事件(圖2e)。此外,樣本中同時(shí)包含一個(gè)微震事件和另一個(gè)事件的P 波或者S 波也被歸為第五類(lèi),簡(jiǎn)稱(chēng)C5。
1. 2 數(shù)據(jù)增廣
數(shù)據(jù)增廣可以提高模型的泛化能力和魯棒性,有助于減少過(guò)擬合問(wèn)題。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時(shí),通常需要大量的訓(xùn)練數(shù)據(jù),但是大多數(shù)地球物理的數(shù)據(jù)集比較有限。通過(guò)數(shù)據(jù)增廣,能夠擴(kuò)展數(shù)據(jù)集,增加訓(xùn)練樣本的多樣性。常見(jiàn)的數(shù)據(jù)增廣方法包括旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪、平移、縮放、添加噪聲等[23, 37]。針對(duì)井下微震事件檢測(cè),本文參考Zhang 等[42]提出的方法進(jìn)行數(shù)據(jù)增廣。其中,針對(duì)C2 樣本的增廣方法共有5 種。圖3 為原始樣本的三分量數(shù)據(jù)波形記錄,圖4 為對(duì)圖3 數(shù)據(jù)增廣后的結(jié)果。
圖4a 為顛倒檢波器順序:微震事件可能發(fā)生在檢波器陣列的上方或下方,顛倒檢波器順序可以模擬發(fā)生在不同位置的微震事件。
圖4b 為旋轉(zhuǎn)分量:微震事件可能發(fā)生在不同的方位角和不同的震源機(jī)制作用下。不同的方位角導(dǎo)致波形數(shù)據(jù)中的粒子運(yùn)動(dòng)變化。旋轉(zhuǎn)分量可以模擬具有不同偏振角產(chǎn)生的復(fù)雜波形的微地震事件[42]。
圖4c 為移動(dòng)P 波或S 波相位:P 波與S 波的到時(shí)差與檢波器的幾何分布、地下速度模型以及事件發(fā)生的位置等因素有關(guān)。通過(guò)隨機(jī)移動(dòng)P 波和S 波波形來(lái)模擬由各種物理因素引起的到時(shí)差。本文從? 15 ms 到15 ms 之間隨機(jī)選擇一個(gè)值進(jìn)行移動(dòng)P波到時(shí)或者S 波到時(shí)。此外,為了防止移動(dòng)后S 波的到時(shí)早于P 波到時(shí),選擇最小P、S 波到時(shí)差為25 ms。
圖4d 為調(diào)整P 波振幅:調(diào)整P 波振幅有助于提高模型的泛化能力。我們選擇對(duì)S 波之前的P 波波形隨機(jī)乘以值為0. 2~1. 2 的因子。當(dāng)因子較小時(shí),樣本主要顯示S 波波形,可模擬單震相事件。
圖4e 為添加噪聲:信噪比是影響微地震事件檢測(cè)精度的一個(gè)重要因素。噪聲類(lèi)型的多樣性有利于提高網(wǎng)絡(luò)模型的檢測(cè)準(zhǔn)確度。本文選擇了4 種不同類(lèi)型的噪聲改變事件的信噪比。第一種為實(shí)際數(shù)據(jù)噪聲。首先從原始的監(jiān)測(cè)數(shù)據(jù)中截取了50 個(gè)噪聲窗口,隨機(jī)選擇一個(gè)噪聲窗口疊加到微震事件波形中。
通過(guò)隨機(jī)設(shè)置信噪比模擬被不同程度噪聲污染的事件。第二種為高斯白噪聲。本文選擇的高斯白噪聲約為信號(hào)最大值的5×10?3~5×10?2 倍。第三種添加脈沖噪聲。脈沖噪聲絕對(duì)值為1,脈沖出現(xiàn)的概率范圍為10?2~10?3。第四種添加正弦波噪聲,正弦波頻率為3~6 Hz,振幅為0. 05~0. 30 個(gè)單位。
C3 與C4 樣本的數(shù)據(jù)增廣方法通過(guò)截取C2 樣本實(shí)現(xiàn)。以C2 樣本中所有檢波器中最后的P 波到時(shí)與最初的S 波到時(shí)的平均值為基點(diǎn),隨機(jī)選擇? 25 ms~25 ms 的擾動(dòng),拆分窗口。分別得到一個(gè)C3 樣本以及一個(gè)C4 樣本。然而,拆分的樣本不滿(mǎn)足時(shí)窗長(zhǎng)度要求,需要對(duì)P、S 波前后的噪聲進(jìn)行插值或截?cái)?,得到滿(mǎn)足時(shí)窗長(zhǎng)度要求數(shù)據(jù)集。
針對(duì)C5 的數(shù)據(jù)增廣方法一共兩種:
(1) 兩個(gè)C2 樣本疊加。從C2 樣本中隨機(jī)選取兩個(gè)事件進(jìn)行疊加。如果兩個(gè)選取的C2 樣本距離較近,則疊加后的樣本難以區(qū)分是C2 或是C5,因此本文規(guī)定兩個(gè)疊加事件的P 波到時(shí)差需要超過(guò)100 ms。
此外,通過(guò)乘以值為0. 5~1. 0 的一個(gè)因子改變振幅,更加貼合實(shí)際情況。
(2) 一個(gè)C2 樣本與一個(gè)C3 或者C4 樣本疊加。具體做法是將一個(gè)位于時(shí)窗前部S 波與一個(gè)任意位置的C2 樣本疊加,或者是一個(gè)位于時(shí)窗后部的P 波與一個(gè)任意位置的C2 樣本疊加。
本文從野外原始記錄的波形數(shù)據(jù)中分別截取5種數(shù)據(jù)樣本,并通過(guò)以上數(shù)據(jù)增廣方法進(jìn)行數(shù)據(jù)增廣,數(shù)據(jù)集增廣前、后個(gè)數(shù)如表1 所示。數(shù)據(jù)集個(gè)數(shù)從91 增加到22431,5 種數(shù)據(jù)樣本的比例分別為19. 83%,20. 28%,19. 97%,20. 01% 以及19. 98%。最后將數(shù)據(jù)集按8:2 的比例劃分為訓(xùn)練集以及驗(yàn)證集,訓(xùn)練集與驗(yàn)證集個(gè)數(shù)分別為17944、4487。
2 方法與訓(xùn)練結(jié)果
2. 1 殘差學(xué)習(xí)模塊
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)層數(shù)增加時(shí),易出現(xiàn)梯度消失的問(wèn)題。He 等[24]在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,增加跨層數(shù)據(jù)通路(圖5 黑色折線(xiàn)),加強(qiáng)了層與層之間的溝通,該神經(jīng)網(wǎng)絡(luò)被稱(chēng)為殘差網(wǎng)絡(luò)(Residual Net?work,簡(jiǎn)稱(chēng)ResNet)。該網(wǎng)絡(luò)主要由殘差塊堆疊而成。圖5 是本文所使用的殘差塊結(jié)構(gòu),輸入x 依次進(jìn)入卷積層、批量規(guī)范化層(Batch NormalizationLayer, 簡(jiǎn)稱(chēng)BN 層)、ReLU 激活層、卷積層、BN 層以及ReLU 層,同時(shí)在最后一個(gè)ReLU 層之前,加入了跨層連接,得到映射函數(shù)F(x)+x。需要注意的是,殘差塊的輸入x 與最終輸出的數(shù)據(jù)形狀是相同的。
2. 2 殘差網(wǎng)絡(luò)結(jié)構(gòu)
圖6 為本文殘差模型的架構(gòu)。模型的輸入大小為 n×1001×36( n 為訓(xùn)練樣本個(gè)數(shù),1001 為時(shí)間采樣點(diǎn),36 為12 個(gè)三分量檢波器的道數(shù))的波形數(shù)據(jù)。其中,第二個(gè)通道的排列順序?yàn)椋旱? 個(gè)檢波器的N、E、Z 分量;第2 個(gè)檢波器的N、E、Z 分量;以此類(lèi)推。首先,模型第一層是通道數(shù)為64、步長(zhǎng)為2 的7 × 7 的卷積層,隨后依次進(jìn)入BN 層、RuLU 層、以及步長(zhǎng)為2 的3 × 3 的最大池化層。此時(shí)的輸出將進(jìn)入堆疊的殘差塊。按順序包括3 個(gè)通道數(shù)為64、3 個(gè)通道數(shù)為128、3 個(gè)通道數(shù)為256 和3 個(gè)通道數(shù)為512 的殘差塊。由于每個(gè)殘差塊包含2 個(gè)卷積層,再加上第一層7 × 7 的卷積層,該網(wǎng)絡(luò)一共包含了25 個(gè)卷積層。其中,第1、第8、第14 和第20 層的卷積層步長(zhǎng)為2,其余步長(zhǎng)均為1。隨后,輸出與全局池化層相連。最后,使用包含5 個(gè)神經(jīng)元的全連接層并使用Softmax 分類(lèi)器輸出5 個(gè)值,分別對(duì)應(yīng)輸入樣本為C1、C2、C3、C4、C5 的概率,其中最大概率值對(duì)應(yīng)的類(lèi)別即為該網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果。
深度學(xué)習(xí)的損失函數(shù)與地球物理反演中的目標(biāo)函數(shù)十分相似,用于估計(jì)模型的預(yù)測(cè)值與真實(shí)值的差別程度。在分類(lèi)問(wèn)題中,多使用交叉熵?fù)p失函數(shù)衡量輸入的真實(shí)概率分布p 和預(yù)測(cè)概率分布q 之間的差異H ( p,q),即
式中: xi 表示第i 個(gè)數(shù)據(jù); N 代表數(shù)據(jù)總數(shù)。損失函數(shù)可使用Adam 優(yōu)化算法迭代求解,每次迭代后,卷積核和權(quán)重將會(huì)被更新。
2. 3 訓(xùn)練過(guò)程和模型評(píng)估
模型在RTX3060 圖像處理器上進(jìn)行訓(xùn)練,訓(xùn)練時(shí)長(zhǎng)約為145 min。經(jīng)過(guò)100 次迭代后,訓(xùn)練集和驗(yàn)證集的準(zhǔn)確度損失曲線(xiàn)均得到收斂(圖7)。其中,訓(xùn)練集準(zhǔn)確度達(dá)到99. 96%,訓(xùn)練集損失值約為0. 0017;驗(yàn)證集準(zhǔn)確度達(dá)到99. 82%,驗(yàn)證集損失值約為0. 0082。
本文使用歸一化的混淆矩陣(Confusion Matrix)進(jìn)一步分析了模型性能?;煜仃囌故玖艘粋€(gè)分類(lèi)器對(duì)樣本進(jìn)行分類(lèi)時(shí)產(chǎn)生的錯(cuò)誤,即真實(shí)類(lèi)別被分為其他類(lèi)別的錯(cuò)誤。圖8 為五分類(lèi)模型驗(yàn)證集的歸一化混淆矩陣,矩陣主對(duì)角線(xiàn)為預(yù)測(cè)標(biāo)簽與真標(biāo)簽吻合的概率值。在驗(yàn)證集中C1 與C3 樣本全部預(yù)測(cè)正確,個(gè)數(shù)分別為890 與896,所以對(duì)應(yīng)的主對(duì)角線(xiàn)的值為1;C2 個(gè)數(shù)為個(gè)910 個(gè),其中被正確預(yù)測(cè)的個(gè)數(shù)為908,占比為99. 8%; 898 個(gè)C4 樣本中有897 個(gè)預(yù)測(cè)正確,占比99. 9%;893 個(gè)C5 樣本中有887 個(gè)預(yù)測(cè)正確,占比99. 4%,其中有6 個(gè)C5 樣本被錯(cuò)誤預(yù)測(cè)為C2 樣本。
2. 4 數(shù)據(jù)降維可視化
降維可視化是將高維數(shù)據(jù)轉(zhuǎn)換為二維或三維的可視化展示,有助于更好地理解和分析數(shù)據(jù),從而找到數(shù)據(jù)中的模式和規(guī)律。
神經(jīng)網(wǎng)絡(luò)可以把高維度復(fù)雜的數(shù)據(jù)輸出為線(xiàn)性可分的語(yǔ)義特征,最后只需要一層線(xiàn)性分類(lèi)器即可把數(shù)據(jù)進(jìn)行分類(lèi),這說(shuō)明倒數(shù)第二層的語(yǔ)義特征在高維度中線(xiàn)性可分。本文使用 T?SNE( t?Distributed Sto?chastic Neighbor Embedding)降維方法。T ? SNE 是一種用于高維數(shù)據(jù)降維可視化的算法,其主要思想是將高維數(shù)據(jù)映射到低維空間中,使數(shù)據(jù)點(diǎn)之間的相對(duì)距離在低維空間中保持不變或最大化。
本文將驗(yàn)證集在倒數(shù)第二層(全局池化層)輸出的語(yǔ)義特征進(jìn)行降維(圖9)。雖然個(gè)別事件被錯(cuò)誤分類(lèi),但五分類(lèi)數(shù)據(jù)集確實(shí)線(xiàn)性可分。
3 五分類(lèi)算法檢測(cè)流程與應(yīng)用
3. 1 五分類(lèi)事件檢測(cè)流程
本文提出的五分類(lèi)算法將輸入樣本預(yù)測(cè)為噪聲、完整的微震事件、只含P 波、只含S 波、多個(gè)微震事件五類(lèi)。但在實(shí)際應(yīng)用中,最終需要獲得同時(shí)包含P 波和S 波的微地震事件,而五分類(lèi)算法中的C3 與C4樣本并不是完整的微震事件。因此,需要通過(guò)移動(dòng)時(shí)窗再次處理C3 與C4 樣本,從而得到完整的微震事件用于震源定位。
首先,把野外采集的連續(xù)波形記錄(圖10a)按照長(zhǎng)度為1001 的時(shí)窗( 約為500 ms)進(jìn)行切分( 圖10b),不同于二分類(lèi)模型,五分類(lèi)樣本的時(shí)窗沒(méi)有重疊。得到規(guī)定長(zhǎng)度時(shí)窗后,進(jìn)行歸一化處理,輸入到訓(xùn)練好的模型中進(jìn)行分類(lèi);然后利用訓(xùn)練好的ResNet 模型把時(shí)窗預(yù)測(cè)為C1、C2、C3、C4 和C5 五類(lèi)(圖10c)。C2 類(lèi)型可直接用于微地震定位。通過(guò)分析可知,若相鄰兩個(gè)樣本預(yù)測(cè)結(jié)果為C3 和C4,則大概率是一個(gè)微地震事件被截?cái)喑蓛刹糠郑瑢3 樣本向后時(shí)移或者C4 樣本向前時(shí)移即可。本文選取200 ms 進(jìn)行時(shí)窗移動(dòng)能夠獲得完整的微震事件。如果C3 或C4 類(lèi)型單獨(dú)出現(xiàn),同樣向后或者向前移動(dòng)200 ms,然后用于微地震定位。此外,C5 樣本情況較為復(fù)雜,可以對(duì)樣本進(jìn)行人工處理后再用于定位。
3. 2 五分類(lèi)模型應(yīng)用
隨機(jī)選取未用于模型訓(xùn)練的原始波形記錄作為測(cè)試數(shù)據(jù)進(jìn)行模型測(cè)試, 數(shù)據(jù)長(zhǎng)度為17517 ms( 圖11)。該段數(shù)據(jù)的水力壓裂事件較為密集,信噪比范圍較廣,可充分測(cè)試五分類(lèi)模型性能。首先,把該測(cè)試數(shù)據(jù)按1001 數(shù)據(jù)點(diǎn)的時(shí)窗大小截取,可以得到35 個(gè)樣本。所有樣本經(jīng)過(guò)歸一化處理后,輸入到ResNet 模型中進(jìn)行預(yù)測(cè)。通過(guò)人工檢查,測(cè)試數(shù)據(jù)中一共包括23 個(gè)微地震事件。
把預(yù)測(cè)結(jié)果按照順序并把不同類(lèi)別標(biāo)簽的時(shí)窗用不同顏色標(biāo)注出來(lái)(圖12a)。據(jù)統(tǒng)計(jì),五分類(lèi)模型預(yù)測(cè)結(jié)果為:9 個(gè)C2、5 個(gè)C3、5 個(gè)C4 以及3 個(gè)C5。其中,相鄰兩個(gè)樣本預(yù)測(cè)結(jié)果為C3 和C4 的情況有3次,為了防止反復(fù)拾取,此時(shí)只移動(dòng)C4,故從C3 和C4 中一共得到7 個(gè)微地震事件。經(jīng)過(guò)人工檢查,3 個(gè)C5 事件一共包含7 個(gè)微地震事件,故成功拾取的微地震事件個(gè)數(shù)為23。
圖12b 與圖12c 是圖12a 中的兩個(gè)紅色虛線(xiàn)框位置的放大圖,分別是預(yù)測(cè)結(jié)果為C2 與C5 的低信噪比事件。該結(jié)果表明,ResNet 模型有很強(qiáng)的抗噪能力。
然后,將訓(xùn)練好的五分類(lèi)模型應(yīng)用到該套水力壓裂數(shù)據(jù)的第14 個(gè)壓裂段的微地震事件檢測(cè)中。第14個(gè)壓裂段的壓裂時(shí)長(zhǎng)約為135 min,把該數(shù)據(jù)按1001數(shù)據(jù)點(diǎn)(約為500 ms)的時(shí)窗大小截取,得到16204 個(gè)樣本。經(jīng)過(guò)統(tǒng)計(jì),該壓裂段樣本的預(yù)測(cè)結(jié)果為:10889個(gè)C1、2830 個(gè)C2、955 個(gè)C3、824 個(gè)C4 以及706 個(gè)C5。預(yù)測(cè)時(shí)間為82 s。本文還利用不重疊時(shí)窗的二分類(lèi)模型對(duì)該16204 個(gè)樣本進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果為:12440 個(gè)C1、3764 個(gè)C2。
為了評(píng)估微地震檢測(cè)的準(zhǔn)確度,利用Zhang 等[42]提出的微地震到時(shí)拾取泛化模型對(duì)檢測(cè)出的事件進(jìn)行P、S 波到時(shí)拾取。該泛化模型的輸入為12 道三分量波形數(shù)據(jù),輸出為12 道的P 波、S 波和噪聲的概率分布。對(duì)于輸入時(shí)窗的任意一道,可以將兩個(gè)最大概率值所在橫坐標(biāo)作為拾取的P 或S 波到時(shí)。Zhang等[42]規(guī)定這兩個(gè)拾取點(diǎn)之間的距離需要大于高斯分布半徑(20 ms),且拾取點(diǎn)的概率值大于0. 7。由于很多檢測(cè)的事件信噪比較低,拾取模型[42]的泛化能力不足夠完全正確拾取P 波和S 波到時(shí)。為了保證定位的準(zhǔn)確性,需要剔除拾取結(jié)果較差的事件。剔除標(biāo)準(zhǔn)為:①拾取網(wǎng)絡(luò)只拾取到單震相;②拾取的P 波或S波走時(shí)個(gè)數(shù)少于3 個(gè);③時(shí)窗內(nèi)包含多個(gè)事件。
經(jīng)過(guò)剔除拾取結(jié)果較差的事件后,最終定位得到的五分類(lèi)和二分類(lèi)微震事件數(shù)分別為2844 個(gè)和1789 個(gè)。文中利用網(wǎng)格搜索的方法進(jìn)行微地震定位。震源搜索深度為2900~3500 m ,水平方向?yàn)?~500 m,搜索間隔為2 m。定位結(jié)果如圖13 所示。定位結(jié)果分布在壓裂井的附近,較為合理,表明兩種模型的檢測(cè)結(jié)果均具有較高的準(zhǔn)確度。但五分類(lèi)檢測(cè)方法檢測(cè)出了更多數(shù)量的微震事件,進(jìn)而可更好地監(jiān)測(cè)壓裂過(guò)程和評(píng)估壓裂效果。
4 結(jié)論與認(rèn)識(shí)
本文提出了一種基于殘差網(wǎng)絡(luò)的微地震事件五分類(lèi)檢測(cè)方法。通過(guò)有針對(duì)性的數(shù)據(jù)增廣方法,用較少的標(biāo)注數(shù)據(jù)獲得了較高精度的訓(xùn)練模型,模型訓(xùn)練集精度達(dá)到99. 96%,驗(yàn)證集精度達(dá)到99. 82%。分別采用五分類(lèi)與二分類(lèi)算法對(duì)野外監(jiān)測(cè)的連續(xù)數(shù)據(jù)進(jìn)行檢測(cè),并對(duì)檢測(cè)結(jié)果進(jìn)行到時(shí)拾取,用于微地震定位。測(cè)試結(jié)果表明,五分類(lèi)檢測(cè)方法檢測(cè)出了更多數(shù)量的微震事件。
值得注意的是,針對(duì)信噪比較差的實(shí)際數(shù)據(jù),如果人工難以給出標(biāo)簽,可以先通過(guò)繞射疊加算法(不需要拾取P 波和S 波到時(shí))進(jìn)行部分震源定位[43],然后將能定位出事件的時(shí)窗作為訓(xùn)練樣本,并通過(guò)數(shù)據(jù)增廣方法擴(kuò)充數(shù)據(jù)集,從而用于模型的訓(xùn)練和后續(xù)壓裂數(shù)據(jù)的處理。此外,本文提出的五分類(lèi)檢測(cè)算法的泛化性有待進(jìn)一步測(cè)試,未來(lái)可針對(duì)不同壓裂監(jiān)測(cè)數(shù)據(jù)特征進(jìn)行重新訓(xùn)練或者使用遷移學(xué)習(xí)算法以提高網(wǎng)絡(luò)模型的泛化能力。處理新的工區(qū)數(shù)據(jù)時(shí),只需獲得較少的微地震事件,通過(guò)文中采用的數(shù)據(jù)增廣方法,便可進(jìn)行模型訓(xùn)練。