田宵 汪明軍 張偉
1)東華理工大學(xué),地球物理與測控技術(shù)學(xué)院,南昌 330013 2)南方科技大學(xué),地球與空間科學(xué)系,廣東深圳 518055
水力壓裂是頁巖氣、煤層氣等非常規(guī)油氣資源開采過程中的關(guān)鍵環(huán)節(jié),而微地震監(jiān)測技術(shù)是監(jiān)測壓裂過程以及評估壓裂效果的重要手段。水力壓裂過程中巖石破裂產(chǎn)生的地震波信號可以被放置在井中或地表的檢波器接收,這些信號能夠用來反演震源位置、震源機(jī)制解、震級等參數(shù),從而監(jiān)測裂縫的發(fā)育過程以及評估壓裂效果(Eisner et al,2010;Maxwell,2010;宋維琪等,2013;李晗等,2018;Wang et al,2018)。地面監(jiān)測和井中監(jiān)測是兩種常用的監(jiān)測方式。與井中監(jiān)測相比,地面監(jiān)測的檢波器記錄由于地震波衰減嚴(yán)重通常顯示出較低的信噪比。地面監(jiān)測不僅具有較高的覆蓋次數(shù)和較寬的方位角,更易于反演震源機(jī)制解,而且具有簡單、經(jīng)濟(jì)以及適應(yīng)性強(qiáng)等優(yōu)勢,因此得到了越來越廣泛的應(yīng)用(Duncan et al,2010)。
微地震監(jiān)測的主要內(nèi)容是反演震源位置和震源機(jī)制解。震源位置能夠提供裂縫的位置和分布信息,而震源機(jī)制解可用于描述裂縫破裂類型、了解工區(qū)地應(yīng)力狀態(tài)(尹陳等,2013;Zeng et al,2014;Zheng et al,2016)。大量的壓裂監(jiān)測結(jié)果表明微地震事件主要是由剪切為主的裂縫破裂產(chǎn)生的,因此地面觀測記錄會出現(xiàn)P波極性變化(Eisner et al,2010;Staněk et al,2014)。P波極性信息的確定對地面微地震的震源定位和震源機(jī)制反演具有重要意義。
常用的求解震源機(jī)制的方法包括P波極性法(許忠淮等,1983)、縱橫波振幅比法(Kisslinger,1980)和波形反演方法(Li et al,2011;譚玉陽等,2019)。P波極性物理圖像明確,是穩(wěn)定的地震波信息。鑒于地面監(jiān)測范圍廣、微地震事件震級較小,利用不同方位的檢波器記錄的P波極性能夠反演出較為穩(wěn)定的震源機(jī)制解,且求解過程具有簡單、快速等優(yōu)點。因此,P波極性法被廣泛用于地面監(jiān)測的震源機(jī)制反演(Staněk et al,2014;楊心超等,2015)。
地面監(jiān)測數(shù)據(jù)信噪比低、數(shù)據(jù)量大,通常采用不需要拾取走時的繞射疊加定位法(Kao et al,2004;Li et al,2020)。受震源機(jī)制的影響,直接使用原始波形進(jìn)行疊加會因為極性不同而導(dǎo)致震源位置的疊加能量降低,影響定位精度。為克服該問題,前人使用不同的波形特征進(jìn)行疊加定位(Trojanowski et al,2017),例如使用波形振幅的平方、長短時窗能量比、波形的包絡(luò)信息等;或者聯(lián)合反演震源位置和震源機(jī)制解,利用震源機(jī)制校正微地震記錄的極性(Liang et al,2016;李宏等,2018)。Trojanowski等(2017)對比了幾種常用的解決極性問題的方法,結(jié)果表明經(jīng)過極性校正后的定位精度明顯高于使用原始波形以及振幅平方等波形特征的結(jié)果。因此,確定P波極性可以提高微地震繞射疊加定位的精度。
微地震監(jiān)測的數(shù)據(jù)處理方法通常借鑒天然地震領(lǐng)域。早期的天然地震極性拾取由經(jīng)驗豐富的地震工作者完成,隨著全球?qū)掝l帶地震儀的迅速發(fā)展,地震數(shù)據(jù)量越來越龐大,這些工作逐漸被一些自動算法所替代。例如,Chen等(2016)根據(jù)拾取的P波到時,通過相位振幅和噪聲水平的比值來確定極性;Pugh等(2016)利用貝葉斯算法進(jìn)行P波初動方向的定量概率估計,以得到極性是正值還是負(fù)值的概率;Kim等(2017)選取信噪比較好的參考波形,通過計算目標(biāo)波形和參考波形的互相關(guān)系數(shù)來獲取相對極性。極性自動拾取算法具有穩(wěn)定性和可重復(fù)性,但是大多需要預(yù)先拾取P波到時,計算速度較慢。
近年來,隨著計算機(jī)領(lǐng)域人工智能的發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在計算機(jī)視覺、自然語言處理、語音識別等多個領(lǐng)域取得了巨大的成功(Hinton et al,2012)。機(jī)器學(xué)習(xí)算法也被廣泛地應(yīng)用于地震學(xué)和地震勘探領(lǐng)域,包括地震信號的檢測與拾取(Zhu et al,2019;于子葉等,2018;趙明等,2019;Wang et al,2019;Zheng et al,2020)、震源定位(Zhang et al,2020),信號去噪(王鈺清等,2019)等。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種著名的深度學(xué)習(xí)方法,主要應(yīng)用于圖像分類、目標(biāo)檢測和圖像分割等問題上(Krizhevsky et al,2012)。Ross等(2018)利用CNN進(jìn)行天然地震極性分類,通過大量已標(biāo)定極性的數(shù)據(jù)集進(jìn)行模型訓(xùn)練,預(yù)測精度能夠與人工拾取相匹敵。隨后,Hara等(2019)將CNN應(yīng)用到日本西部地區(qū)的地震數(shù)據(jù)極性分類中,并采用不同區(qū)域的地震數(shù)據(jù)驗證了訓(xùn)練的模型具有較強(qiáng)的適用性。除此之外,Mousavi等(2019)采用聚類方法確定天然地震信號的極性類型,該方法不需要預(yù)先對數(shù)據(jù)進(jìn)行標(biāo)定。深度學(xué)習(xí)算法可以直接從訓(xùn)練數(shù)據(jù)中挖掘出P波極性特征,不需要預(yù)先拾取P波到時。預(yù)測新的數(shù)據(jù)時,只需要將微震事件分割成相互獨立的窗口,然后輸入到訓(xùn)練好的模型中即可迅速預(yù)測出極性類型,節(jié)省了大量的計算時間。
針對地面微地震監(jiān)測的檢波器布置多采用規(guī)則觀測系統(tǒng),Tian等(2020)提出了多道記錄的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(Multi-trace based CNN,簡稱MT-CNN),以確定地面微地震事件的P波極性。該方法不同于Ross等(2018)提出的單道記錄的CNN(Single-trace based CNN,簡稱ST-CNN),其使用多條相鄰檢波器記錄作為訓(xùn)練樣本,并輸出多道記錄的極性。MT-CNN在學(xué)習(xí)P波極性特征的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)了相鄰檢波器的極性分布規(guī)律。Tian等(2020)將MT-CNN訓(xùn)練為易于實現(xiàn)的回歸模型,輸出一組范圍在[-1,1]之間的連續(xù)變量,然后通過設(shè)置閾值進(jìn)行極性分類,當(dāng)預(yù)測值大于0.3時為正極性、小于-0.3 時為負(fù)極性,其余為不確定。相較基于分類模型的ST-CNN,人工選取閾值會導(dǎo)致MT-CNN正(負(fù))極性和不確定性之間的預(yù)測誤差較大。此外,回歸模型使用均方誤差作為損失函數(shù),而分類模型使用的是交叉熵?fù)p失函數(shù),導(dǎo)致回歸模型的收斂速度比分類模型慢(Golik et al,2013)。
微地震的3種極性標(biāo)簽相互獨立,屬于無序性問題,構(gòu)建CNN的極性分類模型會比回歸模型更易于網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練和收斂。因此,本文在Tian等(2020)的基礎(chǔ)上,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的地面微地震P波極性分類網(wǎng)絡(luò)模型,與MT-CNN類似,其輸入仍為多道記錄,但是輸出為中間道的極性。通過分析訓(xùn)練模型的準(zhǔn)確度、損失曲線以及在實際數(shù)據(jù)中的應(yīng)用,進(jìn)一步論證訓(xùn)練模型的適用性。
本文使用的訓(xùn)練數(shù)據(jù)為一套網(wǎng)格型的地面監(jiān)測數(shù)據(jù)。地面監(jiān)測的檢波器分布如圖1 所示,758個垂直單分量檢波器布置成由10條線所組成的網(wǎng)格,檢波器的間距約為25m,圖中的數(shù)字代表檢波器的排列順序。圖2(a)為時間長度為1s的原始波形,時間采樣率為1ms,原始數(shù)據(jù)的信噪比較低,難以肉眼識別出微震事件。通過對原始數(shù)據(jù)去除均值、帶通濾波(10~70Hz),可觀測到較為清晰的微地震事件(圖2(b))。山西和順地勢復(fù)雜,檢波器高程在1290~1450m之間,通過高程校正,微震事件的記錄變得更加連續(xù)(圖2(c)),且可以觀察到極性逆轉(zhuǎn)的現(xiàn)象。
圖 1 地面微地震監(jiān)測的檢波器分布
圖 2 微震數(shù)據(jù)預(yù)處理(a)觀測到的微震事件原始波形; (b)去除均值、帶通濾波(10~70Hz)后的波形; (c)高程校正后的波形; 紅色箭頭表示正極性,黑色箭頭表示負(fù)極性
通過對微地震原始數(shù)據(jù)預(yù)處理,最后挑選出具有不同震源機(jī)制解和信噪比的5個微震事件來構(gòu)建數(shù)據(jù)集。為了提高訓(xùn)練模型的泛化能力和魯棒性,對訓(xùn)練樣本進(jìn)行了數(shù)據(jù)增強(qiáng)(Tian et al,2020)。微震數(shù)據(jù)可以看作二維圖像數(shù)據(jù),參照圖像識別,可使用反轉(zhuǎn)、平移的方式進(jìn)行數(shù)據(jù)增強(qiáng)。反轉(zhuǎn)是指將已有的訓(xùn)練樣本值乘以-1,相應(yīng)的極性類型也反轉(zhuǎn);平移是指沿著時間軸滑動樣本,使P波極性信息出現(xiàn)在時窗的任意位置。經(jīng)過數(shù)據(jù)增強(qiáng),數(shù)據(jù)集擴(kuò)充為17227個樣本,其中正極性、負(fù)極性和不確定的比例分別為29%、39%和32%。最后將整個數(shù)據(jù)集和對應(yīng)的標(biāo)簽隨機(jī)分為2組:三分之二的數(shù)據(jù)用于模型訓(xùn)練,稱為訓(xùn)練數(shù)據(jù)集;剩余三分之一的數(shù)據(jù)用于模型測試,稱為測試數(shù)據(jù)集。
CNN是一個多層前饋神經(jīng)網(wǎng)絡(luò),卷積層作為CNN的關(guān)鍵部分,通常與其他層一起使用。CNN每個卷積層由一組濾波器組成,這些濾波器對前一層的輸出結(jié)果進(jìn)行卷積計算,以此來提取數(shù)據(jù)集的P波極性特征并用于極性預(yù)測。通過優(yōu)化學(xué)習(xí)過程和網(wǎng)絡(luò)結(jié)構(gòu),微調(diào)整個網(wǎng)絡(luò)的權(quán)重和偏差,可以最大限度地提取這些特征。本文基于Keras平臺分別設(shè)計了基于單道記錄的CNN模型和基于多道記錄的CNN模型,用于進(jìn)行地面微地震P波極性分類。
P波初至極性識別可以當(dāng)作一個簡單的圖像分類問題。根據(jù)人工極性的識別結(jié)果,可將每道微震數(shù)據(jù)分為三類:正極性、負(fù)極性和不能被人工識別的不確定極性?;趩蔚烙涗浀腃NN模型(簡稱ST-CNN-classify)截取單道地震記錄的P波信息作為輸入層,輸入樣本的大小為1×M的向量,其中1代表道數(shù),M為時間域采樣點的個數(shù)。輸入樣本經(jīng)過若干個相互交替的卷積層、池化層提取極性特征后,再經(jīng)過一個或一個以上的全連接層,最后由 Softmax 分類器輸出3個值,分別對應(yīng)輸入樣本為不確定、正極性、負(fù)極性的概率,其中最大概率值所對應(yīng)的類別即為該網(wǎng)絡(luò)的預(yù)測結(jié)果,如圖3(a)所示,圖中輸出的最大概率值為0.92,對應(yīng)極性類別為2,即極性為負(fù)。
圖 3 基于單道記錄(a)與基于多道記錄(b)的極性分類網(wǎng)絡(luò)
分類問題一般采用交叉熵?fù)p失函數(shù)來優(yōu)化網(wǎng)絡(luò)參數(shù),交叉熵通常用于衡量輸入(真實)概率分布p和預(yù)測概率分布q之間的差異
(1)
其中,N為訓(xùn)練數(shù)據(jù)集的大小。損失函數(shù)(Loss)可使用隨機(jī)梯度下降算法迭代求解,每次迭代后,卷積核和權(quán)重將會被更新。在訓(xùn)練過程中,損失值(loss)和準(zhǔn)確度(accuracy)為判斷ST-CNN-classify模型的性能指標(biāo)。
對于地面微震監(jiān)測,檢波器陣列通常采用“星型”、“網(wǎng)格型”等規(guī)則觀測系統(tǒng)??紤]到P波的輻射花樣,相鄰檢波器記錄通常顯示出規(guī)則的極性分布?;诖?,本文提出利用多條相鄰道的P波信息作為訓(xùn)練樣本。為了將多道極性識別仍當(dāng)作分類問題處理,輸入樣本包含多道相鄰檢波器記錄(道數(shù)為奇數(shù)),但是只輸出中間道(目標(biāo)道)的極性類型(圖3(b))。對于第K道的檢波器記錄,選取前后各N1道數(shù)據(jù),時間域的采樣點數(shù)為M,則輸入樣本的大小為(2×N1+1)×M,輸出結(jié)果為第K道的極性。多道記錄和單道記錄的樣本標(biāo)定方法相同,不確定為0,正極性為1,負(fù)極性為2。
MT-CNN-classify和ST-CNN-classify均為分類模型,兩者的區(qū)別主要在于前者能夠?qū)⒛繕?biāo)道與相鄰道結(jié)合起來預(yù)測目標(biāo)道的極性類型。如果目標(biāo)道前面或后面不足N1道時,則填充目標(biāo)道的波形記錄。與ST-CNN-classify相同,MT-CNN-classify也經(jīng)過若干卷積層、池化層和全連接層,最后由Softmax分類器輸出不同類別的概率值,數(shù)值最大的概率值對應(yīng)類別則為分類結(jié)果。
利用微地震實際數(shù)據(jù)分別訓(xùn)練2個CNN模型,其中MT-CNN-classify的訓(xùn)練樣本中相鄰檢波器個數(shù)為5。在輸入神經(jīng)網(wǎng)絡(luò)前,所有輸入數(shù)據(jù)均歸一化至[-1,1]之間。ST-CNN-classify 和 MT-CNN-classify 均使用4組卷積層,每組卷積層包含卷積最大池化和Dropout。其中,卷積操作通過ReLu激活函數(shù)實現(xiàn)從輸入數(shù)據(jù)中提取極性特征;在卷積層之后緊跟著最大池化層,其主要功能為降維、對特征進(jìn)行壓縮、簡化網(wǎng)絡(luò)復(fù)雜度等;Dropout層是指按照一定概率將神經(jīng)元從網(wǎng)絡(luò)中丟棄,從而降低模型的過擬合風(fēng)險。卷積神經(jīng)網(wǎng)絡(luò)的最后一層為全連接層,其用于連接所有的輸出,并用Softmax激活函數(shù)計算分類概率。2個CNN模型的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1、表2 所示。MT-CNN-classify和ST-CNN-classify結(jié)構(gòu)相似,但在 MT-CNN-classify 中,卷積操作使用二維卷積核同時學(xué)習(xí)P波極性特征和檢波器陣列的極性規(guī)律。2個CNN網(wǎng)絡(luò)均采用隨機(jī)梯度下降優(yōu)化方法進(jìn)行訓(xùn)練,學(xué)習(xí)率設(shè)定為0.01,模型設(shè)定的批量大小為8,迭代次數(shù)為200。
表1ST-CNN-classify參數(shù)
表 2MT-CNN-classify參數(shù)
圖 4 MT-CNN-classify(a)、(c)和ST-CNN-classify(b)、(d)的準(zhǔn)確度損失曲線訓(xùn)練準(zhǔn)確度和訓(xùn)練損失曲線分別以紅色和綠色繪制;測試準(zhǔn)確度和測試損失曲線分別以藍(lán)色和黑色繪制
圖 5 測試數(shù)據(jù)集的預(yù)測誤差直方圖(a)測試集預(yù)測誤差分布;(b)不同數(shù)量檢波器的模型預(yù)測誤差對比
圖 6 3個CNN模型的損失曲線對比
訓(xùn)練好的CNN模型可進(jìn)一步用于地面微震實際數(shù)據(jù)的P波極性分類。采用訓(xùn)練好的ST-CNN-classify模型和MT-CNN-classify模型分別預(yù)測未用于構(gòu)建訓(xùn)練數(shù)據(jù)集的34個微地震事件的P波極性,預(yù)測過程僅耗時幾秒。由于實際數(shù)據(jù)的極性是未知的,可通過反演震源機(jī)制解來評估預(yù)測結(jié)果。利用P波極性求解震源機(jī)制解需要震源位置,在進(jìn)行地面監(jiān)測時,垂直單分量檢波器的P波記錄通常顯示出比S波更高的信噪比,因此可用P波信息定位微地震事件。根據(jù)已有的資料,用于繞射疊加定位的P波速度模型為4250m/s。X、Y、Z三個方向的定位范圍分別為0~1000m、0~1000m和700~1700m,步長均為10m。求出震源位置后,通過對所有可能的走向、傾角和滑動角進(jìn)行格點搜索,可以得到最佳的震源機(jī)制解。最小矛盾比為CNN預(yù)測極性和震源機(jī)制解計算的極性不一致的比例,可用來評估反演得到的震源機(jī)制解的準(zhǔn)確度。
圖 7對比了ST-CNN-classify模型和MT-CNN-classify模型預(yù)測的8個微地震事件的極性分布,極性預(yù)測結(jié)果直觀地顯示在檢波器陣列上,紅色、綠色和黃色圓圈分別為正極性、負(fù)極性和不確定,圓圈的大小與微震數(shù)據(jù)振幅的相對大小成正比,黑色實心圓代表了微震事件的震源位置,由繞射疊加方法利用極性矯正后的波形獲得。圖7 各分圖左上角的沙灘球(最佳斷層面解的下半球投影圖)是由預(yù)測的P波極性反演的震源機(jī)制解,黑色陰影區(qū)域代表壓縮象限,白色區(qū)域代表膨脹象限。通常,正極性應(yīng)該被投射到壓縮象限,而負(fù)極性應(yīng)該被投射到膨脹象限,然而ST-CNN-classify的膨脹(壓縮)象限中出現(xiàn)一些正(負(fù))極性。對比圖7(a)和圖7(b),可以直觀地看出MT-CNN-classify模型在正、負(fù)極性之間的預(yù)測誤差更小,得到的極性分布比ST-CNN-classify模型更為合理。圖7 中的Ψ為震源機(jī)制解的最小矛盾比,范圍在0和1之間,Ψ的數(shù)值越小,表明震源機(jī)制解越準(zhǔn)確。Ψ值進(jìn)一步證明了MT-CNN-classify模型具有更高的P波極性預(yù)測準(zhǔn)確度。
圖 7 8個微震事件的極性預(yù)測結(jié)果
統(tǒng)計34個微震事件的最小矛盾比的分布情況,如圖8 所示,圖8 中3種模型最小矛盾比的均值和方差見表3。結(jié)果表明,MT-CNN-classify模型的最小矛盾比大多分布在0~0.1區(qū)間,與ST-CNN-classify結(jié)果相比有較大改善。進(jìn)一步對比基于回歸模型的 MT-CNN-regression 的結(jié)果(Tian et al,2020),MT-CNN-classify中有13個事件的最小矛盾比在0~0.05區(qū)間,而MT-CNN-regression模型有11個事件在該區(qū)間。此外,相比ST-CNN-classify,多道數(shù)據(jù)的分類模型和回歸模型均有較低的最小矛盾比。
圖 8 不同CNN模型的最小矛盾比分布直方圖
表3不同CNN模型最小矛盾比的平均值和方差
為了便于與Tian等(2020)中MT-CNN-regression的結(jié)果對比,本文構(gòu)建數(shù)據(jù)集的方法與Tian等(2020)相同,但該處理方法存在數(shù)據(jù)泄露的風(fēng)險。首先,將5個微震事件數(shù)據(jù)增強(qiáng)后的樣本分為訓(xùn)練集與測試集,導(dǎo)致測試集與訓(xùn)練集中可能存在同一源數(shù)據(jù)生成的樣本。此外,訓(xùn)練樣本與測試樣本均來自5個微震事件,而檢波器為間距極小的高密臺陣。因此,對同一事件,相鄰臺站的波形記錄相似度極高,即訓(xùn)練集與測試集中存在高度相似的樣本。
針對以上兩點,對檢波器個數(shù)為9的MT-CNN-classify網(wǎng)絡(luò)進(jìn)行交叉驗證,即將5個微震事件數(shù)據(jù)增強(qiáng)后的結(jié)果依次放入訓(xùn)練集和測試集,該處理方法可避免測試集與訓(xùn)練集中存在同一源數(shù)據(jù)生成的樣本。5組樣本集交叉驗證的訓(xùn)練集和測試集的準(zhǔn)確度如表4 所示,結(jié)果表明,訓(xùn)練集的準(zhǔn)確度和圖4 相比相差不大,但測試集準(zhǔn)確度有所降低,由此可證明圖4 所采用的數(shù)據(jù)集存在數(shù)據(jù)泄露。此外,最后一組交叉驗證的測試集準(zhǔn)確度為74.58%,相比前面4組較低,這是由于事件5的信噪比較低。雖然本文使用的數(shù)據(jù)集存在數(shù)據(jù)泄露,導(dǎo)致測試集的準(zhǔn)確度偏高,但是通過實際數(shù)據(jù)的應(yīng)用,MT-CNN-classify模型比ST-CNN-classify的預(yù)測精度高這一結(jié)論仍然成立。
表4MT-CNN-classify交叉驗證
針對地面微地震監(jiān)測多為規(guī)則觀測系統(tǒng),本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)的多道極性分類網(wǎng)絡(luò)模型,并以此來確定微震數(shù)據(jù)的P波極性。多道數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)模型不僅可以學(xué)習(xí)P波極性特征,還能夠?qū)W習(xí)相鄰檢波器的P波極性分布規(guī)律,進(jìn)一步提高目標(biāo)道的預(yù)測精度。本文著重對比了ST-CNN-classify、MT-CNN-classify和MT-CNN-regression三個網(wǎng)絡(luò)模型,實際數(shù)據(jù)的P波極性預(yù)測結(jié)果表明,相比單道數(shù)據(jù)的CNN模型,無論是基于回歸模型還是分類模型的多道數(shù)據(jù)的CNN均可獲得較高的極性預(yù)測精度。此外,MT-CNN-classify模型的損失曲線比MT-CNN-regression收斂快。本研究提出的基于多道的P波極性分類網(wǎng)絡(luò)還適用于其他具有規(guī)則臺站分布的地震數(shù)據(jù)集。
致謝:感謝南京物探研究院提供的水力壓裂監(jiān)測數(shù)據(jù)以及審稿人提出的寶貴意見。