亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林方法的地震插值方法研究

        2018-04-03 12:26:44徐凱孫贊東
        石油科學(xué)通報(bào) 2018年1期
        關(guān)鍵詞:決策樹插值振幅

        徐凱,孫贊東

        中國石油大學(xué)(北京)地質(zhì)與地球物理綜合研究中心,北京 102249

        0 引言

        在地震勘探中,采集資料的準(zhǔn)確與否對勘探結(jié)果有著至關(guān)重要的作用。但是在地震資料的采集過程中,由于地形、實(shí)際采集方法等條件限制,采集得到的地震數(shù)據(jù)經(jīng)常會(huì)存在壞道、死道、空道等情況,嚴(yán)重影響了后續(xù)的偏移解釋等工作。地震插值是一種較為有效的解決該問題的方法。

        地震插值主要有以下幾種方法:(1)基于變換域的插值方法。該方法主要是將地震信號(hào)變化到其他域內(nèi)進(jìn)行操作,然后再反變換到時(shí)空域。主要有Radon變換,F(xiàn)ourier變換,曲波變換等方法。Fourier變換方法是將其變換到波數(shù)域進(jìn)行道集重建。在波數(shù)域可以實(shí)現(xiàn)五維插值的效果[1-3]。Sacchi[4]等在反演的思想下實(shí)現(xiàn)了五維插值的方法。曲波變換是小波變換的另一種形式,可以較好的描述地震數(shù)據(jù)的稀疏特性,可以采用壓縮感知的方法來進(jìn)行插值[5-7]。(2)基于預(yù)測濾波的插值方法。Spitz[8]在f-x域?qū)崿F(xiàn)了基于預(yù)測濾波的插值方法,Claerbout[9]在此基礎(chǔ)上研究了t-x域的預(yù)測誤差濾波地震插值方法,實(shí)現(xiàn)了含假頻的數(shù)據(jù)重構(gòu)。上述傳統(tǒng)插值方法都是基于較為復(fù)雜的數(shù)學(xué)變換或者波場重構(gòu)理論,計(jì)算較為繁瑣,而且在變換重構(gòu)過程中需要多種近似,難以精確預(yù)測缺失地震道的真實(shí)情況。

        機(jī)器學(xué)習(xí)方法在地球物理中得到了廣泛的應(yīng)用。目前應(yīng)用主要集中于地震屬性預(yù)測領(lǐng)域[10-14]。在地震插值領(lǐng)域,機(jī)器學(xué)習(xí)方法應(yīng)用較少。由于地震道缺失問題可以看作是一個(gè)隨機(jī)的、非線性的數(shù)學(xué)問題,而且地震道插值主要用了周圍幾道的的信息,所以本文嘗試采用機(jī)器學(xué)習(xí)中有監(jiān)督學(xué)習(xí),從局部規(guī)律學(xué)習(xí)的角度出發(fā)來進(jìn)行缺失道數(shù)據(jù)的補(bǔ)全處理。有監(jiān)督學(xué)習(xí)是一種從標(biāo)簽化訓(xùn)練數(shù)據(jù)集中推斷出抽象函數(shù)的機(jī)器學(xué)習(xí)技術(shù),常見的算法包括決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、梯度下降樹和隨機(jī)森林等算法。各類算法各有利弊,其中隨機(jī)森林算法是由Brieman于2001年提出的一種集成機(jī)器學(xué)習(xí)算法[15],可用于解決高維非線性的分類預(yù)測、回歸預(yù)測與特征選擇。它是Bagging集成學(xué)習(xí)算法[16]的改進(jìn)版本,大量實(shí)踐證明隨機(jī)森林能夠有效解決高維非線性問題,是目前階段被廣泛使用的一種機(jī)器學(xué)習(xí)算法[17]。

        本文首先介紹了基于機(jī)器學(xué)習(xí)思想的隨機(jī)森林回歸預(yù)測方法。從理論上推導(dǎo)了本文方法的可行性。隨后在機(jī)器學(xué)習(xí)的思想下,以無缺失道為學(xué)習(xí)樣本集,補(bǔ)全缺失的地震數(shù)據(jù)。最后將該方法分別應(yīng)用于模型資料與實(shí)際資料,驗(yàn)證了該方法的正確性與有效性。

        1 基于隨機(jī)森林的缺失道補(bǔ)全

        1.1 隨機(jī)森林回歸預(yù)測算法

        隨機(jī)森林回歸預(yù)測算法是一種集成大量隨機(jī)決策樹模型的集成學(xué)習(xí)算法[13],其基礎(chǔ)是CART回歸決策樹算法[14]。對于y=F( X),其中X={x1, x2... xP}型的回歸問題,CART回歸樹算法通過優(yōu)選分割變量及其閾值,將原始的P維輸入空間遞歸分割為有限個(gè)子空間。在具體的遞歸分割過程中,假設(shè)當(dāng)前父節(jié)點(diǎn)所對應(yīng)子空間為XC,記對于第i個(gè)輸入變量xi閾值為的分割為S(),則S()等效于將其分割為左右兩個(gè)節(jié)點(diǎn),設(shè)左邊節(jié)點(diǎn)對應(yīng)子空間XL,右邊節(jié)點(diǎn)對應(yīng)的子空間為XR,分割規(guī)則可表示如下:

        對于回歸問題CART決策樹將遍歷XC中P維輸入x1, x2... xP中每一個(gè)潛在的分割S(),優(yōu)選最佳分割使得“不純度”I()最小,其中I()可表示為:

        (1)當(dāng)前父節(jié)點(diǎn)中所有樣本P維特征均一致;

        (2)當(dāng)前父節(jié)點(diǎn)中樣本個(gè)數(shù)小于給定最小葉子節(jié)點(diǎn)樣本個(gè)數(shù);

        (3)當(dāng)前父節(jié)點(diǎn)中樣本的y值方差小于給定方差閾值。

        條件滿足時(shí),停止遞歸分割并將當(dāng)前父節(jié)點(diǎn)設(shè)置為葉子結(jié)點(diǎn)。在完成遞歸分割后,所生成的CART決策樹等效于將整個(gè)樣本空間X分割為X1, X2... XS,并以二叉樹的形式存儲(chǔ)分割邏輯。在預(yù)測時(shí),CART決策樹取每個(gè)空間內(nèi)的樣本在預(yù)測變量y上的均值作為該子空間內(nèi)的預(yù)測值,建立回歸預(yù)測函數(shù):

        式中,I為脈沖函數(shù),E為期望值。

        綜上所述,可見CART可通過對訓(xùn)練樣本的學(xué)習(xí)擬合出一個(gè)分段常數(shù)函數(shù),該函數(shù)能夠在一定程度上有效表示原始訓(xùn)練樣本中的潛在統(tǒng)計(jì)關(guān)系,但往往過于粗糙且不穩(wěn)定。對此Brieman利用集成學(xué)習(xí)的思想,通過對原始樣本集進(jìn)行Bootstrap抽樣獲取N個(gè)樣本子集,而后在這N個(gè)樣本子集的基礎(chǔ)上分別構(gòu)建CART回歸樹,在預(yù)測時(shí)取這N個(gè)CART回歸樹的預(yù)測均值作為最終的預(yù)測結(jié)果,這種方法被稱之為Bagging集成,它能夠在一定程度上克服單個(gè)CART預(yù)測模型的弊端。

        而后Brieman通過數(shù)學(xué)證明和數(shù)據(jù)實(shí)驗(yàn)表明,在保證Bagging集成模型中每棵樹的有效性同時(shí),使得每棵樹間的差異越大則最終的集成預(yù)測效果越好。在此思路的指導(dǎo)下,Brieman通過對決策樹的生成過程中引入更多隨機(jī)性來提高每棵樹間的差異。該算法被稱之為隨機(jī)森林算法,其算法框架如圖1所示,其隨機(jī)性的引入通過兩方面進(jìn)行:

        (1)與Bagging集成相同,隨機(jī)森林首先對全部樣本集進(jìn)行Bootstrap抽樣,生成一系列隨機(jī)樣本子集,在各樣本子集的基礎(chǔ)上進(jìn)行決策樹的構(gòu)建。

        (2)在節(jié)點(diǎn)分割過程中,與CART決策樹遍歷所有輸入的所有潛在分割不同,隨機(jī)森林中隨機(jī)決策樹僅在K個(gè)隨機(jī)抽選的特征子集中進(jìn)行優(yōu)選來分割當(dāng)前節(jié)點(diǎn)。

        根據(jù)上述方法構(gòu)建出的隨機(jī)決策樹在保證每棵樹具有相當(dāng)?shù)臏?zhǔn)確性的同時(shí),使得樹與樹之間的差異性足夠大。較之于Bagging集成隨機(jī)森林模型具有抗噪性好、有效避免過擬合且得到的函數(shù)關(guān)系更為平滑。大量實(shí)踐證明,隨機(jī)森林回歸預(yù)測算法能夠有效學(xué)習(xí)樣本集中的高維非線性統(tǒng)計(jì)關(guān)系,因此本文主要基于隨機(jī)森林算法學(xué)習(xí)缺失道集臨近道各點(diǎn)振幅間的高維非線性統(tǒng)計(jì)關(guān)系,據(jù)此進(jìn)行缺失道的補(bǔ)全。

        1.2 從局部學(xué)習(xí)角度進(jìn)行缺失道補(bǔ)全

        目前常用的地震插值方法雖然易用性較高,但是存在以下問題:

        第一,各類插值方法本身具有其模型假設(shè),例如三次樣條插值方法假設(shè)相鄰數(shù)據(jù)點(diǎn)間滿足三次多項(xiàng)式關(guān)系,而克里格類插值方法假設(shè)整個(gè)剖面上的數(shù)據(jù)點(diǎn)滿足二階平穩(wěn)假設(shè),當(dāng)實(shí)際資料中的地震數(shù)據(jù)與這些假設(shè)偏差較大時(shí),強(qiáng)行基于這些插值方法進(jìn)行缺失道補(bǔ)全,將造成不可避免的計(jì)算誤差。

        圖1 隨機(jī)森林回歸預(yù)測算法示意圖Fig. 1 A schematic diagram of random forest regression prediction algorithm

        第二,插值方法完全忠實(shí)于所給出的數(shù)據(jù)點(diǎn)(插值得到的一維曲線、二維曲面一定過各數(shù)據(jù)點(diǎn)),對于噪音干擾較大的數(shù)據(jù)無法保證各數(shù)據(jù)點(diǎn)上數(shù)據(jù)測量結(jié)果的準(zhǔn)確性,完全忠實(shí)于所有數(shù)據(jù)點(diǎn)進(jìn)行插值會(huì)把采集誤差、隨機(jī)噪音等引入到插值結(jié)果中。

        此外,作為一種全局方法,通過插值方法進(jìn)行缺失道補(bǔ)全將依賴整個(gè)道集剖面中的所有數(shù)據(jù),而實(shí)際上對缺失道某一時(shí)間點(diǎn)振幅補(bǔ)全結(jié)果產(chǎn)生實(shí)質(zhì)影響的僅僅是臨近道臨近時(shí)間范圍內(nèi)的數(shù)據(jù)點(diǎn)??紤]到對于缺失道Ti的給定時(shí)間點(diǎn)t處的振幅Ai,t,在整個(gè)共炮集剖面中與其具有較強(qiáng)相關(guān)性的數(shù)據(jù)點(diǎn)僅是Ti的臨近道Ti+n的t+m范圍內(nèi)數(shù)據(jù)點(diǎn)的振幅Ai?n,t?m,…,Ai,t,…,Ai+n,t+m。本文所提出方法的基本思路是以Ai,t為學(xué)習(xí)目標(biāo),而以Ai?n,t?m,…,Ai,t,…,Ai+n,t+m等為輸入,基于隨機(jī)森林算法基于機(jī)器學(xué)習(xí)過程,根據(jù)未缺失部分?jǐn)?shù)據(jù)建立回歸關(guān)系A(chǔ)i,t=F( Ai?n,t?m,…,Ai,t,…,Ai+n,t+m),而后將回歸預(yù)測函數(shù)F( x)應(yīng)用到缺失道位置處,基于缺失道的臨近道數(shù)據(jù)對其進(jìn)行補(bǔ)全。

        對于真實(shí)的地震數(shù)據(jù),數(shù)據(jù)道的確實(shí)情況可分為兩種,一種為單道缺失(如圖2(a)中所示),對于這種情況缺失道左右兩側(cè)的臨近道均可獲??;另一種情況則為連續(xù)缺失(如圖2(b)中所示),這種情況下僅有最邊緣缺失道的左側(cè)或者右側(cè)的臨近道可確定。針對這兩種情況,分別采用不同的策略進(jìn)行缺失道補(bǔ)全。

        對于單道缺失的情況,以同一道集剖面中未缺失數(shù)據(jù)道為基礎(chǔ),分別以Ti道的t時(shí)間點(diǎn)處的振幅Ai,t,以及Ti左右Ti±2的t±5范圍內(nèi)的共44個(gè)數(shù)據(jù)點(diǎn)的振幅Ai±2,t±5等構(gòu)建機(jī)器學(xué)習(xí)樣本集,在此樣本集的基礎(chǔ)上使用隨機(jī)森林方法,通過機(jī)器學(xué)習(xí)得到統(tǒng)計(jì)關(guān)系A(chǔ)i,t=Fm(Ai±2,t±5)。其中m代表缺失道兩側(cè)。同時(shí)考慮到這一統(tǒng)計(jì)映射關(guān)系可能隨著空間位置(道號(hào)i)和時(shí)間發(fā)生變化,因此同時(shí)將道號(hào)i和時(shí)間t也納入輸入空間之中,所得到的Fm實(shí)質(zhì)上為Ai,t=Fm(Ai±2,t±5,i, t)。對于單一缺失道Tj時(shí)間點(diǎn)為t處的振幅,可通過將其所在左右臨近道t附近44個(gè)點(diǎn)的振幅Ai±2,i±5道號(hào)i、時(shí)間t帶入Fm按照Aj,t=Fm(Ai±2,t±5,j, t )計(jì)算得到。

        對于連續(xù)缺失的情況,由于無法獲取各道左右臨近兩道數(shù)據(jù),無法按照回歸預(yù)測函數(shù)Fm(x)進(jìn)行預(yù)測,對于這種情況采用遞推方法進(jìn)行預(yù)測補(bǔ)全。以最左側(cè)缺失道的補(bǔ)全為例,按照與單道缺失相同的方法,以同一道集剖面中未缺失數(shù)據(jù)道為基礎(chǔ),分別以Ti道的t時(shí)間點(diǎn)處的振幅Ai,t,以及Ti左側(cè)Ti?1,Ti?2,Ti?3,Ti?4,范圍內(nèi)的t±5范圍內(nèi)的共44個(gè)數(shù)據(jù)點(diǎn)的振幅、道號(hào)等構(gòu)建機(jī)器學(xué)習(xí)樣本集,在此基礎(chǔ)上利用隨機(jī)森林算法學(xué)習(xí)得到Ai,t=Fl( Ai?1…5,t±5,i, t )統(tǒng)計(jì)關(guān)系,其中l(wèi)代表缺失道左側(cè)。對于連續(xù)缺失的最左側(cè)道Tj,帶入Aj,t=Fl( Aj?1…5,t±5,j, t)計(jì)算其各點(diǎn)振幅,而后將預(yù)測的到的T*j作為未缺失道,按照同樣的方法計(jì)算Tj+1道各點(diǎn)的振幅。以此類推得到連續(xù)缺失各道的振幅響應(yīng)。

        圖2 單道缺失和連續(xù)缺失情況下的輸入點(diǎn)分布示意圖Fig. 2 A schematic diagram of input point distribution for single trace loss and continuous loss

        與此同時(shí),以同一道集中未缺失數(shù)據(jù)道為基礎(chǔ),分別以Ti道的t時(shí)間點(diǎn)處的振幅Ai,t,以及Ti右側(cè)Ti+1,Ti+2,Ti+3,Ti+4范圍內(nèi)的t±5范圍內(nèi)的共44個(gè)數(shù)據(jù)點(diǎn)的振幅、道號(hào)等構(gòu)建機(jī)器學(xué)習(xí)樣本集。在此基礎(chǔ)上利用隨機(jī)森林算法學(xué)習(xí)得到Ai,t=Fr( Ai+1…5,t±5,i, t)的統(tǒng)計(jì)關(guān)系,其中r代表缺失道右側(cè)。按照同樣的方法從最右側(cè)缺失道開始,從右至左預(yù)測各道振幅。最終,取從右至左和從左至右個(gè)點(diǎn)兩個(gè)振幅預(yù)測結(jié)果的均值作為最終預(yù)測結(jié)果。

        2 方法應(yīng)用分析

        我們將本文方法分別應(yīng)用于正演模型資料與r1區(qū)域的實(shí)際采集資料,分析預(yù)測結(jié)果,驗(yàn)證該方法的正確性與有效性。隨機(jī)森林主要的算法參數(shù)包括:(1)隨機(jī)樹的個(gè)數(shù),(2)隨機(jī)特征子集的大小,(3)葉子結(jié)點(diǎn)中最少樣本點(diǎn)個(gè)數(shù)。一般而言樹越多越好,但過多的隨機(jī)樹會(huì)帶來巨大的計(jì)算時(shí)間,權(quán)衡利弊后,選擇使用500棵隨機(jī)決策樹構(gòu)建隨機(jī)森林。而在樹的生長過程中,考慮到46個(gè)隨機(jī)特征子集輸入中可能存在無效輸入,通過從1到46逐個(gè)嘗試,最終確定取23個(gè)隨機(jī)特征子集預(yù)測時(shí)效果最佳。而葉子結(jié)點(diǎn)中最少樣本點(diǎn)個(gè)數(shù)往往取決于樣本集中的噪音強(qiáng)度,考慮到地震數(shù)據(jù)中不可避免的存在測量誤差,為提高機(jī)器學(xué)習(xí)預(yù)測模型抗噪性、防止過擬合,最小葉子節(jié)點(diǎn)樣本個(gè)數(shù)不應(yīng)太小,在本文的實(shí)驗(yàn)中將其設(shè)置為20。

        2.1 正演模擬數(shù)據(jù)應(yīng)用驗(yàn)證

        首先將本文所提出方法應(yīng)用到正演模擬數(shù)據(jù)上來驗(yàn)證方法的正確性。地層模型采用的是Marmousi模型。該模型里還有較多的斷層、背斜、尖滅等地質(zhì)情況存在,可以較好的驗(yàn)證該插值方法在復(fù)雜地質(zhì)條件下的插值效果。對于給定地層模型,通過交錯(cuò)網(wǎng)格正演方法得到各道的波形記錄(共100道,每道以2 ms為采樣間隔,如圖3(a)中所示),然后人為將第10、20、30、40、50、60-63、80-85道數(shù)據(jù)設(shè)置為缺失道(在圖3(a)中使用虛線標(biāo)出),而后利用在前文中所提出的方法,根據(jù)缺失道之外的各道數(shù)據(jù)構(gòu)建機(jī)器學(xué)習(xí)樣本集,得到回歸預(yù)測函數(shù)Fm(x )、F1( x )和Fr( x)。據(jù)此對人為設(shè)置為缺失的道進(jìn)行補(bǔ)全,補(bǔ)全結(jié)果在圖3(b)中用紅線標(biāo)出。圖3(b)中看出該方法能較完整的補(bǔ)缺道集。對于10、20、30、40等單道來說,該方法得到的補(bǔ)全道同相軸的連續(xù)性較好,與周圍各地震道保持了連貫性。振幅的相似性較高,與周圍各道保持一致。對于60-63、80-85各道的連續(xù)缺失來說,該方法也能較好的補(bǔ)全連續(xù)缺失道。從圖中可以看出,補(bǔ)全連續(xù)缺失道中的第2道和第3道的振幅依然飽滿,與前道相似度較高,同相軸連續(xù)性極佳,與單一缺失道的補(bǔ)全基本沒有區(qū)別。

        圖3 正演數(shù)據(jù)模型及數(shù)據(jù)補(bǔ)全效果Fig. 3 Forward modeling data interpolation result

        圖4 單道振幅對比圖Fig. 4 Single channel amplitude contrast diagram

        為了測試該插值方法的保幅性,本文又抽取了第10、20、30、40、50、60、80、85道做單道振幅對比。由于這幾道是人為設(shè)置缺失的,其真實(shí)模型振幅是可通過正演模擬得到的,因此可通過對比這些道的正演波形和補(bǔ)全波形,從而驗(yàn)證補(bǔ)全波形的正確性。圖4中分別為第10、20、30、40、50、60、80、85道的正演波形(紅色)和補(bǔ)全波形(藍(lán)色)。從圖中可以看出,除去在振幅非常強(qiáng)的波峰和波谷處存在差異外,正演波形和補(bǔ)全波形整體而言非常相似,各層振幅能量均衡,補(bǔ)全道與正演值匹配性較好。對于單道缺失跟多道缺失的第一道來說,本方法預(yù)測的振幅值在0.13左右,而真實(shí)振幅值在0.15左右,誤差在10%左右。對于多道缺失的最后一道來說,預(yù)測值與真實(shí)值誤差變大,大約在30%左右。但是振幅形態(tài)分布、波峰波谷位置保持一致,有效的證明了本方法的適用性。此外,搜集第10、20、30、40、50、60-63、80-85道上各點(diǎn)正演波形和補(bǔ)全波形振幅值,以正演波形的振幅值(真實(shí)幅度)為X軸、以補(bǔ)全波形的振幅值(預(yù)測幅度)為Y軸繪制散點(diǎn)圖如圖5所示??梢钥闯鲈诜葹?-0.2,0.2)范圍內(nèi)的數(shù)據(jù)點(diǎn),真實(shí)幅度和預(yù)測幅度的點(diǎn)基本處于Y=X的對角線上,而對于幅度大于0.2的點(diǎn)還是存在著一定的偏差,這是因?yàn)闆Q策樹的預(yù)測本身為局部均值,而隨機(jī)森林又為多顆決策樹的估計(jì)均值,對于振幅過高的波峰和波谷將帶來一定的平滑作用。但整體而言對于數(shù)據(jù)較為密集的區(qū)域,兩者之間一致性非常高,整體相關(guān)系數(shù)R2可達(dá)0.906。

        圖5 各道波形真實(shí)幅度與預(yù)測幅度對比分析圖Fig. 5 Comparison of real amplitude and predictive amplitude

        眾所周知,噪音是地震采集資料中不可忽視的一個(gè)重要影響因素。為了測試本算法的抗噪音能力,本文將模型數(shù)據(jù)加了20%的白噪,隨后對再進(jìn)行插值測試,如圖6(a)所示。從圖6(a)中可以看出,加噪音的插值結(jié)果與無噪音的補(bǔ)全結(jié)果基本一致,且與原始道集相似性高。圖6(b)與圖5相似,也是各道波形真實(shí)幅度與預(yù)測幅度的對比分析圖。從圖中可以看出,相關(guān)系數(shù)有一定的減少,但是整體形態(tài)變化不大,說明有噪音情況下的插值結(jié)果與真實(shí)值較為接近,可信度較高,證明了該方法有較好的抗噪性。

        2.2 實(shí)際資料數(shù)據(jù)處理

        圖6 加噪音后的補(bǔ)全剖面與振幅散點(diǎn)圖Fig. 6 Interpolation section and amplitude

        同時(shí)本文將該方法應(yīng)用于工區(qū)中的疊前采集數(shù)據(jù),首先考慮對工區(qū)中無缺失道數(shù)據(jù)進(jìn)行人工缺失,對比利用該方法得到補(bǔ)全道集與真實(shí)道集間的相似性,驗(yàn)證方法的有效性。將r1剖面(如圖7(a)中所示)中的第10、70-75道人為設(shè)置為缺失道(如圖7(b)中所示),而后按照前述方法以未缺失道部分?jǐn)?shù)據(jù)為基礎(chǔ)對第10、70、72道這三道進(jìn)行補(bǔ)全,補(bǔ)全效果如圖7(c)中所示。對比圖7 (a)中和圖7 (c)中剖面可以看出在人工缺失道位置處二者差別很小,在能看到同相軸區(qū)域,補(bǔ)全道能較好的延續(xù)同相軸走勢,且從圖中能直觀看出振幅能量較強(qiáng),圖像的一致性較好。針對連續(xù)缺失的情況,如第70-75道,該方法也能較好的補(bǔ)全缺失道集,保持同相軸的連續(xù)性。

        圖7 人工缺失道集剖面補(bǔ)全效果Fig. 7 Real data interpolation result

        圖8 人工缺失道補(bǔ)全波形與真實(shí)波形對比圖Fig. 8 Single channel amplitude contrast diagram

        圖9 缺失各道波形真實(shí)幅度與預(yù)測幅度對比分析圖Fig. 9 Comparison of real amplitude and predictive amplitude

        為了測試該方法的保幅性,本文抽取了10、70、72三道進(jìn)行單道對比。在圖8中將這三道的真實(shí)波形(紅色)和預(yù)測補(bǔ)全波形(藍(lán)色)進(jìn)行對比,并以三道數(shù)據(jù)原始波形振幅為X軸、預(yù)測波形振幅為Y軸繪制散點(diǎn)圖(圖9)。從圖9中可以看出,由于受真實(shí)數(shù)據(jù)中噪音和波形的復(fù)雜性影響,真實(shí)波形和預(yù)測波形間的一致性略遜于正演剖面數(shù)據(jù),但二者之間的波形相似性依舊很高。無論是反射較強(qiáng)的區(qū)域還是反射較弱區(qū)域,補(bǔ)全道的振幅能量與真實(shí)資料較為一致,振幅大小也較為相似。對于單道缺失跟多道缺失的第一道來說,本方法預(yù)測的振幅值在50左右,而真實(shí)振幅值在40左右,誤差在20%左右。對于多道缺失的最后一道來說,預(yù)測值與真實(shí)值誤差變大,大約在40%左右。但是振幅形態(tài)分布、波峰波谷位置保持一致,有效的證明了本方法的實(shí)用性。

        從圖9中可以看出各點(diǎn)基本處于Y=X的對角線附近,以相關(guān)系數(shù)來定量評(píng)價(jià)二者相似性,原始波形振幅和預(yù)測波形振幅之間的整體相關(guān)系數(shù)R2可達(dá)0.899,已達(dá)到誤差可接受范圍內(nèi),說明本文所提出方法可應(yīng)用于r1的實(shí)際地震資料插值。為了驗(yàn)證本文方法在插值方面的優(yōu)越性,同時(shí)選用快速傅里葉變換的插值方法進(jìn)行對比。圖10為快速傅里葉變換方法的插值結(jié)果對比圖。從圖10中可以看出,快速傅里葉在單道缺失中效果較好,與隨機(jī)森林方法類似,可以補(bǔ)全缺失道,并保證同相軸的延續(xù)性。但是連續(xù)道缺失情況下,該方法插值效果一般,同相軸連續(xù)性較差,缺失道異?,F(xiàn)象明顯。圖11為單道振幅對比圖,從圖中可以明顯看出,在第10道,70道時(shí)紅色線與藍(lán)色線吻合性較好,證明該方法對于單道缺失效果較為理想。第72道為連續(xù)缺失道的中間道,從圖中可以看出,對于這種連續(xù)缺失道,快速傅里葉插值方法與理論值差別較大,波形相似性較低。單道缺失的振幅誤差還能保證在20%以內(nèi),而多道缺失波形基本沒有相似性,沒有誤差對比的必要。圖12為預(yù)測振幅與真實(shí)振幅的散點(diǎn)圖,從圖中可以明顯看出,真實(shí)振幅與預(yù)測振幅相差較大,散點(diǎn)圖的趨勢沒有沿著對角線方向。通過與快速傅里葉變換插值的對比證明,本文提出的插值方法精確度更高。特別是對于連續(xù)缺失道插值,該方法能很好的保持同相軸趨勢的連續(xù)性,較好的補(bǔ)全缺失道集。

        圖10 快速傅里葉方法插值結(jié)果Fig. 10 Fouries interpolation result

        圖11 快速傅里葉法缺失道補(bǔ)全波形與真實(shí)波形對比圖Fig. 11 Single channel amplitude contrast diagram

        圖12 缺失各道波形真實(shí)幅度與預(yù)測幅度對比分析圖Fig. 12 Comparison of real amplitude and predictive amplitude

        3 結(jié)論與展望

        目前針對地震插值的主要方法是將原始地震數(shù)據(jù)變換到其他域進(jìn)行計(jì)算,隨后反變換到時(shí)空域輸出結(jié)果。不同于這一常用的方法,本文從利用機(jī)器學(xué)習(xí)進(jìn)行地震插值的角度進(jìn)行了研究。首先將無缺失道作為機(jī)器學(xué)習(xí)的樣本集進(jìn)行訓(xùn)練,學(xué)習(xí)各道各點(diǎn)之間的振幅關(guān)系。隨后引入隨機(jī)森林回歸方法,預(yù)測缺失道的振幅時(shí)間關(guān)系,從而補(bǔ)全道集,得到一個(gè)較好的地震插值效果。本文采用了高隨機(jī)性的多維隨機(jī)森林回歸預(yù)測方法,具有較好的抗噪性,而且能有效的避免過擬合現(xiàn)象。由于地震插值主要利用周圍幾個(gè)點(diǎn)的振幅值,所以本文引入了局部學(xué)習(xí)的方法,結(jié)果表明,該方法能夠較好的補(bǔ)全缺失的地震道集,而且振幅準(zhǔn)確,差異性較小。對于模型資料來說,基本可以完整補(bǔ)全缺失地震道,抽取的單道振幅表明,除了最強(qiáng)的波峰波谷處可能存在一定的誤差,剩余波形基本能保持一致,且對噪音的壓制作用較好。實(shí)際資料試算表明,該方法能夠較好的補(bǔ)全缺失道,能保證同相軸的連續(xù)性,振幅的一致性,尤其對于多道缺失情況,該方法效果較好。相關(guān)函數(shù)表明除去波峰波谷,剩余波形相關(guān)性較高,證明該方法有較好的實(shí)用性。

        但是該方法依然存在一定的局限性,主要表現(xiàn)為:(1)三維插值計(jì)算量太大,難以大規(guī)模應(yīng)用。(2)無法與真實(shí)地下介質(zhì)信息結(jié)合。所以本文下一步研究方向主要集中于以下兩個(gè)方面:(1)三維資料插值需要使用124維數(shù)據(jù)。如何進(jìn)行算法優(yōu)化,利用先驗(yàn)條件(如上覆地層信息等)來約束插值過程,減少計(jì)算量是我們下一步研究的重點(diǎn)與難點(diǎn)。(2)由于不同地質(zhì)條件對應(yīng)的道集會(huì)存在一定的差異,所以本文方法針對不同地質(zhì)條件得到更為精確的插值結(jié)果也是需要探索的內(nèi)容。

        [1] HAMPSON D. Inverse velocity stacking for multiple elimination [J]. Journal Canadian of Society of Exploration Geophysics, 1986,61(3):891-901.

        [2] DANIEL T. A strategy for wide-azimuth land interpolation[C]. 77th Annual SEG Meeting Expanded Abstracts, San Antonio, 2007, 26:946-950.

        [3] DANIEL T. Five-dimensional interpolation: Recovering from acquisition constraints [J].Geophysics, 2009, 74(6):123-132.

        [4] SACCHI M D, GAO J J, STANTON A, et al. Tensor factorization and its application to multidimensional seismic data recovery[C]. 85th Annual SEG Meeting Expanded Abstracts, New Orleans, 2015, 4827-4831.

        [5] 唐剛.基于壓縮感知和稀疏表示的地震數(shù)據(jù)重建與去噪[D].北京:清華大學(xué), 2010. [TANG G. Seismic data reconstruction and denoising based on compressive sensing and sparse Representation [D].Beijing: Tsinghua University, 2010.]

        [6] 孔麗云,于四偉,程琳,等.壓縮感知技術(shù)在地震數(shù)據(jù)重建中的應(yīng)用[J].地震學(xué)報(bào), 34(5), 659-666. [KONG L Y, YU S W, CHENG L,et al. Application of compressive sensing to seismic data reconstruction [J]. Acta Seismologica Sinica, 2012, 34 (5): 659-666.]

        [7] 路交通,曹思遠(yuǎn),董建華,等.基于稀疏變換的地震數(shù)據(jù)重構(gòu)方法[J].物探與化探, 2013, 37(1), 175-179. [LU J T, CAO S Y, DONG J H, et al. A study of seismic data recovery based on sparse transform [J]. Geophysical and Geochemical Exploration, 2013, 37(1): 175-179.]

        [8] SPITZ S. Seismic trace interpolation in the F-X domain. Geophysics [J]. 1991, 56(6): 785-794.

        [9] CLAERBOUT J F, NICHOLS D A V E. Interpolation beyond aliasing by (t, x)-domain PEFs [C]. 53rd Annual EAEG Meeting ExpandAbstracts, Paris, 1991, 2-3.

        [10] KADKHODAIE I A, REZAEE M R, RAHIMPOUR B H, et al. Petrophysical data prediction from seismic attributes using committee fuzzy inference system[J]. Computers & Geosciences, 2009, 35(12): 2314-2330.

        [11] HUANG L, DONG X, CLEE T E. A scalable deep learning platform for identifying geologic features from seismic attributes [J].Leading Edge, 2017, 36(3): 249-256.

        [12] SMITH T. Geobody interpretation through multiattribute surveys, natural clusters, and machine learning [C]. 87th Annual SEG Meeting Expanded Abstracts, Houston, 2017, 2153-2157.

        [13] GUITTON A, WANG H, TRAINOR G, et al. Statistical imaging of faults in 3D seismic volumes using a machine learning approach [C].87th Annual SEG Meeting Expanded Abstracts, Houston, 2017, 2045-2049.

        [14] LIN Y, GUTHRIE G, COBBLENTZ D, et al. Towards real-time geologic feature detection from seismic measurements using a randomized machine-learning algorithm[C]. 87th Annual SEG Meeting Expanded Abstracts, Houston, 2017, 2143-2148.

        [15] BIEIMAN L. Random forest [J]. Machine Learning, 2001, 45:5-32.

        [16] BREIMAN L. Bagging predictors [J]. Machine Learning, 1996, 24(2):123-140.

        [17] WU X, KUMAR V. The top ten algorithms in data mining [M]. New York, USA: CRC Press, 2009.

        [18] ZHOU Z H. Ensemble methods: Foundations and algorithms [M]. Boca Raton, FL: Taylor & Francis, 2012.

        [19] BREIMAN L, FRIEDMAN J H, OLSHEN R A, et al. Classi fication and regression trees [M]. Belmont, CA: Wadsworth and Brooks,Monterey, 1984.

        猜你喜歡
        決策樹插值振幅
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        十大漲跌幅、換手、振幅、資金流向
        十大漲跌幅、換手、振幅、資金流向
        十大漲跌幅、換手、振幅、資金流向
        滬市十大振幅
        基于決策樹的出租車乘客出行目的識(shí)別
        一種改進(jìn)FFT多譜線插值諧波分析方法
        基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
        五月婷婷六月激情| 初尝人妻少妇中文字幕| 人妻丝袜av中文系列先锋影音 | 老熟妇高潮av一区二区三区啪啪 | 性欧美长视频免费观看不卡| 色一情一乱一伦一区二区三区日本| 最新国产在线精品91尤物| 青青草伊人视频在线观看| 成人av在线久色播放| 午夜福利试看120秒体验区 | 亚洲综合欧美在线一区在线播放 | 亚洲综合国产成人丁香五月小说 | 中文字幕乱码人妻无码久久麻豆| 久久麻豆精亚洲av品国产精品| 亚洲色图专区在线视频| 97久久超碰国产精品旧版| 国产三级在线视频播放| 亚洲免费看三级黄网站| 精品国产成人av久久| 麻豆成人精品国产免费| 国产亚洲精品A在线无码| 午夜国产精品一区二区三区| 一区二区和激情视频| 亚洲a∨无码男人的天堂| 久青草久青草视频在线观看| 国产精品流白浆喷水| 最全精品自拍视频在线| 免费人成小说在线观看网站| 久久久久国产一区二区三区 | 久久午夜av一区二区三区| 午夜精品一区二区三区的区别| 久久亚洲av永久无码精品 | 中文字幕丰满人妻被公强| 天堂8在线新版官网| 人妻少妇av无码一区二区| 无码av永久免费大全| 亚洲av高清天堂网站在线观看| 肥臀熟女一区二区三区| 97在线视频免费| 国产极品大秀在线性色| 国产免费爽爽视频在线观看|