宋 輝 高 洋 陳 偉 張 翔
(①油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(長(zhǎng)江大學(xué)),湖北武漢 430100; ②長(zhǎng)江大學(xué)地球物理與石油資源學(xué)院,湖北武漢 430100;③中國(guó)石油大學(xué)(北京)CNPC物探重點(diǎn)實(shí)驗(yàn)室,北京 102249; ④非常規(guī)油氣湖北省協(xié)同創(chuàng)新中心,湖北武漢 430100)
隨著油氣勘探環(huán)境變得愈加復(fù)雜,地震數(shù)據(jù)在采集過程中受到的噪聲干擾也愈加嚴(yán)重[1]。地震數(shù)據(jù)中的噪聲可分為兩類:相干噪聲和隨機(jī)噪聲。相干噪聲具有一定的波形特征,而隨機(jī)噪聲沒有固定的波形特征,與有效信號(hào)隨機(jī)混合在一起,影響高分辨率處理、屬性分析、反演等。
噪聲壓制在地球物理學(xué)中是一個(gè)經(jīng)典的問題,已提出了很多方法。傳統(tǒng)的噪聲壓制方法是基于地震數(shù)據(jù)的特性,如可預(yù)測(cè)性、稀疏性等?;陬A(yù)測(cè)性的去噪方法利用有效信號(hào)線性或擬線性生成預(yù)測(cè)濾波器提高信噪比[2-3],但不能處理非線性地震信號(hào)?;谙∈枳儞Q的去噪方法利用信號(hào)在變換域內(nèi)具有較好的稀疏性壓制噪聲,例如小波變換[4-5]、曲波變換[6-7]、Shearlet變換[8-9]等。由于它們建立在固定的變換基函數(shù)上,因此不能自適應(yīng)地處理結(jié)構(gòu)復(fù)雜的地震數(shù)據(jù)。字典學(xué)習(xí)是一種基于數(shù)據(jù)驅(qū)動(dòng)的算法,使用可學(xué)習(xí)的字典代替?zhèn)鹘y(tǒng)的變換基函數(shù),因此可以自適應(yīng)地表示數(shù)據(jù)[10-11]。中值濾波在圖像處理中是一種經(jīng)典的平滑去噪方法,利用信號(hào)與噪聲之間的統(tǒng)計(jì)差異抑制噪聲,常用于地震數(shù)據(jù)去噪[12]。以上方法噪聲壓制效果受限于模型假設(shè)和參數(shù)設(shè)置等因素。
近年來,深度學(xué)習(xí)在圖像處理、語音處理等領(lǐng)域取得了顯著成果[13-15]。通過構(gòu)建多個(gè)處理層逐步實(shí)現(xiàn)抽象的特征表示,可以完成復(fù)雜的分類或預(yù)測(cè)等任務(wù)[16-19]。目前,基于標(biāo)簽數(shù)據(jù)的深度學(xué)習(xí)方法已經(jīng)成功應(yīng)用于地震隨機(jī)噪聲壓制[20],根據(jù)生成標(biāo)簽數(shù)據(jù)的策略,主要可以分為兩類: ①將傳統(tǒng)去噪方法的結(jié)果作為標(biāo)簽數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后將訓(xùn)練好的網(wǎng)絡(luò)模型用于實(shí)際地震數(shù)據(jù)噪聲壓制[21-22]; ②將創(chuàng)建的合成地震數(shù)據(jù)作為標(biāo)簽數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)[23],然后將訓(xùn)練好的網(wǎng)絡(luò)模型用于實(shí)際地震數(shù)據(jù)噪聲壓制[24-25]。第一類方法制作的標(biāo)簽數(shù)據(jù)并不太準(zhǔn)確,因此會(huì)影響網(wǎng)絡(luò)模型的去噪性能。第二類方法制作的標(biāo)簽數(shù)據(jù)雖然準(zhǔn)確,但是合成數(shù)據(jù)與實(shí)際地震數(shù)據(jù)差異大,影響網(wǎng)絡(luò)模型的泛化能力?;跇?biāo)簽數(shù)據(jù)的深度學(xué)習(xí)方法取得了良好的去噪效果,但是在制作復(fù)雜而龐大的訓(xùn)練集上也會(huì)浪費(fèi)大量的資源。因此,開發(fā)不依賴于標(biāo)簽數(shù)據(jù)的無監(jiān)督學(xué)習(xí)方法對(duì)于地震數(shù)據(jù)噪聲壓制具有重要意義。
為了改善地震數(shù)據(jù)的噪聲壓制效果,本文提出了一種基于卷積降噪自編碼器的地震噪聲壓制算法。該算法基于無監(jiān)督學(xué)習(xí),能夠直接從含噪的地震數(shù)據(jù)中恢復(fù)無噪的地震數(shù)據(jù),省去了標(biāo)注數(shù)據(jù)所需的大量工作。
自編碼器屬于無監(jiān)督學(xué)習(xí),它利用反向傳播算法對(duì)無標(biāo)簽的輸入數(shù)據(jù)進(jìn)行重構(gòu)。典型的自編碼器如圖1所示,可以看出它包括兩部分:編碼框架和解碼框架。編碼框架負(fù)責(zé)將輸入數(shù)據(jù)映射為潛在空間的特征表達(dá),解碼框架則負(fù)責(zé)將特征表達(dá)解碼為與原始輸入數(shù)據(jù)相近的輸出數(shù)據(jù)。自編碼器的目標(biāo)是使輸出數(shù)據(jù)盡可能等于其輸入數(shù)據(jù),但是它不能有效提取地震數(shù)據(jù)特征。對(duì)于無標(biāo)簽的輸入數(shù)據(jù),自編碼器按以下方式重建輸入數(shù)據(jù)
H=ξθ1(P)=σ(W1P+b1)
(1)
Q=ξθ2(H)=σ(W2H+b2)
(2)
式中:P、H與Q分別為輸入數(shù)據(jù)、特征表達(dá)、輸出數(shù)據(jù);σ為sigmoid激活函數(shù);W1與b1分別為輸入層與隱藏層之間的權(quán)重矩陣與偏置;W2與b2分別為隱藏層與輸出層之間的權(quán)重矩陣與偏置;θ1=[W1,b1]和θ2=[W2,b2]分別為編碼參數(shù)和解碼參數(shù);ξθ1(P)和ξθ2(H)分別為編碼函數(shù)和解碼函數(shù)。
模型訓(xùn)練的目的是為了優(yōu)化模型參數(shù)[θ1,θ2],使重建數(shù)據(jù)Q與輸入數(shù)據(jù)P盡可能地接近,即
圖1 自編碼器模型示意圖
(3)
式中L(·)表示L2范數(shù),用于衡量Q與P之間的重構(gòu)誤差。
降噪自編碼器是自編碼器的一個(gè)變體。與自編碼器不同的是,降噪自編碼器通過訓(xùn)練損壞的輸入數(shù)據(jù)進(jìn)行特征學(xué)習(xí),其核心思想是提取數(shù)據(jù)的魯棒性特征。典型的降噪自編碼器如圖2所示,可以看出,降噪自編碼器與自編碼器對(duì)輸入層的處理不同,降噪自編碼器按照一定的概率將輸入節(jié)點(diǎn)置0,如果這種損壞的概率為0,降噪自編碼器就退化為自編碼器。
圖2 降噪自編碼器模型示意圖
為了定性地比較這兩種自編碼器的學(xué)習(xí)效果,分別設(shè)計(jì)了對(duì)應(yīng)的兩種自編碼器網(wǎng)絡(luò),網(wǎng)絡(luò)層數(shù)設(shè)置為3,其中隱藏層單元數(shù)為64,并將這兩種自編碼器輸入層與隱層之間的權(quán)重矩陣進(jìn)行可視化,結(jié)果如圖3所示。從圖3可以看出,自編碼器訓(xùn)練后得到的權(quán)重是雜亂的,含有大量噪聲,而降噪自編碼器訓(xùn)練后得到的權(quán)重含有明顯的結(jié)構(gòu)特征,噪聲較弱(這兩種自編碼器的輸入數(shù)據(jù)均來源于本文實(shí)驗(yàn)部分的合成數(shù)據(jù),權(quán)重尺寸為48×48,降噪自編碼器的損壞程度為60%)??梢钥闯觯翟胱跃幋a器能夠提取、編碼出具有魯棒性的特征,具有很強(qiáng)的網(wǎng)絡(luò)表達(dá)能力。
圖3 自編碼器(a)和降噪自編碼器(b)的權(quán)重矩陣可視化結(jié)果
全連接形式的降噪自編碼器的輸入是一維形式,因此對(duì)圖像處理存在局限性。在圖像中,局部的像素聯(lián)系較為緊密,相距較遠(yuǎn)的像素關(guān)聯(lián)性不大,而全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)里下層神經(jīng)元與所有上層神經(jīng)元都能夠形成連接,促使網(wǎng)絡(luò)學(xué)習(xí)圖像全局結(jié)構(gòu),忽略了圖像的局部相關(guān)性,同時(shí)造成了參數(shù)糅雜。近年來,卷積神經(jīng)網(wǎng)絡(luò)在圖像處理方面應(yīng)用廣泛,這歸因于它能夠通過卷積核捕獲原始圖像中的局部特征,并且卷積核權(quán)重共享,大大減少了參數(shù)量。卷積形式的降噪自編碼器在圖像處理方面已經(jīng)取得了不錯(cuò)的效果,但還未被用于地震數(shù)據(jù)去噪。
本文設(shè)計(jì)的卷積降噪自編碼器如圖4所示。使用3層卷積層和池化層作為編碼框架,3層上采樣層和卷積層作為解碼框架。在編碼框架中,卷積層作為特征提取層,用于捕捉地震數(shù)據(jù)波形特征,而池化層作為特征壓縮層,一方面能夠減小特征圖的尺寸,降低網(wǎng)絡(luò)計(jì)算量; 另一方面能夠提取重要的地震數(shù)據(jù)特征,有效降低噪聲成分。本文將每層卷積層設(shè)置24個(gè)卷積核,卷積核的移動(dòng)步長(zhǎng)設(shè)置為1。因此,48×48×1的地震數(shù)據(jù)經(jīng)過編碼框架以后就被壓縮為6×6×24的壓縮特征表達(dá)。壓縮特征表達(dá)保留了地震數(shù)據(jù)最重要的信息,但是丟失了大量細(xì)節(jié)信息。因此,解碼框架承擔(dān)著擴(kuò)大特征圖與恢復(fù)地震數(shù)據(jù)細(xì)節(jié)信息的任務(wù)。
圖4 卷積降噪自編碼器模型
地震數(shù)據(jù)的特征復(fù)雜,具有多尺度特征,而單一尺寸的卷積核只能學(xué)習(xí)到特定尺度的特征。因此,本文設(shè)計(jì)了多尺度卷積模塊,一個(gè)多尺度模塊相當(dāng)于三個(gè)卷積核,如圖5所示。多尺度卷積模塊就是將不同大小的卷積核構(gòu)成的網(wǎng)絡(luò)并聯(lián)起來,既有效解決了卷積核大小的選擇問題,又能夠有效捕捉地震數(shù)據(jù)的復(fù)雜特征。
圖5 多尺度卷積模塊
本文使用數(shù)據(jù)分塊的訓(xùn)練方式去噪。即采用一個(gè)固定尺寸的窗口對(duì)地震數(shù)據(jù)進(jìn)行滑移,窗口按固定的滑移步長(zhǎng)每滑移一次,產(chǎn)生一個(gè)樣本數(shù)據(jù)。窗口尺寸代表了樣本數(shù)據(jù)的尺寸,窗口尺寸一旦確定,滑移步長(zhǎng)就決定了樣本數(shù)據(jù)的數(shù)量。首先,分塊訓(xùn)練的方式較好地適應(yīng)了地震數(shù)據(jù)的關(guān)鍵信息只與局部數(shù)據(jù)有關(guān),避免了在訓(xùn)練過程中計(jì)算資源的浪費(fèi); 其次,該訓(xùn)練策略會(huì)產(chǎn)生大量的樣本數(shù)據(jù),有利于訓(xùn)練出良好的模型參數(shù)。在本文實(shí)驗(yàn)中,將窗口尺寸設(shè)置為48×48,滑移步長(zhǎng)設(shè)置為4。由于無監(jiān)督學(xué)習(xí)的性質(zhì),本文實(shí)驗(yàn)不需要單獨(dú)的訓(xùn)練集訓(xùn)練模型參數(shù),模型參數(shù)的更新是通過對(duì)原始含噪數(shù)據(jù)的自我學(xué)習(xí)完成,利用早停止原則控制模型訓(xùn)練的結(jié)束。
使用合成地震數(shù)據(jù)與實(shí)際地震數(shù)據(jù)測(cè)試本文方法的去噪性能,并與多道奇異值分析(MSSA)[26]、小波變換[27]、f-x反褶積[3]等方法進(jìn)行對(duì)比。其中小波變換采用bior2.4小波基,f-x反褶積預(yù)測(cè)濾波器的長(zhǎng)度設(shè)置為6,MSSA要保留的奇異值數(shù)量設(shè)置為5。
合成地震數(shù)據(jù)(圖6a)共88道,每道468個(gè)樣點(diǎn),采樣間隔為1ms。該合成數(shù)據(jù)包含線性同相軸、曲線同相軸、間斷同相軸以及斷層;當(dāng)加入噪聲后(圖6b),同相軸的連續(xù)性變差。使用信噪比(SNR)定量地評(píng)價(jià)不同方法的去噪性能
(4)
式中dclean和ddenoise分別表示無噪地震數(shù)據(jù)與去噪后的地震數(shù)據(jù)。加噪合成地震數(shù)據(jù)的SNR為2.04dB。
由于網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性,首先測(cè)試卷積層數(shù)、卷積核數(shù)量、卷積核尺寸以及輸入數(shù)據(jù)的損壞程度對(duì)去噪結(jié)果的影響。
(1)卷積層數(shù)。將卷積層數(shù)從2增加到8,合成數(shù)據(jù)去噪后的SNR測(cè)試結(jié)果如圖7a所示。可見隨著層數(shù)的增加,信噪比先增加后降低; 當(dāng)卷積層數(shù)為6時(shí),網(wǎng)絡(luò)去噪性能最佳,因此將卷積層數(shù)設(shè)置為6。
圖6 合成地震數(shù)據(jù)(a)及其加噪結(jié)果(b)
(2)卷積核數(shù)量。將卷積核數(shù)量從6增加到72,合成數(shù)據(jù)去噪后的SNR測(cè)試結(jié)果如圖7b所示??梢姡?dāng)卷積核數(shù)量為24時(shí)網(wǎng)絡(luò)去噪性能最佳,因此將卷積核數(shù)量設(shè)置為24。
(3)卷積核尺寸。將卷積核尺寸設(shè)置為3×3、5×5、7×7或三者的組合,合成數(shù)據(jù)去噪后的SNR測(cè)試結(jié)果如圖7c所示??梢姡喑叨鹊木矸e核能夠獲得更優(yōu)的去噪結(jié)果,因此本文采用多尺度卷積核。
(4)輸入數(shù)據(jù)的損壞程度。本文測(cè)試了輸入數(shù)據(jù)的損壞程度對(duì)去噪結(jié)果的影響,其結(jié)果如圖7d所示。由圖7d可知,對(duì)輸入數(shù)據(jù)進(jìn)行一定程度地?fù)p壞可以實(shí)現(xiàn)更好的去噪性能。根據(jù)測(cè)試結(jié)果,本文將輸入數(shù)據(jù)的損壞程度設(shè)置為60%。
圖7 網(wǎng)絡(luò)參數(shù)對(duì)去噪性能的影響
上述四種網(wǎng)絡(luò)參數(shù)確定之后,運(yùn)行該網(wǎng)絡(luò)可獲得最終的去噪結(jié)果,并與MSSA、小波變換和f-x反褶積等去噪方法進(jìn)行比較(圖8)。由圖8可見: MSSA、f-x反褶積法去噪不足,去噪剖面上含有明顯的殘余噪聲,且MSSA法去噪剖面的間斷點(diǎn)不清晰; 小波變換法去噪剖面上無明顯殘留噪聲,但同相軸能量不穩(wěn)定; 本文方法的去噪剖面上基本無噪聲殘留、同相軸能量更穩(wěn)定、間斷點(diǎn)更清晰。
圖8 合成數(shù)據(jù)不同方法的去噪結(jié)果對(duì)比
為了比較四種去噪方法的保幅性,計(jì)算了四種去噪方法的殘差剖面(圖9)。小波變換與f-x反褶積法的殘差剖面上有明顯的有效信號(hào)痕跡,表明有效信號(hào)損失嚴(yán)重,而本文去噪方法的殘差剖面上有效信號(hào)的痕跡不明顯,有效信號(hào)損失最小,說明本文方法有良好的保幅效果。從平均振幅譜(圖10)上可以看出,本文方法去噪結(jié)果的平均振幅譜最接近于原始信號(hào)的平均振幅譜,所以本文方法在去除噪聲的同時(shí)能夠最大程度地保護(hù)有效信號(hào)不受損失。
圖9 合成數(shù)據(jù)不同方法去噪的殘差剖面
圖10 合成數(shù)據(jù)不同方法去噪結(jié)果的平均振幅譜
為了定量比較四種方法的去噪性能,分別計(jì)算了不同方法去噪結(jié)果的信噪比。MSSA、小波變換、f-x反褶積和本文方法的去噪結(jié)果的信噪比分別為11.46、12.26、12.41、16.32dB。圖11為在不同噪聲水平下的四種方法去噪結(jié)果的信噪比,可見四種方法去噪之后信噪比都會(huì)得到一定的提升,但本文方法始終保持最高的信噪比,說明本文方法有更強(qiáng)的魯棒性。
圖11 不同噪聲水平下四種方法去噪結(jié)果的信噪比
選取一段明顯被隨機(jī)噪聲污染的實(shí)際地震剖面(圖12)測(cè)試各種方法的去噪能力。該地震數(shù)據(jù)共120道地震道,單道含548個(gè)采樣數(shù),采樣間隔為1ms。由圖12可以看出,該地震數(shù)據(jù)含有曲線同相軸以及斷層構(gòu)造,但受噪聲干擾嚴(yán)重,同相軸連續(xù)性較差,弱信號(hào)識(shí)別困難。使用與合成數(shù)據(jù)去噪相同的網(wǎng)絡(luò)模型,并重新訓(xùn)練用于實(shí)際地震數(shù)據(jù)去噪。MSSA、小波變換、f-x反褶積和本文方法去噪所耗時(shí)間分別為0.22s、0.07s、0.08s、515.86s。圖13為四種方法實(shí)際地震數(shù)據(jù)的去噪結(jié)果。小波變換法去噪后的地震剖面分辨率低,同相軸不清晰。與其他方法相比,f-x反褶積法去噪后的地震剖面中殘留的噪聲更多。MSSA法的去噪結(jié)果中無明顯噪聲殘留,但損失了某些局部細(xì)節(jié)。本文方法去噪結(jié)果含有更豐富的局部細(xì)節(jié),無明顯噪聲殘留,同相軸清晰連續(xù)。圖14為四種方法對(duì)應(yīng)的殘差剖面,MSSA、小波變換和f-x反褶積方法的殘差剖面上含有明顯的有效信號(hào)的痕跡,因此這三種傳統(tǒng)去噪方法在壓制隨機(jī)噪聲的同時(shí)損失了部分有效信號(hào)。而本文方法的殘差剖面上無明顯有效信號(hào)的痕跡,說明本文方法在處理實(shí)際資料時(shí)具有良好的保幅特性。
圖12 實(shí)際地震剖面
圖13 實(shí)際地震剖面四種方法的去噪結(jié)果
圖14 實(shí)際地震數(shù)據(jù)四種去噪方法的殘差剖面
為了有效地壓制地震隨機(jī)噪聲,本文提出了基于卷積降噪自編碼器的地震數(shù)據(jù)去噪方法。該方法利用卷積降噪自編碼器的特性從含噪的地震數(shù)據(jù)中自適應(yīng)地學(xué)習(xí)地震信號(hào)的特征,從而濾除較強(qiáng)的隨機(jī)噪聲。由于使用無監(jiān)督學(xué)習(xí),本文的去噪方法不需要標(biāo)注無噪的地震數(shù)據(jù),可以更加靈活應(yīng)用。合成數(shù)據(jù)和實(shí)際數(shù)據(jù)的應(yīng)用結(jié)果表明,與MSSA、小波變換、f-x反褶積方法相比,本文方法去噪效果最好。
然而,本文方法雖保證了去噪效果,但效率較低,如何提高計(jì)算效率需進(jìn)一步研究。