邵婕,王一博*,梁興,薛清峰,梁恩茂,史樹有
1 中國科學(xué)院地質(zhì)與地球物理研究所, 北京 100029 2 中國科學(xué)院地球科學(xué)研究院,北京 100029 3 中國石油天然氣股份有限公司浙江油田分公司,杭州 311100 4 北京辰安科技股份有限公司,北京 100094
分布式光纖聲波傳感器(Distributed Fiber-optic Acoustic Sensing,DAS)是近年來新發(fā)展起來的,利用獨特的分布式光纖探測技術(shù)對沿光纖傳輸路徑上的空間分布和隨時間變化的振動信息進(jìn)行測量或監(jiān)測的一種振動數(shù)據(jù)觀測儀器,它基于光纖背向瑞利散射的原理,利用光纖作為傳感器對地震信號進(jìn)行采集.相比常規(guī)地震檢波器,DAS具有低成本、高密度、高靈敏度、高效施工及可長期監(jiān)測傳輸?shù)葍?yōu)點,已在結(jié)構(gòu)監(jiān)測、滲漏探測、交通運輸、安全系統(tǒng)、油氣勘探及天然地震等領(lǐng)域引起了人們的廣泛關(guān)注(李彥鵬等,2020;張麗娜等,2020;隋微波等,2021;Xu et al.,2021;周小慧等,2021).然而,這種新的地震數(shù)據(jù)采集技術(shù)也為DAS數(shù)據(jù)的后續(xù)應(yīng)用帶來了新的問題.以DAS在井中地震勘探中的應(yīng)用為例,光纖電纜懸置在套管內(nèi),在這種情況下,光纖和地層的耦合效果差.套管內(nèi)自由懸掛的電纜拍打和振鈴會導(dǎo)致采集的數(shù)據(jù)中存在著相干耦合噪聲,記錄的地震數(shù)據(jù)顯示出條紋或之字形的特征圖案.此外,受隨機(jī)噪聲的影響,導(dǎo)致最終采集的套管井中懸置光纜DAS地震數(shù)據(jù)的信噪比很低,嚴(yán)重影響了DAS數(shù)據(jù)的后續(xù)應(yīng)用.因此,研究針對DAS地震數(shù)據(jù)的噪聲壓制技術(shù),提高數(shù)據(jù)信噪比,對提高后續(xù)的數(shù)據(jù)處理效果十分重要.
地震數(shù)據(jù)的噪聲壓制方法有很多,傳統(tǒng)的去噪方法利用了有效信號和噪聲在時空域或變換域內(nèi)的差異,實現(xiàn)了增強(qiáng)有效信號及壓制噪聲的目的.時空域去噪方法包括:多項式擬合(Liu et al.,2011;李向云,2013)、中值濾波(王偉等,2012)及各向異性擴(kuò)散濾波(張爾華等,2010)等.時空域去噪方法的去噪效果通常較為有限,尤其當(dāng)數(shù)據(jù)的信噪比較低時,去噪效果較差.變換域內(nèi)的去噪方法包括:基于小波變換(Mousavi et al.,2016)、S變換(李雪英和侯相輝,2011)、曲波變換(彭才等,2008)及seislet變換(Liu et al.,2015;張雅晨等,2019)等不同變換的去噪方法.這類方法是借助于各類數(shù)學(xué)變換方法將地震信號變換到變換域,然后利用有效信號和噪聲在變換域內(nèi)的差異,實現(xiàn)了二者的分離.另外,信號稀疏表示理論(Candèsand Demanet,2005)的發(fā)展促使了基于稀疏表示的地震噪聲壓制方法得到廣泛應(yīng)用(劉璐等,2021).它假設(shè)信號在某種變換的作用下是稀疏的,噪聲是非稀疏的,從而有效地實現(xiàn)信噪分離.對于稀疏表示中的數(shù)學(xué)變換,除了采用傳統(tǒng)的傅里葉變換、小波變換及曲波變換等,也可以通過字典學(xué)習(xí)方法(Zhu et al.,2015;Pilikos and Faul,2017;Shao et al.,2019),直接從輸入數(shù)據(jù)中學(xué)習(xí)數(shù)據(jù)本身的稀疏表達(dá)方式,從而適應(yīng)地震數(shù)據(jù)的非穩(wěn)態(tài)特征,提高去噪效果.Chen等(2019)研究了基于稀疏表示理論的DAS耦合噪聲壓制方法,根據(jù)有效信號和噪聲在形態(tài)結(jié)構(gòu)上的差異,分別采用小波變換和離散余弦變換表示有效信號和噪聲,實現(xiàn)二者的分離.
傳統(tǒng)的去噪方法雖然在一定程度上可以壓制噪聲,但大多數(shù)傳統(tǒng)方法的參數(shù)選取都依賴于先驗知識,這不僅影響著最終的去噪效果,當(dāng)工區(qū)內(nèi)的數(shù)據(jù)量很大時,也降低了地震數(shù)據(jù)的處理效率.近年來,人工智能方法在地震數(shù)據(jù)處理和解釋中的應(yīng)用逐漸廣泛,如基于深度學(xué)習(xí)的地震數(shù)據(jù)初至拾取、插值、去噪、斷層識別及儲層預(yù)測等.相比于傳統(tǒng)的去噪方法,基于深度學(xué)習(xí)的去噪方法通過各種不同的網(wǎng)絡(luò)結(jié)構(gòu),對大量的數(shù)據(jù)進(jìn)行訓(xùn)練,可以自動地深入挖掘出數(shù)據(jù)所包含的特征,從而有效地表示地震數(shù)據(jù)中的有效信號,壓制噪聲(Zhao et al.,2020).Liu等(2020)提出了基于三維卷積神經(jīng)網(wǎng)絡(luò)(3-D-DnCNN)的噪聲壓制方法,可以同時壓制三維疊后地震數(shù)據(jù)中的隨機(jī)噪聲和弧狀成像噪聲.董新桐等(2021)提出了基于正演模型驅(qū)動的卷積神經(jīng)網(wǎng)絡(luò)去噪方法(FMA-CNN),通過正演模擬構(gòu)建了高真實性的無噪聲地震數(shù)據(jù)集,利用該數(shù)據(jù)集以及實際DAS隨機(jī)噪聲數(shù)據(jù)集引導(dǎo)網(wǎng)絡(luò)訓(xùn)練,從而有效地實現(xiàn)DAS地震數(shù)據(jù)的隨機(jī)噪聲壓制.上述方法在網(wǎng)絡(luò)訓(xùn)練的過程中,需要提供大量的無噪聲數(shù)據(jù)作為標(biāo)簽數(shù)據(jù),然后將其與對應(yīng)的含噪聲數(shù)據(jù)進(jìn)行成組標(biāo)記,人工標(biāo)記工作量巨大.對于實際地震數(shù)據(jù)而言,無噪聲數(shù)據(jù)通常很難直接獲取.對此,可以將傳統(tǒng)去噪方法處理后的結(jié)果作為標(biāo)簽數(shù)據(jù),但這會導(dǎo)致標(biāo)簽數(shù)據(jù)不準(zhǔn)確,從而影響了訓(xùn)練網(wǎng)絡(luò)的去噪效果(Li et al.,2021;陳文超等,2021;Liu et al.,2022).另外,也可以采用正演模擬的方式產(chǎn)生無噪聲數(shù)據(jù),但這會導(dǎo)致模擬的數(shù)據(jù)難以表征復(fù)雜實際數(shù)據(jù)的特征,從而影響了訓(xùn)練網(wǎng)絡(luò)的泛化能力.
本文將孿生網(wǎng)絡(luò)方法應(yīng)用于人工震源分布式光纖聲波傳感數(shù)據(jù)中的隨機(jī)噪聲壓制.基于孿生網(wǎng)絡(luò)的基本思想,該方法采用了U-Net網(wǎng)絡(luò)建立深度學(xué)習(xí)框架,包括輸入層、編碼器、解碼器和輸出層四部分.參與訓(xùn)練的輸入數(shù)據(jù)只需要含噪聲的原始數(shù)據(jù),不再需要利用無噪聲數(shù)據(jù)對原始的含噪聲數(shù)據(jù)進(jìn)行標(biāo)記.訓(xùn)練后的網(wǎng)絡(luò)可直接應(yīng)用于含噪聲數(shù)據(jù)的去噪處理,為實際地震數(shù)據(jù)去噪處理帶來了便利.最終,采用合成數(shù)據(jù)和實際資料驗證了本文所研究方法的有效性.
實際采集的地震數(shù)據(jù)中通常包含了部分噪聲,假設(shè)y為含噪聲的地震數(shù)據(jù),則它可以表示為
y=x+n,
(1)
其中,x為無噪聲的有效信號,n為噪聲.傳統(tǒng)的監(jiān)督學(xué)習(xí)去噪網(wǎng)絡(luò)需要含噪聲數(shù)據(jù)y和無噪聲數(shù)據(jù)x作為標(biāo)簽數(shù)據(jù),然后將成對的輸入數(shù)據(jù)(y,x)輸入網(wǎng)絡(luò)f進(jìn)行訓(xùn)練,獲得將含噪聲數(shù)據(jù)y映射為無噪聲有效信號x的最佳網(wǎng)絡(luò)參數(shù)θ,從而實現(xiàn)去噪目的.監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練的目標(biāo)函數(shù)為
(2)
在實際應(yīng)用中,無噪聲數(shù)據(jù)通常很難獲得,尤其是對于分布式光纖地震數(shù)據(jù)而言,高信噪比數(shù)據(jù)的數(shù)據(jù)量往往很少.通過正演模擬方式獲得的地震有效信號難以全面地表征實際有效信號的特征,從而影響最終訓(xùn)練網(wǎng)絡(luò)的泛化能力.此外,大量的正演模擬也給實際應(yīng)用帶來了極大的不便.
如果能只使用含噪聲數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,則會有效地克服傳統(tǒng)監(jiān)督學(xué)習(xí)去噪網(wǎng)絡(luò)在實際地震數(shù)據(jù)去噪應(yīng)用中的瓶頸.為此,假設(shè)噪聲的均值為0,則給定自監(jiān)督網(wǎng)絡(luò)訓(xùn)練的目標(biāo)函數(shù)如下(Xie et al.,2020):
-f(yJc;θ)J‖2/|J|]1/2,
(3)
其中,E表示對數(shù)據(jù)取均值,m表示輸入數(shù)據(jù)y的空間維度,J可作為一個mask算子,通過它可以獲得數(shù)據(jù)的某一個子集(如圖1所示),|J1|+…+|Jk|=m,JC表示J在m中的補(bǔ)集,f(·)J表示f(·)在J上的取值,yJc表示y在JC上的取值.
從公式(3)的目標(biāo)函數(shù)可以看出,該網(wǎng)絡(luò)在訓(xùn)練時需要含噪聲數(shù)據(jù)y和由數(shù)據(jù)y經(jīng)mask算子作用后的yJc(如圖1所示),無需再使用無噪聲數(shù)據(jù).因此,它屬于自監(jiān)督網(wǎng)絡(luò).為此,基于孿生網(wǎng)絡(luò)的思想,采用U-Net網(wǎng)絡(luò)建立如圖1所示的深度學(xué)習(xí)去噪網(wǎng)絡(luò).該網(wǎng)絡(luò)由輸入層、編碼器、解碼器和輸出層4個部分組成.原始的輸入數(shù)據(jù)首先經(jīng)過兩個卷積層,每一個卷積層包含了4個濾波器,步長為1.編碼器由4組下采樣層和卷積層構(gòu)成.編碼器中所有的下采樣層都具有反假頻特征(Zhang,2019),以避免下采樣過程中的假頻影響.每個下采樣層后都有兩個卷積層,各組卷積層中的濾波器數(shù)量逐漸加倍,即分別為8、16、32、64.解碼器由4組上采樣層、拼接層和卷積層構(gòu)成.在解碼器中,每一組都包含一個上采樣層和拼接層及兩個卷積層,各組卷積層中的濾波器數(shù)量逐漸減少,即分別為32、16、8、4.最終的輸出層是由濾波器和線性激活函數(shù)構(gòu)成的卷積層.建立的網(wǎng)絡(luò)中所有卷積層的卷積核大小均為3×5.
圖1 去噪網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Structure of the denoising network
為了驗證本文提出的基于孿生網(wǎng)絡(luò)的DAS數(shù)據(jù)去噪方法的有效性,首先采用合成數(shù)據(jù)進(jìn)行測試.通過正演模擬獲得了原始無噪聲的人工震源井中分布式光纖數(shù)據(jù),每炮數(shù)據(jù)共有50道,每道數(shù)據(jù)的時間采樣點數(shù)為2048,數(shù)據(jù)中包含了P波和S波,且S波的能量明顯強(qiáng)于P波.在原始無噪聲數(shù)據(jù)中加入信噪比值分布在-20~10 dB范圍內(nèi)的隨機(jī)噪聲,最終獲得用于網(wǎng)絡(luò)訓(xùn)練的含噪聲數(shù)據(jù)共4288炮.圖2展示了訓(xùn)練集中的部分地震數(shù)據(jù),不同炮數(shù)據(jù)間的地震波波形、振幅、相位、同相軸的斜率及信噪比等特征各不相同.選取其中80%的數(shù)據(jù)(共3424炮)作為訓(xùn)練集,用于進(jìn)行去噪網(wǎng)絡(luò)訓(xùn)練,獲得實現(xiàn)最佳去噪效果的各網(wǎng)絡(luò)參數(shù)值.為了分析和驗證訓(xùn)練網(wǎng)絡(luò)的去噪效果,選取其中20%的數(shù)據(jù)(共864炮)作為驗證集.在合成數(shù)據(jù)的網(wǎng)絡(luò)訓(xùn)練時,設(shè)置批大小(batch size)為32,時期次數(shù)(epoch)為5000,圖3為合成數(shù)據(jù)進(jìn)行去噪網(wǎng)絡(luò)訓(xùn)練時損失函數(shù)值隨時期次數(shù)的變化曲線.
圖3 合成數(shù)據(jù)去噪網(wǎng)絡(luò)訓(xùn)練的收斂曲線Fig.3 Convergence curve of denoising network training for synthetic data
在訓(xùn)練獲得去噪網(wǎng)絡(luò)的最優(yōu)參數(shù)后,選取如圖4所示的數(shù)據(jù)測試訓(xùn)練網(wǎng)絡(luò)的去噪效果.該數(shù)據(jù)的特征與參與網(wǎng)絡(luò)訓(xùn)練的數(shù)據(jù)特征相似,即數(shù)據(jù)中包含了P波(黑色箭頭所示)和S波(藍(lán)色箭頭所示),且S波的能量明顯強(qiáng)于P波.不同之處在于地震波波形、振幅、相位及同相軸的斜率特征.在原始數(shù)據(jù)中分別加入信噪比為9.03 dB、0 dB和-6.99 dB的隨機(jī)噪聲,然后將訓(xùn)練的網(wǎng)絡(luò)參數(shù)直接應(yīng)用于不同信噪比的含噪數(shù)據(jù),獲得的去噪結(jié)果及去除的噪聲分別如圖5、6、7所示.
圖4 無噪聲的井中分布式光纖合成數(shù)據(jù)Fig.4 Synthetic downhole DAS data without noise
當(dāng)含噪聲數(shù)據(jù)的信噪比較高時(SNR=9.03 dB),仍可以識別出含噪數(shù)據(jù)中的弱能量P波,如圖5a所示.在這種情況下,訓(xùn)練的網(wǎng)絡(luò)可以完全地壓制原始數(shù)據(jù)中的噪聲,去噪的結(jié)果(如圖5b所示)與真實數(shù)據(jù)幾乎相同,去噪后數(shù)據(jù)的信噪比為20.37 dB.但去除的噪聲中殘留了部分S波能量,如圖5c所示.這主要是由于訓(xùn)練網(wǎng)絡(luò)無法有效地恢復(fù)地震有效信號的振幅導(dǎo)致的.從網(wǎng)絡(luò)訓(xùn)練的目標(biāo)函數(shù)可以看出,該網(wǎng)絡(luò)訓(xùn)練的主要目標(biāo)在于去除噪聲對有效信號的影響,訓(xùn)練的網(wǎng)絡(luò)無法可靠地估計有效信號的真實振幅值.當(dāng)信噪比值為中等(SNR=0 dB)時,加入噪聲后的弱能量P波完全淹沒于噪聲中,難以有效地識別出來,強(qiáng)能量的S波初至仍可識別,但后續(xù)的弱能量S波也幾乎淹沒于噪聲中,如圖6a所示.在這種情況下,噪聲仍可以被有效地壓制,弱能量的P波和后續(xù)S波都得到了較好的恢復(fù),去噪后數(shù)據(jù)的信噪比為12.73 dB,如圖6b所示,去除的噪聲如圖6c所示.當(dāng)信噪比較低(SNR=-6.99 dB)時,加入噪聲后的弱能量P波和后續(xù)的弱能量S波都已完全淹沒于強(qiáng)噪聲中,只有強(qiáng)能量的S波初至仍可識別.在這種情況下,噪聲仍得到了有效壓制,弱能量的P波和后續(xù)S波得到了部分恢復(fù),如圖7所示,去噪后數(shù)據(jù)的信噪比為6.64 dB.
為了進(jìn)一步定量地分析本文提出方法的去噪效果,我們對圖4中的數(shù)據(jù)加入了信噪比值分布在-20~40 dB范圍內(nèi)的隨機(jī)噪聲,對加入噪聲后的各數(shù)據(jù)分別進(jìn)行處理,并按照公式(4)計算了每一個信噪比情況下所有道去噪后數(shù)據(jù)和真實無噪聲數(shù)據(jù)間歸一化的均方誤差(MSE),結(jié)果如圖8所示,圖中的誤差棒由公式(5)給出,是不同道去噪后數(shù)據(jù)和真實無噪聲數(shù)據(jù)之間均方誤差的標(biāo)準(zhǔn)差(STD).
(4)
(5)
(6)
從圖8可以看出,隨著SNR的增加,由公式(4)計算的MSE值不斷減小.因此,隨著數(shù)據(jù)中噪聲的不斷減少,去噪結(jié)果和真實數(shù)據(jù)之間的差異不斷減小,去噪效果不斷變好.當(dāng)信噪比達(dá)到某一程度時,二者的差異趨于達(dá)到穩(wěn)定值.另外,隨著SNR的增加,計算結(jié)果的標(biāo)準(zhǔn)差整體也呈現(xiàn)出減小趨勢,但部分?jǐn)?shù)值會有起伏變化,如7 dB處的誤差棒較周圍其他值明顯變長.這可能是由于去噪方法無法有效地恢復(fù)地震有效信號的振幅導(dǎo)致的.
選用某地區(qū)的人工震源井中分布式光纖數(shù)據(jù)對本文所提出方法進(jìn)行進(jìn)一步測試,實際數(shù)據(jù)采集的觀測系統(tǒng)示意圖如圖9所示,光纖布設(shè)在套管外.該數(shù)據(jù)共80炮,每炮數(shù)據(jù)包含712道,每道數(shù)據(jù)的時間采樣點數(shù)為2048.由于實際數(shù)據(jù)的數(shù)據(jù)量較少,因此,我們將上述合成數(shù)據(jù)的訓(xùn)練結(jié)果作為預(yù)訓(xùn)練模型,在此基礎(chǔ)上,繼續(xù)進(jìn)行實際資料的網(wǎng)絡(luò)訓(xùn)練.這就要求合成數(shù)據(jù)應(yīng)該具有與實際數(shù)據(jù)相類似的特征,否則無法使用.如果實際數(shù)據(jù)量足夠多,則無需選用合成數(shù)據(jù)的訓(xùn)練結(jié)果作為預(yù)訓(xùn)練模型.在訓(xùn)練過程中,選取65炮數(shù)據(jù)作為訓(xùn)練集,剩余的15炮數(shù)據(jù)作為驗證集,設(shè)置批大小為32,時期次數(shù)為50.圖10為實際資料進(jìn)行網(wǎng)絡(luò)訓(xùn)練時損失函數(shù)值隨時期次數(shù)的變化曲線,可以看到,由于選用合成數(shù)據(jù)的訓(xùn)練結(jié)果作為預(yù)訓(xùn)練模型,實際數(shù)據(jù)的訓(xùn)練網(wǎng)絡(luò)能夠很快地達(dá)到收斂.從實際資料中分別選出高信噪比、中等信噪比和低信噪比三種不同情況下的去噪結(jié)果進(jìn)行分析,得到結(jié)果分別如圖11、12、13所示.從去噪結(jié)果中可以看出,訓(xùn)練的網(wǎng)絡(luò)都能較好地壓制剖面中的噪聲,去噪后的同相軸變得更加連續(xù).從去噪后的殘差剖面中可以看出,高信噪比數(shù)據(jù)的殘差剖面中包含了部分有效信號的能量,這同樣是由于訓(xùn)練網(wǎng)絡(luò)無法有效地恢復(fù)地震有效信號的振幅導(dǎo)致的.
圖8 不同信噪比時合成DAS數(shù)據(jù)的去噪效果Fig.8 The denoising result of synthetic DAS data with different SNRs
圖9 井中分布式光纖數(shù)據(jù)采集觀測系統(tǒng)示意圖Fig.9 Diagram of borehole DAS seismic data acquisition geometry
圖10 實際資料進(jìn)行去噪訓(xùn)練的收斂曲線Fig.10 Convergence curve of denoising training for field data
圖11 高信噪比實際資料去噪(a) 含噪聲數(shù)據(jù); (b) 去噪結(jié)果; (c) 去除的噪聲.Fig.11 Denoised result of field data with high SNR(a) Noisy data; (b) Denoised data; (c) The removed noise.
圖12 中等信噪比實際資料去噪(a) 含噪聲數(shù)據(jù); (b) 去噪結(jié)果; (c) 去除的噪聲.Fig.12 Denoised result of field data with medium SNR(a) Noisy data; (b) Denoised data; (c) The removed noise.
圖13 低信噪比實際資料去噪(a) 含噪聲數(shù)據(jù); (b) 去噪結(jié)果; (c) 去除的噪聲.Fig.13 Denoised result of field data with low SNR(a) Noisy data; (b) Denoised data; (c) The removed noise.
本文將孿生網(wǎng)絡(luò)應(yīng)用于人工震源分布式光纖傳感數(shù)據(jù)的去噪處理.合成數(shù)據(jù)和實際資料的處理結(jié)果表明,本文方法可以有效地壓制人工震源分布式光纖地震數(shù)據(jù)中的隨機(jī)噪聲.與傳統(tǒng)的監(jiān)督學(xué)習(xí)去噪方法不同,本文方法屬于自監(jiān)督學(xué)習(xí)方法,在網(wǎng)絡(luò)訓(xùn)練過程中,不需要使用去噪后的數(shù)據(jù)對原始含噪聲數(shù)據(jù)進(jìn)行人工標(biāo)記,這非常有利于實際應(yīng)用,可以顯著地提高實際地震數(shù)據(jù)去噪處理效率.本文方法的不足與限制在于它無法有效地恢復(fù)地震有效信號的振幅,導(dǎo)致去除的噪聲剖面中會殘留部分有效信號的能量.因此,后續(xù)仍需進(jìn)一步研究并改進(jìn)本文方法,以提高其對有效信號振幅的恢復(fù)和保護(hù)作用.
致謝感謝審稿專家對文章提出的寶貴意見,感謝編輯對文章的修改完善.