薛亞茹,蘇軍利*,馮璐瑜,張程,梁琪
(1.中國(guó)石油大學(xué)(北京)信息科學(xué)與工程學(xué)院,北京 102249;2.中國(guó)石油大學(xué)(北京)油氣資源與工程全國(guó)重點(diǎn)實(shí)驗(yàn)室,北京 102249)
地震數(shù)據(jù)往往受自然環(huán)境、采集儀器等因素的影響而被不同程度噪聲干擾,從而降低了信噪比和保真度。因此,對(duì)采集的地震數(shù)據(jù)去噪是不可或缺的重要環(huán)節(jié)。
依據(jù)地震數(shù)據(jù)特征和不同先驗(yàn)假設(shè)提出了各種去噪理論和實(shí)現(xiàn)方法,主要可分為以下幾類(lèi)。①基于預(yù)測(cè)的濾波方法,如t-x域預(yù)測(cè)濾波[1]、f-x域反褶積濾波[2]、非平穩(wěn)性預(yù)測(cè)濾波[3]等。該類(lèi)方法基于地震道之間的可預(yù)測(cè)性,適用于線(xiàn)性同相軸。②基于稀疏變換的濾波方法,如傅里葉變換[4]、小波變換[5]、曲波變換[6]等。此類(lèi)方法假設(shè)地震數(shù)據(jù)在變換域能被稀疏表征,通過(guò)抑制較小的參數(shù)值達(dá)到去噪目的,在一定程度上可以獲得良好的去噪效果,但變換域噪聲壓制的閾值等超參數(shù)難以確定。 ③矩陣降秩方法。該類(lèi)方法假設(shè)地震數(shù)據(jù)可以表征為一個(gè)低秩矩陣,隨機(jī)噪聲的存在會(huì)增加矩陣的秩,因此可以將去噪問(wèn)題轉(zhuǎn)化為低秩矩陣逼近問(wèn)題。如Cadzow 濾波[7]、奇異值分解[8]、多通道奇異譜分析(Multichannel Singular Spectrum Analysis,MSSA)[9]等方法。字典學(xué)習(xí)本質(zhì)也屬于降秩方法,它能夠從地震數(shù)據(jù)中自適應(yīng)地學(xué)習(xí)基函數(shù),從而對(duì)數(shù)據(jù)進(jìn)行稀疏表示,以便將信號(hào)與噪聲進(jìn)行分離,達(dá)到好的去噪效果[10],然而其計(jì)算成本較高,而且算法在字典更新步驟中會(huì)破壞稀疏系數(shù)的結(jié)構(gòu)。模態(tài)分解也是降秩方法之一,通過(guò)提取有限的模態(tài)分量達(dá)到信噪分離的目的,目前使用最為廣泛的有經(jīng)驗(yàn)?zāi)B(tài)分解[11]和變分模態(tài)分解[12]。
近年來(lái),隨著計(jì)算機(jī)性能的迅速提高及大數(shù)據(jù)時(shí)代的來(lái)臨,深度學(xué)習(xí)研究備受青睞。不少學(xué)者將深度學(xué)習(xí)引入到地球物理領(lǐng)域?qū)崿F(xiàn)對(duì)地震數(shù)據(jù)去噪處理[13-15]。最初的研究多是采用有監(jiān)督深度學(xué)習(xí)模型,相較于依賴(lài)先驗(yàn)信息的傳統(tǒng)算法,有監(jiān)督模型在地震數(shù)據(jù)去噪和插值方面表現(xiàn)出了優(yōu)異的性能[16-18],但是海量高質(zhì)量標(biāo)簽數(shù)據(jù)的獲取,無(wú)疑增加了人工和計(jì)算成本。因此,無(wú)監(jiān)督學(xué)習(xí)受到了廣泛關(guān)注?;跓o(wú)監(jiān)督學(xué)習(xí)的自編碼網(wǎng)絡(luò)模型通過(guò)對(duì)輸入數(shù)據(jù)編碼壓縮和解碼重構(gòu)達(dá)到去噪的目的[19-20]。Zhang 等[21]通過(guò)對(duì)網(wǎng)絡(luò)中間層加入稀疏約束提高網(wǎng)絡(luò)去噪性能;Yang等[22]提出了一種全連接型深度去噪無(wú)監(jiān)督網(wǎng)絡(luò)用于三維地震數(shù)據(jù)噪聲壓制;Saad等[23]將無(wú)監(jiān)督網(wǎng)絡(luò)用于增強(qiáng)微地震信號(hào)和壓制隨機(jī)噪聲,通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行切片操作,初步減小輸入數(shù)據(jù)的維度,之后利用自編碼網(wǎng)絡(luò)實(shí)現(xiàn)信噪分離。為了強(qiáng)化網(wǎng)絡(luò)對(duì)地震數(shù)據(jù)高階特征的學(xué)習(xí)能力,在編碼器和解碼器之間加入跳躍連接,使得解碼器在獲得全局特征的同時(shí)可以融入編碼器提取的局部特征[24]。考慮到疊前地震資料經(jīng)動(dòng)校正(NMO)后具有較高的自相似性,Liu 等[25]提出了一種基于無(wú)監(jiān)督深度學(xué)習(xí)壓制面波的方法,將經(jīng)過(guò)動(dòng)校正后的地震數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入,利用UNet 型卷積網(wǎng)絡(luò)提取數(shù)據(jù)特征,從而達(dá)到信噪分離的目的。
上述基于神經(jīng)網(wǎng)絡(luò)的地震數(shù)據(jù)去噪方法大多在時(shí)空域完成。將地震數(shù)據(jù)剖分成小的時(shí)空切片[24],利用切片之間的相似性[25],通過(guò)神經(jīng)網(wǎng)絡(luò)提取有效信號(hào)特征,實(shí)現(xiàn)信噪分離。此類(lèi)方法將數(shù)據(jù)切分,未曾考慮切片之間的連續(xù)性,也未考慮三維數(shù)據(jù)體之間的相關(guān)性。地震數(shù)據(jù)在頻域是可預(yù)測(cè)的,MSSA 法利用該特性實(shí)現(xiàn)噪聲壓制和數(shù)據(jù)重構(gòu)[9],并能夠較好地保持橫向連續(xù)性,但該方法需要構(gòu)建大型Hankel 矩陣,計(jì)算量大;同時(shí)基于奇異值分解理論的壓縮去噪方法提取的地震數(shù)據(jù)特征是相互正交的,對(duì)信號(hào)進(jìn)行稀疏表征的程度有限,而且有效信號(hào)秩的優(yōu)選也比較困難。
本文提出一種頻域降秩的深度學(xué)習(xí)去噪方法。首先分析三維地震數(shù)據(jù)體的低秩特性,利用奇異值分解理論指導(dǎo)自編碼網(wǎng)絡(luò)的建立;針對(duì)頻域噪聲分布特征,引入K-L(Kullback-Leibler)散度優(yōu)化損失函數(shù)。合成記錄和實(shí)際地震資料處理結(jié)果表明,本文方法在隨機(jī)噪聲壓制效果和處理效率等方面均優(yōu)于MSSA和K-SVD(K-奇異值分解)方法。
地震勘探通過(guò)多炮激發(fā)實(shí)現(xiàn)地下構(gòu)造反射成像。為提高成像精度,震源在探區(qū)多次激發(fā),構(gòu)成了炮點(diǎn)坐標(biāo)(xs,ys)、檢波點(diǎn)坐標(biāo)(xr,yr)及時(shí)間t的五維地震數(shù)據(jù),可表示為d(xs,ys,xr,yr,t)。為方便解釋?zhuān)疚囊砸粭l測(cè)線(xiàn)的炮集為例進(jìn)行分析,但同樣適用其他三維數(shù)據(jù)體。假設(shè)地層是水平層狀介質(zhì),第k炮數(shù)據(jù)可表示為dk(xs,xr,t),則第k+1炮記錄可表示為
式中:Δxs為炮間距;p為射線(xiàn)參數(shù)。變換到頻率域,有
由上式可知,相鄰炮記錄之間的頻譜僅有線(xiàn)性相位差s=exp(-i2πfpΔxs)。對(duì)某個(gè)頻率而言,各炮數(shù)據(jù)構(gòu)成低秩矩陣,可以表示為
式中:n為檢波點(diǎn)個(gè)數(shù);m為炮數(shù)。由此可以看到該矩陣的秩是1,也就是說(shuō)各炮記錄是相似的。但是考慮到實(shí)際地層并非水平,也并非各向同性,上述矩陣秩不一定是1,但仍滿(mǎn)足低秩假設(shè),因此對(duì)于三維地震數(shù)據(jù), 其頻率切片滿(mǎn)足低秩特征。
M的奇異值分解可表示為
式中:r為矩陣M的秩;U是矩陣MMT的特征向量矩陣,由各炮f-xr譜特征向量組成,且相互正交;V是矩陣MTM的特征向量矩陣,由各檢波點(diǎn)的f-xs譜特征向量組成;S表示各特征值構(gòu)成的對(duì)角矩陣;σk為第k個(gè)特征值;uk、vk為第k個(gè)特征值對(duì)應(yīng)的特征向量。
根據(jù)上述分析,頻率切片會(huì)呈現(xiàn)一定的低秩特征(或稀疏性),對(duì)任一炮的某一頻率分量可以表示為特征向量的稀疏表示,即
式中:mj表示第j炮頻率分量;cj=S(VT)j為稀疏表征參數(shù)。該表示方式也可以理解為稀疏字典概念,其中U也稱(chēng)為字典。通過(guò)適當(dāng)?shù)慕抵龋梢赃_(dá)到壓制噪聲的目的。
奇異值分解方法獲得的各特征向量是相互正交的,這限制了數(shù)據(jù)稀疏表征程度。為了解決該問(wèn)題,提出了獨(dú)立分量分析、基于數(shù)據(jù)驅(qū)動(dòng)的冗余字典等方法。本文將采用數(shù)據(jù)驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)框架,在頻域?qū)崿F(xiàn)地震數(shù)據(jù)壓縮去噪。
自編碼器是Lecun[26]提出的一種具有對(duì)稱(chēng)結(jié)構(gòu)的無(wú)監(jiān)督型神經(jīng)網(wǎng)絡(luò)。對(duì)于輸入數(shù)據(jù)為X,編碼器函數(shù)可表示為
該過(guò)程期望獲得數(shù)據(jù)X的稀疏編碼。式中:h為隱層神經(jīng)元的輸出;w為網(wǎng)絡(luò)輸入的權(quán)重;b為網(wǎng)絡(luò)輸入的偏置。與式(5)相比,實(shí)質(zhì)就是尋找稀疏編碼系數(shù)c;編碼器各神經(jīng)元的權(quán)重系數(shù)w近似為式(5)中的特征向量矩陣U的轉(zhuǎn)置,但沒(méi)有U各特征向量的正交性限制。自編碼網(wǎng)絡(luò)可以通過(guò)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程優(yōu)化各特征向量,打破正交約束,大大提高數(shù)據(jù)特征的稀疏性。
然后,網(wǎng)絡(luò)通過(guò)將來(lái)自隱層的低維空間特征進(jìn)行解壓縮達(dá)到數(shù)據(jù)重構(gòu)和還原的目的,這一過(guò)程也被稱(chēng)為解碼。解碼器函數(shù)可以表示為
該過(guò)程即為式(6)的逆過(guò)程,利用編碼器的稀疏系數(shù)重構(gòu)數(shù)據(jù)。式中:Y為神經(jīng)網(wǎng)絡(luò)的輸出;w′為網(wǎng)絡(luò)輸出的權(quán)重;b′為網(wǎng)絡(luò)輸出的偏置。在整個(gè)過(guò)程中由于壓縮作用,會(huì)將不相干的噪聲壓制,而只保留相干性較強(qiáng)的有效信號(hào)。
通過(guò)上述分析可見(jiàn),自編碼網(wǎng)絡(luò)工作原理與奇異值分解相似,這為自編碼網(wǎng)絡(luò)提供了工作機(jī)理,克服了神經(jīng)網(wǎng)絡(luò)的黑箱特性。圖1解釋了自編碼網(wǎng)絡(luò)與奇異值分解在結(jié)構(gòu)和原理上的對(duì)應(yīng)關(guān)系。
圖1 自編碼網(wǎng)絡(luò)與奇異值分解原理映射圖
基于上述自編碼網(wǎng)絡(luò)去噪原理,設(shè)計(jì)了無(wú)監(jiān)督網(wǎng)絡(luò)模型(圖2)。首先,應(yīng)用快速傅里葉變換(FFT)將三維數(shù)據(jù)變換到頻率域,由于頻率域數(shù)據(jù)是復(fù)數(shù),將某一切片數(shù)據(jù)實(shí)部和虛部串接作為神經(jīng)網(wǎng)絡(luò)的輸入。然后,采用自編碼網(wǎng)絡(luò)實(shí)現(xiàn)噪聲壓制,將處理過(guò)的所有頻率切片重構(gòu)回三維數(shù)據(jù)頻譜,進(jìn)行快速傅里葉逆變換(IFFT)得到去噪后數(shù)據(jù)。
圖2 無(wú)監(jiān)督去噪模型框架
在該處理流程中,自編碼網(wǎng)絡(luò)結(jié)構(gòu)是影響去噪的關(guān)鍵因素。一是網(wǎng)絡(luò)不同層之間的連接方式。本文在隱層添加跳躍連接塊以增強(qiáng)網(wǎng)絡(luò)對(duì)地震數(shù)據(jù)特征的學(xué)習(xí),如此,解碼層的輸入包含兩部分,即來(lái)自隱層的輸出和來(lái)自跳躍連接塊的輸出。跳躍連接塊的使用可以加速無(wú)監(jiān)督模型收斂,增強(qiáng)網(wǎng)絡(luò)提取高階特征的能力。解碼器重建抽象特征,然后將這些抽象特征映射回原始地震數(shù)據(jù)空間,以實(shí)現(xiàn)隨機(jī)噪聲衰減。通過(guò)迭代學(xué)習(xí)抽象特征表示,盡可能減少編碼器和解碼器的差異。
二是網(wǎng)絡(luò)中間層的維度決定了數(shù)據(jù)壓縮程度。維度太小,將導(dǎo)致信號(hào)壓縮過(guò)度,損失有效信號(hào);維度太大,壓縮不到位,噪聲去除效果不佳。采用深度學(xué)習(xí)的目的是希望獲得比SVD 方法更好的壓縮編碼效果,因此利用SVD 分解后特征值能量占比為90%時(shí)對(duì)應(yīng)的階數(shù),作為中間層維度的參考。此策略保證自編碼網(wǎng)絡(luò)的稀疏度低于SVD 方法,能學(xué)習(xí)到更稀疏的數(shù)據(jù)特征。
均方誤差函數(shù)是回歸問(wèn)題中較為常見(jiàn)的損失函數(shù)。根據(jù)Bayes 反演理論,最小化均方誤差函數(shù)是以零均值高斯白噪聲為假設(shè)條件。但是由于本文方法是在頻率域完成,白噪聲的存在導(dǎo)致頻率切片的均值偏移,因此對(duì)去噪結(jié)果進(jìn)行均值約束,有利于數(shù)據(jù)歸位于其真值。K-L 散度可以度量?jī)蓚€(gè)分布之間的距離,定義為
式中:Pde=mean(Y),表示對(duì)去噪后數(shù)據(jù)Y取均值;Pref為參考均值,理論上應(yīng)該等于干凈信號(hào)的均值。式(8)度量了去噪數(shù)據(jù)均值與參考均值的距離,當(dāng)Pde=Pref時(shí),該值達(dá)到最小。
將上述K-L 散度約束與均方誤差函數(shù)相結(jié)合,定義新的損失函數(shù)為
正則化項(xiàng)的加入可以驅(qū)動(dòng)去噪結(jié)果均值接近參考值。
使用一組合成數(shù)據(jù)和兩組海洋實(shí)際數(shù)據(jù)驗(yàn)證本文方法的有效性,并根據(jù)信噪比(Signal-Noise Ratio,SNR)、局部相似性對(duì)方法進(jìn)行評(píng)價(jià)。
區(qū)域(包括本礦區(qū))開(kāi)展過(guò)1∶20萬(wàn)、1∶5萬(wàn)水系沉積物地球化學(xué)測(cè)量以及1∶1萬(wàn)土壤地球化學(xué)測(cè)量工作。1∶5萬(wàn)水系沉積物測(cè)量成果顯示,本區(qū)元素異常以Mo、W為主,二者強(qiáng)度高、規(guī)模大,且與1∶20萬(wàn)水系沉積物地球化學(xué)鉬異??傮w形態(tài)相似,套合較好。1∶1萬(wàn)土壤地球化學(xué)測(cè)量Mo、W、Ag、Cu異常強(qiáng)度高、規(guī)模較大,是礦區(qū)的主要成礦元素和伴生元素。Mo異常集中分布在上棋盤(pán)北側(cè)和南側(cè),以及大尖山一帶。上棋盤(pán)北側(cè)和南側(cè)的Mo異常,總體展布方向呈北北西—南南東向,大尖山一帶的Mo異常,總體展布方向呈北西—南東向,與區(qū)域上Mo異常成礦帶基本一致。經(jīng)普查地質(zhì)工作,化探鉬異常多為礦致異常。
SNR作為全局衡量標(biāo)準(zhǔn),定義為
使用褶積模型合成三維數(shù)據(jù)體。該模型共128×128 道,每道256 個(gè)采樣點(diǎn),時(shí)間采樣間隔為2 ms。對(duì)合成數(shù)據(jù)添加方差為0.3 的高斯噪聲,信噪比低至-5.96 dB(圖3a),分別采用MSSA、K-SVD 和本文方法去噪。K-SVD 方法去噪效果最差,信噪比僅提升至2.72dB,同相軸附近殘留噪聲較多,殘差道集也可以看出同相軸附近痕跡明顯,說(shuō)明該方法去除噪聲并不徹底(圖3b);MSSA 方法較K-SVD 方法去噪效果有所改善,信噪比提高至4.52 dB,但殘差道集有同相軸殘留(圖3c),說(shuō)明該方法對(duì)有效信號(hào)造成了一定程度的損傷;本文方法去噪較為徹底、效果最好,信噪比提升至6.55 dB,同相軸刻畫(huà)較為清晰,殘差數(shù)據(jù)也基本看不到同相軸痕跡(圖3d),說(shuō)明本文方法在壓制隨機(jī)噪聲的同時(shí)不會(huì)對(duì)有效信號(hào)造成損傷。
圖3 合成數(shù)據(jù)三種方法去噪效果三維對(duì)比
為方便觀(guān)察各方法的數(shù)據(jù)處理細(xì)節(jié),抽取該三維數(shù)據(jù)Inline 方向第11 個(gè)剖面進(jìn)行對(duì)比(圖4)。與原始合成數(shù)據(jù)(圖4a 左)相比,加噪數(shù)據(jù)的同相軸被淹沒(méi)在強(qiáng)噪聲中,信噪比低至-5.98 dB(圖4a 右)。K-SVD方法去噪結(jié)果的信噪比僅提高到2.47 dB(圖4b 左),殘差剖面中同相軸痕跡明顯(圖4b右)。MSSA 方法去噪結(jié)果的信噪比達(dá)到4.37 dB,但同相軸處仍有明顯的噪聲殘留(圖4c 左),殘差剖面中也留有同相軸痕跡(圖4c右)。本文方法去噪后,同相軸更連續(xù),信噪比提高到6.37 dB(圖4d 左),殘差剖面中同相軸痕跡不明顯(圖4d 右)。由此可以看出,本文方法壓制噪聲效果優(yōu)于其他兩種方法。
圖4 合成數(shù)據(jù)三種方法去噪效果剖面對(duì)比
進(jìn)一步抽取主頻為30 Hz 的頻率剖面,測(cè)試重構(gòu)階數(shù)或中間層維度對(duì)SVD 算法和無(wú)監(jiān)督網(wǎng)絡(luò)去噪結(jié)果的影響,即比較編碼稀疏度對(duì)去噪結(jié)果的影響(圖5)。當(dāng)中間層維度取19 時(shí),無(wú)監(jiān)督網(wǎng)絡(luò)去噪結(jié)果的SNR 最高、效果最好(圖5中綠色虛直線(xiàn)②所示),恰是該頻率切片奇異值能量占比為90%所對(duì)應(yīng)的維度。從圖中不難發(fā)現(xiàn),無(wú)監(jiān)督網(wǎng)絡(luò)去噪結(jié)果的SNR 一直高于SVD 方法,即當(dāng)兩者有相同的稀疏度時(shí),無(wú)監(jiān)督網(wǎng)絡(luò)性能更優(yōu)(圖5 中綠色虛直線(xiàn)①所示)。即使在更小的稀疏參數(shù)下,無(wú)監(jiān)督網(wǎng)絡(luò)也可以獲得比SVD 方法更佳的去噪效果。
圖5 中間層維度對(duì)去噪性能的影響
提取出無(wú)監(jiān)督網(wǎng)絡(luò)第二編碼層的特征向量,并計(jì)算其協(xié)方差矩陣,即各特征向量之間的相關(guān)譜(圖6),除了主對(duì)角線(xiàn)上,其余位置仍然有不少非零值,可見(jiàn)其特征向量并未完全正交,即采用無(wú)監(jiān)督網(wǎng)絡(luò)打破了傳統(tǒng)SVD 方法特征向量正交這一約束,有利于提高數(shù)據(jù)表征的稀疏性。
圖6 第二編碼層特征向量相關(guān)譜
去噪方法的時(shí)間成本同樣是一個(gè)值得關(guān)注的問(wèn)題。對(duì)于合成三維數(shù)據(jù)體,MSSA、K-SVD 和本文方法處理時(shí)間分別為792、1358、276 s。由于K-SVD 方法每次迭代都需要奇異值分解運(yùn)算,耗時(shí)最大;MSSA 也需要大規(guī)模矩陣的奇異值分解,耗時(shí)也較大;而本文方法采用的數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單,自編碼網(wǎng)絡(luò)通過(guò)反向傳播優(yōu)化網(wǎng)絡(luò),計(jì)算簡(jiǎn)單,可以快速實(shí)現(xiàn)。
為了定量評(píng)價(jià)本文方法的實(shí)際數(shù)據(jù)處理能力,對(duì)實(shí)際海洋地震數(shù)據(jù)進(jìn)行去噪實(shí)驗(yàn)。該數(shù)據(jù)共有400炮,每一炮包含400道數(shù)據(jù),每道數(shù)據(jù)有800個(gè)時(shí)間采樣點(diǎn),采樣間隔為2 ms。圖7a是原始地震道集及其加入高斯白噪聲的數(shù)據(jù),信噪比降至-7.30 dB,原始數(shù)據(jù)中弱信號(hào)同相軸被噪聲淹沒(méi)。圖7b~圖7d 分別是K-SVD、MSSA 和本文方法的處理結(jié)果及其殘差道集,可以看出本文方法的殘差道集中有效信號(hào)能量最弱。對(duì)圖7 紅框區(qū)域進(jìn)行放大顯示,如圖8所示??梢悦黠@看出,MSSA 和K-SVD 方法去噪后的數(shù)據(jù)同相軸附近仍殘留大量噪聲,有效信號(hào)能量較弱,而本文方法去噪后同相軸最清晰。K-SVD、MSSA 和本文方法處理結(jié)果的SNR 分別為2.76、4.73 和5.91 dB,顯然本文方法的去噪效果最好。
圖7 實(shí)際海洋數(shù)據(jù)三種方法去噪效果對(duì)比
圖8 圖7 紅框區(qū)域的放大顯示
為了驗(yàn)證本文方法保持?jǐn)?shù)據(jù)橫向連續(xù)性的優(yōu)勢(shì),抽取第10 個(gè)共炮檢距道集0.4~1.0 s 部分(圖9)。由圖9 可以看出,本文方法在強(qiáng)噪聲背景下仍較好地恢復(fù)了同相軸連續(xù)性,而且最清晰,尤其是在圖中箭頭處,效果明顯優(yōu)于其他兩種方法。
圖9 實(shí)際海洋數(shù)據(jù)三種方法去噪結(jié)果的共炮檢距道集對(duì)比
對(duì)于實(shí)際數(shù)據(jù)一,MSSA、K-SVD 和本文方法處理時(shí)間分別為6524、1315、1160s。由于實(shí)際數(shù)據(jù)維度較大,因此MSSA 的計(jì)算效率低于K-SVD??梢?jiàn),無(wú)論是合成數(shù)據(jù)還是實(shí)際數(shù)據(jù),本文方法的計(jì)算效率最高。
本文方法中參數(shù)Pref的取值會(huì)影響各個(gè)子網(wǎng)絡(luò)對(duì)頻率切片的去噪性能。選取不同的Pref值對(duì)30 Hz含噪頻率切片數(shù)據(jù)進(jìn)行去噪處理并計(jì)算其SNR(圖10)。含噪切片數(shù)據(jù)的SNR 為-6.59dB,當(dāng)Pref取值0.03 時(shí),去噪后SNR 最高,這也恰是無(wú)噪數(shù)據(jù)的均值。隨著Pref逐漸偏離真值,去噪后SNR 也會(huì)隨之下降。由此可以看出,K-L 散度約束對(duì)去噪結(jié)果有一定影響。
圖10 參數(shù)Pref對(duì)去噪效果的影響
為了評(píng)價(jià)本文方法的實(shí)用性,對(duì)實(shí)際含噪數(shù)據(jù)二進(jìn)行處理。實(shí)際數(shù)據(jù)一中的隨機(jī)噪聲是人為添加,而實(shí)際數(shù)據(jù)二中是真實(shí)噪聲。圖11a 是原始含噪道集,噪聲導(dǎo)致同相軸的清晰度降低;圖11b 為K-SVD 方法去噪結(jié)果及殘差道集,可以看出,噪聲去除并不徹底,尤其是遠(yuǎn)炮檢距仍然可以看到大量噪聲存在;圖11c 為MSSA 方法去噪結(jié)果及殘差剖面,噪聲得到了有效壓制,但是同相軸的連續(xù)性并未得到恢復(fù),并且殘差道集中有明顯的有效信號(hào)痕跡;圖11d是本文方法去噪結(jié)果及殘差剖面,噪聲壓制比較徹底、同相軸更清晰,殘差道集中有效信號(hào)不明顯。需承認(rèn)的是,本文方法在去噪的同時(shí)對(duì)弱信號(hào)會(huì)造成輕微的損傷,如圖中4.8 s 以后弱信號(hào)難以恢復(fù)。這是由于在頻率域,淺層強(qiáng)信號(hào)和深層弱信號(hào)耦合,經(jīng)過(guò)自編碼網(wǎng)絡(luò)的壓縮會(huì)壓制弱信號(hào)。
圖11 實(shí)際地震數(shù)據(jù)二三種方法去噪效果對(duì)比
去噪結(jié)果與去除的噪聲之間的局部相似性能評(píng)價(jià)信號(hào)泄漏程度[27],高相似異常就表明去噪結(jié)果在相應(yīng)的位置有信號(hào)泄漏。圖12 展示了K-SVD、MSSA和本文方法去噪結(jié)果與去除的噪聲之間的相似性。由圖可見(jiàn):K-SVD 方法處理后在2.4~3.2 s 大炮檢距處,殘差信號(hào)與去噪結(jié)果存在較高的相似性,說(shuō)明去噪結(jié)果中仍然保留了部分噪聲,壓制不徹底;經(jīng)過(guò)MSSA 方法去噪后的數(shù)據(jù)在1.8~3.4 s除了大炮檢距處噪聲殘留,對(duì)有效信號(hào)損傷也較大,這在圖11c的殘差道集上也很明顯;而本文方法去除的噪聲與保留的信號(hào)相干性較小,說(shuō)明在去噪時(shí)沒(méi)有損傷有效信號(hào),具有較高的保真度。
圖12 三種方法去噪結(jié)果與殘差的局部相似性對(duì)比
本文利用三維數(shù)據(jù)頻域相似性,建立了一種奇異值分解理論指導(dǎo)的自編碼無(wú)監(jiān)督去噪網(wǎng)絡(luò)模型。通過(guò)將奇異值分解映射為自編碼網(wǎng)絡(luò),克服了奇異值分解各特征向量正交的約束,提高了數(shù)據(jù)表示的稀疏性。根據(jù)頻率域噪聲分布特點(diǎn)在損失函數(shù)中引入K-L散度約束,驅(qū)動(dòng)數(shù)據(jù)恢復(fù)其均值分布。本文方法實(shí)現(xiàn)了一種運(yùn)算速度快、又保留傳統(tǒng)方法物理可解釋性的無(wú)監(jiān)督學(xué)習(xí)算法模型。合成和實(shí)際數(shù)據(jù)處理結(jié)果均表明,本文方法在去噪的同時(shí)能夠保留信號(hào)細(xì)節(jié),具有較高的保真度。