關(guān)鍵詞:地震速度反演,深度學習,注意力,多尺度,特征融合,特征強化
0 引言
地震速度反演精度是偏移成像的關(guān)鍵。目前,地震速度反演的主要方法有疊加速度分析、偏移速度分析、層析速度反演和全波形反演及深度學習方法等。
Garotta等[1]提出的常規(guī)疊加速度分析方法是常用的速度建模方法之一。張明等[2]、徐文君等[3]、王瑞林等[4]改進了疊加速度模型方法,但是在復雜地質(zhì)條件下精度明顯不足。偏移速度分析可結(jié)合速度分析與偏移成像進行速度建模,早期主要是利用Kirchhoff積分法[5?7]實現(xiàn),但精度較低。后續(xù)具有更高精度的基于波動方程的偏移速度分析方法成為主流[8?9],但是效果受迭代精度和計算效率的影響較大。層析成像方法可分為以射線理論為基礎(chǔ)的射線層析[10?11]和以波動理論為基礎(chǔ)的繞射層析[12?14]兩種類型,其中射線層析的結(jié)果分辨率較低,繞射層析的計算量過大。全波形反演[15?17]基于波動方程,利用觀測到的數(shù)據(jù)與模擬數(shù)據(jù)的最優(yōu)匹配以建立地下介質(zhì)的模型,反演結(jié)果精度高,但過度依賴初始速度模型,迭代過程較復雜,耗時較長。
深度學習技術(shù)為速度建模提供了高效利用海量地震數(shù)據(jù)的手段。Araya?polo等[18]提出了基于深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetworks,DNN)的二維速度建模方法,將提取的道集數(shù)據(jù)特征作為網(wǎng)絡(luò)輸入,具有較高精度,但特征提取部分受人為因素影響較大。韓明亮等[19]將地震反射波形和速度譜作為U?Net的輸入,克服單獨使用反射波形或速度譜時存在的建模不穩(wěn)定和精度不足的問題。張兵[20]將速度譜作為神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),將時間域?qū)铀俣茸鳛闃撕灁?shù)據(jù),設(shè)計了一種編碼—解碼結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,直接將速度譜映射為時間域?qū)铀俣?。以上方法主要是利用現(xiàn)有經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整輸入與標簽信息進而實現(xiàn)反演。Mosser等[21]將反演問題看作不同域之間的轉(zhuǎn)換,使用深度卷積生成對抗網(wǎng)絡(luò),實現(xiàn)了地震數(shù)據(jù)域與速度模型域之間的轉(zhuǎn)換,但結(jié)果的精度還具有較大提升空間。Zhang等[22]設(shè)計了VelocityGAN網(wǎng)絡(luò),將物理驅(qū)動方法的逆過程轉(zhuǎn)化為圖像之間的映射,直接從原始地震波形數(shù)據(jù)生成高質(zhì)量的速度圖像,提高了生成的速度模型精度。Feng等[23]針對全波形反演(Full?waveformInversion,F(xiàn)WI)中的局部極小值問題,基于全卷積網(wǎng)絡(luò)(FullyConvolutionalNetworks,F(xiàn)CN)開發(fā)了一種多尺度數(shù)據(jù)驅(qū)動方法,相較傳統(tǒng)FWI具有更高的精度和更少的計算時間。Li等[24]認為深度學習反演的映射關(guān)系存在弱對應的問題,提出Seis?InvNet網(wǎng)絡(luò),通過學習增強地震道中的空間對應關(guān)系重構(gòu)速度模型,這在一定程度上提高了精度。
綜上所述,基于深度學習的速度反演方法面臨以下挑戰(zhàn):①時間域(地震數(shù)據(jù))與空間域信息(速度模型)之間的語義映射對應性較弱,使網(wǎng)絡(luò)在學習該映射關(guān)系時存在多解性;②采集到的原始地震記錄中存在噪聲,神經(jīng)網(wǎng)絡(luò)將地震數(shù)據(jù)映射到速度模型時缺少有效引導,導致反演精度下降。
特征強化是通過提高特征表示能力進而增強模型性能的方法。特征疊加、特征增強、特征融合等方法都可以視為特征強化的手段,可以在深度學習中提高學習特征的有效性和表現(xiàn)力,從而解決深度學習技術(shù)運用到速度反演領(lǐng)域所面臨問題。本文將對空間位置信息更敏感的U?Net[25?26]作為基礎(chǔ)網(wǎng)絡(luò),結(jié)合特征強化的思想改進U?Net,提出了一種深度神經(jīng)網(wǎng)絡(luò)反演方法:①為解決傳統(tǒng)反演模型多解性問題,本文基于特征疊加的思想,疊加多炮地震數(shù)據(jù)特征并設(shè)計特征提取模塊,保留更多的地震數(shù)據(jù)與速度模型之間的映射關(guān)系,使提取的特征圖與目標模型之間的映射關(guān)系更加明確。通過設(shè)計多尺度模塊,使用不同尺寸卷積核處理特征圖,并對提取的不同特征進行融合,以增強網(wǎng)絡(luò)特征學習能力。②為解決神經(jīng)網(wǎng)絡(luò)缺乏引導的問題,采用注意力門代替跳躍連接,以增強網(wǎng)絡(luò)學習速度模型的重點特征,提高關(guān)鍵特征質(zhì)量。引入殘差學習策略,并基于預激活和瓶頸殘差的思想,設(shè)計預激活瓶頸殘差結(jié)構(gòu),引入跨層連接,強化特征表達,以避免梯度消失和模型退化,提高網(wǎng)絡(luò)魯棒性。使用理論速度模型作為樣本進行網(wǎng)絡(luò)試算,驗證本文方法的有效性。然后在含噪數(shù)據(jù)及標準模型中進行測試,驗證方法的抗噪性和泛化能力。
1 方法原理
1.1 多炮特征疊加
特征疊加是將多個數(shù)據(jù)源提取的特征進行堆疊以提高特征表示,獲得更加全面、豐富的數(shù)據(jù)表示。
在地震勘探中,與速度模型對應的三維地震記錄一般為[S,R,T],其中S為震源數(shù)量,R為接收器數(shù)量,T為采樣時間步長。由于從震源到接收器的波場傳播路徑是固定的,這使每個震源對應的地震剖面[1,R,T]不同,而每個地震剖面包含的信息有限,只能為部分速度模型提供支持?,F(xiàn)有方法通常用S作為初始卷積層的通道數(shù),導致提取的每個通道的特征映射與速度模型的對應關(guān)系不適定,使神經(jīng)網(wǎng)絡(luò)難以將數(shù)據(jù)域轉(zhuǎn)換為空間域。因此,本文對多炮地震數(shù)據(jù)進行變形操作,即網(wǎng)絡(luò)輸入的是[1,S×R,T]格式的地震數(shù)據(jù),其中初始卷積層的輸入通道為1。這在不破壞原始地震數(shù)據(jù)的情況下,保留了接收器與震源之間的空間關(guān)系,使提取的特征圖與速度模型之間的對應關(guān)系更加明確,減少了求解反演問題的多解性。
基于特征疊加的思想,將來自不同震源的多個地震數(shù)據(jù)沿著1個維度疊加,形成新的輸入數(shù)據(jù)。將每個震源對應的不同的地震剖面疊加到相同的特征空間中,便于模型對整體數(shù)據(jù)進行學習和分析。
如圖1所示,圖1a為具有4個震源的速度模型,圖1b為[S,R,T]格式的三維地震數(shù)據(jù),每個震源對應不同的地震剖面[1,R,T],接收器與震源之間的空間關(guān)系不明確。圖1c為[1,S×R,T]格式的二維地震數(shù)據(jù),接收器與震源之間的空間關(guān)系較為清晰,增加了有效特征的約束,可以減少解空間的大小,提高求解的準確性。
1.2 有效特征增強
傳統(tǒng)的U?Net采用跳躍式連接,將淺層卷積提取的低層次特征與深層卷積提取的相同尺度的高層次特征進行融合,可以為上采樣提供無法恢復的空間信息。然而,在速度反演領(lǐng)域,神經(jīng)網(wǎng)絡(luò)的主要任務是將時域地震數(shù)據(jù)映射到空間域速度模型,由淺層卷積層提取的時域地震數(shù)據(jù)的低層特征不適合直接并入空間域速度模型的高層特征中,網(wǎng)絡(luò)在缺少引導的情況下使用跳躍連接會導致地震記錄中的噪聲信息被重復使用?;谔卣鲝娀乃枷?,通過注意力門(At?tentionGates,AGs)[27]代替跳躍連接,使用上采樣得到的深層特征引導網(wǎng)絡(luò),以全局視角給將要拼接的低層特征每個元素不同的權(quán)重,幫助神經(jīng)網(wǎng)絡(luò)降低不相關(guān)的低層次特征的干擾,改進拼接特征的質(zhì)量,增強對速度模型相關(guān)特征的學習。如圖2所示,AGs方法通過分析深層特征(g)提供的語義信息計算得到注意力系數(shù)(a),輸入的淺層特征(f)使用a選擇需要集中注意的區(qū)域。
圖3a是從地震數(shù)據(jù)中提取的低維時域特征,圖3b是經(jīng)過深層卷積后解碼得到的高維空間域特征,經(jīng)過注意力門后的特征如圖3c所示,包含了經(jīng)過加權(quán)后的低層特征。圖3c和圖3b進行通道上的拼接后輸入到下一層卷積,為卷積層提供了增強的特征和缺失的細節(jié)信息,引導網(wǎng)絡(luò)重點學習速度模型相關(guān)特征。
1.3 多尺度特征融合
特征融合通常將不同來源、不同尺度的特征信息進行組合,以提高模型性能?;谔卣魅诤系乃枷耄褂枚喑叨染矸e核,在不同感受野下對地震數(shù)據(jù)特征進行提取,可以捕獲更多的細節(jié)和結(jié)構(gòu)信息,并將提取的特征進行通道拼接,使下一卷積層得到更豐富的全局特征表示。多尺度卷積通過使用不同的卷積核對圖像特征進行提取,并從全局視角對圖像特征信息進行編碼和解碼,從而提高網(wǎng)絡(luò)性能。其中,規(guī)模大的卷積核具有更大的感受野,可以提取更多的信息,用于稀疏地震數(shù)據(jù)的初始特征提??;規(guī)模小的卷積核具有更少的參數(shù)和更低的內(nèi)存需求。
2 網(wǎng)絡(luò)結(jié)構(gòu)
本文提出的FEU?Net(FeatureEnhancementU?Net)結(jié)構(gòu)包括特征提取模塊、多尺度模塊、注意力門模塊和殘差模塊4個部分(圖4)。
2.1 特征提取模塊
特征提取模塊由1個卷積核(7×7的卷積層)和2個3×3尺度的殘差塊組成(圖5)。經(jīng)過預處理后的地震數(shù)據(jù)尺寸過大,將其輸入網(wǎng)絡(luò)主體前需要使用特征提取模塊減小數(shù)據(jù)尺寸。同時,該模塊可以對時域地震記錄進行初始特征提取。
2.2 多尺度模塊
多尺度模塊(圖6)由1個3×3、5×5、7×7卷積層和1個9×9卷積層并行組成,以此增強網(wǎng)絡(luò)的多尺度斷層檢測能力。同時,在模塊中增加1個1×1的卷積層,使網(wǎng)絡(luò)能夠獲取更多的空間信息。
對于大卷積核使訓練參數(shù)過多而導致網(wǎng)絡(luò)計算效率下降的問題,可以使用多個小卷積核的組合代替較大的卷積核。多個小卷積核連續(xù)卷積的效果和單個大卷積核卷積的作用相同,2個3×3的卷積層堆疊后的感受野為5×5,3個3×3的卷積層堆疊后的感受野為7×7,故可以通過小尺寸卷積層的堆疊替代大尺寸卷積層,并且在感受野不變的同時使網(wǎng)絡(luò)堆疊更深,以增加網(wǎng)絡(luò)的擬合能力。因此,為減少網(wǎng)絡(luò)的內(nèi)存需求,多尺度模塊中的5×5、7×7和9×9卷積層分別替換為具有等價效果的2個3×3、3個3×3和4個3×3卷積序列。
2.3 注意力門模塊
注意力門模塊的結(jié)構(gòu)如圖7所示。使用注意力門計算輸入淺層特征f=[f11,f12,???,fij,???,fnn]的重要內(nèi)容,通過分析深層特征g=[g11,g12,???,gij,???gnn]提供的語義信息,計算得到相應的α,其中n為特征數(shù)量。注意力系數(shù)α=[a11,a12,???,aij,???,ann]中的每個輸出aij和輸入特征中的每個輸入fij相對應。注意力門模塊主要由3個1×1的卷積組成。首先,輸入特征f和g分別經(jīng)過2個1×1卷積,使兩者的通道數(shù)相同,對其進行加法運算(Add)操作后再使用LeakyReLU函數(shù)進行激活。再次執(zhí)行1×1卷積使特征通道數(shù)減小為1,并以Sigmoid作為激活函數(shù)使最終得到的aij∈[0,1]。然后,根據(jù)特征圖的大小是否相同來決定是否使用重采樣(Resampler)。最后,使用得到的注意力系數(shù)與原始特征進行元素乘積(Element?wisemultiplication)可得到最終輸出特征F。
2.4 預激活瓶頸殘差模塊
殘差結(jié)構(gòu)通過跨層連接實現(xiàn)對跨層信息的傳遞,使梯度更容易反向傳遞回前面的層,同時將上一層的輸入與當前層的輸出相加,減少地震數(shù)據(jù)在網(wǎng)絡(luò)傳遞過程中有效信息的損失,提高特征的表達能力。常規(guī)殘差模塊隨著網(wǎng)絡(luò)深度增加,在提取從地震數(shù)據(jù)到速度模型的映射關(guān)系時,相鄰兩個層之間的特征差別越來越小,梯度逐漸消失。因此,需要對常規(guī)殘差模塊進行改進。
瓶頸殘差模塊(BottleneckResidualBlock)[28]依次由1×1、3×3、1×1的3個卷積層堆疊而成,1×1的卷積用于降低或升高特征的維度,3×3的卷積在相對較低的維度可以更有效、更直觀地提取特征。同時,2個1×1的卷積代替一部分常規(guī)殘差模塊中3×3卷積的作用,減少參數(shù)的數(shù)量,從而達到提高計算效率的目的。
預激活殘差單元(Pre?activationResBlock)[29]將ReLU激活函數(shù)放入殘差塊內(nèi)部,數(shù)據(jù)進入每個模塊(Block)時先經(jīng)過批量歸一化(BN)和ReLU激活函數(shù)再進行卷積。實驗數(shù)據(jù)表明,使用預激活殘差單元的網(wǎng)絡(luò)比基本殘差單元更容易優(yōu)化。考慮到地震數(shù)據(jù)的類型為實數(shù),而U?Net中使用的ReLU激活函數(shù)會使網(wǎng)絡(luò)中過多的神經(jīng)元失活,因此使用LeakyReLU作為激活函數(shù)[30]。
基于上述思想,本文設(shè)計了預激活瓶頸殘差模塊(圖8)。由圖可見,輸入x進入殘差路徑,先經(jīng)過1層BN和LeakyReLU進行預激活,然后通過1×1卷積降維處理。降維后的數(shù)據(jù)通過BN和LeakyReLU開展3×3卷積進行特征提取,最后由1×1卷積將特征維度復原,并和直接映射路徑的數(shù)據(jù)進行add操作,即為預激活瓶頸殘差模塊的輸出。因此,在解決模型退化的同時引入跨層連接強化了特征的表達。
3 模型測試
3.1 簡單速度模型測試
為了驗證本文方法反演的有效性,首先使用正演程序模擬生成的簡單速度模型進行反演,并將U?Net與FEU?Net的反演結(jié)果進行對比。
隨機生成最小層數(shù)為4、最大層數(shù)為7、最小速度為1500m/s、最大速度為4500m/s的速度模型,并設(shè)置斷層和鹽丘體參數(shù)生成斷層和鹽丘速度模型。根據(jù)生成的速度模型,采用20Hz的雷克子波,生成采樣時間間隔為1ms、總采樣時間為1600ms的地震數(shù)據(jù)。將得到的數(shù)據(jù)按照8:1:1的比例劃分為訓練集、驗證集、測試集,輸入網(wǎng)絡(luò)進行訓練。
在測試集中,任意選取1個普通速度模型樣本、1個斷層速度模型樣本和1個鹽丘速度模型樣本(圖9a),對比U?Net(圖9b)和FEU?Net(圖9c)的反演結(jié)果,可知本文方法得到普通速度模型的反演結(jié)果更準確,斷層速度模型的邊界更清晰,鹽丘速度模型鹽丘體具更高的精度(黑色方框)。這表明了本文方法通過強化特征,有效增強了地震數(shù)據(jù)與速度模型之間的映射關(guān)系,使網(wǎng)絡(luò)可以反演出準確的背景速度和地質(zhì)體尺度及位置信息。
圖10是從圖9普通速度模型、斷層速度模型和鹽丘速度模型中紅線處提取的單道速度值。在淺層,F(xiàn)EU?Net反演重建的速度模型結(jié)果與真實值基本一致,曲線較為平滑,而U?Net反演結(jié)果局部產(chǎn)生較大誤差并且存在較為明顯的波動。在深層,兩者的反演結(jié)果與真實值都存在一定的差別,但FEU?Net反演的結(jié)果較U?Net更加穩(wěn)定,前者反演的結(jié)果是較為平滑的折線,而后者為波動的曲線。另外,由MAE(平均絕對誤差)、MSE(均方誤差)、SSIM(結(jié)構(gòu)相似度)和SNR(信噪比)函數(shù)評價指標結(jié)果(表1)可見,F(xiàn)EU?Net反演結(jié)果的4個評價指標均優(yōu)于U?Net。
3.2 抗噪性測試
實際采集到的原始地震數(shù)據(jù)通常含有無規(guī)律噪聲。為了測試本文方法的抗噪性,在SEG/EAGE推覆體數(shù)據(jù)集中選取任意1個原始地震數(shù)據(jù)樣本(圖11),分別加入噪聲等級r(噪聲信號標準差與原始信號標準差之比)為0.01、0.03、0.05、0.07、0.10、0.30的隨機噪聲。
由表2可知,在噪聲強度較小時(r為0.01~0.10),對4種評價指標的影響較??;在噪聲強度較大時(r為0.30),MSE和MAE的數(shù)值上升幅度增大,SSIM和SNR的數(shù)值大幅下降。
由圖12可見,噪聲強度較小時(r為0.01~0.10),本文算法反演出了比較準確的速度模型,在黑色矩形框區(qū)域存在少量偽影,表現(xiàn)出了良好的抗噪性;噪聲強度較大時(r為0.30),本文算法仍然具有一定的抗噪能力,網(wǎng)絡(luò)學習到了整體的速度信息。
通過在網(wǎng)絡(luò)中引入多個尺度的卷積,可以在不同的空間尺度上捕獲有關(guān)圖像結(jié)構(gòu)的信息,從而提高對噪聲的容忍度。同時殘差模塊將輸入信息與卷積輸出信息相加,使殘差模塊能夠在前向傳遞時傳遞輸入的特征,神經(jīng)網(wǎng)絡(luò)更具有魯棒性,網(wǎng)絡(luò)在處理帶有噪聲的數(shù)據(jù)時能夠更好地保持穩(wěn)定性。
3.3 Marmousi模型泛化測試
為了進一步驗證本文方法的泛化性,利用Mar?mousi二維模型對FEU?Net算法進行測試。下采樣后的Marmousi模型如圖13a所示。Marmousi數(shù)據(jù)集中的速度模型更復雜,結(jié)構(gòu)與之前的訓練數(shù)據(jù)集有很大不同,因此,F(xiàn)EU?Net使用Marmousi訓練集重新訓練30個Epoch以微調(diào)神經(jīng)網(wǎng)絡(luò)的參數(shù),然后使用Marmousi的樣本進行反演。
從圖13可見,本文方法在底部高速體區(qū)域反演出了較為準確的地質(zhì)信息,在淺層速度體區(qū)域也有較好的表現(xiàn)(圖13b)。本文方法通過強化地震數(shù)據(jù)中的有效特征,加強神經(jīng)網(wǎng)絡(luò)的特征學習能力,使網(wǎng)絡(luò)表現(xiàn)出了一定的泛化能力。
4 結(jié)束語
本文提出FEU?Net的深度神經(jīng)網(wǎng)絡(luò)地震速度反演方法,對多炮地震數(shù)據(jù)特征疊加處理,使提取的特征與速度模型的對應關(guān)系更加清晰;使用特征提取模塊,過濾不適合連接速度模型的底層特征;引入注意力門代替跳躍連接,增強網(wǎng)絡(luò)特征學習能力;引入多尺度模塊,用不同尺寸的卷積核使網(wǎng)絡(luò)可以學習到更多的特征融合信息;引入預激活瓶頸殘差模塊,在增加網(wǎng)絡(luò)深度的同時避免了網(wǎng)絡(luò)退化。實驗結(jié)果證明了FEU?Net的優(yōu)越性。與同類算法相比,本文反演模型具有更高的清晰度,且網(wǎng)絡(luò)模型具有一定的抗噪性和泛化能力。