王德英,張凱,李振春,張醫(yī)奎,許鑫
(1.中國石油勘探開發(fā)研究院西北分院,甘肅 蘭州 730030;2. 中國石油大學(xué)(華東) 地球科學(xué)與技術(shù)學(xué)院,山東 青島 266580;3. 物華能源科技有限公司,陜西 西安 710067)
在實際地震勘探中,數(shù)據(jù)體內(nèi)容復(fù)雜且容量巨大,加之野外地形條件和經(jīng)濟成本的限制,地震勘探數(shù)據(jù)在空間方向上經(jīng)常進行不規(guī)則采樣。在陸地上這種情況可能起因于地震道的布置受到建筑、湖泊、禁采區(qū)等復(fù)雜地形限制,另外人工放炮的不充分激發(fā)也可能起因于壞道或者嚴(yán)重污染道的出現(xiàn),從而導(dǎo)致采集到的地震數(shù)據(jù)不規(guī)則、不完整或出現(xiàn)空間假頻。在海上地震勘探中,則可能由于電纜的水平偏移等引起,這種稀疏分布的地震數(shù)據(jù)難以滿足高分辨地震勘探的需要[1]。
壓縮感知數(shù)據(jù)恢復(fù)的3個關(guān)鍵因素分別是:對待恢復(fù)數(shù)據(jù)的稀疏表示、對完整數(shù)據(jù)的隨機采樣和最優(yōu)化差值重建算法。其中基于壓縮感知的數(shù)據(jù)采樣通常是完全隨機采樣,這種采樣方式會導(dǎo)致采樣點間隔過于稀疏或密集,當(dāng)采樣點過于稀疏時會導(dǎo)致重要信息丟失,影響恢復(fù)效果;采樣點過于密集則造成多余采樣,違背壓縮感知節(jié)約經(jīng)濟成本的原則。唐剛[2]引入泊松碟采樣方式,提高了重建效果,但該采樣方式由于事先固定采樣,也不能根據(jù)野外地質(zhì)條件靈活調(diào)整,使其在實際應(yīng)用中有一定局限。Leneman提出了Jitter采樣方式[3],首先應(yīng)用于圖像處理。Hennenfent G等[4]指出在利用非線性稀疏性促進求解方法時,隨機采樣相比等間距的規(guī)則采樣可以獲得更好的數(shù)據(jù)重建效果。Hennefent G等[4]、唐剛[2]將其引入到地震數(shù)據(jù)重建中,使采樣點分布相對均勻,在一定程度上能夠根據(jù)地質(zhì)條件靈活調(diào)整。Herrmann F J等[5]使用Jitter采樣進行了基于壓縮感知的地震數(shù)據(jù)重建。Mosher C C[6]提出了NUOS采樣方案并用于在感知成像技術(shù)(compressed sensing imaging,CSI)中尋找炮點和接收點的最佳位置。Yang等[7]在2015年完成CSI技術(shù)在陸地、海洋和OBN勘探中的生產(chǎn)和應(yīng)用,提出了一種分段隨機采樣方法,并對其進行了理論分析。以上研究結(jié)果表明,與隨機采樣和Jitter采樣相比,相同次數(shù)下分段隨機采樣的重建效果優(yōu)于其他兩種方法。
壓縮感知理論的一個重要前提是信號的稀疏性。由于地震數(shù)據(jù)通常不是稀疏的,因此如何找到合適的稀疏字典,使得信號在該字典下的系數(shù)是稀疏的,即能對信號進行稀疏表示,就顯得尤為重要?,F(xiàn)今已有多種數(shù)學(xué)變換被用于地震數(shù)據(jù)重建,如Fourier變換[8]、Curvelet變換[5]、Wavelet變換[9]、Dreamlet變換[6]、Shearlet變換[10]等。由于地震數(shù)據(jù)通常由不同類型的元素組成,單一變換往往不能充分、有效地將其全部表達,李海山等[11]提出形態(tài)分量分析(morphological component analysis,MCA)方法。該方法主要利用不同信號之間成分的差異對信號進行分離,最早由Starck等提出并將其應(yīng)用于圖像的去噪與修復(fù),且取得良好效果,目前被廣泛應(yīng)用于信號的去噪、重建、分隔、修復(fù)以及融合等多種領(lǐng)域。李海山等[11]將MCA方法引入地震數(shù)據(jù)重建領(lǐng)域,取得了較好效果。周亞同等[12]在MCA框架下定量評價了多種不同稀疏字典組合的數(shù)據(jù)重建效果,判定離散余弦變換(discrete cosine transform,DCT)與Curvelet字典組合具有最高的重建精度。劉成明等[10]和張良等[13]指出Shearlet變換作為一種新型的多尺度幾何變換,具有比Curvelet變換更好的方向性以及其自身所具有的各向異性特點,從而擁有更突出的稀疏表達能力,認(rèn)為基于Shearlet變換的重建算法可望取得精度更高的重建結(jié)果。
受上述研究的啟發(fā),將Shearlet變換應(yīng)用到MCA中,它能準(zhǔn)確地描述數(shù)據(jù)的局部特征,因此,有必要尋求一種全局型變換來與之配合。經(jīng)過反復(fù)測試,確定Shearlet+DCT的重建效果優(yōu)于單一數(shù)學(xué)變換和其他字典組合。此外,我們還比較了不同采樣方法的重建結(jié)果,證明了SRS(segmented random sampling)更有利于CS的重建。本文采用SRS和Shearlet+DCT對實際資料進行處理,均取得理想結(jié)果。
缺失地震數(shù)據(jù)的恢復(fù)可以看作一個壓縮感知問題,一個不滿足奈奎斯特采樣定理的信號可以通過某些稀疏變換在特定的稀疏域來恢復(fù)。地震數(shù)據(jù)的重建問題可以描述為由一組不完整數(shù)據(jù)通過線性算子的作用恢復(fù)出完整的數(shù)據(jù),假設(shè)線性正演模型:
y=Rx+e,
(1)
其中:y代表采集的地震數(shù)據(jù);x表示待恢復(fù)的數(shù)據(jù);R表示隨機采樣矩陣;e代表隨機噪聲。
壓縮感知技術(shù)的第一條件是信號可以在某一稀疏域被稀疏表示,假設(shè)數(shù)據(jù)x′是數(shù)據(jù)x在稀疏域F的稀疏表示,則方程(1)可以改寫為:
y=Ax′+eA=RFH,
(2)
其中,F(xiàn)H是稀疏變換F的共軛轉(zhuǎn)置矩陣,如果x′中有k個非零元素且k?L,我們視x′是稀疏的,它可以通過凸優(yōu)化問題來恢復(fù)[12]。
(3)
y′=FT〈x〉 。
(4)
MCA方法認(rèn)為,信號是由形態(tài)不同的多個分量線性組合而成,每個分量都能找到一個字典,該字典只能稀疏表示對應(yīng)的形態(tài)分量,而無法稀疏表示其他分量。
給定二維信號X,假設(shè)它由K個不同形態(tài)的分量線性組合而成,即
(5)
式中:Xk為K個形態(tài)分量,它可被字典Dk稀疏表示;ak為對應(yīng)的稀疏系數(shù)。
地震數(shù)據(jù)的重建可表示為:
Y=RX,
(6)
式中:X表示理想的完整地震數(shù)據(jù);Y表示實際采集的含缺失道地震數(shù)據(jù);R表示采樣矩陣。
在MCA框架下,式(6)可被表示為:
(7)
將式(7)改寫為無約束最優(yōu)化問題,求解得:
(8)
式中:λ為拉格朗日乘子,用來平衡l1范數(shù)項和l2范數(shù)項所占比重。
對于恢復(fù)算法的求解,Sardy等[9]結(jié)合塊坐標(biāo)松弛(Block coordinate relaxation,BCR)算法給出如下基于形態(tài)分量的求解方法。
輸入:采樣矩陣R,字典組合D=[D1,…,DK],缺失地震數(shù)據(jù)Y,總迭代次數(shù)N
輸出:重建地震數(shù)據(jù)X
1) for:n=1:N;
2) 殘差r(n)=Y-R·sum(X1,…,XK)
3) for:k=1∶K
6) 應(yīng)用閾值模型減小λ
7) end
8) end
9)X=sum(X1,…,XK)
其中:D-1表示字典D對應(yīng)的逆變換;Tλ為閾值函數(shù),其公式為:
(9)
除了閾值λ外,我們還有另一個獨立參數(shù)p可以靈活選擇,以獲得更好的性能。在泰勒級數(shù)的基礎(chǔ)上,指數(shù)閾值可被認(rèn)為是一個光滑的0范數(shù)約束。當(dāng)|x|?λ時,它是p閾值算子的近似,可簡化為p=0時的Stein閾值算子和p=1時的軟閾值。在求解算法時,需要調(diào)整拉格朗日乘子來得到最優(yōu)解。步驟如下:首先選取較大的變換域系數(shù)作為閾值,得到稀疏近似解。其次,不斷減小該值以包含更多的變換域系數(shù),并通過連續(xù)迭代逼近最優(yōu)解。閾值選擇策略稱為閾值模型,它影響算法的速度和精度。標(biāo)準(zhǔn)閾值模型包括線性模型、指數(shù)模型和數(shù)據(jù)驅(qū)動模型。本文采用指數(shù)模型,其形式為:
(10)
式中:λmax、λmin分別為所選最大、最小正則化參數(shù);qmax和qmin是用戶定義的百分比;N是迭代次數(shù)。
稀疏字典的選取是MCA方法的核心問題,不同的字典對稀疏表示的效果影響很大。周亞同等[12]已對Curvelet字典的不同組合方案進行了實驗,最終認(rèn)定離散余弦變換(DCT)與Curvelet字典組合具有最高重建精度。Curvelet具有刻畫多尺度、多方向各向異性的能力,能夠很好地表達地震信號中的曲線狀邊緣特征;但與Shearlet變換相比,其稀疏表示能力相對弱一些。Shearlet變換的數(shù)學(xué)結(jié)構(gòu)較簡單,它通過對一個函數(shù)進行伸縮、平移、旋轉(zhuǎn)來生成基函數(shù),該特點與小波類似,卻正是Curvelet變換所欠缺的,所以Shearlet字典非常適用于圖像恢復(fù)重建。DCT變換是一種在信號和圖像處理中常用的數(shù)學(xué)變換,它具有一個很重要的特性——能量集中,即經(jīng)DCT變換后信號能量非常集中,且大多數(shù)系數(shù)都集中在低頻部分。經(jīng)過多次的對比實驗得出利用MCA框架下Shearlet和DCT字典組合的方法進行數(shù)據(jù)重建的效果最好。
壓縮感知的關(guān)鍵技術(shù)之一是隨機欠采樣方法,因為它可以把混淆真實頻率的相干噪聲轉(zhuǎn)化成容易濾除的不相干噪聲,即使這些隨機噪聲和真實頻譜相互疊合在一起,仍然可以通過迭代的方式檢測出真實頻率。因此,相干噪聲的程度很自然地就成為衡量一種欠采樣方法效果的重要標(biāo)準(zhǔn)之一。然而單純的隨機采樣會造成采樣點過于聚集或者過于分散的情況,難以達到理想的重建效果,同時也不能根據(jù)野外實際地質(zhì)條件靈活調(diào)整,因此引入Jitter欠采樣方式,以控制采樣間隔,更加適合地震數(shù)據(jù)重建。Jitter采樣方法首先將待處理區(qū)域劃分成若干個子區(qū)域,然后在每個子區(qū)域內(nèi)都隨機地強制采一個點。由于每個子區(qū)域都有采樣點,相鄰缺失地震道之間的間隔也就得到了控制,同時也保持采樣點的隨機性,可將假頻轉(zhuǎn)化成低幅度噪聲,使真實頻率更容易檢測[14-23]。但是Jitter欠采樣過程中會存在剩余采樣點,不容易使Jitter參數(shù)與離散隨機變量相等,導(dǎo)致無法達到最優(yōu)Jitter采樣。分段隨機采樣在保證采樣點的規(guī)則性與隨機性的同時,很好地克服了這一缺點。
分段隨機采樣的設(shè)計主要分為兩個步驟:第一步是根據(jù)項目要求及工區(qū)實際地質(zhì)條件,設(shè)計一個充分完整規(guī)則的觀測系統(tǒng)。壓縮感知的作用與目的就是盡可能地減少炮點和檢波點的數(shù)量,不僅可以節(jié)約成本也可以擴大地震勘探區(qū)域或提高空間分辨率[21,24-26]。第二步則是對第一步生成的完整觀測系統(tǒng)進行優(yōu)化。非規(guī)則觀測系統(tǒng)設(shè)計步驟如下:
1)根據(jù)地震勘探項目與客觀條件確定欠采樣缺失因子P。
2)假設(shè)一條有N個檢波器的接收道可以表示為:
X=[x(1),x(2),…,x(N)] 。
(11)
3)給定一個分段長度L,X被分成若干個長度為L的Si,在Si內(nèi)根據(jù)欠采樣缺失因子P確定采樣點數(shù)量,則實際的接收點可以表示為:
Xr=x(h(m)),X0=0 ,
(12)
其中,h(m)代表隨機采集m個點,0代表未采集的點。
4)炮點的不規(guī)則化方法與采樣點相同。
5)將不規(guī)則的炮點和檢波點輸出到SPS文件中。
圖1是分段隨機采樣的示意,表現(xiàn)了規(guī)則采樣點不規(guī)則化的過程。從圖中可以看出幾個采樣點共同位于一個小段(P=50%)中,黑色代表采樣點,白色代表未被采樣的點。每一小段的長度L=4,欠采樣缺失因子。沿著這條檢波道,每4個點被分成一段,段中50%的點被隨機選擇。每小段的采樣點個數(shù)為L×P=2,此檢波道的最大采樣間隔為4。在選擇分段長度L時也要考慮欠采樣缺失因子的大小,盡量使L×P的結(jié)果是整數(shù)[5],最大采樣間隔也是由這2個參數(shù)來決定。如果L=4,P=25%,則采樣間隔是6。從圖2f、g、h可以看出,最后3種采樣方法所采集的缺失數(shù)據(jù)沒有假頻,頻譜中只存在部分噪聲。相比之下,分段隨機采樣所產(chǎn)生的噪聲最小。從時間域圖像分析,分段隨機采樣能更好地保留有效信息。
圖1 分段隨機采樣示意Fig.1 Schematic diagram of segmented random sampling
a—合成地震記錄;b—合成地震記錄頻譜;c—規(guī)則欠采樣數(shù)據(jù);d—規(guī)則欠采樣數(shù)據(jù)頻譜;e—完全隨機采樣數(shù)據(jù);f—完全隨機采樣數(shù)據(jù)頻譜;g—分段隨機采樣數(shù)據(jù);h—分段隨機采樣數(shù)據(jù)頻譜a—synthetic seismic record;b—spectrum of synthetic seismic record wavenumber;c—synthetic seismic data after regular sampling;d—spectrum of synthetic seismic data after regular sampling wavenumber;e—synthetic seismic data after random sampling;f—spectrum of synthetic seismic data after random sampling wavenumber;g—synthesized seismic record after SRS;h—spectrum of synthesized seismic record after SRS圖2 欠采樣數(shù)據(jù)及其頻譜Fig.2 Sampled data and spectrum
為了對重建結(jié)果進行定量描述,本文引入兩個評價參數(shù),其定義如下:
1)信噪比RS/N
(13)
其中,X表示完整地震數(shù)據(jù);X′表示重建地震數(shù)據(jù)。
(14)
其中,MSE表示均方差,其計算公式如下:
(15)
為了充分說明分段隨機采樣與MCA重建技術(shù)的優(yōu)越性,選用3種隨機采樣方法(完全隨機采樣、Jitter采樣和分段隨機采樣)對原始數(shù)據(jù)進行采樣,得到3種缺失數(shù)據(jù),比較它們單一DCT字典、單一Shearlet字典和MCA框架下Shearlet和DCT字典組合的重建效果。本文選擇了某地區(qū)真實的炮記錄進行實驗(為便于觀察重建質(zhì)量,數(shù)據(jù)已經(jīng)過去噪處理),其時間采樣頻率為1 ms,含有200道,每道有600個采樣點。圖3b、c、d分別是與數(shù)據(jù)大小相等的隨機采樣矩陣、Jitter采樣矩陣和分段隨機采樣矩陣,采樣點的缺失率均為50%;圖3e、f、g分別是圖3a經(jīng)過3種采樣矩陣作用得到的3種缺失數(shù)據(jù),可以看出圖3e中存在多連續(xù)道缺失,過多的連續(xù)數(shù)據(jù)缺失是影響重建效果的主要原因。相反,圖3f、g保留了缺失道的隨機性也控制了采樣點的最大間隔,對比圖3c、d可以看出分段隨機采樣的這種控制能力更強。
a—原始數(shù)據(jù);b—隨機采樣矩陣;c—Jitter采樣矩陣;d—分段隨機采樣矩陣;e—完全隨機采樣數(shù)據(jù);f—Jitter采樣數(shù)據(jù);g—分段隨機采樣數(shù)據(jù)a—original data;b—Random sampling matrix;c—Jitter sampling matrix;d—segmented random sampling matrix;e—missing data after random sampling;f—missing data after Jitter sampling;g—missing data after segmented random sampling圖3 原始數(shù)據(jù)、采樣矩陣和缺失數(shù)據(jù)Fig.3 Original data, sampling matrix and missing data
此實驗在使用單一稀疏域進行重建時選用DCT字典和Shearlet字典,它們分別通過DCT變換和Shearlet變換生成,求解算法為FPOCS算法,其迭代次數(shù)均是120次。圖4是利用單一DCT字典的重建結(jié)果和所對應(yīng)的差值剖面。差值剖面通過重建數(shù)據(jù)與原始數(shù)據(jù)作差來得到,在沒有造影參與的情況下可用來表示重建誤差。從圖中可以看出在單一DCT稀疏域中,無論隨機采樣、Jitter采樣和分段隨機采樣都獲得不理想的重建效果。這是因為DCT字典的特征是能量集中且大多數(shù)系數(shù)都集中在低頻,使其在重建較為復(fù)雜的實際資料時具有一定的局限性。對比圖4a、b、c可以明顯的看出,圖4c的同相軸最為光滑、連續(xù),對比圖4d、e、f也可以看出分段隨機采樣的重建誤差的浮值(分段隨機采樣重建誤差絕對值0.03;Jitter采樣重建誤差絕對值0.04;隨機采樣重建誤差絕對值0.06)低于前兩者,這也說明了分段隨機采樣的優(yōu)越性。
a—隨機采樣的DCT重建結(jié)果;b—Jitter采樣的DCT重建結(jié)果;c—分段隨機采樣的DCT重建結(jié)果;d—隨機采樣的DCT差值剖面;e—Jitter采樣的DCT差值剖面;f—分段隨機采樣的DCT差值剖面a—DCT reconstruction result of random sampling;b—DCT reconstruction result of Jitter sampling;c—DCT reconstruction result of segmented random sampling;d—DCT reconstruction result of segmented random sampling;e—DCT difference profile of Jitter sampling;f—DCT difference profile of segmented random sampling圖4 DCT字典重建數(shù)據(jù)與差值剖面Fig.4 Reconstruction results and difference profiles of DCT dictionary
對比圖4和圖5可以發(fā)現(xiàn)單一Shearlet字典總體重建效果遠(yuǎn)好于單一DCT字典。這是因為Shearlet變換是基于具有合成膨脹的仿射系統(tǒng)構(gòu)建的新型多尺度幾何變換,用于對圖像等高維數(shù)據(jù)進行更為稀疏的表示。相比于DCT變換以及其他稀疏變換,Shearlet變換具有更簡單的數(shù)學(xué)結(jié)構(gòu)及更突出的稀疏表示能力?,F(xiàn)階段,綜合時間成本與重建效果的雙重因素,在恢復(fù)實際資料時Shearlet變換是非常實用的選擇。從圖5可以看出無論哪一種采樣方法,Shearlet變換都可以取得良好效果,但觀察圖5d會發(fā)現(xiàn)由于完全隨機采樣的缺點,在連續(xù)多道缺失的地方仍然會存在部分誤差,相比之下Jitter采樣和分段隨機采樣可以很好地解決這一問題。
a—隨機采樣的Shearlet重建結(jié)果;b—Jitter采樣的Shearlet重建結(jié)果;c—分段隨機采樣的Shearlet重建結(jié)果;d—隨機采樣的Shearlet差值剖面;e—Jitter采樣的Shearlet差值剖面;f—分段隨機采樣的Shearlet差值剖面a—Shearlet reconstruction result of random sampling;b—Shearlet reconstruction result of Jitter sampling;c—Shearlet reconstruction result of segmented random sampling;d—Shearlet reconstruction result of segmented random sampling;e—Shearlet difference profile of Jitter sampling;f—Shearlet difference profile of segmented random sampling圖5 Shearlet字典重建數(shù)據(jù)與差值剖面Fig.5 Reconstruction results and differences profile of Shearlet dictionary
圖6展示了Shearlet與DCT字典組合的重建數(shù)據(jù),可以看出重建效果優(yōu)于單一Shearlet字典和單一DCT字典。雖然誤差最大絕對值略高于單一DCT字典誤差最小絕對值(Shearlet+DCT重建誤差絕對值0.04;DCT重建誤差絕對值0.03;Shearlet重建誤差絕對值0.06),但誤差集中于直達波區(qū)域,對后期處理無過大影響,而字典組合的中深層誤差基本為0。對比3種字典的重建結(jié)果也可看出圖6所示結(jié)果的圖像更為干凈,同相軸更為連續(xù)清晰。對比圖6e、f可知,字典組合對重建Jitter采樣數(shù)據(jù)和分段隨機采樣數(shù)據(jù)的效果都很理想,但在對數(shù)據(jù)邊界處理的方面來看,分段隨機采樣仍具有一定優(yōu)勢,兩者差別見圖中紅圈部分。
a—隨機采樣的Shearlet+DCT重建結(jié)果;b—Jitter采樣的Shearlet+DCT重建結(jié)果;c—分段隨機采樣的Shearlet+DCT重建結(jié)果;d—隨機采樣的Shearlet+DCT差值剖面;e—Jitter采樣的Shearlet+DCT差值剖面;f—分段隨機采樣的Shearlet+DCT差值剖面a—Shearlet+DCT reconstruction result of random sampling;b—Shearlet+DCT reconstruction result of Jitter sampling;c—Shearlet+DCT reconstruction result of segmented random sampling;d—Shearlet+DCT reconstruction result of segmented random sampling;e—Shearlet+DCT difference profile of Jitter sampling;f—Shearlet+DCT difference profile of segmented random sampling圖6 字典組合重建結(jié)果及差值剖面Fig.6 Reconstruction results and difference profiles of Dictionary Combination
基于壓縮感知的數(shù)據(jù)重建不只是一個找回丟失數(shù)據(jù)的過程,同樣也是一個提高信噪比的過程。表1展示了3種采樣數(shù)據(jù)在使用不同稀疏字典重建前后的信噪比和峰值信噪比,兩者的計算方法在3.1節(jié)給出。從表中可以看出本文提出方法(分段隨機采樣與Shearlet+DCT組合)的重建結(jié)果無論信噪比和峰值信噪比均有最大的提升。
表1 重建結(jié)果評價參數(shù)Table 1 Evaluation parameters of reconstruction results
不同的拉格朗日乘子數(shù)值對恢復(fù)重建的效果不同。從圖7中可以看出選取拉格朗日乘子為0.95時,重建后信噪比較0.90時具有更高值,圖7a、b的迭代次數(shù)分別是100和200。迭代次數(shù)越多,重建結(jié)果信噪比越高,但也要承擔(dān)相應(yīng)的時間成本。在本文的實驗中,迭代次數(shù)選120次時,已經(jīng)能夠達到很好的重建效果。
圖7 拉格朗日乘子及迭代次數(shù)與重建信噪比Fig.7 Lagrangian multiplier and number of iterations and reconstruction signal-to-noise ratio
為更深地探究地震數(shù)據(jù)重建對信噪比的影響,對含噪合成地震數(shù)據(jù)進行欠采樣及重建實驗。為突出所提方法的優(yōu)勢,選擇DCT、Shearlet、Shearlet+DCT進行實驗,并對比3種方法的重建效果及定量評價值。含噪合成地震記錄共500道,每道含800個時間采樣點。圖8為數(shù)據(jù)的分段隨機采集過程,圖8a、b分別展示了原始數(shù)據(jù)及分段隨機欠采樣數(shù)據(jù)。圖9展示了3種重建方法的重建結(jié)果,從圖中可以看出本文所提方法(Shearlet+DCT字典)的重建數(shù)據(jù)具有更少的噪聲干擾。從表2中可以看出本文所提方法對原始數(shù)據(jù)的信噪比具有明顯提升作用,且提升量高于單一DCT字典與單一Shearlet字典。
a—原始含噪數(shù)據(jù);b—分段隨機采樣50%數(shù)據(jù)a—original noise data;b—50% missing data圖8 含噪合成地震數(shù)據(jù)欠采樣Fig.8 Under sampling of noise synthetic seismic data
a—DCT重建結(jié)果;b—Shearlet重建結(jié)果;c—Shearlet+DCT重建結(jié)果a—DCT reconstruction result;b—Shearlet reconstruction result;c—Shearlet+DCT reconstruction result圖9 三種重建結(jié)果Fig.9 Three reconstruction results
表2 重建結(jié)果評價參數(shù)Table 2 Evaluation parameters of reconstruction results
以上采樣方法基于壓縮感知技術(shù),壓縮感知的理論基礎(chǔ)是隨機采樣方式。但在實際生產(chǎn)中,由于實際工區(qū)地形限制,經(jīng)常會出現(xiàn)地震道連續(xù)缺失的情況,難以滿足隨機采樣的假設(shè),因此我們添加復(fù)雜實際地震圖像連續(xù)缺失重建實驗。本節(jié)不設(shè)置對比實驗,僅驗證所提方法重建連續(xù)缺失地震數(shù)據(jù)的有效性。圖10顯示了分層介質(zhì)的局部圖像。為不失一般性,本文依次從原始圖像中提取出11道和22道,然后使用所提出的方法進行重建。連續(xù)缺失數(shù)據(jù)、重建結(jié)果和重建誤差分別如圖11和圖12所示??梢钥闯觯瑑煞N情況下都能獲得較好的重建結(jié)果,說明所提方法具有一定的空間表示能力,能夠重建有限范圍的連續(xù)缺失道。
圖10 原始剖面Fig.10 Original profile
a—連續(xù)缺失11道圖像;b—重建結(jié)果;c—絕對誤差a—11 consecutive missing images;b—reconstruction result;c—absolute error圖11 連續(xù)缺失11道Shearlet+DCT重建Fig.11 Shearlet+DCT reconstruction of 11 consecutive missing
a—連續(xù)缺失22道圖像;b—重建結(jié)果;c—絕對誤差a—22 consecutive missing images;b—reconstruction result;c—absolute error圖12 連續(xù)缺失22道Shearlet+DCT重建Fig.12 Shearlet+DCT reconstruction of 22 consecutive missing
由于缺道壞道等問題,地震數(shù)據(jù)往往是不完整的。從反演的角度看,不完整圖像重建是一個病態(tài)反問題。CS技術(shù)利用較少的隨機采樣數(shù)據(jù)重構(gòu)出完整信號,其主要思想是利用信號在某一變換域的稀疏性。
本文在MCA框架下提出了一種新的字典組合:Shearlet+DCT。Shearlet變換是多尺度、多方向的,可以得到更稀疏的系數(shù),DCT是一種用于重建平滑構(gòu)造的全局型變換。因此,Shearlet+DCT得到的信號系數(shù)更加稀疏,無論對局部細(xì)節(jié)還是整體圖像趨勢都有很好的重建效果。通過數(shù)值實驗對Shearlet、DCT和Shearlet+DCT這3種方法進行了比較。結(jié)果表明,本文提出方法的重建結(jié)果的相對誤差較小,可以很好地重建局部細(xì)節(jié)和深弱反射信號。但隨著數(shù)據(jù)的復(fù)雜度的提升,數(shù)學(xué)變換的局限性會逐漸暴露出來。我們現(xiàn)在也在使用學(xué)習(xí)算法來訓(xùn)練自適應(yīng)基函數(shù),以獲得更好的結(jié)果。
本文還證明了分段隨機采樣比Jitter采樣更有利于數(shù)據(jù)重建。CS的理論基礎(chǔ)是隨機采樣,但在實際應(yīng)用中,地震道往往在大范圍內(nèi)連續(xù)缺失,難以滿足隨機采樣的假設(shè)。對于有限數(shù)量的連續(xù)缺失案例,本文提出的重建方法也是有效的。但對于大連續(xù)缺失區(qū)域,例如超過 22 道連續(xù)缺失,重建結(jié)果并不是很理想。經(jīng)反復(fù)實驗,我們得出對于復(fù)雜實際資料來說,壓縮感知可以接受原始數(shù)據(jù)10%以內(nèi)的連續(xù)缺失,這一范圍隨數(shù)據(jù)量的大小、數(shù)據(jù)復(fù)雜程度及層位密集程度的整加而減小,隨三者的降低而增加。因此,下一步的研究重點將是開發(fā)大連續(xù)缺失信號的空間表達,利用有限的信息進行重建并開發(fā)更好的重建方法,如字典學(xué)習(xí)或機器學(xué)習(xí)重建方法等。