,,
(長江大學(xué)電子信息學(xué)院,湖北 荊州 434023) (長江大學(xué)地球物理與石油資源學(xué)院,湖北 武漢 430100)
針對地震勘探數(shù)據(jù)壓縮的JPEG 2000算法改進(jìn)
張正炳,楊順遼,徐鋒濤桂志先
(長江大學(xué)電子信息學(xué)院,湖北荊州434023) (長江大學(xué)地球物理與石油資源學(xué)院,湖北武漢430100)
為減輕海量地震數(shù)據(jù)給地震勘探的遠(yuǎn)程質(zhì)量監(jiān)督所帶來的巨大壓力,對靜止圖像壓縮標(biāo)準(zhǔn)JPEG2000算法進(jìn)行了適當(dāng)改進(jìn):去掉了原編碼算法中用于均值調(diào)整的預(yù)處理和用于色彩處理的分量間變換2個(gè)部分及其在解碼器中的對應(yīng)部分,改進(jìn)了數(shù)據(jù)輸入輸出的動(dòng)態(tài)范圍和編解碼器所能表示的數(shù)據(jù)動(dòng)態(tài)范圍,使其與地震數(shù)據(jù)的大動(dòng)態(tài)范圍相匹配。利用改進(jìn)后的算法對地震數(shù)據(jù)進(jìn)行壓縮試驗(yàn),結(jié)果表明,對疊前數(shù)據(jù)壓縮5倍以下時(shí),信噪比高于42dB,效果較好,對疊后數(shù)據(jù)壓縮15倍以下時(shí),信噪比高于30dB。
地震數(shù)據(jù)壓縮,JPEG2000,地震勘探
地震勘探是目前最主要的油氣勘探方法,為了提髙地震資料的成像精度和分辨率,利用超萬道地震儀器來實(shí)施兩寬一高(寬頻寬方位高密度)和多波多分量勘探,使得地震勘探數(shù)據(jù)量呈爆炸性增長,無論是地震儀器采集的數(shù)據(jù)還是處理中的道集數(shù)據(jù)都達(dá)到TB級(jí),是名副其實(shí)的海量數(shù)據(jù)。在采集方面,利用一套無線地震數(shù)據(jù)采集系統(tǒng)GSR,每天采集的數(shù)據(jù)達(dá)到2TB左右[1]。新疆油田近年來在準(zhǔn)噶爾盆地瑪湖地區(qū)部署的多塊高密度三維勘探中,MC井區(qū)三維面元12.5m×12.5m,炮道密度806.4萬道/km2,采集的數(shù)據(jù)高達(dá)60TB[2]。在處理方面,以方位各向異性分析為核心的OVT(炮檢距向量片)域疊前地震屬性分析,充分利用疊前地震資料蘊(yùn)含的地質(zhì)信息和流體信息,可更有效地進(jìn)行儲(chǔ)層預(yù)測,是寬方位高密度地震勘探的配套技術(shù)。將利用OVT技術(shù)處理得到的疊前地震道集稱為OVT道集,則一個(gè)中型地震工區(qū)的OVT道集總數(shù)據(jù)量可達(dá)5~10TB[3]。另據(jù)統(tǒng)計(jì),在過去數(shù)年間,單位勘探面積的地震數(shù)據(jù)量增長超過了35倍,單個(gè)地震數(shù)據(jù)體的規(guī)模也已超過100TB[4]。
海量數(shù)據(jù)給地震勘探數(shù)據(jù)的傳輸、處理和存儲(chǔ)提出了嚴(yán)峻挑戰(zhàn)。海量數(shù)據(jù)給地震數(shù)據(jù)的存儲(chǔ)所帶來的主要問題是要占用極大的存儲(chǔ)空間,從而增加存儲(chǔ)成本;給傳輸所帶來的主要問題是極大地增加了傳輸帶寬需求,同時(shí)也增加了傳輸時(shí)間。而海量地震數(shù)據(jù)的傳輸又不可避免,這是因?yàn)樵诘卣鹂碧降臄?shù)據(jù)采集與處理過程中,常常需要從邊遠(yuǎn)地區(qū)、海上甚至國外通過衛(wèi)星或其他途徑傳輸?shù)交剡M(jìn)行處理[5,6];在地震資料處理和解釋過程中,也經(jīng)常需要在工作站之間通過局域網(wǎng)傳輸數(shù)據(jù)[6]。更嚴(yán)重的是,因數(shù)據(jù)量太大、傳輸時(shí)間過長往往會(huì)導(dǎo)致網(wǎng)絡(luò)斷線而必須重傳,甚至可能完成不了完整的數(shù)據(jù)傳輸,以致所接收到的數(shù)據(jù)無法使用,這給跨國或跨探區(qū)作業(yè)的地震勘探質(zhì)量監(jiān)督帶來了困難。因此,海量地震數(shù)據(jù)在存儲(chǔ)、傳輸和處理過程中迫切需要壓縮。
地震勘探數(shù)據(jù)壓縮方法按照有無信息丟失可分為無損壓縮和有損壓縮2大類。無損壓縮方法能保證解壓數(shù)據(jù)與原始數(shù)據(jù)完全一樣,因此特別適合于對解壓后還需要做進(jìn)一步處理的地震數(shù)據(jù)進(jìn)行壓縮,但其壓縮效率低,一般壓縮倍數(shù)在2倍左右。有損壓縮在允許有少量信息損失的情況下可以獲得高倍壓縮,該方法壓縮倍數(shù)較高,但存在信息丟失。
JPEG2000算法[7]是JPEG[8]的升級(jí)版本,支持圖像數(shù)據(jù)的有損和無損壓縮,壓縮率比JPEG高約30%,實(shí)現(xiàn)了圖像的漸進(jìn)傳輸,支持感興趣區(qū)域編碼,并采用離散小波變換(DWT)克服了JPEG采用離散余弦變換(DCT)導(dǎo)致在高倍壓縮時(shí)方塊效應(yīng)明顯的缺點(diǎn),在靜態(tài)醫(yī)學(xué)圖像壓縮[9]、遙感影像壓縮[10]、無線圖像傳輸[11]、地震數(shù)據(jù)準(zhǔn)無損壓縮[12]和圖像聯(lián)合壓縮加密[13]等許多方面得到應(yīng)用。但由于JPEG2000是針對小動(dòng)態(tài)范圍的圖像數(shù)據(jù)而設(shè)計(jì)的,不能直接用于超大動(dòng)態(tài)范圍的地震數(shù)據(jù)有損壓縮,所以對JPEG2000核心算法進(jìn)行適當(dāng)改進(jìn)后用于地震勘探數(shù)據(jù)壓縮,對于在跨國或跨探區(qū)作業(yè)的地震勘探質(zhì)量監(jiān)督中降低遠(yuǎn)程數(shù)據(jù)傳輸帶寬要求和有效縮短傳輸時(shí)間,從而降低數(shù)據(jù)傳輸成本具有重要實(shí)際意義。
JPEG2000算法的核心編解碼結(jié)構(gòu)[7]如圖1所示,由編碼器和解碼器所構(gòu)成。其中,編碼器由預(yù)處理、正向分量間變換、正向分量內(nèi)變換、量化、Tier-1編碼器、Tier-2編碼器和位率控制等7部分組成;解碼器對應(yīng)地由后處理、反向分量內(nèi)變換、反向分量間變換、反量化、Tier-1譯碼器、Tier-2譯碼器等6部分組成。由于解碼是編碼的逆過程,所以解碼器中的每個(gè)組成部分的運(yùn)算都分別與編碼器中的對應(yīng)部分相逆。
圖1 JPEG2000算法編解碼結(jié)構(gòu)
在圖1中,預(yù)處理和后處理互為逆過程,是針對像素值為無符號(hào)整數(shù)的圖像數(shù)據(jù)而設(shè)計(jì)的,目的是為了將均值非零的原始數(shù)據(jù)調(diào)整成均值為零的數(shù)據(jù),以利于有效編碼。正向分量間變換和反向分量間變換互為逆過程,是針對多分量的圖像數(shù)據(jù)(如R、G、B 3分量彩色圖像等)而設(shè)計(jì)的,目的是減少各分量間的冗余,以便提高壓縮倍數(shù)。正向分量內(nèi)變換和反向分量內(nèi)變換分別完成小波正變換和小波反變換,有Mallat分解算法和小波提升方案2種算法可選。Tier-1編碼器和Tier-2編碼器用于實(shí)現(xiàn)優(yōu)化截?cái)嗲度雺K編碼算法(EBCOT:Embedded Block Coding with Optimized Truncation),而Tier-1譯碼器和Tier-2譯碼器用于實(shí)現(xiàn)對應(yīng)的解碼算法。
JPEG2000算法是針對圖像數(shù)據(jù)而設(shè)計(jì)的,而地震勘探數(shù)據(jù)與圖像數(shù)據(jù)之間存在很大差異,不能直接將JPEG2000用于地震數(shù)據(jù)壓縮,因此需要對其進(jìn)行適當(dāng)改進(jìn)。為使JPEG2000算法適合于地震數(shù)據(jù)壓縮,對其進(jìn)行改進(jìn)的思路如下:
1)圖像數(shù)據(jù)一般是具有3個(gè)分量的彩色圖像數(shù)據(jù),每個(gè)分量都是無符號(hào)整數(shù),因此需要利用預(yù)處理將各分量變成均值為零的有符號(hào)數(shù)據(jù);而地震勘探數(shù)據(jù)本身就是單分量、零均值的數(shù)據(jù),因此不需進(jìn)行預(yù)處理和正向分量間變換;
2)圖像數(shù)據(jù)的每個(gè)分量一般是8位的無符號(hào)整數(shù),因此其表示范圍只是0~255,動(dòng)態(tài)范圍很?。欢卣鹂碧綌?shù)據(jù)一般為使用24位模數(shù)轉(zhuǎn)換器采集、并用SEG-Y格式記錄的32位IBM浮點(diǎn)數(shù),動(dòng)態(tài)范圍非常大,遠(yuǎn)遠(yuǎn)大于圖像數(shù)據(jù)的動(dòng)態(tài)范圍。但是,原始的JPEG2000編解碼算法只適合于壓縮較小動(dòng)態(tài)范圍的圖像數(shù)據(jù),而無法直接用于壓縮超大動(dòng)態(tài)范圍地震數(shù)據(jù)。因此,必須擴(kuò)大其可表示數(shù)據(jù)的動(dòng)態(tài)范圍,以便與地震勘探數(shù)據(jù)的動(dòng)態(tài)范圍相適應(yīng)。
3)小波提升方案更適合于地震數(shù)據(jù)分解的優(yōu)良特性。
根據(jù)改進(jìn)思路對JPEG2000算法作如下改進(jìn):
1)刪除圖1中編碼器的預(yù)處理、正向分量間變換及其解碼器的對應(yīng)部分;
2)采用提升方案進(jìn)行小波正變換和反變換;
3)改進(jìn)編解碼器所能表示的數(shù)據(jù)動(dòng)態(tài)范圍以及原始數(shù)據(jù)輸入和重建數(shù)據(jù)輸出動(dòng)態(tài)范圍,使其適應(yīng)大動(dòng)態(tài)范圍的地震勘探數(shù)據(jù)輸入、輸出和編解碼。
圖2 改進(jìn)后的JPEG2000算法流程圖
改進(jìn)后的JPEG2000算法流程如圖2所示。利用改進(jìn)算法壓縮地震數(shù)據(jù)的過程是,首先對二維原始地震數(shù)據(jù)進(jìn)行5層W5/3小波提升變換,以便將絕大部分能量集中在少數(shù)低頻子帶系數(shù)上;然后經(jīng)過量化操作,去除一定的冗余信息;之后讓變換系數(shù)經(jīng)過Tier-1編碼,利用8鄰域系數(shù)上下文對變換系數(shù)的重要性進(jìn)行預(yù)測,經(jīng)MQ算術(shù)編碼器得到編碼比特流;最后通過Tier-2編碼部分,將比特流分段形成多個(gè)質(zhì)量層,根據(jù)預(yù)先所設(shè)定的壓縮比特率選擇丟棄最不重要的幾個(gè)質(zhì)量層,以形成最終的壓縮數(shù)據(jù)。解壓縮是壓縮的逆過程,對壓縮數(shù)據(jù)解壓縮得到重建地震數(shù)據(jù)。
在地震數(shù)據(jù)壓縮方面,還沒有能夠反映因壓縮所產(chǎn)生的信息丟失對后續(xù)處理結(jié)果的影響程度的技術(shù)指標(biāo)。目前,用于評價(jià)解壓數(shù)據(jù)質(zhì)量的常用技術(shù)指標(biāo)有信噪比、相對誤差、能量比、能量損失和重建精度等,而這些指標(biāo)之間具有一定的關(guān)聯(lián),因此,筆者選用目前用得較多的信噪比(SNR)作為評價(jià)解壓數(shù)據(jù)質(zhì)量的技術(shù)指標(biāo)。
表1 對疊前數(shù)據(jù)壓縮5~20倍和對疊后數(shù)據(jù)壓縮5~120倍的SNR
利用改進(jìn)算法分別對512道、每道512樣點(diǎn)的SEG-Y格式疊前原始地震數(shù)據(jù)(其局部顯示見圖3)和疊后原始地震數(shù)據(jù)(其局部顯示見圖4)進(jìn)行壓縮和解壓縮試驗(yàn),并將根據(jù)原始數(shù)據(jù)和解壓重建之間的差值計(jì)算得到的信噪比(SNR)作為衡量重建數(shù)據(jù)質(zhì)量的技術(shù)指標(biāo)。SNR值越大,表明重建數(shù)據(jù)的信息丟失越少,質(zhì)量就越好。對疊前數(shù)據(jù)壓縮5~20倍和對疊后數(shù)據(jù)壓縮5~120倍的SNR如表1所示。由表1可見,在保持SNR值相近的情況下,對疊后數(shù)據(jù)的壓縮倍數(shù)遠(yuǎn)高于疊前數(shù)據(jù);而在保持壓縮倍數(shù)相同的情況下,疊后數(shù)據(jù)的SNR值遠(yuǎn)高于疊前數(shù)據(jù)。該結(jié)果表明,疊前數(shù)據(jù)比疊后數(shù)據(jù)難以壓縮,主要原因是疊前數(shù)據(jù)是未經(jīng)任何處理的野外采集數(shù)據(jù),與經(jīng)過濾波和疊加等系列處理后的疊后數(shù)據(jù)相比,其中含有更高的頻率成分和更多的噪聲。因此,在壓縮疊前數(shù)據(jù)的同時(shí),對噪聲進(jìn)行適當(dāng)壓制既可提高壓縮倍數(shù),又可突出有效信號(hào),將為疊前數(shù)據(jù)壓縮方法的研究提供新的思路。
圖3 原始疊前數(shù)據(jù)
對疊前數(shù)據(jù)壓縮5倍(SNR=42.39dB)和15倍(SNR=12.3dB)后的解壓重構(gòu)數(shù)據(jù)的對應(yīng)局部顯示如圖5所示,與圖3對比可見,當(dāng)壓縮倍數(shù)在15倍以下時(shí),重建數(shù)據(jù)與原始數(shù)據(jù)的剖面顯示并無明顯差別。綜合分析表1、圖3、圖5和圖6的結(jié)果可知,當(dāng)利用改進(jìn)算法對疊前數(shù)據(jù)壓縮5倍以下時(shí),信噪比可達(dá)42dB以上,保真度較高;但當(dāng)壓縮倍數(shù)超過10倍以后,信噪比降到20dB以下,造成較大失真,筆者認(rèn)為會(huì)對后續(xù)處理產(chǎn)生較大不利影響。當(dāng)對疊前數(shù)據(jù)壓縮15倍時(shí),其地震剖面顯示效果與原始數(shù)據(jù)并無明顯差異,故可用于地震勘探過程中的遠(yuǎn)程質(zhì)量監(jiān)控。
圖4 原始疊后數(shù)據(jù)
對疊后數(shù)據(jù)壓縮20倍(SNR=25.1dB)和60倍(SNR=17.36dB)后的重構(gòu)數(shù)據(jù)的對應(yīng)局部顯示如6所示,與圖4對比可見,當(dāng)壓縮倍數(shù)在60以下時(shí),重建數(shù)據(jù)與原始數(shù)據(jù)的剖面顯示也無明顯差別。綜合分析表1、圖4、圖6的結(jié)果可知,當(dāng)用改進(jìn)算法對疊后數(shù)據(jù)壓縮15倍以下時(shí),信噪比可達(dá)30dB以上,肉眼不能分辨重構(gòu)結(jié)果與原始數(shù)據(jù)之間的差別,可以用于處理過程中的質(zhì)量監(jiān)督;但當(dāng)壓縮倍數(shù)超過30以后,信噪比下降到20dB以下,造成較大失真,會(huì)對后續(xù)處理產(chǎn)生較大的不利影響。由于當(dāng)壓縮倍數(shù)在60以下時(shí),重建數(shù)據(jù)的剖面顯示與原始數(shù)據(jù)無明顯差異,所以仍然可以用于處理過程中的質(zhì)量監(jiān)督。
圖6 對原始疊后數(shù)據(jù)壓縮的重構(gòu)結(jié)果
對JPEG2000算法進(jìn)行了改進(jìn)并將其用于疊前和疊后地震數(shù)據(jù)壓縮,試驗(yàn)結(jié)果表明,對疊前數(shù)據(jù)壓縮5倍以下時(shí),信噪比高于42dB,效果較好,對疊后數(shù)據(jù)壓縮15倍以下時(shí),信噪比高于30dB。當(dāng)需要對壓縮重建數(shù)據(jù)作后續(xù)處理時(shí),壓縮倍數(shù)不宜太大,若只是用于質(zhì)量監(jiān)督,則可對疊前數(shù)據(jù)和疊后數(shù)據(jù)分別壓縮15倍和60倍左右。由于筆者所采用的信噪比與油氣分析結(jié)果沒有直接關(guān)聯(lián)而無法準(zhǔn)確評價(jià)編解碼效果,因此在以后的研究中擬采用測井資料或過井剖面來協(xié)助分析壓縮失真對后期油氣分析的影響程度。
[1]聶明濤,張慕剛,丁冠東,等. GSR無線節(jié)點(diǎn)采集技術(shù)在地震勘探中的應(yīng)用[J]. 石油管材與儀器,2016,2(4):68~71.
[2] 竇強(qiáng)峰,妥軍軍,蔣在超,等. 準(zhǔn)噶爾盆地瑪湖地區(qū)高密度地震勘探中靜校正問題解決方法[J]. 新疆地質(zhì),2016,34(4):552~555.
[3] 詹仕凡,陳茂山,李磊,等. OVT域?qū)挿轿化B前地震屬性分析方法[J]. 石油地球物理勘探,2015,50(5):956~966.
[4] 文佳敏,趙長海,侯紅軍,等. GeoEast海量地震數(shù)據(jù)高效處理技術(shù)[J]. 石油工業(yè)計(jì)算機(jī)應(yīng)用,2016,24(3):12~19.
[5] 馮占林,張學(xué)工,李衍達(dá). 基于小波變換的地震勘探數(shù)據(jù)壓縮的工程分析[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2001, 41(4/5):170~173.
[6] 吳繼偉,孔祥茜,岳繼光. 地震數(shù)據(jù)的小波變換壓縮方法[J]. 電子技術(shù)應(yīng)用,2006,(1):34~36.
[7] ISO/IEC JTC 1/SC 29/WG 1 N 2412,The JPEG-2000 Still Image Compression Standard[S].
[8] Pennebaker W B, Mitchell J L. JPEG still image data compression standard[M]. New York: Van Nostrand Reinhold, 1993.
[9] 衛(wèi)俊霞,焦國華,高曉惠.基于JPEG2000 的靜態(tài)醫(yī)學(xué)圖像壓縮設(shè)計(jì)方案[J]. 計(jì)算機(jī)工程,2007,33(8):213~215.
[10] 盧 亮,吳善明,鄧術(shù)軍. 面向遙感影像的JPEG2000優(yōu)化壓縮算法[J]. 計(jì)算機(jī)工程,2010,36(2):203~205,208.
[11] 劉錦楊,戚飛虎.一種基于JPEG2000的無線圖像傳輸方法[J]. 計(jì)算機(jī)工程,2004,30(13):140~142.
[12] 孫寰宇,武文波,楊志高.基于JPEG2000的地震數(shù)據(jù)準(zhǔn)無損壓縮[J]. 計(jì)算機(jī)工程與應(yīng)用,2005,41(16):185~188.
[13] 謝凱明,鄧家先,陳益剛. 基于JPEG2000的圖像聯(lián)合壓縮加密算法[J]. 計(jì)算機(jī)應(yīng)用研究,2014,31(12):3695~3699.
[編輯]易國華
2017-08-19
張正炳(1961-),男,博士,教授,現(xiàn)主要從事數(shù)據(jù)壓縮方面的教學(xué)與研究工作,zhangzb@yangtzeu.edu.cn。
引著格式張正炳,楊順遼,徐鋒濤,等.針對地震勘探數(shù)據(jù)壓縮的JPEG 2000算法改進(jìn)[J].長江大學(xué)學(xué)報(bào)(自科版),2017,14(21):1~6.
TP391
A
1673-1409(2017)21-0001-06