鄒德江 ,謝關(guān)寶
(1.中國石化石油勘探開發(fā)有限公司,北京 100029;2.中國石化石油工程技術(shù)研究院)
?
大數(shù)據(jù)時代的現(xiàn)代測井解釋技術(shù)探討
鄒德江1,謝關(guān)寶2
(1.中國石化石油勘探開發(fā)有限公司,北京 100029;2.中國石化石油工程技術(shù)研究院)
大數(shù)據(jù)分析技術(shù)已經(jīng)成為時代變革的力量,國內(nèi)外一些石油公司及科研院所也開始嘗試著在石油勘探開發(fā)中使用這種技術(shù)。在測井資料解釋領(lǐng)域是否可以應(yīng)用大數(shù)據(jù)分析技術(shù),以提高測井解釋精度與勘探開發(fā)效益,是當(dāng)代測井從業(yè)人員值得思考的問題。在分析傳統(tǒng)測井資料處理解釋技術(shù)與大數(shù)據(jù)分析技術(shù)特點(diǎn)的基礎(chǔ)上,論述了測井資料處理解釋大數(shù)據(jù)分析面臨的挑戰(zhàn)與技術(shù)難點(diǎn),同時提出一種基于大數(shù)據(jù)分析技術(shù)的測井資料處理分析方法,并給出了詳細(xì)實(shí)現(xiàn)過程。展望未來,測井從業(yè)人員需要從理論、技術(shù)、實(shí)踐三個方面來面對大數(shù)據(jù)分析技術(shù)對傳統(tǒng)測井解釋技術(shù)的挑戰(zhàn)。
大數(shù)據(jù);測井解釋;數(shù)據(jù)驅(qū)動;數(shù)據(jù)挖掘;云計(jì)算
傳統(tǒng)測井資料處理解釋方法是通過實(shí)驗(yàn)、經(jīng)驗(yàn)、數(shù)學(xué)物理統(tǒng)計(jì)等方式建立模型,測井資料處理解釋人員根據(jù)資料所處地層不同、選擇合適模型與參數(shù),然后進(jìn)行資料的處理與綜合解釋;處理分析過程一般可以分為數(shù)據(jù)的獲取、數(shù)據(jù)預(yù)處理、服務(wù)性程序、數(shù)據(jù)處理、成果顯示與輸出等五個步驟。每個步驟都產(chǎn)生不同類型的信息,如處理流程的選擇、處理模型的選擇與優(yōu)化、處理參數(shù)的選擇、解釋結(jié)果的確定與優(yōu)化等[1],這些信息是具有大數(shù)據(jù)的顯著特點(diǎn)(大量(Volume)、高速(Velocity)、多樣(Variety)、價值(value))。在現(xiàn)有的測井資料處理解釋軟件中,這些寶貴信息有些被儲存下來了,但大部分信息還沒有儲存或者利用起來。如何儲存、加工、利用這些寶貴的大數(shù)據(jù),使這些信息及數(shù)據(jù)實(shí)現(xiàn)“增值”,是現(xiàn)代測井解釋工程師在大數(shù)據(jù)時代面臨的機(jī)遇與挑戰(zhàn)。
維基百科、Gartner、IDC及一些咨詢公司給大數(shù)據(jù)有不同的定義,總的來看,大數(shù)據(jù)是指在互聯(lián)網(wǎng)、云計(jì)算等技術(shù)飛速發(fā)展的背景下,產(chǎn)生的需要新的技術(shù)和手段才能處理的,具有規(guī)模大、速度快、類型多且價值密度低等特點(diǎn)的各類數(shù)據(jù)資源。
數(shù)據(jù)資源是現(xiàn)代社會的一種新的自然資源,只有經(jīng)過提煉才能發(fā)揮其最大價值,大數(shù)據(jù)的分析方法是決定最終大數(shù)據(jù)是否有價值的決定因素。大數(shù)據(jù)分析一般具有以下五個方面特征。
(1)預(yù)測性分析能力。數(shù)據(jù)挖掘可以讓分析員更好地理解數(shù)據(jù),預(yù)測性分析可以讓分析人員根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出一些預(yù)測性的判斷。
(2)數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理是一些管理方面的最佳實(shí)踐。通過標(biāo)準(zhǔn)化的流程和工具對數(shù)據(jù)進(jìn)行處理可以保證一個預(yù)先定義好的高質(zhì)量的分析結(jié)果。
(3)可視化分析。不管是對數(shù)據(jù)分析專家還是普通用戶,數(shù)據(jù)可視化是數(shù)據(jù)分析工具最基本的要求??梢暬梢灾庇^地展示數(shù)據(jù),讓數(shù)據(jù)自己說話,讓觀眾聽到、看到結(jié)果。
(4)語義引擎。非結(jié)構(gòu)化數(shù)據(jù)復(fù)雜性與多樣性給數(shù)據(jù)分析帶來了新的挑戰(zhàn),需要一系列的新工具去解析、提取、分析數(shù)據(jù)。語義引擎需要被設(shè)計(jì)成能夠從“文檔”中智能提取信息。
(5)數(shù)據(jù)挖掘算法。可視化是給人看的,數(shù)據(jù)挖掘就是給機(jī)器看的。集群、分割、孤立點(diǎn)分析還有其他的算法讓我們深入數(shù)據(jù)內(nèi)部,挖掘價值。這些算法不僅要處理大數(shù)據(jù)的量,也要處理大數(shù)據(jù)的速度。
大數(shù)據(jù)分析技術(shù)的戰(zhàn)略意義不在于掌握這些龐大的數(shù)據(jù)信息,而在于對這些含有特定意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
2.1 石油勘探開發(fā)大數(shù)據(jù)應(yīng)用趨勢
石油勘探開發(fā)是一個認(rèn)識與再認(rèn)識的過程,其中涉及到多學(xué)科與多專業(yè)的協(xié)同工作。在勘探開發(fā)過程中產(chǎn)生的數(shù)據(jù)具有學(xué)科復(fù)雜、類型多樣及規(guī)模巨大的特點(diǎn),具有天然的大數(shù)據(jù)特征。目前國內(nèi)外石油勘探開發(fā)已經(jīng)在這方面做了許多有益的嘗試,如鉆井作業(yè)中的套管卡管預(yù)測、采油生產(chǎn)狀態(tài)預(yù)測、生產(chǎn)設(shè)備預(yù)見性維護(hù)、管道腐蝕預(yù)見性維護(hù)、測井?dāng)?shù)據(jù)預(yù)測產(chǎn)量等,綜合國內(nèi)外應(yīng)用看,石油勘探開發(fā)行業(yè)大數(shù)據(jù)引用有如下趨勢:
(1)越來越多的油公司開始關(guān)注大數(shù)據(jù)自動采集和設(shè)備遠(yuǎn)程控制;
(2)據(jù)統(tǒng)計(jì),國際石油公司約75%信息投入與大數(shù)據(jù)有關(guān),經(jīng)過大數(shù)據(jù)分析與優(yōu)化,油公司至少可以提高6%的采收率和8%的產(chǎn)量(數(shù)據(jù)來自IBM);
(3)國際油公司在開展大數(shù)據(jù)業(yè)務(wù)時,一般按“大數(shù)據(jù)—小場景—高回報(bào)”的策略,快速實(shí)現(xiàn)業(yè)務(wù)價值。
2.2 測井解釋與大數(shù)據(jù)分析
測井解釋評價軟件是測井資料處理與評價的重要工具與載體,是運(yùn)用各種現(xiàn)代技術(shù)綜合解決地質(zhì)問題的重要手段,是測井解釋技術(shù)能力的綜合體現(xiàn),也是衡量測井技術(shù)水平的一個重要指標(biāo)。
國內(nèi)外石油服務(wù)公司都十分注重相關(guān)專業(yè)軟件的開發(fā)工作,相繼開發(fā)了自己的測井資料處理解釋系統(tǒng)。國外具代表性的公司有斯倫貝謝、貝克休斯、哈里伯頓、帕拉代姆、IP,各家解釋軟件及相應(yīng)處理平臺如表1所示,國內(nèi)具有代表性的公司有中國石油、中國石化、石大油軟和吉奧特等幾家公司,各家解釋軟件及相應(yīng)的處理解釋平臺如表2所示。
綜合國內(nèi)外測井處理解釋軟件來看,測井資料處理解釋軟件發(fā)展具有以下趨勢:
表1 國外測井資料處理解釋平臺統(tǒng)計(jì)
表2 國內(nèi)測井資料處理解釋平臺統(tǒng)計(jì)
(1)系統(tǒng)應(yīng)用平臺由Unix系統(tǒng)向Windows系統(tǒng)轉(zhuǎn)變;
(2)處理系統(tǒng)從針對單一廠商研發(fā)向適應(yīng)多廠商發(fā)展;
(3)多學(xué)科融合,測錄井評價從單井儲層參數(shù)分析為主,向工程應(yīng)用、地質(zhì)分析和區(qū)域評價等方向拓展;
(4)資料解釋從二維剖面解釋向三維化參數(shù)評價發(fā)展;
(5)系統(tǒng)數(shù)據(jù)采用數(shù)據(jù)庫與文件管理并存;
(6)系統(tǒng)功能模塊多以圖標(biāo)+菜單式管理,且提供豐富的二次開發(fā)工具。
在面對大數(shù)據(jù)時代對傳統(tǒng)測井資料處理解釋帶來理念沖擊的同時,針對測井解釋大數(shù)據(jù),還需要積極做好技術(shù)準(zhǔn)備。對測井?dāng)?shù)據(jù)進(jìn)行大數(shù)據(jù)處理分析,首先需要構(gòu)建可以進(jìn)行大數(shù)據(jù)分析的數(shù)據(jù)基礎(chǔ),其次要研究針對測井行業(yè)數(shù)據(jù)的大數(shù)據(jù)分析方法,最后形成可以對測井大數(shù)據(jù)進(jìn)行查詢、使用、分析等進(jìn)行智能觸發(fā)機(jī)制或數(shù)據(jù)驅(qū)動軟件平臺,以良好的人機(jī)交互,發(fā)掘測井解釋大數(shù)據(jù)的最大價值。
3.1 關(guān)鍵技術(shù)分析
3.1.1 分類信息數(shù)據(jù)采集
測井?dāng)?shù)據(jù)庫:存放野外采集到的各種測井?dāng)?shù)據(jù)。
綜合數(shù)據(jù)庫:地質(zhì)、鉆井、錄井、測試、實(shí)驗(yàn)等數(shù)據(jù)(可借助現(xiàn)有各專業(yè)數(shù)據(jù)庫)。
業(yè)務(wù)流程庫:梳理測井處理解釋及綜合研究流程,建立對研究目標(biāo)適用的、有效經(jīng)驗(yàn)的測井處理解釋綜合研究流程庫。
分析基礎(chǔ)庫:記錄測井處理解釋對數(shù)據(jù)的訪問、對應(yīng)的人員、處理流程、服務(wù)程序及其相應(yīng)的變化(參數(shù)、服務(wù)程序、模型的選擇、解釋結(jié)果的確定等變化)。
人員信息庫:存放處理解釋人員個人信息,包括個人成功案例與失敗案例、研究成果、多個服務(wù)程序的熟練程度等。
分析成果庫:將大數(shù)據(jù)分析的結(jié)果進(jìn)行記錄,累積豐富的大數(shù)據(jù)分析經(jīng)驗(yàn)。
數(shù)據(jù)驅(qū)動庫:在測井?dāng)?shù)據(jù)庫、綜合數(shù)據(jù)庫、分析基礎(chǔ)庫、人員信息庫、分析成果庫中進(jìn)行數(shù)據(jù)查詢和使用之前增加簡捷的詢問,如本數(shù)據(jù)用于什么區(qū)域、什么井、服務(wù)程序等,為進(jìn)行數(shù)據(jù)驅(qū)動提供大數(shù)據(jù)分析的基礎(chǔ)。記錄其數(shù)據(jù)使用足跡,在使用該數(shù)據(jù)前使用了哪些數(shù)據(jù),在使用后又使用了哪些數(shù)據(jù),最終又產(chǎn)生了哪些數(shù)據(jù)[2-3]。
3.1.2 數(shù)據(jù)的存儲與導(dǎo)入
存儲系統(tǒng)是大數(shù)據(jù)應(yīng)用中最核心的數(shù)據(jù)基礎(chǔ),它不再是傳統(tǒng)分散、單一的底層設(shè)備,除具備傳統(tǒng)數(shù)據(jù)存儲的高性能、高安全、高可靠等特征之外,為滿足大數(shù)據(jù)處理應(yīng)用的需要,還應(yīng)具有虛擬化、自動分層、并行分布、全局緩存加速、彈性擴(kuò)展、異構(gòu)資源整合等多方面的特點(diǎn)。
在測井分類信息數(shù)據(jù)采集中,還要大量導(dǎo)入其他專業(yè)數(shù)據(jù)庫,把這些綜合數(shù)據(jù)導(dǎo)入到一個集中的大型分布式數(shù)據(jù)庫,或者分布式存儲集群,在導(dǎo)入基礎(chǔ)上做一些簡單的“清洗”和預(yù)處理工作。這些都給測井解釋大數(shù)據(jù)庫的建立與管理帶來巨大挑戰(zhàn)。
3.1.3 數(shù)據(jù)分析技術(shù)
針對需要進(jìn)行的地質(zhì)任務(wù),需要自動梳理數(shù)據(jù)集、服務(wù)程序及工作流程,并根據(jù)以往處理進(jìn)行參數(shù)選擇,同時需要記錄訪問的數(shù)據(jù),在進(jìn)行數(shù)據(jù)訪問時,依據(jù)關(guān)聯(lián)進(jìn)行訪問提示。對各階段的成果,依據(jù)數(shù)據(jù)使用的流程、分析的流程和對目標(biāo)的認(rèn)知程度進(jìn)行評判,并提示。根據(jù)成果的檢驗(yàn),確定是否累積到大數(shù)據(jù)庫中。
3.1.4 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘與數(shù)據(jù)分析技術(shù)的分析過程與傳統(tǒng)統(tǒng)計(jì)分析不同,一般不預(yù)先設(shè)定主題,主要根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行基于各種算法的計(jì)算,從而起到預(yù)測的效果,實(shí)現(xiàn)一些高級別數(shù)據(jù)分析的需求。比較典型算法有用于聚類的K-Means、用于統(tǒng)計(jì)學(xué)習(xí)的SVM和用于分類的Naive Bayes。
3.1.5 智能應(yīng)用測井處理解釋軟件平臺
國內(nèi)外現(xiàn)有測井處理解釋平臺都還未能采集、分析測井解釋大數(shù)據(jù),需要根據(jù)測井解釋大數(shù)據(jù)的特點(diǎn),研發(fā)面向大數(shù)據(jù)時代的新一代測井處理解釋平臺:一是可以采集、記錄、導(dǎo)入測井解釋大數(shù)據(jù),并具備大數(shù)據(jù)數(shù)據(jù)庫管理功能;二是在具備傳統(tǒng)測井處理解釋功能基礎(chǔ)上,具備大數(shù)據(jù)測井?dāng)?shù)據(jù)處理解釋功能;三是具有大數(shù)據(jù)分析的良好交互能力。
3.2 測井資料大數(shù)據(jù)分析方法
從大數(shù)據(jù)分析的技術(shù)特點(diǎn)可知,需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,面對處理海量、高增長率和多樣化的數(shù)據(jù)資產(chǎn)。假設(shè)現(xiàn)在已經(jīng)擁有這些大數(shù)據(jù)信息,我們可以采用如圖1所示的方法進(jìn)行測井資料的大數(shù)據(jù)處理及分析工作。
圖1 測井資料大數(shù)據(jù)分析流程示意
首先需要確定地質(zhì)處理任務(wù)的工作區(qū)及目標(biāo)井,然后設(shè)置該地質(zhì)處理任務(wù)有關(guān)的區(qū)域資料,同時在工區(qū)中選取若干鄰近非目標(biāo)井。由于目標(biāo)井及其鄰近非目標(biāo)井都位于同一工作區(qū)中,地層環(huán)境類似,因此鄰近非目標(biāo)井的測井解釋成果可用于為目標(biāo)井的測井資料的處理提供參考依據(jù)。但是,所獲取的鄰近非目標(biāo)井應(yīng)當(dāng)為與目標(biāo)井具有相同的地質(zhì)處理任務(wù),這樣該鄰近非目標(biāo)井地質(zhì)處理任務(wù)的過程、結(jié)論可以為目標(biāo)井的分析提供參考依據(jù)。
一個工作區(qū)中通常包括幾十甚至上百個鄰近非目標(biāo)井,其中與目標(biāo)井具有相同的地質(zhì)處理任務(wù)的鄰近非目標(biāo)井的個數(shù)也很多。若是每個鄰近非目標(biāo)井的測井解釋成果都需要用來分析、處理目標(biāo)井的測井資料,將會帶來巨大的數(shù)據(jù)處理量,提高了對計(jì)算處理設(shè)備的硬件要求,延長了目標(biāo)井的測井解釋成果得出的時間。因此,可獲取一個用戶認(rèn)為最適合的鄰近非目標(biāo)井來協(xié)助處理、分析目標(biāo)井。
選定了目標(biāo)井和鄰近非目標(biāo)井后,用戶可根據(jù)目標(biāo)井的地質(zhì)處理任務(wù),選取若干適合該地質(zhì)處理任務(wù)的處理流程。根據(jù)用戶選定的處理流程,選取若干適合的處理程序;向用戶展示所選取的處理程序,并獲取用戶選定的處理程序;根據(jù)用戶選定的處理程序,選取若干適合的處理模型;向用戶展示所選取的處理模型,并獲取用戶選定的處理模型;根據(jù)用戶選定的處理模型,選取若干適合的處理參數(shù)初始值和參數(shù)變化步長;向用戶展示所選取的處理參數(shù)初始值和參數(shù)變化步長,并獲取用戶選定的處理參數(shù)初始值和參數(shù)變化步長。向用戶展示的處理程序、處理模型、處理參數(shù)初始值和參數(shù)變化步長均可根據(jù)歷史經(jīng)驗(yàn)數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)獲得??衫眠x定的鄰近非目標(biāo)井,處理目標(biāo)井的測井資料,得到處理解釋成果,向用戶展示出來。用戶若是滿意該處理解釋成果,可將該處理解釋成果作為最終成果保存。當(dāng)前的目標(biāo)井的地質(zhì)處理任務(wù)完成,接著去處理其他的目標(biāo)井的地質(zhì)處理任務(wù)。用戶若是不滿意該處理解釋成果,用戶可選擇為處理參數(shù)初始值疊加上所選定的參數(shù)變化步長,得到新的處理參數(shù),之后再次進(jìn)行處理,判斷所得到的處理解釋成果是否滿意;若是經(jīng)過數(shù)次變化處理參數(shù),所得到的處理解釋成果仍不符合用戶的要求,則用戶可以重新選擇參數(shù)變化步長、處理參數(shù)初始值、處理模型、處理程序、處理流程等任一項(xiàng)或多項(xiàng)。
若用戶選擇的是工作區(qū)的多目標(biāo)井處理,則重復(fù)前文所記載的執(zhí)行選擇和處理過程,直至用戶所選擇的目標(biāo)井被全部處理完畢。
在大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)要素。通過專業(yè)技術(shù)人才的不斷創(chuàng)新,大數(shù)據(jù)會逐步為人類創(chuàng)造更多的價值。面對專業(yè)化的測井處理解釋技術(shù),需要從以下三個方面系統(tǒng)認(rèn)知分析大數(shù)據(jù):
第一是理論,從理論上進(jìn)行深入探討,從專業(yè)的角度對測井解釋大數(shù)據(jù)進(jìn)行特征定義、描繪與定性,洞悉其技術(shù)特點(diǎn)與發(fā)展趨勢。
第二是技術(shù),分別從計(jì)算、處理、存儲、分析技術(shù)與應(yīng)用平臺構(gòu)建來說明大數(shù)據(jù)從采集、處理、存儲到形成結(jié)果的整個過程及關(guān)鍵技術(shù)。
第三是實(shí)踐,構(gòu)建專業(yè)化的智能測井解釋軟件平臺,從無到有、從簡單到精細(xì),展現(xiàn)大數(shù)據(jù)分析技術(shù)在測井解釋領(lǐng)域的美好景象與即將實(shí)現(xiàn)的藍(lán)圖。
其中,理論是大數(shù)據(jù)認(rèn)知基礎(chǔ),技術(shù)是大數(shù)據(jù)價值體現(xiàn)的手段和前進(jìn)的基石,實(shí)踐是大數(shù)據(jù)的最終價值體現(xiàn)。
面對測井解釋大數(shù)據(jù),測井解釋工程師們還需要實(shí)現(xiàn)傳統(tǒng)測井?dāng)?shù)據(jù)處理解釋理念的三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果。
展望未來,基于大數(shù)據(jù)分析技術(shù)的測井解釋與傳統(tǒng)測井解釋將會從碰撞(Collide)走向連接(Connect)直到最終走向融合(Collaborate)的3C之路。
[1] 《測井學(xué)》編寫組. 測井學(xué)[M].北京:石油工業(yè)出版社,1998:384-527.
[2] 隋志強(qiáng). 對勘探綜合研究中的大數(shù)據(jù)分析的思考[J].油氣地球物理,2014,12(1):1-3.
[3] 王喜雙,趙邦六,董世泰,等. 油氣工業(yè)地震勘探大數(shù)據(jù)面臨的挑戰(zhàn)及對策[J].中國石油勘探,2014,19(4):43-47.
編輯:韓玉戟
1673-8217(2016)06-0051-04
2016-04-28
鄒德江, 高級工程師,博士,1974年生,現(xiàn)從事測井方法、綜合地質(zhì)研究及勘探技術(shù)管理工作。
P631.81
A