崔海福,何貞銘,王寧
(長江大學 地球科學學院,武漢 430100)
?
大數(shù)據(jù)在石油行業(yè)中的應用
崔海福,何貞銘,王寧
(長江大學 地球科學學院,武漢 430100)
摘要:隨著石油勘探與開發(fā)難度的日益增大,信息化的成熟度成為影響石油行業(yè)提高出產(chǎn)量的關鍵因素,而信息化則是有效利用大數(shù)據(jù)技術把大量的數(shù)據(jù)有效地管理起來。總結了大數(shù)據(jù)在地震勘探、地質研究、生產(chǎn)開發(fā)和安全管理等方面的應用,指出基于大數(shù)據(jù)的并行處理技術、神經(jīng)網(wǎng)絡算法、聚類分析等方法可以用來提高石油勘探效率、降低生產(chǎn)與開發(fā)成本,并以Hadoop框架為例介紹了海量數(shù)據(jù)并行處理的技術。
關鍵詞:大數(shù)據(jù)石油行業(yè)信息化數(shù)據(jù)處理
油氣的勘探、生產(chǎn)、運輸和安全管理等過程都需要有數(shù)據(jù)作為實踐的支撐,這些數(shù)據(jù)不僅量大,而且類型復雜,稱得上是大數(shù)據(jù)。它同樣涵蓋了大數(shù)據(jù)的 “5V”(Volume, Velocity, Variety, Veracity, Value)特征[1]: 1) 數(shù)據(jù)體量大,海量的數(shù)據(jù)以TB, PB, EB為單位;2) 數(shù)據(jù)的快速流轉,伴隨著油田設置的更新、傳感器網(wǎng)絡的安裝,數(shù)據(jù)的產(chǎn)生、更新和處理速度變快;3) 數(shù)據(jù)的多樣性,由于數(shù)據(jù)來源與數(shù)據(jù)類型變多,產(chǎn)生如文本、圖片、視頻等結構化數(shù)據(jù),半結構化數(shù)據(jù)和非結構化數(shù)據(jù);4) 數(shù)據(jù)的不確定性,由于數(shù)據(jù)的噪音、缺失、不一致性、歧義等因素,易對數(shù)據(jù)的真實性造成影響;5) 巨大的數(shù)據(jù)價值,大數(shù)據(jù)的終極目標在于從數(shù)據(jù)中挖掘價值。這與石油行業(yè)利用數(shù)據(jù)準確地找到更多的石油目標是一致的,因而大數(shù)據(jù)技術可以貫穿石油行業(yè)從上游到下游的整個領域。具體而言,油田大數(shù)據(jù)涵蓋了地震、鉆井、測井、錄井、試油試采、分析化驗、油層改造和開發(fā)生產(chǎn)的動態(tài)數(shù)據(jù)[2-4],包括現(xiàn)場的原始采集數(shù)據(jù)、經(jīng)過專業(yè)人員處理的數(shù)據(jù)以及最終形成的知識成果。而數(shù)據(jù)格式也很多樣,包括數(shù)據(jù)表、文本、圖件、報表和例如地震數(shù)據(jù)等的大數(shù)據(jù)體。下文將詳細闡述大數(shù)據(jù)在地震勘探、地質研究、生產(chǎn)開發(fā)、油氣輸送和安全管理等領域的具體應用。
1地震勘探
大數(shù)據(jù)在勘探領域的應用主要體現(xiàn)在地震勘探數(shù)據(jù)的存儲、綜合處理和成像等方面。地球物理勘探包括地球物理數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)分析解釋三個環(huán)節(jié)[5-6]。地震資料的內(nèi)涵就是數(shù)據(jù),通過數(shù)據(jù)可以反映地質結構、地層變化,通過數(shù)據(jù)可以為油氣勘探開發(fā)提供重要依據(jù)。新的地震數(shù)據(jù)采集方法可以使采集覆蓋次數(shù)由幾十次增至幾千次,數(shù)據(jù)體會成幾何倍數(shù)增長。同時,物探裝備技術的不斷進步,實現(xiàn)了高效采集和施工方法的巨大跨越,一定程度上使得數(shù)據(jù)量快速膨脹。海量數(shù)據(jù)形成之后,對處理方法要求很高,且針對不同的區(qū)塊和數(shù)據(jù),需要不同的參數(shù)和流程組合,這就要求對于海量數(shù)據(jù)需要反復試驗,一個參數(shù)的試驗可能需要耗費幾天甚至更久。因此,傳統(tǒng)的數(shù)據(jù)處理環(huán)境已不能滿足海量數(shù)據(jù)的處理要求。
面對大量數(shù)據(jù)的管理與處理的問題,大數(shù)據(jù)的模式識別分析方法、數(shù)據(jù)的并行處理技術等都可為石油勘探所用。大數(shù)據(jù)時代的地震勘探的發(fā)展方向表現(xiàn)在如下四個方面: 對地震儀器的嚴格要求,因為其是限制巨量地震數(shù)據(jù)采集的關鍵,也關系到野外生產(chǎn)組織管理方式、數(shù)據(jù)質量、施工效率、生產(chǎn)成本等,應選擇輕便的網(wǎng)絡化地震采集儀器來適應大數(shù)據(jù)時代;對可控震源有效采集技術的推廣,同樣有利于在大數(shù)據(jù)環(huán)境下提高工作效率并降低成本;采用量化的質量監(jiān)控軟件,可大幅提升數(shù)據(jù)質量評價的可靠性;高速發(fā)展的計算機技術也可為巨量地震數(shù)據(jù)的處理與解釋提供重要保障??傊?,要重視大數(shù)據(jù)處理與解釋的環(huán)境建設,提高海量地震數(shù)據(jù)的處理能力,并不斷開展大數(shù)據(jù)下的信息挖掘技術研究,以提高油氣識別的精度,最終達到提高石油勘探準確性的目的。
2地質研究
在對某一區(qū)塊進行地質研究之前,要首先了解該地區(qū)的地貌特質和地質狀況,查看條件是否適合布井、是否存在發(fā)生自然災害的可能性,同時還要對該區(qū)塊目的層位的勘探資料進行了解,這其中包括地震層位和斷層的解釋。其次要對研究區(qū)的井位資料進行收集,包括鉆井、錄井、測井曲線、試油等[7-9],這些有助于認識研究區(qū)目的層位的沉積相特征、物性特征以及電性特征等。除此之外,還要對研究區(qū)的產(chǎn)能狀況進行了解,包括注水等生產(chǎn)動態(tài)以及儲量數(shù)據(jù)。以上這些數(shù)據(jù)涵蓋了幾十類甚至上百類的結構化、半結構化、非結構化的數(shù)據(jù)。因此,要針對這些數(shù)據(jù)的存儲與管理,從它們的類別、類型、訪問方式等考慮,構建一體化的數(shù)據(jù)管理模型,保證大數(shù)據(jù)的高質量、高性能、高可用性,充分發(fā)揮大數(shù)據(jù)的價值。
特別在地質儲層研究中,大數(shù)據(jù)技術中的一些分析方法可以作為儲層研究的手段。例如可以采用聚類分析的算法,選取平均喉道半徑、啟動壓力梯度、可動流體飽和度等參數(shù)對儲層多孔介質進行分類;同時可對地震的屬性進行聚類分析,通過總結已知含油區(qū)的相似屬性特征來劃分有利的含油區(qū),以達到預測未知的含油區(qū)的目的。
3生產(chǎn)開發(fā)
油田數(shù)字化進程極大程度上提高了油田的產(chǎn)量,且隨著數(shù)字化程度的提高,更多“隱藏”的數(shù)據(jù)被利用起來。據(jù)了解,數(shù)字油田被完全優(yōu)化后至少可提高6%的采收率和8%的油氣產(chǎn)量。在油氣生產(chǎn)領域,通過對大量歷史數(shù)據(jù)的分析,預測未來數(shù)據(jù)的走向,可以極大限度地提高采收率、油氣產(chǎn)量;同時,通過綜合分析地震、鉆井和生產(chǎn)數(shù)據(jù),可以使得生產(chǎn)服務更加智能。例如,通過分析油田生產(chǎn)中的各種大數(shù)據(jù),可以得出產(chǎn)量、壓力等參數(shù)隨時間變化的趨勢,據(jù)此作為改變開發(fā)方法的決策支持。還有學者在數(shù)據(jù)倉庫的基礎之上,采用決策樹分析方法、聚類分析法、神經(jīng)網(wǎng)絡等算法建立起油氣數(shù)據(jù)的挖掘模型,對大量的、多維的、多源的數(shù)據(jù)進行了關聯(lián)分析與預測工作[10-11]。例如,用戶可以挖掘滲透率、有效厚度、生產(chǎn)壓差、含氣飽和度等各參數(shù)與油井產(chǎn)能的關聯(lián)度,并建立一個有關油井產(chǎn)能的模型。之后根據(jù)模型將自己感興趣的參數(shù)作為輸入值,油井產(chǎn)量作為預測值,進一步預測油井產(chǎn)量在某些特定因素下的發(fā)展趨勢。這些預測結果可以用曲線、數(shù)據(jù)表等形式進行展示,從而為油氣的生產(chǎn)和決策提供重要的依據(jù)。
4油氣輸送
油氣管道在設計、建設和運營過程中會積累大量數(shù)據(jù),從而可為管道安全分析、評價與管理提供數(shù)據(jù)支持。而目前國內(nèi)管道數(shù)據(jù)庫及信息管理系統(tǒng)存在一定問題,直接影響到數(shù)據(jù)高效、全面的應用[12-13],主要表現(xiàn): 數(shù)據(jù)的記錄形式多樣,標準不一;缺乏綜合統(tǒng)一的信息管理平臺,各環(huán)節(jié)的數(shù)據(jù)比較孤立,難以整合;數(shù)據(jù)采集環(huán)節(jié)標準不一,難以確保數(shù)據(jù)的高質量。面對管道大數(shù)據(jù)存在的這些問題,筆者認為應充分利用大數(shù)據(jù)技術,來解決管道管理中的問題。大數(shù)據(jù)在油氣管道行業(yè)的應用及發(fā)展方向應該是通過對大數(shù)據(jù)挖掘分析得出的結論,對管道進行風險判定和預控,并有計劃地修復管道缺陷,為其生產(chǎn)決策服務。
以大數(shù)據(jù)在管道腐蝕調查和處理中的應用為例,傳統(tǒng)的風險評估方法通常會基于管道內(nèi)外監(jiān)測數(shù)據(jù)對所有的疑似腐蝕點進行開挖施工,造成工作量巨大、不能全面排查所有的腐蝕點的后果?;诖髷?shù)據(jù)的管道監(jiān)控,則可以在管道數(shù)據(jù)庫建立的基礎之上統(tǒng)計,將與管道腐蝕相關的數(shù)據(jù)進行篩查分析,按其對腐蝕的影響程度進行權重排序,這其中可能包括建設公司施工條件、管道地下應力狀態(tài)、材質、地質條件、天氣狀況以及土壤腐蝕性等因素。當某段管道材質差、土壤腐蝕性強、地下應力水平高、施工時管道有損傷時,其發(fā)生腐蝕的幾率更大。因此,根據(jù)以上影響因素,可以按照不同管段發(fā)生腐蝕的概率進行排序,對其進行劃分等級,篩選出可能導致事故發(fā)生的腐蝕點。通過對這些腐蝕點的開挖驗證,確定腐蝕點的腐蝕情況,并根據(jù)開挖結果修正之前的判定模型,制訂相應的維修方案。綜上所述,根據(jù)基于大數(shù)據(jù)分析的管道安全管理的過程,結合管道大數(shù)據(jù)的挖掘應用,可全面識別管道風險,減少開挖數(shù)量,從而達到提升工作效率、節(jié)約成本、提高管道安全管理水平的目的。
5安全管理
安全管理涉及對油氣生產(chǎn)中各種參數(shù)的分析,可以預知可能出現(xiàn)的問題,及早做出防范舉措。石油產(chǎn)業(yè)的下游要解決輸送、轉運、銷售和管理等環(huán)節(jié),隨著生產(chǎn)能力和規(guī)模的逐年擴大,生產(chǎn)存儲設備向大型化和規(guī)?;茏?,導致危險因素也逐漸變多,無論是制度缺陷、設備隱患、程序遺漏、工作疏忽或者個人的違章操作都有可能造成重大事故。目前,在安全管理領域對數(shù)據(jù)的挖掘和利用還很匱乏,因而有必要從海量數(shù)據(jù)中挖掘出人的不安全行為、物的不安全狀態(tài)、管理的漏洞等有用的信息,從而找出事故發(fā)生的規(guī)律,來提高安全生產(chǎn)的管理水平。
先見性修復是海洋油氣建造管理當中的一項重要任務。由于鉆井平臺距離陸地的距離較遠,人員及設備的運輸比較耗時。因此,在深海設備發(fā)生損壞之前,必須留足時間進行修復工作的準備。如果時間提前太早,會釀成資源浪費;若等到設備發(fā)生故障之后再進行處理,則會耗費時間耽誤工程進度。隨著設施的運行,系統(tǒng)輸出的數(shù)據(jù)質量也會隨著時間降低。因此,可以利用數(shù)學分析方法,根據(jù)監(jiān)測設備反饋的數(shù)據(jù)來獲知系統(tǒng)的運行情況[14]。例如,大數(shù)據(jù)監(jiān)測技術可以對平臺的上千個零部件的振幅、溫度、轉速和油壓等進行實時監(jiān)測,并推測其運行狀態(tài),據(jù)此設計維修計劃。
6結論
無論是在油氣的勘探、生產(chǎn),還是運輸、管理中,都會產(chǎn)生海量的數(shù)據(jù),并且需要對這些數(shù)據(jù)進行快速有效地處理。而大數(shù)據(jù)技術恰恰可以提供這種功能,比如現(xiàn)在比較流行的Hadoop就是一個分布式系統(tǒng)的基礎架構,石油行業(yè)可以充分利用Hadoop框架來構建符合自己需求的數(shù)據(jù)處理系統(tǒng)。主要包括HDFS,MapReduce,HBase,其中HDFS和MapReduce是其核心設計。HDFS是對海量的數(shù)據(jù)提供了存儲,而MapReduce為海量的數(shù)據(jù)提供了計算,它們之間相互獨立,工作時互不影響,這就極大地提高了數(shù)據(jù)的存儲與處理的速度。MapReduce將所有針對海量異構數(shù)據(jù)的操作
抽象為兩種操作,即Map和Reduce。Map就是一個映射過程,它是對列表中的每一個相對獨立元素進行一定條件的操作,比如對一個成績列表中的每一項數(shù)據(jù)都加1,在這個運算過程中數(shù)據(jù)表的每一個元素都是獨立進行操作的,原來的列表并沒有被修改,原因是這里新建了一個表來保存修改后的結果。因此,Map高度并行的操作特點可以滿足高性能要求的應用,并且會極大地提高并行計算的效率。Reduce是一個化簡的過程,它是對列表中的元素進行適當?shù)睾喜?,例如當對成績列表求平均分時,通過定義求和函數(shù)使每一個元素與相鄰的元素進行相加,這樣遞歸運算直到剩最后一個總數(shù),最后用這個數(shù)除以總人數(shù)就得到了平均分數(shù)。雖然Reduce在并行運算上不及Map函數(shù),但由于其答案相對簡單并且具有運算的獨立性,使Reduce函數(shù)在大規(guī)模高度并行環(huán)境下是非常有用的。總之,還有很多的大數(shù)據(jù)技術可以應用在石油領域,將會帶來一定的經(jīng)濟效益,未來可以發(fā)掘更多的技術算法,為國內(nèi)的石油工業(yè)服務。
參考文獻:
[1]李清泉,李德仁.大數(shù)據(jù)GIS[J].武漢大學學報(信息科學版),2014,39(06): 641-644.
[2]曾慶猛,王冬梅,姚子修,等.中石油A1系統(tǒng)PCEDM數(shù)據(jù)模型基本實體初步研究[J].勘探地球物理進展,2008,31(06): 464-466.
[3]文必龍,肖波,陳新榮,等.石油勘探開發(fā)數(shù)據(jù)元管理技術[J].大慶石油學院學報,2012,36(01): 83-87.
[4]李明巖.大數(shù)據(jù)技術在油氣上游領域廣泛應用[J].中國石化,2014(12): 66-68.
[5]王喜雙,趙邦六,董世泰,等.油氣工業(yè)地震勘探大數(shù)據(jù)面臨的挑戰(zhàn)及對策[J].中國石油勘探,2014,19(04): 43-47.
[6]王曉麗,孟祥龍,時玉龍,等.地震大數(shù)據(jù)的管理與應用[J].數(shù)字技術與應用,2014(01): 205-206.
[7]李偉,趙春宇.油田勘探開發(fā)“大數(shù)據(jù)”管理及應用[J].信息技術,2013(04): 197-198.
[8]王兵,張文生.地質油藏數(shù)據(jù)信息化管理思路[J].中國石油和化工,2013(09): 57-59.
[9]趙貴菊,王彥春,崔其山,等.石油勘探開發(fā)一體化數(shù)據(jù)倉的建立和應用[J].物探與化探,2010,34(01): 108-110.
[10]檀朝東,岳晶晶,吳麗烽,等.數(shù)據(jù)挖掘技術在油藏挖掘者軟件中的應用[J].中國石油和化工,2010(10): 66-67.
[11]檀朝東,陳見成,劉志海,等.大數(shù)據(jù)挖掘技術在石油工程的應用前景展望[J].中國石油和化工,2015(01): 49-51.
[12]崔濤,馮慶善,楊祖佩,等.新建管道完整性管理理念探索[J].油氣儲運,2008,27(10): 4-8.
[13]王維斌.長輸油氣管道大數(shù)據(jù)管理架構及應用[J].油氣儲運,2015(03): 229-232.
[14]王兵.談大數(shù)據(jù)監(jiān)測在海洋油氣設備管理中的應用[J].電子測試,2014(03): 139-141.
Application of Big Data in Petroleum Industry
Cui Haifu, He Zhenming, Wang Ning
(College of Geosciences, Yangtze University, Wuhan, 430100, China)
Abstract:With difficulty increasing of exploration and development in petroleum industry, maturity of information technology has become primary factor affecting output growth rate of petroleum industry. Big data is an important technology which is used to manage data efficiently. Application of big data in seismic exploration, geological research, production development, safety management and so on is summarized parallel processing technology, neural network algorithm and cluster analysis based on big data can be used to improve petroleum exploration efficiency and reduce production and development cost.Massive data parallel processing technology is introduced by taking Hadoop framework as example.
Key words:big data; petroleum industry; informatization; data processing
作者簡介:崔海福(1987—),女,吉林琿春人,長江大學在讀碩士研究生,主要從事油田GIS技術的應用研究。
中圖分類號:TP311
文獻標志碼:B
文章編號:1007-7324(2016)02-0043-03
稿件收到日期: 2005-12-01。