彭佳琦,王海起,朱 錦,董倩楠,車 磊
(1.中國石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,山東 青島 266580;2.中油國際(阿聯(lián)酋)公司,阿聯(lián)酋 阿布扎比 93785)
油田地理信息和勘探開發(fā)數(shù)據(jù)解析及標準化
彭佳琦1,王海起1,朱 錦2,董倩楠1,車 磊1
(1.中國石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,山東 青島 266580;2.中油國際(阿聯(lián)酋)公司,阿聯(lián)酋 阿布扎比 93785)
建立油田公司地理信息數(shù)據(jù)庫并創(chuàng)建空間數(shù)據(jù)模型,通常需要解決新老數(shù)據(jù)空間基準不一致和原始紙質(zhì)、文本文件或其他格式數(shù)據(jù)與面向?qū)ο蟮臄?shù)據(jù)模型格式不兼容兩方面問題。以阿聯(lián)酋地區(qū)的油氣田為研究對象,分析確定了區(qū)域空間參考系統(tǒng),對油田多源數(shù)據(jù)結(jié)構(gòu)進行了分類、解析和歸化,并對空間數(shù)據(jù)模型進行了分類總結(jié),為建立油田地理信息數(shù)據(jù)庫奠定了數(shù)據(jù)基礎(chǔ)。
數(shù)據(jù)庫;數(shù)據(jù)模型;數(shù)據(jù)解析;數(shù)據(jù)標準化;數(shù)據(jù)管理
該研究區(qū)數(shù)據(jù)源于不同公司在不同年代產(chǎn)生的多種數(shù)據(jù)資料,存在數(shù)據(jù)格式不統(tǒng)一,類型多樣化、空間參考信息和基準轉(zhuǎn)換參數(shù)不相同或空間參考信息丟失等情況。
1.1 數(shù)據(jù)分類
為了便于數(shù)據(jù)的解析和歸化,首先需要把搜集到的數(shù)據(jù)信息分類列表,歸納為地震采集數(shù)據(jù)、處理解釋數(shù)據(jù)、油田和井位數(shù)據(jù)、陸地地理信息數(shù)據(jù)、海上地理信息數(shù)據(jù)、模型數(shù)據(jù)6大類,其中包括測量控制點、水系、居民地、交通、油氣管線、各種邊界、地形和油田設(shè)施等所有地面地理信息,以及二維和三維地震采集數(shù)據(jù)、油井錄井數(shù)據(jù)、油藏構(gòu)造等油田勘探開發(fā)數(shù)據(jù)和地下信息,具體分類如表1??梢姡瑪?shù)據(jù)資料包含的格式主要有text、shapefile、dwg、矢量數(shù)據(jù)模型、柵格數(shù)據(jù)模型和紙質(zhì)文件。其中shapefile文件可直接被地理信息數(shù)據(jù)庫識別和使用,其他格式的文件需進行解析及歸化才能錄入數(shù)據(jù)庫。
表1 油田多源數(shù)據(jù)分類
1.2 數(shù)據(jù)歸化
針對需要解析、歸化、規(guī)范、內(nèi)插和轉(zhuǎn)換的數(shù)據(jù),本文制定了標準化改造流程,如圖1所示。
2.1 基準轉(zhuǎn)換
Nahawan 1967是適合中東地區(qū)的區(qū)域基準,也是本研究很多數(shù)據(jù)的應(yīng)用基準。由于衛(wèi)星定位技術(shù)的應(yīng)用和發(fā)展,最近十幾年開發(fā)和應(yīng)用的WGS84基準定義了能與地球完美吻合的橢球,且坐標系原點位于地球質(zhì)心(中心),目前被世界各地包括中東地區(qū)廣泛引用。
圖1 數(shù)據(jù)分類、解析、規(guī)范和和建模流程圖
由于各公司技術(shù)要求和工作區(qū)域地理位置均不同,因此遞交的數(shù)據(jù)資料是基于不同基準和基準轉(zhuǎn)換參數(shù)的,這會造成相鄰數(shù)據(jù)重疊區(qū)地理信息不匹配,影響施工生產(chǎn)和勘探開發(fā)設(shè)計。對于基準不同問題,本文的解決方案是確認原始數(shù)據(jù)應(yīng)用的基準和基準轉(zhuǎn)換參數(shù),把所有空間數(shù)據(jù)都轉(zhuǎn)換到WGS84(ITRF 2000.0)基準面上,這樣在保證地理信息數(shù)據(jù)準確性的同時,也保證了其共享性,能夠和阿聯(lián)酋境內(nèi)的其他公司以及市政部門應(yīng)用的基準保持一致。
根據(jù)不同公司不同年代或不同地域應(yīng)用的基準,本文整理計算了基準轉(zhuǎn)換參數(shù)表,如表2所示。如果原始數(shù)據(jù)保存有WGS84(ITRF2000.00)坐標數(shù)據(jù),則不轉(zhuǎn)換;如果原始數(shù)據(jù)沒有保留WGS84基準下的坐標數(shù)據(jù)或根本不是通過WGS84轉(zhuǎn)換過來的數(shù)據(jù),將根據(jù)相應(yīng)的基準轉(zhuǎn)換參數(shù)轉(zhuǎn)換到WGS84(ITRF 2000.0)基準面上。
2.2 紙質(zhì)文件數(shù)字化及地理配準
原始資料中大多數(shù)地形圖和海圖以紙質(zhì)形式存在,掃描到電腦后,需要對其進行地理配準和數(shù)字化處理,使有用信息能夠錄入到地理信息數(shù)據(jù)庫中。具體的處理流程如圖2所示。
圖2 紙質(zhì)資料數(shù)字化入庫流程圖
地理配準是地圖掃描和矢量化至關(guān)重要的環(huán)節(jié),其精度直接影響后期矢量化的精度,從而影響數(shù)據(jù)應(yīng)用的正確性[5]。應(yīng)用ArcGIS提供的創(chuàng)建數(shù)據(jù)、數(shù)據(jù)集合程序、拓撲和高級編輯4種工具實現(xiàn)地形圖和海圖的數(shù)字化。首先對地形圖和海圖進行地理定位,選取柵格圖像控制點進行坐標匹配和幾何校正[6],賦予空間參考信息和地理坐標;再創(chuàng)建數(shù)據(jù)文件或數(shù)據(jù)模型;最后通過編輯幾何圖形和屬性表完成地形圖和海圖的數(shù)字化工作,獲取地理信息。
2.3 補充空間參考信息
矢量數(shù)據(jù)在應(yīng)用和存儲過程中也有丟失空間參考信息的可能,這些數(shù)據(jù)可以用ArcCatalog重新賦值。柵格數(shù)據(jù)的配準改變了原來的坐標屬性并賦予了空間參考,而矢量數(shù)據(jù)重新配置空間參考信息只是找回丟失了的空間參考信息,并沒有改變矢量數(shù)據(jù)原有的幾何文件和幾何屬性,如圖3所示。
圖3 柵格數(shù)據(jù)地理配準原理
表2 基準轉(zhuǎn)換參數(shù)表
2.4 數(shù)據(jù)格式轉(zhuǎn)換
早期的油田數(shù)據(jù)多為text文本格式或CAD軟件產(chǎn)生的dwg格式,如井位等坐標數(shù)據(jù),多以text文本格式存在;路網(wǎng)、建筑等測繪信息,多以dwg格式存在。為了統(tǒng)一標準和規(guī)范油田原始數(shù)據(jù),使其能夠被地理信息數(shù)據(jù)庫所使用,需要對這些數(shù)據(jù)進行轉(zhuǎn)換。
1) text文件的轉(zhuǎn)換。對于text文件(ASCII碼文本)坐標數(shù)據(jù),可以應(yīng)用ArcMap實現(xiàn)數(shù)據(jù)的轉(zhuǎn)換,相當于批量導(dǎo)入X、Y坐標,可將其導(dǎo)出為shapefile文件或其他需求的數(shù)據(jù)格式。通過編輯功能設(shè)置其屬性信息,并在ArcCatalog編輯元數(shù)據(jù)信息,完成數(shù)據(jù)文件的轉(zhuǎn)換,需注意的是在導(dǎo)入過程中要配置空間參考。
2)CAD文件的轉(zhuǎn)換。CAD數(shù)據(jù)也是目前建立地理信息數(shù)據(jù)庫較多的數(shù)據(jù)源,在ArcGIS流行之前的測量繪圖、土木工程、工業(yè)設(shè)計都是由CAD相關(guān)產(chǎn)品完成的,因此產(chǎn)生了大量的不同版本不同數(shù)據(jù)格式的dwg或dxf文件。雖然ArcGIS能夠識別和應(yīng)用,但由于其坐標系概念及數(shù)據(jù)存在的形式與本文建立的地理信息數(shù)據(jù)庫的標準化要求有差異,所以需要把CAD數(shù)據(jù)看作原始數(shù)據(jù),做必要的歸化和處理,轉(zhuǎn)換成標準的柵格或矢量數(shù)據(jù)模型。
基于GIS系統(tǒng)的空間參考坐標系與CAD數(shù)據(jù)的坐標系有根本區(qū)別,CAD只是針對實際物體建立模型,使用固定坐標系定位數(shù)據(jù)的2D和3D笛卡爾右手坐標系,其X、Y、Z坐標是相對于某一個幾何原點(0,0,0)的位置,且X指向東,Y指向北,通常情況下其坐標系的存在形式不能做到直角坐標和大地坐標或不同基準之間的正確轉(zhuǎn)換,其坐標概念不是地理意義上的坐標系。本文是基于地理信息系統(tǒng)和地球信息科學(xué)理論,研究的是地球及地球上所有地物的數(shù)據(jù)模型,某一獨立個體針對特定坐標系具有唯一性,所以需對CAD文件進行轉(zhuǎn)換和空間參考信息改造。
CAD數(shù)據(jù)文件轉(zhuǎn)換為地理數(shù)據(jù)庫數(shù)據(jù)模型,可以在讀取CAD數(shù)據(jù)集的同時創(chuàng)建相應(yīng)的新的工程圖要素數(shù)據(jù)集,并配置空間坐標參考信息。本文應(yīng)用ArcMap模塊CAD到地理數(shù)據(jù)庫轉(zhuǎn)換工具實現(xiàn)CAD文件的轉(zhuǎn)換。
2.5 高程數(shù)據(jù)插值
本文研究區(qū)域地震采集資料比較久遠,最早可追溯到1969年的二維資料,在對這些資料的分析過程中發(fā)現(xiàn),測量數(shù)據(jù)大多是常規(guī)測量資料,由于當時技術(shù)原因,部分物理點高程未實測或因存儲設(shè)備問題造成部分高程數(shù)據(jù)丟失,對目前高精度的地震資料處理精度影響較大。由于年代久遠,如果再次通過野外測量或衛(wèi)星影像拾取高程數(shù)據(jù),獲取的數(shù)據(jù)并不一定是當時高程的真實體現(xiàn),因此通過當時區(qū)域內(nèi)的高程數(shù)據(jù),建立高程模型,在相關(guān)點位提取出當時相應(yīng)物理點的高程數(shù)值并為高程缺失的物理點賦值,才是比較科學(xué)和合理的方法。
本文選取了不規(guī)則三角網(wǎng)(TIN)、反距離權(quán)重法、克里金插值法和樣條函數(shù)插值法進行了對比分析。
通過高程擬合插值方法,本文針對研究區(qū)進行了局部地震采集數(shù)據(jù)23 377 個物理點的實例計算,建立25 m分辨率的高程模型。通過ArcGIS提供的數(shù)據(jù)分析提取工具為各個物理點賦值高程數(shù)據(jù),得到高程精度統(tǒng)計分析結(jié)果如表3??梢钥闯?,TIN方法存在較多點提取不出高程,而其他3種情況相差不大,相比之下,反距離權(quán)重法效果更好一些。
表3 精度統(tǒng)計分析表
對誤差大的點作進一步分析,通過作等值線檢查誤差大于1 m物理點分布情況,等高線和誤差較大的點位分布如圖4所示。對比發(fā)現(xiàn),兩種方法誤差較大的點多數(shù)分布在等值線變化較大或坡度變化較大的區(qū)域。圖4a的顯著特征是誤差大或提取不出高程的位置基本都在TIN的邊緣地區(qū),可通過邊緣裁剪或用其他方法建立的高程模型進行擬合來彌補。
圖4 點位精度分布對比分析圖
雖然表3中的數(shù)據(jù)顯示反距離權(quán)重法結(jié)果最好,但從圖4誤差較大點的分布情況來看,對于研究區(qū)域,反距離權(quán)重法并不適合,每一種內(nèi)插擬合方法都有其針對性和優(yōu)缺點。油田地震采集數(shù)據(jù)物理點具有分布較均勻、地形起伏不大、距離和方向差異不大的特點,樣條法可以通過每一個取樣點,綜合考慮,使用樣條法對本地區(qū)數(shù)據(jù)高程缺失的點進行擬合更加合理。
根據(jù)地理信息數(shù)據(jù)庫的建設(shè)和數(shù)據(jù)庫管理的需要,經(jīng)過數(shù)據(jù)解析、歸化和轉(zhuǎn)換后的數(shù)據(jù)模型將會以多種格式、種類、層級存在于不同的地理數(shù)據(jù)庫中,本文對矢量數(shù)據(jù)、柵格數(shù)據(jù)和屬性數(shù)據(jù)三大類空間地理數(shù)據(jù)模型進行了歸納和分類。
通常情況下,矢量數(shù)據(jù)模型主要是shapefile、地理關(guān)系模型Coverage和地理對象關(guān)系模型Geodatabase;柵格數(shù)據(jù)模型主要是tiff、jpeg、DEM等文件;屬性數(shù)據(jù)主要為屬性表,包括Access、dBase、Oracle等。圖5為各種空間數(shù)據(jù)模型的全貌圖。
圖5 地理數(shù)據(jù)模型全貌圖
shapefile、Coverage和Geodatabase是矢量數(shù)據(jù)模型發(fā)展3個階段的代表產(chǎn)品[7](以ESRI公司產(chǎn)品為例),shapefile是ESRI公司推出的沒有拓撲結(jié)構(gòu)的第一代矢量數(shù)據(jù)模型,是一種由若干個文件組成、空間信息和屬性信息分開存儲的非關(guān)系型數(shù)據(jù)模型;Coverage是第二代矢量數(shù)據(jù)模型,是一種以文件夾形式存在的地理關(guān)系混合數(shù)據(jù)模型;Geodatabase是第三代矢量數(shù)據(jù)模型,是一種將空間對象的屬性和行為結(jié)合起來的面向?qū)ο蟮闹悄芑乩韺ο箨P(guān)系數(shù)據(jù)模型,通常也稱作地理數(shù)據(jù)庫,是為了更好地管理和使用地理要素,按照一定的數(shù)據(jù)模型和規(guī)則組合起來的存儲空間數(shù)據(jù)和屬性數(shù)據(jù)的數(shù)據(jù)庫系統(tǒng)[8]。
shapefile、Coverage、Geodatabase的創(chuàng)建、編輯、修改、刪除、重命名和轉(zhuǎn)移等活動均可通過ArcCatalog或ArcTools來實現(xiàn)。在用ArcMap模塊對其修改時,ArcCatalog將自動修復(fù)相應(yīng)文件保證其完整性。
地理信息數(shù)據(jù)庫是建設(shè)數(shù)字油田的基礎(chǔ),而在石油勘探開發(fā)和生產(chǎn)過程中產(chǎn)生的地震、地質(zhì)和解釋圖件數(shù)據(jù)存在復(fù)雜性、多源性和數(shù)據(jù)量大的特點,本文基于ArcGIS平臺,闡述了數(shù)據(jù)資料的整理、分類及標準化過程;具體介紹了基準轉(zhuǎn)換、紙質(zhì)文件地理配準及數(shù)字化、不同文件格式的轉(zhuǎn)換、高程數(shù)據(jù)擬合方法和創(chuàng)建數(shù)據(jù)模型的方法,為油田公司建立地理信息數(shù)據(jù)庫和創(chuàng)建數(shù)據(jù)庫模型提供了具體解決方案。
[1] 劉穎, 李樹軍. GIS數(shù)據(jù)庫與普通地理數(shù)據(jù)庫[J].海洋測繪, 2001(3)∶52-54
[2] 梁世友.油氣勘探項目信息系統(tǒng)的分析與設(shè)計[J]. 地理空間信息, 2009,7(3)∶56-58
[3] 萬劍華,陶為翔.現(xiàn)代測繪技術(shù)在油氣田生產(chǎn)與管理中的應(yīng)用[J].測繪與空間地理信息,2007,30(6)∶9-11
[4] 胡玲.城市規(guī)劃管理信息系統(tǒng)設(shè)計與實現(xiàn)[D].成都∶電子科技大學(xué), 2006
[5] 李晶,王耀強,包亮,等.運用ArcGIS9.0 ArcMap進行內(nèi)蒙古地質(zhì)圖柵格數(shù)據(jù)矢量化[J].中國科技信息,2010(9)∶118-119
[6] 李崢.基于ArcEngine的柵格數(shù)據(jù)批量配準、坐標系轉(zhuǎn)換及裁切功能的研發(fā)[J].林業(yè)勘察設(shè)計,2011(2)∶58-63
[7] 張佐幫,尚穎娟.基于Geodatabase的面向?qū)ο罂臻g數(shù)據(jù)庫設(shè)計[J].地理空間信息,2005,3(2)∶33-35
[8] 張耀波,張遷.基于Geodatabase海量地理信息數(shù)據(jù)的組織與管理[J].地理空間信息,2011,9(3)∶44-46
P208
B
1672-4623(2016)09-0019-04
10.3969/j.issn.1672-4623.2016.09.006在現(xiàn)代化工業(yè)大生產(chǎn)背景下,油田公司的管理早已從傳統(tǒng)的召開會議制定解決方案、下達文件、決策執(zhí)行向即時獲取信息、自動化科學(xué)決策和快速反應(yīng)方向發(fā)展。建立油氣田地理數(shù)據(jù)庫是油田數(shù)字化和智能化的基礎(chǔ),也是有效應(yīng)用空間數(shù)據(jù)和屬性數(shù)據(jù)進行分析、模擬和決策的依據(jù)[1]。石油勘探成果多以紙質(zhì)形式保存,也存在一些計算機資料處理系統(tǒng),但這些系統(tǒng)相對獨立,存在“信息孤島”現(xiàn)象,現(xiàn)有的管理方式不利于資料共享與利用[2]。數(shù)據(jù)資料存在空間基準不一致,以及紙質(zhì)、文本文件或其他格式數(shù)據(jù)與面向?qū)ο蟮臄?shù)據(jù)模型不兼容問題,因此在建立地理信息數(shù)據(jù)庫前,需將數(shù)據(jù)資料進行分類、解析和歸化,篩選出正確的數(shù)據(jù)信息,改正錯誤的數(shù)據(jù)資料,且要對數(shù)據(jù)結(jié)構(gòu)和模型進行標準化改造[3-4]。本文以阿聯(lián)酋地區(qū)油氣田為例,論述了油氣田地理信息數(shù)據(jù)資料的整理分類、解析、歸化及空間數(shù)據(jù)模型的創(chuàng)建方法。
彭佳琦,碩士研究生,研究方向為數(shù)字油田。
2016-01-05。
項目來源:國家自然科學(xué)基金資助項目(41471322);山東省自然科學(xué)基金資助項目(ZR2012DM010)。