張旭亮 王乃建 蔣永祥 王海立 唐 虎 焦文龍 楊海申 馬 潔郭 敏 肖永新 趙薇薇 李紅遠(yuǎn) 魏振輝 雷云山 皮紅梅
( 1 中國(guó)石油集團(tuán)東方地球物理公司采集技術(shù)中心;2 河北省地震勘探數(shù)據(jù)采集技術(shù)創(chuàng)新中心;3 中國(guó)石油玉門油田公司勘探事業(yè)部;4 中國(guó)石油集團(tuán)東方地球物理公司青海物探處 )
目前,全球數(shù)據(jù)庫技術(shù)逐漸走向成熟,在一些國(guó)外油田公司的勘探領(lǐng)域得到很好的應(yīng)用,并取得了巨大的經(jīng)濟(jì)效益。阿爾及利亞國(guó)家石油公司在對(duì)測(cè)量數(shù)據(jù)、地震剖面、地質(zhì)成果,以及鉆井、測(cè)井等信息進(jìn)行分類分析的基礎(chǔ)上,建立了數(shù)據(jù)銀行,實(shí)現(xiàn)了油田數(shù)據(jù)資料共享。挪威、俄羅斯、巴西等國(guó)家也已建成了地球物理和地質(zhì)數(shù)據(jù)銀行。加拿大地質(zhì)調(diào)查局早已廣泛應(yīng)用數(shù)據(jù)庫管理海洋調(diào)查勘探等地學(xué)數(shù)據(jù)[1]。國(guó)外油田大公司獨(dú)立性、專業(yè)性較強(qiáng),所以數(shù)據(jù)的專業(yè)性和獨(dú)立性要求也相對(duì)較高,數(shù)據(jù)建設(shè)相對(duì)比較規(guī)范、統(tǒng)一,且大力發(fā)揮數(shù)據(jù)的作用與價(jià)值。這些國(guó)外公司在數(shù)據(jù)應(yīng)用方面均有100多年的歷史,在油田數(shù)據(jù)應(yīng)用方面比國(guó)內(nèi)早且先進(jìn),但對(duì)數(shù)據(jù)治理的認(rèn)識(shí)和提出均比較晚。數(shù)據(jù)治理的目的主要是發(fā)現(xiàn)數(shù)據(jù)在建設(shè)中存在多期次、多數(shù)據(jù)庫和數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一的現(xiàn)象。2010年左右,當(dāng)國(guó)內(nèi)油田專家提出數(shù)據(jù)治理時(shí),國(guó)外才開始關(guān)注對(duì)數(shù)據(jù)治理的研究。例如中國(guó)石油集團(tuán)慶新油田開發(fā)有限責(zé)任公司引入數(shù)據(jù)治理技術(shù)后,過去跨庫提取動(dòng)態(tài)數(shù)據(jù)需要煩瑣的半自動(dòng)化操作,數(shù)據(jù)治理之后獲取數(shù)據(jù)的便利度和速度均有了大幅度的提升。此外,中國(guó)石油集團(tuán)長(zhǎng)城鉆探工程公司等多個(gè)公司均進(jìn)行了多種方式的治理,效果明顯,工作效率均有大幅度提高[2]。
2012年,中國(guó)石油勘探與生產(chǎn)分公司在新疆油田組織召開了上游業(yè)務(wù)物探基礎(chǔ)工作現(xiàn)場(chǎng)會(huì),會(huì)議強(qiáng)調(diào)了面向復(fù)雜地質(zhì)目標(biāo)必須抓好物探基礎(chǔ)工作的重要性和緊迫性,明確了物探基礎(chǔ)數(shù)據(jù)庫的建設(shè)目標(biāo)。隨著勘探開發(fā)的不斷深入并依據(jù)現(xiàn)場(chǎng)會(huì)的要求,各油田不同程度地開展了測(cè)量與SPS、表層成果、靜校正數(shù)據(jù)、高精度衛(wèi)星圖片、速度和文檔管理等數(shù)據(jù)庫的建設(shè)。目前新疆油田公司[3]、西南油氣田公司[4]、大慶油田公司[5]、華北油田公司[6]等基本建齊了物探基礎(chǔ)數(shù)據(jù)庫[7],其他油田公司也建設(shè)了部分?jǐn)?shù)據(jù)庫[8-9],但仍需補(bǔ)充完善。東方物探公司經(jīng)過調(diào)研發(fā)現(xiàn),上述數(shù)據(jù)庫的建設(shè)時(shí)間較早,基本都是依托中國(guó)石油的外部公司協(xié)助,技術(shù)容易受限,并且在云共享、數(shù)據(jù)標(biāo)準(zhǔn)化管理和數(shù)據(jù)應(yīng)用等方面存在一些問題和不足。
東方物探公司作為中國(guó)石油物探領(lǐng)域的先鋒,在數(shù)據(jù)庫技術(shù)和云共享等方面進(jìn)行了大量研究,積極與玉門油田公司合作并建設(shè)符合中國(guó)石油標(biāo)準(zhǔn)的盆地級(jí)物探基礎(chǔ)數(shù)據(jù)庫平臺(tái)。在建設(shè)初期,玉門油田的物探基礎(chǔ)數(shù)據(jù)基本以文檔的形式存放,存在數(shù)據(jù)格式不統(tǒng)一、數(shù)據(jù)類型不全、數(shù)據(jù)存儲(chǔ)分散、難以適應(yīng)盆地級(jí)的大數(shù)據(jù)量管理等問題,沒有真正地實(shí)現(xiàn)集團(tuán)公司提倡的數(shù)字化轉(zhuǎn)型[10-11]要求。
盆地級(jí)物探基礎(chǔ)數(shù)據(jù)庫(GeoContainer)系統(tǒng)是東方物探公司自主研發(fā)、覆蓋物探多業(yè)務(wù)、全過程和大數(shù)據(jù)量的專業(yè)管理平臺(tái)。該系統(tǒng)具有兼容中國(guó)石油勘探開發(fā)夢(mèng)想云[12-13]、微服務(wù)分布式架構(gòu)[14]、開發(fā)高擴(kuò)展性、操作方便等特點(diǎn)。GeoContainer系統(tǒng)采用中國(guó)石油油氣勘探開發(fā)數(shù)據(jù)模型(EPDM)[15-16],該模型已在中國(guó)石油各油田得到廣泛應(yīng)用[17],明顯強(qiáng)于國(guó)外油田數(shù)據(jù)庫的數(shù)據(jù)建設(shè)和數(shù)據(jù)治理,其在橫向上能夠?qū)⒏鱾€(gè)專業(yè)的數(shù)據(jù)整合在一起,使數(shù)據(jù)之間的聯(lián)系更加密切,更好地滿足研究人員的使用。2021年,東方物探公司首次將GeoContainer系統(tǒng)部署在玉門油田公司進(jìn)行實(shí)際應(yīng)用,并取得了顯著成效[18-19]。
GeoContainer系統(tǒng)由服務(wù)端和客戶端兩大部分組成(圖1),該系統(tǒng)供管理人員和從事石油勘探的專業(yè)技術(shù)人員使用?;诳蛻舳?服務(wù)器(C/S)架構(gòu),在服務(wù)端以Linux為操作系統(tǒng)平臺(tái),以PostgreSQL作為數(shù)據(jù)庫引擎[20],采用微服務(wù)的分布式存儲(chǔ)[21-22],其服務(wù)器云端架構(gòu)[23]與中國(guó)石油夢(mèng)想云[24]兼容;以油田公司局域網(wǎng)為通信載體,在客戶端以Windows操作系統(tǒng)為應(yīng)用平臺(tái),實(shí)現(xiàn)了基于PC客戶端的數(shù)據(jù)錄入、修改、查詢和刪除;以EPDM模型為基礎(chǔ),能夠滿足勘探開發(fā)動(dòng)、靜態(tài)數(shù)據(jù)一體化管理;運(yùn)用插件式二次開發(fā)技術(shù),便于快速擴(kuò)充應(yīng)用功能,能夠完成物探基礎(chǔ)數(shù)據(jù)的數(shù)字化管理、規(guī)范化存儲(chǔ)、正確性驗(yàn)證和專業(yè)化應(yīng)用等工作。
圖1 GeoContainer系統(tǒng)簡(jiǎn)圖Fig.1 Schematic diagram of GeoContainer system
GeoContainer系統(tǒng)服務(wù)端主要由高性能服務(wù)器組、微服務(wù)查詢平臺(tái)和API(Application Programming Interface,即應(yīng)用程序編程接口)在線文檔管理平臺(tái)三大部分組成。
高性能服務(wù)器組是由4臺(tái)企業(yè)機(jī)架式服務(wù)器和1臺(tái)企業(yè)級(jí)交換機(jī)組成的硬件系統(tǒng)(圖2)。企業(yè)機(jī)架式服務(wù)器技術(shù)規(guī)格見表1,設(shè)備具有兩個(gè)及以上第二代英特爾可擴(kuò)展處理器,每個(gè)處理器多達(dá)20個(gè)核心,容量可擴(kuò)展至168TB的企業(yè)級(jí)存儲(chǔ)能力。
表1 企業(yè)機(jī)架式服務(wù)器技術(shù)規(guī)格表Table 1 Technical specifications of enterprise rack server
圖2 高性能服務(wù)器組硬件系統(tǒng)組成圖Fig.2 Hardware system composition of high performance server group
(1)系統(tǒng)能滿足各種應(yīng)用程序的需求,均衡地結(jié)合資源、可擴(kuò)展性和經(jīng)濟(jì)性,適應(yīng)現(xiàn)代數(shù)據(jù)處理不斷變化的需求。通過一鍵式調(diào)整優(yōu)化應(yīng)用程序性能。
(2)采用Dell EMC OpenManage智能自動(dòng)化功能,有助于減少花費(fèi)在例行維護(hù)上的時(shí)間,從而提高工作效率。
(3)具有網(wǎng)絡(luò)彈性的全面架構(gòu),在每臺(tái)服務(wù)器中嵌入全新配置鎖定功能和本地存儲(chǔ)的系統(tǒng)擦除功能,能夠確保數(shù)據(jù)安全和數(shù)據(jù)隱私。
1.1.2 微服務(wù)查詢平臺(tái)
微服務(wù)查詢平臺(tái)采用微服務(wù)分布式架構(gòu),各服務(wù)能夠獨(dú)立部署,服務(wù)之間通過Feign進(jìn)行遠(yuǎn)程調(diào)用(圖3)。以觀測(cè)系統(tǒng)數(shù)據(jù)上傳為例,首先調(diào)用文件服務(wù)上傳接口,上傳臨時(shí)文件,并返回文件ID;再通過觀測(cè)系統(tǒng)服務(wù),調(diào)用上傳數(shù)據(jù)信息接口(附帶文件ID),遠(yuǎn)程調(diào)用文件服務(wù),進(jìn)行文件校驗(yàn)、獲取文件信息;最后調(diào)用MinIO文件存儲(chǔ)服務(wù)器,獲取臨時(shí)文件內(nèi)容,解析入數(shù)據(jù)庫。用戶通過網(wǎng)頁端授權(quán)即可操作應(yīng)用,安全性高。
圖3 微服務(wù)查詢平臺(tái)界面示意圖Fig.3 Interface sketch of micro-service query platform
1.1.3 API在線文檔管理平臺(tái)
API在線文檔管理平臺(tái)是為Java MVC框架集成Swagger生成API文檔的增強(qiáng)解決方案,前端UI界面改善增強(qiáng)(圖4)。在微服務(wù)架構(gòu)下,該平臺(tái)使用更加靈活,從導(dǎo)航下拉窗口能夠切換到任意模塊,查看相應(yīng)接口說明,測(cè)試環(huán)境下也可以對(duì)接口進(jìn)行調(diào)試,提升前后端模式開發(fā)效率。
兩組比較,學(xué)生對(duì)OSCE模式滿意度較高,認(rèn)為OSCE模式更符合教學(xué)大綱,在評(píng)分標(biāo)準(zhǔn)、難易程度、時(shí)間安排均比傳統(tǒng)考核方式更合理,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)(見表2)。
圖4 API在線文檔管理平臺(tái)界面示意圖Fig.4 Interface sketch of API online document management platform
GeoContainer系統(tǒng)客戶端由數(shù)據(jù)管理平臺(tái)和應(yīng)用軟件兩部分組成,兩者功能獨(dú)立,其可擴(kuò)展性高,操作簡(jiǎn)單便捷,具有良好的交互性,易于操作人員掌握(圖5)。
圖5 GeoContainer系統(tǒng)客戶端組成圖Fig.5 Client composition of GeoContainer system
1.2.1 數(shù)據(jù)管理平臺(tái)
數(shù)據(jù)管理平臺(tái)由用戶交互模塊、數(shù)據(jù)操作模塊和網(wǎng)絡(luò)請(qǐng)求模塊三大部分組成。采用PostgreSQL數(shù)據(jù)庫技術(shù),能夠?qū)σ幌盗袛?shù)據(jù)交互流程進(jìn)行統(tǒng)一安全管理,支撐數(shù)據(jù)操作和網(wǎng)絡(luò)請(qǐng)求等業(yè)務(wù)的實(shí)施[25]。
(1)能夠?qū)τ脩魧?shí)現(xiàn)角色管理,主要分為系統(tǒng)管理員、數(shù)據(jù)錄入員和應(yīng)用人員;對(duì)項(xiàng)目進(jìn)行分類管理,能夠快速查詢項(xiàng)目基本信息。
(2)實(shí)現(xiàn)對(duì)數(shù)據(jù)的錄入、更新、轉(zhuǎn)換和請(qǐng)求等功能;能完成文件的上傳與下載;支持項(xiàng)目的新建、更新和刪除等功能。
(3)通過對(duì)數(shù)據(jù)請(qǐng)求進(jìn)行網(wǎng)絡(luò)格式解析,使用POST請(qǐng)求和GET請(qǐng)求,保證數(shù)據(jù)管理平臺(tái)與應(yīng)用軟件之間的通信。
1.2.2 應(yīng)用軟件
應(yīng)用軟件主要由測(cè)量與SPS、表層成果、靜校正數(shù)據(jù)、高精度衛(wèi)星圖片、速度文件和文檔管理等多個(gè)功能插件組成,軟件開發(fā)人員可通過插件的方式進(jìn)行開發(fā)應(yīng)用,能夠?qū)崿F(xiàn)對(duì)物探基礎(chǔ)數(shù)據(jù)的規(guī)范化管理和高效應(yīng)用(圖6)。
圖6 應(yīng)用軟件主頁面示意圖Fig.6 Interface sketch of main page of application software
GeoContainer系統(tǒng)在正式發(fā)布之前進(jìn)行了大量的系統(tǒng)試驗(yàn)及軟件測(cè)試,在玉門油田的應(yīng)用,是該系統(tǒng)在油田推廣實(shí)施的典型案例。玉門油田坐落于戈壁腹地,祁連山下,這里誕生了新中國(guó)第一口油井、第一個(gè)油田、第一個(gè)石化基地,為中國(guó)石油工業(yè)的發(fā)展做出了重大貢獻(xiàn)。20多年來,數(shù)字地震勘探采集的大量數(shù)據(jù)已成為玉門油田極為寶貴的財(cái)富,是制定勘探、開發(fā)決策的重要基礎(chǔ)。截至2021年底,應(yīng)用該系統(tǒng)已經(jīng)完成盆地級(jí)別的測(cè)量與SPS、表層成果數(shù)據(jù)、靜校正數(shù)據(jù)、高精度衛(wèi)星圖片、速度相關(guān)數(shù)據(jù)和文檔信息的加載入庫,并利用該系統(tǒng)進(jìn)行數(shù)據(jù)歸檔管理和數(shù)據(jù)應(yīng)用支持服務(wù)。
測(cè)量與SPS庫主要用于管理測(cè)量相關(guān)的基礎(chǔ)成 果信息,能夠展示項(xiàng)目部署情況和采集狀況等,其數(shù)據(jù)類型主要包括SPS信息、施工邊界、地表地理信息等。目前該數(shù)據(jù)庫已錄入玉門油田相關(guān)盆地44個(gè)項(xiàng)目的生產(chǎn)數(shù)據(jù),其中激發(fā)點(diǎn)128多萬行,檢波點(diǎn)238多萬行。軟件應(yīng)用功能包括億行級(jí)別炮檢點(diǎn)顯示、點(diǎn)位篩選等(圖7、圖8)。
圖7 觀測(cè)系統(tǒng)平面顯示圖Fig.7 Plane display of observation system
圖8 觀測(cè)系統(tǒng)表格顯示圖Fig.8 Diagram of observation system data table
表層成果庫主要用來描述近地表的地震地質(zhì)情況,并用于靜校正計(jì)算和指導(dǎo)生產(chǎn),其數(shù)據(jù)類型包括表層成果、巖性錄井、表層施工參數(shù)等。目前該數(shù)據(jù)庫已錄入玉門油田的盆地表層調(diào)查點(diǎn)6200多個(gè)。軟件應(yīng)用功能包括表層建模、Q值應(yīng)用等(圖9)。
圖9 表層沿線切面模型圖Fig.9 Section of surface data modeling
靜校正數(shù)據(jù)庫主要是連接采集和處理的紐帶,能夠提高復(fù)雜地表區(qū)的疊加成像精度,其數(shù)據(jù)類型包括近地表模型、靜校正計(jì)算參數(shù)、靜校正量等。目前該數(shù)據(jù)庫已錄入玉門油田相關(guān)盆地靜校正數(shù)據(jù)量達(dá)2GB。軟件應(yīng)用功能包括近地表建模、連片靜校正計(jì)算等(圖10、圖11)。
圖10 近地表建模示意圖Fig.10 Schematic diagram of near-surface modeling(a) 近地表模型沿線剖面圖;(b)近地表模型平面顯示圖
圖11 連片靜校正計(jì)算示意圖Fig.11 Schematic diagram of continuous static correction calculation
高精度衛(wèi)星圖片庫主要用于展示工區(qū)實(shí)際地表狀況,可以指導(dǎo)生產(chǎn),其數(shù)據(jù)類型包括衛(wèi)星圖片、航拍照片、矢量圖片等。軟件應(yīng)用功能包括TB級(jí)衛(wèi)星圖片的分級(jí)分塊、快速縮放及拖拽疊加顯示等,如圖12所示。
圖12 某研究區(qū)高精度衛(wèi)星圖片F(xiàn)ig.12 High resolution satellite image of a study area
速度庫主要用于野外現(xiàn)場(chǎng)處理和室內(nèi)成果處理等,其數(shù)據(jù)類型包括疊加速度、偏移速度、疊前偏移速度、測(cè)井速度等。軟件應(yīng)用可以支持多類型的速度格式,能實(shí)現(xiàn)對(duì)速度文件的數(shù)字化管理和共享。
文檔管理庫主要用于管理采集項(xiàng)目相關(guān)的輔助文檔,如項(xiàng)目總結(jié)報(bào)告、典型單炮記錄、初至文件等,可設(shè)置不同的文件類型和關(guān)鍵字,便于查找。該數(shù)據(jù)庫可以支持多類型的文件格式,能夠?qū)崿F(xiàn)對(duì)文件的管理和共享。目前該數(shù)據(jù)庫已錄入玉門油田的高精度衛(wèi)星圖片、地質(zhì)圖和各類報(bào)告文檔等非結(jié)構(gòu)化數(shù)據(jù)達(dá)1.3TB(圖13)。
圖13 文檔管理中心界面示意圖Fig.13 Interface sketch of document management center
目前GeoContainer系統(tǒng)6個(gè)數(shù)據(jù)庫的實(shí)施,能直觀地顯示盆地內(nèi)各項(xiàng)目的觀測(cè)系統(tǒng)、管理盆地級(jí)別的測(cè)量與SPS、表層成果、靜校正數(shù)據(jù)、速度數(shù)據(jù)和高精度衛(wèi)星圖片等。在數(shù)據(jù)錄入方面,能夠進(jìn)行自定義格式數(shù)據(jù)解析;能夠?qū)崿F(xiàn)TB級(jí)別的超大文件上傳、下載及斷點(diǎn)續(xù)傳;支持上億行記錄高效、穩(wěn)定傳輸。在數(shù)據(jù)治理方面,數(shù)據(jù)錄入需要經(jīng)過雙重質(zhì)控,數(shù)據(jù)加載時(shí)系統(tǒng)進(jìn)行有效性檢查,加載完成后進(jìn)行數(shù)值范圍檢查、各種質(zhì)控平面圖檢查,可快速發(fā)現(xiàn)異常數(shù)值,保證錄入數(shù)據(jù)的正確性和有效性。以往科研人員查找和整理相關(guān)項(xiàng)目信息,需要從檔案館和存儲(chǔ)設(shè)備中等待調(diào)用,往往花費(fèi)至少幾天或一周以上的時(shí)間,使用該系統(tǒng)后,僅僅幾個(gè)小時(shí)的時(shí)間,就可以快速地從數(shù)據(jù)庫系統(tǒng)下載所需資料,這極大地提高了科研人員的工作效率。
GeoContainer系統(tǒng)是能夠基于云架構(gòu)平臺(tái)在中國(guó)石油內(nèi)部網(wǎng)實(shí)現(xiàn)管理人員和質(zhì)控部門對(duì)項(xiàng)目的異地督促指導(dǎo)、前后方一體化異地協(xié)同的組織新模式。尤其在物探基礎(chǔ)數(shù)據(jù)的共享、管理和應(yīng)用方面,該系統(tǒng)能夠使科研人員初步實(shí)現(xiàn)快速?gòu)闹袊?guó)石油數(shù)據(jù)主湖中獲取研究所需的物探基礎(chǔ)數(shù)據(jù),并將數(shù)據(jù)推送至系統(tǒng)客戶端開展作圖等工作;同時(shí)物探基礎(chǔ)數(shù)據(jù)相關(guān)成果圖件等資料也可歸檔至夢(mèng)想云平臺(tái),這為中國(guó)石油各油田之間實(shí)現(xiàn)成果繼承與跨區(qū)域云共享提供了全面支撐。
物探基礎(chǔ)數(shù)據(jù)庫系統(tǒng)是實(shí)現(xiàn)油田數(shù)據(jù)科學(xué)管理、科學(xué)決策、降低成本的重要手段。依托EPDM模型的GeoContainer系統(tǒng)的研發(fā)及項(xiàng)目成功落地,充分地契合了中國(guó)石油油氣勘探開發(fā)的需要,以及中國(guó)石油勘探與生產(chǎn)分公司的物探業(yè)務(wù)需求,實(shí)現(xiàn)了對(duì)物探數(shù)據(jù)數(shù)字化管理的基本目標(biāo),符合中國(guó)石油“十四五”規(guī)劃中關(guān)于數(shù)字化轉(zhuǎn)型的戰(zhàn)略選擇。通過該系統(tǒng)的實(shí)際應(yīng)用,實(shí)現(xiàn)了玉門油田歷史勘探數(shù)據(jù)的數(shù)據(jù)挖掘和重復(fù)利用,為指導(dǎo)下一步油氣勘探開發(fā)和生產(chǎn)部署提供依據(jù)。