底青云 李守定 付長民 吳思源 王嘯天
(①中國科學(xué)院地質(zhì)與地球物理研究所,中國科學(xué)院頁巖氣與地質(zhì)工程重點(diǎn)實(shí)驗(yàn)室,北京 100029,中國)(②中國科學(xué)院地質(zhì)與地球物理研究所,中國科學(xué)院深地資源裝備技術(shù)工程實(shí)驗(yàn)室,北京 100029,中國)(③中國科學(xué)院地球科學(xué)研究院,北京 100029,中國)(④中國科學(xué)院大學(xué),地球與行星科學(xué)學(xué)院,北京 100049,中國)
石油天然氣是重要的戰(zhàn)略物資和工業(yè)資源,我國國民經(jīng)濟(jì)的快速發(fā)展對(duì)石油天然氣生產(chǎn)始終保持高需求度,2019年我國石油對(duì)外依存度達(dá)到70%以上(劉朝全等,2019)。提高油氣產(chǎn)量,尤其是實(shí)現(xiàn)非常規(guī)等復(fù)雜油氣藏開發(fā)對(duì)保障我國經(jīng)濟(jì)發(fā)展和能源安全具有重要意義(劉洪林等,2009;鄒才能等,2010;賈承造等,2012)。導(dǎo)向鉆井技術(shù)方法是21世紀(jì)全球石油工業(yè)最重要的技術(shù)進(jìn)步之一,也是美國“頁巖氣革命”核心技術(shù)水平鉆井的關(guān)鍵組成部分。導(dǎo)向鉆井技術(shù)包括旋轉(zhuǎn)導(dǎo)向鉆井技術(shù)和隨鉆測(cè)井技術(shù),是實(shí)現(xiàn)深層非常規(guī)等復(fù)雜油氣藏開發(fā)最先進(jìn)的鉆井技術(shù)之一。旋轉(zhuǎn)導(dǎo)向技術(shù)可有效控制井眼軌跡,使鉆頭沿著特定方向鉆達(dá)地下預(yù)定目標(biāo),隨鉆測(cè)井系統(tǒng)相當(dāng)井下設(shè)備的“千里眼”,能夠隨時(shí)將鉆進(jìn)沿途井下地質(zhì)數(shù)據(jù)反饋至地面,用于優(yōu)化鉆井作業(yè)和地層評(píng)價(jià),兩種技術(shù)相結(jié)合能夠極大提升作業(yè)效率、降低工程風(fēng)險(xiǎn)。
當(dāng)前,導(dǎo)向鉆井的主要研究目標(biāo)是提高鉆井速度、降低鉆井時(shí)間和風(fēng)險(xiǎn),智能化是目標(biāo)實(shí)現(xiàn)的重要途徑。物聯(lián)網(wǎng)、大數(shù)據(jù)、云平臺(tái)和人工智能等前沿技術(shù)賦能各行各業(yè)的數(shù)字化轉(zhuǎn)型,數(shù)字化轉(zhuǎn)型成為油氣企業(yè)應(yīng)對(duì)低油價(jià)挑戰(zhàn)、實(shí)現(xiàn)高質(zhì)量發(fā)展的重要手段(高志亮等,2015;馬濤等,2020;王同良,2020)。面對(duì)能源革命的新趨勢(shì),智能導(dǎo)鉆工程必須要有效利用上述技術(shù),推動(dòng)石油開發(fā)向數(shù)字化、智能化轉(zhuǎn)型。石油和天然氣行業(yè)具有海量數(shù)據(jù)資源,包括不同類型和復(fù)雜程度的巖性、構(gòu)造多元異構(gòu)的大數(shù)據(jù)體,收集國外有關(guān)數(shù)據(jù)以形成油氣“大數(shù)據(jù)鏈”,可以從中提取、挖掘出具有創(chuàng)新價(jià)值的核心信息(Baaziz et al.,2014;Staff,2015;滕吉文等,2016;Feng et al.,2019;徐鵬等,2020)?;诖髷?shù)據(jù)和人工智能等前沿技術(shù)的智能鉆井技術(shù),有望實(shí)現(xiàn)鉆井過程的超前探測(cè)、智能導(dǎo)向、閉環(huán)控制和智能決策,從而大幅提高油氣井產(chǎn)量和采收率,降低鉆井成本(李根生等,2020;李劍峰,2020;李陽等,2020)。
目前,國內(nèi)外各大石油公司和油服公司紛紛開展了基于大數(shù)據(jù)和人工智能的平臺(tái)建設(shè)(Korovin et al.,2016;匡立春等,2021)。英國石油公司開發(fā)了Sandy平臺(tái)集成上下游業(yè)務(wù),實(shí)現(xiàn)決策自動(dòng)化。斯倫貝謝和道達(dá)爾合作開發(fā)了DELFI云平臺(tái),綜合管理開發(fā)勘探、開發(fā)、存儲(chǔ)和管道項(xiàng)目。國內(nèi)中石油和華為合作,開發(fā)了夢(mèng)想云平臺(tái)(杜金虎等,2020;馬濤等,2020),中石化和阿里巴巴合作,開發(fā)了油田智云工業(yè)互聯(lián)網(wǎng)平臺(tái),中海油開發(fā)了智能油田技術(shù)平臺(tái)。利用物聯(lián)網(wǎng)和云平臺(tái)技術(shù),實(shí)現(xiàn)石油行業(yè)的大數(shù)據(jù)上云,利用人工智能助力決策,打造云端智能導(dǎo)向一體化指揮平臺(tái)是實(shí)現(xiàn)油氣行業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的方向(Hassani et al.,2018)。因此,本文提出一種依托物聯(lián)網(wǎng),利用云平臺(tái),使用大數(shù)據(jù)和人工智能等技術(shù)的前沿智能導(dǎo)向鉆井技術(shù)方法,并開展了相關(guān)算法的研究。
基于云端大數(shù)據(jù)智能導(dǎo)向鉆井方法架構(gòu)主要包括3層:物聯(lián)網(wǎng)感知層,大數(shù)據(jù)存儲(chǔ)層和云平臺(tái)決策層,系統(tǒng)架構(gòu)如圖1所示。其中:物聯(lián)網(wǎng)感知層處于最底層,實(shí)現(xiàn)井場(chǎng)關(guān)鍵信息的采集和傳輸,借助現(xiàn)有4G/5G/衛(wèi)星等通訊設(shè)施,將井場(chǎng)數(shù)據(jù)直接上傳至大數(shù)據(jù)中心。大數(shù)據(jù)中心構(gòu)建大統(tǒng)一數(shù)據(jù)庫,支持結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),將以前分散在各個(gè)井場(chǎng)和技術(shù)人員工作站中的數(shù)據(jù)統(tǒng)一入云管理,為構(gòu)建人工智能訓(xùn)練網(wǎng)絡(luò)提供數(shù)據(jù)基礎(chǔ)。云平臺(tái)決策層依托大數(shù)據(jù)中心的海量數(shù)據(jù),包含云端地面軟件、人工智能決策以及云平臺(tái)管理等軟件子系統(tǒng)。云端地面軟件系統(tǒng),用于對(duì)井下實(shí)時(shí)上傳的泥漿數(shù)據(jù)或者電磁信號(hào)進(jìn)行解碼,實(shí)時(shí)獲取鉆井軌跡和測(cè)井曲線,同時(shí)將解碼后的數(shù)據(jù)存儲(chǔ)至大數(shù)據(jù)中心。人工智能決策模塊基于大數(shù)據(jù)中心的海量數(shù)據(jù)和自研的機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)地下巖性智能預(yù)測(cè)和存儲(chǔ)物性智能反演,識(shí)別儲(chǔ)層和孔隙度、滲速率、飽和度等關(guān)鍵儲(chǔ)層參數(shù),進(jìn)而實(shí)現(xiàn)鉆井軌跡智能修正和鉆井參數(shù)智能優(yōu)化,保證智能導(dǎo)向工程鉆得準(zhǔn)、鉆得快。云端管理相當(dāng)于云平臺(tái)的“管家”,用于保障用戶安全管理和對(duì)相關(guān)設(shè)備和軟件進(jìn)行統(tǒng)一配置。
圖1 智能導(dǎo)向云平臺(tái)架構(gòu)Fig.1 Intelligent-oriented cloud platform architecture
(1)物聯(lián)網(wǎng)感知。鉆井工程離不開各種傳感器數(shù)據(jù),脈沖壓力傳感器接收泥漿脈沖壓力波動(dòng)用于井下數(shù)據(jù)的解碼和譯碼。指令下傳器用于和井下工具通訊,更新井下工具鉆進(jìn)指令。鉆壓、轉(zhuǎn)速、排量等傳感器用于實(shí)時(shí)監(jiān)測(cè)鉆井關(guān)鍵參數(shù),是保障井下工具正常工作和鉆井安全的重要手段。物聯(lián)網(wǎng)技術(shù)可以實(shí)現(xiàn)利用傳感器對(duì)現(xiàn)場(chǎng)進(jìn)行信息采集,通過網(wǎng)絡(luò)直接發(fā)送到云端大數(shù)據(jù)中心。井場(chǎng)數(shù)據(jù)通過物聯(lián)網(wǎng)發(fā)送至云端之后,遠(yuǎn)程專家可以通過電腦或移動(dòng)端實(shí)時(shí)查看不同區(qū)塊的不同井場(chǎng)的多種數(shù)據(jù)。
(2)大數(shù)據(jù)中心?,F(xiàn)有作業(yè)方式下,每個(gè)專業(yè)需要各自的數(shù)據(jù)采集和處理流程,不同處理系統(tǒng)之間的數(shù)據(jù)相對(duì)封閉,形成“數(shù)據(jù)孤島”,不同系統(tǒng)之間難以進(jìn)行數(shù)據(jù)的連接互動(dòng)?!皵?shù)據(jù)孤島”持續(xù)制約著石油工業(yè)研發(fā)與施工各個(gè)環(huán)節(jié)的交互連接,導(dǎo)致后端工程施工結(jié)果不能動(dòng)態(tài)反饋給地質(zhì)部門,油藏模型得不到及時(shí)修正,造成大量的投資浪費(fèi)。針對(duì)同一油氣藏工作,由于選用的參數(shù)值不一致,不同單位的研究結(jié)果缺乏縱向一致性和橫向可比性(匡立春等,2021)。將井場(chǎng)物聯(lián)網(wǎng)感知模塊所得到各種數(shù)據(jù),包括實(shí)時(shí)壓力波形數(shù)據(jù),實(shí)時(shí)鉆井參數(shù)數(shù)據(jù)等,通過高速傳輸網(wǎng)絡(luò),實(shí)時(shí)上傳至云平臺(tái)大數(shù)據(jù)中心,以現(xiàn)有井場(chǎng)地面系統(tǒng)數(shù)據(jù)庫為基礎(chǔ),在云平臺(tái)建立起大統(tǒng)一數(shù)據(jù)庫,支持結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),將所有區(qū)塊的井?dāng)?shù)據(jù)進(jìn)行統(tǒng)一存儲(chǔ),打破“數(shù)據(jù)孤島”。數(shù)據(jù)可以通過底層物聯(lián)網(wǎng)上傳、由云端地面軟件系統(tǒng)實(shí)時(shí)解碼存儲(chǔ),由用戶登陸云平臺(tái)數(shù)據(jù)中心系統(tǒng)上傳等方式獲取。
(3)云平臺(tái)決策。該模塊包括云端地面軟件系統(tǒng)、人工智能決策系統(tǒng)以及云端管理系統(tǒng),云平臺(tái)數(shù)據(jù)流如圖2所示。
圖2 云平臺(tái)數(shù)據(jù)流Fig.2 Cloud platform data flow
隨鉆測(cè)井作業(yè)是一項(xiàng)復(fù)雜的工程,地面軟件系統(tǒng)是此項(xiàng)工程中重要的工具。地面軟件系統(tǒng)負(fù)責(zé)井場(chǎng)現(xiàn)場(chǎng)的工作管理,負(fù)責(zé)解碼地面?zhèn)鞲衅鲾?shù)據(jù)和井下儀器測(cè)量數(shù)據(jù),獲得來自于井下工具的狀態(tài)指示信息以及地層測(cè)量數(shù)據(jù)信息,從而掌握井下工具的工作狀態(tài),得到井下工具采集的地質(zhì)信息。專家對(duì)獲得的井場(chǎng)現(xiàn)場(chǎng)數(shù)據(jù)進(jìn)行分析處理解釋,指導(dǎo)工作現(xiàn)場(chǎng),可達(dá)到大幅降低鉆井成本、有效提高鉆井效益的目的。
現(xiàn)有地面系統(tǒng)軟件為單機(jī)操作,獨(dú)立運(yùn)行。井場(chǎng)工程師利用此套地面軟件系統(tǒng)在現(xiàn)場(chǎng)進(jìn)行操作,采集隨鉆測(cè)井?dāng)?shù)據(jù)。在需要向外傳輸數(shù)據(jù)時(shí)連接服務(wù)器,通過國際標(biāo)準(zhǔn)的WITS或者WITSML協(xié)議,將隨鉆測(cè)井的相關(guān)數(shù)據(jù)、鉆井相關(guān)數(shù)據(jù)進(jìn)行遠(yuǎn)程傳輸,遠(yuǎn)程專家在對(duì)數(shù)據(jù)進(jìn)行處理分析后,利用電話等方式,與井場(chǎng)現(xiàn)場(chǎng)進(jìn)行溝通。
本架構(gòu)中云端地面軟件系統(tǒng)將隨鉆測(cè)井工程中各種應(yīng)用軟件上云,采用云上解碼,云上顯示和云上導(dǎo)向。該軟件從大數(shù)據(jù)中心獲取實(shí)時(shí)脈沖數(shù)據(jù),利用解碼算法模塊進(jìn)行云解碼,得到實(shí)時(shí)井斜、方位和深度信息,得到實(shí)時(shí)地質(zhì)信息,包括伽馬、電阻率、密度和孔隙度信息,將工程信息和測(cè)井參數(shù)曲線云端實(shí)時(shí)顯示。人工智能決策系統(tǒng)以大數(shù)據(jù)中心為支撐,基于大數(shù)據(jù)中心的海量數(shù)據(jù),利用深度學(xué)習(xí)技術(shù)以及大幅提升的計(jì)算力,研究人工智能在智能導(dǎo)向工程中的應(yīng)用。通過構(gòu)建訓(xùn)練集數(shù)據(jù),訓(xùn)練具有不同功能的網(wǎng)絡(luò)模型,經(jīng)過訓(xùn)練后的模型存儲(chǔ)在云平臺(tái)上,用戶可以直接調(diào)用,用戶將物聯(lián)網(wǎng)感知模塊上傳的實(shí)時(shí)數(shù)據(jù)以及先驗(yàn)知識(shí)輸入人工智能預(yù)測(cè)模型進(jìn)行決策判斷,根據(jù)決策判斷的結(jié)果指導(dǎo)智能導(dǎo)向安全高效進(jìn)行,降低成本和風(fēng)險(xiǎn),提高復(fù)雜油氣藏的開發(fā)能力。云端管理系統(tǒng)則用于統(tǒng)一進(jìn)行權(quán)限管理、配置管理、日志管理以及井場(chǎng)視頻管理等。
深層復(fù)雜的地質(zhì)環(huán)境導(dǎo)致鉆井風(fēng)險(xiǎn)高、成本大、周期長,給旋轉(zhuǎn)導(dǎo)向帶來了極大的不確定性。亟需認(rèn)識(shí)深部地層特性,掌握深部高溫高壓鉆井工程影響因素、鉆進(jìn)響應(yīng)特征規(guī)律。其中:巖性識(shí)別是鉆井實(shí)時(shí)監(jiān)控的重要研究內(nèi)容。通過巖性識(shí)別將儲(chǔ)層巖石進(jìn)行適當(dāng)定義和分類,結(jié)合油藏?cái)?shù)值模擬模型即可獲得儲(chǔ)層的真正動(dòng)態(tài)特性。綜合利用測(cè)井資料確定巖性,對(duì)油氣勘探和測(cè)井解釋有十分重要的意義。不同的儲(chǔ)集層具有不同的物性、含油性和地球物理特征,因此測(cè)井解釋的某些規(guī)律也因巖性的不同而有所差異。在此認(rèn)識(shí)的基礎(chǔ)上,主要研究了深部鉆遇地層巖性分類,從大量無序的地球物理、地質(zhì)錄井信息中,運(yùn)用機(jī)器學(xué)習(xí)的方法找出特征并進(jìn)行分類預(yù)測(cè),為構(gòu)建巖石數(shù)據(jù)庫提供物理機(jī)制與參數(shù)基礎(chǔ)。
目前國內(nèi)外學(xué)者在利用測(cè)井?dāng)?shù)據(jù)進(jìn)行巖性識(shí)別方面的研究成果豐碩。如交會(huì)圖法可以根據(jù)與取芯井巖芯資料對(duì)比校正后的圖版,較為準(zhǔn)確地識(shí)別多種巖性在交會(huì)點(diǎn)的坐標(biāo),從而看出各種巖性的分界和所分布的區(qū)域,實(shí)現(xiàn)巖性識(shí)別(范宜仁等,1999)。但交會(huì)圖法不能進(jìn)行全井段的巖性識(shí)別,且耗時(shí)較長、人為因素大。同時(shí)地下情況復(fù)雜和非均質(zhì)性較強(qiáng),測(cè)井?dāng)?shù)據(jù)之間經(jīng)常呈現(xiàn)極強(qiáng)的非線性關(guān)系,數(shù)據(jù)間的映射關(guān)系也極為復(fù)雜,應(yīng)用傳統(tǒng)方法的效果較差。神經(jīng)網(wǎng)絡(luò)模型可以進(jìn)行測(cè)井資料的巖性識(shí)別,經(jīng)過訓(xùn)練和測(cè)試,驗(yàn)證了神經(jīng)網(wǎng)絡(luò)模型在巖性識(shí)別中是行之有效的,但神經(jīng)網(wǎng)絡(luò)中存在的過擬合、局部極小化問題、收斂速度慢等缺點(diǎn)(Zhu et al.,2018)。支持向量機(jī)算法在巖性識(shí)別中的可行性和有效性,并且運(yùn)用支持向量機(jī)模型在巖性識(shí)別中取得了較好的效果。但支持向量機(jī)是一種有堅(jiān)實(shí)理論基礎(chǔ)的小樣本學(xué)習(xí)方法,若面對(duì)成千上萬甚至更多的測(cè)井?dāng)?shù)據(jù)點(diǎn),其優(yōu)勢(shì)不能得到很好的發(fā)揮(Al-anazi et al.,2010)。所以提出了在進(jìn)行巖性剖面預(yù)測(cè)的過程中根據(jù)決策樹(Quinlan,1986)和隨機(jī)森林(Breiman,2001;方匡南等,2011)的優(yōu)缺點(diǎn),靈活運(yùn)用以得到精度最高、泛化能力最強(qiáng)的模型。
基于國內(nèi)某井的地質(zhì)錄井資料和地球物理測(cè)井資料,進(jìn)行巖性分類預(yù)測(cè)。全井共下5層套管,在第5次開鉆時(shí),即超深層段發(fā)生了井漏,由于在鉆進(jìn)過程中加入了大量隨鉆堵漏材料,巖屑代表性極差,真巖屑極少。根據(jù)錄井油氣顯示,該層段屬于儲(chǔ)層,該層段地質(zhì)資料的全面性對(duì)后續(xù)開采有至關(guān)重要的作用。重新鉆井再進(jìn)行錄井往往需要很高的成本,對(duì)于已經(jīng)實(shí)現(xiàn)完井操作的井眼,重新進(jìn)行巖屑錄井難以實(shí)現(xiàn)。為了節(jié)約成本,可以采用多種方法直接利用已有測(cè)井?dāng)?shù)據(jù)人工生成錄井剖面,從而補(bǔ)全缺失井段信息。
具體實(shí)現(xiàn)過程,首先利用本區(qū)塊內(nèi)已有的測(cè)井曲線作為輸入,巖性剖面作為輸出并行訓(xùn)練生成模型。然后對(duì)于新鉆探的超深井,基于實(shí)測(cè)的測(cè)井曲線,自動(dòng)生成巖性剖面。這種人工巖性剖面成本較低、耗時(shí)較短,容易得到大規(guī)模的應(yīng)用,有利于進(jìn)行區(qū)塊乃至盆地級(jí)別的評(píng)估與分析。針對(duì)缺少巖屑錄井剖面的區(qū)塊,也可以考慮結(jié)合遷移學(xué)習(xí)的方法,利用其他區(qū)塊訓(xùn)練獲得的模型進(jìn)行預(yù)測(cè)分析。研究路線如圖3所示。
圖3 研究路線Fig.3 Research route
在中國華南區(qū)域多源多尺度地質(zhì)、地球物理數(shù)據(jù)分析的基礎(chǔ)上(Di et al.,2021),通過收集,共整理了不同區(qū)塊且深度不同的測(cè)井資料及部分錄井、巖芯資料,選取了測(cè)井資料、錄井資料、巖芯資料齊全超深層段組成了深部地層巖性分類的數(shù)據(jù)集。選取自然電位(SP)、自然伽馬(GR)、密度(DEN)、聲波(AC)、補(bǔ)償中子(CNL)、電阻率(RT)等6個(gè)測(cè)井參數(shù)作為輸入。同時(shí)將巖性剖面數(shù)據(jù)化,如表1所示。并結(jié)合錄井資料進(jìn)行深度校正,將巖性分為7類,作為輸出。
由于測(cè)井儀器不是一次性下測(cè),且不同的測(cè)井儀器取點(diǎn)間距不同,所以需要將所有測(cè)井曲線校正到同一取點(diǎn)深度間隔。例如,聲波的取點(diǎn)間距是其他測(cè)井曲線的兩倍,則采取的辦法是舍棄其他測(cè)井曲線一半的采樣點(diǎn),使聲波測(cè)井曲線與其他測(cè)井曲線具有相同的采樣間隔且在同樣的深度點(diǎn)取點(diǎn)。既保證了地層地球物理參數(shù)的真實(shí)性,又便于在模型建立時(shí)其他參考資料的統(tǒng)一。
數(shù)據(jù)清洗與標(biāo)準(zhǔn)化是構(gòu)建準(zhǔn)確度較高模型的先決條件。模型的輸入與輸出之間應(yīng)該存在正確的地球物理關(guān)系,這樣建立出來的模型才能進(jìn)行正確的預(yù)測(cè)。所以在模型之前,應(yīng)該先檢驗(yàn)各參數(shù)之間的關(guān)系。調(diào)用python中seaborn庫,將自然電位、自然伽馬、密度、聲波、補(bǔ)償中子、電阻率等6個(gè)測(cè)井參數(shù)值在每類巖性上的分布情況進(jìn)行可視化,以便對(duì)樣本數(shù)據(jù)集有更好的掌握。小提琴圖(Violin Plot)用于顯示數(shù)據(jù)分布及其概率密度。這種圖表結(jié)合了箱形圖和密度圖的特征,主要用來顯示數(shù)據(jù)的分布形狀。中間的黑色粗條表示四分位數(shù)范圍,從其延伸的幼細(xì)黑線代表95%置信區(qū)間,而白點(diǎn)則為中位數(shù)(圖4)??梢暬瘓D橫坐標(biāo)是巖性分類類別,縱坐標(biāo)是測(cè)井參數(shù)值。圖中某一錐形表達(dá)可以看出,橫向分布越寬則代表此巖性類別對(duì)應(yīng)的縱坐標(biāo)(即測(cè)井參數(shù)值)數(shù)量越多。
圖4 測(cè)井參數(shù)與巖性分布情況Fig.4 Logging parameters and lithology distribution
首先,構(gòu)建決策樹來進(jìn)行預(yù)測(cè)。將數(shù)據(jù)集分為訓(xùn)練集、測(cè)試集,且訓(xùn)練集數(shù)據(jù)與測(cè)試集數(shù)據(jù)比值為3︰1。決策樹是一種非常引人注目、可解釋極強(qiáng)的分類方法。通過可視化一棵樹,可以了解如何通過將分類規(guī)則分解成一系列關(guān)于數(shù)據(jù)特征的問題來進(jìn)行預(yù)測(cè),圖5即為該模型可視化后的決策樹。
圖5 決策樹模型Fig.5 Decision tree model
為了尋求更高的準(zhǔn)確度,進(jìn)一步采用隨機(jī)森林的方法構(gòu)建模型。隨機(jī)森林是近年來提出的一種融合二叉決策樹的集成學(xué)習(xí)算法。隨機(jī)森林方法有良好的抗噪、抗異常值性能,不容易出現(xiàn)過擬合現(xiàn)象。由于生成決策樹的過程是獨(dú)立的,隨機(jī)森林在處理大數(shù)據(jù)的時(shí)候便于進(jìn)行并行運(yùn)算,尤其是在對(duì)高維度數(shù)據(jù)進(jìn)行分類的時(shí)候,隨機(jī)森林速度快、精度高、穩(wěn)定性好的特點(diǎn)得到更明顯的體現(xiàn),適用于地球物理測(cè)井?dāng)?shù)據(jù)對(duì)巖性分類,其有效性得到了驗(yàn)證。在地球物理學(xué)領(lǐng)域,現(xiàn)有研究利用不同的機(jī)器學(xué)習(xí)方法對(duì)地震圖像進(jìn)行濾波處理、對(duì)測(cè)井曲線缺失段進(jìn)行預(yù)測(cè)、對(duì)巖性進(jìn)行識(shí)別。雖然方法各異,但過擬合問題、準(zhǔn)確度和泛化能力較低的問題仍較為突出。針對(duì)以上問題,在超深層井中應(yīng)用隨機(jī)森林的方法進(jìn)行巖性分類預(yù)測(cè)。
構(gòu)建上述模型后,通過構(gòu)建決策樹模型預(yù)測(cè)的準(zhǔn)確率是0.81,而隨機(jī)森林模型預(yù)測(cè)準(zhǔn)確率是0.89。選定電阻率和密度作為最優(yōu)特征對(duì)巖性進(jìn)行分類。進(jìn)一步地,將預(yù)測(cè)過程進(jìn)行可視化:輸出預(yù)測(cè)值,并與原始預(yù)測(cè)集中的真實(shí)值進(jìn)行對(duì)比。如圖6所示,可以看到左圖是直接用模型輸出的預(yù)測(cè)值與真實(shí)值進(jìn)行對(duì)比分析,在虛線框中具有非常好的預(yù)測(cè)性。右圖是將模型輸出的預(yù)測(cè)值按四舍五入的方法取整之后再與真實(shí)值進(jìn)行對(duì)比分析,虛線框內(nèi)同樣具有良好的相關(guān)性。
圖6 預(yù)測(cè)值與真實(shí)值對(duì)比Fig.6 Comparison of predicted value and true value
最后,繪制了數(shù)字?jǐn)?shù)據(jù)集的隨機(jī)森林分類器的學(xué)習(xí)曲線(圖7)。降低過擬合現(xiàn)在最好的方法就是擴(kuò)大訓(xùn)練樣本數(shù)量,從學(xué)習(xí)曲線中可以清楚地看到訓(xùn)練出一個(gè)最精準(zhǔn)的模型所需樣本數(shù)量的情況。從隨機(jī)森林分類器的學(xué)習(xí)曲線可以看出:訓(xùn)練得分在開始時(shí)非常高并且隨著樣本量的增加而降低,并且交叉驗(yàn)證得分在開始時(shí)非常低并且隨著樣本量的增加而增加。最終精度穩(wěn)定在0.85~0.90之間。所以可以進(jìn)一步通過增加訓(xùn)練樣本來增加驗(yàn)證分?jǐn)?shù),降低過擬合現(xiàn)象。
圖7 隨機(jī)森林模型的學(xué)習(xí)曲線Fig.7 The learning curve of the random forest model
云端平臺(tái)管理決策主要用于井下實(shí)時(shí)上傳的泥漿數(shù)據(jù)或者電磁信號(hào)進(jìn)行解碼,實(shí)時(shí)獲取鉆井軌跡和測(cè)井曲線,同時(shí)將解碼后的數(shù)據(jù)存儲(chǔ)至大數(shù)據(jù)中心。人工智能決策模塊基于大數(shù)據(jù)中心的海量數(shù)據(jù)和自研的深度學(xué)習(xí)算法,實(shí)現(xiàn)地下巖性智能預(yù)測(cè)和存儲(chǔ)物性智能反演,識(shí)別儲(chǔ)層和孔隙度、滲透率、飽和度等關(guān)鍵儲(chǔ)層參數(shù),進(jìn)而實(shí)現(xiàn)鉆井軌跡智能修正和鉆井參數(shù)智能優(yōu)化,保證智能導(dǎo)向工程鉆得準(zhǔn)、鉆得快。云端管理相當(dāng)于云平臺(tái)的“管家”,用于保障用戶安全管理和對(duì)相關(guān)設(shè)備和軟件進(jìn)行統(tǒng)一配置。
云端服務(wù)管理包括鑒權(quán)與授權(quán)云服務(wù)系統(tǒng)、配置管理、日志管理云服務(wù)模塊和井場(chǎng)實(shí)時(shí)視頻系統(tǒng)(白凱等,2017)。傳統(tǒng)的智能導(dǎo)向軟件系統(tǒng)與井下硬件儀器結(jié)合緊密,其操作涉及到儀器系統(tǒng)的機(jī)密技術(shù),因此需要嚴(yán)格細(xì)致的權(quán)限劃分功能。現(xiàn)有技術(shù)鑒權(quán)系統(tǒng)也安裝在本地,采用固定的用戶名及密碼登陸,當(dāng)電腦系統(tǒng)故障或者受到木馬入侵,將可能導(dǎo)致賬戶丟失或被竊取,影響作業(yè)進(jìn)度,危及技術(shù)安全,無法滿足復(fù)雜安全的權(quán)限需求,且遠(yuǎn)程基地?zé)o法控制井場(chǎng)現(xiàn)場(chǎng)的用戶登陸,存在技術(shù)泄露風(fēng)險(xiǎn)。
通過部署在云端的鑒權(quán)與授權(quán)云服務(wù)系統(tǒng),本地機(jī)器可以不再保存賬戶信息,防止因忘記密碼、系統(tǒng)崩潰、木馬入侵等原因影響現(xiàn)場(chǎng)作業(yè)進(jìn)度。具有權(quán)限的管理員可遠(yuǎn)程登陸至鑒權(quán)與授權(quán)云服務(wù)系統(tǒng)進(jìn)行用戶權(quán)限的設(shè)置,包括用戶的添加、刪除、用戶密碼的修改、用戶的角色和權(quán)限設(shè)置。智能導(dǎo)向系統(tǒng)軟件模塊眾多,功能復(fù)雜,在系統(tǒng)運(yùn)行時(shí)需專業(yè)人員對(duì)系統(tǒng)進(jìn)行配置,從而完成相關(guān)功能。現(xiàn)有技術(shù)需專人到現(xiàn)場(chǎng)操作配置,時(shí)間與資金成本大且效率低,高度依賴現(xiàn)場(chǎng)工程師個(gè)人經(jīng)驗(yàn)水平。
配置管理云服務(wù)模塊基于鑒權(quán)與授權(quán)云服務(wù)系統(tǒng)提供的權(quán)限功能,配置管理員可遠(yuǎn)程登陸至配置管理云服務(wù)系統(tǒng),在系統(tǒng)中選擇相應(yīng)的井場(chǎng)對(duì)應(yīng)的地面軟件系統(tǒng),進(jìn)行系統(tǒng)配置。地面軟件系統(tǒng)登陸后,向配置管理云服務(wù)申請(qǐng)其配置文件,地面軟件系統(tǒng)根據(jù)獲得的配置文件對(duì)其本身進(jìn)行配置,配置內(nèi)容包括:地面?zhèn)鞲衅髋渲梦募?、軟件系統(tǒng)的配置文件、顯示模板配置、測(cè)井儀器庫配置、默認(rèn)的儀器參數(shù)配置、儀器功能測(cè)試配置文件、儀器刻度文件配置、單位制配置文件和泥漿解碼算法配置文件。
現(xiàn)有智能導(dǎo)向軟件系統(tǒng)僅支持測(cè)井、鉆井相關(guān)數(shù)據(jù)的遠(yuǎn)程傳輸,無法將軟件系統(tǒng)運(yùn)行日志等相關(guān)數(shù)據(jù)外傳。由于系統(tǒng)的復(fù)雜性,測(cè)井?dāng)?shù)據(jù)結(jié)果受現(xiàn)場(chǎng)操作影響,遠(yuǎn)程專家無法獲得軟件操作日志等信息,無法監(jiān)控地面軟件處理數(shù)據(jù)的過程是否正確,僅利用智能導(dǎo)向軟件系統(tǒng)處理之后的井場(chǎng)測(cè)井?dāng)?shù)據(jù)進(jìn)行分析處理,無法從源頭上排查錯(cuò)誤數(shù)據(jù),從而影響遠(yuǎn)程數(shù)據(jù)分析的準(zhǔn)確性。
日志管理云服務(wù)模塊基于鑒權(quán)與授權(quán)云服務(wù)系統(tǒng),相關(guān)日志管理員可遠(yuǎn)程登陸。地面軟件系統(tǒng)運(yùn)行時(shí),連接日志管理云服務(wù)模塊,并上傳系統(tǒng)產(chǎn)生的相關(guān)日志,日志管理員可實(shí)時(shí)采集獲得來自于各井場(chǎng)的地面軟件系統(tǒng)日志信息,日志包括:軟件系統(tǒng)基本運(yùn)行日志、軟件操作日志、模塊訪問日志和軟件錯(cuò)誤日志,遠(yuǎn)程專家可從源頭上監(jiān)控地面軟件數(shù)據(jù)處理過程。
井場(chǎng)實(shí)時(shí)視頻系統(tǒng)包括安裝在井架上的攝像機(jī)以及井場(chǎng)上空飛行的無人機(jī)。井架攝像機(jī)負(fù)責(zé)對(duì)井口現(xiàn)場(chǎng)的施工視頻進(jìn)行實(shí)時(shí)記錄,無人機(jī)負(fù)責(zé)對(duì)井場(chǎng)的整體狀態(tài)進(jìn)行記錄,兩者錄制的視頻經(jīng)井場(chǎng)視頻系統(tǒng)實(shí)時(shí)傳輸?shù)皆破脚_(tái)數(shù)據(jù)中心中,作為遠(yuǎn)程決策系統(tǒng)中視頻監(jiān)控模塊的數(shù)據(jù)源。
分析了國內(nèi)外大數(shù)據(jù)與人工智能在石油工業(yè)應(yīng)用情況,建立了云端大數(shù)據(jù)智能導(dǎo)向鉆井方法架構(gòu),提出了隨鉆測(cè)井參數(shù)人工智能反演與識(shí)別方法,指出了云端大數(shù)據(jù)與智能算法管理的實(shí)現(xiàn)途徑,結(jié)論如下:
(1)基于云端大數(shù)據(jù)智能導(dǎo)向鉆井方法主要包括物聯(lián)網(wǎng)感知層、大數(shù)據(jù)存儲(chǔ)層和云平臺(tái)決策層。物聯(lián)網(wǎng)感知層實(shí)現(xiàn)井場(chǎng)關(guān)鍵信息的采集并傳輸至大數(shù)據(jù)中心;大數(shù)據(jù)中心支持?jǐn)?shù)據(jù)存儲(chǔ)與云管理;云平臺(tái)決策層依托大數(shù)據(jù)中心的海量數(shù)據(jù),進(jìn)行云端地面軟件控制、人工智能決策以及云平臺(tái)管理。
(2)采用機(jī)器學(xué)習(xí)的方法智能反演與識(shí)別地層巖性,選擇自然電位、自然伽馬、密度、聲波、補(bǔ)償中子、電阻率等6條隨鉆測(cè)井?dāng)?shù)據(jù),分別采用不同的機(jī)器學(xué)習(xí)算法進(jìn)行地層巖性反演與識(shí)別,決策樹模型和隨機(jī)森林模型分別達(dá)到0.81和0.89的準(zhǔn)確度,形成了一套可快速自動(dòng)描述巖性特性分類的方案。
(3)云端平臺(tái)管理決策主要用于井下實(shí)時(shí)上傳數(shù)據(jù)解碼,獲取鉆井軌跡和測(cè)井曲線,云端人工智能決策模塊對(duì)地層及鉆井參數(shù)進(jìn)行智能反演預(yù)測(cè),實(shí)現(xiàn)鉆井軌跡智能修正和鉆井參數(shù)智能優(yōu)化,保證智能導(dǎo)向工程鉆的準(zhǔn)、鉆的快。