亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘與機器學習技術的低滲儲層產量預測

        2023-09-23 11:01:48廖璐璐李根生曾義金宋先知高啟超周珺
        長江大學學報(自科版) 2023年5期
        關鍵詞:水平井油藏數(shù)據(jù)挖掘

        廖璐璐,李根生,曾義金,宋先知,高啟超,周珺

        1.中國石油大學(北京)石油工程學院,北京 102249

        2.中國石化石油工程技術研究院有限公司,北京 102206

        低滲儲層是非常規(guī)油氣儲層的重要組成部分,其在全球石油天然氣供應中的地位日益凸顯。隨著我國油氣能源需求的不斷增加,提升儲量潛力巨大的低滲儲層產量對于保障我國經濟發(fā)展和能源安全保障至關重要。然而,低滲儲層的區(qū)域延展性大、油氣生產效率低,以及鉆井和儲層改造作業(yè)頻繁等特點使得多年在常規(guī)油氣藏生產作業(yè)中所總結出的知識體系與開發(fā)方式不能很好的應用于此。另一方面,我國石油公司在海外新區(qū)的勘探開發(fā)過程中缺乏實踐經驗。因此,借助以大數(shù)據(jù)和機器學習為代表的AI技術將是快速掌握儲層數(shù)據(jù)信息、提升認知水平、高效制定工程措施,并實現(xiàn)致密儲層降本增效開發(fā)的重要契機。

        油氣田的生產預測至關重要,需要包括地質學家、油藏工程師、采油師和鉆完井工程師等多個石油領域專家們的分工合作。好的生產預測需要專業(yè)、高效和緊密的團隊合作,每個領域的專家在一個項目的分析預測過程中不僅各有分工,且存在時間上的先后順序。針對油氣藏產量預測,前人進行了多方面的探索并得到了許多切實可行的方法,比如通過遞減分析和典型曲線分析方法[1];利用二元非線性或多元線性回歸出經驗公式[2];或者使用計算科學技術進行綜合油藏數(shù)值模擬[3]。區(qū)別于常規(guī)油氣藏,低滲油氣藏開發(fā)的成功與工程優(yōu)化和合同期內的高效開發(fā)更加息息相關。因此,一個快速有效的、綜合了地理/油藏/工程參數(shù)的產量預測模型非常關鍵。

        隨著數(shù)據(jù)量的爆炸式增長、計算資源的日益豐富以及數(shù)學算法的不斷改善,以數(shù)據(jù)驅動、機器學習技術等為代表的現(xiàn)代數(shù)據(jù)科學為傳統(tǒng)石油與天然氣行業(yè)提供了技術變革的可能性。許多國家(國際石油公司)都在此投入了大量的精力,希望發(fā)現(xiàn)新技術可以提高、改善甚至取代傳統(tǒng)的工業(yè)工藝流程。非常規(guī)頁巖儲層開發(fā)中產生的大量生產、物性和工程參數(shù)為數(shù)據(jù)挖掘的應用提供了可能性[4]。加拿大非常規(guī)油氣藏資源豐富、布井密度高,可以提供充足的機器學習樣本。一些經典的方法如利用基于圖形辨識的人工神經網(wǎng)絡方法預測獨立變量的變化值大?。?-7];利用基于因變量與多元自變量的多元線性回歸方法預測產能[8-12];利用變量結構回歸(非線性)方法自動識別模型結構等[13-14];利用支持向量機(SVM)預測巖石物性和提高油藏組分模型的運行效率[15-16];基于隨機變量自由組合等原理,利用隨機森林(RF)回歸方法和梯度提升機方法(XGboost)通過疊加效果較差的初始預測模型最終建立集合優(yōu)化模型等[17-19]。

        基于此,筆者提出了利用大數(shù)據(jù)挖掘和機器學習技術來解決中石化海外作業(yè)者項目中產量的快速預測和工程參數(shù)的綜合評估問題。該研究收集了來自加拿大Cardium致密儲層-Pembina油田的1 200多口油井數(shù)據(jù):利用敏感性測試確定了與產量相關的主控因素,在該基礎上建立多維數(shù)據(jù)庫,并為之后的機器學習模型建立打下基礎。根據(jù)敏感性分析結果,篩選出10種與Cardium低滲儲層累計產量最為相關的影響參數(shù)。通過測試基于不同機器學習技術的預測模型,隨機森林算法以其最低誤差值、穩(wěn)定的輸出和優(yōu)異的預測精度脫穎而出。這種以機器學習技術為基礎創(chuàng)建的預測流程在時效性和準確度上均具備優(yōu)勢(精度可達85%),可以為現(xiàn)場壓裂施工設計優(yōu)化提供可靠的保障。

        1 預測流程

        流程分為4個步驟:①針對研究目標區(qū)域建立包含樣本、協(xié)變量和標簽值的數(shù)據(jù)集合;②利用皮爾遜相關系數(shù)找尋主控因素和標簽函數(shù)的關鍵節(jié)點時間;③建立多種機器學習模型,如梯度提升機(XGboost)、隨機森林(RF)、支持向量(SVM)和神經網(wǎng)絡等,并計算預測模型精度;④利用k-Fold交叉驗證方法進一步提升優(yōu)選機器學習模型的預測精度,如圖1所示。

        圖1 基于數(shù)據(jù)挖掘與機器學習技術的低滲儲層產量預測流程

        2 案例概述和數(shù)據(jù)庫

        以加拿大阿爾伯塔省的Cardium致密儲層為研究案例。Cardium致密儲層向東延伸至阿爾伯塔省邊界以東約200 km處。厚度從位于西部邊界150 m到平原地區(qū)的不足50 m不等。Cardium致密儲層深度從1 200~2 700 m不等。研究目標位于Range 09-13 &Township45-49區(qū)塊,寬約50 km,長50 km,平均儲層厚度10~20 m。根據(jù)預測方法步驟①,將研究區(qū)域內的1 286口井經過一系列除雜、清洗和篩選,得到可用的數(shù)據(jù)樣本井為612個,每個樣本中包含50種協(xié)變量(井位/巖性/工程參數(shù))與5組標簽值(3、6、9、12、18和36個月累計產量)。

        2.1 主控因素排名

        根據(jù)預測方法步驟②篩選了10種與標簽值相關系數(shù)最高的協(xié)變量:分別是井位坐標、資源密度、垂直深度、水平井段長度、總壓裂段級數(shù)、總泵入支撐劑量、單位泵入液量、加砂濃度、排量和有無泥隔層;相較于前人研究的標簽參數(shù)僅局限在一個固定值上,選取了不同時間節(jié)點上的5個累計產量值,由此發(fā)現(xiàn)10個主控因素中的6種鉆完井工程參數(shù)的相關系數(shù)存在拐點,即存在時間軸上的系數(shù)相關最大值。以水平井長度段為例,如圖2(a)所示,不同時間節(jié)點上的累計產量值與其相關系數(shù)略有不同,計算值在12個月累計產量的分析中達到峰值,其他幾個工程參數(shù)表現(xiàn)出相類似的特點,如圖2(b)所示,判斷“到底利用哪個時間節(jié)點為最終標簽值”做好了數(shù)學理論基礎依據(jù)。

        圖2 主控因素篩選

        2.2 優(yōu)選算法

        嘗試了多種機器學習模型,結果表明隨機森林算法在同等條件下所得到的誤差值最低,擁有最好的表現(xiàn)。圖3(a)為決策樹的邏輯表達,圖3(b)為隨機森林的邏輯表達。

        圖3 算法優(yōu)選

        前文提到的運算條件指的是數(shù)據(jù)庫總樣本量、訓練集/測試集比例、協(xié)變量值、標簽值和驗證方法等,如表1所示,該模型建立涉及到的總數(shù)據(jù)量為3萬多個,協(xié)變量包括27個工程參數(shù)與23個非工程參數(shù),標簽值的最終選擇為12個月累計產量,驗證方法為10-Fold交叉驗證方法,最終的預測精度到達85%以上。對比不同的運算條件可以看出:①總樣本數(shù)量的增加可以顯著減低誤差率;②訓練集/測試集比例控制在80∶20~90∶10的區(qū)間比較合適,比例過大或過小可能造成過擬合和欠擬合;③協(xié)變量數(shù)量一定的情況下,標簽值選擇累計產量為12個月的預測誤差值越低,這也與之前皮爾遜相關系數(shù)的分析相一致;④k-Fold交叉驗證方法可以提高預測精度和穩(wěn)定性。

        表1 隨機森林結果展示

        2.3 現(xiàn)場施工參數(shù)優(yōu)化

        在油藏地質相似的情況下,認為優(yōu)選6個工程主控因素將會對Cardium致密儲層開發(fā)產生積極的作用,研究的最后一項內容則圍繞著如何利用數(shù)據(jù)挖掘解決工程參數(shù)優(yōu)化問題。首先對全區(qū)的620口井進行了分類:類Ⅰ為RT-全區(qū),包含全部井的樣本(地質油藏條件良莠不齊,水力壓裂技術方案多樣);類Ⅱ為RT-對比區(qū)(該處地質油藏條件較差,未采用改良水力壓裂技術);類Ⅲ為RT-西南角(該處地質油藏條件最差,但采用了改良的水力壓裂技術),并對此3類的3個月、6個月、9個月、12個月和36個月的平均累計產量進行了對比。需要注意的是類Ⅱ為未來布井的研究區(qū)域,分區(qū)和具體產值如表2所示。

        對比類Ⅰ與類Ⅱ可以看出,在12個月前,RT-西南角的水平井的產量表現(xiàn)更為優(yōu)異。在地質油藏條件更差的前提下,說明了類Ⅱ儲層改造的效果很好,12個月后,地質油藏因素與產量的相關性增強,產量開始更多的受到儲層本身性質的影響。12個月產量兩類產值持平,而到36個月時全區(qū)平均累計產量比西南角僅高出了500 m3左右。另外,12個月這個轉折節(jié)點也與之前皮爾遜相關系數(shù)值的拐點相一致,相互印證。

        對比類Ⅰ與類Ⅱ說明,RT-西南角相較于油藏地質同等或稍好的RT-對比區(qū)有更高的平均累計產量,并且一直領先。從3個月到36個月累計產量,差值分別為338.02、655.67、822.40、909.42和1 258.18 m3,增速逐漸變緩。綜上所述,對比研究的儲層改造工藝有很大提高和優(yōu)化的空間,36個月產值提高可達到25%以上,如圖4所示。

        圖4 RT全區(qū)、RT-對比區(qū)和RT-西南區(qū)在不同 時間上的平均產值對比

        研究相應總結與歸納了該6項工程主控參數(shù)在類Ⅰ、類Ⅱ和類Ⅲ的數(shù)學統(tǒng)計值。以尋求產量差異的工程因素差別,在不同的分區(qū)下,施工數(shù)據(jù)存在個性差別,可以通過對比區(qū)(需改進區(qū)域)與西南角的工程參數(shù)的統(tǒng)計值的對比,為對比區(qū)的新井鉆完井工程參數(shù)設計提供參考意見。水平井段長度方面,類Ⅱ的平均值為1 158.0 m,比類Ⅰ和類Ⅲ的均值小15%~16%,并且全區(qū)范圍內的長度最小值出現(xiàn)在類Ⅱ,最大值出現(xiàn)在類Ⅲ;壓裂級數(shù)方面,類Ⅱ的平均值為18.5級,比類Ⅰ和類Ⅲ的均值小5%~12%,并且全區(qū)范圍內的長度最小值出現(xiàn)在類Ⅱ,最大值出現(xiàn)在類Ⅲ;每米加砂量方面,類Ⅱ的平均值為361.3 kg/m,比類Ⅰ和類Ⅲ的均值高13%~7%,對比各項統(tǒng)計結果為3種類型中的最高值;每米加液量方面,類Ⅱ的平均值為3.6 m3/m,與類Ⅰ持平,比類Ⅲ高出19%;加砂質量濃度方面,類Ⅱ的平均值為481.0 kg/m3,與類Ⅰ持平,比類Ⅲ高出18%;排量方面,類Ⅱ的平均值為7.8 m3/min,與類Ⅰ和類Ⅲ幾乎持平(見表3)。

        表3 Cardium致密儲層水平井-關鍵完井參數(shù)統(tǒng)計表

        最終依據(jù)皮爾遜相關系數(shù)、累計產量對比和不同工程參數(shù)的統(tǒng)計情況,基于宏觀統(tǒng)計提出對比區(qū)域新井的施工改進方案:在原有的基礎上將水平井段增加15%~20%;壓裂級數(shù)相應增加10%~15%,即在原有的段間距基礎上保持不變甚至略微加大;每米加砂量和每米加液量保持不變或略微減少;加砂質量濃度在原有基礎上減少10%~15%;排量在原有基礎上減少5%~10%。采用該改良工程施工方案,并通過本文提到的優(yōu)化隨機森林方法可以預測對比區(qū)的12個月或36個月累計產量,結果相較于研究區(qū)域的歷史平均產量提高15%~20%??紤]到壓裂技術水平井段長度、級數(shù)和壓裂規(guī)模等費用的增加,初步計算了基于數(shù)據(jù)挖掘和機器學習技術改良鉆完井參數(shù)后的單井創(chuàng)收值,如表4所示。36個月累計提高產量為7185.85桶,考慮桶油操作成本為9.8美元/桶,36個月累計創(chuàng)收43.12萬美元,年增收利潤約為5.5萬美金/井。

        表4 Cardium致密儲層水平井-采用優(yōu)化鉆完井參數(shù)后的年創(chuàng)收效益

        3 結論

        從大數(shù)據(jù)的角度出發(fā),在Cardium致密儲層建立了地理/物性/工程與生產數(shù)據(jù)的機器學習模型。完成了該儲層600多口水平井的單因素敏感分析,篩選了主控因素,建立并優(yōu)選了機器學習預測模型,優(yōu)化后的精度可以達到85%以上。該研究為Cardium致密儲層提供了一套切實可行的集數(shù)據(jù)庫建立、主控因素篩選和機器學習方法建立優(yōu)化等一體的產量預測方法,進而可以更加快速合理地評估儲層和降低開發(fā)成本。

        1)利用皮爾遜相關性分析,在50種協(xié)變量中甄選了10個主控因素,分別是井位坐標、資源密度、垂直深度、水平井段長度、總壓裂段級數(shù)、總泵入支撐劑量、單位泵入液量、加砂濃度、排量和有無泥隔層。參數(shù)不僅僅局限在一個固定值上,而是找到了不同時間節(jié)點上的5個累計生產產量值,并利用相關值的拐點找到時間軸上的系數(shù)最相關值。

        2)眾多模型中隨機森林的預測模型具有最低的誤差值,預測精度可以達到85%以上。中小型數(shù)據(jù)庫中可以利用k-Fold交叉驗證方法來提升模型預測精度和預測穩(wěn)定性。

        3)訓練集/測試集比例控制在80∶20~90∶10的區(qū)間比較合適,比例過大或過小可能造成過擬合和欠擬合,另外,通過降低葉子節(jié)點維數(shù)也可以解決過度擬合的問題。

        4)結合皮爾遜相關性研究,Cardium致密儲層前12個月累計產量與工程參數(shù)更相關,而之后則逐漸受到地質油藏條件的影響。西南角在相同甚至更差的地質油藏情況下,仍然可以通過增加水平井段長度、每米加砂量、每米加液量和減少加砂質量濃度來提高產量。預計在目標區(qū)域,通過基于數(shù)據(jù)挖掘與機器學期技術優(yōu)化后的鉆完井參數(shù)將為目標區(qū)域創(chuàng)造5~6萬美元/井的增收效益。

        猜你喜歡
        水平井油藏數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        低滲油藏注采結構調整與挖潛技術
        云南化工(2020年11期)2021-01-14 00:51:02
        低滲透油田壓裂水平井生產動態(tài)分析
        云南化工(2020年11期)2021-01-14 00:50:42
        基于模糊數(shù)學的油藏干層識別研究
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于水平井信息的單一河口壩內部增生體識別
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        一種計算水平井產能的新方法
        注CO2混相驅候選油藏篩選評價新方法
        熱采水平井加熱半徑計算新模型
        国产精品毛片一区二区三区| 午夜婷婷国产麻豆精品| 成人精品国产亚洲欧洲| 日本不卡一区二区三区在线观看 | 开心五月婷婷综合网站| 精品国产亚洲第一区二区三区| 亚洲中文字幕无码不卡电影 | 国产在线无码不卡影视影院| 国产自偷自偷免费一区| 日韩精品成人无码AV片| 日本少妇又色又紧又爽又刺激| 无码h黄肉3d动漫在线观看| 亚洲日本va午夜在线电影| 久久久久国产精品片区无码| 日本免费三级一区二区| 久久精品国产亚洲av果冻传媒 | 人妻在线日韩免费视频| 在线观看国产三级av| 日本高清在线播放一区二区| 国内少妇毛片视频| 成在人线av无码免费| 国产高跟丝袜在线诱惑| 中文字幕女优av在线| 野狼第一精品社区| 亚洲VA欧美VA国产VA综合| 精品人妻av中文字幕乱| 亚洲av综合av一区| 区二区欧美性插b在线视频网站| 日本女同伦理片在线观看| 国产高清成人午夜视频| 久久精品噜噜噜成人| 欧美日韩中文字幕久久伊人| 日韩在线精品免费观看| 免费欧洲毛片a级视频老妇女 | 亚洲中文字幕成人无码| 国产午夜福利精品| 日本一区二区偷拍视频| 国产欧美一区二区精品久久久 | 在线视频青青草猎艳自拍69| 毛片成人18毛片免费看| 夜夜揉揉日日人人青青|