亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學習的煤層氣產(chǎn)能標定智能算法及影響因素分析

        2024-03-07 14:08:12宋洪慶都書一楊焦生王玫珠張繼東朱經(jīng)緯
        工程科學學報 2024年4期
        關鍵詞:模型

        宋洪慶,都書一,楊焦生,王玫珠,趙 洋,張繼東,朱經(jīng)緯

        1) 北京科技大學土木與資源工程學院,北京 100083 2) 大數(shù)據(jù)分析與計算技術國家地方聯(lián)合工程實驗室,北京 100190 3) 中國石油勘探開發(fā)研究院,北京 100083

        煤層氣是一種重要的非常規(guī)能源. 高效開發(fā)利用煤層氣不僅可以提高煤炭資源回收率,而且可以緩解煤礦開采中存在的大量安全問題,帶來巨大的經(jīng)濟效益和社會效益[1]. 煤層氣產(chǎn)能是開采現(xiàn)場的一個關鍵參數(shù),是評價一個煤層氣區(qū)塊開采潛力的重要指標,而單井產(chǎn)能標定是對每口井的最大產(chǎn)氣能力進行科學地評估[2]. 世界范圍內(nèi),眾多學者開展了煤層氣產(chǎn)能的相關研究. Guo 等[3]基于自行研制的實驗裝置,在設計的滲透率和壓力組合下,對煤層氣聯(lián)產(chǎn)進行了物理模擬,為煤層氣疊加體系的高效開發(fā)提供理論和技術支持. 郭肖等[4]針對多煤層氣儲層中的多尺度、多區(qū)域、多介質(zhì)復雜流動問題,建立了多煤層氣藏全過程氣-水兩相耦合流動模型,采用數(shù)值方法對耦合模型進行求解,建立了多煤層氣藏層系劃分流程和判定準則. 郭廣山等[5]為揭示影響相鄰煤層氣井組以及同一井組間產(chǎn)能差異控制因素,探討了產(chǎn)能類型,日產(chǎn)氣均值和日產(chǎn)水均值等參數(shù)的差異性,并從地質(zhì)控制因素、工程工藝控制因素和排除管理因素出發(fā),詳細剖析了資源條件、井身質(zhì)量、壓裂工藝等對煤層氣產(chǎn)量的控制作用,為煤層氣井產(chǎn)量控制因素分析提供了理論依據(jù). Stopa 與Miko?ajczak[6]考慮煤層氣地層中氣水兩相流過程,提出了一種新的煤層氣儲層兩相流動數(shù)學模型,并基于生產(chǎn)數(shù)據(jù)進行歷史擬合,結(jié)果表明,該模型可作為煤層氣兩相產(chǎn)能預測的有效工具. 絕大多數(shù)傳統(tǒng)煤層氣井產(chǎn)能研究,或通過繁瑣的理論推導,或采用復雜的數(shù)值模擬,且大都給出了一定的簡化、限制條件,對于煤層氣開發(fā)具有相應的參考價值,但難以廣泛適用于煤層氣開采現(xiàn)場.

        近年來,人工智能已呈現(xiàn)井噴式發(fā)展[7],且在石油行業(yè)中的應用越來越多[8-9]. Wang 等[10]通過建立深度神經(jīng)網(wǎng)絡,并利用Xavier 初始化、Dropout 技術和Sobol 分析等方法,對頁巖油累產(chǎn)量進行了預測并研究了各影響參數(shù)的重要性. Du 等[11]提出了一種利用機器學習評價油田井間連通性的方法,通過建立三維卷積神經(jīng)網(wǎng)絡,結(jié)合動態(tài)生產(chǎn)數(shù)據(jù)反演井間連通性,為常規(guī)油藏和非常規(guī)油藏的二次開發(fā)提供了有效的指導. Meng 等[12]使用了人工神經(jīng)網(wǎng)絡、隨機森林(Random forest, RF)、支持向量機和極端梯度增強四種流行的機器學習算法,對頁巖氣吸附進行了預測. Song 等[13]采用數(shù)值模擬技術獲取所需數(shù)據(jù)集,并利用多種機器學習方法預測儲層垂向非均質(zhì)性,結(jié)果表明,機器學習方法在非均質(zhì)性預測方面表現(xiàn)優(yōu)異. Hu 等[14]采用灰色關聯(lián)分析和BP 神經(jīng)網(wǎng)絡的方法,對煤層氣井壓裂產(chǎn)量進行了預測及評價. Anifowose 等[15]利用多種機器學習技術并采用兩種地震測井綜合數(shù)據(jù)預測了油藏滲透率. 由此可見,油氣行業(yè)眾多問題可以利用AI 技術有效解決,然而,就作者所了解到的而言,基于機器學習方法并利用煤層氣實際監(jiān)測參數(shù)進行產(chǎn)能標定的研究仍有欠缺.

        本文基于我國山西沁水盆地某區(qū)塊煤層氣井的實際靜態(tài)儲層數(shù)據(jù)與動態(tài)生產(chǎn)數(shù)據(jù),結(jié)合現(xiàn)場開采經(jīng)驗,提出基于生產(chǎn)井史的煤層氣井產(chǎn)能計算公式;通過產(chǎn)能計算公式計算煤層氣單井產(chǎn)能,并與相應井的地質(zhì)、生產(chǎn)、特征數(shù)據(jù)形成機器學習數(shù)據(jù)集;利用100 口煤層氣井完整的數(shù)據(jù)集,建立深度神經(jīng)網(wǎng)絡(DNN)、支持向量機(SVR)以及隨機森林模型(RF)三種機器學習智能算法進行訓練,預測煤層氣單井產(chǎn)能并分析不同排采天數(shù)的生產(chǎn)數(shù)據(jù)對標定產(chǎn)能準確性的影響,比較三種機器學習模型的預測結(jié)果;最后利用預測決定系數(shù)最高的DNN 模型及敏感性分析方法,分析了排采前期的動態(tài)參數(shù)和靜態(tài)參數(shù)對產(chǎn)能的重要性程度.本文提供了一種適用于尚處于開采前期煤層氣井的產(chǎn)能標定機器學習方法.

        1 數(shù)據(jù)選取與處理

        1.1 煤層氣井數(shù)據(jù)的選取

        沁水盆地某區(qū)塊地處山西省東南部,橫跨臨汾、晉城兩市,是我國沁水煤層氣田重點開發(fā)區(qū)塊之一. 本文采用該區(qū)塊下100 口壓裂直井的實際靜態(tài)儲層數(shù)據(jù)和動態(tài)生產(chǎn)數(shù)據(jù)用于分析研究,其井位分布如圖1 所示. 其中,儲層數(shù)據(jù)包括:井位坐標、煤層埋深、孔隙度、測井滲透率、壓后滲透率、煤層厚度、含氣量、地層壓力以及見氣時間,共8 個參數(shù). 地質(zhì)條件的優(yōu)劣在一定程度上決定著煤層氣井產(chǎn)能的大小,其數(shù)據(jù)隱含了煤層氣井產(chǎn)能的信息[16-17]. 選取的儲層數(shù)據(jù)中包含了測井滲透率與壓后滲透率,通過壓裂前后滲透率的變化,可以在一定程度上反映壓裂施工對煤層氣井產(chǎn)能的影響. 本文選取的100 口煤層氣井孔隙度和測井滲透率較低,壓裂效果明顯,埋深較淺、煤層厚度大、含氣量較高.

        圖1 100 口煤層氣井井位分布Fig.1 Well location distribution of 100 CBM wells

        煤層氣不同于常規(guī)天然氣,其在煤層中的儲集主要依賴于吸附作用[18],其開采需經(jīng)歷解吸過程. 開采初期通常要進行排水降壓,當儲層內(nèi)部的壓力低于解吸壓力時,甲烷氣從煤表面解吸出來,通過擴散進入割理裂縫形成氣泡,最終滲流流入井筒完成開采[19]. 因此,煤層氣解吸—擴散—滲流過程直接影響著煤層氣井的產(chǎn)量,提取這一過程的數(shù)據(jù)特征對于分析煤層氣井產(chǎn)能有著重要的影響,但實際這一過程中的參數(shù),如解吸壓力,往往不易獲得. 動態(tài)產(chǎn)氣、產(chǎn)水及壓力數(shù)據(jù)包含了煤層氣解吸—擴散—滲流的動態(tài)特征[20-22]. 在煤層氣相關研究中,已有學者將產(chǎn)氣、產(chǎn)水及壓力等數(shù)據(jù)共同作為AI 模型的輸入,實現(xiàn)產(chǎn)量的高精度預測[23-25].另外,Xu 等[26]基于多元長短時記憶神經(jīng)網(wǎng)絡(MLSTM NN)模型預測煤層氣產(chǎn)量時,證實了加入產(chǎn)水和壓力作為輔助輸入數(shù)據(jù)的預測準確率比僅使用歷史產(chǎn)氣量作為輸入的模型精度高. 因此,本文選取了3 個開采現(xiàn)場日常監(jiān)測的動態(tài)生產(chǎn)數(shù)據(jù):日產(chǎn)氣、日產(chǎn)水和井底流壓,用來引入煤層氣解吸—擴散—滲流信息. 本文選取的100 口煤層氣井,每口井已開采時間為8 a 左右. 詳細的靜動態(tài)數(shù)據(jù)信息如表1 所示.

        表1 100 口煤層氣井靜動態(tài)數(shù)據(jù)Table 1 Static and dynamic data of 100 CBM wells

        1.2 數(shù)據(jù)的清洗與歸一化

        開采現(xiàn)場記錄的數(shù)據(jù)存在誤差,人為采取某些措施(如停機檢修、氣量調(diào)整等)也會導致煤層氣井相關動態(tài)數(shù)據(jù)產(chǎn)生奇異點,為數(shù)據(jù)引入噪聲. 如圖2 所示,66 號井在第2172 d 的產(chǎn)氣量高達2577 m3,但并不符合該井產(chǎn)氣曲線的生產(chǎn)趨勢. 因此,對數(shù)據(jù)奇異點進行清理對于后續(xù)數(shù)據(jù)特征提取是必要的. 本文通過計算該動態(tài)數(shù)據(jù)點與全部動態(tài)數(shù)據(jù)算數(shù)平均值之比來定義異常比值系數(shù),并根據(jù)油藏專家經(jīng)驗設定閾值,清洗相應動態(tài)數(shù)據(jù). 對于某口煤層氣井,定義:

        圖2 66 號煤層氣井產(chǎn)氣曲線與奇異點分布Fig.2 Gas production curve and singularity distribution for CBM well 66

        其中, ε為比值系數(shù);為第n個動態(tài)數(shù)據(jù)第i天的值;為該井第n個動態(tài)數(shù)據(jù)所有天的平均值. 本文采用的動態(tài)數(shù)據(jù)包括日產(chǎn)氣、日產(chǎn)水及井底流壓. 結(jié)合開采現(xiàn)場專家經(jīng)驗,設定日產(chǎn)氣的閾值為2.5,即若某天的產(chǎn)氣量大于該井日產(chǎn)氣均值的2.5 倍,則該天的產(chǎn)氣量將被視為奇異值清洗掉.考慮到煤層氣開井排水降壓的物理過程,前期井底流壓及產(chǎn)水量較高符合物理規(guī)律,又由于該區(qū)塊煤層氣井最晚見氣時間約為270 d,本文選定對見氣后穩(wěn)定三個月,即排采365 d 后的日產(chǎn)水與井底流壓奇異值進行清洗,設定閾值為10.

        數(shù)據(jù)的歸一化處理可以消除數(shù)據(jù)之間的量綱影響,同時可以提升模型訓練時的收斂速度和精度[27],因此本文采用最大最小標準化對數(shù)據(jù)進行歸一化處理. 對于第k個參數(shù)進行歸一化處理,公式為:

        其中,Tk為參數(shù)T中第k個參數(shù)的原始數(shù)據(jù),為對應Tk歸一化后的數(shù)據(jù),Tmin和Tmax分別為參數(shù)Tk數(shù)據(jù)序列中的最小值和最大值.

        1.3 機器學習數(shù)據(jù)集

        煤層氣產(chǎn)能受到地質(zhì)參數(shù)、工程施工、生產(chǎn)制度控制、現(xiàn)場管理等眾多因素的影響,但所有影響最終都會反映到產(chǎn)氣量、井底流壓等生產(chǎn)監(jiān)測數(shù)據(jù)上. 井的日產(chǎn)氣曲線能直接體現(xiàn)井的產(chǎn)氣特征[28],井底流壓也是包含產(chǎn)能信息的重要參數(shù)[29]. 另外,已有研究表明流壓降低速率的快慢對于煤層氣產(chǎn)能具有影響[30]. 本文結(jié)合以上考慮及現(xiàn)場經(jīng)驗,提出了基于生產(chǎn)井史的煤層氣單井產(chǎn)能計算公式.公式為:

        其中,Q為單井產(chǎn)能值,m3·d-1;N為天數(shù),取值為該井的穩(wěn)產(chǎn)期天數(shù);為該井日產(chǎn)氣量降序排列前N天的日產(chǎn)氣平均值,m3·d-1;Pe為地層壓力,MPa;Pc為該井的臨界解吸壓力,MPa; β為區(qū)塊流壓降速,表征一個區(qū)塊正常生產(chǎn)過程中的流壓降低速率,MPa·d-1,其值由開采現(xiàn)場給定.

        本文機器學習模型的輸出為煤層氣單井產(chǎn)能,由公式(3)計算得到. 輸入數(shù)據(jù)包括儲層數(shù)據(jù)、生產(chǎn)數(shù)據(jù)與特征數(shù)據(jù). 儲層數(shù)據(jù)為井位坐標、煤層埋深、孔隙度、測井滲透率、壓后滲透率、煤層厚度以及含氣量,生產(chǎn)數(shù)據(jù)包括排采前期的日產(chǎn)氣、日產(chǎn)水和井底流壓數(shù)據(jù). 生產(chǎn)數(shù)據(jù)是動態(tài)的,因此需要考慮輸入排采前期多長時間的數(shù)據(jù). 本文考慮開井后365、730、1000 以及1365 d 四個時間點分別進行探究. 特征數(shù)據(jù)為排采前期天數(shù)的日產(chǎn)氣均值、日產(chǎn)水均值以及井底流壓均值,用來表征生產(chǎn)數(shù)據(jù)的影響. 由此形成的四個機器學習數(shù)據(jù)集分別命名為數(shù)據(jù)集a、數(shù)據(jù)集b、數(shù)據(jù)集c 和數(shù)據(jù)集d. 四個數(shù)據(jù)集劃分訓練集和測試集的比例都是9:1,整體工作流程如圖3 所示.

        圖3 整體工作流程圖Fig.3 Overall workflow

        2 機器學習模型

        2.1 深度神經(jīng)網(wǎng)絡

        深度神經(jīng)網(wǎng)絡(Deep neural network, DNN)是多層感知器結(jié)構,包括輸入層、隱藏層以及輸出層,其利用節(jié)點之間的相互連接進行信號的傳輸,信號傳輸過程中權重與閾值的調(diào)整則由誤差反向傳播算法進行優(yōu)化. 誤差反向傳播算法在網(wǎng)絡前饋傳播的基礎上,計算預測結(jié)果與真實結(jié)果之間的誤差值,然后從最后一層到第一層反向傳播該誤差進行網(wǎng)絡的權值與閾值調(diào)整.

        對于一個M維輸入、H維輸出的K層深度神經(jīng)網(wǎng)絡,其前饋計算過程為[31]:

        網(wǎng)絡輸入:

        輸入層:

        隱藏層:

        輸出層:

        網(wǎng)絡輸出:

        其中,a(l)表示l層神經(jīng)元的輸入信號;W(l)表示l-1層到l層的權值矩陣;b(l)表示l層網(wǎng)絡閾值;z(l)表示l層神經(jīng)元的狀態(tài);fl(·)表示l層神經(jīng)元的激活函數(shù),yH表示第H個輸出參數(shù).

        前饋過程完成后,計算網(wǎng)絡前饋輸出結(jié)果與真實結(jié)果之間的誤差值J(W,b),并采用優(yōu)化算法,如梯度下降算法(式(11~12)),優(yōu)化神經(jīng)網(wǎng)絡權重值與閾值,使目標函數(shù)J(W,b)最小化.

        其中,W(l)和為網(wǎng)絡更新前后l-1層到l層的權值矩陣;b(l)和為更新前后l層網(wǎng)絡閾值; α為參數(shù)的學習率.

        為了充分提取生產(chǎn)數(shù)據(jù)包含的煤層氣解吸—擴散—滲流過程信息,本文首先利用三個神經(jīng)網(wǎng)絡分別擬合產(chǎn)氣、產(chǎn)水、井底流壓,之后再與7 個儲層數(shù)據(jù)以及3 個特征數(shù)據(jù)相結(jié)合,最終輸出該煤層氣井產(chǎn)能,網(wǎng)絡結(jié)構如圖4 所示.

        圖4 深度神經(jīng)網(wǎng)絡結(jié)構Fig.4 Structure of the deep neural network

        相較于傳統(tǒng)的神經(jīng)網(wǎng)絡結(jié)構模型,該新模型創(chuàng)新性地將地質(zhì)參數(shù)和特征參數(shù)作為輸入層加入到神經(jīng)網(wǎng)絡結(jié)構模型中從而增加模型的泛化能力和對復雜實際地質(zhì)環(huán)境的預測能力;同時,由于傳統(tǒng)產(chǎn)量數(shù)據(jù)和地質(zhì)參數(shù)數(shù)據(jù)量的巨大差異,會導致數(shù)據(jù)體結(jié)構的維度不一致的問題從而降低模型的預測精度,因此本神經(jīng)網(wǎng)絡結(jié)構模型通過動態(tài)數(shù)據(jù)提取,智能地將動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)維度保持一致,從而提高了深度神經(jīng)網(wǎng)絡的泛化能力和預測精度.

        2.2 支持向量回歸機

        支持向量機(Support vector machine, SVM)是以統(tǒng)計學理論為基礎的有監(jiān)督學習算法,由Vladimir N.Vapnik 在1963 年提出[32]. 支持向量回歸機(Support vector regression, SVR)是SVM 應用于回歸問題的拓展,適合解決小樣本、非線性和高維度數(shù)問題.SVR 的基本思想是構造一個最優(yōu)超平面,使得數(shù)據(jù)集樣本到該最優(yōu)超平面的距離誤差最小.

        對于給定的訓練集數(shù)據(jù):

        其中,xi為訓練集中第i個輸入數(shù)據(jù),yi為第i個輸出數(shù)據(jù),R 為實數(shù)集. 若為線性回歸問題,則基于訓練集尋找超平面(ω,b):

        使得f(x)與y盡可能地接近,式中, ω 和b為待定參數(shù). 支持向量回歸機容忍f(x) 與y之間最多有|?|的偏差,即當且僅當f(x) 與y的距離大于 φ時才計算損失,形成了f(x)為中心,寬度為 2φ的隔離帶.第i個樣本點的損失值計算公式為:

        其中,C為懲罰因子. 通過構建拉格朗日函數(shù),并根據(jù)對偶原理、卡羅需-庫恩-塔克條件(KKT)條件可得

        2.3 隨機森林

        隨機森林是在以決策樹為基學習器并使用Bagging 集成的基礎上,引入隨機屬性選擇的集成學習算法,其既可以用于分類問題又可以用于回歸問題[34]. 隨機森林為使集成中的E個基學習器盡可能地相互獨立,采用自助采樣法(Bootstrap sampling)在原始數(shù)據(jù)集中隨機有回放地采取E個數(shù)據(jù)子集,并用單個數(shù)據(jù)子集獨立地訓練一個基學習器,最后將E個基學習器集成. 通過自助采樣法訓練的基學習器可能見到一些數(shù)據(jù)多次,另一些數(shù)據(jù)可能一次也沒有見到[35],未使用過的數(shù)據(jù)在后續(xù)的訓練過程中可用作驗證集以評估隨機森林的泛化能力. 因此隨機森林在做預測時會有較強的穩(wěn)定性. 另外,隨機森林在屬性選擇時,會在當前結(jié)點的d個屬性中隨機選擇一個包含k(1 ≤k≤d)個屬性的子集,然后再從這個屬性子集中選擇一個最優(yōu)屬性用于劃分[36]. 這可能使得基學習器之間的差異性進一步增大,以增強隨機森林的泛化能力.

        當隨機森林解決回歸問題時,常采用簡單平均法獲得最終的輸出結(jié)果:

        其中,H(x)為隨機森林輸出數(shù)據(jù),E為基學習器個數(shù),hi(x)為第i個基學習器的輸出數(shù)據(jù).

        2.4 評價指標

        本文選取決定系數(shù)(Rsquared,R2)、平均絕對誤差(Mean absolute error, MAE)、均方根誤差(Root mean square error, RMSE)三個指標來評價機器學習模型預測結(jié)果的準確性.

        其中,U為數(shù)據(jù)集總樣本數(shù),為數(shù)據(jù)集中第i個樣本點的真實值,為機器學習模型對第i個樣本點的預測值,為所有的平均值.

        3 結(jié)果分析與討論

        3.1 單井產(chǎn)能計算公式準確性評估

        由于開采條件復雜及工程施工等原因,煤層氣實際的產(chǎn)氣曲線并不總是可以較為明確地劃分出產(chǎn)量上升、穩(wěn)產(chǎn)和產(chǎn)量遞減階段. 因此,本文對100 口井的穩(wěn)產(chǎn)期進行整體衡量,確定該區(qū)塊煤層氣井的平均穩(wěn)產(chǎn)期為1000 d,即每口井的穩(wěn)產(chǎn)期天數(shù)N都取值為1000 d. 另外,本文選取的煤層氣井所在區(qū)塊的區(qū)塊流壓降速 β為0.01 MPa·d-1.

        本文以煤層氣井產(chǎn)氣曲線上最大日產(chǎn)氣量為標準并定義波動系數(shù)來評估單井產(chǎn)能計算公式的準確性. 公式為:

        其中, λ為波動系數(shù);Zlabel為單井產(chǎn)能計算公式計算值,MPa·d-1;Zprod為該井最大日產(chǎn)氣量,MPa·d-1.若計算值與最大日產(chǎn)氣量越接近,則波動系數(shù) λ越趨于0. 本文選取的100 口煤層氣井的波動系數(shù)分布如圖5 所示,圖中兩條黑色實線標出了±25%范圍,紅色方形點代表落在±25%范圍內(nèi)的井,藍色菱形點代表落在±25%范圍外的井. 可以看出,100口煤層氣井的波動系數(shù)圍繞在黑色虛線λ=0上下,絕大部分井的波動系數(shù)在±25%范圍內(nèi).

        各波動系數(shù)分布范圍的井數(shù)及其所占百分比如表2 所示. 可以看出,±10%范圍內(nèi)的井有43 口,即40%以上的井的波動系數(shù)位于區(qū)間[-0.1,0.1]內(nèi);分別有72%和84%的井的波動系數(shù)在±20%及±25%范圍內(nèi),只有16 口井的波動系數(shù)離λ=0較遠,分布在±25%范圍外. 因此,基于生產(chǎn)井史的單井產(chǎn)能計算公式能夠較高精度地計算該區(qū)塊已開采時間較長的煤層氣井產(chǎn)能.

        表2 波動系數(shù)分布范圍及井數(shù)占比Table 2 Range of fluctuation coefficient distribution and percentage of wells

        3.2 產(chǎn)能值預測結(jié)果分析

        神經(jīng)網(wǎng)絡模型中隱藏層神經(jīng)元個數(shù)對模型的最終預測效果有著重要的影響[37],考慮到儲層數(shù)據(jù)與特征數(shù)據(jù)的數(shù)量級,用來擬合產(chǎn)氣、產(chǎn)水、井底流壓的三個神經(jīng)網(wǎng)絡輸出單元數(shù)都選為10. 此外,神經(jīng)網(wǎng)絡模型訓練迭代次數(shù)為200,學習率為10-4,批尺寸(Batch size)為11;支持向量回歸機的核函數(shù)為RBF,懲罰系數(shù)為9.6;隨機森林的樹個數(shù)(Number of trees)為37,最大特征(Max feature)為50.

        三種機器學習模型分別使用數(shù)據(jù)集a、數(shù)據(jù)集b、數(shù)據(jù)集c 和數(shù)據(jù)集d 訓練后,測試的結(jié)果如圖6 所示,圖中平均R2為DNN、SVR 和RF 模型在測試時的R2平均值. 可以看出,使用數(shù)據(jù)集a 訓練的模型在預測時效果較差,較多的點遠離y=x線,三種機器學習模型的平均R2值僅有0.196,不能準確標定煤層氣單井產(chǎn)能. 使用數(shù)據(jù)集b 訓練的模型在測試時有了較大的提升,平均R2值提升到了0.688,但預測準確度仍然較低. 當使用數(shù)據(jù)集c 訓練機器學習模型時,大部分煤層氣井開始逐漸進入穩(wěn)產(chǎn)期,生產(chǎn)數(shù)據(jù)包含了煤層氣井排采前期較為完整的解吸—擴散—滲流特征,訓練好的機器學習模型預測決定系數(shù)較高,三種模型預測平均R2值為0.828. 進一步增大生產(chǎn)數(shù)據(jù)的排采天數(shù),可以看出,三種模型的平均決定系數(shù)增加到了0.873.

        圖6 機器學習模型在四類數(shù)據(jù)集上的預測結(jié)果. (a)數(shù)據(jù)集a;(b)數(shù)據(jù)集b;(c)數(shù)據(jù)集c;(d)數(shù)據(jù)集dFig.6 Prediction results of machine learning models on four datasets: (a) Dataset a; (b) Dataset b; (c) Dataset c; (d) Dataset d

        三種機器學習模型的平均R2值隨不同排采天數(shù)的生產(chǎn)數(shù)據(jù)變化如圖7 所示,可以看出,從圖中a點到b 點,所用時間增加1 a,平均R2值增加了0.492;從b 點到c 點,所用時間增加9 個月,平均R2值增加了0.14. 但從c 點到d 點,所用時間增加1 a,平均R2值僅增加了0.045. 從實際應用上分析,提前一年完成產(chǎn)能標定對于煤層氣現(xiàn)場進行項目規(guī)劃、工程施工等工作有著重要的影響. 因此,應選用數(shù)據(jù)集c 標定該煤層氣區(qū)塊產(chǎn)能. 另外,從圖7中可以看出,4 個點連成的曲線呈對數(shù)式增長,前期隨著生產(chǎn)數(shù)據(jù)排采天數(shù)的增加,平均R2值增長趨勢明顯,之后增長趨勢減緩并最終趨于平穩(wěn).

        圖7 決定系數(shù)變化趨勢Fig.7 Rrend of

        比較三種機器學習模型在數(shù)據(jù)集c 上各自的預測效果,測試結(jié)果如圖8 所示. 可以看出,DNN 模型在測試集上表現(xiàn)出了較好的效果,整體上DNN預測結(jié)果更接近于真實值.

        圖8 三種機器學習模型在數(shù)據(jù)集c 上的預測結(jié)果Fig.8 Prediction results of three machine learning models on dataset c

        定量分析結(jié)果如表3 所示. 從R2指標可以看出,DNN、SVR 和RF 模型在測試集上R2值分別為0.923、0.746 和0.816,DNN 模型決定系數(shù)均高于SVR 和RF. 另外DNN、SVR 和RF 在測試集上的MAE 值分別為194.44、348.28、311.92 m3·d-1,DNN模型的MAE 值比SVR 模型低了約44.2%,比RF模型低了約37.7%. 最后DNN 模型在測試集上的RMSE 值為214.66 m3·d-1,低于SVR 與RF 在測試集上的RMSE 值.

        表3 機器學習模型評價指標值Table 3 Metric values of machine learning models

        以上三個指標再次說明了:在數(shù)據(jù)集c 上,DNN能夠高精度地預測煤層氣產(chǎn)能,RF 次之,SVR 預測效果相對較差. 因為數(shù)據(jù)集c 輸入的生產(chǎn)數(shù)據(jù)僅為排采前期1000 d,所以本文提供了一種適用于尚處于開采前期的煤層氣單井產(chǎn)能標定智能算法.

        3.3 產(chǎn)能單因素敏感性分析

        在煤層氣開采過程中,合理配置各項資源對于確保煤層氣產(chǎn)量尤為重要[38]. 因此,探究產(chǎn)能對物理參數(shù)的敏感性,對于指導煤層氣開發(fā)具有重要意義. Sobol 方法可以有效解決高度非線性模型中參數(shù)間相互作用引起的靈敏度問題,計算結(jié)果相對穩(wěn)健可靠,是最具代表性的全局敏感性分析方法[39-40]. 因此,本文利用此方法,基于預測決定系數(shù)最高的DNN 模型,分析產(chǎn)能影響參數(shù)的重要性程度.

        Sobol 方法的主要思想是將函數(shù)分解成多個遞增項之和,通過采樣計算參數(shù)對模型響應的總方差及各項偏方差,進而求得各參數(shù)的靈敏度[40];為探究各物理參數(shù)對煤層氣產(chǎn)能的重要性,首先需要形成采樣數(shù)據(jù)集. 對于一口煤層氣井的采樣數(shù)據(jù)集,本文將該井的井位坐標及生產(chǎn)數(shù)據(jù)保持不變,儲層數(shù)據(jù)與特征數(shù)據(jù)在其自身值的1%波動范圍內(nèi)采樣. 例如,該井煤層厚度為5 m,則其采樣區(qū)間為[4.95, 5.05]. 為減小采樣隨機性對結(jié)果的影響,將每口井計算10 次后取算數(shù)平均作為該井的最終結(jié)果. 另外,本文統(tǒng)一分析產(chǎn)能對滲透率的敏感性,不區(qū)分測井滲透率與壓后滲透率.

        本文選取了6 口煤層氣井的計算結(jié)果進行展示,其產(chǎn)能對影響參數(shù)的單因素敏感性如圖9 所示. 圖中橫軸表示產(chǎn)能影響參數(shù),P1 到P5 為地質(zhì)參數(shù)(煤層埋深、孔隙度、滲透率、煤層厚度、含氣量),P6 到P8 為特征參數(shù)(排采前期的日產(chǎn)氣均值、日產(chǎn)水均值和井底流壓均值). 縱軸表示各影響參數(shù)的權重值,其值為Sobol 算法計算出的一階敏感性[41],反映各參數(shù)對煤層氣井產(chǎn)能的重要性程度. 對于16 號井和37 號井,權重值最大的兩項依次為P6(日產(chǎn)氣均值)和P7(日產(chǎn)水均值);其次P5(含氣量)和P8(井底流壓均值)的權重值基本相等;最后,剩余的地質(zhì)參數(shù)中,權重值從高到低依次為P3(滲透率)、P2(孔隙度)、P4(煤層厚度)以及P1(煤層埋深),說明3 個特征參數(shù)以及地質(zhì)參數(shù)中的P5(含氣量)、P3(滲透率)和P2(孔隙度)對這兩口井的產(chǎn)能影響比較大. 對于29、33、40 以及49 號井,3 個特征參數(shù)對于產(chǎn)能的重要性程度都高于地質(zhì)參數(shù),且參數(shù)權重值最大的都是P7(日產(chǎn)水均值);地質(zhì)參數(shù)中,29、33 和40 號井參數(shù)權重值最大的是P5(含氣量),而49 號井參數(shù)權重值最大的是P3(滲透率).

        圖9 煤層氣單井產(chǎn)能單因素敏感性Fig.9 Single-factor sensitivity of single CBM well productivity

        將100 口井的參數(shù)權重值求算數(shù)平均,并計算各個參數(shù)所占的百分比,用來衡量整個區(qū)塊產(chǎn)能影響參數(shù)的單因素敏感性[42]. 如圖10 所示,分析區(qū)塊參數(shù)的敏感性,可以看到,3 個特征參數(shù)P7(日產(chǎn)水均值)、P6(日產(chǎn)氣均值)、P8(井底流壓均值)依次占比17.54%、17.00%、13.91%,說明了產(chǎn)能預測模型對于這三個參數(shù)敏感性最高. P6(日產(chǎn)氣均值)和P7(日產(chǎn)水均值)所占百分比基本持平且接近20%,說明排采前期日產(chǎn)氣和日產(chǎn)水是影響區(qū)塊產(chǎn)能最關鍵的兩個因素. 另外,煤層氣開采過程中,地層壓力變化較為緩慢,井底流壓在一定程度上反映了開采過程中生產(chǎn)壓差的影響. P8(井底流壓均值)占比13.91%,說明排采前期生產(chǎn)壓差對于煤層氣產(chǎn)能的影響比較大. 地質(zhì)參數(shù)中,P5(含氣量)、P3(滲透率)、P2(孔隙度)、P4(煤層厚度)以及P1(煤層埋深)依次占比12.72%、12.41%、11.56%、8.4%和6.42%,說明P5(含氣量)、P3(滲透率)對煤層氣產(chǎn)能的重要性程度較高. 相對而言,P2(孔隙度)、P4(煤層厚度)和P1(煤層埋深)對于煤層氣產(chǎn)能影響較小.

        圖10 煤層氣區(qū)塊產(chǎn)能單因素敏感性Fig.10 Single-factor sensitivity of CBM block productivity

        綜上所述,從單個影響參數(shù)上看,3 個特征參數(shù)對區(qū)塊產(chǎn)能的重要性占比都高于5 個地質(zhì)參數(shù),說明單個排采前期動態(tài)參數(shù)對區(qū)塊產(chǎn)能的影響大于單個靜態(tài)參數(shù). 從總體上看,特征參數(shù)共占比48.45%,地質(zhì)參數(shù)共占比51.55%,兩者分別約占48%和52%,說明排采前期動態(tài)參數(shù)和靜態(tài)參數(shù)對產(chǎn)能的影響都較強.

        3.4 產(chǎn)能雙因素敏感性分析

        進一步分析影響參數(shù)之間的交互作用對煤層氣產(chǎn)能的重要性程度. 參數(shù)的二階交互作用表征其共同作用對產(chǎn)能的影響程度,其值為Sobol 算法計算出的二階敏感性[43],為產(chǎn)能的雙因素敏感性.6 口煤層氣井的雙因素敏感性結(jié)果如圖11 所示.圖中橫縱軸都表示產(chǎn)能影響參數(shù),P1 到P8 各自對應的物理參數(shù)與單因素敏感性分析時一致. 圖中右側(cè)給出了權重指數(shù),若圖中小方塊顏色越深,則權重指數(shù)值越大,表示對應橫縱坐標兩個影響參數(shù)的共同作用對井產(chǎn)能的影響越大. 可以看出,6 口井都是P1(煤層埋深)和P8(井底流壓均值)的交互作用對產(chǎn)能影響最大,P3(滲透率)和P8(井底流壓均值)的交互作用次之. 對于16、37 和49 號井,P2(孔隙度)和P6(日產(chǎn)氣均值)的權重指數(shù)比較高,說明兩者的交互作用對它們的產(chǎn)能影響較大,而40 號井的產(chǎn)能則對P1(煤層埋深)和P4(煤層厚度)的共同作用以及P5(含氣量)和P8(井底流壓均值)的共同作用比較敏感. 對于29 號井和33 號井,P1(煤層埋深)和P2(孔隙度)分別對其產(chǎn)能有較為明顯的影響.

        圖11 煤層氣單井產(chǎn)能雙因素敏感性Fig.11 Two-factor sensitivity of single CBM well productivity

        將100 口煤層氣井的交互作用權重指數(shù)求算數(shù)平均,分析如圖12 所示的區(qū)塊產(chǎn)能影響參數(shù)的雙因素敏感性[44]. 可以看出,對于該煤層氣區(qū)塊,P1(煤層埋深)和P8(井底流壓均值)以及P3(滲透率)和P8(井底流壓均值)的權重指數(shù)分列前兩位,表明區(qū)塊產(chǎn)能對它們的敏感性強. 另外,P2(孔隙度)和P6(日產(chǎn)氣均值)的交互作用也對區(qū)塊產(chǎn)能有較大的影響. 總體上看,地質(zhì)參數(shù)與特征參數(shù)之間的交互作用對于煤層氣產(chǎn)能影響更大,各地質(zhì)參數(shù)之間或各特征參數(shù)之間的影響相對較小.

        圖12 煤層氣區(qū)塊產(chǎn)能雙因素敏感性(P1:煤層埋深;P2:孔隙度;P3:滲透率;P4:煤層厚度;P5:含氣量;P6:日產(chǎn)氣均值;P7:日產(chǎn)水均值;P8:井底流壓均值)Fig.12 Two-factor sensitivity of CBM block productivity (P1: buried depth; P2: porosity; P3: permeability; P4: thickness; P5: gas content;P6: average daily gas production; P7: average daily water production;P8: average bottom hole flow pressure)

        4 結(jié)論

        (1)針對已開采時間較長的煤層氣井,基于靜態(tài)數(shù)據(jù)中的地層壓力與生產(chǎn)數(shù)據(jù)中的日產(chǎn)氣和井底流壓,提出了基于生產(chǎn)井史的單井產(chǎn)能計算公式,并以煤層氣井產(chǎn)氣曲線上最大日產(chǎn)氣量為標準衡量計算公式的準確性. 結(jié)果表明:100 口煤層氣井的波動系數(shù)整體圍繞在0 周圍,43%、72%和84%的井的波動系數(shù)分布在±10%、±20%以及±25%范圍內(nèi),具有較高的計算精度.

        (2)建立了基于DNN、SVR 以及RF 的煤層氣產(chǎn)能標定智能算法,利用井位坐標、煤層埋深、孔隙度、測井滲透率、壓后滲透率、煤層厚度、含氣量7 個儲層數(shù)據(jù),日產(chǎn)氣、日產(chǎn)水、井底流壓3 個排采前期365、730、1000 以及1365 d 的生產(chǎn)數(shù)據(jù)以及相應的3 個特征數(shù)據(jù)擬合了煤層氣單井產(chǎn)能,提供了一種適用于尚處于開采前期煤層氣井的產(chǎn)能標定智能算法. 結(jié)果表明:隨著生產(chǎn)數(shù)據(jù)排采天數(shù)的增加,智能算法預測煤層氣單井產(chǎn)能的精度呈對數(shù)式增長,前期增長趨勢明顯,之后增長趨勢減緩并最終趨于平穩(wěn),三種智能算法測試的平均R2值為0.828,其中DNN 模型的決定系數(shù)最高,在測試集上達到0.923,MAE、RMSE 分別為194.44 m3·d-1和214.66 m3·d-1.

        (3)利用預測決定系數(shù)最高的DNN 模型分析了煤層氣產(chǎn)能影響參數(shù)的敏感性. 結(jié)果顯示:排采前期日產(chǎn)水均值、日產(chǎn)氣均值以及井底流壓均值依次占比17.54%、17.00%和13.91%,為影響因素占比最高的3 項;地質(zhì)參數(shù)中占比最高的兩項為含氣量和滲透率,分別占比12.72%和12.41%;總體上看,特征參數(shù)與地質(zhì)參數(shù)分別約占48%和52%.以上結(jié)果表明,排采前期的日產(chǎn)氣、日產(chǎn)水和生產(chǎn)壓差以及含氣量和滲透率是影響煤層氣產(chǎn)能的重要因素,產(chǎn)能對排采前期的動態(tài)參數(shù)和靜態(tài)參數(shù)的敏感性都較強.

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        3D打印中的模型分割與打包
        免费观看18禁无遮挡真人网站| 久草精品手机视频在线观看| 久久免费看视频少妇高潮| 国产亚洲一区二区三区综合片| 蜜桃av区一区二区三| 亚洲黄色av一区二区三区| 亚洲av首页在线| 国产午夜视频在线观看| 日韩中文字幕久久久经典网 | 欧美老妇交乱视频在线观看| 久久久久久人妻毛片a片| 无码不卡一区二区三区在线观看| 国内精品久久人妻互换| 久久精品熟女亚洲av麻| 精品人妻无码视频中文字幕一区二区三区| 精品日韩国产欧美在线观看| 亚洲成AV人片无码不卡| 亚洲福利二区三区四区| 日本一道综合久久aⅴ免费 | 国产精品嫩草影院午夜| 日韩人妖一区二区三区| 在线观看午夜视频一区二区| 最近最新中文字幕| 在线视频中文字幕乱人伦| 蜜桃视频一区视频二区| 日本一区二区不卡在线| 中文字幕日韩三级片| 天美麻花果冻视频大全英文版| 亚洲精品一区二区三区播放| av网站大全免费在线观看| 狠狠综合久久av一区二区 | 天堂中文官网在线| 国产天堂在线观看| 亚洲高清一区二区三区视频| 久久天堂一区二区三区av| 乱人伦中文无码视频| 精品少妇一区一区三区| 国产精品自拍午夜伦理福利| 免费a级毛片无码免费视频120软件| 国产激情内射在线影院| 成 人 网 站 在线 看 免费|