——基于斜率關聯(lián)度—隨機森林方法的工作案例"/>

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用地球物理測井資料預測煤層氣含量
        ——基于斜率關聯(lián)度—隨機森林方法的工作案例

        2021-04-24 01:13:38郭建宏張占松張超謨周雪晴肖航秦瑞寶余杰
        物探與化探 2021年1期

        郭建宏,張占松,張超謨,周雪晴,肖航,秦瑞寶,余杰

        (1.長江大學 地球物理與石油資源學院,湖北 武漢 430100; 2.長江大學 油氣資源與勘探技術(shù)教育部重點實驗室,湖北 武漢 430100; 3.中海油研究總院,北京 100027)

        0 引言

        煤層氣勘探是近年來非常規(guī)油氣資源開發(fā)的重點研究方向,準確評價煤層氣含量對煤層氣井單井產(chǎn)量預測與煤層氣產(chǎn)能評估及勘探開發(fā)尤為關鍵[1-3]。煤層氣資源作為非常規(guī)油氣資源,儲集與滲流機理與常規(guī)天然氣差異較大[4],且煤層氣含量受控于多因素,機理復雜,例如與其埋深、層厚,煤體結(jié)構(gòu)及變質(zhì)程度,以及儲層壓力、溫度等地質(zhì)因素均有一定關系[5-7]。評價煤儲層氣含量一直是煤層研究的重、難點,煤層氣含量評價方法最為直接的是對煤層取心樣本直接進行解吸測量,這一方法最為準確,但由于煤層大多較薄且機械強度差易破碎,導致煤層取心率低,對應煤心解吸實驗資料較少[8]。國內(nèi)外學者針對這一問題,結(jié)合煤層氣儲集機理與實驗等,提出了一系列方法:從KIM法將儲層因素與水分等工業(yè)組分相關聯(lián),后基于這一方法將工業(yè)組分引入并對其分析得到KIM改進方程[9-10];后有學者通過實驗建立等溫吸附模型,利用等溫吸附線對煤層氣含量進行預測,并基于這一理論提出蘭氏煤階方程進行評價預測[11-12]。

        上述實驗方法雖能評價煤層氣含量,但多為對樣本點進行評價,難以應用到整口井或整個區(qū)塊,因此通過地球物理測井方法評價煤層氣含量等煤層參數(shù)逐漸成為研究熱點。相較于成本較高的取心方法,測井手段連續(xù)性強,性價比與可靠性均較高,將兩者結(jié)合評價煤層氣含量成為了接受度更高,使用更廣泛的方法。利用地球物理測井資料預測煤層氣含量的方法主要可概括為:原理法、數(shù)學地質(zhì)法及數(shù)學統(tǒng)計法。原理法多為直接基于煤層測井資料,通過理論方法形成煤層氣含量預測模型,例如將測井體積模型用于評價煤層氣含量[13],或利用背景值法[14]計算煤層氣含量,但兩種方法中參數(shù)的選擇對結(jié)果影響較大,且該類方法泛化性差,只能用于單井或單層評價。也有部分數(shù)學地質(zhì)方法被用于煤層氣含量預測,田敏等[15]將灰色系統(tǒng)理論結(jié)合實驗數(shù)據(jù)對煤層氣含量建立灰色多變量靜態(tài)模型,隨后郭建宏等[16]基于此將灰色多變量靜態(tài)模型與測井曲線相結(jié)合將這一方法泛化性增強,能連續(xù)且準確地評價出整段煤層的氣含量曲線,這類方法更多從數(shù)據(jù)上出發(fā),得到的結(jié)果不一定能與理論完全相符。相比之下,數(shù)學統(tǒng)計法在煤層氣含量預測中應用的更為廣泛。由于煤層的復雜性,測井響應與煤層氣含量間的關系也復雜多樣,可能為線性亦或非線性關系,因而統(tǒng)計法多以回歸分析及機器學習算法為主。回歸分析法即是通過研究測井曲線與目標氣含量的相關關系找到與煤層氣含量敏感的測井曲線,利用最小二乘法計算出煤層氣含量回歸評價模型,這一方法簡單且效果穩(wěn)定,被廣泛應用于煤層氣含量評價。梁亞林等[17]利用測井曲線建立多元回歸方程預測氣含量并以此為基礎對相應區(qū)塊進行氣含量預測,結(jié)果與地質(zhì)情況相吻合;黃兆輝等[18]與金澤亮等[19]針對沁水盆地將多元線性回歸法與蘭氏方程相結(jié)合,建立煤層氣含量評價模型,結(jié)果準確度較高,具有有效性。當線性關系難以表征煤層氣含量與測井曲線間的關系時,可利用機器學習等方法進行預測,這類方法非線性逼近能力強,以神經(jīng)網(wǎng)絡方法為主,已有許多學者對此進行研究,將特征參數(shù)與目標參數(shù)通過神經(jīng)網(wǎng)絡進行訓練形成網(wǎng)格模型,對測試集進行泛化性測試,以此評價模型的實用性。上述方法對存在潛在聯(lián)系但無法直接用表達式展示的問題有明顯優(yōu)勢,例如將煤層氣含量與測井曲線資料通過BP神經(jīng)網(wǎng)絡進行訓練,后對區(qū)塊其他井進行驗證發(fā)現(xiàn)這一方法預測煤層氣含量精度高[20-21];隨后支持向量機[22]等更多算法被引入到煤層氣含量預測中。

        在實際應用中,各類方法均受到不同程度的限制,體積模型法等原理傳統(tǒng)方法受參數(shù)選擇影響大且泛化性差而無法被推廣使用;多元回歸法由于各測井曲線對氣含量響應的靈敏度不同使得結(jié)果會出現(xiàn)偏差,且這類方法對數(shù)據(jù)量要求大,與煤層取心率低樣本少的特點相沖突;BP神經(jīng)網(wǎng)絡訓練的復雜性大,參數(shù)選擇對模型影響大且對樣本量有一定要求,使用局限性明顯;支持向量機回歸對小樣本適用性強但容易過擬合;隨機森林算法可利用袋外數(shù)據(jù)直接檢測泛化性,且可利用有放回抽樣解決樣本數(shù)據(jù)少的問題[23],因此也被應用于復雜儲層參數(shù)預測中[24],相比其他傳統(tǒng)機器學習方法,隨機森林算法更適合解決煤層小樣本參數(shù)預測問題?;诖?,筆者將斜率關聯(lián)度法與隨機森林相結(jié)合,基于測井曲線對煤層氣含量進行斜率關聯(lián)度分析,剔除冗余數(shù)據(jù),即通過斜率關聯(lián)法篩選出與煤層氣含量敏感的測井曲線作為特征向量,并基于分析結(jié)果結(jié)合隨機森林算法進行決策樹個數(shù)優(yōu)選,建立模型對煤層氣含量進行預測,并用實際數(shù)據(jù)來驗證本文方法的有效性與實用性。

        1 基本原理

        1.1 斜率關聯(lián)度計算

        一般關聯(lián)度最早由鄧聚龍教授提出,該分析法對樣本數(shù)量小且分布無明顯規(guī)律的數(shù)據(jù)有較強的實用性,計算結(jié)果與定性分析符合。一般關聯(lián)度基本思想為將各序列與目標序列曲線形態(tài)進行對比,其幾何形狀接近,序列間關聯(lián)度大,反之則小[25]。實際使用時,普通的關聯(lián)度法存在缺陷,許多學者提出了改進,例如為了克服在規(guī)范性與保序性上的不足提出普通斜率關聯(lián)度法[26],即在不同序列上對比各序列段斜率的接近程度來計算各序列間關聯(lián)度大小,斜率越接近則關聯(lián)度越大,反之則越小。后在此基礎上進行了改進,對斜率的正負進行了計算[27],使其既能反映正關聯(lián)也能找到負關聯(lián),極大提高了評價的精確性。規(guī)定一參考序列x0與一對比序列xi,其形式分別為:

        x0={x0(k)|k=1,2,3,…,n},

        (1)

        xi={xi(k)|k=1,2,3,…,n},

        (2)

        則改進的斜率關聯(lián)法公式為[28]:

        (3)

        1.2 隨機森林

        1.2.1 隨機森林原理

        隨機森林法于2001年被提出[29],該算法是一種以決策樹為基礎的集成算法,將單個決策樹視作其對目標建立的模型結(jié)果進行綜合得到新的模型。其中一組決策樹可寫為:{h(X,θk),k=1,2,…,K}。式中θk為隨機變量,服從獨立同分布,X與K分別表示自變量與決策樹的個數(shù)。隨機森林預測的結(jié)果基于各決策樹的結(jié)果取均值而得[29]:

        (4)

        (5)

        即每棵樹約有36.8%的樣本未被抽取參與建模,將此類數(shù)據(jù)稱為袋外數(shù)據(jù)(OOB,out of bag)。Bagging思想在隨機化建立更多的決策樹時還保證其相互獨立性。與Bagging思想類似,隨機子空間思想可以保證不同樹節(jié)點與其節(jié)點間的特征子集的差異性,以及樹的獨立性與多樣性,即在構(gòu)建決策樹的過程中,每個分裂節(jié)點的特征數(shù)選取一般為從總特征空間F中隨機抽取f(推薦為f=log2F)個特征,并依照Gini指標選取最優(yōu)特征進行分支生長。因而在隨機森林回歸中,決策樹K與特征數(shù)f對模型預測性能存在顯著影響。

        1.2.2 隨機森林泛化誤差

        以遵循獨立同分布的隨機向量(X,Y)為例,結(jié)合式(5),則h(X)對應均方泛化誤差為:

        EX,Y(Y-h(X))2,

        (6)

        在隨機森林回歸中,若決策樹的個數(shù)趨于無窮時,存在:

        (7)

        (8)

        1.2.3 隨機森林流程

        隨機森林回歸算法流程為:

        1) 應用boostrasp采樣隨機生成訓練數(shù)據(jù)集,未被抽中的為袋外數(shù)據(jù),再隨機抽取m個特征進行節(jié)點分裂,結(jié)合數(shù)據(jù)集中建模數(shù)據(jù)構(gòu)建決策樹;

        2) 按照上述方法構(gòu)建K棵回歸決策樹,令其充分生長,不進行剪枝,形成隨機森林;

        3) 利用袋外數(shù)據(jù)誤差(OOB error)評價對效果進行評價,公式為:

        (9)

        4) 利用上述步驟確定的模型對目標數(shù)據(jù)樣本進行預測,隨機森林各決策樹預測結(jié)果的平均為最終預測輸出結(jié)果。

        1.3 煤層氣含量評價步驟

        結(jié)合本文實際內(nèi)容,實行步驟為:

        1) 利用斜率關聯(lián)度計算各測井曲線與煤層氣含量的關聯(lián)性,并根據(jù)實際計算結(jié)果篩選出有利于煤層氣含量建模的數(shù)據(jù);

        2) 利用選取出的測井曲線結(jié)合隨機森林算法進行建模,并探究出合適的回歸決策樹的數(shù)目;

        3) 根據(jù)探究得到的特征個數(shù)與回歸子樹個數(shù)進行建模,并用未參與建模的數(shù)據(jù)進行預測驗證。

        2 煤層氣含量預測模型

        2.1 應用工區(qū)概況

        使用沁水煤田柿莊北地區(qū)部分井3號煤層數(shù)據(jù),結(jié)合本文所述方法對該區(qū)塊3號層氣含量進行評價預測。沁水煤田為石炭—二疊紀煤田,資源儲量豐富,儲層條件穩(wěn)定,具有巨大開發(fā)潛力[31]。柿莊北區(qū)位于該區(qū)塊,共取得該區(qū)塊9口井共40組煤心數(shù)據(jù),將煤心樣本取得后,通過對樣本進行多次采樣實驗測試對應樣品氣含量,最后對實驗結(jié)果求取平均值。同時對煤心樣本對應的深度段取平均深度值對應的各測井曲線響應值,并進行制表。表1為3號煤層標準化后的測井響應范圍,圖1為各測井響應曲線與煤層氣含量交會圖。

        圖1 煤層氣含量與測井參數(shù)間的關系Fig.1 Relationship between coalbed methane content and logging parameters

        表1 3號煤層測井響應范圍

        理論上,煤層埋深一定程度上決定了煤巖產(chǎn)生的氣體能否有效儲存,在埋深較淺處,煤層氣含量隨深度增加而增大??紫抖葴y井系列包含補償密度測井、聲波時差測井及補償中子測井。由于煤的基質(zhì)密度較低,煤層密度值隨其致密程度的增加而增大,相應的孔隙度及氣含量會降低,因而隨著煤層氣含量的增加,對應煤的體積密度減小,在補償密度測井資料上補償密度測井響應值與煤層氣含量理論上應呈負相關關系;煤巖分子結(jié)構(gòu)相對松散,聲波時差測井曲線的響應為時差值較高,且其對儲層含氣性敏感,遇氣層會明顯增大或出現(xiàn)周波跳躍現(xiàn)象[32],理論上在聲波時差測井資料上兩者呈正相關關系;煤儲層由碳、氫、氧組成且煤層氣中含有甲烷,導致含氫指數(shù)高,使補償中子測井資料呈現(xiàn)出一種虛高假象,而實際孔隙度通常較低。巖性測井系列提供了自然伽馬測井曲線和自然電位測井曲線。由于煤的自然放射性通常較弱,煤的天然放射性多取決于成煤過程中的外來礦物質(zhì),粘土礦物會通過影響煤的吸附性能進而影響煤層氣儲集,煤層中粘土礦物增多,對應自然伽馬測井響應增大,但煤層氣含量由于有效孔隙降低而使得氣含量減少,即在自然伽馬測井資料上呈現(xiàn)出兩者為負相關關系;在自然電位測井上,煤層的巖性相對更純且導電性差,煤巖與泥漿間的化學作用和動電學作用弱,對應自然電位響應較低。電阻率測井系列提供了深、淺側(cè)向電阻率曲線:煤巖電阻率受多因素影響,從煤層氣含量考慮,氣含量越大,電阻率測井響應越大。

        從理論上分析后結(jié)合實際交會圖進行判斷,3號煤層深度范圍為953~1 350 m間,每口井實驗樣本數(shù)大多在4~7組,從交會圖1h中可發(fā)現(xiàn)不同井3號層深度相近,與氣含量無明顯關聯(lián),總體上隨深度增加煤層氣含量增大。分析煤層氣含量與孔隙度測井系列曲線的交會圖,結(jié)合圖1b及補償密度測井資料得到的響應范圍,3號煤層補償密度測井資料反映煤層的響應區(qū)間為1.19~1.89 g/cm3,但純煤密度較低,若煤層中含泥巖夾矸則會使得補償密度側(cè)向響應值增大,將A4井中補償密度過高值與A9井中氣含量過低值剔除,則可發(fā)現(xiàn)煤層補償密度測井值與煤層氣含量呈負相關關系。圖1c與圖1d能看出聲波時差測井曲線資料中的響應值與煤層氣含量趨勢上為正相關,但關系較差,補償中子測井曲線資料上其響應值與煤層氣含量呈正相關且關系相對明顯,即3號煤層由于煤層氣的存在將使得補償中子測井資料的“虛高假象”更為突出。對應圖1a與圖1g分析,不同井自然伽馬基線存在差異,每口井中存在自然伽馬測井響應高值,這一原因多為煤層中泥巖夾矸所致,由于煤層中含泥巖夾矸段會導致自伽馬測井響應異常增高進而直接影響了兩者相關性;自然電位測井響應與煤層氣含量總體上為正相關,但每口井中自然電位測井響應與煤層氣含量無明顯關系。煤巖電阻率受多方面因素影響,其變質(zhì)程度、煤體結(jié)構(gòu)、礦物質(zhì)含量及分布等均會對電阻率測井響應值產(chǎn)生影響,通過圖1e與1f分析,煤層氣含量與深側(cè)向電阻率總體上無相關關系,僅單井部分樣品存在相關性,且煤層氣含量與淺側(cè)向電阻率相對深側(cè)向電阻率存在差異,單井來看趨勢也并不明顯,多因煤層受泥漿侵入影響或擴徑導致其表征的并非為原狀地層。

        綜上分析可以看出,煤層氣含量與地球物理測井曲線響應間的關系極為復雜,測井響應受多方面因素影響,煤巖本身以及夾矸存在等均會使得煤層段測井曲線響應出現(xiàn)變化。煤層取心率低,樣本少,簡單數(shù)據(jù)清洗會使得樣本數(shù)據(jù)減少,且趨勢也不一定能準確找到,而傳統(tǒng)交會圖分析對樣本數(shù)據(jù)量有一定要求且容易受異常值的影響,因而靠交會圖難以準確得到適合隨機森林算法的特征參數(shù)?;诖耍疚耐ㄟ^斜率關聯(lián)度進行相關性分析,這一方法對實驗數(shù)據(jù)具有更好的隱性挖掘能力,且受異常值影響相對小,能對樣本數(shù)據(jù)總體與目標數(shù)據(jù)進行綜合分析,不會由于單個異常點對結(jié)果產(chǎn)生較大影響。

        2.2 斜率關聯(lián)度計算

        通過改進的斜率關聯(lián)度法,對煤層測井曲線參數(shù)進行計算分析,表2為參與斜率關聯(lián)度計算的數(shù)據(jù),表3為斜率關聯(lián)度計算結(jié)果。

        表2 3號煤層斜率關聯(lián)度計算樣本

        表3 3號煤層斜率關聯(lián)度計算結(jié)果

        通過表3可以得到6條與煤層氣含量正關聯(lián)的測井曲線,自然電位與淺側(cè)向電阻率為負關聯(lián),正關聯(lián)曲線中,均能找到理論支撐。在正關聯(lián)曲線中,自然伽馬曲線關聯(lián)度相對其他測井曲線較低,為了驗證這一曲線是否適合用于煤層氣含量預測,利用隨機森林中袋外誤差曲線進行求證。如圖2所示,將隨機森林決策樹個數(shù)選定為600個,共作出3條曲線,曲線1為在斜率關聯(lián)度計算后篩選出的曲線基礎上去掉了自然伽馬曲線得到的袋外誤差數(shù)據(jù),曲線2為斜率關聯(lián)度計算篩選出的曲線得到的袋外誤差數(shù)據(jù),曲線3為未經(jīng)斜率關聯(lián)度計算的全曲線得到的袋外誤差數(shù)據(jù)。經(jīng)分析可發(fā)現(xiàn),曲線3初始袋外誤差大且收斂速度慢但相對穩(wěn)定,經(jīng)特征篩選后的袋外誤差數(shù)據(jù)初始誤差相對較小且收斂速度慢,曲線1與曲線2均在收斂過程中出現(xiàn)震蕩,但很快趨于穩(wěn)定,且最終曲線2袋外誤差最低,即斜率關聯(lián)度計算結(jié)果具有可靠性,包含自然伽馬曲線的曲線特征組袋外誤差相對低且收斂相對更快。因而證明斜率關聯(lián)度能更深地發(fā)掘與煤層氣含量相關的測井曲線,計算結(jié)果準確且與理論相符。

        圖2 斜率關聯(lián)度計算前后隨機森林袋外誤差結(jié)果Fig.2 Results of random forest out of bag error before and after slope correlation calculation

        2.3 隨機森林決策樹優(yōu)選

        為了使隨機森林建立的模型具有可靠性和對煤層氣含量預測的有效性,需對隨機森林的參數(shù)進行探究。在優(yōu)選特征個數(shù)的基礎上,還需確定決策樹的個數(shù)。就隨機森林這一算法而言,決策樹個數(shù)的選擇能直接影響模型的性能與精度,決策樹過少,建立的模型精度低,數(shù)據(jù)利用不充分,模型效果發(fā)揮不充分,決策樹過多會導致模型成型慢且增加過擬合發(fā)生的風險。由于煤層取心率低且數(shù)據(jù)稀少,為有效利用數(shù)據(jù),將已有的40組數(shù)據(jù)隨機分成4份,每組10個數(shù)據(jù),其中1份為測試集,不參與隨機森林建模,另外3份數(shù)據(jù)用于交叉驗證以確定決策樹的優(yōu)選范圍。具體做法為將3份原始數(shù)據(jù)中選取兩組數(shù)據(jù)作為訓練集對隨機森林模型進行訓練,再用另外一組數(shù)據(jù)進行驗證,對驗證集中的數(shù)據(jù)進行預測,以驗證集中預測值與實驗值的MSE作為判別指標。在4組分布中,為保證交叉驗證的有效性,煤層氣含量分布相對平均,除測試集外,另外3組數(shù)據(jù)中利用其中兩組數(shù)據(jù)進行訓練得到模型,預測另一組樣本,通過觀測預測結(jié)果隨決策樹個數(shù)變化來判斷每組合適的決策樹個數(shù),結(jié)合3組結(jié)果進行判斷。如圖3所示,通過交叉驗證,隨著決策樹個數(shù)不斷增加,3個組分別作為驗證集時的預測值與實驗值的均方誤差逐漸穩(wěn)定,在決策樹為500個時,3組驗證集均方誤差趨于穩(wěn)定且達到低值,因而確定決策樹個數(shù)為500。如圖4所示,以上述3組數(shù)據(jù)為訓練集對隨機森林進行訓練得到模型,決策樹個數(shù)設為500,觀察其袋外誤差, 發(fā)現(xiàn)500個決策樹時袋外誤差已達到最低值且穩(wěn)定,因而證明上述探究結(jié)果有效。

        圖3 交叉驗證探究決策樹范圍結(jié)果Fig.3 Cross validation to explore decision tree range results

        圖4 決策樹個數(shù)為500時袋外誤差Fig.4 Out of bag error when the number of decision trees is 500

        2.4 隨機森林預測煤層氣含量

        基于上述對測井曲線特征的優(yōu)選和對決策樹個數(shù)的選擇,利用上述3組訓練集訓練得到的隨機森林模型預測測試集煤層氣含量,結(jié)果如圖5及表4所示。隨機森林計算得到的模型在訓練集回判相對誤差為19%,針對測試集預測,平均相對誤差在 11.1%,并以此為基礎對該區(qū)塊單井3號煤層進行評價預測,以A7井為例,結(jié)果如圖6所示。隨機森林訓練得到的模型在測試集上表現(xiàn)穩(wěn)定,能有效預測煤層氣含量,并能以此為基礎對區(qū)塊各井3號煤層進行煤層氣含量曲線預測,且預測結(jié)果與實驗結(jié)果相符合,說明該算法對訓練集有效且泛化性強,能有效抗過擬合。此外,為了進行對比還對數(shù)據(jù)進行多元回歸擬合,用同樣曲線回歸擬合出的模型在訓練集與測試集上的平均相對誤差分別為21%和19%,誤差均大于本文算法預測的結(jié)果,也說明本文方法相對應用較為廣泛的多元回歸法能進一步提升預測精度。在預測結(jié)果中,發(fā)現(xiàn)當煤層氣含量為低值時的預測結(jié)果都存在較大誤差,即含氣量低值預測結(jié)果相對偏高,針對這一問題,筆者進行了分析。

        圖5 斜率關聯(lián)度—隨機森林預測煤層氣含量結(jié)果Fig.5 Slope correlation degree-prediction of coalbed methane content by random forest

        表4 3號煤層測試集預測結(jié)果

        圖6 A7井3號煤層氣含量預測成果Fig.6 Prediction results of No.3 coalbed methane content in A7 well

        2.5 誤差異常值分析

        如圖7所示,以A3井為例,對比該井3號煤層測井響應值,發(fā)現(xiàn)煤層中下段部分存在響應異常值,7號樣本自然伽馬測井響應值與補償密度測井響應值明顯偏高,深側(cè)向電阻率測井響應值相對較淺部分減小且補償密度測井響應值超出煤巖最大密度范圍,結(jié)合柿莊北區(qū)綜合柱狀圖發(fā)現(xiàn),該區(qū)3號層存在泥巖或炭質(zhì)泥巖巖性的夾矸,理論上自然伽馬測井響應值增加,密度測井響應值增加與深側(cè)向電阻率測井響應值減小理論上表征的應為煤層氣含量減小,而A3井7號樣本實驗結(jié)果表明取心處氣含量僅略低于其他處且與3號樣本持平,這一現(xiàn)象會導致針對該樣本的預測結(jié)果遠低于實際實驗情況,即夾矸的存在對煤層氣含量預測結(jié)果造成了影響。綜合分析,夾矸的存在對煤層測井響應會產(chǎn)生較大影響,自然伽馬值與補償密度值異常增高且泥巖電阻率低會使得電率測井資料響應值出現(xiàn)減小波動,所以對應夾矸深度段用于預測煤層氣含量的測井資料響應會受到干擾,使得夾矸段氣含量評價結(jié)果相對異常,而煤層取樣難度大,樣本量小,受夾矸影響的實驗樣本少,多元回歸法或機器學習法都難以單獨對這類情況進行建模評價,隨機森林法對該類樣本預測誤差相對該算法對其他層段預測誤差較大,為38.4%,多元回歸法對該井夾矸處氣含量預測的相對誤差為54.8%,相比之下雖然隨機森林算法預測誤差相對略低,但預測效果均較差,兩種方法都無法準確預測。因而隨機森林算法能有效預測煤層非夾矸段氣含量值,夾矸段難以準確預測,總體對生產(chǎn)上能進行準確指導,對煤層氣含量預測評價提供了一種新的思路方法。

        圖7 A3井3號煤層響應與實驗值分析Fig.7 Response and experimental value analysis of No.3 coal seam in well A3

        3 結(jié)論

        1) 斜率關聯(lián)度算法能更好發(fā)掘測井資料與煤層氣含量間的關系,通過對各條測井曲線與煤層氣含量值進行斜率關聯(lián)度計算分析,對于煤層氣含量預測問題,自然伽馬、補償密度、聲波時差、補償中子、深側(cè)向電阻率及深度與煤層氣含量為正關聯(lián),利用上述測井曲線相對其他曲線組合能降低隨機森林算法的袋外誤差,提升該算法在煤層氣含量預測能力上的泛化性。

        2) 針對隨機森林算法的超參數(shù)中的決策樹個數(shù)選擇中,利用交叉驗證計算得到?jīng)Q策樹個數(shù)為500時,該算法學習效率達到穩(wěn)定且能充分發(fā)揮算法性能,訓練出的模型準確且強健。

        3) 通過實際計算分析,利用斜率關聯(lián)度—隨機森林法能有效預測煤層氣含量,計算精度相對多元回歸法更高,但在煤巖夾矸段煤層氣含量預測效果欠佳,總體上能有效評價區(qū)塊煤層氣含量。

        綜上,利用斜率關聯(lián)度—隨機森林法能有效預測煤層氣含量,構(gòu)建出的模型強健且泛化性強,實際應用價值突出,對煤層氣勘探開發(fā)可提供幫助。

        91av精品视频| 国产成人av一区二区三区在线观看| 国产永久免费高清在线| 亚洲gv白嫩小受在线观看| 欧美综合区自拍亚洲综合| 亚洲国产91精品一区二区| 亚洲综合欧美色五月俺也去| 女人被爽到呻吟gif动态图视看| 精品无码AV无码免费专区| 久久精品网站免费观看| 国产人妻熟女呻吟在线观看| 国产av麻豆mag剧集| 99热成人精品免费久久| 日韩精品少妇专区人妻系列| 亚洲伦理第一页中文字幕| 天天燥日日燥| 亚洲午夜无码久久yy6080| 久久精品国产福利亚洲av| 日韩精品人成在线播放| 蜜桃麻豆www久久囤产精品| 无码Av在线一区二区三区| 国产一区二区不卡av| 又紧又大又爽精品一区二区 | 久久精品国产精品亚洲毛片| 国产美女胸大一区二区三区| 国产区女主播一区在线| 久久精品噜噜噜成人| 女的把腿张开男的猛戳出浆| 国产亚洲精品视频网站| 未发育成型小奶头毛片av| 曰本极品少妇videossexhd| 国产成人精品视频网站| 亚洲精品一区三区三区在线| 亚洲 自拍 另类小说综合图区 | 日本a在线播放| 精品黄色国产一区二区| 亚洲av无码专区亚洲av网站| 毛片网站视频| 亚洲一区二区三区ay| 亚洲 日本 欧美 中文幕| 国产成人精品成人a在线观看|