亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于聚類匹配的煤層氣壓裂效果主控因素識別

        2022-10-05 09:00:20代博仁石詠衡楊兆中李小剛張馨慧
        特種油氣藏 2022年4期
        關(guān)鍵詞:氣量煤層氣標(biāo)簽

        閔 超,代博仁,石詠衡,楊兆中,李小剛,張馨慧

        (1.西南石油大學(xué)理學(xué)院,四川 成都 610500;2.西南石油大學(xué)人工智能研究院,四川 成都 610500;3.西南石油大學(xué)油氣藏地質(zhì)及開發(fā)工程國家重點實驗室,四川 成都 610500;4.國家管網(wǎng)集團(tuán)油氣調(diào)控中心,北京 100022)

        0 引 言

        煤層氣是一種重要的非常規(guī)油氣資源,但其儲層物性較差,需要采用水力壓裂技術(shù)進(jìn)行儲層改造來獲得工業(yè)產(chǎn)能[1]。煤層氣壓裂效果受地質(zhì)條件和壓裂施工等諸多復(fù)雜因素的影響,客觀準(zhǔn)確地從中篩選影響壓裂效果的主控因素,對優(yōu)化壓裂設(shè)計、提高產(chǎn)能具有重要的研究意義。目前,國內(nèi)外學(xué)者圍繞煤層氣的壓裂效果評價[2-4]與主控因素分析[5-6]等問題做了大量的研究。王玉海等[7]利用壓降曲線的形態(tài)特征對壓裂效果進(jìn)行了評價分級。計勇等[8]將影響因素與產(chǎn)氣指標(biāo)的數(shù)據(jù)關(guān)系進(jìn)行可視化處理,更直觀地分析了兩者之間的關(guān)系。李玉偉等[9]應(yīng)用模糊綜合評判和灰色關(guān)聯(lián)度分析相結(jié)合的方法,對多級壓裂水平井的壓裂效果進(jìn)行了評價。謝詩章[10]利用統(tǒng)計分析、數(shù)值模擬方法對煤層氣儲層日產(chǎn)水量進(jìn)行了分類與成因分析。Wu等[11]基于數(shù)據(jù)挖掘和滲流理論,提出了一種改進(jìn)的煤層氣井分類評價方法。檀朝東等[12]采用主成分分析法研究壓裂效果的主要影響因素。然而,上述方法均存在局限性,一方面,這些方法多以定性分析為基礎(chǔ)來評價壓裂效果,閾值的設(shè)定方法帶有一定的主觀性;另一方面,以單變量分析方法來篩選主控因素,沒有系統(tǒng)地考慮各影響因素的冗余性,難以挖掘影響因素與壓裂效果之間潛在的非線性關(guān)系。為此,提出了一種基于聚類匹配的主控因素識別方法,以挖掘影響因素之間的內(nèi)在聯(lián)系。首先,采用凝聚聚類方法對樣本井壓裂后的產(chǎn)氣效果進(jìn)行分類評級;然后,對潛在的壓裂效果影響因素進(jìn)行聚類篩選;最后,基于聚類匹配的思想,將壓裂效果分類與基于主控因素的樣本聚類結(jié)果做匹配,檢驗篩選出的影響因素和壓裂效果之間的吻合程度。該方法可有效減少人為主觀判斷帶來的干擾,克服隨機(jī)森林等有監(jiān)督學(xué)習(xí)方法只考慮因素與標(biāo)簽之間的重要性而忽視因素間冗余性的缺點,減少基于樹的分類算法的初始輸入數(shù)據(jù)量。

        1 基于聚類分析的煤層氣壓裂效果分級

        利用無監(jiān)督學(xué)習(xí)的聚類技術(shù)對壓裂后產(chǎn)能數(shù)據(jù)進(jìn)行劃分,得到的簇類按照平均日產(chǎn)氣量進(jìn)行分級,并以此作為樣本井壓裂效果的標(biāo)簽,其目的是與后文基于主控因素的聚類結(jié)果作對應(yīng)匹配?;诰垲惣夹g(shù)的評價分級方法,可以根據(jù)相似性度量或鄰近性標(biāo)準(zhǔn),按壓裂后產(chǎn)能數(shù)據(jù)的內(nèi)在聯(lián)系對樣本井進(jìn)行自然劃分,避免了采用單一產(chǎn)能指標(biāo)按閾值劃分范圍的主觀性和片面性。

        1.1 數(shù)據(jù)預(yù)處理

        選取中國某煤層氣田某區(qū)塊196口井的壓裂施工相關(guān)數(shù)據(jù)為研究對象,基礎(chǔ)數(shù)據(jù)包括23個影響壓裂效果的因素(包括地層因素數(shù)據(jù)和施工因素數(shù)據(jù))與2個壓裂后的產(chǎn)量評價指標(biāo)。為了便于數(shù)據(jù)分析,對其進(jìn)行編號,其變量符號與屬性名對應(yīng)關(guān)系如表1所示。

        表1 壓裂井基礎(chǔ)數(shù)據(jù)

        現(xiàn)場采集的196口井的數(shù)據(jù)中存在缺失和異?,F(xiàn)象,故需對數(shù)據(jù)進(jìn)行處理以提高其可用性。首先將缺失率較高的樣本數(shù)據(jù)刪去,部分缺失的數(shù)據(jù)則采用插值法進(jìn)行填補(bǔ);然后利用Epanechnikov密度估計法對數(shù)據(jù)進(jìn)行異常值檢測[13],剔除閾值以下的異常點;最后,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,最終得到167口井的壓裂數(shù)據(jù)作為有效樣本。

        為綜合分析樣本井壓裂后的產(chǎn)氣能力與排液效果,根據(jù)統(tǒng)計的累計產(chǎn)氣10 000 m3的時間和累計產(chǎn)水量,可以計算出日均產(chǎn)氣量和日均產(chǎn)水量,進(jìn)而推導(dǎo)出平均日產(chǎn)氣水比、日產(chǎn)氣貢獻(xiàn)率,以便后續(xù)壓裂效果的評價分級。

        平均日產(chǎn)氣量:

        Q=10000/t

        (1)

        平均日產(chǎn)水量:

        W=Qw/t

        (2)

        平均日產(chǎn)氣水比:

        (3)

        日產(chǎn)氣貢獻(xiàn)率:

        (4)

        式中:Q為平均日產(chǎn)氣量,m3/d;W為平均日產(chǎn)水量,m3/d;T為平均日產(chǎn)氣水比,%;C為日產(chǎn)氣貢獻(xiàn)率,%;Qi為第i個樣本井的日均產(chǎn)氣量,m3/d。

        整理得到的壓裂后產(chǎn)能數(shù)據(jù)共包含6個指標(biāo):t、Qw、Q、W、T、C,作為壓裂效果評價的有效數(shù)據(jù)屬性集合。

        1.2 基于壓裂后產(chǎn)能數(shù)據(jù)的壓裂效果分類

        由于產(chǎn)能指標(biāo)數(shù)據(jù)具有一定的層次結(jié)構(gòu),故選用凝聚聚類法,根據(jù)指標(biāo)t、Qw、Q、W、T、C對樣本井進(jìn)行分類。凝聚聚類法屬于層次聚類的一種,該算法將每個樣本初始?xì)w為單獨簇類,再在每個步驟中合并2個簇類,直至生成一個包含所有數(shù)據(jù)集的單塊[14]。首先,采用歐氏距離作為樣本間差異的距離度量;然后,綜合考慮壓裂后產(chǎn)能數(shù)據(jù)在不同聚類下4種鏈方法的同表型相關(guān)性系數(shù)和輪廓系數(shù),確定利用平均鏈將樣本井聚類為4個簇類。同時,為了對樣本井的壓裂效果進(jìn)行評價分級,根據(jù)凝聚聚類的結(jié)果分別統(tǒng)計了各簇類樣本井的平均日產(chǎn)氣量(圖1)。

        由圖1可知:4類樣本井的平均日產(chǎn)氣量以60 m3/d為界呈現(xiàn)明顯的兩級區(qū)分,其中1、2簇類共101口樣本井,3、4簇類共66口樣本井;1、2簇類樣本井的產(chǎn)氣量明顯低于3、4簇類樣本井的產(chǎn)氣量。為消除隨機(jī)性造成的干擾,分別對1、2簇類樣本井與3、4簇類樣本井進(jìn)行合并,實現(xiàn)信息粒度的粗化。將各簇類的平均日產(chǎn)氣量從低到高排序,產(chǎn)能較低的第1、2簇類樣本井標(biāo)記為“0”,第3、4簇類樣本井則標(biāo)記為“1”,并將167口煤層氣井的壓裂效果對應(yīng)分為4級(表2)。

        圖1 各簇類平均日產(chǎn)氣

        表2 壓裂效果分類

        為檢驗上述壓裂效果分級標(biāo)簽的有效性,采用t-SNE算法對167口井的其他因素數(shù)據(jù)進(jìn)行可視化處理,如圖2所示。每口樣本井的23個地層、施工因素數(shù)據(jù)可看作一個23維行向量,利用t-SNE算法向二維平面投影過程中,各樣本之間的相對距離保持不變;然后再根據(jù)壓裂效果標(biāo)簽,將投影后的點以不同的顏色標(biāo)記。

        由圖2可知:大部分效果類標(biāo)簽為1的樣本均位于y>0的半平面內(nèi),標(biāo)簽為0的則位于y<0的半平面內(nèi),說明基于壓裂效果的類標(biāo)簽可以將表1中樣本井的地層、施工因素數(shù)據(jù)分離,間接證明了根據(jù)壓裂效果指標(biāo)進(jìn)行聚類分級的方法的可靠性。

        圖2 帶類標(biāo)簽的壓裂影響因素數(shù)據(jù)集的t-SNE圖

        2 壓裂效果影響因素篩選

        根據(jù)表1中的23個地層、施工因素對167口樣本井的基礎(chǔ)數(shù)據(jù)進(jìn)行聚類和相關(guān)性分析,實現(xiàn)對煤層氣壓裂效果影響因素的初步篩選,步驟如下:①對樣本的23個地層、施工數(shù)據(jù)進(jìn)行因素聚類。②計算不同簇類中各個因素的信息增益,以此衡量其對類標(biāo)簽的重要程度,并設(shè)置閾值,去除重要性較低的因素。③對每個簇類中余下的因素做相關(guān)性分析,去除與其他因素相關(guān)性高、與類標(biāo)簽相關(guān)性低的因素。

        2.1 基于K-means算法的影響因素聚類

        通過比較K-means算法、層次聚類算法和DBSCAN算法(具有噪聲的基于密度的聚類方法)對167口樣本井的23個因素數(shù)據(jù)的聚類結(jié)果及評估指標(biāo),選取效果最佳的K-means算法對數(shù)據(jù)進(jìn)行聚類。

        首先,輸入歸一化處理后的地層、施工數(shù)據(jù),利用手肘法確定因素聚類的最優(yōu)k(分類數(shù)目)值為4。再利用K-means算法進(jìn)行聚類,得到的4個簇類包含的因素個數(shù)分別為6、3、8、6。具體聚類結(jié)果如表3所示。

        表3 基于K-means算法的因素聚類結(jié)果

        利用輪廓系數(shù)對因素聚類的結(jié)果進(jìn)行評估,繪制出相應(yīng)的輪廓圖,如圖3所示。由圖3可知,當(dāng)k=4時,每類因素的分布較為均勻,表明簇內(nèi)間距較接近其平均值,而相鄰簇類間又有明顯的分離。

        圖3 因素聚類的輪廓系數(shù)

        2.2 聚類后因素的重要性排序

        為了對因素做進(jìn)一步篩選,需要對各簇類中包含的因素進(jìn)行重要性衡量與相關(guān)性分析,去除與壓裂效果標(biāo)簽關(guān)聯(lián)性低、與同類其他因素相關(guān)性高的因素。

        在因素選擇中,信息增益常用來衡量因素帶給分類標(biāo)簽的信息量,其值越大,代表該特征越重要。為了衡量各類因素對壓裂效果類標(biāo)簽的重要程度,分別計算因素xi的信息增益:

        G(D,xi)=H(D)-H(D|xi)

        (5)

        式中:G(D,xi)為信息增益;D為23列地層、施工數(shù)據(jù)加上類標(biāo)簽組成的數(shù)據(jù)集;H(D)為數(shù)據(jù)集D的經(jīng)驗熵;H(D|xi)為因素xi對數(shù)據(jù)集D的經(jīng)驗條件熵。

        將壓裂效果類標(biāo)簽集表示為Y={0,1},pj表示第j類樣本所占比例,則:

        (6)

        設(shè)因素xi有n個不同的可能取值{ai1,ai2,…,ail,ain},則p(ail)表示因素xi取值為ail的樣本占總樣本的比例;pj(ail)表示第j類樣本中因素xi取值為ail的樣本所占比例,于是:

        (7)

        通過計算得到每個因素對應(yīng)的信息增益,設(shè)置適當(dāng)?shù)拈撝?,對聚類后的每類因素進(jìn)行初篩選,留下對標(biāo)簽重要性較大的因素。此處根據(jù)總體因素數(shù)量以及其對應(yīng)的信息增益取值,將閾值設(shè)為0.7,剔除閾值以下的因素,如圖4所示。

        圖4 各聚類中因素的信息增益分布圖

        由于簇類2中各因素的信息增益均低于0.7,故全部移除。最后,簇類1、簇類3、簇類4共剩余13個因素。簇類1對應(yīng)的因素為:壓裂液用量、前置液用量、攜砂液用量、破裂壓力、最小主水平應(yīng)力;簇類3對應(yīng)的因素為:支撐劑用量、最高砂比、垂直應(yīng)力、最大主水平應(yīng)力;簇類4對應(yīng)的因素為:加砂強(qiáng)度、含氣飽和度、含氣量、儲層壓力。

        2.3 基于相關(guān)性分析的簇內(nèi)因素冗余性消除

        將余下的13個因素按類別分別進(jìn)行相關(guān)性分析,以消除簇內(nèi)因素間的冗余性,進(jìn)一步提煉影響煤層氣壓裂效果的主控因素。

        簇類1余下的因素為:壓裂液用量(x2)、前置液用量(x3)、攜砂液用量(x4)、破裂壓力(x7)、最小主水平應(yīng)力(x16)。首先利用python對這5個因素進(jìn)行相關(guān)性分析,得到各因素間的相關(guān)系數(shù)(表4)。由表4可知:有2組因素的相關(guān)系數(shù)值較高:corr(x2,x3)=0.68,corr(x2,x4)=0.78。其中,壓裂液用量x2等于前置用量x3與攜砂液用量x4之和,即因素x2可由因素x3與因素x4綜合體現(xiàn),故剔除因素x2。

        表4 因素間的相關(guān)性系數(shù)

        結(jié)合類標(biāo)簽,對各因素本身以及因素之間的分布關(guān)系進(jìn)行可視化處理(圖5)。其中,圖5a—d和圖5f—i表示因素x4和x16與同簇類其他因素之間關(guān)于類標(biāo)簽的散點分布關(guān)系,圖5e、j表示因素x4和x16自身關(guān)于類標(biāo)簽的概率分布(2個曲線分別對應(yīng)類標(biāo)簽0和類標(biāo)簽1)。由圖5可知,因素x4與其他因素在類標(biāo)簽0/1下具有明顯的區(qū)分度,且該因素的密度分布無明顯重合現(xiàn)象(圖5a—e);而因素x16與其他因素在類標(biāo)簽0/1下的散點分布重疊率高,區(qū)分度較差,且在類標(biāo)簽0/1下的密度分布較為相近(圖5f—j),說明該因素的取值對產(chǎn)能影響較小,故剔除因素x16。利用該分析方法,最終可以確定簇類1中的3個因素為x3、x4、x7。

        圖5 各因素間的相關(guān)性散點分布圖

        對其他簇類進(jìn)行類似分析,簇類3的最終因素有2個:支撐劑用量(x6)、垂直應(yīng)力(x14);簇類4的最終因素有3個:加砂強(qiáng)度(x12)、含氣飽和度(x17)、含氣量(x18)。

        綜上,篩選得到8個影響壓裂效果的因素,按重要程度降序排列依次為:前置液用量(0.91)、攜砂液用量(0.91)、含氣飽和度(0.83)、含氣量(0.82)、垂直應(yīng)力(0.81)、支撐劑用量(0.80)、破裂壓力(0.80)、加砂強(qiáng)度(0.72)。

        3 基于聚類匹配的主控因素識別與檢驗

        第1節(jié)中基于壓裂后產(chǎn)能數(shù)據(jù)的分級與第2節(jié)中基于影響因素的聚類,這二者計算過程是相互獨立的。按照圖6所示的聚類匹配方法的思路,在“背靠背”的情況下,如果這2種分類結(jié)果之間存在對應(yīng)關(guān)系,則可以認(rèn)為篩選出的因素與產(chǎn)能效果之間具有潛在的非線性關(guān)系。

        圖6 聚類匹配方法的示意圖

        以篩選出的8個因素對應(yīng)的樣本數(shù)據(jù)為輸入,對167口井進(jìn)行重新聚類。由于得到的分類結(jié)果需要與樣本井的壓裂效果類標(biāo)簽相對應(yīng),故確定聚類數(shù)為2。其聚類效果如圖7所示。

        圖7 基于主控因素數(shù)據(jù)集的樣本聚類可視化

        由圖7可知,基于這8個因素得到的樣本井聚類效果較好,可以很好地區(qū)分簇類。同時,基于主控因素的聚類結(jié)果與基于壓裂后指標(biāo)的效果分類進(jìn)行匹配統(tǒng)計(表5)。其匹配度達(dá)到79.7%,查準(zhǔn)率為81.9%,查全率為85.1%。說明該特征識別方法有效可行,所選出的8個因素確定為影響壓裂效果的主控因素。

        表5 樣本井類別的匹配矩陣

        此外,選取的8個主控因素與其他特征選擇方法進(jìn)行主控因素識別的結(jié)果進(jìn)行對比,如表6所示。由表6可知,基于聚類匹配的特征識別方法與隨機(jī)森林、遞歸特征選擇法所選的因素有6個重合,與Apriori關(guān)聯(lián)分析法[15]所選的因素有5個重合。其中,4種方法共有的主控因素有5個,分別為:x3(前置液用量)、x4(攜砂液用量)、x6(支撐劑用量)、x14(垂直應(yīng)力)、x18(含氣量)。

        表6 不同方法的主控因素識別結(jié)果對比

        基于聚類匹配的方法所選的主控因素與其他特征選擇方法的結(jié)果重合率較高,個別的差異主要源于該方法去除了相關(guān)性較高的因素,降低了因素間的冗余性,保證了所選因素具有獨立性和代表性。篩選出的主控因素中:①含氣飽和度和含氣量直接反應(yīng)了煤儲層的含氣性;②垂直應(yīng)力則與裂縫的形態(tài)有關(guān)(是否為水平縫、是否穿層);③破裂壓力反應(yīng)了施工的難易程度;④前置液用量、攜砂液用量、支撐劑用量、加砂強(qiáng)度則一定程度上反映了壓裂后的改造體積。

        4 結(jié) 論

        (1) 利用聚類算法對某區(qū)塊196口井壓裂效果進(jìn)行了評價分級,考慮壓裂施工條件的復(fù)雜性,研究了各因素對壓裂效果的影響程度。對壓裂后指標(biāo)和地層-施工因素分別獨立地進(jìn)行聚類,并根據(jù)聚類結(jié)果的匹配,篩選出8個主控因素:前置液用量、攜砂液用量、含氣飽和度、含氣量、垂直應(yīng)力、支撐劑用量、破裂壓力、加砂強(qiáng)度。

        (2) 基于聚類匹配的主控因素識別方法避免了因素選取的主觀性,克服了常規(guī)方法只考慮變量對分類的重要性而忽視變量間冗余性的缺點,可以為重復(fù)壓裂施工設(shè)計優(yōu)化提供參考依據(jù)。

        猜你喜歡
        氣量煤層氣標(biāo)簽
        頁巖超臨界態(tài)吸附氣量計算模型
        氣量可以學(xué)習(xí)嗎
        2019年《中國煤層氣》征訂單
        中國煤層氣(2019年2期)2019-08-27 00:59:38
        煤層氣吸附-解吸機(jī)理再認(rèn)識
        中國煤層氣(2019年2期)2019-08-27 00:59:30
        無懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        大港油田穩(wěn)步提高產(chǎn)氣量 提前4個月完成全年指標(biāo)
        錄井工程(2017年3期)2018-01-22 08:39:56
        氣量三層次
        標(biāo)簽化傷害了誰
        DFS-C02V煤層氣井高產(chǎn)因素簡析
        中國煤層氣(2015年6期)2015-08-22 03:25:29
        精品久久日产国产一区| 一区二区三区在线 | 欧| 在线播放亚洲第一字幕| 北岛玲日韩精品一区二区三区| 加勒比久草免费在线观看| 国产亚洲一区二区三区综合片| 国产午夜福利不卡在线观看| 国产精品久久国产精麻豆99网站| AV中文字幕在线视| 99青青草视频在线观看| 欧美激情在线播放| 国产精品.xx视频.xxtv| av无码一区二区三| 日本a级片一区二区三区| 国产免费又爽又色又粗视频| 色翁荡息又大又硬又粗又视频图片| 国产精品久久久一本精品| 国产日本精品一区二区免费| 日日噜噜夜夜狠狠va视频v| 久久久久国产精品熟女影院| 8090成人午夜精品无码| 久久久人妻一区二区三区蜜桃d | 亚洲av久久久噜噜噜噜| 国产亚洲日韩一区二区三区| 精品黑人一区二区三区| 澳门蜜桃av成人av| 极品av麻豆国产在线观看| 亚洲国产精品久久久天堂不卡海量| 大红酸枝极品老料颜色| 日本免费视频| 国内老熟妇对白xxxxhd| 久久99久久99精品免视看国产成人| 日韩av在线不卡一区二区| 摸进她的内裤里疯狂揉她动图视频 | 午夜视频免费观看一区二区| 久久狼精品一区二区三区| 国产绳艺sm调教室论坛| 久久水蜜桃亚洲av无码精品麻豆| 亚洲一区二区日韩精品| 亚洲va欧美va日韩va成人网| 国产毛片网|