亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        PCA-OPLS聯(lián)合法快速評價頁巖氣井儲量動用程度

        2023-09-02 10:03:14劉洪林周尚文李曉波
        油氣藏評價與開發(fā) 2023年4期
        關(guān)鍵詞:模型

        劉洪林,周尚文,李曉波

        (1.中國石油勘探開發(fā)研究院,北京 100083;2.中國石油非常規(guī)油氣重點(diǎn)實(shí)驗室,北京 100083;3.國家能源頁巖氣研發(fā)(實(shí)驗)中心,河北 廊坊 065007)

        在中國四川盆地威遠(yuǎn)、長寧、涪陵等地區(qū)已經(jīng)實(shí)現(xiàn)了頁巖氣資源的規(guī)模開發(fā),隨著勘探開發(fā)工作的深入,確定可動用儲量逐漸成為頁巖氣開發(fā)評價的重要工作,也是進(jìn)一步調(diào)整開發(fā)方案的重要基礎(chǔ)[1?3]。與常規(guī)油氣藏類似,頁巖氣井的儲量動用程度為某一生產(chǎn)時間動用的地質(zhì)儲量與已經(jīng)投入開發(fā)地質(zhì)儲量的比值,單井可采儲量可以通過數(shù)值模擬法、生產(chǎn)動態(tài)分析法等方法獲得。頁巖氣井的單井控制儲量可以通過單井控制面積和資源豐度進(jìn)行計算,該方法屬于頁巖氣儲量動用的直接計算法,由于頁巖儲層的儲量動用受儲層物性、含水飽和度、動用范圍、地層壓力等多因素影響,頁巖氣的產(chǎn)出與儲層地質(zhì)參數(shù)、工程參數(shù)等緊密相關(guān),因此,也可以通過分析各參數(shù)與單井可采儲量與單井控制儲量的關(guān)系,利用多元回歸的數(shù)學(xué)方法進(jìn)行頁巖氣儲量動用的預(yù)測。正交偏最小二乘法(OPLS)是一種新型的多元統(tǒng)計數(shù)據(jù)分析方法,它由TRYGG Johan 等人于2002 年首次提出,是一種多因變量對多自變量的回歸建模方法,其最大特點(diǎn)是可以去除自變量X中與分類變量Y無關(guān)的數(shù)據(jù)變異,使分類信息主要集中在一個主成分中,模型變得簡單和易于解釋,其模型預(yù)測效果優(yōu)于PLS(偏最小二乘法),該方法后來被推廣到微生物基因分析領(lǐng)域[4?10]。國內(nèi)有學(xué)者將主成分分析法(PCA)與多元非線性回歸法結(jié)合應(yīng)用在儲層敏感性和煤層含氣量預(yù)測方面,并取得了良好的效果[4,11];在孔隙度預(yù)測方面,優(yōu)選基于地震數(shù)據(jù)中與孔隙度相關(guān)性較大的5 種地震屬性,建立回歸方程,預(yù)測孔隙度的精度相對較高,可以得到目標(biāo)區(qū)的孔隙度分布情況[12]。也有學(xué)者采用Boosting?PLS(根據(jù)錯誤率采樣的偏最小二乘方法)進(jìn)行頁巖總含氣量的預(yù)測,提取最能反映含氣性的密度、中子、鈾、釷等測井信息,通過模型自動學(xué)習(xí)訓(xùn)練樣本中輸出曲線響應(yīng)值與總含氣量的響應(yīng)關(guān)系,利用所得響應(yīng)關(guān)系建立總含氣量預(yù)測模型[13]。在農(nóng)業(yè)領(lǐng)域,采用PCA和PLS用于大豆品質(zhì)評價[14]。目前也有學(xué)者在研究頁巖氣產(chǎn)能主控因素中使用PLS提取關(guān)鍵因素[15],但是由于頁巖氣地質(zhì)、工程和生產(chǎn)要素之間具有較高的相關(guān)性,如含氣量與總有機(jī)碳(TOC)之間、加砂量和壓裂液量之間等相關(guān)性較強(qiáng),因此在因素分析中容易導(dǎo)致參數(shù)重復(fù)賦權(quán)。在國內(nèi)開展的儲量動用研究工作中,多為常規(guī)油氣或致密氣,未見在頁巖氣儲量動用評價中的應(yīng)用[16?21],通過將PCA 方法中降維優(yōu)勢和OPLS 多變量預(yù)測優(yōu)勢結(jié)合起來嘗試用于頁巖氣儲量動用程度分析,可以為頁巖氣儲量動用程度評價提供一種新方法,提高儲量動用程度分析速度和預(yù)測效果。

        1 PCA?OPLS聯(lián)合法的建立

        1.1 主成分分析法(PCA法)

        PCA 法是一種數(shù)據(jù)降維的數(shù)學(xué)方法,該方法把數(shù)據(jù)投射到樣本散布最開的正交向量上,使投射平均均方誤差盡可能小。該方法將數(shù)據(jù)進(jìn)行特征分解,構(gòu)造新變量(稱為主成分),并保證各變量之間正交。方差越大主成分含原變量信息量越大。提取較少幾個主成分就可以包含原數(shù)據(jù)的信息,將高維數(shù)據(jù)降到低維。PCA 法處理不但能減少每組樣本的特征個數(shù),而且確保這些特征相互獨(dú)立,使樣本規(guī)律更清晰,便于回歸模型的挑選,并加快算法速度。PCA法的降維步驟為:

        1)建立原始樣本矩陣X,樣本數(shù)量要求不小于自變量數(shù)量。

        2)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。

        3)計算樣本相關(guān)系數(shù)矩陣R。

        4)計算相關(guān)系數(shù)矩陣的特征值和相應(yīng)的特征向量,得到特征值λ=(λ1,λ2,…,λp),特征向量ai=(a1,a2,…,ap)。

        5)根據(jù)影響因素累積貢獻(xiàn)大小選擇前k個因素,計算累積貢獻(xiàn)率的公式為

        式中:k為特征向量的數(shù)量;λi為矩陣R的特征值;η為累積貢獻(xiàn)率。

        通常取λ>1 的前k個特征向量,認(rèn)為前k個影響因素已包含數(shù)據(jù)的原始信息。前k個特征向量組成的矩陣U,即主成分得分系數(shù)矩陣。

        6)利用式(3),將p個影響因素降維成k個影響因素,即:

        式中:X′為PCA法處理后的樣本矩陣。

        1.2 正交最小偏二乘分析方法(OPLS法)

        多元回歸分析是對2 個或2 個以上具有相關(guān)關(guān)系的變量變化的一般關(guān)系進(jìn)行分析,它主要是研究自變量X和因變量Y之間的相互關(guān)系,建立變量間經(jīng)驗公式,以便達(dá)到預(yù)測或控制的目的。多元非線性回歸就是尋找能表示特征值x1,x2,...,xn和預(yù)測值yi之間的非線性函數(shù)關(guān)系式:

        式中:yi為預(yù)測值;x1,x2,…,xn為特征值。

        通過最小二乘法可求得模型中相應(yīng)的參數(shù)。在變量系統(tǒng)中提取若干對系統(tǒng)具有最佳解釋能力的新綜合變量,并求出當(dāng)前主成分?jǐn)?shù)量時總的模型預(yù)測指數(shù)Q2和變量投影重要性值(VIP),若0.50.8,模型具有較好預(yù)測能力。同時根據(jù)VIP值大小進(jìn)行排序,若參數(shù)VIP值>1,參數(shù)具有重要性。變量投影重要性指標(biāo)VIP值用以評價自變量對因變量的影響能力,其定義式為:

        式中:Rd(Y;tk)和Rd(Y;t1,t2,…,tr)是單個主成分tk對產(chǎn)量Y的影響能力和所有主成分t1,…,tr,對Y的累計解釋能力,p為自變量數(shù)量。自變量xj在解釋因變量Y的重要性,可以用變量投影重要性指標(biāo)VIPj來測度。VIPj值越大,說明xj對Y的影響能力就越大,即各影響因素對產(chǎn)能的貢獻(xiàn)程度越大。

        1.3 PCA-OPLS聯(lián)合法實(shí)現(xiàn)流程

        PCA?OPLS 聯(lián)合法實(shí)現(xiàn)流程主要有以下3 個步驟:①頁巖氣樣本數(shù)據(jù)集采集:包括各種地質(zhì)、儲層、壓裂和生產(chǎn)參數(shù),并計算儲量動用程度。②樣本實(shí)驗集和驗證集劃分:對實(shí)驗集樣本進(jìn)行PCA 降維處理,降維后得到的特征彼此之間相互獨(dú)立,不存在線性相關(guān)的主成分,重新命名主成分為新變量指標(biāo),便于探索新變量與預(yù)測值之間的數(shù)學(xué)關(guān)系,用最小二乘法對實(shí)驗集樣本數(shù)據(jù)綜合分析,建立新變量與預(yù)測值之間的數(shù)學(xué)模型。③模型精度檢驗:用驗證集樣本對模型進(jìn)行精度檢驗,形成預(yù)測模型并應(yīng)用于新區(qū)的預(yù)測。

        2 實(shí)驗分析及應(yīng)用

        2.1 自變量和因變量的建立

        以昭通國家級頁巖氣示范區(qū)為例,開展PCA?OPLS 聯(lián)合法的實(shí)驗分析。昭通國家級頁巖氣示范區(qū)主體處于盆外復(fù)雜構(gòu)造殘留坳陷區(qū)(圖1),浙江油田分公司在2 a 內(nèi)實(shí)現(xiàn)了集中評價與產(chǎn)能試驗,探明了千億立方米級儲量的大型淺層頁巖氣田。目的層龍馬溪組埋深500~1 500 m,五峰組—龍一1亞段優(yōu)質(zhì)頁巖發(fā)育厚度3~5 m、有機(jī)質(zhì)豐度TOC介于2.58 %~3.21 %,Ro介于1.99 %~3.08 %、含氣性介于3.30~5.51 m3/t、孔隙度介于3.98%~5.41%、脆性礦物含量介于51 %~75 %,地層壓力系數(shù)介于1.25~1.62[22?25]。目前已經(jīng)有27口井投入生產(chǎn),單井平均測試產(chǎn)量7.03×104m3/d,取得了較好的效果,采用單井可采儲量與控制儲量比值法計算儲量采出程度平均為9.2%~39.6%。

        圖1 昭通淺層頁巖氣田的位置Fig.1 Location of shallow shale gas field of Zhaotong

        通過收集昭通地區(qū)頁巖氣井的脆性礦物含量、儲層厚度、總有機(jī)碳、孔隙度等20項自變量參數(shù)組成矩陣X,通過單井可采儲量和控制儲量計算獲得單井儲量動用程度,定義為因變量Y,詳見表1。根據(jù)樣本數(shù)量不小于自變量數(shù)量的要求,采用其中20 個樣本作為實(shí)驗樣本,即采用最小樣本數(shù)量進(jìn)行實(shí)驗,目的在于探索最小樣本情況下的方法精度,其余7個樣本作為驗證樣本。然后利用公式1進(jìn)行變量的標(biāo)準(zhǔn)化,使得自變量X中具有不同數(shù)量級參數(shù)的方差都能得到有效表達(dá)。

        表1 頁巖氣井實(shí)驗樣本的主要參數(shù)Table 1 Key parameters of testing samples from shale gas wells

        2.2 PCA法降維

        在采用OPLS 進(jìn)行建模之前,先將標(biāo)準(zhǔn)化處理后的實(shí)驗樣本進(jìn)行主成分分析,以降低樣本數(shù)據(jù)的維度、簡化識別模型。主成分分析的結(jié)果見表2,前5個主成分的方差貢獻(xiàn)率分別為30.03 %、20.10 %、14.00 %、10.30 %和7.15 %。由此得知,前5 個主成分的累計貢獻(xiàn)率已達(dá)81.58%,能夠很好地表征原樣本的信息。

        表2 頁巖氣井實(shí)驗樣本的總方差解釋Table 2 Interpretation of total variance of testing samples from shale gas wells

        2.3 主成分矩陣和主成分得分系數(shù)矩陣U

        由PCA分析獲得的成分矩陣表3可以看出:主成分PCA1 主要與資源豐度、優(yōu)質(zhì)儲層厚度等反映資源品質(zhì)的指標(biāo)相關(guān),定義為資源品質(zhì)指標(biāo);主成分PCA2 主要與累計產(chǎn)氣、IP30 等反映氣井產(chǎn)量的指標(biāo)相關(guān),定義為產(chǎn)量指標(biāo);主成分PCA3 主要與主壓裂用液量、加砂量等反映了改造程度的指標(biāo)有關(guān),定義為改造程度指標(biāo);主成分PCA4 主要與吸附氣含量、含氣飽和度等反映儲層質(zhì)量指標(biāo)相關(guān),定義為儲層質(zhì)量指標(biāo);主成分PCA5 主要與壓裂排量參數(shù)相關(guān),定義為壓裂施工指標(biāo)。同時,通過PCA分析獲得5個主成分的得分系數(shù)矩陣見表4,得分系數(shù)矩陣是計算主成分的基礎(chǔ)數(shù)據(jù)。

        表3 頁巖氣井實(shí)驗樣本的成分矩陣Table 3 Composition matrix of testing samples from shale gas wells

        表4 頁巖氣井實(shí)驗樣本的主成分得分系數(shù)矩陣Table 4 Principal component score coefficient matrix of testing samples from shale gas wells

        以頁巖氣井實(shí)驗樣本的主成分PCA1 為例說明主成分計算方法。

        PCA1=0.837×優(yōu)質(zhì)儲層厚度+0.795×資源豐度?0.738×井口壓力?0.663×總有機(jī)碳+0.149×累計產(chǎn)氣+0.141×IP30+0.463×孔隙度+0.459×含氣量?0.012×主壓裂用液量?0.026×改造段數(shù)?0.107×加砂量?0.097×吸附氣含量?0.168×含氣飽和度+0.141×水平段長+0.637×單井儲量?0.320×脆性礦物含量?0.156×最大排量?0.042×最小排量?0.133×井深

        其他主成分PCA2、PCA3、PCA4、PCA5 計算方法與其相同,最終得到PCA降維后的矩陣,見表5,包含5個自變量的矩陣X′。

        表5 頁巖氣井實(shí)驗樣本的PCA處理后的矩陣Table 5 PCA processed matrix of testing samples from shale gas wells

        2.4 OPLS法分析

        將表2 中20 個樣品資源品質(zhì)指標(biāo)、產(chǎn)量指標(biāo)、改造程度指標(biāo)、儲層質(zhì)量指標(biāo)、壓裂施工指標(biāo)等作為自變量,計算的儲量動用程度作為因變量,通過SIMICA13.0 軟件建立計算儲量動用程度與自變量的校正OPLS模型,進(jìn)行偏最小二乘法分析,求出當(dāng)前5個主成分時的模型擬合精度指數(shù)R2為0.891 2 和模型預(yù)測指數(shù)Q2值為0.869 3,說明模型具有較好預(yù)測能力,最后使用7 個驗證樣本數(shù)據(jù)進(jìn)行精度檢驗,若R2<0.80,可以通過重新選擇實(shí)驗樣本數(shù)據(jù)構(gòu)建新的OPLS 預(yù)測模型,通過計算獲得所有樣本數(shù)據(jù)預(yù)測結(jié)果繪制交匯圖和參數(shù)重要性VIP圖(圖2)。由圖2可知儲量動用程度預(yù)測值與計算值相關(guān)系數(shù)r達(dá)到0.851 1,具有較高的預(yù)測精度,預(yù)測誤差越小,越能夠滿足預(yù)測要求。

        圖2 儲量動用程度預(yù)測結(jié)果及影響因素VIP值分布Fig.2 Prediction results and VIP value distribution of reserve recovery ratio

        OPLS 法計算得到各參數(shù)的VIP值并進(jìn)行排序,按照排序最終判斷影響頁巖氣儲量動用程度的主控因素大小,結(jié)果是改造程度指標(biāo)>資源品質(zhì)指標(biāo)>儲層質(zhì)量指標(biāo)>產(chǎn)量指標(biāo)>壓裂施工指標(biāo),其中改造程度指標(biāo)、資源品質(zhì)指標(biāo)的VIP值大于1.0,為模型的重要影響參數(shù)。

        為了比較方法間的準(zhǔn)確性,利用SPSS 軟件采用神經(jīng)網(wǎng)絡(luò)、多元線性回歸方法進(jìn)行擬合,對比PCA?OPLS 聯(lián)合法、神經(jīng)網(wǎng)絡(luò)法、多元線性回歸方法之間的精度見表6,可知PCA?OPLS 聯(lián)合法平均誤差1.44%,神經(jīng)網(wǎng)絡(luò)法平均誤差為4.86%,直接回歸法平均誤差為6.13%。與神經(jīng)網(wǎng)絡(luò)、多元線性回歸法相比,PCA?OPLS聯(lián)合法可大幅度提高預(yù)測值的準(zhǔn)確率。

        表6 不同方法預(yù)測結(jié)果與計算結(jié)果比較Table 6 Comparison of prediction results and calculation results of different methods

        3 新方法驗證應(yīng)用

        為進(jìn)一步驗證PCA?OPLS 聯(lián)合法的可靠性和可推廣性,采用威遠(yuǎn)地區(qū)的頁巖氣井?dāng)?shù)據(jù)作為新驗證樣品進(jìn)行進(jìn)一步分析,威遠(yuǎn)地區(qū)鉆井較多,其中威202井區(qū)和威204井區(qū)已經(jīng)投產(chǎn)490口井。按照上述應(yīng)用流程,先采用PCA 對數(shù)據(jù)進(jìn)行降維,然后建立OPLS 預(yù)測模型分析方法,獲得預(yù)測擬合與計算儲量動用率相關(guān)性圖(圖3),結(jié)果表明威遠(yuǎn)地區(qū)預(yù)測效果仍然較好,相關(guān)系數(shù)分別為0.923 4 和0.864 2。大樣本數(shù)據(jù)分析結(jié)果明顯好于昭通地區(qū)的小樣本數(shù)據(jù)預(yù)測精度,說明更多的樣本數(shù)據(jù)對于模型的迭代和分析能夠提供更多的信息,避免個別異常樣本的干擾,提高模型的預(yù)測精度。

        圖3 威遠(yuǎn)地區(qū)儲量動用程度擬合結(jié)果與計算結(jié)果對比Fig.3 Comparison between fitted and calculated results of reserve recovery ratio in Weiyuan area

        4 結(jié)論與認(rèn)識

        1) 通過對樣本進(jìn)行PCA 法降維處理,再用OPLS 法建立計算值與預(yù)測值之間的回歸擬合數(shù)學(xué)模型,建立了PCA?OPLS 聯(lián)合法預(yù)測頁巖氣儲量動用程度的新方法。

        2)PCA?OPLS聯(lián)合法的優(yōu)點(diǎn)在于利用PCA降維法保證樣本信息損失最小減少的前提下,大大減少樣本矩陣維度和計算工作量,同時發(fā)揮OPLS 模型多變量預(yù)測優(yōu)勢,確定影響儲量動用程度的核心參數(shù)。

        3)通過實(shí)例應(yīng)用表明PCA?OPLS 聯(lián)合法在昭通、威遠(yuǎn)頁巖氣井儲量動用預(yù)測準(zhǔn)確率滿足要求,可以用于預(yù)測新鉆井的儲量動用程度。威遠(yuǎn)地區(qū)大樣本對比表明,當(dāng)樣本量越大,預(yù)測結(jié)果誤差越小,綜合預(yù)測法使用精度更高,效果更好。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        国产 字幕 制服 中文 在线| 日本黄网色三级三级三级| 日本亚洲视频一区二区三区| 无码区a∨视频体验区30秒| 欧美日韩精品一区二区在线视频| 亚洲色AV天天天天天天| 亚洲综合一区二区三区在线观看 | 精品专区一区二区三区| 国产91传媒一区二区三区| 久久综合狠狠色综合伊人| 91免费在线| 亚洲素人日韩av中文字幕| 亚洲色图视频在线免费看| 国产熟妇按摩3p高潮大叫| 色综合久久综合欧美综合图片| 亚洲天堂免费成人av| 日本亚洲精品一区二区三| 国产一区二区精品久久| 亚洲大片免费| 亚洲av手机在线观看| 成 人 免 费 黄 色| 呻吟国产av久久一区二区| 白白色发布永久免费观看视频| 国产精品熟女一区二区三区| 消息称老熟妇乱视频一区二区| 99精品成人片免费毛片无码| 国产一级自拍av播放| 国产精品理论片在线观看| 久久久久亚洲av无码专区桃色| 亚洲AV无码日韩一区二区乱| 国产av一级片在线观看| 久久久精品国产sm调教网站 | 国产无遮挡无码视频免费软件| 日韩在线视精品在亚洲| 亚洲精品中文字幕91| 免费视频成人片在线观看| 中文文精品字幕一区二区| 中文字幕视频二区三区| 国产av无码专区亚洲精品| 精品久久久无码中文字幕| 偷拍自拍一区二区三区|