亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        可解釋機器學習在油氣產量預測中的研究進展

        2023-12-06 07:26:26侯夢瑤潘曉甜張春曉馬含含
        石油化工應用 2023年10期
        關鍵詞:產量特征方法

        侯夢瑤,潘曉甜,張春曉,馬含含

        (西安石油大學石油工程學院,陜西西安 710065)

        在油田開發(fā)過程中,油氣產量預測是一項非常重要的工作,合理進行石油產量預測可以有效評估油田的開發(fā)潛力,有助于全面認識油藏以及改善油井的工作制度,進而提出相應的發(fā)展策略。產量預測方法可以分為基于物理機理的預測方法和基于數(shù)據(jù)驅動的預測方法。基于物理機理進行建模時,建模方法主要包括解析、半解析及數(shù)值模擬方法等。但是,基于物理機理的預測方法在實際應用時存在許多弊端,比如它對數(shù)據(jù)的要求很高,但實際所獲取的多為一些雜亂數(shù)據(jù),若數(shù)據(jù)處理不完善會對模型預測的準確度影響較大。基于物理機理的傳統(tǒng)產量預測方法建模周期長,工作量大,尤其在復雜的地質及工程條件下,預測效果通常會不理想。另外,一些理想化假設的引入與求解方法的復雜程度都限制了物理機理預測方法在現(xiàn)場的應用。為解決上述基于物理機理的傳統(tǒng)油氣產量預測中存在的問題,研究人員開始利用機器學習等數(shù)據(jù)驅動方法建立油氣產量與儲層、壓裂等參數(shù)之間的模型,從而對油氣產量進行合理預測[1]。雖然機器學習進行油氣產量預測的優(yōu)勢很大,但是目前的研究仍存在一定問題。比如模型在訓練時需要進行超參數(shù)的優(yōu)化,但是這方面的研究有限。另一方面,由于算法的最小可解釋性和黑箱性質,這些先前建立的模型很難被大多數(shù)人所理解[2]。打開黑匣子至關重要[3-4],它可以讓工作人員輕松理解機器學習的內部邏輯[5-6],進一步從各個方面來分析影響因素的作用規(guī)律。本文就以上問題調研了基于機器學習建立產量預測模型的方法,并詳細介紹了幾種可解釋分析方法。

        1 基于機器學習的油氣產量預測研究現(xiàn)狀

        WANG 等[7]在2019 年開發(fā)了一種綜合數(shù)據(jù)挖掘方法來評價加拿大西部沉積盆地Montney 組的油井生產動態(tài),定性和定量的評價了增產參數(shù)與第一年產油量之間的關系。此外,比較了四種常用的監(jiān)督學習方法,包括隨機森林(RF)、自適應增強(AdaBoost)、支持向量機(SVM)和神經網(wǎng)絡(NN),以估計第一年的井產量。并且采用遞歸特征消去交叉驗證(RFECV)確定了影響非常規(guī)油藏第一年采油的最重要因素。研究發(fā)現(xiàn),最終確定用來建立準確預測模型的重要變量為:井緯度、經度、井垂深、單井泵入支撐劑、井橫向長度和單井注入流體,與其他機器學習方法相比,RF 的預測性能最好。

        LI 等[8]在2020 年對涪陵頁巖氣田主區(qū)塊地質和裂縫工程數(shù)據(jù)采用了一種新的分段產量預測方法。對三種機器學習方法,包括支持向量回歸(SVR)、核脊回歸(KRR)和隨機森林(RF)進行了訓練和測試。在進行模型訓練前,先使用偏相關分析和遞歸特征消除方法,對自變量進行處理以選出最佳參數(shù),即層數(shù)、40/70 目低密度陶粒、支撐劑總體積、砂比、簇數(shù)和簇間距。結果表明,RF 的均方根誤差最小,即預測精度最高。另外,該研究在進行水力壓裂處理前,利用局部依賴圖成功地優(yōu)化了地質和裂縫工程參數(shù),這在一定程度上也提高了預測精度。近幾年來學者們基于機器學習建立油氣產量預測的一些研究見表1。

        表1 基于機器學習的油氣產量預測技術研究

        然而,盡管一系列研究表明基于機器學習的數(shù)據(jù)驅動方法可以很好的進行油氣產量預測[13-15],但其所建立的大多數(shù)預測模型都是黑盒子模型[16],這就意味著人們很難理解模型的行為和思維過程。在進行油氣產量預測時,通過可解釋分析有助于理解模型內部的預測機制,由此來給開發(fā)者一些意見。實際上,可解釋人工智能(Explainable Artificial Intelligence,XAI)已成為智能油田一個新興研究領域,在使用機器學習方法進行油氣產量預測之后,可以利用XAI 工具提高機器學習的可解釋性、公平性和透明度。

        2 可解釋方法概述

        2.1 建模前的可解釋

        建立模型之前的可解釋性主要包括數(shù)據(jù)分析和特征工程。數(shù)據(jù)分析是開展可解釋性分析的第一步,可以通過變量相關性分析、數(shù)據(jù)可視化等工作對數(shù)據(jù)進行詳細的了解,這是開展后續(xù)工作的基礎。特征工程包括數(shù)據(jù)預處理、特征構造和特征選擇。特征工程是從數(shù)據(jù)中提取有效的特征,作為模型的輸入,從而提高模型的預測精度。數(shù)據(jù)預處理包括數(shù)據(jù)清洗和不平衡數(shù)據(jù)處理等工作。特征構造是通過對原始特征進行加工、組合來生成新的特征。特征選擇是因為當特征維度很大時不但會使得模型難以訓練,又容易導致過擬合。

        2.2 建模中的可解釋

        建模時所用到的模型中有一類其本身是可解釋的,稱為自解釋模型。這類模型通常結構簡單,容易理解,傳統(tǒng)的自解釋模型包括線性模型、邏輯回歸、樸素貝葉斯等。但在實際應用時,為了提高預測精度,通常會使用黑盒子模型進行預測。針對黑盒子模型,可以使用代理模型的方法進行解釋,即使用可解釋的模型來模仿黑盒子的行為,盡量做到在保證預測精度的基礎上降低模型復雜度。

        2.3 建模后的可解釋

        大多數(shù)候選模型不被認為是內在可解釋的,此類模型通常被稱為黑盒子模型。各個領域的研究人員開發(fā)了多種XAI 工具,以幫助理解基于人工智能(AI)的黑盒子模型。對于已經建立好的黑盒子模型進行解釋,也就是理論界常說的建模后的可解釋,主要用來理解這些特征是如何影響預測結果的。建模后的可解釋可以分為全局與局部解釋性兩大類型[17]。借助全局可解釋性能夠清晰的了解模型的內在邏輯和運行機制,同時還可以將參數(shù)和學習形式以最簡單的方式進行展示。借助這種解釋方法可以很好的認識模型學習的具體過程。根據(jù)數(shù)據(jù)樣本學習到的具體內容制定具體形式的對策等。對于局部可解釋性來說,可以據(jù)此了解模型對于特定的輸入而做出決策的細節(jié)過程,也可以從中知道具體特征對于預測結果具有何種貢獻。這部分主要運用模型無關的解釋方法,接下來詳細介紹一下SHAP 和LIME 兩種方法,其余幾種常用的方法見表2。

        表2 模型無關的解釋方法比較

        2.3.1 SHAP SHAP 是一種基于博弈論的方法,是一類加性解釋模型,用于描述機器學習模型的性能。為了產生一個可解釋的模型,SHAP 使用了一種加性特征屬性方法,即輸出模型被定義為輸入變量的線性相加,所有特征的貢獻值的和即為模型的最終預測。SHAP用以下公式定義:

        式中:φ0-預測模型在數(shù)據(jù)集上的平均預測值,即SHAP 值;φj-特征j 對樣本z'的貢獻值;z'-聯(lián)合向量,即特征存在(z'=1)或不存在(z'=0);M-輸入特征數(shù)量。

        三特征的示意流程圖見圖1,紅色表示特征是正貢獻作用,藍色則表示特征是負貢獻作用??梢钥闯鰧τ诿恳粋€樣本,SHAP 都能詳細地分析出特征的影響力和影響的正負性。SHAP 可以很好的進行全局和局部解釋。在先前的研究中可以找到SHAP 更詳細的解釋[21-22]。

        圖1 三個輸入變量SHAP 方法

        2.3.2 LIME LIME(本地可解釋模型-不可知性解釋),顧名思義,本地可解釋模型-不可知性解釋(LIME)是一種工具,用于理解和解釋底層機器學習模型,同時保持模型不可知[23]。LIME 的工作假設是非線性模型可以用小尺度的線性模型近似。該算法略微擾動了示例的特征值,在其鄰域內創(chuàng)建了一組類似的示例,這是特征空間的一個子空間。指數(shù)核用于定義鄰域。LIME 用以下公式定義解釋:

        式中:G 是可解釋模型的集合;Ω(g)定義了所有g∈G 的解釋的復雜度,目標是使Ω(g)最小,從而具有可解釋的簡單模型;正在解釋的黑盒子模型用f 表示;πx定義了實例x 周圍的鄰域大??;L(f,g,πx)是可解釋模型g 與原始黑盒子模型f 之間預測接近度的度量(即保真度)。最終目標是最小化L(f,g,πx),同時使Ω(g)低到足以被人類解釋,從而保證可解釋性和局部保真度。

        3 結論和建議

        (1)基于機器學習的油氣產量預測模型結合了地質、生產等多種類型的數(shù)據(jù),充分挖掘數(shù)據(jù)內部的規(guī)律,極大的提高了模型預測的精確性。

        (2)在數(shù)據(jù)挖掘預測模型中,“特征越多,性能越好”的做法不再被接受。通過合適的算法進行特征選擇在一定程度上可以提高預測結果的準確度。特征選擇結果越穩(wěn)定,更能為可解釋模型的建立提供支持。

        (3)實際上,在絕大多數(shù)模型中,可解釋性與準確率是互斥關系。關于深度學習的可解釋性研究仍沒有可靠的可解釋方法。因此,在構建模型的過程中引入一種有效機制來兼顧模型的準確率和可解釋性在各個領域均具有重大意義。

        (4)可解釋性研究在石油工業(yè)中的應用作為較新的研究方向,仍存在許多亟待解決的問題等待著后來者去探索研究。

        猜你喜歡
        產量特征方法
        2022年11月份我國鋅產量同比增長2.9% 鉛產量同比增長5.6%
        今年前7個月北海道魚糜產量同比減少37%
        當代水產(2021年10期)2021-12-05 16:31:48
        海水稻產量測評平均產量逐年遞增
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        2018上半年我國PVC產量數(shù)據(jù)
        聚氯乙烯(2018年9期)2018-02-18 01:11:34
        抓住特征巧觀察
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        亚洲色图在线视频观看| 日出水了特别黄的视频| 成年女人永久免费看片| 天堂Av无码Av一区二区三区| 久久少妇高潮免费观看| 2019nv天堂香蕉在线观看 | 成人精品天堂一区二区三区| 醉酒后少妇被疯狂内射视频| 国产片三级视频播放| 精品女厕偷拍视频一区二区区| 国产精品免费看久久久无码| 久久精品国产亚洲av高清漫画| 久久久久久久久国内精品影视| av天堂手机在线看片资源| 无码aⅴ精品一区二区三区| 人妻无码久久一区二区三区免费| A阿V天堂免费无码专区| 亚洲一区二区三区在线视频| 成 人 免 费 黄 色| 人妻无码中文字幕免费视频蜜桃 | 亚洲一区二区三区四区地址 | 久久久久国产精品免费免费搜索| 天堂AV无码AV毛片毛| 国产亚洲av综合人人澡精品| 国产激情无码一区二区三区| chinese国产乱在线观看| 亚洲精品中文字幕尤物综合| 91精品国产在热久久| 国产97在线 | 亚洲| 国产精品亚洲午夜不卡| 伊人影院成人在线观看| 国产婷婷色一区二区三区| 亚洲日韩∨a无码中文字幕| 国产AV无码无遮挡毛片| 国产精品国产三级国产av创| 日本韩国一区二区高清| 97精品国产一区二区三区| 精品国产a∨无码一区二区三区| 国产精品国产三级国av在线观看| 亚洲中文字幕在线一区| 久热这里只有精品视频6|