亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        選擇性集成學習模型在巖性-孔隙度預測中的應用

        2020-04-08 13:02:46段友祥王言飛孫歧峰
        科學技術與工程 2020年3期
        關鍵詞:分類方法模型

        段友祥, 王言飛, 孫歧峰

        (中國石油大學(華東)計算機與通信工程學院,青島 266580)

        當今,隨著油氣勘探不斷地向深層和儲集條件復雜的區(qū)域開發(fā),油氣勘探活動越來越復雜,儲層勘探的難度也越來越大[1],運用新技術來研究儲層的識別和預測變得越來越重要??紫抖茸鳛橐环N重要的儲層參數,是解釋地層和降低油氣勘探項目風險的基礎和關鍵[2],因此,準確地預測孔隙度至關重要??紫抖鹊臏y定可以分為直接測定法(巖心分析、井壁取心、巖屑分析)和間接解釋法(地震、測井)[3],其中,測井數據是目前所能獲得的分辨率最高、連續(xù)性最好的地質數據,在取心較少以及地震資料分辨率達不到要求的情況下,利用測井數據進行孔隙度等儲層屬性參數的預測非常必要和重要,一直是學者研究的重要課題。

        在使用測井數據進行孔隙度預測方面,常規(guī)方法主要有反演法、經驗公式法或多元回歸等線性方法,這些方法雖然原理簡單、易于操作,但誤差較大,解釋結果并不理想。而人工神經網絡、支持向量機(support vector machine,SVM)、決策樹等機器學習方法不但能夠解決復雜的非線性映射問題,而且比常規(guī)方法的學習能力、自適應能力及信息處理能力更強,解釋的結果精度更高,因此被廣泛運用在預測方面。項云飛等[4]提出將線性回歸與徑向基(radial basis function,RBF)神經網絡相結合的復合方法進行儲層的孔隙度預測,該方法預測的精度明顯高于單獨使用線性回歸或RBF神經網絡方法預測的精度;鄧社根等[5]提出考慮巖性信息的改進支持向量機方法進行孔隙度預測,該方法明顯提高了孔隙度的預測精度;陳曉琳等[6]提出使用基于局部加權的決策樹算法對孔隙度進行預測,并取得了良好的效果;魏佳明等[7]將隨機森林方法引入到孔隙度預測中,與多元回歸相比,有效提高了孔隙度預測的精度;An等[8]提出使用深度學習技術進行孔隙度預測,并達到了預期的效果;Baneshi等[9]采用優(yōu)化的RBF神經網絡通過井數據來預測儲層的孔隙度模型,并取得了較高的預測精度;Saljooghi等[10]提出將小波理論與多層感知機相結合的孔隙度預測方法,提高了人工神經網絡的收斂速度和泛化能力。然而單一機器學習方法在地質儲層參數預測問題上存在普適性不強、穩(wěn)定性不高等缺點[11]。而集成學習,特別是選擇性集成學習的出現,為解決單一的學習器所不能解決的問題提供了新思路。選擇性集成學習是由Zhou等[12-13]提出的,即在執(zhí)行分類或回歸時,當訓練出多個個體學習器之后,從中選擇一部分彼此差異大且泛化能力強的個體學習器進行集成,可以得到比使用所有個體學習器進行集成更好的結果[14]。

        基于此,考慮巖性對孔隙度的影響,研究并提出了融合巖性分類進行選擇性集成學習建立預測模型的方法,該方法首先使用支持向量機進行巖性分類,并將巖性分類結果作為孔隙度選擇性集成預測模型的輸入。然后在研究分析典型機器學習方法的基礎上,通過主成分方法分析法從支持向量回歸、RBF神經網絡、隨機森林、嶺回歸和K近鄰回歸等經典模型中選擇出一組表現優(yōu)異的個體學習模型組成集成學習模型,個體在集成模型中的權重由主成分權重平均法獲得,最終采用加權平均法得到集成學習模型的輸出。通過該方法對儲層孔隙度進行預測,以期得到更準確的預測結果。

        1 模型與方法

        1.1 基本模型

        提出的模型框架如圖1所示。其基本思想是先進行巖性分類,再根據巖性建立預測模型。即首先將輸入數據預處理,利用SVM、邏輯回歸、隨機森林和決策樹四種機器學習方法進行巖性分類,選擇一種分類準確率最高的方法建立巖性分類模型。對不同巖性的測井數據,按一定的策略選擇訓練表現優(yōu)異的多個個體學習模型組成集成學習模型,再采用組合方法得到集成模型的輸出。其中,選擇性集成學習模型采用的個體學習模型方法有SVM、RBF神經網絡、隨機森林、嶺回歸和K近鄰回歸。模型中涉及的經典機器學習方法主要有7種,其基本原理及優(yōu)缺點比較如表1所示。

        圖1 巖性-孔隙度預測模型框架

        1.2 具體方法

        1.2.1 巖性分類模型的建立

        分別采用支持向量機、邏輯回歸、隨機森林和決策樹方法進行訓練,選擇分類準確率最高的方法建立巖性分類模型。其結構如圖2所示。

        圖2 巖性分類模型結構

        1.2.2 孔隙度預測模型的建立

        通過研究和分析,采用SVM、RBF神經網絡、隨機森林、嶺回歸和K近鄰回歸等經典模型作為個體學習模型。分別應用5種機器學習方法對訓練數據進行訓練學習,得到5個個體學習器,對個體學習器采用主成分方法分析法進行選擇性集成學習,選擇出一部分訓練效果好的個體學習器組成集成學習器,并對集成學習器采用 主成分權重平均法產生最終的輸出結果。該模型簡稱PCA-SEN模型。其結構如圖3所示,其中選擇和組合是模型的核心。

        表1 經典機器學習方法原理及優(yōu)缺點

        圖3 PCA-SEN模型結構

        選擇采用主成分方法分析法,即將訓練數據采用5種機器學習方法進行訓練學習,并對訓練數據進行一次預測分析。對每條訓練數據采用不同機器學習方法得到的預測值與真實值進行比較,選擇預測值最優(yōu)所對應的機器學習方法作為該條數據所采用的方法,統(tǒng)計每種機器學習方法所通過的樣本數,以及在總的訓練樣本中所占的比例。最后,根據比例選擇出幾種最優(yōu)的機器學習方法。假設對于給定的訓練樣本集{(xi,yi),i=1,2,…n},其中xi∈Rm,yi∈R,其服從y=f(x),分別使用SVM、RBF、隨機森林、嶺回歸和K近鄰回歸方法進行建模,得到回歸方程式分別為g=f1(x)、g=f2(x)、g=f3(x)、g=f4(x)和g=f5(x),對于任意一條訓練數據(xk,yk),采用這五個模型進行預測,得到五個不同的輸出值f1(xk)、f2(xk)、f3(xk)、f4(xk)和f5(xk),采用式(1)方法,分別將每種方法的輸出值和真實值對比,選擇輸出值與真實值誤差最小所對應的機器學習方法作為該條數據所采用的方法。

        min{|yk-fi(xk)|},i=1,2,…,5

        (1)

        對所有的訓練數據,重復上述步驟,得到每種機器學習方法所通過的樣本數,分別記為p1、p2、p3、p4、p5,且滿足p1+p2+p3+p4+p5=n,根據式(2)、式(3),選擇符合條件的機器學習方法,組成集成學習的個體學習器。

        (2)

        (3)

        組合和決策方式的不同,對模型預測精度的影響至關重要。常用的組合和決策方法有簡單平均法和權重平均法。簡單平均法是把單一機器學習方法的輸出的平均值作為最終輸出。權重平均法是從單一機器學習方法估計的結果乘以其在總體預測中的貢獻的權重因子,權重因子通常通過遺傳算法或單層感知器獲得。采用主成分權重平均法確定個體學習器的權重因子。即對于給定的訓練樣本集{(xi,yi),i=1,2,…,n},其中xi∈Rm,yi∈R,假設經過“主成分方法分析”法后,選擇了方法1、方法2、方法5三種機器學習方法,得到的回歸方程分別是f1(x)、f2(x)和f5(x),對于任意一條訓練數據(xk,yk),得到三個不同的輸出值f1(xk)、f2(xk)和f5(xk),采用式(4)方法,分別將每種方法的輸出值和真實值對比,選擇輸出值與真實值誤差最小所對應的機器學習方法作為該條數據所采用的方法。

        min{|yk-f1(xk)|,|yk-f2(xk)|,|yk-f5(xk)|}

        (4)

        對所有的訓練數據,重復上述步驟,得到每種機器學習方法所通過的樣本數,分別記為t1、t2、t3,且滿足t1+t2+t3=n,根據式(5),計算每種模型的權重因子。

        (5)

        2 實驗結果及分析

        實驗使用了某區(qū)塊的3口油井(井1、井2、井3)的測井數據,3口油井的詳細數據如表2所示。其中,井1數據集樣例如表3所示。實驗選擇Python3.6.5平臺,以Python3.6.5中的Scikit-learn工具包為基礎,Scikit-learn是建立在NumPy、SciPy和Matplotlib模塊之上的一個開源機器學習模塊,提供了各種機器學習算法的接口,在調用具體機器學習方法時,只需要設置相應的參數即可建立需要的各種模型。

        2.1 巖性分類模型的確定

        巖性數據一般包含泥巖、泥質砂巖、砂巖等,實驗中使用的巖性數據分為兩種,分別是泥巖數據和砂巖數據。設置泥巖類型的標簽為數值0,砂巖類型的標簽為數值1,實驗的輸入測井屬性有隨鉆衰減電阻(A40H)、井徑(CAL)、中子(CNCF)、自然伽馬(GR)、隨鉆相移電阻(P40H)、聲波時差(DT)、密度(ZDEN),通過特征選擇,優(yōu)選了四種巖性響應特征明顯的測井屬性,即GR、CNCF、ZDEN、DT。將這四種測井屬性作為輸入,將泥砂數據的標簽值作為輸出,分別采用支持向量機、邏輯回歸、隨機森林和決策樹建立模型,其在測試集上的識別率如表4所示。

        表2 3口油井的數據描述

        表3 井1數據集樣例

        表4 識別率分析結果

        由表4可知,選擇支持向量機方法的分類識別率最高,此時,核函數選擇RBF核函數,懲罰系數設置為1 000,核函數參數設置為0.01。

        2.2 孔隙度預測模型的確定

        根據2.1節(jié)得到的巖性分類模型,將井3的測井數據分為泥巖數據和砂巖數據,分別對泥巖的測井數據進行訓練,建立泥巖的孔隙度預測模型;對砂巖的測井數據進行訓練,建立砂巖的孔隙度預測模型。

        2.2.1 泥巖的孔隙度預測模型的確定

        將井1、井2的真實泥巖數據中的GR、CNCF、ZDEN、DT作為輸入,孔隙度作為輸出。根據“主成分方法分析”法,分別采用SVM、RBF神經網絡、隨機森林、嶺回歸和K近鄰回歸方法建模,并對訓練數據集進行一次預測分析,由式(1)可得每種機器學習模型在訓練集上通過的樣本數,再由式(2)、式(3)計算每種機器學習模型在訓練集上的貢獻比例,如表5所示。由表5可知,SVM、RBF和K近鄰回歸三種方法貢獻的權重最大,且總和超過0.8。因此,選擇SVM、RBF和K近鄰回歸組成集成學習的個體學習器。

        表5 主成分方法分析法計算的每種模型所占的比重

        根據主成分權重平均法,對優(yōu)選出來的SVM、RBF、K近鄰回歸方法得到的個體學習器在訓練數據集上進行一次預測分析,由式(4)可得每個個體學習器在訓練集上通過的樣本數,再由式(5)計算每個個體學習器在訓練集上的貢獻比例,即為每個個體學習器的權重因子。結果如表6所示。

        確定泥巖的孔隙度預測模型后,利用該模型可以對預測井泥巖層的孔隙度進行預測。

        表6 主成分權重平均法計算的每種模型的權重

        2.2.2 砂巖的孔隙度預測模型的確定

        同樣可以確定砂巖孔隙度預測模型。根據主成分方法分析法,由式(1)可得每種機器學習模型在訓練集上通過的樣本數,再由式(2)、式(3)計算每種機器學習模型在訓練集上的貢獻比例。如表7所示。由表7可知,SVM和RBF兩種方法貢獻的權重最大,且總和超過0.8。因此,選擇SVM和RBF組成集成學習的個體學習器。

        表7 主成分方法分析法計算的每種模型所占的比重

        根據主成分權重平均法,對優(yōu)選出來的SVM、RBF方法得到的個體學習器在訓練數據集上進行一次預測分析,由式(4)可得每個個體學習器在訓練集上通過的樣本數,再由式(5)計算每個個體學習器在訓練集上的貢獻比例,即為每個個體學習器的權重因子。結果如表8所示。

        表8 主成分權重平均法計算的每種模型的權重

        確定砂巖的孔隙度預測模型后,利用該模型可以對預測井砂巖層的孔隙度進行預測。

        2.3 孔隙度預測與結果分析

        分別采用經典SVM、K近鄰回歸、RBF等學習器模型以及2.2節(jié)得到的PCA-SEN預測模型對預測井3的孔隙度進行了預測。結果如表9、圖4所示。其中,圖4(a)是真實孔隙度值,圖4 (b) ~圖4(e)分別是SVM、K近鄰回歸、RBF、PCA-SEN的預測孔隙度值。均方差(MSE)和相關系數(R)對比如表10所示。

        表9 井3數據集樣例與預測數據樣例

        圖4 井3孔隙度曲線對比

        表10 單一預測模型與PCA-SEN預測模型的均方差和相關系數分析結果

        由圖4、表10可知,與經典SVM、K近鄰回歸、RBF模型相比,PCA-SEN模型預測的孔隙度與真實孔隙度的均方差更小,且相關系數更大,說明論文提出的PCA-SEN預測模型的預測精度更高。

        同時,也將融合了巖性分類的PCA-SEN模型與未融合巖性分類的PCA-SEN模型進行了井3的孔隙度預測實驗,結果如表9、圖5所示。其中圖5 (a)為真實孔隙度值,圖5 (b)為未融合巖性分類的PCA-SEN模型的預測孔隙度值,圖5 (c)為融合巖性分類的PCA-SEN的預測孔隙度值。均方差(MSE)和相關系數(R)對比如表11所示。

        圖5 井3孔隙度曲線對比

        表11 融合巖性分類模型與未融合巖性分類的均方差和相關系數分析結果

        由圖5、表11可知,與未融合巖性分類的PCA-SEN模型相比,融合巖性分類的PCA-SEN模型預測的孔隙度與真實孔隙度的均方差更小,且相關系數更大,說明提出的PCA-SEN預測模型的預測精度更高。

        因此,提出的融合了巖性分類的選擇性集成預測模型與單一機器學習方法預測的孔隙度相比、與未融合巖性分類的選擇性集成預測模型相比,其均方差更小,且相關系數更大,即孔隙度預測的精度更高。同時,針對不同巖性,預測模型集成的個體學習器的類型與個數可能不同,有較好的適應性,模型的容錯能力強。

        3 結論

        在對經典機器學習模型深入研究的基礎上,分析了各個模型在應用中的優(yōu)勢與不足,針對儲層屬性預測問題,提出了一種融合巖性分類的、優(yōu)選集成的儲層孔隙度預測方法。該方法的優(yōu)點和創(chuàng)新點如下。

        (1)模型建立過程考慮巖性對孔隙度預測的影響,針對不同巖性,集成的個體模型個數和類型可以不同。

        (2)提出采用主成分方法分析法優(yōu)選個體學習器及主成分權重平均法計算權重。把優(yōu)選個體模型和有機組合結合在一起,建立了適應性更強的選擇性集成預測模型。

        通過實驗可知,選擇性集成預測模型具有更好的預測表現,這為利用機器學習方法進行儲層建模屬性參數的預測進行了有益的探索。

        猜你喜歡
        分類方法模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        分類討論求坐標
        數據分析中的分類討論
        教你一招:數的分類
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        无码人妻一区二区三区在线视频| 日本一区二区三区免费精品| 狂野欧美性猛xxxx乱大交| 亚洲日韩中文字幕一区| 亚洲精品亚洲人成在线下载| 在线免费午夜视频一区二区| 最新中文字幕人妻少妇| 性色做爰片在线观看ww| 中文字幕天堂在线| 一区二区三区岛国av毛片| 国产精品亚洲二区在线看| 日本入室强伦姧bd在线观看| 久久综合给日咪咪精品欧一区二区三 | 国产精品女同一区二区| 无码AV大香线蕉伊人久久| 可以直接在线看国产在线片网址 | av网站免费在线浏览| 免费人成激情视频在线观看冫 | 精品国产一二三产品区别在哪 | 人妻aⅴ中文字幕| 日韩AV无码免费二三区| 日韩一区二区三区天堂| 国产自拍视频在线观看网站| 无套内射无矿码免费看黄| 人妻精品丝袜一区二区无码AV| 国产亚洲精品综合在线网站| 伊人久久大香线蕉av色婷婷色| 国产乱妇乱子视频在播放| 久久亚洲精品成人综合| 女同三级伦理在线观看| a级毛片无码久久精品免费| 国产又色又爽又刺激视频| 亚洲国产天堂av成人在线播放| 免费观看成人欧美www色| 人人妻人人爽人人做夜欢视频九色| 2020最新国产激情| 国产一级二级三级在线观看av| 48沈阳熟女高潮嗷嗷叫| 高清国产美女一级a毛片在线| 丝袜美腿在线观看视频| 人妻中文字幕无码系列|