亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Boosting Tree算法的測井巖性識別模型

        2018-09-06 06:57:24江凱王守東胡永靜浦世照段航王政文
        測井技術(shù) 2018年4期
        關(guān)鍵詞:砂礫結(jié)點決策樹

        江凱,王守東,胡永靜,浦世照,段航,王政文

        (1.中國石油大學(xué)(北京)地球物理與信息工程學(xué)院,北京 102249;2.油氣資源與探測國家重點實驗室,北京 102249;3.海洋石油勘探國家工程實驗室,北京 102249;4.中國石油新疆油田公司勘探開發(fā)研究院,新疆 克拉瑪依 834000)

        0 引 言

        目前進行巖性識別最可靠直觀的方法是鉆井取心,但油田開發(fā)區(qū)取心井一般較少,且取心井段有限[1],而測井資料能提供全井段的高分辨率地下巖石物理響應(yīng)信息,已成為油氣藏研究的重要手段[2]。

        測井巖性解釋是通過分析地球物理測井資料,建立測井參數(shù)與巖石類型之間的映射關(guān)系模型,再借助手工或計算機對測井?dāng)?shù)據(jù)進行處理,最終達到識別巖性的目的[3]。目前利用測井?dāng)?shù)據(jù)進行巖性解釋的方法多種多樣,但總的可以歸納為基于測井曲線響應(yīng)特征的定性解釋方法[4]、基于測井響應(yīng)方程的定量解釋方法[3]、圖版法[5-8]和支持向量機(SVM)[8-11]、神經(jīng)網(wǎng)絡(luò)[11-12]、決策樹[13-14]等基于機器學(xué)習(xí)的智能化方法。其中定性解釋方法和圖版法的可靠性取決于解釋人員的實踐經(jīng)驗和剖面的復(fù)雜程度且需要人工方式進行處理,受人為因素影響大,解釋效率較低,另外圖版法只能利用部分測井資料,不能實現(xiàn)全部測井信息的有效利用;定量解釋方法通過建立測井響應(yīng)方程實現(xiàn)巖性識別,相比于定性方法可靠性更高,但其受限于地層礦物成分?jǐn)?shù)量,對復(fù)雜巖性儲層的適用性較差[3];基于機器學(xué)習(xí)的巖性解釋方法因具有數(shù)據(jù)處理高度自動化、巖性識別智能化的特點,已成為近年來的研究熱點。支持向量機的關(guān)鍵是核函數(shù)的選取、神經(jīng)網(wǎng)絡(luò)的難點在于網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計和參數(shù)設(shè)置,決策樹是一種符號學(xué)習(xí)方法,直觀易于理解,以上3種方法適用條件各異,方法原理和參數(shù)設(shè)置不同,都是基于單一學(xué)習(xí)器的方法,一次學(xué)習(xí)完成后,不能對錯誤樣本進行再學(xué)習(xí)。

        Friedman等[15]在2000年提出Boosting Tree算法,其構(gòu)建并結(jié)合多個決策樹學(xué)習(xí)器完成分類任務(wù)以提高分類精度[15-17],在互聯(lián)網(wǎng)知識推薦領(lǐng)域已得到廣泛的應(yīng)用。本文使用Boosting Tree算法建立巖性識別模型,并對準(zhǔn)噶爾盆地瑪北油田復(fù)雜砂礫巖儲層的巖性進行識別,取得了很好的應(yīng)用效果。同時本文將Boosting Tree算法與決策樹、支持向量機等傳統(tǒng)機器學(xué)習(xí)方法進行比較,結(jié)果證明基于Boosting Tree算法的巖性識別模型的性能優(yōu)于其他2種算法。

        1 Boosting Tree算法原理

        Boosting Tree算法將多個決策樹學(xué)習(xí)器進行組合,以獲得比單個決策樹學(xué)習(xí)器顯著優(yōu)越的泛化性能,其被認為是統(tǒng)計學(xué)習(xí)中性能最好的方法之一[18]。

        1.1 決策樹

        Boosting Tree算法的基學(xué)習(xí)器為決策樹。決策樹算法是一種具有樹狀結(jié)構(gòu)的符號學(xué)習(xí)方法,其由結(jié)點和有向邊組成,結(jié)點分為代表屬性測試的內(nèi)部結(jié)點和代表決策結(jié)果的葉結(jié)點[19]。從根結(jié)點開始(根結(jié)點包含全部樣本),對樣本集合的全部屬性依此進行測試,根據(jù)測試結(jié)果將樣本集合劃分到不同的子結(jié)點中,這時每個子結(jié)點中的樣本子集都對應(yīng)著該屬性的一個取值或取值范圍,若該子結(jié)點還可進行屬性測試,則其為內(nèi)部節(jié)點,否則為葉結(jié)點。如此遞歸對每個內(nèi)部節(jié)點中的子集進行屬性測試并劃分,直至到達葉結(jié)點,即可獲得最后的分類結(jié)果(見圖1)。在巖性識別問題中,每個測井方法獲得的數(shù)據(jù)即為一個屬性值,某一深度對應(yīng)的巖性即可認為是一個葉結(jié)點。

        圖1 決策樹模型

        樣本屬性測試的規(guī)則是決策樹算法的關(guān)鍵。CART算法是目前應(yīng)用廣泛的決策樹方法,其使用基尼指數(shù)來選擇劃分屬性。假設(shè)樣本集合D中共有K類樣本,第k類樣本所占比例為pk,即樣本點屬于第k類的概率為pk,1-pk即為樣本點不屬于第k類的概率,則樣本集D的基尼指數(shù)為

        k=1,2,3,…,K

        (1)

        在對某一屬性進行測試時,需要計算這一屬性的基尼指數(shù)。屬性a的基尼指數(shù)為

        (2)

        式中,N表示人為的按屬性值的大小或個數(shù)對內(nèi)部結(jié)點中子集進行分塊的數(shù)量(例如可將樣本子集按大于或小于某一數(shù)值進行分塊,此時N=2);|D|和|Dn|分別表示樣本總數(shù)和第n個樣本分塊中的樣本數(shù);Gini(Dn)表示第n個樣本分塊的基尼指數(shù)。

        從根結(jié)點開始,在每個內(nèi)部節(jié)點上都分別計算每個屬性的基尼指數(shù),將基尼指數(shù)小的屬性作為最優(yōu)劃分屬性,可向下延伸出N個分支,如此遞歸直至到達葉結(jié)點結(jié)束。

        1.2 Boosting Tree算法

        Boosting Tree算法的基本思想是通過改變訓(xùn)練樣本分布,學(xué)習(xí)多個決策樹學(xué)習(xí)器(基學(xué)習(xí)器),并將這些學(xué)習(xí)器進行線性組合,以提高分類性能[15-17,20]。每次改變訓(xùn)練樣本分布時,使被前一個學(xué)習(xí)器錯誤分類的樣本權(quán)重提高,被正確分類的樣本權(quán)重降低,這樣被分類錯誤樣本在下一個學(xué)習(xí)器將受到更大關(guān)注。將所有基學(xué)習(xí)器進行線性組合時,給予誤差率小的基學(xué)習(xí)器更大的權(quán)值,誤差率大的基學(xué)習(xí)器更小的權(quán)值,以此規(guī)則組合后即獲得最終的分類器。

        假設(shè)給定一個二分類的訓(xùn)練樣本集D={(x1,y1),…,(xi,yi),…,(xm,ym)},yi∈{-1,+1),xi∈Rn,其中m為樣本集大小,n為數(shù)據(jù)維數(shù),即樣本的屬性個數(shù)。若訓(xùn)練T個弱學(xué)習(xí)器,用Dt表示第t次改變樣本分布后的樣本集,用Wt=(wt,1,…,wt,i,…,wt,m)表示第t次改變樣本分布時所使用的樣本權(quán)重,則初始時樣本權(quán)重為w1,i=1/m;用ht(x)表示第t個弱學(xué)習(xí)器決策樹模型,則Boosting Tree可表示為

        (3)

        在Boosting Tree算法中,第1個基學(xué)習(xí)器h1(x)是直接由初始樣本分布訓(xùn)練而得,此后迭代地生成ht(x)和at。在基于樣本集Dt訓(xùn)練下一個基學(xué)習(xí)器時,新的基學(xué)習(xí)器ht(x)和權(quán)重at應(yīng)使得Ht(x)最小化指數(shù)損失函數(shù)

        (4)

        其中,f(x)表示對所有樣本都分類正確的學(xué)習(xí)器;wt,i=exp(-f(xi)Ht-1(xi))可以被看作常數(shù),如果將被ht(x)正確分類的樣本的集合記作Ct,將錯誤分類的樣本的集合記作Et,那么誤差函數(shù)寫成式(5)形式

        (5)

        其中,指示函數(shù)I(f(xi)≠ht(xi))定義為

        (6)

        對式(5)關(guān)于at求導(dǎo)并置零得

        (7)

        其中,et表示ht(x)在樣本集Dt上的分類錯誤率,其定義為

        (8)

        式(7)為基于樣本集Dt訓(xùn)練得到的基學(xué)習(xí)器ht(x)的權(quán)重at的更新公式。根據(jù)式(4),令

        wt+1,i=wt,iexp(-f(xi)atht(xi))

        (9)

        得到該權(quán)重更新公式(9)。

        由式(7)可以看到,當(dāng)ht(x)在樣本集Dt上的分類錯誤率et越小,則at越大,即表明對全部基學(xué)習(xí)器進行線性組合時,分類錯誤率小的基學(xué)習(xí)器會有更大的權(quán)值;而由式(9)可知,當(dāng)分類錯誤率et<0.5,則at>0,此時若樣本(xi,yi)分類錯誤,即f(xi)≠ht(xi),則wt+1,i=wt,ieat>wt,i,這表明被ht(x)分類錯誤的樣本將在訓(xùn)練下一個基學(xué)習(xí)器ht+1(x)時賦予更大的權(quán)值。

        2 巖性識別模型設(shè)計

        2.1 樣本構(gòu)建

        使用機器學(xué)習(xí)方法所構(gòu)建的巖性識別模型都需要多維數(shù)據(jù)作為樣本進行訓(xùn)練,Boosting Tree算法作為一種有監(jiān)督的機器學(xué)習(xí)方法還需要給樣本加上準(zhǔn)確可靠的標(biāo)簽。所以樣本構(gòu)建的關(guān)鍵是測井屬性的優(yōu)選和巖性標(biāo)簽的合理選擇。

        在使用Boosting Tree算法進行巖性識別時,所輸入的測井屬性組合直接影響預(yù)測精度,因此需要進行測井屬性優(yōu)選。根據(jù)不同測井屬性對地下巖性的敏感度,選取準(zhǔn)噶爾盆地瑪北油田目的層的自然伽馬、自然電位、井徑、沖洗帶電阻率、侵入帶電阻率、原狀地層電阻率、密度、補償中子、聲波時差等9個測井參數(shù)采用交叉驗證法進行試驗,發(fā)現(xiàn)井徑對巖性識別精度提高的貢獻率很低,為了提高巖性識別模型的計算性能,故舍棄該測井參數(shù)選取剩下8個測井參數(shù)作為樣本屬性值。

        根據(jù)錄井資料,準(zhǔn)噶爾盆地瑪北油田目的層的巖石類型主要為泥巖、砂質(zhì)泥巖、含礫泥巖、泥質(zhì)粉砂巖、褐色砂礫巖、灰色砂礫巖和含礫粗砂巖7種巖性,其中后2類為儲集層。在實際測井解釋中,往往更加關(guān)注儲層巖性的精細化分,故本文將泥巖、砂質(zhì)泥巖、含礫泥巖、泥質(zhì)粉砂巖統(tǒng)一歸為泥巖一類,同時為了方便編程處理,用數(shù)字標(biāo)簽1表示泥巖,用數(shù)字標(biāo)簽2表示含礫粗砂巖,用數(shù)字標(biāo)簽3表示灰色砂礫巖,用數(shù)字標(biāo)簽4表示褐色砂礫巖。根據(jù)錄井資料,在每個深度的測井?dāng)?shù)據(jù)后面加上巖性數(shù)字標(biāo)簽,即得到標(biāo)記后的測井?dāng)?shù)據(jù)樣本集。

        2.2 數(shù)據(jù)預(yù)處理

        不同的測井方法測得的數(shù)據(jù)擁有不同的量綱和屬性值數(shù)量級,如果直接將測井?dāng)?shù)據(jù)作為輸入訓(xùn)練巖性識別模型,那么他們對結(jié)果的影響程度是不一樣的。為了消除這種系統(tǒng)性誤差,就需要對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理(見圖2)。

        (1) 數(shù)據(jù)的中心化。得到均值為0,標(biāo)準(zhǔn)差為1的數(shù)據(jù)集,計算過程為

        (10)

        式中,x為樣本數(shù)據(jù);μ為樣本數(shù)據(jù)均值;σ為樣本數(shù)據(jù)標(biāo)準(zhǔn)差。

        (2) 數(shù)據(jù)的歸一化。將測井?dāng)?shù)據(jù)樣本集的所有屬性值化到(-1,1)之間。

        圖2 數(shù)據(jù)標(biāo)準(zhǔn)化前后變化示意圖

        2.3 模型參數(shù)和模型評價指標(biāo)

        使用交叉驗證法對模型參數(shù)進行尋優(yōu)。k折交叉驗證就是將樣本數(shù)據(jù)集分為大小相同的k份,其中k-1份作為訓(xùn)練集進行模型訓(xùn)練,剩下的1份作為驗證集檢驗?zāi)P驮谟?xùn)練集上的分類性能。該過程重復(fù)k次,使得每份數(shù)據(jù)恰好用于驗證集一次,模型在訓(xùn)練集上的總誤差是這k次驗證集誤差的平均。

        基于Boosting Tree算法的巖性識別模型的參數(shù)包括基學(xué)習(xí)器決策樹模型最大深度Depth和基學(xué)習(xí)器個數(shù)N。Depth代表決策樹模型結(jié)點的最大延伸長度,其值過大,就會對數(shù)據(jù)過擬合,其值過小則會欠擬合,這2種情況都會降低模型的泛化能力。使用交叉驗證法對Depth的值進行尋優(yōu),確定Depth的值取6;基學(xué)習(xí)器個數(shù)N的值過大不僅會出現(xiàn)過擬合現(xiàn)象降低模型泛化性能,程序的計算時間也會迅速增加(見圖3)。圖4是采用交叉驗證法得到的模型誤差與基學(xué)習(xí)器個數(shù)N之間的變化關(guān)系圖,由圖可知當(dāng)N超過200時,模型誤差不再有明顯降低,故確定基學(xué)習(xí)器個數(shù)N為200。

        圖3 程序運行時間隨基學(xué)習(xí)器個數(shù)變化關(guān)系圖

        圖4 模型誤差隨基學(xué)習(xí)器個數(shù)變化關(guān)系圖

        當(dāng)使用已經(jīng)訓(xùn)練好的巖性識別模型對新井進行巖性解釋時,需要評價模型的識別效果。已有文獻[8,10-11]大多使用正確率作為模型的性能度量,認為巖性識別正確的樣本數(shù)占樣本總數(shù)的比例越高則模型識別效果越好。在實際測井巖性解釋時,往往希望在保證正確率的情況下,盡可能全面的將儲層巖性識別出來,故本文同時使用正確率和查全率作為巖性識別模型的評價指標(biāo),查全率表示屬于某一類別的樣本被正確識別的比例,儲層巖性的查全率越高則認為模型識別效果越好。

        3 應(yīng)用實例

        3.1 區(qū)域概況

        瑪北油田位于準(zhǔn)噶爾盆地西北緣斷階帶下盤,屬瑪湖凹陷北斜坡帶,構(gòu)造格局表現(xiàn)為東南傾的平緩單斜,局部發(fā)育低幅度平臺、背斜或鼻狀構(gòu)造,斷裂較少[21]。其目的層三疊系百口泉組是一套扇三角洲碎屑沉積,主要巖性為粉砂質(zhì)泥巖、含礫泥巖、泥質(zhì)粉砂巖、褐色砂礫巖、灰色砂礫巖和含礫粗砂巖。研究區(qū)目的層段具有巖石類型多,巖性內(nèi)部結(jié)構(gòu)復(fù)雜,儲集層低孔隙度低滲透率,非勻質(zhì)性強的特點,給巖性解釋帶來較大挑戰(zhàn)[21-23]。

        3.2 應(yīng)用效果

        本文共使用研究區(qū)6口井對應(yīng)目的層段的4 850個測井?dāng)?shù)據(jù),每個測井?dāng)?shù)據(jù)的采樣深度間隔為0.125 m。將1~5號井的4 106個測井?dāng)?shù)據(jù)作為訓(xùn)練集用于訓(xùn)練巖性識別模型,訓(xùn)練集中泥巖、含礫粗砂巖、灰色砂礫巖、褐色砂礫巖的樣本比例分別為32.7%、5.9%、38.4%、23.0%(見表1)。將巖性齊全的6號井的744個測井?dāng)?shù)據(jù)作為測試集以驗證Boosting Tree算法的巖性識別效果,同時將其結(jié)果與使用決策樹、支持向量機算法的巖性識別結(jié)果進行比較,結(jié)果見表2和表3。

        表1 訓(xùn)練樣本集巖性類別分布表

        通過與錄井分析得到的準(zhǔn)確可靠巖性解釋結(jié)果進行比較,使用Boosting Tree算法對準(zhǔn)噶爾盆地瑪北油田6號井目的層段巖性識別的正確率達到89.1%,高于決策樹算法的84.7%和支持向量機算法的86.8%。研究區(qū)目的層的儲集層段巖性為灰色砂礫巖和含礫粗砂巖,其中Boosting Tree算法對灰色砂礫巖的查全率達到88.0%,遠高于決策樹算法的73.7%和支持向量機算法的78.5%。而對于含礫粗砂巖,3種算法均沒有對其做出有效識別,這是因為瑪北油田目的層含礫粗砂巖段為薄層,可用的樣本數(shù)很少,僅占訓(xùn)練集樣本總數(shù)的5.9%,這就造成樣本類別的不均衡,使占比較高的巖性類別淹沒掉巖性占比較低的巖性類別信息。綜合來看,Boosting Tree算法相比于其他2種算法對儲集層巖性的識別效果更好。對于非儲集層中的泥巖,3種巖性識別算法的查全率均大于90%,其中Boosting Tree算法對泥巖的識別效果優(yōu)于決策樹和支持向量機,其查全率達到96.9%.而對于褐色砂礫巖,Boosting Tree算法的查全率為84.3%,略低于決策樹和支持向量機的91.2%。圖5為準(zhǔn)噶爾盆地瑪北油田百口泉組6號井巖性識別結(jié)果對比圖,從圖5中可以直觀地看出基于Boosting Tree算法的巖性識別模型在瑪北油田復(fù)雜砂礫巖儲層的巖性識別中取得了較好的應(yīng)用效果,且應(yīng)用效果優(yōu)于決策樹算法和支持向量機算法。表3為與決策樹算法、支持向量機算法的性能比較,雖然Boosting Tree算法在訓(xùn)練集和測試集上的巖性識別正確率都高于其他2種算法,但由于其是多個基學(xué)習(xí)器的組合,程序運行時間相對于其他兩種算法更長,在程序運行時間很短的情況下,巖性識別模型時間成本的增加并不會對巖性解釋過程產(chǎn)生太大影響。

        表2 瑪北油田6號井不同算法巖性預(yù)測結(jié)果比較

        表3 不同算法性能比較

        圖5 準(zhǔn)噶爾盆地瑪北油田百口泉組6號井巖性識別結(jié)果對比*非法定計量單位,1 ft=12 in=0.304 8 m

        4 結(jié) 論

        (1) 提出了一種基于Boosting Tree算法的巖性識別模型,并在準(zhǔn)噶爾盆地瑪北油田對復(fù)雜砂礫巖儲層進行巖性識別試驗,取得了很好的效果,這說明使用Boosting Tree算法識別復(fù)雜砂礫巖儲層巖性是一種有效的手段,也為地球物理測井解釋提供了新思路。

        (2) 測井屬性優(yōu)選、數(shù)據(jù)預(yù)處理和模型參數(shù)選擇對基于Boosting Tree算法的巖性識別模型的應(yīng)用效果有直接影響,需要根據(jù)專業(yè)知識優(yōu)選出合適的測井屬性,對測井?dāng)?shù)據(jù)進行預(yù)處理和使用交叉驗證法確定最優(yōu)的模型參數(shù)。

        (3) 使用Boosting Tree算法進行巖性識別能夠?qū)崿F(xiàn)數(shù)據(jù)處理的高度自動化、巖性識別的智能化,其識別效果主要依賴于模型參數(shù)的選擇,而降低了對解釋人員實踐經(jīng)驗和專業(yè)知識的要求。

        (4) 基于Boosting Tree算法的巖性識別模型對復(fù)雜砂礫巖儲層的應(yīng)用效果比傳統(tǒng)機器學(xué)習(xí)方法決策樹、支持向量機更好,但由于其是多個基學(xué)習(xí)器的線性組合,運行程序的時間成本更高。

        猜你喜歡
        砂礫結(jié)點決策樹
        一種基于膠結(jié)因子譜的砂礫巖膠結(jié)程度的判定方法
        海洋石油(2021年3期)2021-11-05 07:42:42
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點個數(shù)估計
        高混凝土面板砂礫石(堆石)壩技術(shù)創(chuàng)新
        基于決策樹的出租車乘客出行目的識別
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        淺談天然砂礫石路基施工質(zhì)量控制
        砂礫樁處理沼澤段軟土地基技術(shù)應(yīng)用
        基于Raspberry PI為結(jié)點的天氣云測量網(wǎng)絡(luò)實現(xiàn)
        最新国产午夜福利| 女人被男人爽到呻吟的视频| 久久精品黄aa片一区二区三区| 无码中文字幕加勒比一本二本| 国产亚洲AV片a区二区| av免费资源在线观看| 无码国产精品久久一区免费| 特级毛片a级毛片免费播放| 欧美zozo另类人禽交| 蕾丝女同一区二区三区| 精品国产乱码久久久久久郑州公司| 丰满岳乱妇久久久| 欧美洲精品亚洲精品中文字幕 | 少妇高潮精品在线观看| 国产在线精品一区二区三区直播| 久久国产36精品色熟妇| 日本一区二区三本视频在线观看| 婚外情长久的相处之道| 日日噜噜夜夜狠狠va视频| 日韩爱爱网站| 一本色道亚州综合久久精品| 亚洲av天堂免费在线观看| 国产熟人av一二三区| 久久精品国产亚洲av大全相关| 少妇被猛烈进入中文字幕| 亚洲精品蜜夜内射| 欧美视频二区欧美影视| 三级黄色片一区二区三区| 久久久精品视频网站在线观看| 久久综合精品国产一区二区三区无码| 久久免费精品国产72精品剧情| 日韩不卡一区二区三区色图| 午夜裸体性播放| 国产人妻大战黑人20p| 色av综合av综合无码网站| 青青草久热手机在线视频观看| 91精品国产综合久久熟女| 欧美野外疯狂做受xxxx高潮| 欧洲国产成人精品91铁牛tv| 人妖国产视频一区二区| 少妇高潮喷水久久久影院|