亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林的溢漏實(shí)時(shí)判斷方法研究

        2020-07-21 01:56:50史肖燕周英操趙莉萍蔣宏偉
        鉆采工藝 2020年1期
        關(guān)鍵詞:特征

        史肖燕, 周英操, 趙莉萍, 蔣宏偉

        (中國石油集團(tuán)工程技術(shù)研究院有限公司)

        井漏和溢流是影響鉆井施工安全最為常見的兩種井下復(fù)雜事故。井漏和溢流不僅會(huì)帶來嚴(yán)重的儲(chǔ)層損害,增加勘探開發(fā)投入成本,造成油氣開發(fā)效率低下,一旦控制不力,還會(huì)誘發(fā)卡鉆、井塌、井噴等重大惡性事故,造成損失及負(fù)面社會(huì)影響。因此,鉆井過程中溢流、漏失的實(shí)時(shí)識(shí)別判斷具有重要意義。

        目前,國內(nèi)外在溢流、漏失監(jiān)測方面展開了較多研究,形成的技術(shù)主要有:井口監(jiān)測技術(shù)、井下隨鉆監(jiān)測技術(shù)和人工智能監(jiān)測技術(shù)。井口監(jiān)測技術(shù)成熟,能比較準(zhǔn)確地監(jiān)測出溢流和漏失,但這種方法的監(jiān)測結(jié)果存在滯后性,不能很好地解決高壓氣井、深水鉆井等特殊環(huán)境下的井下溢流、漏失監(jiān)測問題。井下隨鉆監(jiān)測方法能夠快速、早期監(jiān)測到溢流和漏失,但成本較高,并且隨鉆測量儀器存在失效的風(fēng)險(xiǎn)。隨著信息技術(shù)和人工智能技術(shù)快速發(fā)展,國內(nèi)外研究人員把人工智能技術(shù)應(yīng)用到溢流、漏失的監(jiān)測中,監(jiān)測結(jié)果更為準(zhǔn)確,但這些人工智能的方法普遍存在著建模較為復(fù)雜,推廣較難的問題。

        近年來,以數(shù)據(jù)為驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法在社會(huì)各領(lǐng)域得到了廣泛的應(yīng)用,其中最重要的算法之一隨機(jī)森林具有建模較為簡單、調(diào)節(jié)參數(shù)少、預(yù)測準(zhǔn)確率高和強(qiáng)魯棒性的特點(diǎn)。本文采用隨機(jī)森林的方法對鉆井實(shí)時(shí)測量數(shù)據(jù)進(jìn)行建模,來對溢流、漏失進(jìn)行實(shí)時(shí)識(shí)別判斷。

        一、隨機(jī)森林方法

        隨機(jī)森林由Breiman L在2001年提出,是一個(gè)可處理高維度與非線性樣本的分類器組合模型。大量的理論和實(shí)證研究都證明了隨機(jī)森林具有很高的預(yù)測準(zhǔn)確率,對異常值和噪聲具有很好的容忍度,并且不容易出現(xiàn)過擬合。因此,自其被提出以來,在醫(yī)學(xué)、生物信息、管理學(xué)等領(lǐng)域得到了廣泛應(yīng)用。隨機(jī)森林分類的基本思想[1-2]:首先,利用自助法(Bootstrap)抽樣技術(shù)從原始訓(xùn)練集抽取k個(gè)樣本集;然后,對k個(gè)樣本集分別建立k個(gè)決策樹模型,得到k種分類結(jié)果;最后,對每個(gè)新記錄根據(jù)k種分類結(jié)果進(jìn)行投票表決決定其最終分類。

        二、基于隨機(jī)森林的溢漏實(shí)時(shí)判斷方法

        在鉆井過程中,當(dāng)有溢流、漏失發(fā)生時(shí),在鉆井測量參數(shù)上會(huì)有所體現(xiàn);例如溢流發(fā)生時(shí),進(jìn)出口流量之差會(huì)增加,立壓降低,大鉤負(fù)載緩增;漏失發(fā)生時(shí),進(jìn)出口流量之差減少,立管壓力降低,井底環(huán)壓降低;由此可見,鉆井測量參數(shù)與溢流、漏失存在著相關(guān)關(guān)系??砂岩缌鳌⒙┦У淖R(shí)別問題建模成以鉆井測量參數(shù)為自變量,是否發(fā)生溢流、漏失為結(jié)果變量的分類模型。本文選用隨機(jī)森林方法對溢流、漏失的實(shí)時(shí)識(shí)別進(jìn)行分類建模,通過大量歷史數(shù)據(jù)對隨機(jī)森林進(jìn)行訓(xùn)練,并對新的實(shí)時(shí)輸入數(shù)據(jù)作出是否發(fā)生溢流、漏失的分類。

        基于隨機(jī)森林的溢流、漏失實(shí)時(shí)判斷方法的流程如圖1所示。

        圖1 基于隨機(jī)森林的溢流、漏失實(shí)時(shí)判斷方法的流程圖

        1. 生成原始數(shù)據(jù)集

        隨機(jī)森林是有監(jiān)督的機(jī)器學(xué)習(xí)算法,用于訓(xùn)練算法的樣本數(shù)據(jù)需要有輸入變量和結(jié)果變量。在本文的模型中,輸入變量即以時(shí)間為索引的鉆井測量參數(shù),結(jié)果變量為是否發(fā)生溢流或漏失。因?yàn)橐缌?、漏失的信息一般以文本的方式記錄在井史?shù)據(jù)中,因此需要對文本數(shù)據(jù)進(jìn)行自動(dòng)識(shí)別,并根據(jù)文本中溢流、漏失事故的發(fā)生和持續(xù)時(shí)間,生成以時(shí)間為索引的溢流、漏失數(shù)據(jù);合并以時(shí)間為索引的鉆井測量參數(shù)和溢流、漏失數(shù)據(jù),即可生成用于隨機(jī)森林算法的原始數(shù)據(jù)集。生成的原始數(shù)據(jù)集是以時(shí)間為索引的多維特征數(shù)據(jù)和分類結(jié)果,特征包括:入口流量、出口流量、PWD環(huán)空壓力、PWD環(huán)空溫度、大鉤載荷、井深、鉆頭深度、總池體積、立管壓力、轉(zhuǎn)速、鉆壓、鉆井液出口密度和鉆井液出口溫度;數(shù)據(jù)的分類結(jié)果為離散值:0代表無事故發(fā)生,1代表有溢流發(fā)生,2代表有漏失發(fā)生。

        2. 數(shù)據(jù)預(yù)處理

        本文的原始數(shù)據(jù)集是以時(shí)間先后為順序排列的數(shù)據(jù)集,很難直接用于溢流、漏失實(shí)時(shí)識(shí)別的建模,為了讓數(shù)據(jù)適合于隨機(jī)森林的建模,需要對數(shù)據(jù)進(jìn)行預(yù)處理。

        首先,溢流、漏失的發(fā)生導(dǎo)致原始數(shù)據(jù)集中各特征數(shù)據(jù)發(fā)生變化,因此各特征數(shù)據(jù)的相對變化量能更好的應(yīng)用于隨機(jī)森林中決策樹的創(chuàng)建,而且使用特征數(shù)據(jù)的相對變化量,可綜合多口井的數(shù)據(jù),形成更大數(shù)據(jù)量的歷史數(shù)據(jù)集。對于某一特征數(shù)據(jù),相對變化量的計(jì)算公式為:

        (1)

        式中:A(Ti)—特征數(shù)據(jù)列A在Ti時(shí)間點(diǎn)的值;A(Ti-1)—特征數(shù)據(jù)列A在Ti-1時(shí)間點(diǎn)的值。

        其次,在不同的工況下,當(dāng)溢流和漏失發(fā)生時(shí),各特征數(shù)據(jù)的變化情況不同,因此根據(jù)原始數(shù)據(jù)集中的數(shù)據(jù),對工況進(jìn)行自動(dòng)識(shí)別,有助于下一步?jīng)Q策樹的生成。本文自動(dòng)識(shí)別的工況包括:鉆進(jìn)、起鉆、下鉆和其它(包括接單跟,卸單根和鉆井液循環(huán)等)。鉆井工況計(jì)算方法為:

        在時(shí)間Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)> HDEP(Ti-1),則鉆井狀態(tài)DS(Ti)為鉆進(jìn)。

        在時(shí)間Ti,若HDEP(Ti)>BDEP(Ti),BDEP(Ti)>BDEP(Ti-1),則鉆井狀態(tài)DS(Ti)為下鉆。

        在時(shí)間Ti,若HDEP(Ti)>BDEP(Ti),BDEP(Ti)

        否則, 鉆井狀態(tài)為其它。

        其中,HDEP(Ti)為Ti時(shí)刻的井深,HDEP(Ti-1)為Ti-1時(shí)刻的井深,BDEP(Ti)為Ti時(shí)刻的鉆頭深度,BDEP(Ti-1)為Ti-1時(shí)刻的鉆頭深度。

        再次,把相關(guān)特征數(shù)據(jù)進(jìn)行簡單的計(jì)算,能與溢流、漏失的發(fā)生建立更直接的關(guān)系,例如出口流量和入口流量之差,可更直接反應(yīng)是否有溢流、漏失發(fā)生。因此把出入口流量差加入到輸入特征集中。

        3. 生成子數(shù)據(jù)集

        對于預(yù)處理之后的溢流、漏失數(shù)據(jù)集,隨機(jī)森林采用Bootstrap重采樣方法,生成k個(gè)用于決策樹生成的樣本集,k由所需建立的決策樹的數(shù)量確定。隨機(jī)森林中決策樹的數(shù)量對預(yù)測結(jié)果有重要影響,本文將在現(xiàn)場實(shí)例中進(jìn)行討論。Bootstrap方法的基本思想為[3]:從容量為N的原始樣本集中進(jìn)行有放回的重復(fù)采樣,采樣樣本的容量也為N,每個(gè)觀測對象被抽到的概率為1/N,每次采樣構(gòu)成的子樣本集稱為Bootstrap樣本集。

        4. 用CART樹進(jìn)行分類

        對于上述步驟生成的每一個(gè)樣本集,隨機(jī)森林采用CART決策樹來對訓(xùn)練數(shù)據(jù)進(jìn)行分類。CART算法采用一種二分遞歸分割的技術(shù),總是將當(dāng)前樣本集分割為兩個(gè)子樣本集,使得生成的決策樹的每個(gè)非葉節(jié)點(diǎn)都只有兩個(gè)分支,因此CART算法生成的決策樹是結(jié)構(gòu)簡潔的二叉樹,可用于分類和回歸任務(wù)。在創(chuàng)建分類樹遞歸過程中,CART每次都選擇當(dāng)前數(shù)據(jù)集中具有最小gini信息增益的特征作為節(jié)點(diǎn)劃分決策樹。gini指數(shù)是一種不等性度量,可用來度量任何不均勻分布,是介于0~1之間的數(shù),0代表完全相等,1代表完全不想等。分類度量時(shí),總體內(nèi)包含的類別越雜亂,gini指數(shù)就越大。gini指數(shù)的計(jì)算公式為:

        (2)

        式中:pj—類別j在樣本T中出現(xiàn)的頻率;

        nj—樣本T中類別j的個(gè)數(shù)。

        在每個(gè)節(jié)點(diǎn)分裂時(shí),計(jì)算不同特征和不同閾值相對應(yīng)的gini信息增益,選擇最小的gini指數(shù)對應(yīng)的特征和閾值,對特征空間進(jìn)行二元分裂。對節(jié)點(diǎn)進(jìn)行二元分裂時(shí),gini信息增益的計(jì)算公式為:

        (3)

        式中:s1—T1中樣本的個(gè)數(shù);s2—T2中樣本的個(gè)數(shù)。

        不同于傳統(tǒng)的CART樹,隨機(jī)森林在CART樹的創(chuàng)建過程中,采用了隨機(jī)特征的選擇,即在每一個(gè)結(jié)點(diǎn)隨機(jī)選擇一小組輸入變量(m個(gè)特征,m<總待選特征個(gè)數(shù))進(jìn)行分割,如圖2所示。

        圖2 決策樹創(chuàng)建過程中的特征選擇

        5. 溢流、漏失識(shí)別

        對于新的輸入樣本,隨機(jī)森林根據(jù)CART算法所生成的k棵決策樹的投票結(jié)果,判斷是否有溢流、漏失發(fā)生。

        三、現(xiàn)場實(shí)例

        1. 實(shí)驗(yàn)數(shù)據(jù)

        本文以塔里木油田的某復(fù)雜井為例,用基于隨機(jī)森林的智能方法對溢流、漏失進(jìn)行實(shí)時(shí)識(shí)別。用于隨機(jī)森林算法訓(xùn)練的歷史數(shù)據(jù)從該井的鄰井?dāng)?shù)據(jù)中獲取,訓(xùn)練數(shù)據(jù)集包括正常鉆井樣本,溢流樣本和漏失樣本。

        2. 溢流識(shí)別

        對該井的鉆井測量參數(shù)進(jìn)行實(shí)時(shí)監(jiān)測的開始時(shí)間為2018年2月11日21∶08,如圖3所示。從21∶09開始,該井停止鉆進(jìn),并打開泵進(jìn)行循環(huán)。由圖3可見從21∶09開始,出口流量大于入口流量;總池體積從21∶19分開始明顯增加,到21∶25達(dá)到峰值,為147.9 m3,增量為0.9 m3,可判斷有溢流發(fā)生。

        圖3 鉆井實(shí)時(shí)測量參數(shù)

        圖4為用隨機(jī)森林的方法對溢流進(jìn)行實(shí)時(shí)識(shí)別的結(jié)果,0代表正常工況,1代表溢流工況,2代表漏失工況。由圖4可見,系統(tǒng)自動(dòng)在溢流發(fā)生初期(21∶09)即對溢流進(jìn)行了自動(dòng)識(shí)別,這比用傳統(tǒng)的總池體積增加法來判斷溢流提早了16 min,實(shí)現(xiàn)了溢流監(jiān)測的及時(shí)性;在21∶24,出口流量等于入口流量,溢流結(jié)束,系統(tǒng)亦進(jìn)行了自動(dòng)識(shí)別,識(shí)別的結(jié)果為正常工況。

        圖4 基于隨機(jī)森林的溢流實(shí)時(shí)識(shí)別

        3. 漏失識(shí)別

        從2018年2月16日00∶16開始,對該井的鉆井測量參數(shù)進(jìn)行實(shí)時(shí)監(jiān)測,如圖5所示。從00∶16開始,該井邊鉆邊漏,出口流量小于入口流量。從00∶35開始,總池體積明顯減少,到00∶39,總池體積從原來的129.3 m3降低到128.1 m3,減少了1.2 m3,可判斷漏失發(fā)生。

        圖6為用隨機(jī)森林的方法對漏失進(jìn)行實(shí)時(shí)識(shí)別的結(jié)果。由圖6可見,系統(tǒng)自動(dòng)在溢流發(fā)生初期(00∶16)即對漏失進(jìn)行了自動(dòng)識(shí)別,這比用傳統(tǒng)的總池體積減少法來判斷漏失提早了23 min,實(shí)現(xiàn)了漏失監(jiān)測的及時(shí)性。

        圖5 鉆井實(shí)時(shí)測量參數(shù)

        圖6 基于隨機(jī)森林的漏失實(shí)時(shí)識(shí)別

        4. 建模參數(shù)的選擇

        用隨機(jī)森林的方法建模時(shí),一個(gè)重要參數(shù)為決策樹的數(shù)量,此參數(shù)的選擇對于隨機(jī)森林的預(yù)測準(zhǔn)確性有重要影響。因此本文對此參數(shù)的選擇進(jìn)行討論。

        圖7~圖10展示了用不同的決策樹數(shù)量,對發(fā)生在2月11日20∶17開始的溢流進(jìn)行識(shí)別的結(jié)果。由圖7可見,當(dāng)決策樹數(shù)量為10時(shí),溢流的識(shí)別結(jié)果里有較多的錯(cuò)誤,隨著決策樹數(shù)量的增加,溢流識(shí)別結(jié)果越來越準(zhǔn)確,到?jīng)Q策樹數(shù)量為100時(shí),識(shí)別結(jié)果趨于穩(wěn)定。因此選用100為決策樹數(shù)量可得到較為準(zhǔn)確的預(yù)測結(jié)果。

        圖7 決策樹數(shù)量為10時(shí)的溢流識(shí)別圖

        圖8 決策樹數(shù)量為20時(shí)的溢流識(shí)別圖

        5. 變量的重要性分析

        本文還用隨機(jī)森林的方法對用于溢流漏失識(shí)別的14個(gè)輸入特征的重要性進(jìn)行分析,其中,流入流出差對于溢流漏失識(shí)別的重要性最高,這符合當(dāng)前主要的溢流、漏失識(shí)別的判斷依據(jù);重要程度接近于0的鉆壓變化量、轉(zhuǎn)速變化量、泵沖變化量和出口溫度變化量可從用于隨機(jī)森林建模的輸入特征中剔除,以提高計(jì)算速度。

        圖9 決策樹數(shù)量為50時(shí)的溢流識(shí)別圖

        圖10 決策樹數(shù)量為100時(shí)的溢流識(shí)別圖

        四、結(jié)論

        (1)隨機(jī)森林作為新興起的集成學(xué)習(xí)算法,具有預(yù)測準(zhǔn)確度高、對噪聲的容忍度大,計(jì)算速度快等優(yōu)點(diǎn),這些優(yōu)點(diǎn)使其適用于溢流、漏失的實(shí)時(shí)識(shí)別判斷。

        (2)現(xiàn)場實(shí)例顯示,通過對鉆井實(shí)時(shí)測量數(shù)據(jù)的合理預(yù)處理,結(jié)合隨機(jī)森林的方法,溢流、漏失可在早期被準(zhǔn)確識(shí)別。

        (3)由于隨機(jī)森林可以處理大量的特征數(shù)據(jù)(輸入數(shù)據(jù)),并可在決定類別時(shí),評(píng)估特征的重要性;本文利用隨機(jī)森林對初選的特征進(jìn)行重要性分析,結(jié)果表明鉆井液流入流出差對于溢流、漏失的判斷具有重要影響。

        猜你喜歡
        特征
        抓住特征巧觀察
        離散型隨機(jī)變量的分布列與數(shù)字特征
        具有兩個(gè)P’維非線性不可約特征標(biāo)的非可解群
        月震特征及與地震的對比
        如何表達(dá)“特征”
        被k(2≤k≤16)整除的正整數(shù)的特征
        不忠誠的四個(gè)特征
        詈語的文化蘊(yùn)含與現(xiàn)代特征
        新聞傳播(2018年11期)2018-08-29 08:15:24
        抓住特征巧觀察
        基于特征篩選的模型選擇
        2017天天爽夜夜爽精品视频| 极品少妇被猛的白浆直喷白浆| 一二三四在线视频观看社区| 小12箩利洗澡无码视频网站 | 亚洲最大av资源站无码av网址 | 精品91精品91精品国产片| 伊人久久综合狼伊人久久| 青青草国产在线视频自拍| 97色伦综合在线欧美视频| 视频福利一区| 一本久道视频无线视频试看| 中文字幕一区二区三区久久网| 免费a级作爱片免费观看美国| 欧洲综合色| 国产美女主播福利一区| 东北女人一级内射黄片| 久久精品国产在热亚洲不卡 | 国产又色又爽又高潮免费视频麻豆 | 91熟女av一区二区在线 | 青青草成人免费在线观看视频 | 亚洲av伊人久久综合密臀性色| 亚洲一区二区三区久久不卡| 国产影院一区二区在线| 日韩一区二区三区无码影院| 亚洲精品久久久久久| 亚洲欧美v国产蜜芽tv| 日本视频一区二区三区在线观看| 成人av鲁丝片一区二区免费| 一本大道香蕉最新在线视频| 国产精品污一区二区三区在线观看 | 国产成人cao在线| 亚洲美女主播内射在线| 久久久久无码国产精品一区| 欧美人与动人物牲交免费观看| 亚洲国产日韩综一区二区在性色| 91精品国产综合久久久密臀九色 | 亚洲在线精品一区二区三区| 国产精品久久777777| 久久综合色鬼| 国产成人亚洲综合二区| 亚洲av无码一区二区一二区|