亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于2D-CNN深度學(xué)習(xí)的鉆井事故等級(jí)預(yù)測(cè)新方法

        2023-01-13 07:02:46趙春蘭范翔宇趙鵬斐
        天然氣工業(yè) 2022年12期
        關(guān)鍵詞:分類模型

        趙春蘭 屈 瑤 王 兵 范翔宇 趙鵬斐 李 屹 何 婷

        1.西南石油大學(xué)理學(xué)院 2.西南石油大學(xué)計(jì)算機(jī)科學(xué)學(xué)院 3.“油氣藏地質(zhì)及開(kāi)發(fā)工程”國(guó)家重點(diǎn)實(shí)驗(yàn)室·西南石油大學(xué) 4.西南石油大學(xué)地球科學(xué)與技術(shù)學(xué)院

        0 引言

        石油鉆井是石油、天然氣勘探開(kāi)發(fā)的重要手段,隨著石油開(kāi)采的不斷提速和鉆井新技術(shù)的迅速發(fā)展,各種鉆井事故在鉆井施工過(guò)程中出現(xiàn)的風(fēng)險(xiǎn)也隨之增大,嚴(yán)重威脅著鉆井工作者的安全[1]。由于鉆井行業(yè)具有規(guī)模大和高風(fēng)險(xiǎn)的特點(diǎn)[2],為了盡量避免人員傷亡、降低財(cái)產(chǎn)損失和保證鉆井作業(yè)的順利進(jìn)行[3],根據(jù)鉆井事故發(fā)生的原因,建立一種新的鉆井安全事故預(yù)測(cè)模型,成為了有效評(píng)價(jià)鉆井事故過(guò)程中亟須解決的重要問(wèn)題。

        對(duì)于石油鉆井安全事故的預(yù)警研究,按照鉆井事故的種類,可分為單一鉆井事故和多種鉆井事故[4]。單一鉆井事故主要為井涌、井漏以及卡鉆等某一種事故,而多種鉆井事故則是包含了多種單一鉆井事故的預(yù)警研究。目前,對(duì)于單一鉆井事故的研究方法較多,包括時(shí)間序列分析[5]、貝葉斯模型[6-7]、模糊專家系統(tǒng)[8]、支持向量機(jī)回歸[9]、BP神經(jīng)網(wǎng)絡(luò)[10-11]等。而關(guān)于多種鉆井事故的預(yù)警研究還較少,因此深入研究多種鉆井事故的預(yù)測(cè)對(duì)于油氣田開(kāi)采行業(yè)具有重要的現(xiàn)實(shí)意義。

        為了研究石油鉆井行業(yè)中多種鉆井事故的預(yù)測(cè),可從其他行業(yè)的多種事故預(yù)測(cè)方向展開(kāi)進(jìn)一步研究。隨著人工智能技術(shù)的日益發(fā)展,關(guān)于多種事故預(yù)測(cè)的研究方法主要分為機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法。機(jī)器學(xué)習(xí)是通過(guò)各種算法對(duì)大量的數(shù)據(jù)進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)預(yù)測(cè)與分類;而深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的分支,是利用更為深層的網(wǎng)絡(luò)結(jié)構(gòu)來(lái)解決特征表達(dá)的學(xué)習(xí)方法。傳統(tǒng)的鉆井事故預(yù)測(cè)大多采用機(jī)器學(xué)習(xí)算法,例如支持向量機(jī)[12](SVM)、隨機(jī)森林[13](RF)以及BP神經(jīng)網(wǎng)絡(luò)[14]等。雖然SVM和RF預(yù)測(cè)模型的準(zhǔn)確性較好,但是其訓(xùn)練樣本的數(shù)據(jù)維度較小,且難以解決多分類的預(yù)測(cè)問(wèn)題。另外BP神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)結(jié)構(gòu)的不確定性導(dǎo)致預(yù)測(cè)精度不佳,且容易陷入局部最小值,降低泛化能力。由于機(jī)器學(xué)習(xí)算法對(duì)于預(yù)測(cè)模型的訓(xùn)練已經(jīng)不能滿足預(yù)測(cè)精度的要求,而深度學(xué)習(xí)算法可以通過(guò)提高網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)算深度來(lái)實(shí)現(xiàn)多分類鉆井事故的預(yù)測(cè),因此考慮將深度學(xué)習(xí)算法應(yīng)用于鉆井事故預(yù)測(cè)問(wèn)題中。

        針對(duì)上述傳統(tǒng)機(jī)器學(xué)習(xí)方法在預(yù)測(cè)精度、處理多維數(shù)據(jù)以及多分類預(yù)測(cè)問(wèn)題等方面存在的不足,國(guó)內(nèi)外的學(xué)者提出了基于深度學(xué)習(xí)方法的卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)解決這些問(wèn)題。譚媛元等[15]提出一種基于主成分分析(PCA)和一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)的融合模型,通過(guò)對(duì)財(cái)務(wù)指標(biāo)的反向?qū)W習(xí)訓(xùn)練,構(gòu)建三層卷積神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)財(cái)務(wù)危機(jī)預(yù)警的二分類問(wèn)題,新模型的預(yù)測(cè)準(zhǔn)確率達(dá)到了81.65%;同時(shí)Ghulam等[16]利用二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN)改進(jìn)抗癌肽的預(yù)測(cè),構(gòu)建一種新的預(yù)測(cè)抗癌肽的二分類模型,最終實(shí)驗(yàn)結(jié)果取得了較好的預(yù)測(cè)準(zhǔn)確性。相較于1D-CNN模型,2D-CNN模型具有較高的計(jì)算深度,有利于提高卷積神經(jīng)網(wǎng)絡(luò)分類預(yù)測(cè)的效果。鑒于之前2D-CNN模型在抗癌肽的二分類預(yù)測(cè)中得到了較好地應(yīng)用,故本文研究二維卷積神經(jīng)網(wǎng)絡(luò)模型在鉆井事故等級(jí)的多分類預(yù)測(cè)方面的應(yīng)用。

        為了更好地解決多維鉆井?dāng)?shù)據(jù)的多分類問(wèn)題,提高預(yù)測(cè)模型的準(zhǔn)確性,筆者提出了一種基于2D-CNN深度學(xué)習(xí)模型的鉆井事故等級(jí)預(yù)測(cè)的新方法。利用卷積層挖掘多維風(fēng)險(xiǎn)指標(biāo)的事故特征,通過(guò)增加卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算深度,來(lái)提高鉆井事故等級(jí)的預(yù)測(cè)精度,首次將二維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于多分類的預(yù)測(cè)問(wèn)題中,實(shí)現(xiàn)鉆井安全事故等級(jí)的識(shí)別,并對(duì)鉆井現(xiàn)場(chǎng)作業(yè)進(jìn)行有效的風(fēng)險(xiǎn)評(píng)價(jià)。

        1 方法原理

        1.1 信息增益

        信息增益(Information Gain,IG)是機(jī)器學(xué)習(xí)中常用的一種度量[17],常用于變量的特征選擇,當(dāng)變量的信息增益值越大時(shí),表明變量對(duì)分類做出的貢獻(xiàn)越多[18],即變量的重要程度越高。通常,信息增益采用信息熵H(X)和條件熵H(XY)的差值表示,信息增益的表達(dá)式為:

        式中m、n表示變量X和Y的維度,p(xi)表示變量X發(fā)生的可能性,表示給定變量X時(shí)變量Y發(fā)生的可能性。

        1.2 模糊C均值聚類算法

        引入模糊數(shù)學(xué)的思想,采用模糊C均值算法(FCM)對(duì)鉆井事故類型進(jìn)行分類。FCM聚類算法是一種無(wú)監(jiān)督的算法,核心思想就是通過(guò)不斷地更新聚類中心與隸屬度函數(shù),直到得到最佳聚類中心則終止[19]。假設(shè)樣本集為X={x1,x2,…,xn},將其劃分為c類,令第i類的聚類中心為ci,第j個(gè)樣本xj屬于第i個(gè)聚類中心的隸屬度為uij。則FCM算法的目標(biāo)函數(shù)如式(2)[20]:

        式中c表示聚類數(shù)目,n表示樣本總數(shù),m表示模糊加權(quán)指數(shù),且表示樣本xj和聚類中心ci之間的歐幾里得距離。隸屬度uij滿足式(3)的約束條件:

        利用拉格朗日乘子法,引入?yún)?shù)λ,則拉格朗日函數(shù)為:

        對(duì)目標(biāo)函數(shù)中的未知變量ci和uij求偏導(dǎo)使其等于0,得到聚類中心ci和隸屬度函數(shù)uij的迭代表達(dá)式為:

        1.3 一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)

        卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種前饋式神經(jīng)網(wǎng)絡(luò),憑借強(qiáng)大的特征提取和識(shí)別能力,在時(shí)間序列數(shù)據(jù)和圖像數(shù)據(jù)的分類任務(wù)中得到了成功的應(yīng)用[21]。它不僅能夠降低網(wǎng)絡(luò)模型的復(fù)雜度,而且還能通過(guò)其特有的卷積、池化操作實(shí)現(xiàn)對(duì)數(shù)據(jù)特征的自動(dòng)化提取,極大地提高了模型對(duì)于輸入數(shù)據(jù)的適應(yīng)能力[22]。由于鉆井現(xiàn)場(chǎng)作業(yè)的事故風(fēng)險(xiǎn)指標(biāo)為時(shí)間序列數(shù)據(jù),因此可以采用一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)模型實(shí)現(xiàn)鉆井事故等級(jí)的多分類預(yù)測(cè)。

        通過(guò)對(duì)BP神經(jīng)網(wǎng)絡(luò)中隱含層結(jié)構(gòu)的功能和形式進(jìn)行改進(jìn),將其轉(zhuǎn)化為一維卷積神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)與一維卷積神經(jīng)網(wǎng)絡(luò)一般都由輸入層、隱含層和輸出層三個(gè)部分組成,區(qū)別在于1D-CNN模型的隱含層還包含卷積層、池化層和全連接層。相較于BP神經(jīng)網(wǎng)絡(luò),一維卷積神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢(shì)在于:①?gòu)妮斎雲(yún)?shù)的角度,由于神經(jīng)元之間的連接方式為局部區(qū)域連接,因此有效減少訓(xùn)練參數(shù)的數(shù)目,降低神經(jīng)網(wǎng)絡(luò)的復(fù)雜度,提高了模型的計(jì)算效率;②從權(quán)值異同的角度,1D-CNN模型采用權(quán)值共享的方式,使得算法具有較強(qiáng)魯棒性,且易于訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)和1D-CNN模型的網(wǎng)絡(luò)連接方式如圖1所示。

        圖1 BP神經(jīng)網(wǎng)絡(luò)和1D-CNN模型的網(wǎng)絡(luò)連接方式圖

        BP神經(jīng)網(wǎng)絡(luò)的神經(jīng)元之間采用全連接的方式,對(duì)應(yīng)的權(quán)值和偏置都不同,則隱含層第j個(gè)神經(jīng)元的輸出表示為:

        由于1D-CNN模型引入了卷積核,因此神經(jīng)元之間的連接方式變?yōu)榫植窟B接,且具有共享權(quán)值的特點(diǎn)。再對(duì)式(7)的權(quán)值部分進(jìn)行改進(jìn),得到一維卷積神經(jīng)網(wǎng)絡(luò)中卷積層第j個(gè)神經(jīng)元的輸出:

        式中wi表示神經(jīng)元之間卷積核的共享權(quán)重;k表示卷積核個(gè)數(shù);bk表示隱含層中第k個(gè)卷積核對(duì)應(yīng)的偏置。

        1.4 二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN)

        根據(jù)卷積神經(jīng)網(wǎng)絡(luò)中卷積核移動(dòng)方向的不同,分為一維卷積神經(jīng)網(wǎng)絡(luò)和二維卷積神經(jīng)網(wǎng)絡(luò)。相較于前者卷積核的單向移動(dòng)方式,二維卷積神經(jīng)網(wǎng)絡(luò)卷積核的雙向移動(dòng)方式能夠較好地提取影響事故等級(jí)的風(fēng)險(xiǎn)特征,從而提高模型的預(yù)測(cè)準(zhǔn)確性。由此,對(duì)1D-CNN的輸入形式進(jìn)行改進(jìn),即將一維形式的時(shí)間序列數(shù)據(jù)轉(zhuǎn)化為二維形式的圖像數(shù)據(jù),則得到2D-CNN模型,其主要結(jié)構(gòu)為卷積層、池化層、輸出層3個(gè)部分。

        通過(guò)卷積層提取矩陣特征,其輸出值由多個(gè)特征面構(gòu)成,特征面對(duì)應(yīng)的每一個(gè)取值都代表一個(gè)神經(jīng)元,特征面中每個(gè)神經(jīng)元上的取值都通過(guò)卷積核計(jì)算得到[21]。一維卷積神經(jīng)網(wǎng)絡(luò)中卷積核是沿x軸的單向移動(dòng),而二維卷積卷積神經(jīng)網(wǎng)絡(luò)的卷積核是先沿x軸,再沿y軸的雙向移動(dòng)[23],其移動(dòng)操作如圖2所示。

        圖2 1D-CNN和2D-CNN的卷積層結(jié)構(gòu)圖

        假設(shè)1D-CNN模型卷積核的維度M=4,2D-CNN模型卷積核的維度M×M=2×2。根據(jù)式(8)對(duì)1D-CNN模型的卷積核和輸入數(shù)據(jù)結(jié)構(gòu)進(jìn)行改進(jìn),得到2D-CNN模型卷積層的計(jì)算公式為:

        式中yk,j表示第k個(gè)特征面的第j個(gè)神經(jīng)元的輸出值;wk,s,t表示第k個(gè)卷積核中第s行第t列對(duì)應(yīng)的權(quán)值;bk為卷積層中第k個(gè)卷積核對(duì)應(yīng)的偏置值。

        為了提高CNN模型的非線性能力,激活函數(shù)選擇常用的Relu函數(shù),其具體的表達(dá)式為:

        接下來(lái)采用池化層對(duì)提取的特征進(jìn)行篩選和過(guò)濾,通過(guò)對(duì)上層的數(shù)據(jù)進(jìn)行縮放映射來(lái)降維,保持?jǐn)?shù)據(jù)特征具有縮放不變性,同時(shí)防止數(shù)據(jù)出現(xiàn)過(guò)擬合的情況。

        最后是輸出層,利用Softmax函數(shù)回歸之后的交叉熵?fù)p失函數(shù)得到最終分類結(jié)果,從而輸出預(yù)測(cè)值,即鉆井事故等級(jí)對(duì)應(yīng)的分類概率,范圍在0到1之間,將概率值最大的類別作為樣本所屬的鉆井事故等級(jí)。其中Softmax函數(shù)和交叉熵?fù)p失函數(shù)的表達(dá)式分別為:

        式中J表示交叉熵?fù)p失函數(shù);xi表示全連接層的輸出值;yi表示4種鉆井事故的真實(shí)等級(jí),分別表示特別重大事故、重大事故、較大事故、一般事故;h(xi)表示Softmax函數(shù)回歸后的值。

        2 2D-CNN的鉆井事故等級(jí)預(yù)測(cè)模型

        2.1 模型思想

        對(duì)于多種鉆井事故的預(yù)測(cè)研究,雖然傳統(tǒng)的機(jī)器學(xué)習(xí)算法基礎(chǔ)理論完善,方法簡(jiǎn)單可行,但在多維數(shù)據(jù)提取事故特征方面存在一定的局限性。而深度學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò)模型作為常用的處理多維數(shù)據(jù)的模型,為多維鉆井?dāng)?shù)據(jù)的事故等級(jí)預(yù)測(cè)提供了新的思路。由于一維卷積神經(jīng)網(wǎng)絡(luò)模型的計(jì)算深度較低,使得分類模型的預(yù)測(cè)效果有待提高。因此為了提高模型的預(yù)測(cè)精度,將二維卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于鉆井事故等級(jí)的預(yù)測(cè)中,以實(shí)現(xiàn)鉆井現(xiàn)場(chǎng)作業(yè)的風(fēng)險(xiǎn)評(píng)價(jià)。

        基于2D-CNN的鉆井事故等級(jí)預(yù)測(cè)模型的構(gòu)建思想如下:首先對(duì)原始鉆井?dāng)?shù)據(jù)的風(fēng)險(xiǎn)指標(biāo)和事故類型進(jìn)行數(shù)據(jù)預(yù)處理,利用FCM聚類算法對(duì)事故類型進(jìn)行分類得到真實(shí)的鉆井事故等級(jí),再利用信息增益值的大小排序?qū)︼L(fēng)險(xiǎn)指標(biāo)進(jìn)行一次降維;然后將新的風(fēng)險(xiǎn)指標(biāo)作為2D-CNN模型的輸入,通過(guò)卷積層的卷積操作以及池化層的二次降維操作,最終輸出預(yù)測(cè)的鉆井事故等級(jí),從而解決鉆井事故等級(jí)的多分類預(yù)測(cè)問(wèn)題。

        2.2 模型構(gòu)建步驟

        為了解決多維鉆井?dāng)?shù)據(jù)的多分類預(yù)測(cè)問(wèn)題,筆者提出了基于2D-CNN深度學(xué)習(xí)算法的新鉆井事故等級(jí)的預(yù)測(cè)模型。模型的構(gòu)建步驟主要分為3步,如圖3所示。

        圖3 基于2D-CNN的鉆井事故預(yù)測(cè)模型結(jié)構(gòu)圖

        2.2.1 原始數(shù)據(jù)完整化處理

        通過(guò)收集鉆井現(xiàn)場(chǎng)作業(yè)數(shù)據(jù),確定原始三級(jí)風(fēng)險(xiǎn)指標(biāo)和原始鉆井事故類型,利用K近鄰插值算法對(duì)缺失值進(jìn)行填充以及歸一化處理,實(shí)現(xiàn)數(shù)據(jù)完整化處理,以確保后續(xù)建模的有效性和準(zhǔn)確性。

        2.2.2 鉆井事故等級(jí)劃分及特征選擇

        采用FCM聚類算法對(duì)原始事故類型進(jìn)行分類,根據(jù)隸屬度矩陣確定鉆井事故等級(jí),再利用原始風(fēng)險(xiǎn)指標(biāo)和鉆井事故等級(jí)進(jìn)行特征選擇,保留信息增益值大于1的新的風(fēng)險(xiǎn)指標(biāo)。

        2.2.3 構(gòu)建2D-CNN模型預(yù)測(cè)鉆井事故等級(jí)

        將新的風(fēng)險(xiǎn)指標(biāo)進(jìn)行向量擴(kuò)充,對(duì)新的風(fēng)險(xiǎn)指標(biāo)向量進(jìn)行矩陣化處理,在二維卷積神經(jīng)網(wǎng)絡(luò)模型中引入卷積核,將新的風(fēng)險(xiǎn)指標(biāo)矩陣作為2D-CNN深度學(xué)習(xí)模型的輸入,通過(guò)卷積層提取風(fēng)險(xiǎn)指標(biāo)的特征,再經(jīng)過(guò)池化層的二次降維,以及全連接層的計(jì)算,最終輸出鉆井事故分類的預(yù)測(cè)結(jié)果。

        3 實(shí)例分析

        3.1 鉆井事故數(shù)據(jù)說(shuō)明及預(yù)處理

        油氣鉆井現(xiàn)場(chǎng)的風(fēng)險(xiǎn)指標(biāo)體系具有復(fù)雜性、多層次性的特點(diǎn),導(dǎo)致影響鉆井現(xiàn)場(chǎng)作業(yè)事故等級(jí)的因素較多。通過(guò)石油鉆探行業(yè)工作人員的現(xiàn)場(chǎng)調(diào)研,鉆井事故數(shù)據(jù)的一級(jí)風(fēng)險(xiǎn)指標(biāo)分別為人的因素、物的因素、環(huán)境因素以及管理因素,13種鉆井事故風(fēng)險(xiǎn)類型[24]分別為交通事故、機(jī)械傷害事故、火災(zāi)、起重傷害事故、其他事故(除上述4類事故以外的事故)、交通事件等。其中,安全事故和安全事件的劃分標(biāo)準(zhǔn)為單位人員或非單位人員在現(xiàn)場(chǎng)作業(yè)時(shí)是否發(fā)生人身傷亡、急性中毒或者直接經(jīng)濟(jì)損失的事故。鉆井事故數(shù)據(jù)的二級(jí)和三級(jí)風(fēng)險(xiǎn)指標(biāo)xi(i= 1,2,…,73)如表1所示,部分三級(jí)風(fēng)險(xiǎn)指標(biāo)含義不作贅述,事故風(fēng)險(xiǎn)類型yj(j= 1,2,…,13)如表2所示。

        表1 鉆井事故風(fēng)險(xiǎn)評(píng)估指標(biāo)表

        表2 鉆井事故風(fēng)險(xiǎn)類型表

        由于各個(gè)鉆探公司收集到的原始鉆井現(xiàn)場(chǎng)作業(yè)數(shù)據(jù)中存在大量缺失數(shù)據(jù),故采用K近鄰插值算法進(jìn)行數(shù)據(jù)完整化處理。設(shè)置適當(dāng)?shù)腒值為3,即將最近鄰的3個(gè)樣本對(duì)應(yīng)維度數(shù)據(jù)點(diǎn)的均值作為該缺失數(shù)據(jù)點(diǎn)的估計(jì)值。將缺失值進(jìn)行數(shù)據(jù)清洗后,整理得到2015年1月至2019年12月內(nèi)59個(gè)鉆井現(xiàn)場(chǎng)作業(yè)的月度樣本數(shù)據(jù)。

        由于鉆井風(fēng)險(xiǎn)指標(biāo)的數(shù)據(jù)維度較大,因此原始數(shù)據(jù)在輸入2D-CNN模型進(jìn)行訓(xùn)練之前,需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,通過(guò)最大最小值歸一化將原始數(shù)據(jù)轉(zhuǎn)化為[0,1]之間的數(shù)據(jù),實(shí)現(xiàn)損失函數(shù)的較快收斂。

        3.2 鉆井事故等級(jí)劃分

        由于影響鉆井風(fēng)險(xiǎn)指標(biāo)的因素較多,根據(jù)13種鉆井事故類型,對(duì)59個(gè)鉆井事故樣本數(shù)據(jù)進(jìn)行聚類。利用FCM聚類算法中聚類中心ci和隸屬度函數(shù)uij的更新迭代公式,得到4種鉆井事故等級(jí)的分類結(jié)果,分別為特別重大事故、重大事故、較大事故、一般事故。則FCM聚類算法的基本流程如下:①初始化參數(shù),設(shè)置聚類類別個(gè)數(shù)為c=4,迭代次數(shù)為50次,并指定模糊加權(quán)指數(shù)m=2;②在滿足隸屬度權(quán)重和為1的約束條件下,計(jì)算隸屬度矩陣U[式(6)];③根據(jù)隸屬度矩陣U計(jì)算聚類中心c[式(5)];④判斷是否達(dá)到預(yù)設(shè)的迭代次數(shù),若未達(dá)到,則返回步驟②,若已達(dá)到,則說(shuō)明已達(dá)到最優(yōu)化的目標(biāo)函數(shù)J[式(2)];⑤根據(jù)最大隸屬度原則,確定各樣本所屬的4種類別標(biāo)簽。

        利用Matlab軟件對(duì)59個(gè)鉆井事故樣本數(shù)據(jù)進(jìn)行模糊C均值聚類,當(dāng)?shù)螖?shù)達(dá)到50次時(shí),目標(biāo)函數(shù)值趨于穩(wěn)定,如圖4-a所示,通過(guò)樣本的最大隸屬矩陣值確定各樣本對(duì)應(yīng)的鉆井事故等級(jí)。根據(jù)鉆井事故的嚴(yán)重程度得到分類結(jié)果:特別重大事故(16種)、重大事故(15種)、較大事故(15種)、一般事故(13種),則各樣本對(duì)應(yīng)的分類結(jié)果如圖4-b所示。

        圖4 鉆井事故等級(jí)的分類結(jié)果圖

        3.3 風(fēng)險(xiǎn)指標(biāo)的確定

        根據(jù)各個(gè)鉆探公司從鉆井現(xiàn)場(chǎng)收集到的風(fēng)險(xiǎn)指標(biāo)和安全事故類型每月發(fā)生次數(shù)的歷史數(shù)據(jù),利用式(1)的信息增益值對(duì)三級(jí)事故風(fēng)險(xiǎn)指標(biāo)進(jìn)行特征選擇,根據(jù)信息增益值的大小排序,保留增益值大于1的風(fēng)險(xiǎn)指標(biāo),得到25個(gè)顯著影響鉆井事故等級(jí)預(yù)測(cè)的事故指標(biāo)。信息增益值的排序結(jié)果如表3所示。

        表3 各風(fēng)險(xiǎn)指標(biāo)的信息增益值表

        3.4 模型參數(shù)設(shè)置及預(yù)測(cè)流程

        2D-CNN模型采用監(jiān)督學(xué)習(xí)的訓(xùn)練方式,訓(xùn)練過(guò)程分為前向訓(xùn)練和反向訓(xùn)練兩個(gè)階段。首先確定二維卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),設(shè)置初始參數(shù)和迭代次數(shù),將結(jié)構(gòu)重組后二維形式的特征矩陣作為模型的輸入,并進(jìn)行前向訓(xùn)練,模型的訓(xùn)練樣本中鉆井事故預(yù)測(cè)等級(jí)與實(shí)際值進(jìn)行對(duì)比得到預(yù)測(cè)準(zhǔn)確率;然后進(jìn)行反向傳播,使用優(yōu)化算法不斷更新權(quán)重矩陣,從而提高模型的預(yù)測(cè)準(zhǔn)確率。

        筆者基于2D-CNN網(wǎng)絡(luò)的鉆井事故預(yù)測(cè)模型由2層卷積層、2層池化層以及2層全連接層構(gòu)成。在第一層二維卷積層中,卷積核個(gè)數(shù)為1,窗口大小為4×4,步長(zhǎng)為2,在卷積層后設(shè)置激活函數(shù)Relu,可以向深度網(wǎng)絡(luò)中加入非線性;為了防止模型訓(xùn)練過(guò)程中出現(xiàn)梯度消失的問(wèn)題,在卷積層后面添加批量歸一化處理(即BN層);之后采用最大池化層,設(shè)置步長(zhǎng)為1,池化尺寸為2×2,以上卷積層和池化層的填充方式均為不填充模式(Valid);接下來(lái)是第二層卷積層,將卷積核的大小設(shè)為2×2,步長(zhǎng)為1;第二層池化層的參數(shù)與上述相同;為了防止模型過(guò)擬合問(wèn)題,加入一個(gè)丟棄層(Dropout),設(shè)置概率(p)為0.5,即舍棄掉50%的信息;再通過(guò)扁平層(Flatten)操作,將三維向量特征壓縮成一維時(shí)序向量特征。最后接入2個(gè)全連接層,輸出4種鉆井事故等級(jí)的預(yù)測(cè)結(jié)果。

        2D-CNN模型訓(xùn)練時(shí),將59個(gè)鉆井樣本的數(shù)據(jù)集按照8∶2的比例劃分為訓(xùn)練集和測(cè)試集。訓(xùn)練過(guò)程中,設(shè)置迭代次數(shù)(Epoch)為100,訓(xùn)練批次大小為4,學(xué)習(xí)率為0.001,卷積層中激活函數(shù)采用激活函數(shù)(Relu),輸出層采用激活函數(shù)(Softmax)和交叉熵?fù)p失函數(shù),優(yōu)化算法為自適應(yīng)矩估計(jì)算法,通過(guò)梯度下降的方式不斷調(diào)整模型的參數(shù),得到最優(yōu)的2D-CNN預(yù)測(cè)模型,最終輸出分類結(jié)果。其中,2D-CNN預(yù)測(cè)模型的結(jié)構(gòu)和參數(shù)如表4所示。

        表4 2D-CNN預(yù)測(cè)模型的結(jié)構(gòu)和參數(shù)表

        利用2D-CNN模型對(duì)鉆井事故等級(jí)進(jìn)行預(yù)測(cè),預(yù)測(cè)模型主要由輸入層、卷積層、池化層及全連接層構(gòu)成,其模型的預(yù)測(cè)流程如圖5所示。

        圖5 基于2D-CNN模型的鉆井事故預(yù)測(cè)流程圖

        基于2D-CNN的多維鉆井事故預(yù)測(cè)模型的具體流程如下:①采用信息增益值和FCM聚類算法實(shí)現(xiàn)數(shù)據(jù)預(yù)處理,確定25個(gè)風(fēng)險(xiǎn)指標(biāo)和4種鉆井事故等級(jí);再將輸入數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,利用獨(dú)熱編碼對(duì)測(cè)試集的事故等級(jí)進(jìn)行數(shù)字化處理;②訓(xùn)練集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)2D-CNN模型的卷積層提取信息并學(xué)習(xí)事故特征,并采用BPTT算法將訓(xùn)練誤差反向傳播,不斷更新模型參數(shù);③利用Softmax函數(shù)得到事故等級(jí)的分類概率,為避免模型過(guò)擬合,通過(guò)梯度下降的方式不斷調(diào)整模型的參數(shù),得到預(yù)測(cè)模型的最優(yōu)參數(shù);④判斷網(wǎng)絡(luò)的迭代次數(shù)是否達(dá)到預(yù)先設(shè)定的100次,如果是,則運(yùn)行下一步,否則重復(fù)第2步;⑤測(cè)試集驗(yàn)證已訓(xùn)練好的模型性能,計(jì)算評(píng)價(jià)指標(biāo),輸出預(yù)測(cè)結(jié)果,則計(jì)算結(jié)束。

        3.5 模型評(píng)價(jià)指標(biāo)

        筆者采用準(zhǔn)確率(Accuracy)、靈敏度(Sensitivity)及特異性(Specificity)3種指標(biāo)來(lái)評(píng)價(jià)預(yù)測(cè)模型的性能,并且用混淆矩陣詳細(xì)地說(shuō)明每種事故等級(jí)的分類結(jié)果。準(zhǔn)確率是分類正確的事故等級(jí)占總測(cè)試樣本的比例;靈敏性是正例中被分類正確的比例;特異性是負(fù)例中被分類正確的比例。其中,準(zhǔn)確率是評(píng)價(jià)模型性能中最直觀的指標(biāo),而靈敏度越高說(shuō)明漏檢的概率越小,特異性越高說(shuō)明誤診率越小。則準(zhǔn)確率、靈敏性及特異性的計(jì)算公式為:

        式中F1、F2、F3分別表示評(píng)價(jià)預(yù)測(cè)模型的準(zhǔn)確率、靈敏度及特異性;TP、FN分別表示正樣本中被正確識(shí)別為正樣本的數(shù)量,被錯(cuò)誤識(shí)別為負(fù)樣本的數(shù)量;TN、FP分別表示負(fù)樣本中被正確識(shí)別為負(fù)樣本的數(shù)量,被錯(cuò)誤識(shí)別為正樣本的數(shù)量。

        3.6 實(shí)驗(yàn)結(jié)果對(duì)比分析

        本文利用2D-CNN模型對(duì)鉆井現(xiàn)場(chǎng)作業(yè)事故進(jìn)行預(yù)測(cè),將特征選擇后的風(fēng)險(xiǎn)指標(biāo)輸入到模型中,經(jīng)過(guò)卷積神經(jīng)網(wǎng)絡(luò)卷積層、池化層以及全連接層的操作后,通過(guò)Softmax函數(shù)得到各個(gè)樣本的鉆井事故等級(jí)的概率值,將概率較大的類別作為樣本對(duì)應(yīng)的事故等級(jí),最終輸出事故預(yù)測(cè)結(jié)果。采用訓(xùn)練集和測(cè)試集的損失和準(zhǔn)確率來(lái)衡量預(yù)測(cè)效果的好壞,損失和準(zhǔn)確率的變化曲線如圖6所示。

        圖6 訓(xùn)練集和測(cè)試集的損失/準(zhǔn)確率的變化曲線圖

        利用2D-CNN模型對(duì)鉆井事故等級(jí)進(jìn)行分類,當(dāng)?shù)螖?shù)達(dá)到60的時(shí)候,損失和準(zhǔn)確率的整體曲線趨于平穩(wěn),測(cè)試集的準(zhǔn)確率達(dá)到了91.67%,損失值為0.409,表明2D-CNN模型在鉆井事故預(yù)測(cè)方面表現(xiàn)出較高的準(zhǔn)確率。

        表5為2D-CNN模型中分類結(jié)果的數(shù)量對(duì)應(yīng)的混淆矩陣以及鉆井事故等級(jí)的靈敏度、特異性以及總體的評(píng)判結(jié)果。結(jié)果表明2D-CNN模型的靈敏度為0.92,特異性為0.92。其中,一般事故、較大事故、特別重大事故的靈敏度和特異性均為1,因此不存在漏檢和誤診的情況。

        表5 2D-CNN模型分類結(jié)果表

        為了進(jìn)一步驗(yàn)證基于2D-CNN鉆井事故預(yù)測(cè)模型的有效性,將其與BP神經(jīng)網(wǎng)絡(luò)模型和1D-CNN模型進(jìn)行對(duì)比分析。采用Python軟件的Keras模塊,在不改變模型整體結(jié)構(gòu)的同時(shí),對(duì)模型的輸入層進(jìn)行修改,使其適用于鉆井事故預(yù)測(cè)的多分類問(wèn)題。采用相同的數(shù)據(jù)集對(duì)鉆井事故等級(jí)進(jìn)行預(yù)測(cè),選取準(zhǔn)確率、靈敏度以及特異性作為衡量預(yù)測(cè)效果的評(píng)價(jià)指標(biāo),不同預(yù)測(cè)模型的對(duì)比結(jié)果如表6所示。

        表6 不同預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)比較表

        由于1D-CNN模型和2D-CNN模型的準(zhǔn)確率明顯高于BP神經(jīng)網(wǎng)絡(luò)模型,說(shuō)明卷積神經(jīng)網(wǎng)絡(luò)的卷積核能夠較好地學(xué)習(xí)風(fēng)險(xiǎn)指標(biāo)之間的特征,提取較為顯著的指標(biāo)進(jìn)行預(yù)測(cè),從而提高了鉆井事故等級(jí)預(yù)測(cè)結(jié)果的準(zhǔn)確性。最終根據(jù)表6實(shí)驗(yàn)結(jié)果可知,筆者建立的基于2D-CNN深度學(xué)習(xí)方法的鉆井事故預(yù)測(cè)模型的準(zhǔn)確率為0.917,靈敏度為0.918,特異性為0.915,均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和1D-CNN模型,并且在測(cè)試集上的損失值最小。

        根據(jù)圖7不同模型鉆井事故等級(jí)的實(shí)際情況與預(yù)測(cè)情況的對(duì)比結(jié)果,相比于其他模型,2D-CNN模型測(cè)試集上鉆井事故等級(jí)的預(yù)測(cè)情況與實(shí)際事情整體變化趨勢(shì)更加符合,存在誤判的情況較少,說(shuō)明該模型具有較好的預(yù)測(cè)能力,適用于鉆井事故等級(jí)的預(yù)測(cè)。

        圖7 不同模型測(cè)試集上實(shí)際情況和預(yù)測(cè)情況對(duì)比圖

        4 結(jié)論與建議

        本文提出一種新的基于2D-CNN深度學(xué)習(xí)算法的預(yù)測(cè)模型,解決了鉆井安全事故等級(jí)預(yù)測(cè)的多分類問(wèn)題,其預(yù)測(cè)結(jié)果對(duì)鉆井作業(yè)現(xiàn)場(chǎng)作業(yè)的事故風(fēng)險(xiǎn)評(píng)價(jià)具有重要參考價(jià)值?;诒狙芯康慕Y(jié)果,得出以下結(jié)論并提出相關(guān)建議。

        1)采用FCM聚類算法對(duì)多種鉆井事故類型進(jìn)行分類,得到4種鉆井事故等級(jí),再通過(guò)信息增益值的大小排序?qū)Χ嗑S風(fēng)險(xiǎn)指標(biāo)進(jìn)行特征選擇,確定了25個(gè)新的影響事故等級(jí)預(yù)測(cè)的風(fēng)險(xiǎn)指標(biāo),合理選擇風(fēng)險(xiǎn)指標(biāo)有利于提高鉆井事故多分類的預(yù)測(cè)精度。

        2)將雙層2D-CNN深度學(xué)習(xí)方法應(yīng)用于鉆井事故等級(jí)預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率為0.917,靈敏度為0.918,特異性為0.915,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和1D-CNN模型,并且在測(cè)試集上損失值最小。由于2D-CNN模型具有較深的計(jì)算深度,提高了模型的預(yù)測(cè)精度,因此該模型適用于鉆井事故等級(jí)預(yù)測(cè)的研究。

        3)針對(duì)多維鉆井?dāng)?shù)據(jù)的多分類問(wèn)題,提出了基于2D-CNN的深度學(xué)習(xí)模型,在小樣本量的鉆井事故等級(jí)預(yù)測(cè)方面具有較好的準(zhǔn)確性和有效性,而在樣本量較大的預(yù)測(cè)問(wèn)題中精度會(huì)得到明顯的提高,因此該方法為樣本量較大的多維鉆井?dāng)?shù)據(jù)的事故預(yù)測(cè)研究提供了一種新的思路。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        午夜福利理论片高清在线观看| 二区三区视频| av少妇偷窃癖在线观看| 最全精品自拍视频在线| 真实夫妻露脸自拍视频在线播放| 人妻丝袜av中文系列先锋影音| 日韩久久一级毛片| 久久精品国产视频在热| 国产乱码精品一区二区三区久久| 风流老熟女一区二区三区| 欧美日韩成人在线| 日韩精品久久不卡中文字幕| 精品国产三级a在线观看不卡| 免费看黄a级毛片| 伊人久久综在合线亚洲不卡| 黄色三级国产在线观看| 亚洲 另类 小说 国产精品| 性一交一乱一透一a级| 一区二区韩国福利网站| 清纯唯美亚洲经典中文字幕| 国产又黄又硬又粗| 97无码人妻福利免费公开在线视频| 大陆啪啪福利视频| 国产免费人成视频在线| 国产又粗又黄又爽的大片| 91免费永久国产在线观看| 女同视频网站一区二区| 成人午夜高潮a∨猛片| 无码国产一区二区三区四区| 国产亚洲日本人在线观看| 高清少妇二区三区视频在线观看| 人禽交 欧美 网站| 国产nv精品你懂得| 女同视频网站一区二区| 国产在线第一区二区三区| 欧美丰满熟妇乱xxxxx图片| 亚洲a∨好看av高清在线观看| 日本一级二级三级不卡| 亚洲成av人片在线观看麦芽| 久久福利青草精品资源| 一区二区三区日本视频|