亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林算法的環(huán)焊縫質(zhì)量不合格性分析預(yù)測(cè)*

        2023-09-26 00:42:52楊新超吳張中戴聯(lián)雙李海潤(rùn)孟祥海
        石油管材與儀器 2023年5期
        關(guān)鍵詞:決策樹(shù)合格焊縫

        劉 亮,李 娟,賀 建,楊新超,吳張中,戴聯(lián)雙,李海潤(rùn),孟祥海

        (1. 國(guó)家管網(wǎng)集團(tuán)工程技術(shù)創(chuàng)新有限公司 天津 300450; 2. 南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系 江蘇 南京 210033;3. 國(guó)家管網(wǎng)集團(tuán)科學(xué)技術(shù)研究總院分公司 河北 廊坊 065000; 4. 國(guó)家管網(wǎng)集團(tuán)生產(chǎn)部 北京 100097)

        0 引 言

        由于建設(shè)時(shí)期技術(shù)水平限制和現(xiàn)場(chǎng)焊接施工質(zhì)量控制等問(wèn)題,環(huán)焊縫一直是管道最薄弱的環(huán)節(jié),加之容易受土體移動(dòng)等附加載荷的影響,環(huán)焊縫開(kāi)裂事故時(shí)有發(fā)生。近年來(lái),隨著管道行業(yè)的大發(fā)展,大量新建管道建設(shè)投產(chǎn)。雖然新建管道普遍采用高強(qiáng)鋼焊接工藝,管道的制管和施工質(zhì)量相比20世紀(jì)70年代的老管道有了很大提升,但部分管道存在冬季施工中未按照工藝要求進(jìn)行管體預(yù)熱和保溫以及強(qiáng)力組對(duì)等問(wèn)題,導(dǎo)致環(huán)焊縫焊接缺陷問(wèn)題的凸顯,影響管道安全運(yùn)行。目前X80高強(qiáng)鋼的使用,也對(duì)環(huán)焊縫的研究提出了更高的要求。

        目前部分學(xué)者對(duì)管道環(huán)焊縫開(kāi)展了研究,帥健等對(duì)高鋼級(jí)管道環(huán)焊縫主要特征及安全性評(píng)價(jià)開(kāi)展了研究[1]。隋永莉?qū)Ω咪摷?jí)環(huán)焊縫的焊接工藝進(jìn)行了探討[2]。沙勝義等在高鋼級(jí)管道環(huán)焊縫安全評(píng)價(jià)方面開(kāi)展了相關(guān)研究,對(duì)環(huán)焊縫的低強(qiáng)匹配、斷裂韌性、沖擊功分散性等問(wèn)題進(jìn)行了探討[3]。陳一諾等主要基于內(nèi)檢測(cè)數(shù)據(jù)對(duì)管體的缺陷情況進(jìn)行了研究[4]。楊鋒平等對(duì)油氣管道環(huán)焊縫失效案例進(jìn)行了收集和分析,并通過(guò)全尺寸試驗(yàn)研究了影響環(huán)焊縫性能的主要因素[5]。其他學(xué)者利用隨機(jī)森林等其他機(jī)器學(xué)習(xí)方法開(kāi)展了數(shù)據(jù)分析研究,吳孝情等利用隨機(jī)森林算法開(kāi)發(fā)了滑坡危險(xiǎn)性評(píng)價(jià)模型[6]。國(guó)外對(duì)環(huán)焊縫缺陷分析預(yù)測(cè)方面的內(nèi)容較少,國(guó)內(nèi)學(xué)者主要對(duì)管體的缺陷進(jìn)行了分析,未基于大數(shù)據(jù)對(duì)環(huán)焊縫缺陷進(jìn)行預(yù)測(cè)分析,所采集的數(shù)據(jù)也不夠全面?;诖?本文收集分析了4萬(wàn)余道環(huán)焊縫質(zhì)量排查過(guò)程中的管道基礎(chǔ)數(shù)據(jù)、建設(shè)期施工數(shù)據(jù)、檢測(cè)數(shù)據(jù)、開(kāi)挖基本信息、適用性評(píng)價(jià)數(shù)據(jù)和修復(fù)數(shù)據(jù),構(gòu)建了環(huán)焊縫缺陷不合格性預(yù)測(cè)分析模型,為有效指導(dǎo)環(huán)焊縫排查工作,提升環(huán)焊縫開(kāi)挖準(zhǔn)確度和有效性提供技術(shù)支持。

        1 隨機(jī)森林算法簡(jiǎn)介

        隨機(jī)森林算法于2001年由Breiman提出,是以決策樹(shù)為基礎(chǔ)的一種更高級(jí)的算法,像決策樹(shù)一樣,隨機(jī)森林既可以用于回歸也可以用于分類。隨機(jī)森林從本質(zhì)上屬于機(jī)器學(xué)習(xí)中的集成學(xué)習(xí),即通過(guò)建立模型組合來(lái)解決單一預(yù)測(cè)的問(wèn)題。

        隨機(jī)森林采用 Bootstrap 抽樣技術(shù)從全部數(shù)據(jù)集中抽取N個(gè)訓(xùn)練集,每個(gè)訓(xùn)練集的大小約為數(shù)據(jù)集的 2/3; 然后依據(jù)抽取的數(shù)據(jù)為每個(gè)訓(xùn)練集建立決策樹(shù),生成由n棵決策樹(shù)組成的森林。決策樹(shù)生長(zhǎng)過(guò)程中,從全部M個(gè)特征中隨機(jī)選取m個(gè)特征 (m≤M),在m個(gè)特征中根據(jù) Gini 系數(shù)最小原則選出最優(yōu)屬性進(jìn)行節(jié)點(diǎn)分支;最后由n棵決策樹(shù)根據(jù)預(yù)測(cè)結(jié)果采用投票的方式?jīng)Q定預(yù)測(cè)樣本的類別。

        為了靈活控制所輸入文件的內(nèi)容和格式,便于優(yōu)化算法所需的參數(shù),以及后續(xù)其他方法的接入,本文采用python語(yǔ)言進(jìn)行模型的開(kāi)發(fā)。

        2 環(huán)焊縫缺陷影響因素分析

        為了保證管道的安全,相關(guān)管道企業(yè)開(kāi)展了油氣管道環(huán)焊縫缺陷排查與治理工作,也有相關(guān)專家學(xué)者對(duì)環(huán)焊縫缺陷的影響因素及治理措施開(kāi)展了研究[7-9]。環(huán)焊縫缺陷的影響因素眾多,包括焊接施工因素,以及管體材料因素、管道特征因素等[10-14],通過(guò)采集相關(guān)因素的數(shù)據(jù),采用聚類、分類等數(shù)據(jù)預(yù)處理方法進(jìn)行處理[15-18],然后可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)因素進(jìn)行綜合分析,選出影響環(huán)焊縫質(zhì)量的主要影響因素。

        2.1 數(shù)據(jù)采集

        為保證研究結(jié)果的準(zhǔn)確性,需要對(duì)與環(huán)焊縫相關(guān)的數(shù)據(jù)進(jìn)行廣泛的采集,避免以偏概全。采集的數(shù)據(jù)主要包括管材數(shù)據(jù)、焊接數(shù)據(jù)、內(nèi)檢測(cè)數(shù)據(jù)、無(wú)損檢測(cè)數(shù)據(jù)、開(kāi)挖數(shù)據(jù)、地理環(huán)境數(shù)據(jù)、氣象數(shù)據(jù)等。前期通過(guò)數(shù)據(jù)對(duì)齊,對(duì)環(huán)焊縫的基礎(chǔ)數(shù)據(jù)進(jìn)行了收集,在后續(xù)的開(kāi)挖檢測(cè)過(guò)程中,通過(guò)多種方式對(duì)其他數(shù)據(jù)進(jìn)行了采集和補(bǔ)充。

        2.2 數(shù)據(jù)預(yù)處理

        由于數(shù)據(jù)閾值定義的不規(guī)范性、人為填報(bào)的多樣性,會(huì)導(dǎo)致數(shù)據(jù)不完整,含有大量的噪聲數(shù)據(jù),因此需要對(duì)缺失值、異常值、邏輯錯(cuò)誤值、非標(biāo)準(zhǔn)化值進(jìn)行處理。

        對(duì)采集的環(huán)焊縫相關(guān)數(shù)據(jù)進(jìn)行分析,大部分為分類數(shù)據(jù),在輸入模型之前,需要對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理。環(huán)焊縫相關(guān)數(shù)據(jù)專業(yè)化程度高、復(fù)雜性也高,而且分析結(jié)果對(duì)精度、可靠性要求高,因此需要掌握焊接、無(wú)損檢測(cè)、材料、內(nèi)檢測(cè)、數(shù)據(jù)分析等多種專業(yè)知識(shí),才能較好地完成數(shù)據(jù)預(yù)處理工作,在后續(xù)的數(shù)據(jù)分析中才能得到符合或超越人們以往已有知識(shí)的認(rèn)知,才能創(chuàng)造價(jià)值。

        針對(duì)施工日期數(shù)據(jù)進(jìn)行拆分處理,施工日期一般為年月日,為了便于分析氣溫等因素對(duì)環(huán)焊縫缺陷的影響,將施工日期抽取為年份和月份,如2010-12-08可以分為2010年和12月份兩類數(shù)據(jù)。

        針對(duì)地形、壁厚等缺失值,由于相鄰區(qū)域的地形地貌是相似的,采用最近鄰方法進(jìn)行補(bǔ)充;由于同一段鋼管或相鄰鋼管壁厚基本是一致的,因此采用最近鄰方法進(jìn)行補(bǔ)充,如1 016 mm直徑的管道,壁厚一般為17.5 mm。

        對(duì)采集的環(huán)焊縫相關(guān)數(shù)據(jù)進(jìn)行分析,大部分為分類數(shù)據(jù),在輸入機(jī)器學(xué)習(xí)模型之前,需要對(duì)數(shù)據(jù)進(jìn)行處理。為了保證數(shù)據(jù)可適用于回歸,分類,聚類等多種模型,因此對(duì)數(shù)據(jù)進(jìn)行one-hot編碼,通過(guò)編碼將離散特征映射到歐式空間,便于進(jìn)行特征之間距離的計(jì)算或相似度的計(jì)算。表1以焊接方式為例,進(jìn)行one-hot編碼。

        〔設(shè)計(jì)意圖:本次作文訓(xùn)練課的重點(diǎn)在于指導(dǎo)學(xué)生如何把一件事(或活動(dòng))的經(jīng)過(guò)寫(xiě)具體,所以提供一篇這次小實(shí)驗(yàn)經(jīng)過(guò)寫(xiě)得簡(jiǎn)單的作文,讓學(xué)生去交流如何把經(jīng)過(guò)寫(xiě)具體,教師因勢(shì)利導(dǎo)歸納方法,做到“不憤不啟,不悱不發(fā)”,接下來(lái)結(jié)合本次作文展開(kāi)具體訓(xùn)練?!?/p>

        表1 焊接方式編碼

        經(jīng)過(guò)對(duì)環(huán)焊縫開(kāi)挖樣本數(shù)據(jù)分析,發(fā)現(xiàn)開(kāi)挖結(jié)果為不合格的焊口為少數(shù),也即正樣本數(shù)量較少,正負(fù)比例相差較大,分類不平衡。為保證模型的準(zhǔn)確性,提高對(duì)少數(shù)樣本的分類性能,本文采用過(guò)采樣的方式對(duì)數(shù)據(jù)進(jìn)行處理。

        2.3 模型構(gòu)建

        本文依據(jù)環(huán)焊縫影響因素與數(shù)據(jù)特征,通過(guò)卡方檢驗(yàn)方法,計(jì)算主要數(shù)據(jù)特征與結(jié)果的相關(guān)性,見(jiàn)表2。

        由表2可知,施工月份所占權(quán)重較高,這是由于現(xiàn)場(chǎng)施工情況復(fù)雜,在以前的施工條件下,不能穩(wěn)定地保持焊接的溫度、濕度等指標(biāo),因此容易產(chǎn)生焊接缺陷。射線底片復(fù)評(píng)等級(jí)同樣有較高的權(quán)重,射線檢測(cè)質(zhì)量符合要求則可以較為準(zhǔn)確地反映環(huán)焊縫的缺陷情況,一般Ⅲ、Ⅳ級(jí)的底片,環(huán)焊縫不合格的情況較多。管節(jié)長(zhǎng)度的影響主要是一般存在短節(jié)的地方組裝應(yīng)力較大,焊接效果不太理想,而且后續(xù)由于應(yīng)力的持續(xù)作用,會(huì)使缺陷擴(kuò)展。為保障模型的準(zhǔn)確性,因此選用以上主要影響因素進(jìn)行分析。

        為構(gòu)建環(huán)焊縫合格性預(yù)測(cè)模型,將樣本數(shù)據(jù)隨機(jī)分為兩組:70%用于訓(xùn)練模型和30%用于驗(yàn)證模型精度。在構(gòu)建模型中,選取主要的隨機(jī)森林參數(shù)有:決策樹(shù)的數(shù)目、樹(shù)的最大深度以及節(jié)點(diǎn)變量數(shù)。為優(yōu)化模型參數(shù),通過(guò)網(wǎng)格搜索法設(shè)置一定的閾值與步長(zhǎng),遍歷所有組合情況根據(jù)模型精度尋找最佳參數(shù)。最后得到的最優(yōu)參數(shù)為:決策樹(shù)的數(shù)目300、樹(shù)的最大深度10、節(jié)點(diǎn)變量數(shù)2。模型構(gòu)建過(guò)程如圖1所示。

        圖1 模型構(gòu)建過(guò)程

        2.4 模型驗(yàn)證與比較

        為保證模型的實(shí)用性,需要對(duì)模型的泛化能力進(jìn)行判斷,針對(duì)分類模型通常采用ROC-AUC作為評(píng)價(jià)指標(biāo)。ROC曲線全稱為受試者工作特征曲線(receiver operating characteristic curve),是根據(jù)一系列不同的二分類方式(分界值或決定閾值),以真陽(yáng)性率(敏感性)為縱坐標(biāo),假陽(yáng)性率(1-特異性)為橫坐標(biāo)繪制的曲線。AUC(Area Under Curve)被定義為ROC曲線下的面積。

        因?yàn)楸疚闹饕芯凯h(huán)焊縫是否合格,為二分類問(wèn)題,因此測(cè)試集中對(duì)模型進(jìn)行內(nèi)部驗(yàn)證,得到隨機(jī)森林、決策樹(shù)的AUC,如圖2所示。隨機(jī)森林的AUC值為0.99,模型泛化能力較好。

        為了對(duì)模型的性能進(jìn)行驗(yàn)證,開(kāi)展了不同機(jī)器學(xué)習(xí)模型預(yù)測(cè)性能比較,將最近鄰模型、支持向量機(jī)、決策樹(shù)、樸素貝葉斯、隨機(jī)森林模型在測(cè)試集中進(jìn)行內(nèi)部驗(yàn)證,結(jié)果見(jiàn)表3。

        表3 不同模型比較

        2.5 模型預(yù)測(cè)

        本文選擇某管道特定環(huán)焊縫缺陷開(kāi)展了預(yù)測(cè),選取的參數(shù)見(jiàn)表4。

        表4 某環(huán)焊縫預(yù)測(cè)特征

        前文建立的預(yù)測(cè)模型為二分類模型,當(dāng)預(yù)測(cè)結(jié)果大于50%時(shí)認(rèn)為環(huán)焊縫質(zhì)量為不合格,當(dāng)預(yù)測(cè)結(jié)果小于50%時(shí)認(rèn)為環(huán)焊縫質(zhì)量為合格?;谒⒌哪P?以某條管道的某個(gè)環(huán)焊縫為例,采集該環(huán)焊縫相關(guān)的數(shù)據(jù),錄入模型所需參數(shù),通過(guò)模型計(jì)算,預(yù)測(cè)結(jié)果為68%,因此認(rèn)為該環(huán)焊縫質(zhì)量為不合格,經(jīng)現(xiàn)場(chǎng)實(shí)際開(kāi)挖驗(yàn)證,該環(huán)焊縫射線檢測(cè)為Ⅳ級(jí),結(jié)果為不合格,與模型的預(yù)測(cè)結(jié)果一致,該環(huán)焊縫為質(zhì)量不合格焊口,需進(jìn)行修復(fù)。由模型分析結(jié)果及統(tǒng)計(jì)數(shù)據(jù)可知,其中施工月份、焊口類型、管道壁厚、施工單位、缺陷時(shí)鐘方位會(huì)對(duì)環(huán)焊縫的不合格有較為顯著的影響,后續(xù)進(jìn)一步完善管道應(yīng)力及開(kāi)挖數(shù)據(jù),通過(guò)數(shù)據(jù)治理可以進(jìn)一步提高預(yù)測(cè)準(zhǔn)確率。將模型與環(huán)焊縫相關(guān)信息平臺(tái)集成,可以實(shí)現(xiàn)對(duì)單道或者多道環(huán)焊縫缺陷不合格性的預(yù)測(cè)。

        3 結(jié)束語(yǔ)

        本文通過(guò)對(duì)實(shí)際長(zhǎng)輸油氣管道環(huán)焊縫開(kāi)挖數(shù)據(jù)進(jìn)行處理、分析,運(yùn)用隨機(jī)森林模型對(duì)環(huán)焊縫缺陷影響因素進(jìn)行了重要性分析,并開(kāi)展了預(yù)測(cè)研究,在實(shí)際的開(kāi)挖工作中進(jìn)行了相關(guān)驗(yàn)證。主要得出以下結(jié)論。

        1)由于人為原因或認(rèn)知不全面,會(huì)導(dǎo)致數(shù)據(jù)采集結(jié)果的多樣性,需要結(jié)合專業(yè)知識(shí)進(jìn)行數(shù)據(jù)預(yù)處理。因?yàn)橛绊懎h(huán)焊縫缺陷的因素眾多,且有部分關(guān)鍵影響因素不易收集,模型可能存在一定的誤差,需要持續(xù)優(yōu)化。

        2)通過(guò)對(duì)環(huán)焊縫影響因素進(jìn)行建模分析,可以得出隨機(jī)森林算法預(yù)測(cè)準(zhǔn)確率較高,具有良好的適用性。針對(duì)特定環(huán)焊縫缺陷的預(yù)測(cè)及開(kāi)挖驗(yàn)證,可以進(jìn)一步驗(yàn)證模型,并為后續(xù)模型優(yōu)化提供參考。

        總之,大量的環(huán)焊縫開(kāi)挖數(shù)據(jù)是一筆寶貴的數(shù)據(jù)資產(chǎn),通過(guò)業(yè)務(wù)知識(shí)、經(jīng)驗(yàn)與數(shù)學(xué)方法的結(jié)合可以分析出用于指導(dǎo)實(shí)際工作的規(guī)律。在后續(xù)的工作中,需要科研與業(yè)務(wù)人員進(jìn)一步分析環(huán)焊縫的機(jī)理模型,進(jìn)一步完善影響因素,同時(shí)各管道企業(yè)應(yīng)提高數(shù)據(jù)自動(dòng)化采集的水平,避免關(guān)鍵數(shù)據(jù)缺失,為相關(guān)研究奠定基礎(chǔ),為智慧管網(wǎng)的建設(shè)提供支撐。

        猜你喜歡
        決策樹(shù)合格焊縫
        基于焊縫余高對(duì)超聲波探傷的影響分析
        TP347制氫轉(zhuǎn)油線焊縫裂紋返修
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
        決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        我是合格的小會(huì)計(jì)
        機(jī)器人在輪輞焊縫打磨工藝中的應(yīng)用
        誰(shuí)不合格?
        基于決策樹(shù)的出租車乘客出行目的識(shí)別
        做合格黨員
        大江南北(2016年8期)2016-02-27 08:22:46
        光譜分析在檢驗(yàn)焊縫缺陷中的應(yīng)用
        人妻熟妇乱系列| 少妇粉嫩小泬喷水视频| 草草浮力地址线路①屁屁影院| 亚洲午夜精品久久久久久一区| 久久婷婷免费综合色啪| 久久国产精品一区av瑜伽| 天天摸夜夜摸摸到高潮| 国产成人www免费人成看片| 国产精品女同久久免费观看| 久久精品国产亚洲av日韩一| 色88久久久久高潮综合影院| 2019最新国产不卡a| 久久精品中文字幕久久| 亚洲综合久久精品少妇av| 99无码精品二区在线视频| 疯狂做受xxxx高潮欧美日本| 国产九九在线观看播放| 日本免费大片一区二区三区| 久久午夜羞羞影院免费观看 | 少妇人妻偷人精品无码视频| 日韩精品首页在线观看| 亚洲黄色一级在线观看| 丰满爆乳在线播放| 国产精品一区二区韩国AV| 国产一区二区三区在线观看免费版| 亚洲av无码专区国产乱码4se| 国产白丝无码视频在线观看 | 黄色三级一区二区三区| 中文字幕亚洲精品一区二区三区| 少妇无码一区二区三区免费| 在线观看av国产自拍| 色视频不卡一区二区三区| 亚洲人成人无码www影院| 免费网站国产| 人妻中出中文字幕在线| 国产免费观看黄av片| 国产嫖妓一区二区三区无码| 中文字幕日本熟妇少妇| 亚洲男人av天堂久久资源| 国产麻豆md传媒视频| 99re6久精品国产首页|