王 勛, 喬 佳, 于燕平, 袁理想, 孫俊芳
(北京市燃?xì)饧瘓F(tuán)研究院,北京100011)
城市燃?xì)馄髽I(yè)每年需投入資金對(duì)老化程度較高或發(fā)生事故頻率較高的隱患管道進(jìn)行技術(shù)改造。僅憑借管道服役年限及泄漏次數(shù)等因素判定是否需要改造不夠科學(xué),有部分管道開挖后發(fā)現(xiàn)并沒有達(dá)到需要改造的程度,造成人力物力浪費(fèi),還可能使需進(jìn)行改造的管道沒有優(yōu)先改造,留下安全隱患。因此有效評(píng)估燃?xì)夤艿朗褂脿顟B(tài)非常重要。
在天然氣管道完整性管理過程中,對(duì)管道壽命預(yù)測(cè)及泄漏風(fēng)險(xiǎn)評(píng)估是兩個(gè)重要研究?jī)?nèi)容。李增杰等人[1]提出基于BP神經(jīng)網(wǎng)絡(luò)模型的統(tǒng)計(jì)模型對(duì)城市燃?xì)夤艿肋M(jìn)行剩余壽命預(yù)測(cè),用差值模型修正BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值;薛吉明等人[2]針對(duì)運(yùn)行多年的輸氣管道出現(xiàn)防腐層龜裂、破損和剝離以及管道承壓能力下降的狀況,提出以多種檢測(cè)方法為基礎(chǔ),采用相關(guān)理論和標(biāo)準(zhǔn)解決管道防腐層問題及對(duì)管道剩余壽命進(jìn)行評(píng)估;羅富緒[3]論述了管道剩余使用壽命預(yù)測(cè)和評(píng)估的必要性,介紹國(guó)外對(duì)管道剩余使用壽命的預(yù)測(cè)方法和評(píng)估理論,提出應(yīng)該把對(duì)管道剩余使用壽命的預(yù)測(cè)工作作為管道運(yùn)行和技術(shù)維護(hù)管理系統(tǒng)的組成部分;龐洪晨等人[4]采用Modified B31G和Kastner評(píng)價(jià)方法計(jì)算了管道剩余強(qiáng)度,并進(jìn)行了剩余壽命預(yù)測(cè);朱晏萱[5]對(duì)Muhlbauer風(fēng)險(xiǎn)評(píng)價(jià)法在天然氣埋地管道的評(píng)分應(yīng)用進(jìn)行了探討;袁雄軍等人[6]提出一種基于模糊邏輯系統(tǒng)的管道風(fēng)險(xiǎn)評(píng)估方法。以上研究均基于管道失效的相關(guān)因素,或賦予權(quán)重[7],或采用專家評(píng)分[8]方式得到評(píng)價(jià)結(jié)果,屬于非監(jiān)督學(xué)習(xí)建模過程。本文針對(duì)某企業(yè)燃?xì)夤艿?,以相關(guān)標(biāo)準(zhǔn)為指導(dǎo),量化燃?xì)夤艿老嚓P(guān)參數(shù),結(jié)合運(yùn)營(yíng)巡檢數(shù)據(jù)及歷史開挖管道技改等級(jí)實(shí)際評(píng)估結(jié)果,提出一種決策樹分類監(jiān)督學(xué)習(xí)模型,有效評(píng)估燃?xì)夤艿朗褂脿顟B(tài),解決燃?xì)夤艿兰几拇笮拶Y金重點(diǎn)使用問題。
在城市燃?xì)夤艿肋\(yùn)營(yíng)巡檢搶修過程中,會(huì)記錄大量燃?xì)夤艿罃?shù)據(jù),如漏氣點(diǎn)數(shù)量(自投運(yùn)以來每年的漏氣點(diǎn)數(shù)量之和)、漏氣點(diǎn)間距(位于管道最兩端漏氣點(diǎn)的距離,單位為m)、投運(yùn)時(shí)間(以年計(jì))、管徑、運(yùn)行壓力、長(zhǎng)度(單位為km)、漏氣點(diǎn)密度(漏氣點(diǎn)數(shù)量與管道長(zhǎng)度之比)、防腐層漏點(diǎn)數(shù)量、防腐層缺陷級(jí)別,其中防腐層缺陷級(jí)別來源于檢測(cè)結(jié)果,其余特征參數(shù)來源于巡檢數(shù)據(jù)。當(dāng)只有1個(gè)漏氣點(diǎn)時(shí),漏氣點(diǎn)間距為0。將這9個(gè)特征參數(shù)或其量化值作為模型的輸入變量。對(duì)管徑、運(yùn)行壓力、防腐層缺陷級(jí)別進(jìn)行量化。管徑量化:如果管道是單一管徑,公稱直徑為a(單位為mm),則量化值為DNa;如果管道非單一管徑,則量化為“多種管徑”4個(gè)字。運(yùn)行壓力量化:如果管道是單一運(yùn)行壓力,則根據(jù)壓力量化為以下文字:高壓A、高壓B、次高壓A、次高壓B、中壓、低壓;如果管道非單一運(yùn)行壓力,則量化為“多種壓力”4個(gè)字。防腐層缺陷級(jí)別量化:參照CJJ 95—2013《城鎮(zhèn)燃?xì)饴竦劁撡|(zhì)管道腐蝕控制技術(shù)規(guī)程》表4.3.1進(jìn)行,將防腐層缺陷級(jí)別量化為輕、中、重級(jí)別。
根據(jù)以往管道開挖后的實(shí)際評(píng)估和改造情況,將管道隱患評(píng)估等級(jí)分為立即整體改造、暫緩整體改造、局部換管、局部修補(bǔ)、加強(qiáng)運(yùn)行和情況尚可6個(gè)等級(jí),這6個(gè)等級(jí)作為模型的輸出變量。對(duì)特征參數(shù)不全的管道信息予以剔除后,共收集到該企業(yè)歷年技改大修中250條燃?xì)夤艿赖奶卣鲄?shù)和隱患評(píng)估等級(jí),部分管道的特征參數(shù)和隱患評(píng)估等級(jí)見表1。
表1 部分管道的特征參數(shù)和隱患評(píng)估等級(jí)
決策樹[9]分類技術(shù)在眾多分類技術(shù)中占有重要地位,屬于統(tǒng)計(jì)學(xué)分類范疇,是一種非規(guī)則的分類方法。決策樹分類技術(shù)通過對(duì)已分類的樣本集進(jìn)行訓(xùn)練,學(xué)習(xí)歸納出分類函數(shù),從而確定分類器。利用訓(xùn)練得到的分類器實(shí)現(xiàn)對(duì)未分類數(shù)據(jù)的分類。通過對(duì)比分析不同的分類算法,發(fā)現(xiàn)決策樹分類算法的應(yīng)用效果比神經(jīng)網(wǎng)絡(luò)分類算法和判定樹分類算法好,特別是待分類數(shù)據(jù)量非常大時(shí),決策樹分類算法較其他分類算法準(zhǔn)確率高。
決策樹分類技術(shù)的原理是相似的輸入特征得到相似的輸出結(jié)果,決策樹分類用于燃?xì)夤艿离[患評(píng)估等級(jí)分類,可以理解為在類似的管材及外部環(huán)境條件下,管道運(yùn)營(yíng)狀態(tài)類似,則管道隱患評(píng)估等級(jí)相同。即已知某些條件、狀態(tài)下管道的隱患評(píng)估等級(jí),對(duì)某管道進(jìn)行隱患評(píng)估等級(jí)評(píng)定時(shí),根據(jù)管道特征參數(shù)通過模型找到與它最相似的一類已知隱患評(píng)估等級(jí)的管道,便可知道被評(píng)定管道的隱患評(píng)估等級(jí)。
該企業(yè)完成了對(duì)歷史技改管道特征參數(shù)及隱患評(píng)估等級(jí)實(shí)際評(píng)判結(jié)果等數(shù)據(jù)的積累,為建立模型奠定了數(shù)據(jù)基礎(chǔ)。
建模采用Python語言編程,實(shí)現(xiàn)平臺(tái)采用anaconda notebook,建模步驟如下。
① 輸入上述輸入變量和輸出變量,其中輸出變量為管道開挖后根據(jù)管道實(shí)際情況及企業(yè)業(yè)務(wù)需求對(duì)管道隱患的綜合評(píng)估結(jié)果。數(shù)據(jù)整理為csv文件,并讀入。
② 引入sklearn包中的tree模塊。
③ 每條管道對(duì)應(yīng)的9個(gè)特征參數(shù)和隱患評(píng)估等級(jí)作為1個(gè)樣本,共250個(gè)樣本。將250個(gè)樣本按照7∶3分為訓(xùn)練集和測(cè)試集,訓(xùn)練集和測(cè)試集分別有175和75個(gè)樣本。采用訓(xùn)練集訓(xùn)練模型,采用測(cè)試集評(píng)判模型效果。
④ 調(diào)用tree模塊中的DecisionTreeClassifier對(duì)象建立決策樹模型,主要參數(shù)設(shè)置見表2。
表2 主要參數(shù)設(shè)置
⑤ 模型評(píng)價(jià)。將測(cè)試集中的輸入變量輸入模型,得到輸出變量,與測(cè)試集中的輸出變量對(duì)比。評(píng)估正確的樣本數(shù)除以參與評(píng)估的總樣本數(shù)得到模型評(píng)價(jià)準(zhǔn)確率(簡(jiǎn)稱score得分)。某企業(yè)燃?xì)夤艿赖臎Q策樹模型score得分為0.8,說明模型效果較好。
⑥ ①~⑤步為單棵決策樹的步驟。為進(jìn)一步提高準(zhǔn)確率,本文通過集成算法優(yōu)化,采用隨機(jī)森林[10]算法。隨機(jī)森林是通過集成學(xué)習(xí)思想將多棵樹集成的一種算法,它的基本單元是決策樹。將250個(gè)樣本按照7∶3的比例隨機(jī)產(chǎn)生訓(xùn)練集和測(cè)試集N次,會(huì)得到N棵決策樹,每棵決策樹都是一個(gè)分類器。對(duì)于每1條管道,會(huì)得到N個(gè)管道隱患評(píng)估等級(jí)。本文N取100。隨機(jī)森林集成了所有決策樹的隱患評(píng)估等級(jí),將最多的隱患評(píng)估等級(jí)判定為最終隱患評(píng)估等級(jí)。將250個(gè)樣本隨機(jī)抽取30%構(gòu)成隨機(jī)森林模型的測(cè)試集,對(duì)隨機(jī)森林模型進(jìn)行測(cè)試,效果良好。隨機(jī)森林的score得分提高到0.9,模型效果較好。
將管道的漏氣點(diǎn)數(shù)量(自投運(yùn)以來每年的漏氣點(diǎn)數(shù)量之和)、漏氣點(diǎn)間距(位于管道最兩端漏氣點(diǎn)的距離)、投運(yùn)時(shí)間(以年計(jì))、管徑、運(yùn)行壓力、長(zhǎng)度、漏氣點(diǎn)密度(漏氣點(diǎn)數(shù)量與管道長(zhǎng)度之比)、防腐層漏點(diǎn)數(shù)量、防腐層缺陷級(jí)別9個(gè)特征參數(shù)或其量化值作為輸入變量,將立即整體改造、暫緩整體改造、局部換管、局部修補(bǔ)、加強(qiáng)運(yùn)行和情況尚可6個(gè)管道隱患評(píng)估等級(jí)作為輸出變量,建立決策樹、隨機(jī)森林分類監(jiān)督學(xué)習(xí)模型。該模型在某企業(yè)進(jìn)行應(yīng)用,效果良好。