亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于CART算法的煤與瓦斯突出判別分析

        2015-06-27 05:55:23劉年平胡慧慧
        中國礦業(yè) 2015年6期
        關(guān)鍵詞:剪枝決策樹數(shù)據(jù)挖掘

        劉年平,胡慧慧

        (1.西南科技大學(xué)環(huán)境與資源學(xué)院,四川 綿陽 621010;2.西南科技大學(xué)固體廢物處理與資源化教育部重點實驗室,四川 綿陽 621010)

        基于CART算法的煤與瓦斯突出判別分析

        劉年平1,2,胡慧慧1

        (1.西南科技大學(xué)環(huán)境與資源學(xué)院,四川 綿陽 621010;2.西南科技大學(xué)固體廢物處理與資源化教育部重點實驗室,四川 綿陽 621010)

        基于分類回歸決策樹(CART)算法,考慮影響煤與瓦斯突出的主要因素,建立了煤與瓦斯突出判別的CART模型。模型選擇瓦斯壓力、瓦斯放散初速度、煤的破壞類型、堅固性系數(shù)和垂深作為煤與瓦斯突出的判別指標體系,選取國內(nèi)典型煤與瓦斯突出礦井的突出數(shù)據(jù)建立模型樣本訓(xùn)練庫,利用k-折交叉驗證方法尋找最優(yōu)樹,并提取優(yōu)化后的突出規(guī)則,最后將提取的規(guī)則對實例進行驗證。研究表明,該模型簡單有效,可以作為煤與瓦斯突出判別分析的一種輔助方法。

        煤與瓦斯突出;決策樹;CART算法;判別分析

        煤與瓦斯突出是一種復(fù)雜的動力學(xué)現(xiàn)象,嚴重影響著礦工的生命安全和礦井的生產(chǎn),目前還無法準確的分析其發(fā)生機理。針對這類具有機理復(fù)雜、非線性顯著等特點的礦井災(zāi)害判別問題,一般無法建立準確的數(shù)學(xué)模型予以分析,因而研究該類危險性判別方法一直是礦井災(zāi)害預(yù)測的重要方向。數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的各種數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程[1]。鑒于煤與瓦斯突出的非線性特點和數(shù)據(jù)挖掘技術(shù)的優(yōu)點,利用數(shù)據(jù)挖掘方法研究突出規(guī)律進而進行突出危險性判別成為一種較為可行的方法,目前研究較多的煤與瓦斯突出數(shù)據(jù)挖掘方法有神經(jīng)網(wǎng)絡(luò)方法[2]、支持向量機方法[3-4]、灰色系統(tǒng)方法[5]、模糊模式識別方法[6]、免疫遺傳算法[7]、時間序列方法[8]、可拓方法[9-10]、多元判別法[11]等,這些數(shù)據(jù)挖掘方法的應(yīng)用為煤與瓦斯突出判別提供了較好的模型。決策樹學(xué)習(xí)是以客觀數(shù)據(jù)為基礎(chǔ)的歸納算法,它采用自頂向下的遞歸方法,能從一組無次序、無規(guī)則的大量數(shù)據(jù)中獲得內(nèi)含的知識分類規(guī)則,不僅能用類似樹層的模式形象的表示出所獲得的知識,還可以用多個IF-THEN規(guī)則的形式表示,具有較高的可讀性。有學(xué)者對決策樹與神經(jīng)網(wǎng)絡(luò)做了分類對比,結(jié)果發(fā)現(xiàn)決策樹具有更高的分類準確率[12]。另外,決策樹能處理各種類型的數(shù)據(jù),尤其擅長處理非數(shù)值型數(shù)據(jù)。決策樹方法在在數(shù)據(jù)挖掘中具有較好的準確性,已在醫(yī)療、氣象、投資風(fēng)險等領(lǐng)域有了廣泛的應(yīng)用,但煤礦災(zāi)害的判別方面研究較少,本文將決策樹方法引入到煤與瓦斯突出的判別中,利用分類回歸決策樹(Classification And Regression Tree,CART)進行煤與瓦斯突出的危險性判別。

        1 CART決策樹的工作原理

        CART決策樹是由Breiman等人提出的一種典型二叉決策樹,現(xiàn)已在統(tǒng)計分析中得到了廣泛的應(yīng)用[13]。與其他決策樹相比,CART可以同時處理連續(xù)變量和分類變量,當(dāng)目標變量是連續(xù)變量,CART生成回歸決策樹,當(dāng)目標變量是分類變量時,CART就會生成分類決策樹。另外,CART能有效的處理數(shù)據(jù)樣本的非線性問題,不需要對數(shù)據(jù)樣本作特定假設(shè),因此非常適用于解決機理不明確的復(fù)雜性問題。CART生成回歸決策樹要經(jīng)過建樹和剪枝兩個主要步驟。

        1.1 CART的建樹

        決策樹算法的核心是選取每個結(jié)點上要測試的屬性,依據(jù)不同的屬性劃分度量方法進行數(shù)據(jù)純度的劃分,屬性的度量方法有多種,如信息增益、信息增益比、基尼指數(shù)、χ2統(tǒng)計、G統(tǒng)計、證據(jù)權(quán)重、最小描述長度、相關(guān)度等方法。分類回歸樹(CART)以Gini(基尼)指數(shù)作為屬性度量方法, Gini系數(shù)定義如式(1)所示。

        (1)

        式中:p(i|t)為測試變量t屬于類i的樣本的概率;c為樣本的個數(shù)。當(dāng)Gini=0時,所有的樣例屬于一類。在CART的二元劃分中,如果屬性滿足一定純度則劃分在左子樹,否則劃分到右子樹。假設(shè)訓(xùn)練數(shù)據(jù)集C中的屬性A將C劃分為C1與C2,則給定劃分C的Gini系數(shù)為式(2)。

        (2)

        為了確定劃分效果,可以用增益Δ來確定劃分效果的標準,增益為父結(jié)點不純度與子結(jié)點不純度的差。增益定義為式(3)。

        (3)

        式中:I()是給定結(jié)點的Gini系數(shù);N是父結(jié)點上的記錄總數(shù);k是屬性值的個數(shù);N(vj)是與子女結(jié)點相關(guān)聯(lián)的記錄個數(shù)。

        CART算法在滿足下述條件之一時停止建樹。①所有葉節(jié)點的樣本數(shù)為1、樣本數(shù)小于某個給定的最小值或者樣本都屬于同一類的時候;②決策樹的高度達到用戶設(shè)置的閾值,或者分支后的葉節(jié)點中的樣本屬性都屬于同一個類的時候;③當(dāng)訓(xùn)練數(shù)據(jù)集中不再有屬性向量作為分支選擇的時候。

        1.2 CART的剪枝

        決策樹初步建立后,為了提高決策樹的準確率和簡潔度,需要考慮對樹進行剪枝,通過剪枝減少決策樹的規(guī)模,消除由于噪聲或缺乏代表性樣本而導(dǎo)致的過分擬合現(xiàn)象。在決策樹的剪枝研究中,目前常用的剪枝方法有四種:悲觀錯誤剪枝PEP(Pessimistic Error Pruning)方法、最小錯誤剪枝MEP(Minimum Error Pruning) 方法、代價-復(fù)雜度剪枝CCP(Cost-Complexity Pruning)方法和基于錯誤剪枝EBP(Error-Based Pruning) 方法。CART采用的是CCP方法,這種方法包括兩個過程:自底向上,對原始決策樹中的每一次修剪得到一棵樹,從而得到一系列的樹,包括原始樹和只有一個結(jié)點的樹;評價這些樹,根據(jù)真實誤差率來選擇一個最優(yōu)秀的樹作為最后被剪枝的樹[13]。決策樹建立并剪枝完成后,最后需要采用某種方法對所建立的一系列子樹進行評估尋找最優(yōu)樹。本文建模采用k-折交叉驗證尋找最優(yōu)樹,當(dāng)樣本數(shù)量較少時,該方法可以有效的利用所有可能的數(shù)據(jù)進行建模與驗證,同時剔除了由于數(shù)據(jù)自身特性帶來的過度適應(yīng),具有較高的準確性。

        1.3 CART的構(gòu)建步驟

        依據(jù)上面的分析,設(shè)訓(xùn)練樣本集L={X1,X2,…,Xn,Y},其中,Xi(i=1,2,…,n)稱為屬性向量,Y為類別。

        1)在根節(jié)點T處,搜索數(shù)據(jù)空間,利用Gini系數(shù)找到使得下一代子節(jié)點中數(shù)據(jù)集的非純度下降最大的最優(yōu)分裂變量和相應(yīng)的分裂閥值。

        2)用1)中的分裂變量和分裂閥值把根節(jié)點分成T1和T2。

        3)如果在某個節(jié)點Ti處滿足上述停止建樹條件,則該節(jié)點為葉節(jié)點,否則轉(zhuǎn)為1)繼續(xù)建樹。

        4)利用代價-復(fù)雜度剪枝方法對樹剪枝,并尋找最優(yōu)二叉樹。

        2 應(yīng)用實例

        針對煤與瓦斯突出的特點,參照相關(guān)文獻研究,選取瓦斯壓力、瓦斯放散初速度、煤的破壞類型、堅固性系數(shù)和垂深作為煤與瓦斯突出的判別指標,選取國內(nèi)21個典型突出礦井的煤與瓦斯突出數(shù)據(jù)建立指標集[14],將突出類型分為突出與不突出兩部分,利用CART對煤與瓦斯突出的數(shù)據(jù)樣本進行知識規(guī)則的提取,為了在增加有限樣本的數(shù)據(jù)集,采用交叉驗證法對樣本數(shù)據(jù)進行劃分,建好決策樹后,利用提取的規(guī)則對未參加訓(xùn)練的其他5個典型樣本進行分析以驗證該模型的有效性,樣本數(shù)據(jù)見表1。

        利用MatLab軟件,對CART算法編程構(gòu)建煤與瓦斯突出數(shù)據(jù)決策樹,利用訓(xùn)練樣本所得到的決策樹見圖1。

        表1 煤與瓦斯突出訓(xùn)練樣本及測試樣本數(shù)據(jù)

        圖1 基于CART算法的煤與瓦斯突出決策樹

        從CART決策樹模型中提取的規(guī)則如下所示。

        規(guī)則1:IfΔP≤5.50 andP≤2.15 Then 不突出。

        規(guī)則2:IfΔP>5.50 andD≤2.00 andP≤2.20 Then 不突出。

        規(guī)則3:IfΔP≤5.50 andP>2.15 Then 突出。

        規(guī)則4:IfΔP>5.50 andD>2.00 Then 突出。

        規(guī)則5:IfΔP>5.50 andD≤2.00 andP>2.20 Then 突出。

        《煤礦安全規(guī)程》中規(guī)定了煤與瓦斯突出單項指標的參考臨界值,預(yù)測煤層突出危險性的單項指標可用煤的破壞類型、瓦斯放散初速度、煤的堅固性系數(shù)和煤層瓦斯壓力等,采用該法預(yù)測時,各種指標的突出危險臨界值應(yīng)根據(jù)礦區(qū)實測資料確定,無實測資料時可參考表2,只有當(dāng)全部指標達到或超過其臨界值時才可視該煤層為突出危險煤層。

        選取其他典型礦區(qū)的煤與瓦斯突出指標數(shù)據(jù),利用所建立的決策樹模型和單項指標對樣本進行判別,判別結(jié)果如表3所示。

        表2 預(yù)測煤與瓦斯突出危險性的單項指標

        表3 決策樹與單項指標預(yù)測結(jié)果

        由決策規(guī)則與預(yù)測結(jié)果可以看出,利用決策樹可以從具有代表性的樣本中提取合理的規(guī)則,決策樹模型的判別結(jié)果較為準確,由于這類樣本數(shù)據(jù)能真實的反應(yīng)突出指標的各種非線性相互作用,該方法能有效的避免專家的知識局限性和判別指標閥值規(guī)則制定的主觀性,具有很強的實際應(yīng)用價值。

        3 結(jié)論

        煤與瓦斯突出危險性判別是煤礦災(zāi)害防治的核心問題之一,針對突出機理的復(fù)雜性,利用分類回歸樹算法,通過MatLab開發(fā)了相應(yīng)程序,以典型煤與瓦斯突出數(shù)據(jù)作為訓(xùn)練樣本建立了決策樹模型。將建立的模型應(yīng)用在未知判別結(jié)果的工程實例中進行驗證后發(fā)現(xiàn),決策樹模型具有較高的精度,同時還能獲取簡單的突出規(guī)則,為快速準確判別突出提供了一種輔助方法。由于分類回歸樹的準確性受到樣本個數(shù)及訓(xùn)練樣本數(shù)據(jù)庫的制約,而支持向量機對小樣本的預(yù)測能量較強,因此在后續(xù)的研究中,將重點研究利用隨機森林的思想把決策樹與支持向量機等數(shù)據(jù)挖掘方法融合起來進一步提高模型的實用性。

        [1] 馬國兵,薛安克.數(shù)據(jù)挖掘技術(shù)在運動目標軌跡預(yù)測中的應(yīng)用[J].計算機工程與應(yīng)用,2004 (11):210-211.

        [2] 楊敏,李瑞霞,汪云甲.煤與瓦斯突出的粗神經(jīng)網(wǎng)絡(luò)預(yù)測模型研究[J].計算機工程與應(yīng)用,2010,46(6):241-244.

        [3] 邵劍生,薛惠鋒.基于PSO-SVM的煤與瓦斯突出強度預(yù)測模型[J].西華大學(xué)學(xué)報:自然科學(xué)版,2012,31(1):63-66.

        [4] 孫玉峰,李中才.支持向量機法在煤與瓦斯突出分析中的應(yīng)用研究[J].中國安全科學(xué)學(xué)報,2010,20(1):25-30.

        [5] 張大偉,郭立穩(wěn),杜通.灰色系統(tǒng)理論在煤與瓦斯預(yù)測中的應(yīng)用[J].河北理工大學(xué)學(xué)報:自然科學(xué)版,2009,31(2):1-5.

        [6] 張子戌,劉高峰,呂潤生,等.基于模糊模式識別的煤與瓦斯突出區(qū)域預(yù)測[J].煤炭學(xué)報,2007,32(6):592-595.

        [7] 朱玉, 張虹,蘇成.基于免疫遺傳算法的煤與瓦斯突出預(yù)測研究[J].中國礦業(yè)大學(xué)學(xué)報,2009,38(1):125-130.

        [8] 鄧明,張國樞,陳清華.基于瓦斯涌出時間序列的煤與瓦斯突出預(yù)報[J].煤炭學(xué)報,2010,35(2): 260-263.

        [9] 楊玉中,吳立云,高永才.煤與瓦斯突出危險性評價的可拓方法[J].煤炭學(xué)報,2010,35(S1):100-104.

        [10] 郭德勇,鄭茂杰,郭超,等.煤與瓦斯突出預(yù)測可拓聚類方法及應(yīng)用[J].煤炭學(xué)報, 2009,34(6):783-787.

        [11] 王超,宋大釗,杜學(xué)勝,等.煤與瓦斯突出預(yù)測的距離判別分析法及應(yīng)用[J].采礦與安全工程學(xué)報,2009,26(4):470-474.

        [12] Muhammad A.Razi,Kuriakose Athappilly.A comparative predictive analysis of neural networks,nonlinear regression and classification and regression tree models [J].Expert Systems with Appocatons,2005,(29):65-74.

        [13] Breiman L,F(xiàn)riendman J,Olshen R.Classification and regression trees[M].Califomia:Wadsworth Belement,1984.

        [14] 肖紅飛,何學(xué)秋,劉黎明.改進BP算法在煤與瓦斯突出預(yù)測中的應(yīng)用[J].中國安全科學(xué)學(xué)報,2003,13(9):59-62.

        Discriminate analysis of coal and gas outburst based on CART algorithm

        LIU Nian-ping1,2,HU Hui-hui1

        (1.School of Environment and Resources,Southwest University of Science and Technology,Mianyang 621010,China;2.Ministry of Education Key Laboraory of Solid Waste Treatment and Resource Recycle,Southwest University of Science and Technology,Mianyang 621010,China)

        Based on the algorithm of classification and regression tree (CART (Classification And Regression Tree)),a discriminate model of coal and gas outburst was established according to main factors,which are gas pressure,gas initial velocity,destructive type of coal,hard coefficient and depth.Select data of discriminating indexes from typical mines with coal and gas outburst as training data,and find the champion tree by the method of k - fold cross-validated,then extract the optimized rules,at lased,the rules is used to discriminate the coal and gas outburst in the instance.The results show that CART model is a simple and effective method,it can be used in discriminate analysis of coal and gas outburst as a auxiliary method.

        coal and gas outburst;decision tree ;CART algorithm;discriminate analysis

        2014-08-05

        西南科技大學(xué)博士研究基金項目資助(編號:12zx7118)

        劉年平(1979-),男,講師,博士,主要從事礦山災(zāi)害與防治,災(zāi)害預(yù)警管理、安全管理方面的工作。E-mail:happyfy2@163.com。

        TD713.2

        A

        1004-4051(2015)06-0128-04

        猜你喜歡
        剪枝決策樹數(shù)據(jù)挖掘
        人到晚年宜“剪枝”
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于YOLOv4-Tiny模型剪枝算法
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        剪枝
        天津詩人(2017年2期)2017-03-16 03:09:39
        基于決策樹的出租車乘客出行目的識別
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        日本美女中文字幕第一区| 不卡视频一区二区三区| 精品国产1区2区3区AV| 亚洲av一二三四五区在线| 欧美性高清另类videosex| a级毛片100部免费看| 五月婷婷激情六月| av高清视频在线麻豆免费观看| 精品国产sm最大网站| 国产成人久久精品激情| 日韩亚洲制服丝袜中文字幕| 精品人妻av区二区三区| 99久久无码一区人妻| 欧产日产国产精品精品| 亚洲无码性爱视频在线观看| 日本午夜理论一区二区在线观看| 97人伦影院a级毛片| 无码人妻品一区二区三区精99| yy111111少妇影院| 中文字幕人妻久久久中出| 真实国产精品vr专区| 91spa国产无码| 五月婷婷激情六月开心| 国产精品女主播福利在线| 人妻夜夜爽天天爽一区| 国产在线不卡免费播放| 少妇人妻系列中文在线| 亚洲午夜成人精品无码色欲| 久久天天躁狠狠躁夜夜爽| 亚洲精品一品二品av| 久久综合精品人妻一区二区三区| 欧洲女人性开放免费网站| 高清国产一级毛片国语| 久久精见国产亚洲av高清热| 国产人妻人伦精品1国产| 欧美成人一级视频| 一区二区三区日本在线| 国产av无码专区亚洲版综合| aaaaa级少妇高潮大片免费看| 狠狠亚洲婷婷综合久久久 | 在线无码精品秘 在线观看|