亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        急傾斜煤層頂煤可放性隨機(jī)森林模型分類預(yù)測及應(yīng)用

        2016-11-03 05:53:17陳海波
        關(guān)鍵詞:分類評價模型

        李 偉, 陳海波

        (黑龍江科技大學(xué) 黑龍江省普通高校采礦工程重點(diǎn)實(shí)驗(yàn)室, 哈爾濱 150022)

        ?

        急傾斜煤層頂煤可放性隨機(jī)森林模型分類預(yù)測及應(yīng)用

        李偉,陳海波

        (黑龍江科技大學(xué) 黑龍江省普通高校采礦工程重點(diǎn)實(shí)驗(yàn)室, 哈爾濱 150022)

        為快速、準(zhǔn)確地預(yù)測急傾斜煤層開采中頂煤可放性等級,借鑒隨機(jī)森林理論,以 19 個放頂煤工作面為例,選取九大實(shí)測指標(biāo)作為頂煤可放性識別因子,建立急傾斜煤層頂煤可放性識別的隨機(jī)森林模型。通過五折交叉檢驗(yàn)確定模型最優(yōu)參數(shù),將模型應(yīng)用到五組急傾斜煤層頂煤可放性評估中。研究表明:隨機(jī)森林模型預(yù)測結(jié)果符合工程實(shí)際,且當(dāng)分段數(shù)量為 5 時,其精度最優(yōu),分別為 91.0%和 100.0%。該研究可以在工程中推廣使用。

        急傾斜煤層; 可放性預(yù)測; 隨機(jī)森林; 交叉檢驗(yàn)

        0 引 言

        頂煤可放性識別是急傾斜煤層巷道放頂煤開采技術(shù)的合理應(yīng)用及重要依據(jù),頂煤可放性直接決定巷道放頂煤的開采設(shè)計(jì)與效益[1-3]。為很好地評價頂煤可放性,部分學(xué)者在頂煤可放性機(jī)制和預(yù)測評價等方面進(jìn)行了大量富有成效的研究工作,尤其是將先進(jìn)的計(jì)算理論和方法引入到頂煤可放性評價中來[1, 4-6]。新的研究成果具有各自的優(yōu)點(diǎn),但同時也具有局限性。為此,學(xué)者仍在不斷探索更為科學(xué)有效的評價方法。隨機(jī)森林 (Random forest, RF)[7]由著名統(tǒng)計(jì)學(xué)家Breiman提出,是一種基于決策樹的組合分類機(jī)器學(xué)習(xí)模型,其內(nèi)涵是通過對大量分類樹的匯總進(jìn)而提高其模型的預(yù)測精度,與支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)智能算法相比,隨機(jī)森林預(yù)測精度相對較高,且運(yùn)算量大大降低。隨機(jī)森林模型在經(jīng)濟(jì)學(xué)、醫(yī)學(xué)等領(lǐng)域應(yīng)用,已體現(xiàn)出卓越的性能[8]。在煤炭領(lǐng)域,從急傾斜煤層頂煤可放性的影響因素考慮,利用RF預(yù)測,可準(zhǔn)確反映輸入變量和輸出變量的關(guān)系,適合于受非線性多元因子影響的頂煤可放性預(yù)測。

        1 計(jì)算原理

        1.1RF計(jì)算原理

        RF 算法利用Bagging( Bootstrap aggregating) 抽樣方法從原始數(shù)據(jù)集中抽取若干個數(shù)據(jù),對其使用基尼系數(shù)gini為屬性度量,建立分類回歸決策樹。其原理是通過劃分決策樹各層使初始數(shù)據(jù)集變得相對純凈,在屬性度量上表現(xiàn)為基尼系數(shù)下降[9]。隨機(jī)森林分類器如圖 1所示。

        圖1 隨機(jī)森林分類器

        RF 算法采用多棵決策樹并通過投票數(shù)對目標(biāo)歸屬進(jìn)行預(yù)測,結(jié)合相應(yīng)的預(yù)測精度來進(jìn)行評估,其算法由以下三步實(shí)現(xiàn)[10-11]:

        (1)從初始樣本中抽取ntree個訓(xùn)練子樣本,訓(xùn)練子樣本大小約占初始樣本的2/3。抽取采用bootstrap技術(shù)完成,在有放回的抽取中約有1/3的樣本未被抽取,這部分樣本自然作為對照樣本集。

        (2)分別對訓(xùn)練樣本集建立分類回歸樹,組建ntree棵決策樹的“森林”,從全部M個屬性中隨機(jī)選擇mtry(mtry≤M)個最優(yōu)分段屬性進(jìn)行分支。

        (3) 集合決策樹預(yù)測結(jié)果,以投票方式確定新樣本的正確歸屬,分類決策為

        (1)

        式中:H(x)——組合分類模型;

        hi——單個決策樹分類模型;

        I(·)——示性函數(shù);

        Y——輸出變量。

        在RF訓(xùn)練過程中,每次抽取將有約1/3的袋外數(shù)據(jù)未能被抽中,由此產(chǎn)生了袋裝誤差,袋裝誤差為無偏估計(jì),趨近于交叉檢驗(yàn)誤差[12]。

        1.2RF模型評價指標(biāo)

        對模型精度評價一般采用混淆矩陣方法,其矩陣為M×M(M為分類數(shù)),用于直觀比較分類點(diǎn)和參照點(diǎn)。Kappa統(tǒng)計(jì)量表征被評價分類與完全隨機(jī)分類產(chǎn)生錯誤減少的比值,其計(jì)算公式[13-14]為:

        (2)

        式中:xi+——第i行和;

        x+i——第i列和;

        xii——第i行i列主對角線值;

        r——混淆矩陣行數(shù);

        N——樣本總數(shù)。

        2 RF模型

        2.1輸入/輸出參量的確定

        建立急傾斜煤層頂煤可放性的RF預(yù)測模型時,需考慮分析資料的易獲性和代表性,參考有關(guān)文獻(xiàn)[1-6],經(jīng)綜合考慮選取煤層基本頂 (X1)、直接頂 (X2)、底板平整度 (X3)、瓦斯含量 (X4)、采深 (X5)、煤層傾角 (X6)、煤層厚度 (X7)、煤層堅(jiān)固性系數(shù) (X8)和夾矸程度 (X9) 九個特征參數(shù)指標(biāo)作為隨機(jī)森林模型評估指標(biāo),隨后發(fā)展起來的距離判別分析模型、Fisher分析模型、SVM模型和神經(jīng)網(wǎng)絡(luò)模型等均選用X1、X2、…、X9作為影響頂煤可放性的主要指標(biāo),對頂煤可放性類別進(jìn)行預(yù)測,并取得了良好的效果。其中X1和X2用所屬分級和類別表示,X1代表煤層基本頂?shù)燃墳?I ~ IV 級,直接頂X2的等級{1 ~ 4}為{不穩(wěn)定、較穩(wěn)定、穩(wěn)定和堅(jiān)硬}四類;X3代表平整度,即X3的等級 {1 ~ 4 }分別表示{平整、較平整、不平整、極不平整};煤層堅(jiān)固性系數(shù)X8用普氏系數(shù) (f) 表示;夾矸程度指標(biāo)X9=mj/d,其中D代表煤層總厚度,dj代表煤層中總夾矸厚度;其余指標(biāo)為定量指標(biāo)用實(shí)測值表示。急傾斜煤層頂煤可放性難易程度按四類考慮,即好(A)、較好(B)、一般(C)和差(D)。

        2.2仿真數(shù)據(jù)采集

        為驗(yàn)證RF的急傾斜煤層頂煤可放性評價的有效性,選取文獻(xiàn)[1, 4-6]中19 個急傾斜煤層放頂煤工作面實(shí)測數(shù)據(jù)為研究對象,其原始數(shù)據(jù)見表 1。煤層傾角54°~89°,煤層厚度2.0~7.9 m區(qū)間,數(shù)據(jù)集可視化如圖2所示。

        表1 急傾斜煤層頂煤可放性實(shí)測數(shù)據(jù)及分類結(jié)果

        圖2 各指標(biāo)數(shù)據(jù)可視化

        2.3參數(shù)尋優(yōu)

        RF模型穩(wěn)定性及泛化能力采用兩種方法進(jìn)行驗(yàn)證。第一,獨(dú)立測試:利用訓(xùn)練樣本集構(gòu)建的RF模型對測試樣本集預(yù)測,根據(jù)預(yù)測結(jié)果檢驗(yàn)?zāi)P?;第二?交叉檢驗(yàn):采用n倍交叉檢驗(yàn)策略,即將訓(xùn)練集隨機(jī)分成n組樣本,留出1組作為測試樣本,其余n-1組作為訓(xùn)練樣本,輪流進(jìn)行n次,作為測試數(shù)據(jù)對每組樣本進(jìn)行預(yù)測。隨機(jī)森林五折交叉檢驗(yàn)的結(jié)果如圖3所示,不難發(fā)現(xiàn),當(dāng)n= 5 時,該模型整體識別精度達(dá)到91.0%,Kappa=0.881,為所有分段數(shù)目中的最佳。

        RF在產(chǎn)生分類結(jié)果的同時可計(jì)算出變量重要性值,如圖4。根據(jù)隨機(jī)森林袋外數(shù)據(jù)自變量值發(fā)生輕微擾動后的分類正確率與擾動前分類正確率的平均減少量計(jì)算可知,采深 (X5)和瓦斯含量 (X4)重要度最高,其后依次為煤層傾角 (X6)、煤層堅(jiān)固性系數(shù) (X8)、煤層厚度 (X7)、夾矸程度 (X9)、煤層基本頂 (X1)、直接頂 (X2) 和底板平整度 (X3)。綜上得出:基于樹型分類器組合算法的隨機(jī)森林模型用于頂煤可放性等級預(yù)測,具有精度高、訓(xùn)練速度快等優(yōu)點(diǎn)。

        圖3 交叉檢驗(yàn)參數(shù)尋優(yōu)

        圖4 RF方法對自變量重要度的排序

        Fig. 4Ranking variable importance that associated with classification evaluation by RF method

        3 工程實(shí)例

        為進(jìn)一步驗(yàn)證急傾斜煤層頂煤可放性RF 模型的有效性,將上述訓(xùn)練好的RF模型應(yīng)用到資興礦務(wù)局嘉禾煤礦(E1)、資興礦務(wù)局新集煤礦(E2)、開灤礦務(wù)局馬家溝煤礦(E3)、攀枝花礦務(wù)局大寶頂煤礦(E4)和梅田礦務(wù)局一礦(E5)等急傾斜煤層頂煤可放性分類預(yù)測中,其原始數(shù)據(jù)如表 2所示。運(yùn)用上述訓(xùn)練好的RF預(yù)測模型對其可放性進(jìn)行分類識別,各模型評價結(jié)果和各礦實(shí)際生產(chǎn)情況列入表2中,RF預(yù)測結(jié)果與實(shí)際情況符合。實(shí)例E2、E4和E5煤層蘊(yùn)含低瓦斯,采深相對較小煤層堅(jiān)固性系數(shù)較大,現(xiàn)場觀測發(fā)現(xiàn)煤體基本不產(chǎn)生變形壓力,爆破前放煤巷道變形也很??;而實(shí)例E1和E3煤層屬高瓦斯煤層,且采深較大,且爆破前放煤巷道已產(chǎn)生較大變形,表明頂煤已經(jīng)產(chǎn)生變形和破壞,可放性好?,F(xiàn)場施工實(shí)況驗(yàn)證了頂煤可放性評估的RF模型準(zhǔn)確可靠,提高了放頂煤開采效果。

        表2 預(yù)測樣本實(shí)測數(shù)據(jù)與分類結(jié)果及實(shí)際情況

        4 結(jié) 論

        (1) 選取九大實(shí)測指標(biāo)作為頂煤可放性識別指標(biāo),建立急傾斜頂煤冒放性識別的RF模型,用五折交叉驗(yàn)證方法確定模型參數(shù),評價結(jié)果與實(shí)際情況吻合,準(zhǔn)確可靠,提高了頂煤可放性評估水平。

        (2) RF在產(chǎn)生分類結(jié)果的同時也計(jì)算出每個屬性變量的重要度,得出煤層采深 (X5)和瓦斯含量 (X4)重要度最高,直接頂 (X2) 和底板平整度 (X3)影響很小,該結(jié)論可以為類似工程指標(biāo)選取提供有益參考。

        (3) 評價指標(biāo)和樣本質(zhì)量決定著評價等級的準(zhǔn)確程度,為此,在應(yīng)用中需更加了解急傾斜煤層頂煤可放性機(jī)制并搜集廣泛的樣本數(shù)據(jù)庫,提高頂煤可放性類別預(yù)測模型的可靠性。合理選擇識別參量,該模型同樣適用于其他煤層可放性識別問題。

        [1]王衛(wèi)軍, 朱川曲, 熊仁欽. 急傾斜煤層頂煤可放性識別的神經(jīng)網(wǎng)絡(luò)模型[J]. 煤炭學(xué)報, 2002, 25(1): 36-39.

        [2]陳海波, 李偉, 康健. 結(jié)構(gòu)復(fù)雜厚煤層工作面年200萬t綜放工藝研究[J]. 煤炭學(xué)報, 2009, 34(2): 159-162.

        [3]王飛. 厚煤層頂煤可放性影響因素分析與評價[J]. 煤炭工程, 2010(4): 40-41.

        [4]劉金海, 馮濤, 王衛(wèi)軍, 等. 急傾斜煤層頂煤可放性識別的距離判別方法及應(yīng)用[J]. 煤炭學(xué)報, 2008, 33(6): 601-605.[5]董隴軍, 李夕兵, 白云飛. 急傾斜煤層頂煤可放性分類預(yù)測的Fisher判別分析模型及應(yīng)用[J]. 煤炭學(xué)報, 2009, 34(1): 58-62.

        [6]劉年平, 王宏圖, 袁志剛. 急傾斜煤層頂煤可放性識別的支持向量機(jī)模型[J]. 煤炭學(xué)報, 2010, 35(11): 1859-1862.

        [7]BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(2): 25-32.

        [8]李寶富, 劉永磊. 沖擊地壓危險性等級識別的隨機(jī)森林模型及應(yīng)用[J]. 科技導(dǎo)報, 2015, 33(1): 57-61.

        [9]張修遠(yuǎn), 劉修國. 基于隨機(jī)森林算法的高維模糊分類研究[J]. 國土資源遙感, 2014, 26(2): 87-91.

        [10]李偉賀, 陳志軍, 鄭建軍. 采用核主元成分分析和隨機(jī)森林的電梯故障診斷[J]. 化工自動化及儀表, 2014, 41(1): 27-30. [11]吳瓊, 李運(yùn)田, 鄭獻(xiàn)衛(wèi). 面向非平衡訓(xùn)練集分類的隨機(jī)森林算法優(yōu)化[J]. 工業(yè)控制計(jì)算機(jī), 2013, 26(7): 89-90.

        [12]黃衍, 查偉雄. 隨機(jī)森林與支持向量機(jī)分類性能比[J].軟件, 2012, 33 (6): 1-7.

        [13]萬建鵬, 官云蘭, 葉素倩, 等. 基于綜合權(quán)重水體指數(shù)的水體提取研究—以鄱陽湖為例[J]. 東華理工大學(xué)學(xué)報: 自然科學(xué)版, 2015(2): 206-211.

        [14]努爾比婭烏斯曼, 李新國, 吐爾遜古麗托合提, 等.干旱區(qū)典型綠洲土地利用動態(tài)變化分析——以且末綠州為例[J]. 新疆師范大學(xué)學(xué)報: 自然科學(xué)版, 2011, 30(3): 45-48.

        (編輯徐巖)

        Cavability classification prediction and application of top coal caving for steep seam based on random forest approach

        LIWei,CHENHaibo

        (Key Laboratory of Heilongjiang University of Science & Technology Mining Engineering College of Heilongjiang Province, Harbin 150022,China)

        This paper is motivated by the need for the rapid and accurate prediction of the cavability classification of top coal in steep seam. The study produces a novel method based on the random forest model for top coal cavability identification using 9 indexes as the discriminating factors for top coal cavability, applying the 19 groups of caving working face as a verification example, and using the theory of random forests. The study includes determining the optimal parameters of the RF model using 5-fold cross-validation and evaluating top coal cavability by applying 5 groups steep coal seam . The research reveals that Random forests model could give prediction results conforming to engineering practice and thus features the optimal accuracy of 91.0% and 100.0% respectively when the segment is 5. The results may promise a wider use in engineering.

        steep seam; cavability prediction; random forest; cross-validation

        2016-05-06

        黑龍江省普通高等學(xué)校采礦工程重點(diǎn)實(shí)驗(yàn)室開放課題(2014KF04)

        李偉(1979-),男,滿族,遼寧省錦州人,副教授,碩士,研究方向:采礦工程、礦井信息化,E-mail:lw7709@126.com。

        10.3969/j.issn.2095-7262.2016.04.005

        TD821

        2095-7262(2016)04-0373-05

        A

        猜你喜歡
        分類評價模型
        一半模型
        SBR改性瀝青的穩(wěn)定性評價
        石油瀝青(2021年4期)2021-10-14 08:50:44
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        基于Moodle的學(xué)習(xí)評價
        国产av麻豆mag剧集| 波多野结衣国产一区二区三区| 久久精品国产91久久性色tv| 成年女人18毛片毛片免费| 中文字幕高清一区二区| 99视频偷拍视频一区二区三区| 亚洲天堂av一区二区三区不卡| 日本黑人乱偷人妻在线播放 | 色狠狠色噜噜av天堂一区| 午夜福利试看120秒体验区| 中文字幕在线亚洲日韩6页手机版| 亚洲夫妻性生活视频网站| 久久久精品国产亚洲av网麻豆 | 无码熟妇人妻AV不卡| 成人国产高清av一区二区三区| 成人爽a毛片免费视频| 无码国产69精品久久久久孕妇| 日日噜狠狠噜天天噜av| 国产精品 精品国内自产拍| 久久亚洲精彩无码天堂 | 丝袜美腿亚洲综合在线播放| 无码人妻精品一区二区三区东京热| 国产成人精品久久一区二区三区| 亚洲av永久无码天堂网手机版| 男女扒开双腿猛进入免费看污| 亚洲另类欧美综合久久图片区 | 性饥渴艳妇性色生活片在线播放| 亚洲国产精品线路久久| 99久久免费中文字幕精品| 亚洲国产精品成人一区二区在线| 夜晚黄色福利国产精品| 成人艳情一二三区| 人禽交 欧美 网站| 国产成人亚洲精品91专区手机| 99久久亚洲精品加勒比| 亚洲中文字幕久久精品品| 日本最新免费二区三区| 国产精品一区二区久久| 中文在线最新版天堂av| 国内精品国产三级国产| 国产精品婷婷久久爽一下|