亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林與支持向量機(jī)的回采工作面瓦斯涌出量預(yù)測(cè)方法

        2022-11-09 02:29:16成小雨周愛(ài)桃郭焱振李德波
        煤礦安全 2022年10期
        關(guān)鍵詞:特征模型

        成小雨,周愛(ài)桃,郭焱振,程 成,李德波

        (1.中煤能源研究院有限責(zé)任公司,陜西西安 710054;2.中國(guó)礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083;3.中煤新集劉莊礦業(yè)有限公司,安徽阜陽(yáng) 236200)

        瓦斯涌出量是指在礦井建設(shè)及生產(chǎn)過(guò)程中從煤與巖石內(nèi)涌出的瓦斯量,是煤礦安全生產(chǎn)的主要威脅之一[1]。通過(guò)對(duì)礦井瓦斯涌出量進(jìn)行預(yù)測(cè),進(jìn)而采取必要的防范措施可以減少乃至有效預(yù)防瓦斯事故的發(fā)生,從而保證礦井安全生產(chǎn)以及保障工作人員生命安全。開(kāi)采過(guò)程中,瓦斯涌出量隨自然條件和開(kāi)采技術(shù)變化而改變,這些因素間存在著耦合性、非線性[2]。近年來(lái)許多學(xué)者從深度學(xué)習(xí)領(lǐng)域積極探尋瓦斯涌出量的預(yù)測(cè)方法:王艷暉等[3]基于改進(jìn)果蠅算法(MFOA)結(jié)合支持向量機(jī)(SVM)對(duì)瓦斯涌出量進(jìn)行了預(yù)測(cè);董曉雷等[4]將遺傳算法(GA)與支持向量機(jī)(SVM)結(jié)合,建立了回采工作面瓦斯涌出量預(yù)測(cè)模型;王生全等[5]借助BP 神經(jīng)網(wǎng)絡(luò)結(jié)合遺傳算法(GA)建立了瓦斯涌出量預(yù)測(cè)模型。部分學(xué)者將特征篩選方法[6]運(yùn)用到瓦斯涌出量預(yù)測(cè)中:李樹(shù)剛等[7]將因子分析與BP 神經(jīng)網(wǎng)絡(luò)結(jié)合,對(duì)瓦斯涌出量預(yù)測(cè)展開(kāi)了研究;盧國(guó)斌等[8]借助主成分分析法結(jié)合BP 神經(jīng)網(wǎng)絡(luò)對(duì)回采工作面瓦斯涌出量進(jìn)行預(yù)測(cè);付華等[9]提出一種基于LSTM 的瓦斯涌出量預(yù)測(cè)模型,并結(jié)合量子粒子群算法對(duì)相關(guān)參數(shù)進(jìn)行了優(yōu)化,測(cè)試表明該模型有著較好的表現(xiàn);吳奉亮等[10]、汪明等[11]提出了以隨機(jī)森林算法進(jìn)行瓦斯涌出量預(yù)測(cè)的方法。從前人研究來(lái)看,灰色理論在預(yù)測(cè)精度上難以滿足要求;神經(jīng)網(wǎng)絡(luò)類深度學(xué)習(xí)方法調(diào)參耗時(shí)費(fèi)力,對(duì)數(shù)據(jù)要求較高且易過(guò)擬合。支持向量機(jī)與隨機(jī)森林算法以其原理清晰等優(yōu)點(diǎn)在農(nóng)業(yè)[12]、生物學(xué)[13]、地球物理[14-15]等領(lǐng)域得到廣泛應(yīng)用。此外,部分學(xué)者將隨機(jī)森林自身特征篩選功能與支持向量機(jī)(SVM)結(jié)合展開(kāi)了相關(guān)研究[16-17],結(jié)果表明,與未進(jìn)行特征篩選相比,該種方法在有效減少數(shù)據(jù)采集工作量的同時(shí),基本取得了較為接近甚至更為理想的效果,這為解決該類多影響因素問(wèn)題提供了思路:可以采取數(shù)據(jù)降維類方法對(duì)影響因素進(jìn)行篩選后結(jié)合相關(guān)算法進(jìn)行求解。為此,針對(duì)當(dāng)前瓦斯涌出量預(yù)測(cè)中數(shù)據(jù)處理粗糙及數(shù)據(jù)利用程度不足等問(wèn)題,將交叉驗(yàn)證、數(shù)據(jù)降維方法結(jié)合對(duì)數(shù)據(jù)進(jìn)行處理;針對(duì)預(yù)測(cè)方法單一、預(yù)測(cè)方法選取不合理問(wèn)題,選取支持向量機(jī)與隨機(jī)森林算法分別建立預(yù)測(cè)模型,通過(guò)對(duì)比篩選出較優(yōu)的瓦斯涌出量預(yù)測(cè)模型。

        1 方法原理

        1.1 隨機(jī)森林原理

        隨機(jī)森林[18]是由多個(gè)決策樹(shù)構(gòu)成的集成算法,屬于集成學(xué)習(xí)的一個(gè)子類,可用于分類及回歸問(wèn)題,它主要對(duì)樣本單元和變量進(jìn)行抽樣,進(jìn)而生成大量決策樹(shù)。對(duì)每個(gè)樣本單元來(lái)說(shuō),所有決策樹(shù)依次對(duì)其進(jìn)行分類,預(yù)測(cè)類別中的眾數(shù)即為隨機(jī)森林所預(yù)測(cè)的該樣本單元所屬類別(用于回歸時(shí),輸出即為所有樹(shù)預(yù)測(cè)值的均值)。

        假設(shè)給定樣本集X 中共有N 個(gè)樣本單元,M 個(gè)特征屬性,用于回歸問(wèn)題時(shí)隨機(jī)森林算法大致如下:①采用Bootstrap 法從給定樣本集X 中隨機(jī)、有放回地抽取Q 個(gè)樣本,生成決策樹(shù);②在每一個(gè)節(jié)點(diǎn)隨機(jī)抽取m 個(gè)特征(m

        圖1 RF 原理圖Fig.1 Principle diagram of random forest

        1.2 支持向量機(jī)原理

        支持向量機(jī)是一種監(jiān)督式機(jī)器學(xué)習(xí)模型,可用于分類及回歸分析。處理非線性問(wèn)題時(shí)借助核技巧將其由原始空間映射到高維空間,轉(zhuǎn)換為該空間內(nèi)的線性問(wèn)題,進(jìn)而尋找一超平面使得所有樣本與該超平面的距離最小。該超平面的表達(dá)式可寫作:

        式中:ω 為權(quán)值向量;b 為偏置值;φ(xi)為非線性映射函數(shù)。

        將上述問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題:

        式中:ξi、ξi*為松弛變量;C 為懲罰系數(shù)。

        借助Lagrange 優(yōu)化方法將上述問(wèn)題轉(zhuǎn)化為對(duì)偶問(wèn)題,最終得到回歸模型表達(dá)式為:

        式中:αi、αi*為拉格朗日乘子;K(xi,xj)為核函數(shù)。約束條件:

        徑向基核函數(shù)(RBF)表達(dá)式為:

        式中:σ 為RBF 的徑向量寬度。

        2 實(shí)驗(yàn)及分析

        2.1 數(shù)據(jù)來(lái)源和數(shù)據(jù)處理

        實(shí)驗(yàn)所用樣本數(shù)據(jù)取自中煤新集劉莊煤礦若干工作面歷史監(jiān)測(cè)數(shù)據(jù),整理共計(jì)24 組,回采工作面瓦斯涌出量與影響因素見(jiàn)表1[19-20]。

        表1 回采工作面瓦斯涌出量與影響因素Table 1 Gas emission and influencing factors in mining face

        為充分利用現(xiàn)有數(shù)據(jù),綜合考慮數(shù)據(jù)量及測(cè)試穩(wěn)定性,采取K-折交叉驗(yàn)證(K-CV)處理數(shù)據(jù)集,K-折交叉驗(yàn)證原理如圖2。

        圖2 K-折交叉驗(yàn)證Fig.2 K-fold cross validation

        具體做法如下:

        將數(shù)據(jù)集均分成K 份規(guī)模相同互斥子集,每次取其中K-1 份子集進(jìn)行訓(xùn)練,余下1 組作為測(cè)試集,如此循環(huán)直至所有子集都作一次測(cè)試集。一般K 從3 取起,當(dāng)K 與樣本數(shù)相等時(shí)即為留一法交叉驗(yàn)證。

        2.2 預(yù)測(cè)模型構(gòu)建

        相關(guān)預(yù)測(cè)模型構(gòu)建工作均借助Python 編程語(yǔ)言中Sklearn 機(jī)器學(xué)習(xí)工具進(jìn)行。支持向量回歸模型(SVR) 中核函數(shù)有線性核、多項(xiàng)式核及高斯核(RBF)等,這里選取泛化能力強(qiáng)、待調(diào)參數(shù)少的RBF為核函數(shù),懲罰系數(shù)C 與σ 按網(wǎng)格搜索法確定,其中C 搜索范圍:[1、5、10、15、20、50、100、200];σ 搜索范圍:[0.01、0.02、0.03、0.04、0.05、0.1、0.2、0.5、1、5、10]。

        隨機(jī)森林回歸模型(RFR)中待調(diào)節(jié)參數(shù)主要有2 個(gè):樹(shù)的數(shù)量N 以及最大特征數(shù)M,以網(wǎng)格搜索法確定二者取值,設(shè)置N 的范圍為50~500,梯度50;最大特征數(shù)取值方法有開(kāi)方取值法、取對(duì)數(shù)值法、取整數(shù)法等,為了節(jié)省測(cè)試時(shí)間及直觀查看其值對(duì)預(yù)測(cè)效果的影響,按取整數(shù)法設(shè)置M 搜索范圍為3~10,梯度為1,其余參數(shù)按默認(rèn)值選取。

        2.3 實(shí)驗(yàn)流程

        瓦斯涌出量預(yù)測(cè)模型構(gòu)建流程如圖3。

        圖3 瓦斯涌出量預(yù)測(cè)模型構(gòu)建流程Fig.3 Flow chart of establishing gas emission prediction model

        首先以交叉驗(yàn)證法對(duì)數(shù)據(jù)集隨機(jī)拆分(shuffle=True)處理,通過(guò)SVR、RFR 預(yù)測(cè)模型得到各個(gè)子集預(yù)測(cè)結(jié)果,對(duì)其效果進(jìn)行對(duì)比分析。

        隨后對(duì)特征篩選后數(shù)據(jù)集進(jìn)行測(cè)試,經(jīng)綜合對(duì)比得到最優(yōu)預(yù)測(cè)模型,并進(jìn)一步對(duì)模型效果驗(yàn)證及分析。為確保測(cè)試合理性與可對(duì)比性,除預(yù)測(cè)模型中參數(shù)設(shè)置外,2 模型在其余處理上均保持同步。

        2.4 K-折交叉驗(yàn)證(K-CV)

        為增加測(cè)試可信度,K 值一般從3 取起,但隨著K 值增加模型性能趨于穩(wěn)定,而工作量也會(huì)隨之增加。通過(guò)查閱相關(guān)文獻(xiàn)確定在工程應(yīng)用中K 值取作5 和10[21]。綜上,為動(dòng)態(tài)表述模型性能隨折數(shù)K 變化趨勢(shì),設(shè)定K 范圍為3~10,并從MSE、MAE、測(cè)試耗時(shí)T 3 個(gè)方面來(lái)考察模型性能,不同模型MSE、MAE、測(cè)試耗時(shí)T 與折數(shù)關(guān)系圖如圖4。

        圖4 不同模型MSE、MAE、測(cè)試耗時(shí)T 與折數(shù)關(guān)系圖Fig.4 Relationship between MSE, MAE, test time T and fold number of different models

        1)隨折數(shù)K 增加,2 種模型的預(yù)測(cè)誤差均呈現(xiàn)出下降趨勢(shì),并在K=10 時(shí)達(dá)到相對(duì)較低水平,MSE穩(wěn)定在0.21 左右,此時(shí)SVR 模型參數(shù)C 為20,σ 為0.01;RFR 模型參數(shù)取值N 為100,M 為10。

        2)從測(cè)試耗時(shí)T 來(lái)看,SVR 模型每輪耗時(shí)約在0.015 s 甚至更低,而RFR 模型耗時(shí)約1~3 s,遠(yuǎn)高于前者。因此,SVR 模型整體表現(xiàn)上稍優(yōu)于后者。

        2.5 留一法(Leave-one-out)交叉驗(yàn)證

        為探究10-折交叉驗(yàn)證與留一法交叉驗(yàn)證效果優(yōu)劣,對(duì)數(shù)據(jù)集進(jìn)行留一法處理后得到相關(guān)指標(biāo),得到留一法處理下SVR 模型參數(shù)C 為50、σ 為0.01,RFR 模型參數(shù)為N 為250,M 為10。不同交叉驗(yàn)證方法效果對(duì)比見(jiàn)表2。

        表2 不同交叉驗(yàn)證方法效果對(duì)比Table 2 Comparison of different cross-validation methods

        留一法處理后模型性能有著小幅提升,測(cè)試過(guò)程中模型誤差較為穩(wěn)定,表現(xiàn)也相對(duì)優(yōu)于10-折交叉驗(yàn)證,因此最終確定按留一法對(duì)數(shù)據(jù)集進(jìn)行處理,不同模型預(yù)測(cè)效果對(duì)比圖如圖5。

        圖5 不同模型預(yù)測(cè)效果對(duì)比圖Fig.5 Comparison of prediction performance of different models

        2.6 特征篩選和結(jié)果分析及模型驗(yàn)證

        應(yīng)用隨機(jī)森林算法獲得14 個(gè)輸入因素中特征重要度前8 位的因素依次為埋深、層間巖性、煤層瓦斯含量、鄰近層厚度、煤厚、開(kāi)采強(qiáng)度、采高、采出率,其值依次為0.539、0.151、0.116、0.042、0.04、0.033、0.022、0.021,累計(jì)重要程度達(dá)到95%以上。將其余因素“剔除”后建立新的數(shù)據(jù)集進(jìn)行測(cè)試。

        測(cè)試需調(diào)整RFR 模型中參數(shù)M 范圍為3~8,梯度為1,其余設(shè)置不做改動(dòng)。測(cè)試得到SVR 模型參數(shù)C 為100、σ 為0.01;RFR 模型參數(shù)N 為350、M為8。特征篩選前后效果對(duì)比見(jiàn)表3,特征篩選后2 種模型預(yù)測(cè)效果對(duì)比圖如圖6。

        表3 特征篩選前后效果對(duì)比Table 3 Comparison of indicators before and after feature screening

        圖6 特征篩選后2 種模型預(yù)測(cè)效果對(duì)比圖Fig.6 Comparison of prediction performance of different models after feature screening

        1)對(duì)輸入因素進(jìn)行降維處理后,2 種模型的預(yù)測(cè)性能均有大幅提高,MSE 值降低近50%,MAE 減少約30%;其中SVR 模型MSE 值降低至0.073,MAE值低至0.216 左右。

        2)測(cè)試耗時(shí)方面,SVR 模型基本穩(wěn)定在0.015 5 s,而后者最高增加至10 s 左右,可能是建樹(shù)量增加造成。

        3)除極個(gè)別樣本點(diǎn)波動(dòng)稍大外,2 模型預(yù)測(cè)值與瓦斯涌出量真實(shí)值誤差較小,幾乎吻合。特征篩選后的預(yù)測(cè)模型均展現(xiàn)出了較好的預(yù)測(cè)效果。

        選取處于回采階段的若干工作面進(jìn)行測(cè)試,驗(yàn)證工作面相關(guān)參數(shù)見(jiàn)表4,不同模型預(yù)測(cè)誤差對(duì)比見(jiàn)表5,可以看出SVR 預(yù)測(cè)模型的性能最優(yōu),其平均絕對(duì)誤差約為0.18 m3/min,平均相對(duì)誤差約3.26%。

        表4 驗(yàn)證工作面相關(guān)參數(shù)Table 4 Relevant parameters of selected mining faces

        表5 不同模型預(yù)測(cè)誤差對(duì)比Table 5 Comparison of gas emission prediction error of different models

        3 結(jié) 語(yǔ)

        選取影響煤礦瓦斯涌出量的14 個(gè)參數(shù)為特征,結(jié)合中煤新集劉莊煤礦歷史監(jiān)測(cè)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行交叉驗(yàn)證及降維處理,運(yùn)用支持向量機(jī)與隨機(jī)森林算法對(duì)工作面瓦斯涌出量預(yù)測(cè)進(jìn)行了研究。

        1)通過(guò)觀測(cè)2 種預(yù)測(cè)模型性能隨交叉驗(yàn)證折數(shù)K 變化情況,得到10 折交叉驗(yàn)證相對(duì)較優(yōu);與留一法交叉驗(yàn)證進(jìn)行二次對(duì)比后,確定以留一法進(jìn)行數(shù)據(jù)處理時(shí)模型更為穩(wěn)定、精度更高。

        2)SVR 模型每輪測(cè)試耗時(shí)約在0.015 s 甚至更低,而RFR 預(yù)測(cè)模型則由0.3 s 開(kāi)始增加,最高達(dá)10 s 左右,推測(cè)由于建樹(shù)量增加導(dǎo)致。

        3)對(duì)輸入進(jìn)行降維后,2 種模型的預(yù)測(cè)性能有著顯著提升,其中RBF-SVR 模型MSE 低至0.073;進(jìn)一步驗(yàn)證得到,特征篩選后的SVR 模型表現(xiàn)最佳,其平均絕對(duì)誤差約為0.18 m3/min,平均相對(duì)誤差3.26%,表明采取降維處理在一定程度上簡(jiǎn)化了工作量,同時(shí)也保證了模型預(yù)測(cè)效果。

        猜你喜歡
        特征模型
        一半模型
        抓住特征巧觀察
        重要模型『一線三等角』
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        毛片成人18毛片免费看| 在线中文字幕有码中文| 未满十八勿入av网免费| 99久久久久久亚洲精品| 国产一区二区三区尤物| 成人欧美一区二区三区黑人| 国产精品狼人久久久久影院 | 天堂网站一区二区三区| 日本高清视频www| 欧美色欧美亚洲另类二区不卡| 中文字幕乱码中文乱码毛片| 国产韩国一区二区三区| 国产丝袜美女| 98久9在线 | 免费| av少妇偷窃癖在线观看| 白色白色视频在线观看| 日本丰满老妇bbw| 麻豆一区二区99久久久久| 日韩精品网| 日本久久视频在线观看| 极品尤物一区二区三区| 天堂一区人妻无码| 日韩在线观看网址| 丝袜人妻中文字幕首页| 亚洲a∨无码精品色午夜| 国产精品成年片在线观看| 精品久久久久久电影院| 全国一区二区三区女厕偷拍| 无码人妻一区二区三区在线| 亚洲 欧美 激情 小说 另类| 91日本在线精品高清观看| 中文字幕日韩高清乱码| 国产成年女人毛片80s网站| 国产欧美日韩视频一区二区三区| 久久久婷婷综合五月天| 亚洲国产中文字幕一区| 边喂奶边中出的人妻| 午夜毛片午夜女人喷潮视频| 99久久精品国产一区色| 日本一区二区三区视频在线观看| 久久综合国产乱子伦精品免费|