亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LASSO-LARS的回采工作面瓦斯涌出量預(yù)測研究

        2022-09-22 03:11:38黃連兵
        煤炭科學(xué)技術(shù) 2022年7期
        關(guān)鍵詞:特征因素影響

        陳 茜,黃連兵

        (1.煤炭工業(yè)規(guī)劃設(shè)計研究院有限公司,北京 100120;2.山東科技大學(xué) 電子信息工程學(xué)院,山東 青島 266590)

        0 引 言

        近年來,我國煤礦安全形勢有所好轉(zhuǎn),安全事故起數(shù)和死亡人數(shù)逐年下降,但安全形勢依然嚴(yán)峻,煤礦事故頻發(fā),重特大事故時有發(fā)生。據(jù)不完全統(tǒng)計,2013—2017年期間全國煤礦事故1 945起,死亡人數(shù)3 771人,其中瓦斯事故起數(shù)和死亡人數(shù)分別占11.21%和30.17%,成為僅次于頂板災(zāi)害事故的第二大安全事故種類,可見瓦斯仍是引發(fā)煤礦安全事故的主要因素之一。而瓦斯涌出量作為瓦斯防治與管理,礦井通風(fēng)系統(tǒng)設(shè)計的重要基礎(chǔ)數(shù)據(jù),快速、精確的預(yù)測瓦斯涌出量是實現(xiàn)煤礦安全生產(chǎn)的重要前提。國內(nèi)外眾多學(xué)者對煤礦瓦斯涌出量的預(yù)測模型做了大量的研究。齊慶杰等[1]、陳存強(qiáng)[2]、馬文偉等[3]分別采用分源預(yù)測法對礦井瓦斯涌出量進(jìn)行了預(yù)測;曹朋等[4]將多元線性回歸和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行組合,預(yù)測了礦井瓦斯涌出量;苗杰[5]、施式亮等[6]分別采用灰色系統(tǒng)相關(guān)理論對礦井瓦斯涌出量進(jìn)行了研究;楊宏海[7]、楊明磊等[8]將SVM 回歸與分源預(yù)測法相結(jié)合建立SVM 分源預(yù)測數(shù)學(xué)模型,對回采工作面的瓦斯涌出量進(jìn)行了回歸分析;胡坤等[9]利用正則化異常值隔離與回歸方法(LOIRE),結(jié)合TLBO優(yōu)化算法,建立了TLBO-LOIRE優(yōu)化預(yù)測模型對相關(guān)影響因素進(jìn)行計算分析并對煤礦回采工作面瓦斯涌出量進(jìn)行了預(yù)測。但上述預(yù)測模型也存在著一定的缺陷,如:神經(jīng)網(wǎng)絡(luò)模型需要選擇模型及參數(shù),存在著收斂速度慢等缺點;灰色理論預(yù)測當(dāng)原始數(shù)據(jù)序列波動大并且信息過于分散時,預(yù)測精度將會降低;聚類分析法中隸屬度的確定受人為因素影響較大。且上述各種方法都不能很好地解決實際工作中普遍存在的變量之間多重共線性問題。消除變量共線性方法,常見的有主成分分析(Principal Component Analysis,PCA)、線 性 判 定 分 析(Linear Discriminant Analysis,LDA)等方法。雖然它們具有較好的降維效果,但由于其改變了原始特征空間的結(jié)構(gòu),得到的新特征意義不明,不容易理解。針對以上現(xiàn)狀,提出了一種基于Lasso算法的特征選擇方法,在原始特征空間的基礎(chǔ)上,通過剔除無關(guān)和冗余的特征選擇出一個最優(yōu)特征子集,原始數(shù)據(jù)集的特征意義沒有改變,且具有更好的可讀性。利用從數(shù)據(jù)角度篩選出的瓦斯涌出量影響因素的主要特征來建立預(yù)測模型,從而能夠準(zhǔn)確地追蹤回采面瓦斯涌出量的變化規(guī)律。

        1 LASSO算法原理

        最小絕對值壓縮選擇模型(Least Absolute Shrinkage and Selection Operator,LASSO)是一種帶有懲罰的正則化稀疏模型,最早由統(tǒng)計學(xué)家TIBSHIRANI于1996年提出[10]。為了給LASSO方法提供有效的算法支撐,BRADLEY等[11-12]提出了最小角回歸(Least Angle Regression,LARS)算法。ZOU等[13]提出了Elastic Net方法,該方法在LARS的基礎(chǔ)上加入二范數(shù)約束條件,解決了高維小樣本數(shù)據(jù)的過擬合問題。施萬鋒等[14]提出一種均分式Lasso方法,通過將特征集分組選擇然后合并的方法,解決了LASSO算法在計算高維數(shù)據(jù)時的內(nèi)存開銷問題,使得LASSO算法在分布式計算框架中的應(yīng)用成為可能。

        LASSO回歸的基本思想是將回歸系數(shù)的絕對值之和約束在一個常數(shù)條件下,使得殘差平方和最小,從而使得某些自變量的回歸系數(shù)自動壓縮到零,即在傳統(tǒng)線性回歸方法最小平方估計的基礎(chǔ)上增加了絕對值形式的懲罰項,達(dá)到變量選擇的目的,得到可解釋的模型[15-17]。

        對于多元線性回歸模型:

        y=β0+β1x1+β2x2+…+βpxp+ε

        (1)

        其中,y為因變量;xi(i=1,2,…,p)為自變量;βi(i=1,2,…,p)為未知參數(shù);ε為隨機(jī)誤差項。

        LASSO方法的系數(shù)估計為

        (2)

        2 礦井瓦斯涌出量預(yù)測模型的建立

        影響瓦斯涌出量的因素眾多,根據(jù)大量研究成果,筆者選取回采工作面測量的10個因素為主要影響因素,包括煤層埋藏深度(X1)、滲透率(X2)、煤層厚度(X3)、煤層瓦斯含量(X4)、CH4濃度(X5)、風(fēng)量(X6)、日產(chǎn)量(X7)、煤層間距(X8)、煤層揮發(fā)分產(chǎn)率(X9)、鄰近層瓦斯含量(X10)[1-9,18-20]。

        圖1 LASSO回歸算法的建模過程Fig.1 Flow of LASSO regression algorithm modeling

        瓦斯涌出量動態(tài)預(yù)測模型訓(xùn)練過程如下:

        1)提取煤礦瓦斯涌出量影響因素原始數(shù)據(jù),X=[X1,X2,…,X10]T,為消除不同指標(biāo)量綱的影響,需要將觀測數(shù)據(jù)標(biāo)準(zhǔn)化、正規(guī)化,即:

        (3)

        2)采用機(jī)器學(xué)習(xí)常用的相關(guān)性熱圖方法,將屬性之間的線性相關(guān)性可視化,并判斷各屬性之間的共線性,如存在,則利用Lasso進(jìn)行降維處理,反之則直接進(jìn)行多元回歸分析。

        3)若屬性之間存在多重共線性,通過Lasso方法計算后,當(dāng)影響因素對應(yīng)的參數(shù)回歸結(jié)果為“0”時,該特征被舍棄;若非“0”則將該特征列入候選特征集合。從而得到稀疏解,達(dá)到降維的目的。

        4)得到低冗余特征子集后,利用特征子集進(jìn)行訓(xùn)練,創(chuàng)建模型族,即不同的λ值的擬合系數(shù)。

        5)生成最優(yōu)預(yù)測模型:選用十折交叉驗證的方法(10-fold Cross Validation)確定參數(shù),具體步驟如下:①將訓(xùn)練集合的順序隨機(jī)擾亂;②將擾亂后的訓(xùn)練集合等分為10份;③從參數(shù)集合中的第1個參數(shù)開始,每次不重復(fù)地選擇一個參數(shù);④從第1份開始,每次取出一份作為測試集,其余的作為訓(xùn)練集;⑤使用訓(xùn)練集和選擇的參數(shù)進(jìn)行模型訓(xùn)練;⑥用訓(xùn)練好的模型對測試集進(jìn)行預(yù)測;⑦對n次的預(yù)測結(jié)果計算平均識別率;⑧選擇取得最高識別率的測試集參數(shù)。

        6)根據(jù)最優(yōu)參數(shù)建立多元回歸方程,進(jìn)行瓦斯涌出量預(yù)測。

        馬刺說:“元帥的藍(lán)晶馬不吃不喝,整日悲嘶,到第七天,身上汗落如雨,藍(lán)晶不融,堆積如丘。后來,馬朝著北方長嘶三聲,就氣絕而死。馬死了,汗晶也在瞬間化成一攤水?!?/p>

        3 模型應(yīng)用與分析

        3.1 回采工作面瓦斯涌出影響因素的選取

        將收集到的淮北某礦回采工作面瓦斯涌出量及各影響因素形成樣本集,樣本數(shù)據(jù)見表1。其中,前57組回采工作面數(shù)據(jù)作為樣本訓(xùn)練集,后5組數(shù)據(jù)作為預(yù)測樣本,用于檢驗所建模型的預(yù)測效果。

        表1 回采工作面瓦斯涌出量和影響因素數(shù)據(jù)集

        續(xù)表

        3.2 瓦斯涌出量影響因素相關(guān)性分析

        相關(guān)性圖是一種表示2個變量之間相關(guān)關(guān)系的熱圖,是廣泛使用的數(shù)據(jù)可視化方法之一。采用相關(guān)性熱圖對瓦斯涌出量影響因素數(shù)據(jù)進(jìn)行更直觀的展示,如圖2所示。計算每組影響因素之間的相關(guān)性,每個格子的顏色代表行與列的相關(guān)性,顏色越紅代表相關(guān)性越強(qiáng),越藍(lán)代表相關(guān)性越弱。由圖中可以看出,影響瓦斯涌出量部分屬性之間有很強(qiáng)的相關(guān)性,適用于Lasso算法進(jìn)行特征篩選。

        圖2 瓦斯涌出量各影響因素的相關(guān)性熱圖Fig.2 Data correlation heatmap of affecting factors

        3.3 基于Lasso算法的高影響因素篩選

        使用Python語言編程進(jìn)行機(jī)器計算,運用Lasso方法對選取的9個屬性進(jìn)行參數(shù)估計與變量選擇,用LARS算法實現(xiàn)計算。采用十折交叉驗證方法進(jìn)行模型選取,同時獲得模型的性能最優(yōu)估計。通過交叉驗證計算不同alpha取值下的均方誤差(MSE),獲得最優(yōu)估計,結(jié)果如圖3所示。

        圖3 alpha和均方誤差圖Fig.3 Figure of alpha and mean square error

        圖3中橫向虛線表示每個懲罰系數(shù)alpha對應(yīng)的目標(biāo)均方誤差,橫向?qū)嵕€表示在十折交叉驗證過程中均方誤差的平均曲線??v向虛線表示在所有的alpha值中最優(yōu)解,即當(dāng)alpha取值為0.012 17時,獲得模型的性能最優(yōu)估計。圖4表示瓦斯涌出量在Lasso回歸中系數(shù)隨參數(shù)的變化情況,由圖4可知,當(dāng)參數(shù)alpha很小時,變量均未被選入模型中,隨著alpha的不斷增大,變量依次進(jìn)入模型,當(dāng)alpha到達(dá)一定值時,變量全部進(jìn)入模型。同時,隨著alpha取值的逐漸增大,壓縮程度增大,所選入模型的變量個數(shù)越少。

        圖4 瓦斯涌出量在LASSO回歸中系數(shù)隨參數(shù)的變化Fig.4 Regression coefficient with alpha in LASSO

        因此,應(yīng)當(dāng)選取合適的參數(shù)值以做出權(quán)衡。當(dāng)alpha取值為10-2左右時,從最初的10個影響因素中挖掘出6個高影響因素,剔除掉4個低影響因素,在一定程度上簡化了指標(biāo)體系結(jié)構(gòu)。與此同時,當(dāng)alpha取值0.012 17時模型的預(yù)測均方誤差控制在0.5以下,能夠兼顧預(yù)測精度與因素篩選。

        運用LASSO變量篩選,最終選出了煤層埋藏深度、煤層厚度、煤層瓦斯含量、煤層揮發(fā)分產(chǎn)率、風(fēng)量和煤層間距6個因素對瓦斯涌出量影響最大,系數(shù)結(jié)果見表2。其中影響最大的是煤層瓦斯含量和煤層埋藏深度,并具有顯著的正向作用;煤層厚度和煤層間距顯著度不如煤層揮發(fā)分產(chǎn)率和風(fēng)量;滲透率、CH4濃度、日產(chǎn)量和鄰近層瓦斯含量數(shù)據(jù)對瓦斯涌出量的影響不顯著,沒有被選入模型。以LASSO算法篩選出的高影響因素為基礎(chǔ),結(jié)合得到的回歸系數(shù),對瓦斯涌出量進(jìn)行預(yù)測。

        表2 基于LASSO算法進(jìn)行屬性選擇的系數(shù)結(jié)果

        3.4 預(yù)測結(jié)果分析對比

        為更好地驗證預(yù)測效果,將LASSO預(yù)測結(jié)果與主成分分析預(yù)測結(jié)果進(jìn)行對比,2種模型預(yù)測結(jié)果的相對誤差見表3,與實測值對比如圖6所示。由圖6可知,運用LASSO預(yù)測模型的最大相對誤差為9.2%,最小相對誤差為2.5%,平均相對誤差為6.5%。根據(jù)主成分選取原則,選取前4個成分(貢獻(xiàn)率91.378%>85%),進(jìn)行回歸預(yù)測的最大相對誤差為24.7%,最小相對誤差為10%,平均相對誤差為14.4%,遠(yuǎn)低于LASSO預(yù)測的精度。

        表3 基于LASSO和主成分分析的瓦斯涌出量預(yù)測值比較Table 3 Comparison of predictod gas emission based on LASSO and principal component,regression

        圖5 基于LASSO和主成分分析的瓦斯涌出量預(yù)測結(jié)果Fig.5 Prediction of gas emission based on LASSO and principal component regression

        同時,引入平均相對變動值(Average Relative Variance,ARV)、均方根誤差(Root Mean Square Error,RMSE)作為誤差評判標(biāo)準(zhǔn),綜合評價模型的預(yù)測精度和泛化能力。ARV值越小,預(yù)測模型泛化能力越強(qiáng);RMSE值越小,預(yù)測模型的精度也越高。2種不同預(yù)測模型效果綜合對比見表4。

        表4 2種預(yù)測模型綜合效果對比

        結(jié)果顯示基于LASSO多元回歸模型預(yù)測精度更高,而且具有一定的泛化性。主成分分析的降維技術(shù)改變了數(shù)據(jù)的原始特征空間結(jié)構(gòu),得到的新的特征意義不夠明確,主成分中存在著噪聲和虛假分量,降低了特征的準(zhǔn)確性和代表性,從而影響了預(yù)測結(jié)果。而LASSO模型通過剔除無關(guān)和冗余的特征選擇出的最優(yōu)特征子集,特征意義沒有改變,具有更好的可讀性,從整體上提高了預(yù)測結(jié)果的準(zhǔn)確性。

        4 結(jié) 論

        1)LASSO回歸模型采用LARS算法對影響瓦斯涌出量的高維數(shù)據(jù)進(jìn)行了降維處理,CH4濃度、日產(chǎn)量和鄰近層瓦斯含量對瓦斯涌出量的影響不顯著。

        2)經(jīng)與主成分分析法對比,LASSO特征篩選方法在信息篩選方面優(yōu)于主成分分析法,預(yù)測精度更高,泛化能力更強(qiáng),為回采工作面瓦斯涌出預(yù)測模型的選擇提供了一種新的依據(jù)。

        3)由于LASSO回歸模型和主成分分析法均屬于線性模型,未充分考慮特征中的非線性因素,采用非線性化的方法對模型進(jìn)行改進(jìn),將是下一步研究的重點方向。

        猜你喜歡
        特征因素影響
        腹部脹氣的飲食因素
        中老年保健(2022年5期)2022-08-24 02:36:04
        是什么影響了滑動摩擦力的大小
        群眾路線是百年大黨成功之內(nèi)核性制度因素的外在表達(dá)
        哪些顧慮影響擔(dān)當(dāng)?
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        擴(kuò)鏈劑聯(lián)用對PETG擴(kuò)鏈反應(yīng)與流變性能的影響
        中國塑料(2016年3期)2016-06-15 20:30:00
        短道速滑運動員非智力因素的培養(yǎng)
        冰雪運動(2016年4期)2016-04-16 05:54:56
        《流星花園》的流行性因素
        精品日韩欧美一区二区在线播放 | 精品国产麻豆免费人成网站| 又色又污又爽又黄的网站| 高清国产美女一级a毛片在线| 日韩一区二区中文字幕| 欧美又大粗又爽又黄大片视频| 少妇性荡欲视频| 亚洲AV成人无码国产一区二区| 日本激情久久精品人妻热| 国产综合精品久久99之一| 在线人成免费视频69国产| 亚洲日韩一区二区一无码| 欧美亚洲国产精品久久高清| 国产chinese在线视频| av中文字幕在线直播| 国产七十六+老熟妇| 国内大量揄拍人妻在线视频| 国产一级黄色录像| 国产不卡一区二区三区视频| 精品久久综合日本久久综合网| 国产特级毛片aaaaaa高潮流水| 黑人大荫道bbwbbb高潮潮喷| 欧美亚洲韩国国产综合五月天| 久久婷婷综合激情亚洲狠狠| 国产精品视频自拍在线| 中文字幕亚洲乱码熟女在线 | 国精无码欧精品亚洲一区| 国产日本在线视频| 91九色极品探花内射| 乱色精品无码一区二区国产盗 | 亚洲亚洲网站三级片在线| 看大陆男女真人草逼视频| 最新欧美精品一区二区三区| 女女女女bbbbbb毛片在线| 丰满人妻一区二区乱码中文电影网 | 国产天美传媒性色av| 甲状腺囊实性结节三级| 一本色道久久88加勒比综合| 亚洲国产婷婷香蕉久久久久久| 欲色天天网综合久久| 久久亚洲精彩无码天堂|