周松元 羅 渭 黃 炳
(1.湖南安全技術(shù)職業(yè)學(xué)院(長沙煤礦安全技術(shù)培訓(xùn)中心),湖南 長沙 410151;2.杭州奇越數(shù)據(jù)科技有限公司,浙江 杭州 310015)
煤與瓦斯突出強(qiáng)度直接決定災(zāi)變后果。經(jīng)驗(yàn)表明:100t以下的低強(qiáng)度突出,災(zāi)變區(qū)域可能僅涉及發(fā)生地點(diǎn)幾十米局部范圍內(nèi),依靠通風(fēng)設(shè)施,就能迅速恢復(fù)正常,造成的人員與財(cái)產(chǎn)損失輕微;但數(shù)百噸、上千噸以上突出一旦發(fā)生,其強(qiáng)烈沖擊波會(huì)在極短時(shí)間推動(dòng)災(zāi)變區(qū)域迅速擴(kuò)大,災(zāi)難性后果將是大概率事件。突出強(qiáng)度的預(yù)測具有非常重要的現(xiàn)實(shí)意義。
近來人工智能機(jī)器學(xué)習(xí)技術(shù)的迅猛發(fā)展,給煤與瓦斯突出預(yù)測預(yù)警技術(shù)研究提供了新的視角、方法和手段。此前一些相關(guān)的研究應(yīng)用了諸如神經(jīng)網(wǎng)絡(luò)等算法進(jìn)行分析,取得了不錯(cuò)的效果,但是這些研究采用的預(yù)測指標(biāo)獲取難度大,樣本量少,且缺少獨(dú)立驗(yàn)證檢驗(yàn),構(gòu)建的模型存在過度擬合的可能性,實(shí)用性受限[1-2]。本文以湖南高瓦斯突出礦井利民煤礦為例,采用機(jī)器學(xué)習(xí)方法,探討礦井煤與瓦斯突出強(qiáng)度預(yù)測模型構(gòu)建的可行性與可靠性,以期能為高危礦井防突管理精準(zhǔn)施策,提出一種災(zāi)害度評判的普適性參考方法。
機(jī)器學(xué)習(xí)的核心思想是對歷史數(shù)據(jù)進(jìn)行分析獲得知識(shí),并對新數(shù)據(jù)作出預(yù)測。探討分析或?qū)⒁?wù)的對象,假定是已投產(chǎn)多年的煤與瓦斯突出礦井,已發(fā)生過煤與瓦斯突出(或視同突出)事故,長期的生產(chǎn)實(shí)踐過程中,已經(jīng)積累了較多的與突出相關(guān)的記錄資料,如“四位一體”防突措施實(shí)施過程記錄等。機(jī)器學(xué)習(xí)能自動(dòng)對突出信息數(shù)據(jù)進(jìn)行歸納、回歸分析,從而獲得規(guī)律,從理論上講,能夠利用這些規(guī)律對未知數(shù)據(jù)(如突出趨勢與強(qiáng)度等)進(jìn)行預(yù)測,所以,本文就選用機(jī)器學(xué)習(xí)算法來構(gòu)建礦井突出強(qiáng)度的預(yù)測模型。
圖1 機(jī)器學(xué)習(xí)項(xiàng)目流程
采用機(jī)器學(xué)習(xí)方法進(jìn)行完全的礦井煤與瓦斯突出強(qiáng)度預(yù)測研究,根據(jù)“CRISP-DM”跨行業(yè)機(jī)器學(xué)習(xí)標(biāo)準(zhǔn)流程,項(xiàng)目要經(jīng)歷三個(gè)階段:數(shù)據(jù)準(zhǔn)備階段、建模與測試階段和模型部署整合階段(如圖1所示)。對于探索性分析研究工作而言,本文探討時(shí)段是到測試驗(yàn)證階段。
MARS(多變量適應(yīng)回歸樣條)是一種高度自動(dòng)化的回歸分析工具,由斯坦福大學(xué)統(tǒng)計(jì)系Jerome H.Friedman開發(fā)[3]。MARS可以自動(dòng)選擇使用哪些變量,對變量優(yōu)化變形,發(fā)現(xiàn)變量之間的交互作用,并且模型能夠自我測試,可有效防止諸如神經(jīng)網(wǎng)絡(luò)等算法可能出現(xiàn)的過度擬合問題。
MARS的函數(shù)形式類似分段函數(shù),但在經(jīng)典統(tǒng)計(jì)中,分段函數(shù)切分位置通常被事先確定,并且被均勻間隔。在MARS中,切分位置則通過搜索步驟進(jìn)行確認(rèn),并且只會(huì)保留需要數(shù)量的分段。MARS創(chuàng)建了一組基函數(shù)來單獨(dú)分解每個(gè)變量的信息,對于基函數(shù)運(yùn)行回歸等同于設(shè)定分段性線函數(shù)。
原國家統(tǒng)配煤礦總公司漣邵礦務(wù)局利民煤礦(現(xiàn)政策關(guān)閉),根據(jù)礦井突出卡片記錄及后期10年較為詳細(xì)的“四位一體”防突指標(biāo)測定記錄及分析研究資料,進(jìn)行數(shù)據(jù)挖掘整理得到突出樣本148次,按建模經(jīng)驗(yàn)以大約1:8的比例從正?!八奈灰惑w”綜合防突措施記錄中隨機(jī)抽取1180條,合計(jì)1328條原始數(shù)據(jù)。由于時(shí)間跨度長,不同時(shí)期記錄內(nèi)容不完全相同,因此數(shù)據(jù)存在相當(dāng)高的缺失率。統(tǒng)計(jì)情況如表1所示。
表1 參與建模原始數(shù)據(jù)樣本變量缺失情況統(tǒng)計(jì)
其中以突出強(qiáng)度是多少作為目標(biāo)變量,其余指標(biāo)作為預(yù)測變量,用于預(yù)測這個(gè)結(jié)果。由于部分預(yù)測變量缺失比例過高,而這些缺失通常是與工作流程高度相關(guān)的,即比如沒有發(fā)生突出,“波及距離”就不會(huì)有數(shù)據(jù)記錄。為了避免分析結(jié)果被這些因素干擾,將不使用相關(guān)指標(biāo)進(jìn)行分析。
以往煤與瓦斯突出預(yù)測預(yù)警研究,研究樣本或是采自不同礦區(qū),或是同礦井,樣本量采集數(shù)量通常也只有二三十條記錄[1-2],缺少獨(dú)立驗(yàn)證的過程,因此可能存在過擬合的情況,即在實(shí)驗(yàn)室表現(xiàn)很好,但用于礦井具體生產(chǎn)過程時(shí)則偏差很大。為克服這一缺點(diǎn),采用20%隨機(jī)獨(dú)立樣本驗(yàn)證的方式,得到模型的R2值為0.428,其他表現(xiàn)指標(biāo)如表2所示。
表2 機(jī)器學(xué)習(xí)模型擬合結(jié)果評估指標(biāo)
構(gòu)建的利民礦井煤與瓦斯突出強(qiáng)度預(yù)測模型(回歸方程)為:
Y=490.136+0.107283×BF1-0.0588377×BF2+133.792×BF3-0.0747148×BF5-0.205089×BF7-0.072001×BF8-2.22403×BF9-1.44556×BF10+68.0238×BF12+43.7664×BF13-60.5995×BF15。
韻玲:我是北方人,大學(xué)畢業(yè)后就留在了山清水秀的江南,一年四季,其他三個(gè)季節(jié)都很舒服,就是到了冬天,實(shí)在是受不了這種陰寒的涼氣。在南方過冬,我已經(jīng)習(xí)慣晚上蓋著好幾床被子睡覺了。不過做了孕媽媽之后,就感覺很不方便了,蓋兩床棉被感覺太壓迫人了,都快喘不過氣來了。而且在北方暖暖和和的棉被到了南方也水土不服不好用,天氣潮濕的時(shí)候,反而黏糊糊的,如果沒有個(gè)艷陽天,反而曬不透。孕期晚上睡覺怎么能睡得舒服,就成了我的心頭大事!
預(yù)測模型中基函數(shù)形式則如下:
BF1=max(0,瓦斯涌出量(M3)(突出前8小時(shí)內(nèi)推算量)-8186.4);
BF2=max(0,8186.4-瓦斯涌出量,M3,突出前8小時(shí)內(nèi)推算量);
BF3=構(gòu)造特征$in(“斷層、褶曲”,“穿層、褶曲”);
BF5= max(0,瓦斯涌出量,M3,突出前8小時(shí)內(nèi)推算量,-3050);
BF7=max(0,最大瓦斯解吸指標(biāo)H2-460);
BF8=max(0,460-最大瓦斯解吸指標(biāo)H2);
BF9=max(0,瓦斯涌出初速度Q-61.365);
BF10=max(0,61.365-瓦斯涌出初速度Q);
BF12=max(0,1.01083-煤層厚度變異系數(shù));
BF13=工作面或鉆孔溫度有無變化$in(“有”);
BF15=構(gòu)造特征$in(“斷層、褶曲”,“褶曲、穿層”)。
通過上面這個(gè)公式,只要取得了對應(yīng)的上述指標(biāo)值,就可以隨時(shí)計(jì)算預(yù)測出對應(yīng)的突出強(qiáng)度,就可以進(jìn)行相應(yīng)的預(yù)防工作,達(dá)到防突措施程度“精準(zhǔn)施策”目的,以實(shí)現(xiàn)最佳的安全經(jīng)濟(jì)效果。下表為部分獨(dú)立驗(yàn)證數(shù)據(jù),依據(jù)上述公式可預(yù)測得到一個(gè)預(yù)測值,與實(shí)際值比較后發(fā)現(xiàn)預(yù)測誤差一般在50t以內(nèi)。如表3所示。
(1)本次研究探討了人工智能機(jī)器學(xué)習(xí)在煤礦瓦斯突出預(yù)測預(yù)警應(yīng)用上的可能性,通過研究可以發(fā)現(xiàn),即使在少量樣本和數(shù)據(jù)質(zhì)量不高的情況下,人工智能機(jī)器學(xué)習(xí)也可以較為準(zhǔn)確地預(yù)測煤礦瓦斯突出強(qiáng)度,這說明人工智能機(jī)器學(xué)習(xí)在礦井地質(zhì)災(zāi)難預(yù)測預(yù)警方面具有廣闊的應(yīng)用前景。
(2)基于具體突出礦井的煤與瓦斯突出強(qiáng)度預(yù)測模型構(gòu)建,可隨時(shí)獲得采掘工作面可能面臨的災(zāi)變程度,有利于準(zhǔn)確設(shè)計(jì)“四位一體”防突措施投入程度,防止投入不足或溢出,提高企業(yè)安全經(jīng)濟(jì)效益。
(3)客觀因素對預(yù)測分析精度以及適用性會(huì)造成一定影響。若數(shù)據(jù)時(shí)間跨度過長,實(shí)際工作流程也有可能已發(fā)生較大改變,礦井樣本數(shù)據(jù)偏少和部分指標(biāo)缺失率過高,也可能造成分析結(jié)果或具偶然性。
(4)未來計(jì)劃采用以下途徑開展進(jìn)一步研究:與具突出礦井的企業(yè)合作,采集大量規(guī)范準(zhǔn)確的樣本數(shù)據(jù)繼續(xù)進(jìn)行分析,進(jìn)一步提升模型預(yù)測精度,并通過實(shí)踐檢驗(yàn),最終實(shí)現(xiàn)將機(jī)器學(xué)習(xí)模型應(yīng)用于煤與瓦斯突出強(qiáng)度預(yù)測工作。
表3 礦井煤與瓦斯突出強(qiáng)度預(yù)測驗(yàn)證表