曹超凡
(西安建筑科技大學,陜西 西安 710055)
基于深度神經(jīng)網(wǎng)絡的煤礦突水水源判別分析
曹超凡
(西安建筑科技大學,陜西 西安 710055)
通過研究已有突水水源判別方法,發(fā)現(xiàn)其存在收斂速度慢和目標函數(shù)存在局部極小點的問題,導致判別準確率較低。為了提高突水水源判別的準確率,文章提出使用深度神經(jīng)網(wǎng)絡判別煤礦突水水源,選擇突水水化學數(shù)據(jù)、礦化度、總硬度、碳酸硬度、非碳酸硬度、負硬度、總堿度和總酸度等指標屬性作為判別因子,建立水源判別模型。通過對比實驗,結果表明,DNN模型可以有效提高突水水源識別的準確率。
煤礦突水;水源判別;DNN
煤礦的突水災害是僅次于瓦斯災害的第二大災害,給煤礦安全生產(chǎn)和煤礦工作者的生命帶來了嚴重的威脅。突水事故發(fā)生時,及時判識突水水源,為突水事故的分析處理和水災預防處理的決策提供技術支持。國內(nèi)外學者針對突水水源判識提出了很多理論,從水化學特征分析,到聚類分析、灰色關聯(lián)分析、貝葉斯判別法。通過分析已有方法和判識指標,針對其存在的問題,提出采用深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)模型判識突水水源,并與已有方法作對比,驗證模型的有效性。
1.1 Piper三線圖法
Piper 三線圖是一種常用的水化學離子成分圖示法,通過分析不同水源的水化學特判別水源,以3組陽離子Mg2+,Ca2+,Na++K+和3組陰離子SO42-,Cl-,HCO3-+CO3
2-作為分析指標,將6組離子每升毫克當量的百分比投影到Piper三線圖上,確定各含水層的水質(zhì)類型,然后取突水點的水樣進行水質(zhì)對比,突水點的水質(zhì)與哪個含水層水質(zhì)相近,即可判斷為突水水源。此方法主要適用于水質(zhì)差別較大的單層充水水源。
1.2 聚類分析法
聚類分析法聚類就是按照某個特定的標準把所選取的一定數(shù)量的樣本數(shù)據(jù)分割成不同的類別組,利用代表點聚類(Clustering Using Representative,CURE)是一種新穎的層次聚類算法,將所有礦井突水層水樣樣本(包括標準數(shù)據(jù)樣本和待檢測樣本)各自作為一類,并規(guī)定樣本之間的距離和類與類之間的距離,然后將聚類最近的兩個類合并成一個新的類,計算新類與其他類之間的距離,重復執(zhí)行此操作,每次減少一個類,直到所有樣本合并為n個類,n為水樣類別總數(shù)。
1.3 灰色關聯(lián)分析法
灰色關聯(lián)分析方法是分析灰色系統(tǒng)中各個因素間關聯(lián)程度的一種量化方法,它的基本思想是根據(jù)礦井水樣樣本(包括標準水樣與待判水樣)序列曲線幾何形狀的相似程度來判斷待判水樣與標準水樣聯(lián)系是否緊密,曲線越接近,相應序列之間的關聯(lián)度就越大,反之就越小。
在灰色關聯(lián)分析中,設Xi為系統(tǒng)因素,其在序號p上的觀測數(shù)據(jù)為:
xi(p),p=1,2,…,n
則稱Xi=(xi(1),xi(2),…,xi(n))為因素Xi的行為序列。其中p為指標序號,xi(p)為因素Xi關于第p個指標的觀測數(shù)據(jù)。
1.4 貝葉斯判別方法
貝葉斯判別是用一個先驗概率描述對研究對象已有的認知,然后通過樣本數(shù)據(jù)修正先驗概率,得到后驗概率,并給予后驗概率識別水源類別。對于識別6類水源的貝葉斯判別公式為:
其中,Gj是已知的6個水源類別;X是需要進行分類的待判突水水樣;P(X|Gj)表示某一類Gj成立時待判水樣X的概率;P(Gj)代表待判水樣在判別之前擁有的初始概率,即Gj的先驗概率,其計算方法如下:
由貝葉斯公式直接計算得到的結果P(Gj|X)就是突水待判水樣屬于某一類別的后驗概率。
1.5 深度學習方法
深度學習(Deep Learning,DL)源自于人工神經(jīng)網(wǎng)絡的研究,是DNN等一系列機器學習方法的總稱,例如,含有多個隱藏層的多層感知機,就是其較為簡單的一種結構形式。最近幾年,DL在NLP和語音識別等眾多領域都取得了非常不錯的突破。它有大規(guī)模的并行處理和分布式的信息存儲能力,良好的自適應性、自組織性和很強的學習、聯(lián)想、容錯及抗干擾能力.在判別這類具有模糊性的問題上有明顯的優(yōu)勢。
2.1 DNN模型結構
深度神經(jīng)網(wǎng)絡一般由輸入層、隱層和輸出層組成。輸入層神經(jīng)元的個數(shù)為輸入信號的維數(shù),本文設置為22,隱藏層個數(shù)以及隱藏層節(jié)點的個數(shù)一般首先取經(jīng)驗值,然后通過實驗確定最優(yōu)參數(shù),由于本文所處理的問題規(guī)模不是非常大,所以隱藏層不宜過深,優(yōu)先考慮1~3個隱藏層的網(wǎng)絡結構。隱層節(jié)點數(shù)確定的最基本原則是:大于1且小于樣本數(shù),隱藏層節(jié)點數(shù)過少時模型無法學習到有效特征,過大時容易過擬合,因此,在滿足精度要求的前提下取盡可能緊湊的結構,即取盡可能少的隱層節(jié)點數(shù)。輸出層神經(jīng)元個數(shù)為輸出信號的維數(shù),本文的判別類型為6類,因此,對輸出做one-hot編碼后的輸出維數(shù)是6,最后將輸出向量解碼就可以獲得對應的水源類別。
如圖1所示,輸入向量為X=(x1,x2,x3,…,x22),第一個隱藏層的向量值為Y1,第二個隱藏層的向量值為Y2,模型的輸出為O。輸入層與第一個隱藏層的權重矩陣為V,兩個隱藏層之間的權重矩陣為W,第二個隱藏層與輸出層之間的權重矩陣為U,則有:
公式中矩陣V大小為n×m,m為輸入向量維數(shù)22,n為第一層隱藏層節(jié)點個數(shù),矩陣W大小為k×n,k為第二個隱藏層節(jié)點數(shù),矩陣U大小為l×k,l為輸出層維數(shù)6。
隱藏層的激活函數(shù)f(x)選擇ReLU(Rectified Linear Unit),ReLU是一個分段函數(shù),能有效解決深度神經(jīng)網(wǎng)絡梯度消失問題。其函數(shù)表達式為:
2.2 煤礦突水水源判別因子
煤礦中各含水層由于其所處的地質(zhì)環(huán)境不同,形成了各自不同的水化學特征,根據(jù)出水點的水化學特征分析結果可以初步判定突水水源。判定水源的過程中,評價指標的選擇與含水層及評價的目的有密切的關系,一般選擇含水層中的主要因素作為評價因子。
本文所研究的礦井突水水源主要分為6種,分別為:K2灰?guī)r、奧灰水、采空區(qū)水、地表水、第四系、砂巖裂隙水。通過測量與分析煤礦突水含水層水樣,綜合考慮建立指標體系的科學性、系統(tǒng)性、可操作性、定性與定量相結合等原則,結合礦井水質(zhì)的基本概念,在礦井水質(zhì)中選擇pH值、游離 CO2、鉀離子、鈉離子、鈣離子、鎂離子、三價鐵、二價鐵、銨離子、氯離子、硫酸根、碳酸根、碳酸氫根、硝酸根、亞硝酸根、礦化度(Z1)、總硬度(Z2)、碳酸硬度(Z3)、非碳酸硬度(Z4)、負硬度(Z5)、總堿度(Z6)、總酸度(Z7)等22個評價因素作為分類標示指標,單位均為mg/ L,總共分為6種類別(T),1代表K2灰?guī)r水,2代表奧灰水,3代表采空區(qū)水,4代表地表水,5代表第四系水,6代表砂巖裂隙水,判別突水水源類型效果良好,部分數(shù)據(jù)如表1—2所示。
2.3 DNN突水水源判別模型的應用于評價
本文采用62條樣本數(shù)據(jù)作為訓練集,每條輸入數(shù)據(jù)包含22維,對20條待判樣本數(shù)據(jù)進行分析,判定每一個水樣所屬的水源類型。
本文采用權重初始化采用MSRA方法,隱藏層激活函數(shù)選取ReLU函數(shù),輸出層激活函數(shù)選擇Softmax,由于是二分類算法,選擇交叉熵損失函數(shù)categorical_crossentropy,即logloss。DropOut可以有效防止模型過擬合,提升模型性能,一般設置為0.5,訓練算法采用目前最好的Adam算法。batch_size選擇12,隱藏層節(jié)點數(shù)為32。
圖1 雙隱藏層的DNN模型
表1 部分數(shù)據(jù)
表2 部分數(shù)據(jù)
圖2 模型訓練精度和損失變化
本文構建了雙隱藏層的DNN網(wǎng)絡用于處理突水水源判識問題,模型精度明顯高于聚類分析和灰色關聯(lián)分析以及Bayes方法,判識結果如表3所示,且DNN的預測精度會隨著訓練樣本的增加而提高。
表3 實驗結果精度對比
本文首先總結并分析了常用的水源判別方法,針對已有方法存在的缺點,提出采用DNN模型判別突水水源,選擇水化學指標、pH值等22項指標作為模型輸入,使用62個樣本數(shù)據(jù)訓練模型,20個樣本做測試集,并與聚類分析、灰色關聯(lián)分析和貝葉斯模型的分類精度作對比,驗證了DNN模型在突水水源識別上的準確性。
[1]HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006(7):1527-1554.
[2]NAIR V, HINTON G E.Rectified linear units improve restricted boltzmann machines[C].International Conference on Machine Learning, 2010:807-814.
[3]李燕,徐志敏,劉勇.礦井突水水源判別方法概述[J].煤炭技術,2010(11):87-89.
[4]衛(wèi)文學,盧新明,施龍青.礦井出水點多水源判別方法[J].煤炭學報,2010(5):811-815.
[5]朱衍利,石磊,李萬業(yè),等.水化學特征分析法在突水水源判別中的應用[J].山東煤炭科技,2010(1):189-190.
Source Identification of coal mine water inrush based on deep neural network
Cao Chaofan
(Xi’an University of Architecture and Technology, Xi’an 710055, China)
By studying the existing method of water inrush, it is found that there is a problem that the convergence rate is slow and the local function has a local minimum point, resulting in a lower accuracy. In order to improve the accuracy of water source identification, the paper proposes to use the Deep Neural Network (DNN) to determine the water inrush from coal mine. The water source identification model is established by using the index attributes such as chemical data, salinity, total hardness, carbonic acid hardness, non-carbonic acid hardness, negative hardness, total alkalinity and total acidity as the discriminant factors. Through the comparison experiment, the results show that DNN model can effectively improve the accuracy of waterfront identification.
coal mine water inrush; water source identification; DNN
曹超凡(1992— ),男,陜西西安。