李海濤,張海寬,齊慶新
(1.煤炭科學(xué)研究總院有限公司 深地科學(xué)研究院,北京 100013;2.煤炭資源高效開(kāi)采與潔凈利用國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100013)
煤礦沖擊地壓具有發(fā)生突然、破壞猛烈的特點(diǎn)[1-4],會(huì)造成巷道大范圍破壞甚至人員傷亡,是對(duì)于煤礦安全生產(chǎn)威脅最為嚴(yán)重的災(zāi)害之一,基于可靠數(shù)據(jù)提升沖擊危險(xiǎn)性預(yù)測(cè)的準(zhǔn)確性,對(duì)于有效防治沖擊地壓具有十分重要的意義。目前,學(xué)者們主要通過(guò)將多類型數(shù)據(jù)進(jìn)行權(quán)重融合[5-11]以實(shí)現(xiàn)對(duì)于目標(biāo)區(qū)域危險(xiǎn)性的評(píng)價(jià)。
微震監(jiān)測(cè)以其較大的空間覆蓋能力和相對(duì)高質(zhì)量的監(jiān)測(cè)數(shù)據(jù),為煤礦沖擊危險(xiǎn)性分析預(yù)測(cè)提供了可靠的支撐[12-14]。在對(duì)礦井中危險(xiǎn)災(zāi)害的分析和預(yù)測(cè)研究方面,相關(guān)研究利用微震監(jiān)測(cè)數(shù)據(jù)的時(shí)序、地點(diǎn)、能量和應(yīng)力等數(shù)據(jù)對(duì)機(jī)器學(xué)習(xí)算法或其他算法進(jìn)行訓(xùn)練,然后預(yù)測(cè)礦井中的危險(xiǎn)災(zāi)害。竇林名等[15]以微震為主,通過(guò)選取沖擊變形能、時(shí)序集中度、時(shí)空擴(kuò)散性等13 個(gè)監(jiān)測(cè)預(yù)警指標(biāo),搭建了集成微震、應(yīng)力、鉆屑等多種監(jiān)測(cè)手段的沖擊礦壓風(fēng)險(xiǎn)智能判識(shí)與多參量監(jiān)測(cè)預(yù)警云平臺(tái);YIN 等[16-17]利用應(yīng)力、扭矩、體積、應(yīng)力變化等微震監(jiān)測(cè)數(shù)據(jù)基于集成算法和神經(jīng)網(wǎng)絡(luò)算法對(duì)沖擊地壓的預(yù)測(cè)進(jìn)行了研究,并取得了較好的效果。相關(guān)礦井中危險(xiǎn)災(zāi)害分析和研究很少考慮危險(xiǎn)災(zāi)害的前兆信息、時(shí)空特性和發(fā)生機(jī)理等信息,且多數(shù)礦井中僅有時(shí)序、地點(diǎn)和能量等監(jiān)測(cè)數(shù)據(jù),這些方法無(wú)法在實(shí)際工程中廣泛使用。
基于微震監(jiān)測(cè)數(shù)據(jù)對(duì)礦井中沖擊地壓發(fā)生機(jī)理的研究中,學(xué)者們通過(guò)對(duì)礦區(qū)整體微震活動(dòng)時(shí)空分布特征的研究認(rèn)為微震參數(shù)的變化規(guī)律可作為預(yù)測(cè)地壓災(zāi)害的前兆特征[18]。袁瑞甫等[19]研究了煤柱型沖擊地壓微震信號(hào)分布特征后,總結(jié)了沖擊地壓發(fā)生前有一段微震活躍期、靜默期、和發(fā)生地點(diǎn)集中等沖擊地壓發(fā)生的前兆信息。相關(guān)機(jī)理研究可以為分析和預(yù)測(cè)方法中數(shù)據(jù)集特征的建立提供一定依據(jù),從而提高基于機(jī)器學(xué)習(xí)算法對(duì)礦井中危險(xiǎn)災(zāi)害的分析預(yù)測(cè)的準(zhǔn)確率和泛用性。
與沖擊地壓對(duì)應(yīng)的微震事件樣本量極為有限,而常規(guī)微震事件雖然樣本體量大,但往往缺乏訓(xùn)練標(biāo)簽,均無(wú)法支撐機(jī)器學(xué)習(xí)模型的應(yīng)用。為此,通過(guò)跟蹤某礦井微震事件及其對(duì)應(yīng)的礦壓顯現(xiàn)特征,并將能夠產(chǎn)生明顯震感或動(dòng)力顯現(xiàn)特征的微震事件標(biāo)注為“危險(xiǎn)事件”,以此獲得含標(biāo)簽的大體量微震數(shù)據(jù)集;并進(jìn)一步針對(duì)無(wú)法準(zhǔn)確判定某次微震事件危險(xiǎn)性的問(wèn)題,考慮沖擊地壓的發(fā)生機(jī)制和前兆信息,基于深度學(xué)習(xí)模型提出了分析礦井中微震危險(xiǎn)性的方法。該方法主要分為3 個(gè)步驟:選取分析特征;建立數(shù)據(jù)集和處理不平衡樣本;訓(xùn)練和測(cè)試基于深度學(xué)習(xí)的分析模型,將該模型用于分析某礦井微震監(jiān)測(cè)數(shù)據(jù)取得了較好的效果,同時(shí)大量實(shí)驗(yàn)驗(yàn)證了該模型具備了較好的泛化能力。
考慮沖擊地壓的前兆信息,基于CNN-GRU 模型(卷積神經(jīng)網(wǎng)絡(luò)[20]-門(mén)控循環(huán)單元模型[21])提出了利用微震監(jiān)測(cè)數(shù)據(jù)分析沖擊危險(xiǎn)性的方法(卷積神經(jīng)網(wǎng)絡(luò)-門(mén)控循環(huán)單元模型)。
由于多數(shù)礦井微震監(jiān)測(cè)數(shù)據(jù)的特征主要包括時(shí)間、地點(diǎn)、能量,因此考慮沖擊地壓發(fā)生的前兆信息[15,18-19],建立了微震事件的時(shí)序集中度、2 次微震事件時(shí)間間隔、空間密集度、能量和能量集中度5 個(gè)分析特征。
根據(jù)相關(guān)研究,沖擊地壓等礦井動(dòng)力災(zāi)害發(fā)生前有一段明顯的微震活躍期,這是因?yàn)閲鷰r正在與外界發(fā)生能量交換,圍巖結(jié)構(gòu)處于非穩(wěn)態(tài)的調(diào)整期,這一性質(zhì)用時(shí)序集中度表示為:
在大能量的危險(xiǎn)事件發(fā)生前,微震活動(dòng)會(huì)出現(xiàn)較短的平靜時(shí)期,一般稱為靜默期,但不同危險(xiǎn)事件的靜默期長(zhǎng)短相差較大,靜默期可用本次微震時(shí)間與上次微震時(shí)間間隔表示ΔT。
微震事件的空間分布與微裂隙在巖體內(nèi)部空間的發(fā)生發(fā)展過(guò)程相對(duì)應(yīng),因此分析微震事件的空間分布規(guī)律變化對(duì)于了解巖體穩(wěn)定性有重要作用,在沖擊地壓等危險(xiǎn)事件發(fā)生前微震的空間密集度會(huì)明顯上升,可表示為:
礦山中沖擊地壓的發(fā)生時(shí),巷道周圍圍巖體中的壓力由穩(wěn)態(tài)增加至極限值,會(huì)造成巖體內(nèi)能量突然釋放,能量是分析礦山?jīng)_擊地壓等危險(xiǎn)事件的重要特征。同時(shí),建立了能量集中度指標(biāo)來(lái)反映沖擊地壓發(fā)生前的能量變化和微震分布情況,計(jì)算公式如下:
由于幾種監(jiān)測(cè)數(shù)據(jù)的數(shù)值大小不一,在分析指標(biāo)建立之后需對(duì)能量指標(biāo)進(jìn)行標(biāo)準(zhǔn)化進(jìn)行處理,公式為:
式中:xi、yi為標(biāo)準(zhǔn)化處理前后的第i 個(gè)數(shù)據(jù)值;n 為監(jiān)測(cè)事件總數(shù)。
對(duì)數(shù)據(jù)集建立和處理步驟為:①根據(jù)分析特征和微震監(jiān)測(cè)事件的危險(xiǎn)性建立初始數(shù)據(jù)集;②在時(shí)間尺度上將初始數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;③對(duì)分割后的每個(gè)數(shù)據(jù)集進(jìn)行樣本不平衡性的處理。上述步驟的順序和處理方法不可改變,如果對(duì)樣本的不平衡處理出現(xiàn)在分割數(shù)據(jù)集之前,或不在時(shí)間尺度上而是隨機(jī)分割數(shù)據(jù)集,會(huì)出現(xiàn)模型在訓(xùn)練集或驗(yàn)證集上效果極好,但在真實(shí)數(shù)據(jù)的測(cè)試集上效果極差的現(xiàn)象。
分析框架中的數(shù)據(jù)集以根據(jù)微震監(jiān)測(cè)數(shù)據(jù)建立的分析特征為數(shù)據(jù)集特征,以微震事件的危險(xiǎn)性作為標(biāo)簽建立數(shù)據(jù)集??紤]到各個(gè)監(jiān)測(cè)數(shù)據(jù)的數(shù)量級(jí)不同,需對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,訓(xùn)練模型中使用的損失函數(shù)為交叉熵,因此對(duì)標(biāo)簽進(jìn)行One-Hot 編碼處理。
對(duì)于不同礦井或同一礦井的不同開(kāi)采地點(diǎn),微震監(jiān)測(cè)數(shù)據(jù)對(duì)應(yīng)的地質(zhì)環(huán)境是不同的,部分沖擊地壓等危險(xiǎn)事件的分析模型在測(cè)試集上效果很好卻很難直接應(yīng)用。因此,為模擬現(xiàn)實(shí)工程的直接應(yīng)用情況,本框架將數(shù)據(jù)集在時(shí)間尺度上分為訓(xùn)練集、驗(yàn)證集和測(cè)試集3 個(gè)部分,將訓(xùn)練集數(shù)據(jù)輸入到模型中進(jìn)行訓(xùn)練,在驗(yàn)證集上對(duì)訓(xùn)練的結(jié)果進(jìn)行評(píng)價(jià),選取性能最好的模型直接應(yīng)用到測(cè)試集中驗(yàn)證模型的泛化性能。
開(kāi)采過(guò)程中危險(xiǎn)事件對(duì)應(yīng)的微震監(jiān)測(cè)數(shù)據(jù)數(shù)量要遠(yuǎn)遠(yuǎn)小于不危險(xiǎn)事件,所以在訓(xùn)練模型之前需要處理不平衡數(shù)據(jù)。目前,從數(shù)據(jù)角度出發(fā)的不平衡數(shù)據(jù)處理方法主要有采樣和數(shù)據(jù)合成方法。其中采樣可分為從少數(shù)類樣本中隨機(jī)采樣來(lái)增加新的樣本的上采樣方法和從多數(shù)類樣本中隨機(jī)選擇少量樣本,再合并原有少數(shù)類樣本作為新的訓(xùn)練數(shù)據(jù)集的下采樣方法。數(shù)據(jù)合成方法是利用已有樣本生成更多樣本,這類方法在小數(shù)據(jù)場(chǎng)景下有很多成功案例,其方法包括合成少數(shù)類過(guò)采樣技術(shù)(SMOTE[22])和自適應(yīng)合成方法(ADASYN[23]),SMOTE 算法的對(duì)少數(shù)類樣本進(jìn)行分析并根據(jù)少數(shù)類樣本通過(guò)人工合成新樣本然后添加到數(shù)據(jù)集中,其改進(jìn)算法包括Borderline-SMOTE[24]等;ADASYN 主要思想是根據(jù)數(shù)據(jù)分布情況為不同的少數(shù)類樣本生成不同數(shù)量的新樣本。根據(jù)對(duì)礦山微震監(jiān)測(cè)數(shù)據(jù)的研究,礦山監(jiān)測(cè)數(shù)據(jù)中危險(xiǎn)事件分布位置呈現(xiàn)分散且分布于非危險(xiǎn)事件之間的特點(diǎn),因此主要使用對(duì)采樣數(shù)據(jù)添加擾動(dòng)的上采樣方法處理不平衡數(shù)據(jù)集。
近些年來(lái)卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像視覺(jué)領(lǐng)域取得了巨大的成功,CNN 是1 個(gè)深度學(xué)習(xí)框架,其靈感來(lái)自于貓的大腦視覺(jué)皮層[25]。CNN 的體系結(jié)構(gòu)可以有所不同,通常由幾個(gè)卷積層、激活層組成,在計(jì)算機(jī)視覺(jué)領(lǐng)域一般也包含池化層或全連接層,其作用是保證卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)圖片分類任務(wù)的平移不變性,由于每組數(shù)據(jù)有限,因此構(gòu)建的CNN 結(jié)構(gòu)中只有卷積層和激活層。卷積層的作用是提取數(shù)據(jù)中的代表性特征,多個(gè)卷積核存在于1 個(gè)卷積層中,也被稱為濾波器。該濾波器類似于1 個(gè)滑動(dòng)窗口,它在數(shù)值矩陣中以特定的步幅來(lái)回移動(dòng)。在對(duì)濾波器和數(shù)值矩陣進(jìn)行卷積運(yùn)算后,可以得到圖像的初始特征圖,并將其發(fā)送到卷積層的激活函數(shù)中。卷積核運(yùn)算示意如圖1。
圖1 卷積核運(yùn)算示意Fig.1 Schematic diagram of convolution kernel operation
通常在特征提取之后會(huì)引入正則化方法,來(lái)加快網(wǎng)絡(luò)訓(xùn)練和收斂速度,防止模型梯度爆炸和過(guò)擬合,目前主流方法有批正則化[26](Batch Normalization)和Dropout[27]方法。將提取的特征輸入到激活函數(shù)中來(lái)為卷積神經(jīng)網(wǎng)絡(luò)中加入非線性因素,卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)中使用的激活函數(shù)為Relu[28]函數(shù),其公式如下:
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)對(duì)于序列數(shù)據(jù)的處理?yè)碛芯薮蟮膬?yōu)勢(shì),因?yàn)槠鋵?shí)一類以序列數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸且所有節(jié)點(diǎn)(循環(huán)單元)按鏈?zhǔn)竭B接的遞歸神經(jīng)網(wǎng)絡(luò)。長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)[29]和門(mén)控循環(huán)單元(GRU)[21]是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的主要變種(目前也有學(xué)者認(rèn)為GRU 是LSTM 的變種),考慮到參數(shù)的數(shù)量和計(jì)算效果,在構(gòu)建模型中選取門(mén)控循環(huán)單元(GRU)。
單個(gè)門(mén)控循環(huán)單元(GRU)結(jié)構(gòu)如圖2。
圖2 門(mén)控循環(huán)單元結(jié)構(gòu)Fig.2 Door control cycle unit structure
重置門(mén)和更新門(mén)的輸入均為當(dāng)前時(shí)間步輸入Xt與上一時(shí)間步隱藏狀態(tài)Ht-1,輸出由激活函數(shù)為Sigmoid 函數(shù)的全連接層計(jì)算得到。Sigmoid 函數(shù)、重置門(mén)Rt和更新門(mén)Zt的計(jì)算如下:
式中:Wxr、Wxz、Whr、Whz為權(quán)重參數(shù);br、bz為偏差參數(shù);h 為隱藏單元個(gè)數(shù);Xt為給定時(shí)間步t 的小批量輸入;Ht-1為上一時(shí)間步的隱藏狀態(tài)。
將當(dāng)前時(shí)間步重置門(mén)的輸出與上一時(shí)間步隱藏狀態(tài)做元素乘法(符號(hào)為⊙)。如果重置門(mén)中元素值接近0,那么意味著重置對(duì)應(yīng)隱藏狀態(tài)元素為0,即丟棄上一時(shí)間步的隱藏狀態(tài)。如果元素值接近1,那么表示保留上一時(shí)間步的隱藏狀態(tài)。然后,將按元素乘法的結(jié)果與當(dāng)前時(shí)間步的輸入連結(jié),再通過(guò)含激活函數(shù)tanh 的全連接層計(jì)算出候選隱藏狀態(tài),其所有元素的值域?yàn)椋郏?,1]。具體來(lái)說(shuō),tanh 激活函數(shù)和時(shí)間步t 的候選隱藏狀態(tài)的公式為:
隨著計(jì)算機(jī)視覺(jué)相關(guān)研究的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的聯(lián)合神經(jīng)網(wǎng)絡(luò)(CNN-RNN)在圖像字幕領(lǐng)域取得了較大進(jìn)展,其主要通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像的空間結(jié)構(gòu)和相關(guān)信息進(jìn)行特征提取,然后將提取的特征輸入到RNN 網(wǎng)絡(luò)中生成對(duì)應(yīng)圖片信息相關(guān)的解釋。受圖像字幕領(lǐng)域的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)啟發(fā),對(duì)于微震數(shù)據(jù)相關(guān)特征的分析首先利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)分析特征進(jìn)行信息提取和信息融合等操作,然后以提取的特征作為初始隱藏狀態(tài),將分類特征作為輸入?yún)?shù)。
建立的CNN-GRU 聯(lián)合卷積神經(jīng)網(wǎng)絡(luò),主要由5 層卷積神經(jīng)網(wǎng)絡(luò)層、5 個(gè)門(mén)控循環(huán)單位結(jié)構(gòu)和2 層全連接層構(gòu)成,由于輸入的分析特征尺寸較小所以設(shè)計(jì)的模型較為簡(jiǎn)單且卷積神經(jīng)網(wǎng)絡(luò)中沒(méi)有pooling 層,該模型在實(shí)驗(yàn)中取得效果最好。在CNN 模型輸入中可將4 個(gè)分析特征視為4 個(gè)特征或1 個(gè)特征的4 個(gè)數(shù)據(jù),主要使用前者輸入,CNN 模型結(jié)構(gòu)中1×1 卷積主要起到信息升維度和跨通道融合的作用,3×3 和2×2 卷積主要起到增加同一通道的信息交流的作用。即使增加模型的層數(shù)也不會(huì)提升模型在測(cè)試集上的效果,且會(huì)出現(xiàn)網(wǎng)絡(luò)退化現(xiàn)象,即層數(shù)增加反而導(dǎo)致模型的訓(xùn)練效果和測(cè)試效果均下降。參考ResNet[30]和DenseNet[31]網(wǎng)絡(luò)結(jié)構(gòu),即使模型加入恒等映射,在測(cè)試集上的效果也未提升。
使用某煤礦礦井的微震監(jiān)測(cè)數(shù)據(jù)對(duì)建立的分析框架進(jìn)行驗(yàn)證,該微震監(jiān)測(cè)數(shù)據(jù)包括從2017 年1 月到2018 年7 月的13 583 條數(shù)據(jù),監(jiān)測(cè)內(nèi)容包括微震發(fā)生時(shí)間、地點(diǎn)和能量,在13 583 條數(shù)據(jù)中強(qiáng)震動(dòng)對(duì)應(yīng)的危險(xiǎn)事件數(shù)量為114。首先根據(jù)微震監(jiān)測(cè)數(shù)據(jù)計(jì)算時(shí)序集中度、空間密集度、時(shí)間間隔和能量作為數(shù)據(jù)集特征,以是否發(fā)生危險(xiǎn)事件作為標(biāo)簽,然后在時(shí)間尺度上按照50%、20%和30%的數(shù)量將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。時(shí)序集中度和空間密集度需要根據(jù)前n 次微震事件的數(shù)據(jù)進(jìn)行計(jì)算,取n=1,2,…,30,建立30 組數(shù)據(jù)集。為模擬模型的直接應(yīng)用情況,然后對(duì)訓(xùn)練集和驗(yàn)證集的聯(lián)合數(shù)據(jù)集、測(cè)試集分別數(shù)據(jù)不平衡處理,使測(cè)試集的數(shù)據(jù)不與其他數(shù)據(jù)集有交叉,考慮到對(duì)危險(xiǎn)事件預(yù)測(cè)的重要性設(shè)定了3 個(gè)測(cè)試集,分別為單獨(dú)危險(xiǎn)事件的測(cè)試集、單獨(dú)不危險(xiǎn)事件的測(cè)試集和混合事件測(cè)試集,混合事件測(cè)試集中使用上采樣加擾動(dòng)的方法使兩種事件的樣本數(shù)量幾乎相同。使用CNN-GRU模型計(jì)算,需要計(jì)算的參數(shù)為3 446 個(gè),模型中使用Adam 優(yōu)化器和Cross Entropy Loss 損失函數(shù),學(xué)習(xí)率為0.01。最后將處理的數(shù)據(jù)輸入到CNN-GRU 模型中,得到的30 組計(jì)算結(jié)果如圖3。
圖3 CNN-GRU 模型在融合前n 次微震事件數(shù)據(jù)的測(cè)試結(jié)果(n=1,2,…,30)Fig.3 Test results of n microseismic event data of CNN-GRU model before fusion(n=1,2,…,30)
通過(guò)計(jì)算結(jié)果可以看出,模型在不同數(shù)據(jù)集上達(dá)到最高準(zhǔn)確率時(shí),所對(duì)應(yīng)的n 不同:①當(dāng)n=8 時(shí)模型在混合事件測(cè)試集上取得最佳效果,準(zhǔn)確率為79.72%,該模型在危險(xiǎn)事件數(shù)據(jù)集上準(zhǔn)確率為81.98%,在非危險(xiǎn)事件測(cè)試集上準(zhǔn)確率為76.11%,此時(shí)模型在驗(yàn)證集準(zhǔn)確率為79.05%(因驗(yàn)證集和測(cè)試集都未參與訓(xùn)練,所以模型在測(cè)試集上的準(zhǔn)確率高于驗(yàn)證集是合理的),這與模型在混合測(cè)試集上的準(zhǔn)確率相近,說(shuō)明該模型的遷移效果極好;②模型在非危險(xiǎn)數(shù)據(jù)集上的最高準(zhǔn)確率出現(xiàn)在n=19時(shí),準(zhǔn)確率為94.96%,但此模型在危險(xiǎn)數(shù)據(jù)集上的準(zhǔn)確率0,其在混合測(cè)試集上的表現(xiàn)最差,這可能和監(jiān)測(cè)數(shù)據(jù)的分布有關(guān);③而當(dāng)n=1 時(shí),模型在非危險(xiǎn)數(shù)據(jù)集上準(zhǔn)確率僅為4.39%,而在危險(xiǎn)數(shù)據(jù)集上的準(zhǔn)確率為99.09%。這是因?yàn)閷?duì)微震事件的危險(xiǎn)性進(jìn)行分析是二分類任務(wù),在不能準(zhǔn)確確定閾值的情況下,當(dāng)1 個(gè)模型將更多的事件分為危險(xiǎn)事件時(shí),其在危險(xiǎn)數(shù)據(jù)集上的準(zhǔn)確率就更高,在不危險(xiǎn)數(shù)據(jù)集上的準(zhǔn)確率就更低,反之亦然。模型在混合測(cè)試集上的結(jié)果在進(jìn)行微震事件危險(xiǎn)性的分析時(shí)更具有參考意義。
使用單獨(dú)CNN 和單獨(dú)GRU 模型對(duì)2 節(jié)中煤礦礦井的微震監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析,分析流程除了神經(jīng)網(wǎng)絡(luò)模型不同外其他均相同。2 個(gè)模型訓(xùn)練過(guò)程中均使用Adam 優(yōu)化器和Cross Entropy Loss 損失函數(shù),CNN 模型參數(shù)總數(shù)為1 384 個(gè),GRU 模型參數(shù)總數(shù)為412 個(gè)。取n=1,2,…,30,建立30 組數(shù)據(jù)集,CNN-GRU 模型、CNN 模型和GRU 模型融合前n 次微震事件數(shù)據(jù)的測(cè)試結(jié)果對(duì)比如圖4。
圖4 3 種模型在測(cè)試集上的效果對(duì)比Fig.4 Comparison of the effects of three models on test sets
通過(guò)圖4 可以發(fā)現(xiàn):當(dāng)n 變化時(shí)(除去n=18時(shí)),GRU 模型在全部測(cè)試集上的表現(xiàn)都相對(duì)穩(wěn)定,不同CNN 模型在測(cè)試集上的性能變化很大,但最高準(zhǔn)確率大于GRU 模型的最高準(zhǔn)確率;多數(shù)情況下,GRU 模型在混合數(shù)據(jù)集上的性能表現(xiàn)好于CNN 模型,這主要是因?yàn)闃?gòu)建的數(shù)據(jù)集中每個(gè)樣本包含數(shù)據(jù)量很少,CNN 模型不能充分發(fā)揮其數(shù)據(jù)信息的融合和提取能力,而GRU 模型可以對(duì)樣本數(shù)據(jù)的時(shí)序進(jìn)行分析。
在大多數(shù)情況下CNN-GRU 模型在混合數(shù)據(jù)集上的效果好于GRU 模型,其原因主要如下:①在GRU 模型基礎(chǔ)上聯(lián)合CNN 模型,增加了神經(jīng)網(wǎng)絡(luò)模型參數(shù)和激活函數(shù),從而增加了神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度、非線性和泛化能力;②雖然不能充分發(fā)揮其優(yōu)勢(shì),但在CNN-GRU 模型中,CNN 模型仍然融合和提取了樣本數(shù)據(jù)的一部分信息,有助于GRU和全連接網(wǎng)絡(luò)對(duì)樣本進(jìn)行分類。
CNN-GRU 模型繼承了2 種單獨(dú)模型的優(yōu)點(diǎn),其在混合測(cè)試集上的表現(xiàn)相對(duì)穩(wěn)定且準(zhǔn)確率是極高的;CNN-GRU 模型最高準(zhǔn)確率為79.72%(n=8),略小于CNN 模型的最高準(zhǔn)確率80.04%(n=25)。此時(shí)CNN-GRU 模型在危險(xiǎn)數(shù)據(jù)集和非危險(xiǎn)數(shù)據(jù)集上取得的準(zhǔn)確率相差不大,分別為76.11%和81.92%;而CNN 模型在危險(xiǎn)和非危險(xiǎn)數(shù)據(jù)集上準(zhǔn)確率為68.59%和90.53%,可見(jiàn)CNN 模型對(duì)于危險(xiǎn)事件的信息提取能力較差??紤]到礦井中對(duì)危險(xiǎn)微震事件分析準(zhǔn)確的重要性,認(rèn)為CNN-GRU 模型在分析微震危險(xiǎn)性方面是性能最好的。
當(dāng)n=8 時(shí)CNN-GRU 模型、CNN 模型和GRU模型的訓(xùn)練損失如圖5。收斂速度快慢和模型損失從小到大依次是CNN-GRU 模型、CNN 模型、GRU模型,這可能是因?yàn)樵谟?xùn)練時(shí)CNN-GRU 模型計(jì)算參數(shù)最多而GRU 模型訓(xùn)練參數(shù)最少。經(jīng)過(guò)對(duì)比分析發(fā)現(xiàn)在分析方法框架中,CNN-GRU 模型取得效果最好,GRU 模型參數(shù)最少且計(jì)算效果較好,證明GRU 模型的參數(shù)使用效率最高。
圖5 數(shù)據(jù)集特征融合前8 次微震事件數(shù)據(jù)時(shí)各模型在訓(xùn)練時(shí)損失值Fig.5 The loss value of each model during training when the data set features are fused with the data of the previous 8 micro-seismic events
在以往基于機(jī)器學(xué)習(xí)(深度學(xué)習(xí))對(duì)沖擊地壓預(yù)測(cè)的研究中,多數(shù)學(xué)者忽略微震監(jiān)測(cè)數(shù)據(jù)的時(shí)空特性或前兆特征,且相關(guān)研究中也很少將數(shù)據(jù)集分為訓(xùn)練集、測(cè)試集和驗(yàn)證集3 個(gè)部分,這也導(dǎo)致了模型完成訓(xùn)練后的泛化能力不能得到很好的保障。為分析方法中根據(jù)微震前兆特征對(duì)數(shù)據(jù)處理的重要性,將前8 次微震監(jiān)測(cè)數(shù)據(jù)的時(shí)間、能量和地點(diǎn)(x,y,z)作為1 個(gè)樣本的特征(尺寸為[5,8]),在時(shí)間尺度上按照5∶2∶3 的數(shù)量比例將數(shù)據(jù)集分為訓(xùn)練集、測(cè)試集和驗(yàn)證集3 個(gè)部分,事件的危險(xiǎn)性作為標(biāo)簽。使用如圖4 的CNN-GRU 模型(輸入特征尺寸和中間參數(shù)尺寸有修改)對(duì)微震危險(xiǎn)事件進(jìn)行分析,在驗(yàn)證集(危險(xiǎn)事件與非危險(xiǎn)事件混合)上的最高準(zhǔn)確率為97.33%,但在混合測(cè)試集上準(zhǔn)確率為49.79%,在危險(xiǎn)事件測(cè)試集上準(zhǔn)確率為98.81%,在非危險(xiǎn)測(cè)試集上準(zhǔn)確率為0。盡管該模型在驗(yàn)證集上取得了極高的準(zhǔn)確率,但在混合測(cè)試集和危險(xiǎn)事件測(cè)試集上準(zhǔn)確率極差,說(shuō)明不考慮微震前兆特征的危險(xiǎn)性分析方法的泛化性能很差,分析的結(jié)果不具有參考意義。
1.1 節(jié)構(gòu)建了4 個(gè)分析指標(biāo),為證明基于學(xué)習(xí)方法分析微震數(shù)據(jù)中危險(xiǎn)事件規(guī)律的可行性,根據(jù)以往相關(guān)研究選取微震監(jiān)測(cè)事件的時(shí)空擴(kuò)散性ds、時(shí)間信息熵Q1、總應(yīng)力當(dāng)量Q32作為額外特征,相關(guān)計(jì)算公式如下:
使用CNN-GRU 模型,取n=1,2,…,30 時(shí)各指標(biāo)組合的訓(xùn)練模型在混合測(cè)試集上的最佳效果通過(guò)對(duì)比發(fā)現(xiàn),能量對(duì)于分析本次微震事件的危險(xiǎn)性是十分重要的,盡管當(dāng)指標(biāo)組合為時(shí)序集中度QT、時(shí)間間隔ΔT、能量E、能量密集度QE時(shí)模型準(zhǔn)確率為80.16%,但其在危險(xiǎn)和非危險(xiǎn)數(shù)據(jù)集上表現(xiàn)效果相差較大,因此認(rèn)為時(shí)序集中度QT、時(shí)間間隔ΔT、空間密集度E、能量密集度QE、時(shí)空擴(kuò)散性QR對(duì)分析微震事件都是有貢獻(xiàn)的;時(shí)空擴(kuò)散性ds和時(shí)間信息熵Q1對(duì)于該礦井中微震危險(xiǎn)性分析影響不大;Q32特征甚至?xí)?yán)重影響對(duì)微震事件危險(xiǎn)性的準(zhǔn)確分析。
以上分析和比較證明,在可用微震監(jiān)測(cè)數(shù)據(jù)較少的情況下,結(jié)合微震前兆特征對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行處理,可以明顯提高微震危險(xiǎn)性分析的準(zhǔn)確率。對(duì)于統(tǒng)一模型不同分析特征組合會(huì)取得不同的效果,有些分析特征會(huì)對(duì)模型的性能產(chǎn)生負(fù)面影響,所以在建立分析特征時(shí)需要充分分析危險(xiǎn)災(zāi)害的發(fā)生機(jī)理和前兆信息。
根據(jù)礦井中微震監(jiān)測(cè)信息對(duì)危險(xiǎn)事件進(jìn)行分析是十分復(fù)雜的,這主要是因?yàn)閷?duì)礦井中危險(xiǎn)事件的發(fā)生規(guī)律缺乏清晰的認(rèn)知,首先基于深度學(xué)習(xí)方法對(duì)礦井中危險(xiǎn)事件的發(fā)生的規(guī)律性進(jìn)行研究,然后根據(jù)已有研究成果和計(jì)算結(jié)果討論深度學(xué)習(xí)模型研究微震監(jiān)測(cè)數(shù)據(jù)中危險(xiǎn)事件的可行性。
訓(xùn)練的CNN-GRU 聯(lián)合模型在混合測(cè)試集上的最高準(zhǔn)確率是79.72%,表明該模型可以遷移應(yīng)用到其他礦井或同一礦井的不同地點(diǎn)中。若將標(biāo)簽設(shè)置為隨機(jī)產(chǎn)生,且取n=8,其它分析步驟不變,該分析方法得到的模型在驗(yàn)證集上最高準(zhǔn)確率為52.30%,在混合測(cè)試集上的準(zhǔn)確率為50.68%,這一特征間接證明了,對(duì)于具體礦井,其微震事件的發(fā)生是有一定規(guī)律可循的,是可以被學(xué)習(xí)的。
通過(guò)不同模型在3 種測(cè)試集上的準(zhǔn)確率對(duì)比發(fā)現(xiàn),絕大多數(shù)情況下模型在危險(xiǎn)事件測(cè)試集上的準(zhǔn)確率最高(多數(shù)在85%以上),在混合數(shù)據(jù)集上的準(zhǔn)確率次之,在危險(xiǎn)事件數(shù)據(jù)集上的準(zhǔn)確率最低。這可能主要是因?yàn)樵急O(jiān)測(cè)數(shù)據(jù)中非危險(xiǎn)事件的數(shù)量要遠(yuǎn)遠(yuǎn)大于危險(xiǎn)事件的數(shù)量,訓(xùn)練數(shù)據(jù)可以包含非危險(xiǎn)事件的全部類型,在訓(xùn)練過(guò)程中模型會(huì)抓取到礦井中非危險(xiǎn)事件的發(fā)生規(guī)律;而危險(xiǎn)事件發(fā)生的數(shù)量極少,訓(xùn)練數(shù)據(jù)甚至是全部監(jiān)測(cè)數(shù)據(jù)都不能包含危險(xiǎn)事件的全部類型。這也說(shuō)明了礦井中危險(xiǎn)事件與微震之間是有一定規(guī)律的,利用深度學(xué)習(xí)方法分析微震事件的危險(xiǎn)性是可行的。
1)考慮礦井沖擊地壓發(fā)生的前兆信息,基于CNN-GRU 模型提出了一種微震危險(xiǎn)性分析方法;在研究某礦山微震監(jiān)測(cè)數(shù)據(jù)過(guò)程中,該方法首先根據(jù)微震前兆特征選取時(shí)序集中度、時(shí)間間隔、空間密集度、能量和能量集中度作為分析特征;然后建立初始數(shù)據(jù)集,在時(shí)間尺度上將數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并分別處理不平衡樣本;最后使用訓(xùn)練集訓(xùn)練CNN-GRU 模型,將在驗(yàn)證集取得最好效果的模型用于測(cè)試,取得了79.72%的準(zhǔn)確率。
2)不同模型進(jìn)行對(duì)比分析結(jié)果顯示GRU 模型在測(cè)試集上表現(xiàn)穩(wěn)定,而CNN 模型表現(xiàn)不穩(wěn)定但最高準(zhǔn)確率要高于GRU 模型取得的最高準(zhǔn)確率,CNNGRU 模型擁有在測(cè)試集上表現(xiàn)穩(wěn)定且取得了最好效果的優(yōu)點(diǎn);在對(duì)3 種模型的訓(xùn)練損失對(duì)比中,CNN-GRU 模型收斂速度最快且最終損失最小。
3)該方法對(duì)分析特征的建立進(jìn)行研究后發(fā)現(xiàn),能量對(duì)于微震事件的危險(xiǎn)性分析極其重要。不考慮微震前兆特征,而直接使用原始數(shù)據(jù)進(jìn)行樣本不平衡處理,并對(duì)CNN-GRU 模型進(jìn)行訓(xùn)練,最終的模型在驗(yàn)證集上雖然準(zhǔn)確率較高,但在測(cè)試集上準(zhǔn)確率極低,而且通過(guò)對(duì)不同分析特征組合的研究也說(shuō)明建立正確的分析特征對(duì)CNN-GRU 模型準(zhǔn)確率的影響很大。
4)對(duì)微震監(jiān)測(cè)數(shù)據(jù)集的標(biāo)簽進(jìn)行隨機(jī)生成,然后利用該方法對(duì)隨機(jī)生成標(biāo)簽的數(shù)據(jù)進(jìn)行分析后取得的效果極差,證明了在選取合適分析特征的基礎(chǔ)上,利用深度學(xué)習(xí)方法對(duì)沖擊危險(xiǎn)狀態(tài)進(jìn)行分析是可靠的。