趙洪寶劉瑞劉一洪張一瀟顧濤
1. 中國(guó)礦業(yè)大學(xué)(北京)能源與礦業(yè)學(xué)院,北京 100083;
2. 河北省物聯(lián)網(wǎng)監(jiān)控工程技術(shù)研究中心,河北廊坊 065201
近年來(lái),微震監(jiān)測(cè)系統(tǒng)作為一種巖石狀態(tài)監(jiān)測(cè)手段,已廣泛應(yīng)用于礦山監(jiān)測(cè)中[1-5]。微震信號(hào)的高精度識(shí)別對(duì)于提高檢測(cè)系統(tǒng)可靠性,預(yù)測(cè)災(zāi)害發(fā)生具有重要的意義。但現(xiàn)存的礦山微震信號(hào)的識(shí)別方法精度和效率較低,因此需要開(kāi)發(fā)新的識(shí)別方法進(jìn)行識(shí)別。微震信號(hào)為一系列非線性隨機(jī)信號(hào),相對(duì)于其他信號(hào)較為復(fù)雜[6-7]。同時(shí),礦山生產(chǎn)過(guò)程中還存在大量背景或者人為干擾信號(hào),這些干擾信號(hào)對(duì)礦山微震信號(hào)的準(zhǔn)確識(shí)別造成了困難[8-9]。國(guó)內(nèi)外學(xué)者對(duì)微震信號(hào)識(shí)別開(kāi)展了廣泛研究,并取得了豐碩成果。趙國(guó)彥等[10-11]提出一種基于希爾伯特黃變換和分形維數(shù)相結(jié)合的識(shí)別方法;尚雪義等[12]將支持向量機(jī)與希爾伯特黃變換相結(jié)合,實(shí)現(xiàn)了機(jī)器學(xué)習(xí)方法與傳統(tǒng)方法的結(jié)合;董隴軍等[13]對(duì)波形參數(shù)進(jìn)行擴(kuò)充,將Fisher 判別法進(jìn)行改進(jìn),提高了識(shí)別精度;Zhang 等[14]融合決策樹(shù)與VMD,為礦山微震信號(hào)識(shí)別模型的構(gòu)建提供了一種新思路;朱權(quán)潔等[15]采用分形維數(shù)與小波包變換結(jié)合的方法,并用支持向量機(jī)(SVM)的方法對(duì)礦山微震信號(hào)進(jìn)行了分類(lèi)識(shí)別;Bi 等[16]基于DCNN 和SVM 相耦合進(jìn)行了礦山微震信號(hào)進(jìn)行識(shí)別。目前上述方法已運(yùn)用在機(jī)器學(xué)習(xí)領(lǐng)域中,但是未能深入到深度學(xué)習(xí)領(lǐng)域當(dāng)中。
王國(guó)法等[17]認(rèn)為,礦山領(lǐng)域中的深度學(xué)習(xí)是將來(lái)研究發(fā)展的重點(diǎn)。而目前存在的大量方法均為機(jī)器學(xué)習(xí),無(wú)法深入到深度學(xué)習(xí),因此開(kāi)發(fā)深度學(xué)習(xí)識(shí)別模式非常有必要。同時(shí),特征深度學(xué)習(xí)區(qū)別于機(jī)器學(xué)習(xí),關(guān)鍵因素是機(jī)器是否自動(dòng)提取[18]。因此需要研究開(kāi)發(fā)新的深度學(xué)習(xí)網(wǎng)絡(luò)識(shí)別方法,以實(shí)現(xiàn)礦山生產(chǎn)過(guò)程中信號(hào)特征的自動(dòng)提取和信號(hào)種類(lèi)的自動(dòng)識(shí)別。
卷積是深度學(xué)習(xí)中一種常用的計(jì)算方法,最先應(yīng)用于信號(hào)處理識(shí)別方向。在深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)中存在卷積和池化兩種計(jì)算方法,可以對(duì)波形整體的信號(hào)進(jìn)行把握,適合大量計(jì)算且具有較高的魯棒性[19]。故本文提出一種采用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)對(duì)微震信號(hào)識(shí)別的模型,即VGG4-CNN 模型。
目前針對(duì)礦山微震信號(hào)的識(shí)別方法主要分為兩類(lèi),一類(lèi)為時(shí)域識(shí)別,另一類(lèi)為頻域識(shí)別。時(shí)域識(shí)別主要依靠信號(hào)在波形上的一些特征進(jìn)行識(shí)別,該特征主要包括尾波發(fā)育特征、分形維數(shù)特征、峰值特征等。依據(jù)時(shí)域特征,可以將礦山微震信號(hào)主要分為隨機(jī)干擾信號(hào)(A)、規(guī)則干擾信號(hào)(B)和難識(shí)別信號(hào)(C)三類(lèi)[15]。在數(shù)據(jù)方面,本文選取在礦山生產(chǎn)過(guò)程中具有代表性的9 類(lèi)信號(hào)進(jìn)行識(shí)別,9 類(lèi)信號(hào)包括鏟煤、背景、爆破、鋤煤、破裂、喊話、礦車(chē)、敲擊、鎬刨,其波形圖像如圖1 所示。
如圖1 所示,對(duì)尾波衰減特征而言,巖石破裂信號(hào)、敲擊信號(hào)和爆破信號(hào)的波形較為相似,其峰值會(huì)突然出現(xiàn)并存在衰減,在該過(guò)程中擁有相似的波形;手鎬刨煤作業(yè)、鋤頭刨煤和鏟子鏟煤三類(lèi)信號(hào),波形均具有瞬時(shí)性且尾波發(fā)育較少;人員喊話是由于某一時(shí)刻的突發(fā)性事件而造成的震動(dòng),因而尾波較少。對(duì)于波形分形而言,背景噪聲所呈現(xiàn)的微震信號(hào)的波形圖像為雜亂和無(wú)序;敲擊信號(hào)與爆破信號(hào)呈現(xiàn)出一定周期;鎬煤、鋤煤和鏟煤等人為干擾信號(hào)無(wú)任何周期性。在峰值方面,爆破峰值最高,喊話與破裂信號(hào)峰值較為相近,由人員作業(yè)引起的微震信號(hào)峰值較小。
圖1 各類(lèi)礦山微震信號(hào)波形Fig.1 Waveforms of microseismic signals of various types of mines
可見(jiàn),從單一特征進(jìn)行多類(lèi)信號(hào)識(shí)別較為困難,因此開(kāi)發(fā)更為細(xì)致和精確的多類(lèi)型波形信號(hào)識(shí)別方法尤為關(guān)鍵。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在近些年被廣泛應(yīng)用于分類(lèi)識(shí)別任務(wù)中,具有較強(qiáng)魯棒性。本文采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型對(duì)礦山微震信號(hào)進(jìn)行識(shí)別,進(jìn)而提高微震信號(hào)的識(shí)別精度與速度,實(shí)現(xiàn)多類(lèi)識(shí)別。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)主要由數(shù)據(jù)預(yù)處理、主干神經(jīng)網(wǎng)絡(luò)和損失函數(shù)三部分構(gòu)成[18]。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)收集、數(shù)據(jù)標(biāo)注和數(shù)據(jù)集構(gòu)建;主干神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型核心,需要依據(jù)需求進(jìn)行設(shè)計(jì);損失函數(shù)則是控制主干神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)路徑和學(xué)習(xí)結(jié)果的一種方法。
數(shù)據(jù)預(yù)處理需要先對(duì)數(shù)據(jù)進(jìn)行收集,再對(duì)數(shù)據(jù)進(jìn)行標(biāo)注和數(shù)據(jù)集構(gòu)建。在數(shù)據(jù)收集和數(shù)據(jù)標(biāo)注方面,本文以山西某礦的礦山微震信號(hào)為數(shù)據(jù)基礎(chǔ),由人員在現(xiàn)場(chǎng)跟進(jìn)并記錄發(fā)生事件和時(shí)間,實(shí)現(xiàn)對(duì)數(shù)據(jù)的標(biāo)注。在數(shù)據(jù)集構(gòu)建方面,采用K 折交叉驗(yàn)證方法(K-fold Cross Validation)將整體數(shù)據(jù)分為三類(lèi)集合(學(xué)習(xí)集、交叉驗(yàn)證集、測(cè)試集[21])。神經(jīng)網(wǎng)絡(luò)通過(guò)對(duì)學(xué)習(xí)集進(jìn)行學(xué)習(xí),不斷通過(guò)交叉驗(yàn)證集對(duì)訓(xùn)練過(guò)程進(jìn)行修正和對(duì)已有的學(xué)習(xí)過(guò)程進(jìn)行測(cè)試,最終通過(guò)測(cè)試集進(jìn)行性能測(cè)試與評(píng)價(jià)。在K 折交叉驗(yàn)證方法中,學(xué)習(xí)集與測(cè)試集按一定數(shù)值進(jìn)行劃分,該比例值被稱(chēng)為K值。在一般計(jì)算中K值取5,本文同樣取5。K 折交叉驗(yàn)證流程如圖2 所示。
圖2 神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)流程示意圖Fig.2 Schematic diagram of the neural network data flow
深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程,本質(zhì)上是通過(guò)數(shù)據(jù)集和損失函數(shù)對(duì)主干神經(jīng)網(wǎng)絡(luò)中參數(shù)進(jìn)行求解的過(guò)程。同時(shí),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在進(jìn)行分類(lèi)時(shí),同樣依靠主干神經(jīng)網(wǎng)絡(luò),將微震信號(hào)從一種較復(fù)雜的高維空間表達(dá)方式轉(zhuǎn)換為容易的低維空間表達(dá)方式,進(jìn)而實(shí)現(xiàn)區(qū)分不同類(lèi)別。主干神經(jīng)網(wǎng)絡(luò)的運(yùn)算方法一般為卷積運(yùn)算。結(jié)合離散卷積性質(zhì)可知,第i層主干神經(jīng)網(wǎng)絡(luò)的卷積信號(hào)可以表達(dá)如下:
式中,i為卷積層數(shù);m為離散采樣點(diǎn)數(shù);Si(t)為經(jīng)過(guò)i-1 層卷積核卷積后的信號(hào)特征;k為卷積核迭代次數(shù);n為卷積步伐;(n-t)為第k次迭代后的第i-1 層卷積核;a、b為池化層尺寸;L為激活函數(shù)。
對(duì)于新構(gòu)建的Si(t)信號(hào)特征,采用Softmax 損失函數(shù)進(jìn)行分類(lèi)和損失計(jì)算:
式中,j為Si(t)第j個(gè)數(shù);為特征向量的第j個(gè)特征。
主干神經(jīng)網(wǎng)絡(luò)作為神經(jīng)網(wǎng)絡(luò)核心,是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和識(shí)別的基礎(chǔ)。VGG4-CNN 模型當(dāng)中的主干神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如下:卷積層(C)3個(gè),池化層(P)2 個(gè),全連接層(F)1 個(gè),Softmax層1 個(gè)。在數(shù)據(jù)輸入C1層前,將數(shù)據(jù)由(1×10 000)的向量變換為(100×100)的矩陣進(jìn)行預(yù)處理;第C1層采用(5×5)的卷積核進(jìn)行16 次卷積,形成(16×100×100)張量。在C1層卷積結(jié)束以后,P1層對(duì)卷積生產(chǎn)的數(shù)據(jù)進(jìn)行(2×2)池化,將大小(100×100)的數(shù)據(jù)格式轉(zhuǎn)化為單個(gè)(50×50)的數(shù)據(jù)矩陣。C2卷積層對(duì)P1層每層數(shù)據(jù)進(jìn)行32 次卷積,形成深度為256 的張量;同時(shí)C3層繼續(xù)對(duì)C2層中的輸出數(shù)據(jù)進(jìn)行16 次卷積,最終得到(4 096×50×50)結(jié)構(gòu)張量;在C2和C3卷積層中,卷積核大小為(3×3),步伐為(1×1)。為方便特征提取和減少計(jì)算量,在C3卷積層卷積后對(duì)產(chǎn)出數(shù)據(jù)進(jìn)行池化,對(duì)(5×5)的P2池化層進(jìn)行處理,形成(4 096×8×8)的池化張量;在池去化層P2結(jié)束以后,加入全連接層對(duì)P2層數(shù)據(jù)進(jìn)行空間拓?fù)浠?。為提高整體神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果,在全連接層結(jié)束后布置Softmax 層[14]。對(duì)于激活函數(shù),本次神經(jīng)網(wǎng)絡(luò)均采用Relu 激活函數(shù),分別存在于C1與P1、C2與C3、C3與P2層之間,總計(jì)3 次使用。主干神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
圖3 VGG4-CNN 神經(jīng)網(wǎng)絡(luò)示意圖Fig.3 Schematic diagram of VGG4-CNN neural network
為對(duì)本文提出的神經(jīng)網(wǎng)絡(luò)模型效果進(jìn)行驗(yàn)證,采用數(shù)據(jù)集中的測(cè)試集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行性能測(cè)試。在本次測(cè)試中,神經(jīng)網(wǎng)絡(luò)運(yùn)行訓(xùn)練采用GPU 處理器,設(shè)備型號(hào)為:GeForce RTX 2060;最高線程7、最低線程5;計(jì)算最高頻率1.2 GHz。設(shè)備性能屬于中層次。此外,為防止出現(xiàn)過(guò)擬合狀態(tài),神經(jīng)網(wǎng)絡(luò)將設(shè)置隨機(jī)失活參數(shù)(Droup Out)[12],參數(shù)設(shè)定見(jiàn)表1。
表1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練各項(xiàng)參數(shù)Tab.1 Parameters of neural network training
為方便展示,將輸出信號(hào)進(jìn)行繪制,對(duì)9 種波形型號(hào)的預(yù)處理圖像、VGG4-CNN 神經(jīng)網(wǎng)絡(luò)過(guò)程中卷積層和池化層進(jìn)行可視化輸出,其結(jié)果見(jiàn)表2。
表2 VGG4-CNN 神經(jīng)網(wǎng)絡(luò)對(duì)于不同種類(lèi)信號(hào)各層輸出情況Tab.2 VGG4-CNN neural network output for different types of signals
如表2 所示,因喊話、敲擊、手鎬刨煤三類(lèi)信號(hào)在P2-1的輸出較為相似,對(duì)P2-2特征層進(jìn)行可視化表明差異性。P2-2特征層可視化圖像見(jiàn)表3。
表3 三類(lèi)礦山微震信號(hào)P2-2 特征層Tab.3 P2-2 layer characteristics of microseismic signals of three types of mines
由表2 和表3 可知:
(1) 在噪聲的處理方面,除喊話以外,余下信號(hào)在通過(guò)C3層時(shí),已經(jīng)將噪聲過(guò)濾,說(shuō)明VGG4-CNN 神經(jīng)網(wǎng)絡(luò)具有一定的抗干擾性和濾波性。
(2) 在數(shù)據(jù)保真方面,數(shù)據(jù)C2層處理后,數(shù)據(jù)值發(fā)生變化,其中最明顯的是喊話、礦車(chē)、敲擊、鎬煤事件等瞬發(fā)無(wú)尾波發(fā)育的信號(hào),對(duì)峰值這一重要區(qū)分度的信息進(jìn)行了保留。這表明在傳遞過(guò)程中卷積核和主干神經(jīng)網(wǎng)絡(luò)對(duì)信號(hào)中重點(diǎn)信息有著合理的把控。
(3) 在神經(jīng)網(wǎng)絡(luò)對(duì)各波形的差異把控方面,爆破信號(hào)P2-1輸出特征值先小幅度上升(紫色變淺黃色)再大幅度上升(紫色變黃色);在敲擊信號(hào)中,P2層體現(xiàn)了信號(hào)的后續(xù)震蕩,但短于爆破信號(hào),體現(xiàn)了神經(jīng)網(wǎng)絡(luò)對(duì)于波形整體的把控性。
(4) 在喊話、敲擊、手鎬刨煤三類(lèi)事件中,P2-1層較為相似,而在P2-2層中表現(xiàn)出來(lái)一定的差異性。該狀況符合神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程,即多層神經(jīng)網(wǎng)絡(luò)層共同作用于信息,而非采用單一神經(jīng)網(wǎng)絡(luò)層進(jìn)行作用。
為對(duì)本文提出的神經(jīng)網(wǎng)絡(luò)模型性能進(jìn)行合理評(píng)價(jià),將VGG4-CNN 模型的訓(xùn)練過(guò)程、特征提取效果、訓(xùn)練結(jié)果等進(jìn)行縱向分析,并與LSTM-RNN、BP 和DCNN 識(shí)別方法進(jìn)行比對(duì)和分析。
訓(xùn)練過(guò)程中的損失和準(zhǔn)確率是考察學(xué)習(xí)過(guò)程變化的重要指標(biāo)。VGG4-CNN 在訓(xùn)練過(guò)程中損失和準(zhǔn)確率變化情況如圖4 所示。
圖4 VGG4-CNN 訓(xùn)練過(guò)程中準(zhǔn)確率和損失變化情況Fig.4 Accuracy and loss changes in VGG4-CNN training process
由圖4 可知,在準(zhǔn)確率方面,隨著訓(xùn)練次數(shù)增加,出現(xiàn)逐漸上升趨勢(shì),上升速度逐漸下降,且靠近1 但永遠(yuǎn)小于1;在損失方面,損失逐漸降低收斂于0。在訓(xùn)練過(guò)程中,VGG4-CNN 模型的損失和準(zhǔn)確率變化趨勢(shì)符合神經(jīng)網(wǎng)絡(luò)訓(xùn)練的變化情況。
特征可視化是檢驗(yàn)神經(jīng)網(wǎng)絡(luò)的卷積特征提取層提取效果的一種方法。因神經(jīng)網(wǎng)絡(luò)提取后特征維度高于2 維,因此需要對(duì)其進(jìn)行降維處理。t-SNE 是基于SNE 提出的,是一種流行非線性降維方法,可以將高維特征進(jìn)行可視化降維,以觀察神經(jīng)網(wǎng)絡(luò)模型特征提取效果。降維效果如圖5 所示。
由圖5 可知,各類(lèi)微震信號(hào)出現(xiàn)了族群聚類(lèi)效應(yīng);巖石破裂信號(hào)(綠色)族群明顯遠(yuǎn)離其他信號(hào)族群,表明模型有效提取了巖石破裂信號(hào)時(shí)域特征;干擾信號(hào)主要集中在中部位置,說(shuō)明了噪聲信號(hào)的混雜性。
圖5 各類(lèi)信號(hào)經(jīng)t-SNE 降維后的平面分布Fig.5 Plane distribution of various signals after dimensionality reduction by t-SNE
訓(xùn)練結(jié)果分析是對(duì)神經(jīng)網(wǎng)絡(luò)性能的另一種重要評(píng)價(jià)方法。該方法在神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練結(jié)束以后,采用全新數(shù)據(jù)進(jìn)行預(yù)測(cè)分類(lèi),從而實(shí)現(xiàn)對(duì)神經(jīng)網(wǎng)絡(luò)性能的分析。對(duì)于訓(xùn)練結(jié)果存在著3 種重要的評(píng)價(jià)指標(biāo),分別為精準(zhǔn)率、召回率、F1系數(shù)。VGG4-CNN 神經(jīng)網(wǎng)絡(luò)測(cè)試結(jié)果及耗時(shí)見(jiàn)表4。
表4 VGG4-CNN 神經(jīng)網(wǎng)絡(luò)對(duì)于各項(xiàng)數(shù)據(jù)識(shí)別結(jié)果及耗時(shí)Tab.4 Identification results and time consuming of VGG4-CNN neural network
由表4 可知,當(dāng)有較大數(shù)據(jù)樣本進(jìn)行學(xué)習(xí)時(shí),預(yù)測(cè)較為精準(zhǔn);當(dāng)數(shù)據(jù)集較小時(shí),可能會(huì)出現(xiàn)一定的偏差。
對(duì)傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)、LSTM 神經(jīng)網(wǎng)絡(luò)和DCNN 分類(lèi)方法進(jìn)行建模和分析,并與本文提出的模型進(jìn)行對(duì)比,結(jié)果見(jiàn)表5 和圖6。
表5 4 類(lèi)神經(jīng)網(wǎng)絡(luò)耗時(shí)及準(zhǔn)確率對(duì)比Tab.5 Comparison of time consumption and accuracy of four types neural networks
由表5 和圖6 可知,傳統(tǒng)的BP 和DCNN 兩類(lèi)神經(jīng)網(wǎng)絡(luò)在多分類(lèi)任務(wù)方面出現(xiàn)了過(guò)擬合現(xiàn)象。DCNN 耗時(shí)過(guò)高,原因?yàn)樵摮绦蛐枰葘?duì)波形進(jìn)行去噪、繪圖再進(jìn)行識(shí)別;VGG4-CNN 與LSTM-RNN因?qū)?shù)據(jù)直接進(jìn)行分析省略了繪圖步驟,降低了耗時(shí),但VGG4-CNN 識(shí)別模型精度高于LSTM-RNN模型。
圖6 4 種神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程損失及準(zhǔn)確率對(duì)比Fig.6 Comparison of loss and accuracy of 4 types neural network training process
訓(xùn)練結(jié)果顯示,DCNN 未能有效區(qū)分爆破作業(yè)、敲擊、手鎬刨煤和鋤頭刨煤信號(hào),其原因?yàn)樗鼈兊牟ㄐ谓Y(jié)構(gòu)較為相似。除此之外,VGG4-CNN 神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上耗時(shí)較大,存儲(chǔ)空間大約為2.29 GB,占用內(nèi)存較大。
(1) 本文提出的VGG4-CNN 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在對(duì)礦山微震信號(hào)識(shí)別時(shí),正確率為94% ,且響應(yīng)時(shí)間短、正確率高、魯棒性強(qiáng),具有一定的優(yōu)越性。
(2) VGG4-CNN 神經(jīng)網(wǎng)絡(luò)對(duì)于噪聲具有一定的過(guò)濾效果,在采用神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別時(shí),可以適當(dāng)放棄去噪過(guò)程以加速學(xué)習(xí)。
(3) 構(gòu)建的VGG4-CNN 神經(jīng)網(wǎng)絡(luò),雖然對(duì)單個(gè)識(shí)別耗時(shí)較少,但是在訓(xùn)練上存儲(chǔ)空間占用較大,約為2.29 GB。減少訓(xùn)練時(shí)間和存儲(chǔ)空間為下一步研究方向。