裴艷宇,楊小彬?,傳金平,吳學松,程虹銘,呂祥鋒
1) 中國礦業(yè)大學(北京)應急管理與安全工程學院,北京 100083 2) 華亭煤業(yè)公司硯北煤礦,華亭 744105 3) 北京科技大學土木與資源工程學院,北京 100083
我國煤礦開采逐漸轉入深部開采,深部開采過程中沖擊地壓事件發(fā)生的數量和強度逐漸增加[1],研究沖擊地壓前兆信號的變化對預測沖擊地壓有重要意義[2].
微震信號監(jiān)測作為一種重要技術手段對沖擊地壓預測有重要作用[3-6],高能級微震事件與沖擊地壓的發(fā)生有良好的對應關系[7].陸菜平等[8]從分析微震信號的功率譜和幅頻特性入手,對沖擊地壓的預測預報進行研究;蔡武等[9]綜合考慮微震的“時、空、強”特征,從時間、空間角度分別對沖擊危險狀態(tài)和沖擊危險區(qū)域及危險等級進行預測;郭來功等[10]則通過微震成像和微震云圖等方式發(fā)掘微震事件時空規(guī)律,為沖擊地壓預測提供判據;田向輝等[11]通過對微震能量、頻次的分析來預測沖擊地壓的危險等級.以上研究結果對沖擊地壓判識提供了手段支持,但在微震能級隨時間變化規(guī)律及基于現有的微震能級如何對后期的微震能級進行預測等方面還需要進一步的研究,尤其對高能級的微震事件進行預測尤為重要.對微震信號的變化進行預測,將微震事件時間節(jié)點前移,以實現對沖擊地壓的提前預測,為沖擊地壓防控提供更多時間保障.
機器學習相關技術和模型的發(fā)展為井下序列數據的預測提供了更廣闊的視野.喬美英等[12]應用遺傳算法優(yōu)化的支持向量機模型對礦井涌水量進行短期預測,預測最大相對誤差為2.62%;趙毅鑫等[13]利用長短時記憶模型對礦壓進行預測并在其他礦井應用,預測結果較佳;李樹剛等[14]利用循環(huán)神經網絡對煤礦工作面的瓦斯?jié)舛冗M行預測,瓦斯體積分數預測結果誤差為0.006%.以上學者應用機器學習模型對時序數據進行預測,在各自研究方面取得了較大進展,但這些傳統機器學習模型存在一點不足,即特征提取和分類分開難以得到最優(yōu)解[15],而卷積神經網絡(Convolutional neural networks,CNN)作為一種深度學習模型,同時具備特征提取和分類輸出的能力.卷積神經網絡特征提取能力出色,在故障診斷[16-18]、地質遙感檢測[19-20]等方面應用廣泛且效果較佳,一些學者應用卷積神經網絡對一維數據進行處理,并展現了其優(yōu)勢.趙康寧等[21]利用一維卷積神經網絡的時序數據特征提取能力,將其與貝葉斯神經網絡結合,對光伏出力進行時序預測;金列俊等[22]建立一維卷積神經網絡的鉆桿故障診斷模型,根據鉆桿的加速度信號對鉆桿工作狀態(tài)進行識別;高佳豪等[23]使用一維卷積神經網絡對包含軸承故障特征的隨機信號成分進行特征提取以對齒輪箱軸承故障進行辨識.一維卷積神經網絡在時序數據特征提取和預測方面都展示了良好的能力.
為此,本文為了實現微震能級時序預測,利用一維卷積神經網絡建立微震能級時序預測模型,以前若干次微震的能量級別作為輸入來預測下一次微震事件的能量級別;分析微震數據時序特征,對模型進行優(yōu)化改進,對比現場微震監(jiān)測數據,驗證建立的一維卷積神經網絡微震能級時序預測模型的可行性.
某一區(qū)域的能量與微震之間存在地震震級-頻度關系,即G-R關系式[24]:
其中,N為微震累積次數;M為區(qū)域性震級的最小值;a,b為與區(qū)域有關的經驗常數,b值刻畫了震源區(qū)的介質與應力情況.
文獻研究已表明微震能級隨時間存在一定的變化規(guī)律,那么,未來微震事件的能量與前幾次微震事件的能量存在關聯.基于此假設,一定存在一個映射g,使得可通過前若干次的微震事件能量Ei、Ei+1、···、EN得到第N+1次的微震事件能量EN+1,如式(2)式所示.
式中,i+1<N.
由于微震事件的能量量級差別較大,為了便于模型輸入及特征提取,對微震事件的能量值取對數,所得結果四舍五入取整后,記為微震事件能量級別,如式(3)所示:
其中,Ki表示第i次微震的能量級別.
基于以上內容構造模型,以前若干次的微震事件能量級別為輸入預測下一次微震事件能量級別.
為有效提取微震能量數據特征,預測微震能量級別的時序變化規(guī)律,現構建基于一維卷積神經網絡的微震能級時序預測模型,具體步驟如下:
(1)模型輸入、輸出.
模型輸入時直接輸入前若干次的微震能量值,本文中模型輸出值代表微震能量級別,由于相鄰的兩個能量級別差異較大,若輸出按十進制標量形式表示能量級別,模型訓練結果會出現較大偏差.因此,采用一維有效編碼方法(One-hot encode)將標量轉化為一維向量,即將預測的對應微震能級表示為1,其他級別均為0.
(2)模型特征提取.
檢測信號對某種特定模式的響應是卷積的本質.卷積核通過遍歷整段輸入向量,對能量序列中某些發(fā)生突變的點或階段等細微特征進行檢測.而池化層將卷積層輸出的特征數據進行縮減以降低模型計算負擔.由于微震能量序列是廣義一維時間數據,相比于圖像、視頻等多維數據其包含信息量較少,為減少特征提取過程中數據信息的丟失,模型使用卷積層進行特征提取而刪去池化層[25].模型先通過多個卷積層對微震數據提取特征,激活函數采用Relu函數,最后由全連接層對最后一層卷積層的輸出加權平均.卷積層對上一層輸出在第j個卷積核處的值,按以下公式進行處理:
其中,I為卷積層的一維輸入向量;O為卷積層的一維輸出向量;f則為該層的激活函數;Hj為長度為m的一維向量,又稱為卷積核.同時,同一卷積層內可有多個卷積核同時對輸入值進行運算.
(3)模型分類與優(yōu)化.
為方便現場人員更好地了解預測類別的概率值,模型輸出層選擇Softmax分類器進行最終分類.
為優(yōu)化人工神經網絡模型,尋找一組神經網絡的權值參數θ,并采用特定算法使損失函數Loss(θ)顯著降低.考慮到學習率對模型訓練效果影響較大,人工確定最佳參數具有較大難度,故選用一種學習率自適應算法Adam作為模型優(yōu)化算法[26].
若設卷積神經網絡模型為f(θ;·),則CN+1與前N次微震能量關系如式(5)所示:
其中,Loss(·)為人為指定的損失函數,用于衡量模型預測的微震能量數量級與真實值之間的誤差.
其中,Li為第i個樣本的誤差;n為樣本數;m為類別數;im為第i個樣本屬于第m類的預測概率;yim為第i個樣本屬于第m類的真實概率.
考慮到采掘活動、地應力條件、地質條件等因素對微震事件的發(fā)生有一定影響,在選擇輸入數據維度時,經大量預試驗,發(fā)現以前十次微震能級作為輸入來預測下一次微震能級時正確率較高,相應的模型結構如圖1所示,模型超參數經多次試驗迭代所得,如表1所示.
表 1 各卷積層超參數Table 1 Hyperparametric table of each convolution layer
圖 1 一維卷積神經網絡微震能級時序預測模型結構Fig.1 Structure of the prediction model of the microseismic energy level time series based on the one-dimensional convolution neural network
利用硯北煤礦250202工作面2017年1月1日至2018年9月30日記錄的10343次微震數據對一維卷積神經網絡微震能級序列預測模型進行訓練和測試.選取9次106級別微震中前6次微震,105級別微震中前66%的微震和其他級別前90%的微震事件,混合、打亂組成訓練集;其余的微震事件混合、打亂組成測試集,模型測試結果如表2所示.
表 2 250202工作面微震能量級別測試結果Table 2 Test results of the microseismic energy level of the 250202 working face%
由表2可知,模型對102、103、104低能級的微震事件預測正確率和對105級別的高能級微震事件的預測正確率均超過了98%,并且總體正確率也達到了97.9%,說明基于一維卷積神經網絡建立模型對微震能級進行時序數據進行預測是可行的.
但需要注意的是,模型預測結果中對106級別的高能級微震事件的預測正確率為0,有必要進一步對模型進行討論、研究以提高對該級別微震事件的預測正確率.
雖然模型在測試集中預測正確率較高,但對106級別微震的預測正確率為0,通過分析發(fā)現模型將106級別微震全部預測為105級別的微震.硯北煤礦250202工作面記錄的2017年1月至2018年10月的10343次微震中,105級別的微震353次,沖擊地壓引起或伴隨的微震只有11次,而106級別的微震有9次,但全部是沖擊地壓引起或伴隨發(fā)生的,因而有必要提高模型對106能級微震事件的預測準確率.
通過分析發(fā)現,模型對106能級微震事件預測正確率低的原因是微震事件各個能量級別的數量不平衡,其他能級事件數量遠遠多于106能級微震事件數量.本次用于模型訓練和測試的數據中,102、103、104級別的微震上千次,106級別微震 9次,如圖2所示.
圖 2 微震各能量級別數量Fig.2 Number of each microseismic energy level
因此,解決模型對106能級微震事件預測準確率低的問題,需從微震事件各能級數據的不平衡特征入手.在機器學習領域的分類問題中,樣本量較多的類別稱為負樣本,樣本量較少的類別稱為正樣本.用存在正、負樣本的數據集訓練的模型會傾向于將正樣本分類為負樣本,導致正樣本事件分類正確率降低.
目前處理正負樣本類間不平衡問題的主要方法有欠采樣、過采樣和混合采樣[27].欠采樣會丟棄有價值的樣本點,導致人工神經網絡無法學習到有效的特征;過采樣會放大正樣本中噪聲的影響,容易造成過擬合.考慮前二者的缺點和混合采樣優(yōu)勢,采用一種混合采樣方法[28]對模型進行訓練,即隨機將負樣本分成若干份并分別和僅有的一份正樣本組合,得到若干訓練集后分別訓練若干個子模型,最后再將每一個子模型的結果集成得到最終結果.混合采樣的訓練集建立過程如圖3所示.
圖 3 混合采樣訓練集建立過程Fig.3 Building process of the hybrid sampling training set
由于微震能級各類別數據的極端不平衡特征,在前文模型的基礎上,前置一個預判模型,該模型對高、低能級微震事件進行預測,當預測結果為低能級事件,直接輸出預測結果;當預測為高能級事件,送入后續(xù)的若干個續(xù)判模型群進一步預測,各個續(xù)判模型的預測結果加權平均作為最終輸出結果.預判模型的訓練集分為高能級、低能級兩種類別,105、106級別微震劃分為高能級微震事件;102、103、104級別微震劃分為低能級微震事件.續(xù)判模型的訓練集采用混合采樣方法建立且訓練集僅包括105、106兩種級別的微震事件.改進的一維卷積神經網絡微震能級時序預測模型框架如圖4所示.
圖 4 改進的基于一維卷積神經網絡的微震能級時序預測模型總體框架Fig.4 General framework of improved prediction model of microseismic energy level time series based on the one-dimensional convolution neural network
預判模型與續(xù)判模型的內部結構與前文已經建立的基于一維卷積神經網絡的微震能級時序預測模型結構一致,不再贅述.
根據前期測試,針對硯北煤礦微震數據集所建模型的續(xù)判模型最佳數量為20個.對續(xù)判模型群,將105級別微震中的前240次微震隨機分成20份,106級別微震中的前6次復制20份,二者隨機組合得到20個子訓練集.105級別的微震中后113次和106級別的微震中的后3次組合作為測試集.
對預判模型的訓練集、測試集劃分,與前文基于一維卷積神經網絡的微震能級時序預測模型的訓練集、測試集劃分方法相同,但105、106級別微震分類時記為同一個類,即具有相同的分類標簽.最后,對改進的預測模型進行測試,測試結果如表3所示.
表 3 250202工作面微震能量級別測試結果Table 3 Test results of the microseismic energy level of the 250202 working face %
改進后的模型對106微震能量級別事件的預測正確率由原來的0提升至99.0%,而105級別微震僅下降了5%,總體預測正確率較之前增加了0.5%,為98.4%.可以認為,改進后的模型一定程度上解決了樣本數據間不平衡導致的模型對106微震能量級別預測正確率低的問題.
為進一步驗證本文改進后的基于一維卷積神經網絡的微震能級時序預測模型在微震能量級別預測方面的準確性,將其應用于硯北煤礦250202工作面進行微震能級預測,以前10次微震能級作為輸入時,預測下一次微震能級.
250202工作面屬于2502采區(qū),處于硯北煤礦最東側,北接1504采區(qū),南與2502采區(qū)運輸大巷、軌道大巷及行人通道相連,西臨250203工作面上部采空區(qū),東部為采區(qū)的保護煤柱區(qū)域.該工作面地質條件較為復雜,受區(qū)域向斜軸影響嚴重,向斜軸線發(fā)生大范圍斜交,走向整體呈現北高南低走勢,走向落差為50~280 m.煤厚為10.8~15.2 m,其平均煤厚為12.9 m,工作面長度在200~220 m之間,工作面走向長度約為1600 m,由北向南推進,采煤方法采用走向長壁放頂煤采煤法,全部垮落法管理頂板,回采速率為3 m·d-1,煤巖沖擊傾向鑒定為具有強沖擊傾向性.自2018年10月1日至10月10日,該工作面共監(jiān)測到112次微震,改進后的基于一維卷積神經網絡的微震能級時序預測模型對112次微震事件能級的預測準確率為93.5%,對高能級微震的預測正確率為100%.實測能級與預測能級比對結果如圖5所示.
圖 5 微震能量預測值與實測值對比Fig.5 Comparison between the predicted and measured microseismic energy
(1)設計了一種基于一維卷積神經網絡的微震能級時序預測模型,以前十次微震事件的能量級別作為輸入,預測下一次微震事件能量級別.訓練后模型在測試集上的正確率達到97.9%.
(2)由于微震事件各個能級樣本數量不平衡導致模型對106級別微震預測正確率過低,為解決該問題對模型進行改進.改進后模型對106級別微震事件的預測正確率由0提升至99.0%,同時總體預測正確率提升為98.4%.
(3)使用硯北煤礦250202工作面10月1日~10月10日的112次微震事件對改進的模型進行驗證,模型對微震事件能級的預測正確率達到了93.5%,證明本文模型可以為現場微震事件能級預測提供一定參考.