冉啟華,吳何碧,丁力生,李 旭,賴永標,楊 揚,楊黎明,賴祥威
(1.云南衛(wèi)士盾科技有限公司,云南昆明 650500;2.中建鐵路投資建設集團有限公司,北京 100053;3.昆明理工大學理學院,云南 昆明 650031)
由于瓦斯災害危害煤礦安全生產(chǎn),國內(nèi)外已有諸多學者針對瓦斯預測開展研究。最開始,有學者認為瓦斯?jié)舛扰c開采深度單純成正比關系,但在實際測量過程中,由于煤礦井下地質(zhì)復雜,瓦斯?jié)舛刃蛄型ǔ3尸F(xiàn)非線性的規(guī)律。于是,部分學者便考慮引入多變量指標預測瓦斯?jié)舛?,但均未取得較為滿意的效果。
為此,不少學者通過向量機[1-2]、Elman 神經(jīng)網(wǎng)絡[3]、BP 神經(jīng)網(wǎng)絡[4]、灰色神經(jīng)網(wǎng)絡[5-9]等方法對瓦斯?jié)舛冗M行非線性擬合。魏林等[10]結合最小二乘支持向量機和自回歸模型對瓦斯體積分數(shù)進行預測。楊麗等[11]提出了一種新的變量選擇和定階方法,利用多元分布滯后模型建立多變量瓦斯?jié)舛刃蛄蓄A測模型。胡坤等[12]利用教學算法優(yōu)化回歸算法的參數(shù),實現(xiàn)了對瓦斯回采工作面演出量的預測。此外,也有學者采用多指標耦合算法[13]、自回歸差分移動平均模型[14]、循環(huán)神經(jīng)網(wǎng)絡[15]對瓦斯進行預測。
隨著智能化煤礦快速發(fā)展,在極大程度上推動了深度學習模型的發(fā)展。Zhang 等[16]采用遺傳算法優(yōu)化SRWNN瓦斯預測模型,開發(fā)了一套分布式智能邊緣裝置瓦斯?jié)舛阮A測系統(tǒng)。Zhang 等[17]利用長短時記憶神經(jīng)網(wǎng)絡對瓦斯監(jiān)控數(shù)據(jù)進行預測。
考慮到模型的預測精度和實時性需求,本文基于融合注意力機制的門控循環(huán)單元神經(jīng)網(wǎng)絡對瓦斯?jié)舛戎颠M行預測,并以瓦斯?jié)舛葰v史數(shù)據(jù)為案例,闡述門控循環(huán)單元(Gated Recurrent Unit,GRU)[18]的結構設計,并將其與卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、人工神經(jīng)網(wǎng)絡進行比較。
考慮到瓦斯?jié)舛刃蛄蓄A測屬于非線性問題,傳統(tǒng)算法難以進行高精度預測,因此本文提出了一種基于門控循環(huán)單元神經(jīng)網(wǎng)絡的瓦斯?jié)舛刃蛄蓄A測算法,以輔助瓦斯?jié)舛缺O(jiān)控系統(tǒng)進行預警。
針對給定的瓦斯?jié)舛刃蛄衳=(x1,x2,...,xn),運用標準循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)算法進行預測。RNN 結構如圖1所示。
Fig.1 RNN internal structure圖1 RNN內(nèi)部結構
由此,計算隱藏層序列h=(h1,h2,...,hn)和輸出層序列y=(y1,y2,...,yn),計算公式如下:
其中,W為權重系數(shù)矩陣,例如Why為隱藏層到輸出層的權重系數(shù)矩陣,by、bh為偏置向量,fa為激活函數(shù),下標t為時刻。
GRU 不同于傳統(tǒng)神經(jīng)網(wǎng)絡,該網(wǎng)絡基于長短期記憶網(wǎng)絡(Long Short-Term Memory,LSTM),但不同之處在于GRU將LSTM 中的輸入門和遺忘門合并成一個更新門。于是GRU 存在兩個門:更新門和重置門。其中,更新門控制上一個時刻的信息保存到下一時刻的程度;重置門控制當前狀態(tài)信息與上一時刻信息是否結合。GRU 內(nèi)部結構如圖2所示。
Fig.2 Internal structure of GRU圖2 GRU內(nèi)部結構
GRU 內(nèi)部計算公式如下:
注意力機制的結構如圖3 所示。其中,xt(t=[1,n])表示網(wǎng)絡層中輸入數(shù)據(jù),ht(t=[1,n])表示網(wǎng)絡層中每一個隱藏層的輸出,at(t=[1,n])表示網(wǎng)絡中隱藏狀態(tài)的每一個注意力概率分布值。
Fig.3 Attention mechanism structure圖3 注意力機制結構
A-GRU 神經(jīng)網(wǎng)絡瓦斯?jié)舛阮A測模型如圖4 所示,共包含輸入層、隱藏層、輸出層、網(wǎng)絡訓練及網(wǎng)絡預測5 個板塊。
(1)輸入層。在輸入瓦斯?jié)舛刃蛄袛?shù)據(jù)前,先定義瓦斯?jié)舛刃蛄袛?shù)據(jù)x=(x1,x2,...,xn),再將數(shù)據(jù)集劃分為訓練集xtrain=(x1,x2,...,xm)和測試集xtest=(xm+1,xm+2,...,xn),m∈(0,n)。最后將劃分好的訓練集和測試集數(shù)據(jù)進行歸一 化 處 理,得 到m∈(0,n) 和
(2)隱藏層。隱藏層采用A-GRU 構造的神經(jīng)網(wǎng)絡,將數(shù)據(jù)輸入隱藏層,經(jīng)過前向傳播公式計算損失,不斷優(yōu)化模型。
(3)輸出層。輸出層用來降低預測值與真實值的損失,然后輸出y=(y1,y2,...,yn),并將m時刻的結果提供給預測模塊,進行一下步m+1 時刻預測,得到瓦斯?jié)舛刃蛄蓄A測最終結果。
(4)網(wǎng)絡訓練。網(wǎng)絡訓練部分首先利用RMSE 進行損失計算,然后使用Adam 優(yōu)化算法進行二次優(yōu)化,再經(jīng)過多次訓練迭代后得到最終預測值。
(5)網(wǎng)絡預測。網(wǎng)絡預測部分采用訓練好的A-GRU神經(jīng)網(wǎng)絡模型進行預測,得到多個時刻的瓦斯?jié)舛刃蛄蓄A測值。
Fig.4 Network model structure圖4 網(wǎng)絡模型結構
為比較不同算法間的優(yōu)劣性,本文采用均方根差(RMSE)和平均絕對誤差(MAE)對不同算法的預測精度進行科學評價,計算公式如下:
其中,n為樣本數(shù)量,xk為時間點k的真實值,為時間點k的預測值。
本文基于吉林省板石瓦斯?jié)舛缺O(jiān)控數(shù)據(jù)對A-GRU 模型、MLP、CNN 和RNN 共4 種模型進行實驗,比較分析各模型的優(yōu)缺點。
實驗數(shù)據(jù)來源于吉林省板石礦瓦斯災害風險防控示范工程項目2020年10月1日至2021年10月1日和2021年1 月1 日至4 月1 日兩個階段的瓦斯監(jiān)控數(shù)據(jù)。數(shù)據(jù)平臺如圖5所示。
Fig.5 Banshi coal mine gas disaster risk management and control platform圖5 板石煤礦瓦斯災害風險管控平臺
瓦斯?jié)舛缺O(jiān)控傳感器數(shù)據(jù)為全天候不間斷采集,采集時間間隔為1h。為避免實驗的偶然性,選取31901 上順工作面和31901 下順工作面采集的樣本數(shù)據(jù)作為實驗數(shù)據(jù),每組樣本數(shù)據(jù)集序列長度如表1 所示,選取數(shù)據(jù)集的前80%為訓練集,后20%為測試集。
Table 1 Description of experimental data set collected by gas concentration sensor in underground coal mine表1 煤礦井下瓦斯?jié)舛葌鞲衅鞑杉瘜嶒灁?shù)據(jù)集描述
由于瓦斯?jié)舛刃蛄写嬖谝欢ǖ男蛄行裕⑶褹-GRU模型的參數(shù)設置會直接影響預測結果的準確性,因此合理設置模型參數(shù)尤為重要。
2.2.1 參數(shù)設置
根據(jù)經(jīng)驗設置歷史數(shù)據(jù)特征數(shù)(即步長)為6,訓練網(wǎng)絡模型的損失函數(shù)選擇均方誤差,優(yōu)化器選擇Adam,迭代次數(shù)為30次,批大小為8。
2.2.2 算法比較
首先從空間角度考查A-GRU 模型的優(yōu)勢,采用31901上順和31901 下順3 個月的實驗數(shù)據(jù)進行預測,得到預測值(見圖6、圖7)和3 個月瓦斯?jié)舛刃蛄姓`差表(見表2)。然后,為了充分驗證該模型的可靠性,對31901 上順工作面和31901 下順工作面6 個月的瓦斯?jié)舛戎颠M行預測,得到預測值(見圖8、圖9)和6 個月瓦斯?jié)舛刃蛄姓`差表(見表3)。
根據(jù)表2 可知,在31901 上順工作面訓練集中A-GRU算法相較于MLP 的RMSE 降低了0.467%,相較于CNN 的MAE 下降了0.297%;在測試集中A-GRU 算法相較于MLP的RMSE 降低了1.858%,MAE 降低了3.483%。
在31901 下順工作面測試集中,A-GRU 算法相較于RNN 的MAE 降低了0.368%。在其它條件都一致的情況下,A-GRU 總體上預測效果更好。
Fig.6 Prediction value of gas by different algorithms in 31901 upper working face(3 months)圖6 31901上順工作面(3個月)不同算法瓦斯預測值
Fig.7 Prediction value of gas by different algorithms in 31901 lower running working face(3 months)圖7 31901下順工作面不同算法瓦斯預測值
Table 2 Error of gas concentration series in 3 months表2 3個月瓦斯?jié)舛刃蛄姓`差
Table 3 Error of gas concentration series in 6 months表3 6個月瓦斯?jié)舛刃蛄姓`差
續(xù)表
Fig.8 Prediction value of gas by different algorithms in 31901 upper working face(6 months)圖8 31901上順工作面(6個月)不同算法瓦斯預測值
由表3 可知,在31901 上順工作面測試集中,A-GRU相較于CNN 的RMSE 降低了0.277%,相較于CNN 的MAE降低了0.776%;在31901 下順工作面訓練集中,A-GRU 相較于MLP 的MAE 降低了0.176%,相較于RNN 的MAE 降低了0.511%。
在6 個月的測試集中,A-GRU 相較于RNN 的MAE 降低了1.024%,總體上預測效果更好。
Fig.9 Prediction value of gas by different algorithms in 31901 lower working face(6 months)圖9 31901下順工作面(6個月)不同算法瓦斯預測值
為準確預測瓦斯?jié)舛刃蛄袛?shù)據(jù),本文提出一種基于A-GRU 神經(jīng)網(wǎng)絡的瓦斯?jié)舛刃蛄蓄A測方法。該方法首先對數(shù)據(jù)集進行劃分和歸一化,接著引入更新門和重置門處理具有時序性的歷史瓦斯?jié)舛刃蛄袛?shù)據(jù),設計網(wǎng)絡結構學習瓦斯?jié)舛刃蛄袃?nèi)部的動態(tài)變化規(guī)律,以誤差損失最小為目標,構建模型預測瓦斯?jié)舛?。并以吉林板石瓦斯?jié)舛缺O(jiān)控數(shù)據(jù)為例,時間、空間兩種不同角度的實例數(shù)據(jù)表明,該方法預測數(shù)據(jù)的最小均方根誤差為3.95%,最小平均絕對誤差為0.71%,相較于CNN、RNN 和MLP 模型預測精度更高。此外,在模型設計方面,本文考慮了瓦斯?jié)舛刃蛄械幕煦缣匦?,增加了模型的普適性。