柴敬, 劉義龍, 王安義, 屈世甲, 歐陽一博
(1.西安科技大學 能源學院, 陜西 西安 710054; 2.西安科技大學 西部礦井開采及災害防治教育部 重點實驗室, 陜西 西安 710054; 3.西安科技大學 通信與信息工程學院, 陜西 西安 710054; 4.天地(常州)自動化股份有限公司, 江蘇 常州 213015)
煤炭開采過程破壞了巖層間原始的應力平衡狀態(tài),在重力影響下,巖體會產(chǎn)生新的應力場,通常稱為礦壓顯現(xiàn)。劇烈的礦壓會誘發(fā)巷道變形失穩(wěn)、瓦斯突出、沖擊地壓等地質(zhì)災害,為煤礦生產(chǎn)帶來巨大的損失[1-2]。因此,為減少地質(zhì)災害的發(fā)生,掌握礦壓顯現(xiàn)的規(guī)律并對礦壓進行有效預測和控制是煤礦安全生產(chǎn)的重要課題之一。
近年來,分布式光纖傳感技術(shù)[3-5]的興起有效解決了礦壓難以監(jiān)測的問題。但是,由于采動過程中巖層變形具有隨機性、非線性的特點,導致礦壓規(guī)律難以預測。為解決該問題,許多學者采用光纖傳感器監(jiān)測的光纖頻移值對礦壓顯現(xiàn)規(guī)律進行表征。王潤沛[6]基于光纖平均頻移變化度表征礦壓的原理,結(jié)合機器學習算法對礦壓進行預測。鞏師鑫等[7]基于液壓支架工作阻力數(shù)據(jù)表征礦壓的原理,采用MRDA FLPEM(流形正則域適應函數(shù)鏈接預測誤差)集成算法預測了綜采工作面礦壓。趙毅鑫等[8]利用液壓支架阻力數(shù)據(jù)分析了大采高工作面的礦壓顯現(xiàn)規(guī)律并采用深度學習算法預測了礦壓。常峰[9]基于工作面頂板礦壓數(shù)據(jù),采用遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型預測了綜采工作面頂板的來壓規(guī)律。李澤萌[10]采用LSTM(Long Short-Term Memory,長短期記憶網(wǎng)絡(luò))模型對支架阻力數(shù)據(jù)表征的礦壓進行預測。趙銘生等[11]基于工作面綜采條件下的礦壓破壞深度實測數(shù)據(jù),采用遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型對礦壓破壞深度進行預測。上述研究在數(shù)據(jù)完整情況下對礦壓顯現(xiàn)規(guī)律進行了有效預測,但礦井環(huán)境惡劣,傳感器采集的數(shù)據(jù)存在缺失現(xiàn)象,導致無法準確預測礦壓顯現(xiàn)規(guī)律。因此,本文以義馬煤業(yè)(集團)有限責任公司千秋煤礦為工程背景,搭建三維相似物理模型,在假設(shè)光纖下半部分數(shù)據(jù)丟失的前提下,引入GRU(Gated Recurrent Unit,門控循環(huán)單元)和LSTM預測模型,對缺失的光纖頻移值進行對比預測,使用預測效果較優(yōu)的缺失值填補光纖頻移值數(shù)據(jù)缺失位置。將填補后的光纖頻移值數(shù)據(jù)轉(zhuǎn)換為能表征礦壓規(guī)律的光纖平均頻移變化度數(shù)據(jù),引入極端梯度提升(eXtreme Gradient Boosting,XGBoost)[12]模型和BP神經(jīng)網(wǎng)絡(luò)模型進行對比預測,得到較適合的礦壓預測模型。
根據(jù)千秋煤礦的地質(zhì)特征及構(gòu)造(表1)搭建三維相似物理模型,如圖1所示。模型幾何相似比為1∶400,容重相似比為1∶1.6,尺寸為3 600 mm×2 000 mm×2 000 mm(長×寬×高)。模型中上覆巖層厚度為174 mm,模擬煤層厚度為60 mm,底板厚度為200 mm。在模型上方均勻放置載荷共計3.4 kPa的沙袋。自開切眼位置從左至右進行掘進,工作面推進步距為40 mm,推進總長為2 400 mm。
在相似物理模型中埋設(shè)分布式光纖傳感器,建立光纖數(shù)據(jù)監(jiān)測系統(tǒng),如圖2所示。該系統(tǒng)由光纖傳感器、NBX-6055應力分析儀及計算機組成。在模型中部等間距布設(shè)3條垂直光纖Fv1,F(xiàn)v2,F(xiàn)v3,光纖數(shù)據(jù)采樣間隔為10 mm,有效長度為1 740 mm。在模擬工作面掘進時,光纖受到巖層內(nèi)部變形力的作用發(fā)生頻移,通過NBX-6055應力分析儀將光信號轉(zhuǎn)換為電信號后,傳輸?shù)接嬎銠C,最后使用計算機軟件實現(xiàn)對光纖數(shù)據(jù)的解析和存儲,采集到的數(shù)據(jù)以.bat格式存放。為了便于處理,將數(shù)據(jù)遷移至excel表格中,數(shù)據(jù)結(jié)構(gòu)為174×60的矩陣形式,行代表整條光纖各個位置的數(shù)據(jù),列代表工作面的推進距離。
表1 覆巖結(jié)構(gòu)及物理力學參數(shù)Table 1 Rock structure and physical and mechanical parameters
圖1 三維相似物理模型Fig.1 3D similar physical model
根據(jù)光纖傳感原理可知,在消除溫度因素影響后,布里淵頻移值與應變存在線性關(guān)系。布里淵頻移值的變化是傳感光纖對巖體變形破裂過程中信息變化的反映。巖層產(chǎn)生的變形越明顯,光纖所受應力越大,光纖監(jiān)測系統(tǒng)測得的布里淵頻移值變化也越大;當巖層產(chǎn)生的變形不明顯時,光纖監(jiān)測系統(tǒng)測得的布里淵頻移值變化小?;谏鲜鰩r層變形引起的光纖頻移值變化規(guī)律,文獻[13-16]提出了一種利用光纖平均頻移變化度表征礦壓的方法,即將光纖平均頻移變化度曲線中的“尖峰”位置作為上覆巖層礦壓顯現(xiàn)的判斷指標。光纖平均頻移變化度公式為
(1)
圖2 光纖監(jiān)測系統(tǒng)Fig.2 Optical fiber monitoring system
GRU模型是基于RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))預測模型和LSTM預測模型的改進模型,既解決了RNN模型中由于共享系數(shù)矩陣導致的梯度彌散和梯度爆炸的問題,也解決了LSTM中內(nèi)部單元結(jié)構(gòu)冗余的問題。這使得GRU模型在運算速度上優(yōu)于LSTM模型,且對小樣本數(shù)據(jù)集的預測精度更高。
GRU模型內(nèi)部單元主要由重置門和更新門組成,如圖3所示。重置門可以令當前神經(jīng)元的隱藏狀態(tài)遺忘與預測不相關(guān)的信息。更新門用于更新當前時刻該神經(jīng)單元記憶有效信息的程度,更新門的值越大說明記憶的有效信息越多。
GRU模型內(nèi)部各部分運算表達式為
r=σ(Wrxt+Brht-1)
(2)
z=σ(Wzxt+Bzht-1)
(3)
g=tanh(Wgxt+Bgrht-1)
(4)
ht=(1-z)ht-1+zg
(5)
圖3 GRU網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 GRU network topology
式中:r為重置門;σ為sigmoid激活函數(shù),表示神經(jīng)元的激活率;Wr,Br,Wz,Bz,Wg,Bg分別為重置門、更新門和候選隱藏狀態(tài)的上一時刻輸出及當前時刻輸入所對應的權(quán)重矩陣;xt為t時刻的輸入;ht-1為t-1時刻的輸出;z為更新門;g為候選隱藏狀態(tài);ht為t時刻的輸出。
XGBoost是在上一次模型預測的基礎(chǔ)上加入一顆新樹,然后去擬合前面樹的預測結(jié)果與真實值之間的殘差從而形成新模型,并將新模型作為下次模型學習的基礎(chǔ),以此提升模型的預測精度。其函數(shù)為
(6)
XGBoost使用的目標函數(shù)為
(7)
(8)
采用平均絕對誤差MR和平均相對誤差MA作為模型預測效果的評價指標。
(9)
(10)
式中C為參與評估的樣本數(shù)。
為選取較優(yōu)模型進行缺失值處理,對LSTM和GRU模型的預測效果進行對比。采用掘進至2 320 mm的光纖頻移值數(shù)據(jù)作為GRU和LSTM模型的數(shù)據(jù)集,將數(shù)據(jù)集按照7∶3的比例劃分為訓練集和測試集。設(shè)預測步長為1,將均方誤差函數(shù)作為損失函數(shù),批尺寸為3,迭代次數(shù)為20。
LSTM和GRU模型的損失函數(shù)分別如圖4、圖5所示??煽闯鲈诘^程中,LSTM模型在7次迭代后收斂過程平穩(wěn),GRU模型在5次迭代后收斂過程平穩(wěn),訓練集損失函數(shù)和測試集損失函數(shù)均達到平穩(wěn)狀態(tài),說明GRU模型的收斂速度比LSTM模型的收斂速度快。
圖4 LSTM模型損失函數(shù)Fig.4 LSTM model loss function
圖5 GRU模型損失函數(shù)Fig.5 GRU model loss function
LSTM和GRU模型對Fv1光纖下半部分數(shù)據(jù)反歸一化后的預測結(jié)果如圖6所示??煽闯?種預測模型都能準確預測出光纖下半部分頻移數(shù)據(jù)。為衡量模型的表現(xiàn)能力,計算真實值和預測值的誤差可得:LSTM模型的平均相對誤差為15.63%,平均絕對誤差為17.43 MHz,GRU模型的平均相對誤差為10.84%,平均絕對誤差為9.78 MHz。說明GRU模型的精度比LSTM模型的精度高。因此,使用GRU模型對缺失值進行回歸預測可得到更優(yōu)效果。
為了評估GRU模型的泛化能力,假設(shè)工作面掘進至1 320 mm時出現(xiàn)缺失現(xiàn)象,導致在后續(xù)監(jiān)測過程中,光纖監(jiān)測的下半部分光纖頻移值數(shù)據(jù)均缺失,采用GRU模型進行多次預測,將預測結(jié)果填補至缺失位置,如圖7所示。與光纖原始頻移數(shù)據(jù)(圖8)對比可知,使用GRU模型預測的光纖數(shù)據(jù)與原始光纖頻移數(shù)據(jù)曲線基本一致,說明GRU模型具有良好的泛化能力。
圖6 LSTM和GRU模型的預測結(jié)果Fig.6 The prediction results of LSTM and GRU models
圖7 光纖預測數(shù)據(jù)整合Fig.7 The optical fiber prediction data integration
圖8 光纖原始頻移數(shù)據(jù)Fig.8 The optical fiber raw frequency shift data
為了驗證XGBoost模型在預測礦壓規(guī)律上的優(yōu)越性,采用傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型與XGBoost模型對礦壓進行對比預測。將完整的光纖頻移值轉(zhuǎn)換為能表征礦壓現(xiàn)象的光纖平均頻移變化度曲線,如圖9所示。根據(jù)光纖平均頻移變化度“尖峰”可以表征礦壓的原理,對“尖峰”進行標注,在工作面掘進過程中,共出現(xiàn)14次來壓現(xiàn)象。
圖9 Fv1光纖平均頻移變化度曲線Fig.9 The average frequency shift curve of Fv1 optical fiber
基于混沌理論[17]對光纖平均頻移變化度數(shù)據(jù)進行相空間重構(gòu),通過自相關(guān)法得到最佳延遲時間τ和嵌入維數(shù)v。經(jīng)實驗得到當v=3,τ=1時,模型達到最優(yōu)狀態(tài)。設(shè)P為根據(jù)嵌入維數(shù)v建立的輸入數(shù)據(jù)集,Q為根據(jù)延遲時間τ建立的輸出數(shù)據(jù)集,數(shù)據(jù)集形式為
(11)
式中p為數(shù)據(jù)集中的數(shù)據(jù)。
將經(jīng)過相空間重構(gòu)的數(shù)據(jù)集按照4∶1的比例劃分為訓練集和測試集,將訓練集代入模型進行學習,測試集用來評估模型預測效果。
采用網(wǎng)格搜索算法對XGBoost模型中樹的深度和數(shù)量等超參數(shù)進行最優(yōu)化,當樹的深度為6、樹的數(shù)量為60時,可使模型性能達到最優(yōu)。XGBoost模型和BP神經(jīng)網(wǎng)絡(luò)模型的預測結(jié)果如圖10所示??煽闯鯴GBoost模型能準確預測出測試集中所有出現(xiàn)“尖峰”的位置,而BP神經(jīng)網(wǎng)絡(luò)模型只預測出2處“尖峰”的位置,說明XGBoost模型的預測效果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型的預測效果。
計算可得BP神經(jīng)網(wǎng)絡(luò)模型的平均絕對誤差為34.42 MHz,平均相對誤差為23.01%,XGBoost模型的平均絕對誤差為13.60 MHz,平均相對誤差為9.45%,XGBoost模型誤差小于BP神經(jīng)網(wǎng)絡(luò)模型,說明XGBoost模型預測礦壓的準確率優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。
圖10 XGBoost模型和BP神經(jīng)網(wǎng)絡(luò)模型的預測結(jié)果Fig.10 Prediction results of XGBoost model and BP neural network model
為驗證使用GRU模型預測缺失值的有效性和采用XGBoost模型預測礦壓的泛化性,將預測出來的缺失數(shù)據(jù)填補到缺失位置,形成“完整”的光纖頻移值數(shù)據(jù),將其轉(zhuǎn)換為光纖頻移變化度數(shù)據(jù)后,再使用XGBoost模型進行預測,實驗結(jié)果如圖11所示??煽闯鼋?jīng)缺失值填補后,采用XGBoost模型依然可以準確預測出“尖峰”位置。對XGBoost 模型預測出來的數(shù)據(jù)與真實數(shù)據(jù)間的誤差進行統(tǒng)計,可得平均絕對誤差為13.74 MHz,平均相對誤差為9.48%。與使用XGBoost模型預測完整光纖的效果相差不大。綜上所述,使用GRU模型可對缺失的光纖數(shù)據(jù)進行有效預測,且XGBoost模型在其他數(shù)據(jù)集中的表現(xiàn)良好。
圖11 替換數(shù)據(jù)預測Fig.11 Replacement data prediction
(1) 通過LSTM和GRU模型對光纖下半部分數(shù)據(jù)進行預測。結(jié)果表明,2種模型均可準確預測出光纖下半部分的數(shù)據(jù),且GRU模型準確性較LSTM模型準確性高。
(2) 基于表征礦壓規(guī)律的相似物理模型實驗測得的光纖頻移數(shù)據(jù),使用XGBoost模型對模擬工作面推進下的礦壓進行預測,可準確預測出測試集中所有出現(xiàn)“尖峰”的位置,其平均絕對誤差為13.60 MHz,平均相對誤差為9.45%。
(3) 通過多次采用GRU模型預測其他掘進次數(shù)的光纖下半部分數(shù)據(jù),用預測結(jié)果替換原始監(jiān)測結(jié)果,重新計算光纖平均頻移變化度,經(jīng)歸一化、相空間重構(gòu)后代入XGBoost模型進行預測。結(jié)果表明,替換后的數(shù)據(jù)能準確預測出周期來壓,與原始結(jié)果基本吻合,其平均絕對誤差為13.74 MHz,平均相對誤差為9.48%。