張丹鋒
(青海省交通建設管理有限公司, 西寧 810001)
隧道開挖過程中可能會穿越油氣盆地、煤系地層等瓦斯聚集帶,一旦發(fā)生瓦斯泄露,極易發(fā)生窒息、爆炸等安全事故[1-2]。因此,在含煤地層中修建隧道時,準確預測瓦斯等有毒氣體濃度,可減少安全事故的發(fā)生、保障施工人員的生命安全[3]。
瓦斯?jié)舛鹊念A測是瓦斯防治技術中一個非常重要的組成部分,目前國內外眾多學者對其開展了廣泛研究,并取得了顯著成果。傳統(tǒng)的瓦斯?jié)舛阮A測主要有礦山統(tǒng)計法[4]、地質教學模型法[5]等利用數(shù)理統(tǒng)計理論建立的模型與方法。但這些傳統(tǒng)預測構建的模型簡單,在處理非線性、非平穩(wěn)的時間序列時極易產(chǎn)生較大誤差。隨著計算機信息技術的發(fā)展,機器學習在時間序列預測領域受到廣泛關注。黃潤蘭等[6]采用支持向量機SVM(Support Vector Machine)在短期風速預測方面很實用;吳奉亮等[7]采用隨機森林RF(Random Forest)模型在煤礦瓦斯涌出量預測方面獲得了較高的預測精度。長短期記憶網(wǎng)絡LSTM(Long Short-Term Memory)是一種循環(huán)神經(jīng)網(wǎng)絡,通過自身結構的特殊化設計,針對時間序列模型建模能力較強,且適合處理與時間序列高度相關的問題[8-9]。李偉山等[10]采用LSTM模型在煤礦瓦斯預測中得到了較高的準確度;Nelson等[11]指出,LSTM是一個適合時間序列的模型,同時比其他機器學習模型如隨機森林、多層感知器和偽隨機模型提供更精確的結果。
盡管使用單一預測模型有助于數(shù)據(jù)分析,但對一些不穩(wěn)定和隨機性很強的時間序列,其分析和預測有一定的局限性。為解決此問題,可使用頻率分解法降低數(shù)據(jù)序列的復雜性:先將非平穩(wěn)的信號分解成若干不同頻率的單一信號,后把各單一信號的預測值進行疊加,這種混合模型的預測精度較單一模型有所提高[12]。代巍等[13]基于變分模態(tài)分解VMD(Variational Mode Decomposition)、差分進化DE(Differential Evolution)算法和相關向量機RVM(Relevance Vector Machine)原理預測了瓦斯涌出量;撒占友等[14]基于經(jīng)驗模態(tài)分解EMD(Empirical Mode Decomposition)和自回歸滑動平均模型ARMA(Auto-Regressive and Moving Average)預測了瓦斯涌出量;趙振學[15]基于經(jīng)驗模態(tài)分解技術和極限學習機ELM(Extreme Learning Machine)預測了瓦斯?jié)舛?。上述研究結果表明,組合模型的誤差值低于其他模型,對瓦斯?jié)舛鹊念A測精度更高。趙會茹等[16]采用基于互補集合經(jīng)驗模態(tài)分解CEEMD(Coplementary Ensemble Empirical Mode Decomposition)和長短期記憶神經(jīng)網(wǎng)絡構建了應用于短期電力負荷預測的CEEMD-LSTM模型,并取得了不錯的效果。CEEMD可解決EMD分解帶來的模態(tài)混疊[17]現(xiàn)象、EEMD分解帶來的冗余噪聲影響。
針對現(xiàn)場瓦斯數(shù)據(jù)具有非線性、非平穩(wěn)性、復雜性的特點,本文提出了一種基于互補集成經(jīng)驗模態(tài)分解和長短期記憶網(wǎng)絡結合的預測方法,并以某穿煤隧道現(xiàn)場實時監(jiān)測的瓦斯?jié)舛葦?shù)據(jù)為研究對象,先運用CEEMD將其分解為具有不同特征的子序列分量,以降低瓦斯時間序列的復雜度和非線性對預測準確性的影響;后對分解后的各子序列分別建立LSTM網(wǎng)絡模型進行單步預測;再疊加各子序列預測結果,得到隧道瓦斯?jié)舛茸罱K預測值。
國道569曼德拉至大通公路小沙河(甘青界)至大通段公路是青海省重要的北部出口通道之一。祁連山2#隧道位于青海省門源縣仙米鄉(xiāng),長約6 000 m,隧址區(qū)海拔高程約3 500 m,為典型的高海拔特長公路隧道,是曼大公路小大段的控制性工程。祁連山2#隧道進口端圍巖為強-中風化炭質頁巖(含煤線)與砂巖互層,巖體較破碎,泥質結構,薄層狀構造,主要礦物為泥質礦物。該段圍巖節(jié)理、裂隙發(fā)育,巖體破碎,呈碎裂結構,圍巖穩(wěn)定性較差。根據(jù)瓦斯評價結果顯示:從單項指標判斷,瓦斯含量較小,屬低瓦斯隧道,但煤層頂?shù)装鍑鷰r較破碎,有逸散突出危險,施工圖設計判定為低瓦斯區(qū)段。
2019年1月9日,在隧道左洞ZK37+845掌子面施工超前地質鉆孔時,左右側距底板2 m位置處施工的鉆孔鉆進至2.5 m時,突然出現(xiàn)水汽噴涌現(xiàn)象,左側鉆孔噴出2.5 m遠,右側鉆孔噴出約1 m遠,在噴涌水汽的鉆孔口檢測到硫化氫和瓦斯?jié)舛确謩e高達100 ppm和2.5%。經(jīng)中煤科工集團重慶研究院有限公司鑒定:該隧道瓦斯等級鑒定結果為高瓦斯隧道。根據(jù)資料估測,該隧道后續(xù)左右洞將還各有1 400多m甚至更長段落高瓦斯區(qū)域,祁連山2#隧道進口段和掌子面煤層如圖1所示。
(a) 隧道進口
互補集合經(jīng)驗模態(tài)分解是由經(jīng)驗模態(tài)分解、集合經(jīng)驗模態(tài)CEEMD(Complementary Ensemble Empirical Mode Decomposition)分解改進而來的一種信號分解方法[18]。CEEMD通過在原始信號中添加一對獨立同分布但符號相反的白噪聲序列,能夠減少原始信號中殘留的輔助噪聲,同時能克服模態(tài)混疊現(xiàn)象。分解步驟如下:
1) 在原始信號中加入n組符合相反的噪聲信號,表達式為:
pi+(t)=x(t)+ni+(t)
pi-(t)=x(t)+ni-(t)
(1)
2) 對合成信號進行經(jīng)驗模態(tài)分解,可以得到pi+(t)、pi-(t)的第k個本征模態(tài)分量為Fik與F-ik。將各模態(tài)分量與殘差分量的平均值作為分解結果,表達式為:
(2)
(3)
式中:x(t)為待分解的原始信號;ni+、ni-為符號相反的白噪聲序列;Ik(t)為第k個本征模態(tài)分量;Re(t)為最終的殘差分量。
長短期記憶網(wǎng)絡是一種改進后的循環(huán)神經(jīng)網(wǎng)絡RNN(Recurrent Neural Network),克服了RNN的梯度消失或爆炸問題,其隱含層結構如圖2所示。
圖2 LSTM隱含層結構
細胞狀態(tài)(cell state)是神經(jīng)網(wǎng)絡模塊的關鍵,LSTM通過3個“門”來保護和控制細胞狀態(tài)[19]。
1) 遺忘門。它決定從細胞狀態(tài)Ct-1中丟棄什么信息。ft=0表示完全舍棄,ft=1表示完全保留,表達式為:
ft=σ(Wf·[ht-1,xt]+bf)
(4)
it=σ(Wi·[ht-1,xt]+bi)
(5)
(6)
接著就是對細胞狀態(tài)進行更新,得到一個新的細胞狀態(tài)Ct,表達式為:
(7)
3) 輸出門。確定輸出值ht:(1) 運行一個sigmoid層來確定隱藏狀態(tài)的哪部分將輸出;(2) 細胞狀態(tài)通過tanh進行處理(得到一個在-1到1之間的值),并將它和sigmoid門的輸出相乘,最終輸出該部分,表達式為:
ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=ot*tanh(Ct)
(9)
式中:Wf、Wi、Wo以及bf、bi、bo分別為神經(jīng)單元遺忘門、輸入門、輸出門的權重矩陣和偏置值;ft、it、ot分別為t時刻遺忘門、輸入門、輸出門的輸出向量;σ為sigmoid激活函數(shù);tanh為雙曲正切激活函數(shù)。
在上述理論基礎上,本文提出了基于CEEMD-LSTM組合模型對瓦斯的預測方法。該模型先對瓦斯時間序列運用CEEMD將其分解為本征模態(tài)函數(shù)IMF(Intrinsic Mode Function)序列和殘差序列,后對分解后的各序列分別建立LSTM模型,再疊加各序列預測結果。CEEMD-LSTM模型預測流程如圖3所示。
圖3 CEEMD-LSTM組合模型預測流程
瓦斯?jié)舛葦?shù)據(jù)取自寧纏隧道同一煤層掌子面處,利用自動監(jiān)控系統(tǒng)實時采集的風排瓦斯?jié)舛?采樣時間為2022年4月1日至2022年4月30日,現(xiàn)場監(jiān)測數(shù)據(jù)間隔為1 h,共計720 h。受現(xiàn)場復雜作業(yè)環(huán)境影響,原始數(shù)據(jù)序列波動性大,復雜程度高,且有異常值和缺失值。為減少數(shù)據(jù)異常對預測模型性能的影響,采用3次樣條插值法補充缺失值和修正異常值。一共有720個數(shù)據(jù)集,其中70%作為訓練集用于網(wǎng)絡訓練,剩余30%作為測試集用于樣本外預測,即504個訓練集、216個測試集,如圖4所示。
圖4 瓦斯數(shù)據(jù)樣本
由于隧道瓦斯?jié)舛鹊脑紩r間序列有很強的非穩(wěn)定性及非線性,序列的復雜程度較高,因此采用CEEMD方法對原始時間序列數(shù)據(jù)進行分解,得到子序列IMF1、IMF2、IMF3以及殘差RES,分解結果如圖5所示。
圖5 瓦斯時間序列模態(tài)分解曲線
關鍵參數(shù)的選取會很大地影響LSTM模型的訓練效果,本文所構建的LSTM預測模型的參數(shù)主要包括:訓練次數(shù)(epoch),批尺寸(batch size),隱含節(jié)點數(shù)(hidden_size),隱含層數(shù)(layer_size),隱含層神經(jīng)元個數(shù)(rnn unit),隨機失活率(dropout),輸入步長(input step),輸出步長(output step)。其中,為提高模型優(yōu)化效果,輸出步長選1,即為單步預測[20];其余主要參數(shù)選用網(wǎng)格搜索法的方式對進行模型訓練,超參數(shù)選取如表1所示。
表1 超參數(shù)選擇情況
LSTM預測模型為單隱含層和Dense全連接層構成,LSTM層后設置dropout層以防止過擬合,訓練優(yōu)化算法采用Adam。
對于預測模型的檢驗,采用均方根誤差RMSE(Root Mean Squared Error)和平均絕對誤差MAE(Mean Absolute Error)作為評價指標。RMSE和MAE指標值均表示樣本的離散程度,數(shù)值越小則表明預測的效果越好。各誤差計算方法如下:
(10)
(11)
為驗證所提的CEEMD-LSTM方法具有更好的預測性能,引入一些其他預測模型進行對比。單一預測模型有MLP、SVR、GRU和LSTM,不同類分解方法的組合模型有EMD-MLP、EMD-SVR、EMD-GU和EMD-LSTM,同類分解方法的組合模型有CEEMD-MLP、CEEMD-SVR和CEEMD-GRU,并對結果進行分析。
4種單一模型各自作用下的瓦斯?jié)舛阮A測結果如圖6所示。由圖6可以看出,未對原始時間序列分解前,使用單一模型對瓦斯?jié)舛冗M行預測的曲線與實際瓦斯?jié)舛惹€具有非常相似的形狀,且在圖6(b)中對預測曲線局部放大后可以看出,預測曲線滯后于真實曲線,且當前時刻的預測值幾乎等于上一時刻的真實值,產(chǎn)生這種現(xiàn)象可能因時間序列的非平穩(wěn)性所致。
(a) 單一模型預測曲線
4種單一模型各自作用下的瓦斯?jié)舛阮A測誤差值如表2所示。由表2可以看出,LSTM預測模型的準確度高于GRU、SVR和MLP,LSTM模型的RMSE指標相對于GRU、SVR和MLP分別降低了4.82%、5.73%和13.38%,MAE指標分別降低了8.71%、23.72%和33.72%。
表2 單一模型預測誤差
為解決單一預測模型出現(xiàn)預測值滯后的問題,需對時間序列進行平穩(wěn)性處理。因此,先采用EMD、CEEMD分解算法對時間序列進行分解,得到序列imf及殘差;后對各分量數(shù)據(jù)分別與單一模型結合預測;再將各分量預測結果進行疊加,得到最終的預測結果。
EMD、CEEMD與4種單一模型組合作用下的瓦斯?jié)舛阮A測結果如圖7、圖8所示。由圖7、圖8可以看出,EMD和CEEMD混合模型沒有出現(xiàn)單一模型預測曲線滯后的現(xiàn)象,EMD混合模型的預測效果相較單一模型有所提升,而CEEMD混合模型的預測效果相較單一模型提升的效果更加顯著。
(a) EMD與單一模型組合預測曲線
(a) CEEMD與單一模型組合預測曲線
EMD與4種單一模型組合作用下的瓦斯?jié)舛阮A測誤差值如表3所示。結合圖7和表3可以看出,EMD-LSTM模型相較EMD-GRU、EMD-SVR和EMD-MLP有更高的預測準確度,其RMSE指標分別降低了7.89%、2.12%和27.84%,MAE指標分別降低了5.50%、24.26%和37.95%。
表3 EMD組合模型預測誤差
CEEMD與4種單一模型組合作用下的瓦斯?jié)舛阮A測誤差值如表4所示。結合圖8和表4可以看出,CEEMD-LSTM模型相較CEEMD-GRU、CEEMD-SVR和CEEMD-MLP有更高的準確度,其RMSE指標分別降低了5.65%、10.34%和24.27%,MAE指標分別降低了5.98%、17.22%和26.29%。
表4 CEEMD組合模型預測誤差
為驗證CEEMD-LSTM模型的準確性,將其與分解前的LSTM模型與其他分解法的EMD-LSTM模型做進一步對比。
LSTM模型與其2種組合模型作用下的瓦斯?jié)舛阮A測對比情況如圖9、表5所示。結合圖9、表5可以看出,CEEMD-LSTM相較LSTM和EMD-LSTM有更高的準確度,其RMSE指標分別降低了40.76%、12.36%,MAE指標分別降低了38.87%、16.02%,這也反映出單一模型對多因素影響下的瓦斯?jié)舛确瞧椒€(wěn)時間序列的自適應性較弱。采用EMD分解監(jiān)測數(shù)據(jù),可考慮不同影響條件下的瓦斯?jié)舛茸兓?guī)律,通過本征模量表達數(shù)據(jù)本質特征,預測重構模型精度高于單一模型;CEEMD可克服EMD模態(tài)混疊現(xiàn)象,進一步提高對瓦斯?jié)舛鹊念A測效果。
表5 LSTM單一模型與組合模型對比誤差
(a) 分解前后預測效果對比
針對現(xiàn)場瓦斯數(shù)據(jù)具有非線性、非平穩(wěn)性及復雜性的特點,本文提出了一種基于互補集合經(jīng)驗模態(tài)分解(CEEMD)與長短期記憶網(wǎng)絡(LSTM)組合模型的隧道瓦斯?jié)舛阮A測方法,通過對瓦斯?jié)舛葦?shù)據(jù)分解后的各子序列分別進行單步預測并疊加獲得隧道瓦斯?jié)舛茸罱K預測值,得出如下結論:
1) 對于非線性、非平穩(wěn)性的時間序列,單一模型預測曲線與真實曲線具有相似的形狀,但預測曲線會滯后于真實曲線且任一時刻的預測值幾乎等于上一時刻的真實值。
2) CEEMD和EMD可將混有高頻噪音、隨機性強的原始瓦斯數(shù)據(jù)分解得到若干頻率由高到低的本征模態(tài)分量和殘差,降低了原始瓦斯時間序列的非平穩(wěn)性,改善了瓦斯數(shù)據(jù)質量,其預測重構模型精度會高于單一模型。但EMD存在模態(tài)混疊的問題,而CEEMD可克服這一現(xiàn)象,并能進一步地提高對瓦斯?jié)舛鹊念A測效果。
3) 構建CEEMD-LSTM模型的RMSE和MAE指標分別為0.023 4和0.017 3,其誤差值低于本文所提其他預測模型,這表明CEEMD-LSTM模型可有效運用在隧道瓦斯領域的時間序列分析,為隧道的安全施工提供指導性的作用。
4) 采用互補集合經(jīng)驗模態(tài)分解法,可更加全面地挖掘出隧道瓦斯?jié)舛鹊淖兓?guī)律,實現(xiàn)瓦斯?jié)舛鹊木珳暑A測,為瓦斯隧道的安全施工提供重要理論依據(jù)。