唐宇峰, 陳星紅, 蔡宇, 楊澤林, 蒲順哲, 楊超凡
(1.四川輕化工大學機械工程學院, 宜賓 644005; 2.重大危險源測控四川省重點實驗室, 成都 610045;3.四川省安全科學技術研究院, 成都 610045)
尾礦庫是礦山安全生產(chǎn)領域的重大危險源,通過分析其壩體的表面位移是評估尾礦壩安全性的重要方式[1],因此對尾礦壩的位移監(jiān)測數(shù)據(jù)進行預測分析具有重要意義。在對壩體位移變形數(shù)據(jù)分析處理上,將監(jiān)測的時序數(shù)據(jù)進行分解為具有物理意義的分量是常用方法[2]。謝博等[3]通過經(jīng)驗模態(tài)分解算法(empirical mode decomposition,EMD)對監(jiān)測數(shù)據(jù)分解后進行預測;周蘭庭等[4]采用自適應噪聲完備集合經(jīng)驗模態(tài)分解算法(complete ensemble empirical model decomposition adaptive noise, CEEMDAN)對監(jiān)測數(shù)據(jù)進行分解,以此對監(jiān)測數(shù)據(jù)的變形規(guī)律進行分析;鄢好等[5]通過移動平均法提取邊坡位移趨勢項和周期項。以上通過對監(jiān)測數(shù)據(jù)進行分解再預測的方法最終對預測結(jié)果的精度提升都有較好的效果,但都有各自一些無法克服的缺陷,如殘留噪聲、模態(tài)混疊、不適合大量數(shù)據(jù)樣本等。
由于尾礦壩的位移變形是一個動態(tài)變化的過程,近年來,基于機器學習對壩體位移進行預測研究成為一個熱點。張炎等[6]通過反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡并結(jié)合多元宇宙算法對大壩位移進行了預測,具有一定的預測效果,但BP的計算速度慢,容易陷入局部極小值;Jiang等[7]采用極限學習機預測周期項位移,但極限學習機對于尾礦壩的動態(tài)變化來說效果還有待改進。寧永香等[8]采用廣義回歸神經(jīng)網(wǎng)絡對露天礦邊坡變形預測,相較于BP網(wǎng)絡,其收斂速度更高,泛化能力較強,但網(wǎng)絡容易陷入梯度消失和梯度爆炸的困境。長短時記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡由于其“門”控機制在模型訓練過程中,能較好處理時序信息問題。在對壩體變形預測問題上,文獻[4]、文獻[9]采用LSTM對壩體監(jiān)測數(shù)據(jù)進行預測,均有較高的預測精度,但未解決LSTM超參數(shù)優(yōu)化問題,選擇不同超參數(shù)其預測結(jié)果具有較大的差異性。且當時間序列過長時,LSTM可能會出現(xiàn)信息丟失問題,影響預測精度[10]。
基于以上方法的優(yōu)勢和不足,現(xiàn)提出一種基于改進的自適應噪聲完備集合經(jīng)驗模態(tài)分解算法(improved complete ensemble empirical mode decomposition with adaptive noise,ICEEMDAN)和麻雀搜索算法-長短時記憶-注意力機制(sparrow search algorithm-long short-term memory-attention mechanism,SSA-LSTM-Attention)模型的尾礦壩體位移預測方法。首先將ICEEMDAN用于時序數(shù)據(jù)的分解處理,將監(jiān)測數(shù)據(jù)提取為趨勢項位移和周期項位移,然后,通過高斯擬合預測趨勢項位移,采用LSTM神經(jīng)網(wǎng)絡對相關影響因子作用下的波動項位移進行預測,并結(jié)合注意力機制(attention mechanism)加強模型處理長時間序列數(shù)據(jù)間相互關系的能力。通過麻雀搜索算法(SSA)優(yōu)化模型超參數(shù),提升模型的預測精度[11]。最后將趨勢項位移、波動項位移的預測值疊加,得到尾礦壩累積位移預測值。并通過實例驗證方法的可行性。
尾礦庫壩體位移是一個非線性的時間序列,若直接對原始累積位移進行建模會產(chǎn)生較大誤差,尾礦壩的變形規(guī)律難以分析。對原始序列采用先分解,再預測的方式既能有效利用數(shù)據(jù)信息,也能降低數(shù)據(jù)的復雜度,提高了預測的精度。采用ICEEMDAN算法將壩體累積位移分解為趨勢項和波動項,即
S(t)=φ(t)+η(t)
(1)
式(1)中:S(t)為累積位移時間序列;φ(t)為趨勢項位移,受壩體結(jié)構(gòu)、地質(zhì)構(gòu)造等自身條件決定;η(t)為受庫水位、降雨量等外界因素影響。
ICEEMDAN是Colominas等[12]在EMD的基礎上提出的一種新的信號分解方法。該方法改進了傳統(tǒng)的方法在對信號分解時存在模態(tài)混疊的不足,極大地減少了本征模態(tài)函數(shù)(intrinsic mode function,IMF)分量中的殘余噪聲。分解后,會得到一組頻率從高到低的IMF和一個殘差項。其中,IMF包含了原位移監(jiān)測數(shù)據(jù)不同時間段的局部特征信息,為波動項位移,而殘差項可以反映時間序列的主要趨勢,為趨勢項位移。
1.2.1 麻雀搜索算法
SSA是Xue等[13]受麻雀種群覓食和反捕食的群體智慧的啟發(fā),提出的一種新的群體優(yōu)化算法,該算法在搜索精度、收斂速度等方面均有很好的表現(xiàn),因此將其用于預測模型的參數(shù)優(yōu)化中。
在麻雀種群整個覓食過程中,分為發(fā)現(xiàn)者和加入者兩種不同的類型。發(fā)現(xiàn)者在覓食和遇到捕食者的過程中,位置不斷發(fā)生變化,其位置更新方式為
(2)
式(2)中:Xi,j為i個麻雀在j維中的位置信息;Imax為最大迭代次數(shù);α為(0,1]內(nèi)的一個隨機數(shù);R2∈[0,1]、S∈[0.5,1]分別為預警值和安全值;Q為服從正態(tài)分布的隨機數(shù);L為大小1×d、元素均為1的矩陣。
加入者的位置更新為
(3)
式(3)中:Xp為發(fā)現(xiàn)者覓食的最優(yōu)位置;Xworst為當前全局最差的位置;A為一個大小為1×d、元素隨機為-1或1的矩陣,且有A+=AT(AAT)-1;n為種群規(guī)模。
當麻雀種群發(fā)現(xiàn)捕食者時,會發(fā)出警告,其位置更新為
(4)
式(4)中:Xbest為整個麻雀種群中最優(yōu)位置;β作為步長控制參數(shù);K為麻雀移動方向同時也是步長控制參數(shù);fi和fg分別為全局最好和最差適應度值;ε為最小常數(shù),以避免分母出現(xiàn)零。
1.2.2 基于LSTM及注意力機制的波動項位移預測模型
LSTM是一種特殊的遞歸神經(jīng)網(wǎng)絡(recurrent neural networks,RNN),與RNN相比,LSTM在RNN的基礎上新增了細胞狀態(tài),讓相關序列信息連續(xù)傳遞下去,并引入“門控機制”,實現(xiàn)信息的添加和剔除,使得LSTM具有長期或短期的記憶能力,避免了RNN可能出現(xiàn)的梯度爆炸和梯度消失等問題[14]。LSTM的門控機制和細胞狀態(tài)的計算過程如下所示。
ft=σ(Wf[ht-1,xt]+bf)
(5)
it=σ(Wi[ht-1,xt]+bi)
(6)
(7)
(8)
ot=σ(Wo[ht-1,xt]+bo)
(9)
ht=ottanh(Ct)
(10)
式中:W為各門控機制對應的權重矩陣;b為各門控機制對應的偏置向量;ft、it、ot分別為遺忘門、輸入門和輸出門的輸出結(jié)果,遺忘門對信息進行丟棄或保留,輸入門對細胞狀態(tài)的信息進行選擇性的更新,輸出門確定下一個隱藏狀態(tài)的值;xt為當前時刻的輸入;Ct-1和Ct為前一時刻和當前時刻經(jīng)過遺忘門和輸入門后的細胞狀態(tài)的輸出結(jié)果;ht-1和ht為前一時刻和當前時刻的隱藏層狀態(tài);σ和tanh分別為Sigmoid函數(shù)和雙曲正切函數(shù)。
傳統(tǒng)的LSTM神經(jīng)網(wǎng)絡對于時間序列數(shù)據(jù)波動性具有較好的預測能力,但對于長序列的樣本可能遺忘較早學習的內(nèi)容,丟失一些重要信息,影響預測的精度。而注意力機制是一種模擬人類視覺接收信息的大腦信號處理機制,在某些特定的情況下,人腦會將注意力分配在需要重點關注的某些方面,對不需要重點關注的方面減少和不分配。這種機制可以從有限的注意力資源中快速篩選出大腦所需要的信息[15]。預測模型輸入的數(shù)據(jù)在不同時間點對尾礦壩位移預測的重要性不同,注意力機制將輸入的特征賦予不同的權重,能有效地突出LSTM網(wǎng)絡預測結(jié)果中影響尾礦壩位移變形的關鍵特征,提高了模型的預測性能。
故將Attention機制引入LSTM中,以此建立模型對監(jiān)測樣本進行訓練預測。模型結(jié)構(gòu)如圖1所示,分別為輸入層、LSTM層、注意力機制層、輸出層。
圖1 LSTM-Attention模型結(jié)構(gòu)圖Fig.1 LSTM-Attention Model structure diagram
輸入層將與波動項相關的影響因子監(jiān)測數(shù)據(jù)xt作為模型的輸入,傳入LSTM神經(jīng)網(wǎng)絡;LSTM層負責對樣本特征進行學習,得到對應隱藏層的輸出ht;在隱藏層加入注意力機制,注意力機制層則對模型輸入特征賦予不同的權重并不斷更新,權重系數(shù)的計算方式如下。
et=utanh(w1ht+b)
(11)
(12)
(13)
式中:et為t時刻的隱藏層向量;αt為注意力權重;u、w1為權重系數(shù);νt為注意力機制層的輸出;b為偏置向量。輸出層通過全連接層輸出下一時刻的預測結(jié)果,表達式為
yt=σ(w2νt+b)
(14)
式(14)中:yt為預測輸出值;w2為權重矩陣,決定了模型在給定輸入時預測輸出的能力;b為偏置向量;σ表示Sigmoid函數(shù)。
基于ICEEMDAN和SSA-LSTM- Attention模型的尾礦位移預測流程如圖2所示。
圖2 預測流程圖Fig.2 Forecast flow chart
步驟1對原始監(jiān)測數(shù)據(jù)進行預處理后,采用ICEEMDAN算法對位移時間序列進行分解為趨勢項位移和波動項位移。
步驟2對趨勢項位移利用其單調(diào)的增長特性采用高斯函數(shù)擬合預測;對于波動項位移,用灰色關聯(lián)度篩選與其密切相關的影響因子,采用LSTM-Attention進行動訓練預測,并利用SSA對該模型的超參數(shù)進行優(yōu)化。
步驟3將趨勢項位移和波動項位移的預測結(jié)果疊加得到尾礦壩累積位移預測值,并評價模型預測效果。
采用均方根誤差(RRMSE)、平均絕對誤差(MMAE)和決定系數(shù)R2指標來評估模型的預測性能。各指標的計算公式如下。
(15)
(16)
(17)
所研究尾礦庫位于攀西地區(qū),尾礦庫初期壩為碾壓透水堆石壩,堆積壩采用上游法尾礦砂筑壩工藝。以尾礦庫的北斗在線監(jiān)測系統(tǒng)的歷史數(shù)據(jù)為樣本,監(jiān)測數(shù)據(jù)包括壩體表面位移、降雨量和庫水位。選擇其中以位移變形較大、監(jiān)測時間較長的監(jiān)測點為實驗數(shù)據(jù),監(jiān)測時間段為2020年5月1日—2021年7月31日,設備采樣頻率為1 h,共10 968個監(jiān)測樣本數(shù)據(jù),選擇前7 968個監(jiān)測數(shù)據(jù)為訓練集,其余數(shù)據(jù)作為測試集,訓練集和測試集比例約為7∶3。由于北斗監(jiān)測存在設備儀器及數(shù)據(jù)的誤差,對于缺失值,進行3次樣條曲線插值補全,對于明顯異常游離的數(shù)據(jù)進行剔除。尾礦庫監(jiān)測點位壩體形變位移、月降雨量、庫水位如圖3所示。
圖3 壩體累積位移、月降雨量和庫水位關系圖Fig.3 Relationship between volume displacement of tailings dam, monthly rainfall and reservoir water level
從圖3中可以看出,壩體位移受庫水位和降雨量雙重影響,2020年5—8月處于雨季月份,降雨量增多,庫水位上升幅度大,壩體位移變化加劇,平均位移變化速率為0.38 mm/d;2020年9月—2021年4月在非雨季月份,降雨量較少,壩體變形過程中庫水位起主要影響,庫水位變化變緩,壩體位移相對于雨季,平均變形速率為0.04 mm/d,位移變化趨于平緩。而在2021年5—7月,此時壩體位移的平均變化速率為0.26 mm/d,從監(jiān)測數(shù)據(jù)可以看到降雨有逐漸增多的趨勢,但總體降雨較少,因此庫水位和壩體位移變化速率相比非雨季月份雖然有所增加,但增長較為緩慢。由此,可推斷尾礦壩體的變形與降雨量和庫水位有較大的相關性,在壩體位移預測過程中需要考慮庫水位和降雨量的影響。
對位移序列采用ICEEMDAN進行分解,得到1個殘差項和11個IMF項。將分離出的殘余項作為趨勢項位移,其他IMF項相加作為波動項位移,如圖4所示。
圖4 ICEEMDAN分解的趨勢項位移和波動項位移Fig.4 ICEEMDAN decomposition of trend term displacement and fluctuating term displacement
受壩體勢能、壩體特性影響,趨勢項位移隨時間表現(xiàn)出單調(diào)遞增的趨勢。因此用高斯擬合對趨勢項擬合預測。擬合以高斯函數(shù)系為基礎,采用3個高斯函數(shù)相加對訓練集進行擬合,并將得到的擬合函數(shù)用于測試集的預測。擬合高斯函數(shù)表達式為
(18)
式(18)中:ai、bi、ci為高斯函數(shù)的參數(shù)。預測結(jié)果如圖5所示,R2為0.91,MMAE為0.93 mm,RRMSE為1.1 mm。
圖5 趨勢項預測結(jié)果Fig.5 Trend term forecast results
2.3.1 影響因子選取
考慮到降雨量和庫水位對壩體位移影響的滯后性,以及壩體本身的演化趨勢。因此將影響因素初步用趨勢項位移變化量f1、當前庫水位f2、每小時庫水位變化量f3、前一月庫水位f4、當前降雨量f5、每小時降雨變化量f6、前一月降雨量f7等7個影響因子表示,并采用灰色關聯(lián)度對影響因子進行篩選?;疑P聯(lián)度ri計算公式如下。
(19)
(20)
式中:Δmin為參考數(shù)列和比較數(shù)列的最小絕對差值;Δmax為參考數(shù)列和比較數(shù)列的最大絕對差值;Δ0i(k)為參考數(shù)列和比較數(shù)列的插值;ρ為分辨系數(shù),取ρ=0.5;ξi(k)為關聯(lián)系數(shù)。影響因子和波動項位移間的關聯(lián)度如表1所示。
表1 波動項位移與影響因子的關聯(lián)度
一般認為當關聯(lián)度ri>0.6時,即可認為影響因子與波動項位移具有較強的相關性。因此選擇f1、f2、f3、f4、f6、f7用于波動項位移的預測。
從表1關聯(lián)度可以看出,庫水位相關的影響因子與波動項位移的關聯(lián)度基本上都密切相關,降雨量的影響因子中,當前降雨量、前一月降雨量的與波動項位移的關聯(lián)度較低,而當前降雨變化量與波動項位移的關聯(lián)度較高。結(jié)合圖5監(jiān)測數(shù)據(jù),分析其原因,首先,所選監(jiān)測時間內(nèi),降雨的變化主要對庫水位影響較為明顯,而對壩體位移的直接影響相對較低,主要通過庫水位來間接對壩體位移產(chǎn)生影響。庫水位對壩體位移的影響在降雨后加劇,改變了原降雨量對壩體位移的影響的相關性。其次,研究中尾礦庫降雨量監(jiān)測與壩體位移監(jiān)測位置不一致且降雨具有隨機性,使得降雨量與波動項位移的相關度較低。說明庫水位是所研究尾礦庫壩體變形的主要影響因素,而降雨量是次要影響因素。
2.3.2 預測結(jié)果對比和分析
將篩選的影響因子作為輸SSA-LSTM- Attention的輸入,波動項位移作為模型的輸出,通過SSA對模型的超參數(shù)優(yōu)化,得到的學習率為0.001 1,迭代次數(shù)為112,第1隱含層節(jié)點數(shù)為92,第2隱含層節(jié)點數(shù)為35。訓練模型時采用Adam優(yōu)化器作為模型的優(yōu)化函數(shù)。分別采用BP、LSTM、LSTM-Attention、SSA-LSTM-Attention進行預測對比。波動項位移預測結(jié)果對比如圖6所示。相比與其他模型,SSA-LSTM-Attention預測結(jié)果更為吻合。
圖6 波動項預測結(jié)果Fig.6 Fluctuation term prediction results
不同模型下波動項位移預測精度對比如表2所示。
表2 不同模型下波動項位移預測精度
由表2可以看出,在波動項位移預測中,BP預測精度最低,這是因為BP是一個靜態(tài)模型,對于尾礦壩位移這一動態(tài)時變過程進行預測具有局限性,相較于傳統(tǒng)的BP、LSTM模型,加入注意力機制的LSTM模型能顯著提升其與時序特征相關的提取能力,而結(jié)合SSA優(yōu)化及注意力機制的LSTM模型,通過搜索其最佳訓練參數(shù),可以使預測精度更高,效果更好。
將預測得到的趨勢項位移和波動項位移相加即得到壩體累積位移,最終得到的累積位移預測值的MMAE為0.553 mm,RRMSE為0.742 mm,R2結(jié)果為0.994,預測結(jié)果對比如表3和圖7所示。
表3 累積位移預測精度對比表
圖7 累積位移預測結(jié)果Fig.7 Cumulative displacement prediction results
從表3可以看出,在累積位移預測中,SSA- LSTM-Attention模型的RRMSE和MMAE與LSTM-Attention相比,分別下降了57.5%和57.8%,R2提升28.2%,從圖7中可以看出,SSA-LSTM-Attention能更好地預測出壩體表面位移變化,對于后續(xù)預警研究有較好的實用價值。
(1)以攀西地區(qū)尾礦庫壩體監(jiān)測數(shù)據(jù)為例,提出了一種基于ICEEMDAN的時間序列分解方法和SSA-LSTM-Attention的尾礦壩累積位移預測模型,對比分析了SSA-LSTM-Attention的預測模型相對于BP、LSTM、LSTM-Attention模型在進行位移預測時的優(yōu)勢。RRMSE、MMAE、R2結(jié)果表明,SSA-LSTM-Attention模型預測效果最好,具有較高的工程應用價值。
(2)通過灰色關聯(lián)度對波動項位移相關影響因子進行定性分析的結(jié)果可知,影響尾礦壩變形的主要因素是庫水位,降雨量次之。在條件允許的情況下,可根據(jù)工程實際,加入更多的尾礦壩影響因素的北斗監(jiān)測數(shù)據(jù)(如浸潤線、內(nèi)部位移)等可以對壩體變形進行更進一步的分析。