呂文玉,王海金,伍永平,杜旭峰,賀雁鵬,賈棟棟
(1.西安科技大學 能源學院,陜西 西安 710054;2.西安科技大學 西部礦井開采及災害防治教育部重點實驗室,陜西 西安 710054;3.陜西小保當煤業(yè)有限公司,陜西 神木 719300)
精準預測綜采面周期來壓,提前做好防護措施,可以保障煤礦安全高效生產(chǎn),具有良好的社會經(jīng)濟效益[1,2]。目前,綜采面周期來壓規(guī)律的分析主要包括巖層控制理論分析推導,室內(nèi)物理模擬尋找潛在規(guī)律,數(shù)值計算軟件在理想條件下,增加約束模擬巖層圍巖破壞變形。傳統(tǒng)采礦為消除老頂來壓帶來的工作面安全隱患,在頂板來壓的發(fā)生機理、預測方面做了大量的工作。但由于煤巖介質非線性、復雜性、不確定等特點,且傳統(tǒng)計算、模擬方法是建立在一定的理想條件下,因此并不能夠達到理想的圍巖控制效果。近年來,隨著人工智能的創(chuàng)新與發(fā)展,基于神經(jīng)網(wǎng)絡、機器學習、深度學習的數(shù)據(jù)挖掘方法為周期來壓的預測預報提供了新的解決思路。賀超峰[3]利用普通的BP神經(jīng)網(wǎng)絡對淮南潘集礦區(qū)的綜采工作面的周期來壓強度、步距進行預測,并取得較高的精度。楊碩[4]針對榆神府礦區(qū)的薄基梁淺埋煤層工作面,利用改進的粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡對采場礦壓規(guī)律進行預測,取得良好的預測效果。趙毅鑫等[5]建立長短時間記憶網(wǎng)絡,并使用遷移學習,對大采高工作面礦山壓力規(guī)律進行預測分析,得出長短時間記憶網(wǎng)絡模型具有較強的泛化性。本文以陜北榆神府礦區(qū)80個近淺埋煤層工作面的工況為研究對象,采用粒子群優(yōu)化的支持向量機(PSO-SVR)算法來預測采場上覆巖層中的礦壓現(xiàn)象。通過粒子群算法建立了PSO-SVR預測模型,尋找支持向量機的最佳參數(shù),改善普通支持向量機收斂速度慢、人為尋找最優(yōu)參數(shù)難度較高,效率低等問題。
回歸型支持向量(SVR)作為支持向量機的一種,其與分類型支持向量(SVR)機區(qū)別主要是在SVR拓撲結構中引入不敏感函數(shù)[6]。支持向量機結構特征主要是利用核技巧、軟間隔最大化去求解一個非線性問題,然后利用松弛變量約束使得更多的樣本集符合約束條件來求解回歸擬合問題,其最主要思想是利用核函數(shù)將非線性的特征向量映射到一個高維空間,在新空間內(nèi)尋找最優(yōu)的決策面使得所有的支持向量離該最優(yōu)分決策面的距離最小[7]。標準支持向量機結構如圖1 所示。
圖1 SVR結構
設在高維空間的樣本集(xi,yi)中,存在多元線性回歸擬合函數(shù):
f(x)=wφ(x)+b
(1)
式中,x,f(x)分別代表訓練樣本集的輸入和輸出值,其中,x=[x1,x2,…,xi];w為權向量;φ(x)為非線性映射函數(shù);b為偏置項。
定義線性不敏感損失函數(shù):
(2)
式中,y代表訓練樣本集的輸入,其中,y=[y1,y2,…,yi],i為輸入的樣本數(shù);ε為不敏感系數(shù)。
(3)
然后求解最優(yōu)回歸函數(shù):
(4)
式中,C為懲罰因子。
同時引入Largranage函數(shù),將其轉化為對偶形式,其結果如下:
(5)
式中,k(xi,xj)=φ(xi)φ(xj)為核函數(shù),其中,xi,xj為原始空間的支持向量。
約束條件為:
(6)
(7)
粒子群優(yōu)化算法(PSO)是一種群智優(yōu)化算法,是利用不同粒子個體間相互協(xié)作來實現(xiàn)對整個群體信息的共享,在群體空間中尋求最優(yōu)解[9]。
PSO算法首先在可解空間中初始化一群粒子,通過不斷更新個體粒子的位置、速度向量,并引入適應度函數(shù)計算適應度值,比較粒子局部與全局適應度值,評選出個體極值,同時利用局部最優(yōu)值與全局最優(yōu)值進行比較,評選最優(yōu)群體極值。其次通過不斷調整粒子群位置和速度,不斷更新個體極值和群體極值,最后當滿足算法尋求到最優(yōu)解或者達到最大迭代次數(shù)時結束計算[10]。在每次的迭代中,粒子更新位置和更新粒子速度的函數(shù)如下:
(8)
(9)
式中,ω慣性權重;d為核函數(shù)參數(shù);k為粒子群更新代數(shù);V為粒子群速度;θ為粒子群位置;Pbest為個體極值;Gbest為群體極值;c1,c2為學習因子;r1,r2為[0,1]隨機數(shù)。
周期來壓的實質是在老頂經(jīng)歷過初次來壓后,覆巖中“梁”和“板”等裂隙體,隨工作面回采后經(jīng)歷“穩(wěn)定—失穩(wěn)—再穩(wěn)定”的過程,形成了工作面的周期來壓。周期來壓期間,各影響因素對周期來壓的變化方向、大小及速度的影響并不明確。一般因素包括圍巖性質和開采條件兩種類型。在本文中主要考慮埋深、煤層傾角、工作面推進速度、工作面長度、直接頂厚度、基本頂厚度、采高、煤層條件等因素對周期來壓的影響。為了理清各因素對周期來壓間的影響,找出最大影響因素,把握矛盾的主要方面[11],本文采用灰度理論分析各因素與周期來壓的關聯(lián)性。
在綜采面頂板來壓系統(tǒng)中,各個因素的量綱并不相同,如埋深的單位為m;煤層傾角的單位為(°),推進速度的單位為m/d等。這樣的數(shù)據(jù)很難進行直接比較。因此需要對原始數(shù)據(jù)采用歸一化變化消除各影響因素量綱,轉化為可以直接比較的數(shù)據(jù)序列[12]。歸一化公式見式(10):
(10)
式中,x為原始數(shù)據(jù)集中的特征值;max、min為原始數(shù)據(jù)集中的最大值、最小值;x*為歸一化后數(shù)據(jù)集中特征值。
原始數(shù)據(jù)歸一化變化后{Xi(t)},{Yi(t)},在i=k時刻,母序列與子序列的關聯(lián)系數(shù)表達式為:
(11)
式中,Δ0i(k)為第k個樣本中兩比較因素的絕對差;Δmin,Δmax分別為所有比較序列在每個樣本中絕對差中的最大值與最小值;ρ稱為分辨系數(shù),其目的在于消除數(shù)據(jù)間絕對誤差過大而引起的數(shù)據(jù)失真,提高練習系數(shù)的可靠性,這里取0.5。
關聯(lián)度分析實質上分析兩相關因素在時間序列上的相關系數(shù)的平均值,即:
(12)
式中,r0i為兩因素間的關聯(lián)度;N為時間序列長度。
各因素對周期來壓的影響程度見表1。由表1可知,在周期步距的灰度理論分析中,影響程度從大到小排序為推進速度、采高、直接頂厚度、基本頂厚度、工作面長度、埋深、頂板條件、煤層傾角、煤厚;在周期來壓強度的灰度理論分析中,影響程度從大到小排序為推進速度、直接頂厚度、頂板條件、基本頂厚度、埋深、采高、煤層傾角、工作面長度、煤厚。從各相關因素對周期來壓的關聯(lián)程度可以看出,推進速度、工作面長度、埋深、頂板條件、煤層傾角對工作面周期來壓影響較為顯著,煤層厚度影響較小,推進速度影響最大,加快工作面的推進速度,可以有效改變砌體梁結構巖塊間的擠壓程度和水平推力,有利于關鍵層巖塊回轉失穩(wěn)后快速形成自穩(wěn)結構[13]。直接頂和基本頂?shù)暮穸?、巖性,直接影響關鍵層破斷后的承載能力[14];工作面長度、煤層傾角、采高的差異性變化,影響“砌體梁”空間結構大小,空間結構越小,加載層厚度越小,來壓強度越小[15]。
表1 各因素對周期來壓的影響程度
為提高PSO-SVR預測綜采面周期來壓的準確性,基于灰度理論分析選取埋深、煤層傾角、工作面長度、直接頂厚度、基本頂厚度、采高、頂板條件、推進速度八個參數(shù)作為影響周期來壓的輸入特征,周期步距和周期來壓強度作為周期來壓的兩個輸出特征。煤層頂板條件是指工作面作頂板的控制難易程度,現(xiàn)為了方便機器學習,將其頂板條件按頂板控制難易程度分別用1、2、3、4代替不穩(wěn)定頂板、中等穩(wěn)定頂板、穩(wěn)定頂板、堅硬頂板。該數(shù)據(jù)幾乎覆蓋了陜北近淺埋煤層所有地質條件和開采工藝。將數(shù)據(jù)分為兩組,其中由Matlab中的rand函數(shù)隨機選取70組作為樣本數(shù)據(jù)集,10組作為測試樣本數(shù)據(jù)集。由于各個特征值之間的量綱和數(shù)量級不同,容易給機器學習帶來一定的困難。因此,本文采用歸一化處理原始數(shù)據(jù)集。原始數(shù)據(jù)(部分)見表2[16]。
表2 各個工作面的周期來壓及其主要影響因素數(shù)據(jù)(部分)
利用MATLAB仿真軟件設計一種PSO-SVR組合算法,建立了綜采工作面周期來壓的預測模型。選取了埋深、煤層傾角、工作面長度、直接頂厚度、基本頂厚、采高、頂板條件作為輸入因子,周期步距和周期來壓強度作為輸出因子。70組樣本作為模型的訓練集,10組樣本作為測試集,模型采用均方誤差(MSE)和決定系數(shù)(R2)作為模型的評價指標值,其公式如下:
(13)
(14)
式中,f(xi)為真實值;yi預測值。
利用Matlab編寫PSO-SVR算法程序,通過測試確定其參數(shù)如下:粒子群個數(shù)80;粒子維數(shù)8;粒子群規(guī)模為10;循環(huán)次數(shù)200;學習因子c1=1.9,c2=2.0。在支持向量機算法中,鑒于徑向基函數(shù)在大部分數(shù)據(jù)處理中表現(xiàn)出的優(yōu)良性能[17],因此,本文采用徑向基函數(shù)K(x,xi)作為支持向量機的核函數(shù),標準支持向量機核函數(shù)參數(shù)σ=10,懲罰因子c=2.5。其具體公式如下:
(15)
為進一步說明粒子群優(yōu)化支持向量機算法的優(yōu)越性,將建立目前應用最廣泛的BP神經(jīng)網(wǎng)絡模型進行對比實驗分析。BP神經(jīng)網(wǎng)絡作為監(jiān)督學習的一種方法,無需描述特征值之間的函數(shù)關系,就可以通過模型映射它們之間的物理關系,BP神經(jīng)網(wǎng)絡最基本思想就是通過反向傳播調整輸入層的權值和閾值,使誤差函數(shù)沿負梯度方向下降最快[18]。
BP神經(jīng)網(wǎng)絡和粒子群優(yōu)化算法(PSO-SVR)一樣,采用相同的輸入因子和輸出因子進行模型學習,利用MATLAB編寫B(tài)P神經(jīng)網(wǎng)絡模型,隱含層中的神經(jīng)元采用S型傳遞函數(shù)tansig,輸出層采用線性傳遞函數(shù)purelin[19]。通過多次試驗驗證,最終確定該模型包含兩個隱含層的模型,10個神經(jīng)元,學習速率0.1,最大迭代次數(shù)1000,允許最大誤差0.001時,BP神經(jīng)網(wǎng)絡模型性能較佳。
通過計算機仿真實驗的 PSO-SVR、SVR 和BP神經(jīng)網(wǎng)絡模型分別對預留10組樣本進行周期來壓規(guī)律進行預測分析,實驗結果見表3。由表3可以看出,PSO-SVR在周期來壓步距和強度試驗中均具有明顯的優(yōu)勢。均方誤差(MSE)反應測試集樣本中實際值與預測值的平均誤差,決定系數(shù)(R2)衡量模型對整體樣本的擬合程度,其數(shù)值越接近1[20],表明模型對數(shù)據(jù)樣本信息捕捉能力越好。對比標準SVR模型與PSO-SVR的均方誤差明顯較小,在預測周期來壓時,PSO-SVR算法模型的預測結果較標準SVR模型更接近真實值。從決定系數(shù)來看,PSO-SVR的擬合優(yōu)度大于SVR,這說明經(jīng)粒子群優(yōu)化后的支持向量機,較標準支持向量機更加能夠解釋輸入因子與周期來壓步距的相關關系,BP神經(jīng)網(wǎng)絡在整體實驗中也表現(xiàn)出不錯的實驗性能。其各項指標在周期來壓步距實驗中優(yōu)于標準支持向量機,但在周期來壓強度試驗中差于標準支持向量機,在與PSO-SVR模型性能指標對比后,BP神經(jīng)網(wǎng)絡無論均方還是收斂速度均處于劣勢。
表3 PSO-SVR、SVR和BP對周期來壓預測結果對比
基于PSO-SVR預測模型的來壓步距和強度適應度變化曲線如圖2所示,在粒子群優(yōu)化支持向量機的模型實驗中,隨著迭代次數(shù)的增加目標函數(shù)(均方誤差)越來越小。在周期來壓步距實驗中,當?shù)?3代時,均方誤差達到最?。辉谥芷趤韷旱膹姸仍囼炛挟?shù)?8代時,預測值與實際值最接近,表明支持向量機選擇參數(shù)達到最佳。
圖2 PSO-SVR來壓步距和強度適應度變化曲線
為充分顯示粒子群優(yōu)化支持向量機模型的優(yōu)越性,PSO-SVR、SVR和BP三種模型對周期來壓預測結果對比如圖3所示。在周期來壓規(guī)律的10組預測樣本中,三種算法模型均表現(xiàn)出良好的擬合度,反應了選取輸入因素中大部分或全部對周期來壓均具有較強的關聯(lián)度。但由于模型拓撲結構不同對數(shù)據(jù)的適應度不同,在周期來壓強度和步距預測中表現(xiàn)出差異的模型性能。在周期來壓步距的第四組預測中,三種模型的預測值均與實際值有較大偏差,都沒能夠進行充分學習;在周期來壓的強度試驗中,除第4組、第6組、第10組數(shù)據(jù),由于BP神經(jīng)網(wǎng)絡在訓練集中表現(xiàn)過擬合,在測試集中誤差較大外,SVR和PSO-SVR在測試集樣本中均表現(xiàn)良好的魯棒性。從總體來看,PSO-SVR預測模型預測綜采工作面周期來壓規(guī)律中表現(xiàn)出良好的模型性能。
圖3 周期來壓步距和強度對比
PSO-SVR、SVR和BP三種預測模型的周期來壓步距和強度誤差對比如圖4所示,從圖4可以直觀看出,PSO-SVR模型的波動幅度均明顯小于標準SVR和支持BP神經(jīng)網(wǎng)絡,且最大誤差、最小誤差均小于SVR算法和BP神經(jīng)網(wǎng)絡,說明粒子群算法對優(yōu)化支持向量機模型性能取得良好的效果,較普通支持向量機具有明顯的優(yōu)勢。進一步分析,經(jīng)過優(yōu)化的支持向量機較SVR模型預測精度提升15%,擬合優(yōu)度提升20%。較普通BP神經(jīng)網(wǎng)絡絕對百分誤差減少16%,此外擬合優(yōu)度大幅度提升,增幅31.5%。說明支持向量機經(jīng)粒子群算法在到位空間篩選最佳模型參數(shù)后,具有較高的精確度,較強的泛化性,更好實現(xiàn)綜采工作面周期來壓的預測。
圖4 周期來壓步距和強度誤差對比
1)經(jīng)粒子群優(yōu)化的支持向量機較標準支持向量機模型更加優(yōu)良,其擬合度、魯棒性明顯優(yōu)于標準支持向量機和普通BP神經(jīng)網(wǎng)絡,為預測綜采工作面的周期來壓提供了一條全新的思路。
2)通過灰色理論分析,埋深、煤層傾角、工作面長度、推進速度、直接頂厚度、基本頂厚、采高、頂板條件與周期來壓的關聯(lián)度均在80%以上,對頂板來壓影響程度較大,而煤層厚度只有45%,影響較小。
3)支持向量機可以準確表達影響工作面周期來壓的開采工藝和地質參數(shù)之間的非線性關系,通過粒子群優(yōu)化算法尋找支持向量機的最佳參數(shù),可以明顯改善支持向量機模型泛化性能,表明該模型可以較好的描述地質條件和開采工藝影響周期來壓的冗余、復雜的非線性關系。
4)采用粒子群優(yōu)化支持向量機進行綜采面周期來壓預測中,除了影響因素較多且相互耦合外,訓練集和測試集樣本數(shù)據(jù)的收集需要投入大量的時間人力及物力?;诖酥С窒蛄繖C對于小樣本數(shù)據(jù),將非線性的原始變量在高維空間中構造為線性函數(shù),這既保證在有限樣本中“充分學習”,又解決“維數(shù)災變”問題。因此,PSO-SVR在綜采面周期來壓預測中具有較強魯棒性。