韓奎峰,康建榮
(1.中國礦業(yè)大學(xué)環(huán)境與測繪學(xué)院,江蘇徐州221116;2.徐州師范大學(xué)測繪學(xué)院,江蘇徐州221116)
基礎(chǔ)研究
基于SVM的厚松散層礦區(qū)開采下沉系數(shù)預(yù)測模型
韓奎峰1,2,康建榮2
(1.中國礦業(yè)大學(xué)環(huán)境與測繪學(xué)院,江蘇徐州221116;2.徐州師范大學(xué)測繪學(xué)院,江蘇徐州221116)
針對厚松散層薄基巖礦區(qū)開采沉陷變形預(yù)計中存在的下沉系數(shù)偏大問題,以23個開采工作面的地質(zhì)采礦條件及其下沉系數(shù)為學(xué)習(xí)和測試樣本,將文化-隨機粒子群算法 (CA-rPSO)和支持向量機 (SVM)相結(jié)合,利用CA-rPSO的快速并行尋優(yōu)功能優(yōu)化SVM參數(shù),建立了厚松散層薄基巖開采條件下下沉系數(shù)的SVM預(yù)測模型。通過實例驗證SVM的預(yù)計結(jié)果與實際符合較好。
SVM;厚松散層;下沉系數(shù)
厚松散層礦區(qū)通常是“三下”采煤問題突出的地區(qū),根據(jù)相關(guān)研究結(jié)果[1-6],在厚松散層礦區(qū)用概率積分法預(yù)計可以取得滿意的預(yù)測精度。通過對多個厚松散層礦區(qū)和具有相同基巖薄松散層礦區(qū)觀測站所求得的概率積分法參數(shù)對比,發(fā)現(xiàn)厚松散層礦區(qū)的下沉系數(shù)明顯偏大,其他參數(shù)變化不明顯。厚松散層礦區(qū)采煤工作面的地質(zhì)采礦條件和下沉系數(shù)之間存在復(fù)雜的非線性關(guān)系[5]?;谥С窒蛄繖C (SVM)的算法適宜處理復(fù)雜的非線性關(guān)系[7-12],具有良好的推廣性能。因此分析厚松散層礦區(qū)影響下沉系數(shù)的主要因素,建立基于SVM的下沉系數(shù)預(yù)測模型,具有重要的現(xiàn)實意義。
淮南新礦區(qū)和皖北礦區(qū)均屬典型的厚沖積層礦區(qū),淮南老礦區(qū)屬薄松散層礦區(qū)。淮南新礦區(qū)的潘集區(qū)松散層厚度為120~360m,謝橋、張集區(qū)松散層厚度為194~485 m。皖北礦區(qū)松散層厚度則為30~375 m。
為研究由采煤引起的地表移動變形規(guī)律,在淮南新礦區(qū)和皖北礦區(qū)建立了地表移動觀測站,淮南新礦區(qū)的3個礦區(qū)共布設(shè)12個觀測站,其中潘集區(qū)5個,謝橋區(qū)3個,張集區(qū)4個;皖北礦區(qū)共設(shè)有18個觀測站:劉橋二礦、毛郢孜礦和祁東礦各1個,任樓礦9個,百善礦和劉橋一礦各3個?;茨侠系V區(qū)共設(shè)有10個觀測站:李咀孜礦和新莊孜礦各2個,李一礦和謝二礦各1個,謝一礦4個。各礦區(qū)從首采開始陸續(xù)開展了觀測站的觀測工作,得到了大量的地表移動變形數(shù)據(jù),為厚松散層礦區(qū)的開采沉陷規(guī)律研究提供了可靠的數(shù)據(jù)基礎(chǔ)。
為了解概率積分法預(yù)計參數(shù)在厚松散層和薄松散層礦區(qū)有何不同,將每個觀測站計算得到的概率積分法預(yù)計參數(shù)進行歸納分析[3],將分析結(jié)果列入表1中。
表1 概率積分法預(yù)計參數(shù)分析
由表1可知,厚松散層礦區(qū)的下沉系數(shù)q明顯偏大,水平移動系數(shù)b,主要影響角正切tgβ以及拐點偏移距s則變化不大,下沉系數(shù)大小與松散層厚度具有明顯的相關(guān)性,但地下采煤引起地表移動變形是一個復(fù)雜的過程,僅研究松散層厚度和下沉系數(shù)的關(guān)系顯然不妥,要準確掌握厚松散層礦區(qū)下沉系數(shù)的變化規(guī)律,應(yīng)該全面分析影響下沉系數(shù)的地質(zhì)采礦條件。
相關(guān)文獻顯示[2,5-6,10,14],影響下沉系數(shù)的因素有:覆巖巖性、煤層傾角、深厚比、松散層厚度、采動程度、采動次數(shù)、采煤方法和頂板管理方法等。根據(jù)煤田地質(zhì)勘探資料,淮南礦新區(qū)和皖北礦區(qū)基巖巖性屬軟巖性,且具有一致性;從觀測站資料可知,工作面很少采用分層開采的方法,只有5個觀測站屬重復(fù)開采情況,數(shù)據(jù)量小,難以找到重復(fù)開采的地表移動變形規(guī)律;頂板管理方法均采用全部垮落法;采煤方法均為走向長壁采煤法。剔除相同的地質(zhì)采礦影響因素,將松散層厚度、煤層傾角、采厚、采動程度和采深5個因素作為SVM算法學(xué)習(xí)訓(xùn)練樣本的因子指標。
3.1 SVM原理
SVM是實現(xiàn)了統(tǒng)計學(xué)習(xí)理論中結(jié)構(gòu)風險最小化原則的實用算法,由Vapnik等學(xué)者首先提出,比較成功地解決了模式分類問題??紤]一組獨立同分布分訓(xùn)練樣本 {(xi,yi)|xi∈Rn,yi∈R,i= 1,2,…,l},SVM回歸建模是通過內(nèi)積函數(shù)定義的非線性變換將輸入空間變換高維特征空間(Hilbert空間),并在這個空間進行線性回歸[7,9,12]。線性函數(shù)表示為:
式中,為Rn→H;ω和b為權(quán)值系數(shù)和偏置量。根據(jù)結(jié)構(gòu)風險最小化原則,函數(shù)回歸問題等價于以下泛函最?。?0]:
式中,C>0,表示超出誤差ε的懲罰程度。
利用Lagrange乘子法,根據(jù)對偶定理和Karush-Kuhn-Tucker(KKT)條件,得到對應(yīng)的對偶問題:
解上述凸二次規(guī)劃問題得到非線性映射:
根據(jù)Mercer定理定義的內(nèi)積核:
得到SVM擬合函數(shù):
其中,K(xi,x)為滿足Mercer條件的對稱函數(shù),稱為核函數(shù),文中選擇徑向基 (RBF)核函數(shù)K(xi,xj)=exp(-γ║xi-xj║2)。
3.2 學(xué)習(xí)訓(xùn)練和驗證測試樣本數(shù)據(jù)的選擇
要獲得高精度的基于SVM的預(yù)測模型,足夠多、質(zhì)量高的學(xué)習(xí)訓(xùn)練樣本數(shù)據(jù)是根本保障,從淮南礦新區(qū)和皖北礦區(qū)的觀測站數(shù)據(jù)來看,可以建成一個很好的學(xué)習(xí)訓(xùn)練樣本。經(jīng)過整理、分析將樣本數(shù)據(jù)列入表2中。樣本中“采動程度”是根據(jù)經(jīng)驗公式來計算[1]。表2中,序號為1~20,21~23的樣本為驗證測試樣本。
3.3 支持向量機預(yù)測模型建立及精度評價
SVM的學(xué)習(xí)性能和泛化能力主要取決于核函數(shù)及其寬度系數(shù)、懲罰因子以及不敏感損失系數(shù)等參數(shù)的選擇,一般通過交叉驗證試算的方法,盲目且耗時,難以獲得最佳逼近效果。本文選用徑向基函數(shù) (RBF)作為核函數(shù),并根據(jù)實際下沉系數(shù)的計算精度要求,將最終結(jié)果容許誤差取為0.001,以1~20為建模樣本,采用文化-隨機粒子群算法(CA-rPSO),按“留一法”優(yōu)化SVM參數(shù)。通過反復(fù)實驗,最終得到計算下沉系數(shù)的最佳SVM參數(shù) (C,σ)為 (128.71,0.001),并建立了厚松散層下沉系數(shù)SVM的預(yù)測模型。圖1為模型預(yù)計值與實測值的對比圖,從圖1可以直觀地看出預(yù)計值和實測值擬合程度較高。為更全面了解所建模型的精度,采用模型計算的中誤差 (MSE,Mean Square Error)和平均絕對誤差百分率 (MAPE,Mean Absolute Percentage Error)對模型的預(yù)測精度進行評價。MSE和MAPE分別用式 (8)和式(9)進行計算。
表2 學(xué)習(xí)訓(xùn)練及測試樣本
圖1 預(yù)計值和實測值對比
式中,qi分別是下沉系數(shù)的實測值和預(yù)計值,n為訓(xùn)練樣本總數(shù),取值20。另外,泛化性能是衡量一個預(yù)測模型的重要指標,本文利用威爾莫特一致性指數(shù) (WIA,Willmott’s Index of Agreement)來考察所建模型的泛化性能[9],一般認為,WIA值大于0.6,模型才具有實際意義。WIA采用式(10)來計算。
式中,qi,和n含義同上文,。經(jīng)計算,得到MSE=0.02,MAPE=0.37,WIA=0.91。從計算結(jié)果看,該模型具有較好的擬合性能,精度較高,泛化能力強。
3.4 模型測試結(jié)果
采用21~23號樣本數(shù)據(jù)對建立的模型進行測試,將計算結(jié)果和預(yù)計結(jié)果列入表3。
表3 SVM預(yù)測精度
由表3可知,下沉系數(shù)最大絕對誤差均小于3倍中誤差,測試結(jié)果表明,基于SVM建立的厚松散層礦區(qū)下沉系數(shù)計算模型準確、可靠。在工作面地質(zhì)采礦條件明確的前提下,該模型可以得到滿足現(xiàn)場精度要求的下沉系數(shù)值。
(1)通過對厚松散層礦區(qū)和具有相同基巖薄松散層礦區(qū)實測概率積分法預(yù)計參數(shù)的對比分析,發(fā)現(xiàn)厚松散層礦區(qū)的下沉系數(shù)明顯偏大,其他參數(shù)變化不明顯。
(2)在綜合分析影響厚松散層礦區(qū)下沉系數(shù)因素的基礎(chǔ)上,建立了基于SVM的厚松散層礦區(qū)下沉系數(shù)計算模型。分析結(jié)果表明,模型具有較好的擬合性能,精度較高,泛化能力強。利用多個實測樣本對模型進行測試,所得下沉系數(shù)值在允許誤差范圍內(nèi),絕對誤差小,能滿足實際工作需要。
(3)基于SVM的厚松散層礦區(qū)的下沉系數(shù)計算模型綜合考慮了影響下沉系數(shù)的主要地質(zhì)采礦因素,為沒有觀測站的類似礦區(qū)提供了一種計算下沉系數(shù)的新方法,其他預(yù)計參數(shù)可以類比具有相同基巖的薄松散層礦區(qū)的參數(shù),有較高的實用價值。
[1]中華人民共和國國家煤炭工業(yè)局.建筑物、水體、鐵路及主要井巷煤柱留設(shè)與壓煤開采規(guī)程[M].北京:煤炭工業(yè)出版社,2000.
[2]高榮久,胡振琪,謝宏全,戚家忠.特厚沖積層非主斷面觀測站巖移參數(shù)的求?。跩].遼寧工程技術(shù)大學(xué)學(xué)報,2006,25(3):332-335.
[3]米麗倩,查劍鋒,劉丙方.概率積分法參數(shù)對預(yù)計地表下沉的影響度分析[J].煤礦開采,2011,16(4):13-16.
[4]郭文兵,鄧喀中,鄒友峰.概率積分法預(yù)計參數(shù)選取的神經(jīng)網(wǎng)絡(luò)模型[J].中國礦業(yè)大學(xué)學(xué)報,2004,33(3).
[5]余華中,李德海,李明金.厚松散層放頂煤開采條件下地表移動參數(shù)研究[J].焦作工學(xué)院學(xué)報 (自然科學(xué)版),2003, 22(6):413-416.
[6]王金莊,常占強,陳 勇.厚松散層條件下開采程度及地表下沉模式的研究[J].煤炭學(xué)報,2003,28(3):230-234.
[7]蔣愛武,謝壽生.基于支持向量機和粒子群算法的壓氣機特性計算[J].航空動力學(xué)報,2010,25(11):2571-2577.
[8]李永樹,王金莊,陳 勇.開采沉陷地區(qū)下沉系數(shù)分析[J].礦業(yè)研究與開發(fā),1998,18(2):1-7.
[9]李培現(xiàn),譚志祥,閆麗麗,等.基于支持向量機的概率積分法參數(shù)計算方法[J].煤炭學(xué)報,2010,35(8).
[10]張宏貞,鄧喀中,劉洪義.老采空區(qū)殘余下沉系數(shù)的神經(jīng)網(wǎng)絡(luò)模型研究[J].采礦與安全工程學(xué)報,2009,26(3).
[11]郭文兵,鄧喀中,鄒友峰.條帶開采下沉系數(shù)計算與優(yōu)化設(shè)計的神經(jīng)網(wǎng)絡(luò)模型 [J].中國安全科學(xué)學(xué)報,2006,16 (6):40-45.
[12]于寧鋒,楊化超,鄧喀中,等.基于PSO和SVM的礦區(qū)地表下沉系數(shù)預(yù)測[J].遼寧工程技術(shù)大學(xué)學(xué)報 (自然科學(xué)版),2008,27(3):365-367.
[13]郭文兵,鄧喀中,鄒友峰.地表下沉系數(shù)計算的人工神經(jīng)網(wǎng)絡(luò)方法研究[J].巖土工程學(xué)報,2003,25(2):212-215.
[14]鄒友峰.地表下沉系數(shù)計算方法研究[J].巖土工程學(xué)報,1997,19(3):109-112.
[責任編輯:張玉軍]
Prediction Model of Subsidence Ratio Coefficient for Mining under Thick Loose Bed Based on SVM
HAN Kui-feng1,2,KANG Jian-rong2
(1.Environment&Surveying School,China University of Mining&Technology,Xuzhou 221116,China; 2.Surveying School,Xuzhou Normal University,Xuzhou 221116,China)
In order to resolve the problem that subsidence coefficient is too large in predicting subsidence and deformation when mining under thick loose bed and thin bed rock,taking the geological and mining conditions and subsidence coefficients from 23 mining faces,combining culture-random particle swarm optimization with SVM so as to optimize SVM parameters with fast parallel optimizing function,SVM subsidence coefficient prediction model for mining under thick loose bed and thin bed rock was set up.Examples showed that prediction value well met actual result.
SVM;thick loose layer;subsidence coefficient
TD325.2
A
1006-6225(2012)04-0008-03
2012-04-12
國家自然科學(xué)基金項目:山西煤礦開采引起的高陡邊坡失穩(wěn)機理研究 (51074139)
韓奎峰 (1975-)男,山東夏津人,博士研究生,講師,現(xiàn)從事開采沉陷方面的教學(xué)和研究工作。