拓萬(wàn)兵,姜 偉,吳鳳民
(1.中國(guó)礦業(yè)大學(xué)銀川學(xué)院礦業(yè)工程系,寧夏 銀川 750011;2.山西藍(lán)焰煤層氣工程研究有限責(zé)任公司,山西 晉城 048012)
基于支持向量機(jī)的開(kāi)采沉陷預(yù)計(jì)參數(shù)選取研究
拓萬(wàn)兵1,姜 偉2,吳鳳民1
(1.中國(guó)礦業(yè)大學(xué)銀川學(xué)院礦業(yè)工程系,寧夏 銀川 750011;2.山西藍(lán)焰煤層氣工程研究有限責(zé)任公司,山西 晉城 048012)
為建立精確度高且具有自學(xué)習(xí)能力的開(kāi)采沉陷預(yù)計(jì)參數(shù)選取模型,采用主成分分析方法,對(duì)文獻(xiàn)中的數(shù)據(jù)進(jìn)行預(yù)處理,選擇累計(jì)方差達(dá)到96.79%的6個(gè)主成分因子和地表下沉系數(shù)為輸入和輸出變量,以徑向基(RBF)為核函數(shù),建立了基于支持向量機(jī)開(kāi)采沉陷預(yù)計(jì)參數(shù)選取模型。結(jié)果表明,支持向量機(jī)模型在訓(xùn)練樣本較少的情況下,具有較高的預(yù)測(cè)精度和較強(qiáng)的泛化能力,平均相對(duì)誤差和均方根誤差值的對(duì)比證明了支持向量機(jī)模型的預(yù)測(cè)準(zhǔn)確性和預(yù)測(cè)穩(wěn)定性更好。
支持向量機(jī);主成分分析;下沉系數(shù);選取
采礦引起的覆巖和地表產(chǎn)生的連續(xù)移動(dòng)變形和非連續(xù)破壞稱為開(kāi)采沉陷[1]。開(kāi)采沉陷預(yù)計(jì)是礦山開(kāi)采沉陷學(xué)的核心內(nèi)容之一,它對(duì)開(kāi)采沉陷的理論研究和生產(chǎn)實(shí)踐都有重要的意義[2]。目前,開(kāi)采沉陷預(yù)計(jì)方法主要有:基于實(shí)測(cè)資料的經(jīng)驗(yàn)方法、影響函數(shù)法和理論模型法等[3]。其中,影響函數(shù)法中的概率積分法是我國(guó)礦區(qū)最常用,最成熟的方法,此方法需要特定的預(yù)計(jì)參數(shù),參數(shù)的選取是否正確直接決定預(yù)計(jì)結(jié)果的可靠性。目前選取預(yù)計(jì)參數(shù)常采實(shí)測(cè)資料求參和類比求參,不能集成開(kāi)采沉陷預(yù)計(jì)的經(jīng)驗(yàn)性知識(shí),缺乏自學(xué)習(xí)能力。此外,由于巖土體介質(zhì)的復(fù)雜性,使得巖土介質(zhì)的力學(xué)行為具有高維數(shù)、非線性等特點(diǎn),使得實(shí)測(cè)或類比求參很難根據(jù)實(shí)際獲得的含有噪聲的信息求出令人滿意的結(jié)果[4]。支持向量機(jī)( Support Vector Machine,SVM) 是借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)問(wèn)題的新工具,其采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,有效地解決了小樣本、非線性、高維數(shù)和局部極小值等問(wèn)題,具有良好的泛化能力[5-7]。本文建立了基于支持向量機(jī)的開(kāi)采沉陷預(yù)計(jì)參數(shù)選取模型。
(1)
式中:Φ(x)是從輸入空間到高維特征空間的非線性映射,系數(shù)w和b通過(guò)式(2)來(lái)估計(jì)。
(2)
式中: C是懲罰參數(shù),Lε為ε不敏感損失函數(shù),即給定ε>0。
(3)
基于式(3),則式(2)可歸結(jié)為式(4)凸約束條件下的二次凸規(guī)劃問(wèn)題。
(4)
(5)
約束條件為,見(jiàn)式(6)。
(6)
式(5)中:K(x,y)為核函數(shù),核函數(shù)的選擇應(yīng)使其為特征空間的一個(gè)點(diǎn)積,即存在下式:K(x,y)=Φ(x)·Φ(y)??梢宰C明,對(duì)稱函數(shù)K(x,y)只要滿足Mercer[8]條件即可滿足核函數(shù)要求。常用的核函數(shù)有:線性核函數(shù)、多項(xiàng)式核函數(shù)、 樣條核函數(shù)、徑向基核函數(shù)(RBF)和Sigmoid核函數(shù)。
參照文獻(xiàn)[9],依據(jù)影響因素的代表性、科學(xué)性以及數(shù)據(jù)易得性原則,從地質(zhì)賦存條件和煤礦開(kāi)采設(shè)計(jì)條件2個(gè)角度,選取了2大類10個(gè)影響因子,見(jiàn)表1。
表1 開(kāi)采沉陷影響因子
開(kāi)采沉陷中地表下沉系數(shù),是指充分采動(dòng)或接近充分采動(dòng)情況下,開(kāi)采水平煤層時(shí)地表最大下沉值與開(kāi)采厚度之比。是開(kāi)采沉陷地表移動(dòng)和變形預(yù)計(jì)時(shí)的關(guān)鍵性參數(shù),故本文首選地表下沉系數(shù)為輸出的目標(biāo)變量Y。
在研究多變量問(wèn)題時(shí),變量太多會(huì)增加分析問(wèn)題的復(fù)雜性,同時(shí)也使預(yù)測(cè)模型變得更為復(fù)雜,降低模型的泛化能力,從而影響預(yù)測(cè)精度。為簡(jiǎn)化預(yù)測(cè)模型的輸入變量個(gè)數(shù),采用主成分分析法,對(duì)文獻(xiàn)[9]中神府礦區(qū)開(kāi)采沉陷原始數(shù)據(jù),見(jiàn)表2,進(jìn)行降維處理,篩選出6個(gè)主成分,其方差貢獻(xiàn)率分別為33.70%、22.86%、14.10%、10.91%、9.63%、5.59%,累計(jì)方差貢獻(xiàn)率達(dá)到96.79%。若以此6個(gè)主成分代替表1中的10個(gè)影響因素作為SVM模型的輸入項(xiàng),在保留原始數(shù)據(jù)絕大部分信息的前提下,既去除了因子間相關(guān)性和冗余信息,又降低建模工作量,提高了模型泛化能力。
徑向基(RBF) 核函數(shù)可調(diào)參數(shù)少,在一般光滑性假設(shè)條件下具有良好的性能,表現(xiàn)出較強(qiáng)的學(xué)習(xí)能力[10],本文選擇徑向基(RBF)核函數(shù)進(jìn)行建模。以表3中提取出的6個(gè)主成分因子為輸入變量,地表下沉系數(shù)為目標(biāo)變量,建立SVM模型。通過(guò)多次調(diào)試,確定模型相關(guān)參數(shù)如下:規(guī)則化參數(shù)C取10,γ取1,停止標(biāo)準(zhǔn)1.0E-6。預(yù)測(cè)結(jié)果見(jiàn)表3。
由表3可以看出,支持向量機(jī)的用于建模的數(shù)據(jù)結(jié)果有很多可以達(dá)到0偏差,說(shuō)明支持向機(jī)的預(yù)測(cè)結(jié)果準(zhǔn)確性比較高。經(jīng)計(jì)算,支持向量機(jī)方法的預(yù)測(cè)結(jié)果和灰色關(guān)聯(lián)回歸方法的平均性對(duì)誤差MAPE分別為0.021、0.033,均方根誤差RMSE分別為0.00066、0.00068,雖然數(shù)值上差距很小,但卻具有統(tǒng)計(jì)學(xué)意義。前者說(shuō)明支持向量機(jī)方法的預(yù)測(cè)精度優(yōu)于灰色關(guān)聯(lián)回歸,后者說(shuō)明支持向量機(jī)方法的預(yù)測(cè)結(jié)果與真實(shí)值的總體偏離程度要小,從性質(zhì)上說(shuō)明支持向量機(jī)預(yù)測(cè)方法優(yōu)于灰色關(guān)聯(lián)的回歸預(yù)測(cè)。此外,MAPE和RMSE的值差距偏小,原因在于地表沉陷程度以地表下沉系數(shù)的形式來(lái)表征,其值本身就是一個(gè)比值,造成計(jì)算MAPE和RMSE的時(shí)候使用的偏差值為更小的數(shù)值。每厘米的沉陷都會(huì)對(duì)建筑造成一定的影響,如果將地表下沉系數(shù)轉(zhuǎn)化為以厘米甚至毫米的實(shí)際沉陷值表征,兩種預(yù)測(cè)方法的精度差別會(huì)很明顯。
表2 神府礦區(qū)開(kāi)采沉陷影響因子原始數(shù)據(jù)
表3 SVM預(yù)測(cè)結(jié)果及與文獻(xiàn)結(jié)果比較
1)本文作者提出將支持向量機(jī)與主成分分析相結(jié)合,對(duì)多影響因素問(wèn)題的分析進(jìn)行分析,對(duì)支持向量機(jī)模型進(jìn)行了優(yōu)化,建立了主成分分析-支持向量機(jī)模型,其精度較高,能夠達(dá)到工程需要,對(duì)開(kāi)采沉陷預(yù)測(cè)參數(shù)選取提供了新的思路。
2)支持向量機(jī)預(yù)測(cè)能描述多個(gè)預(yù)測(cè)量與其相關(guān)參數(shù)的非線性關(guān)系,適用于關(guān)系復(fù)雜的地質(zhì)因素分析。具有誤差小、精度高的優(yōu)點(diǎn)。
3)在處理多因素分析的問(wèn)題時(shí),采用主成分分析法對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理可以達(dá)到有效降維的目的,同時(shí)降低模型復(fù)雜程度,增強(qiáng)模型泛化能力,有利于提高預(yù)測(cè)精度。
[1] 何國(guó)清,楊倫,凌賡娣.礦山開(kāi)采沉陷學(xué)[M].徐州:中國(guó)礦業(yè)大學(xué)出版社,1991.
[2] 曹麗文,姜振泉.人工神經(jīng)網(wǎng)絡(luò)在煤礦開(kāi)采沉陷預(yù)計(jì)中的應(yīng)用研究[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2002(1):23-26.
[3] 張玉卓,陳立良,周萬(wàn)茂.村莊下采煤的理論基礎(chǔ)——地表沉陷預(yù)測(cè)與控制[J].煤炭科學(xué)技術(shù),1998(4):39-42.
[4] 趙洪波.巖土力學(xué)與工程中的支持向量機(jī)分析[M].北京:煤炭工業(yè)出版社,2008.
[5] 白鵬 ,張喜斌,等.支持向量機(jī)理論及工程應(yīng)用實(shí)例[M].西安:西安電子科技大學(xué)出版社,2008.
[6] 楊志民 ,劉廣利.不確定性支持向量機(jī):算法及應(yīng)用[M].北京:科學(xué)出版社,2012.
[7] 魏好,鄧喀中,盧正,等.基于支持向量機(jī)的主要影響角正切求取方法研究[J].金屬礦山,2010(5):120-123.
[8] 方瑞明.支持向量機(jī)理論及其應(yīng)用分析[M].北京:中國(guó)電力出版社,2007.
[9] 宋世杰,趙曉光,劉源,等.榆神府礦區(qū)開(kāi)采沉陷的灰色關(guān)聯(lián)分析及其回歸預(yù)計(jì)[J].煤礦安全,2010(8):138-140.
[10] 田盛豐,黃厚寬.回歸型支持向量機(jī)的簡(jiǎn)化算法[J].軟件學(xué)報(bào),2002,13(6) :1169-1172.
Study on the selection of predication parameters on mining subsidence based on support vector machine
TUO Wan-bing1,JIANG Wei2,WU Feng-min1
(1.School of Mines and Engineering,China University of Mining and Technology Yinchuan College,Yinchuan 750011,China;2.Blue Flame of Coal Bed Gas in Shanxi Group Co.,Ltd.,Jincheng 048012,China)
In order to establish selection model of mining subsidence predicting parameters,which has self learning ability and with high accuracy.In this paper,using principal component analysis preprocessing the data in the literature,we have established the prediction parameters of mining subsidence selection model using support vector machine,based on radial basis function (RBF),by selecting main components factor with cumulative variance reaches 96.79% of 6 and surface subsidence factor as the input and output variables.Results show under the circumstances of less training samples Support vector machine (SVM) model,has high precision and strong generalization ability,the prediction accuracy and prediction stability is better.which was proved contrasting average relative error and root mean square error.
support vector machine;principal component analysis;subsidence coefficient;selection
2014-05-25
寧夏高等學(xué)??茖W(xué)技術(shù)研究項(xiàng)目資助(編號(hào):20130137)
拓萬(wàn)兵(1984—),男,甘肅白銀人,講師,碩士,主要從事“三下”采煤與變形監(jiān)測(cè)與控制方面的教學(xué)與研究工作。E-mail:cumtyc_wbtuo@126.com。
TD173+.4
A
1004-4051(2015)02-0114-03