劉小珊 (湖北文理學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,湖北 襄陽(yáng) 441053 中國(guó)地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院,湖北 武漢 430074)
羅文強(qiáng),李飛翱 (中國(guó)地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院,湖北 武漢 430074)
王成勇 (湖北文理學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,湖北 襄陽(yáng) 441053)
基于SVR的滑坡位移研究
劉小珊 (湖北文理學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,湖北 襄陽(yáng) 441053 中國(guó)地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院,湖北 武漢 430074)
羅文強(qiáng),李飛翱 (中國(guó)地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院,湖北 武漢 430074)
王成勇 (湖北文理學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,湖北 襄陽(yáng) 441053)
滑坡位移具有非線性特征,針對(duì)單變量的時(shí)間序列,首先引入相空間重構(gòu)理論,將其擴(kuò)展到多維的相空間中。再結(jié)合數(shù)據(jù)挖掘中的機(jī)器學(xué)習(xí)算法——支持向量回歸算法(SVR)建立預(yù)測(cè)模型,并對(duì)李家灣滑坡的水平位移進(jìn)行預(yù)測(cè)。試驗(yàn)結(jié)果表明,該模型具有非常高的精度(均控制在94%以上),可以充分的應(yīng)用于滑坡災(zāi)害的預(yù)測(cè)和預(yù)報(bào)。
滑坡水平位移;相空間重構(gòu);支持向量回歸;預(yù)測(cè)
滑坡是一個(gè)極其復(fù)雜的非線性動(dòng)態(tài)系統(tǒng),內(nèi)部受巖土體屬性的控制,外部受庫(kù)水位變動(dòng)、大氣降雨、地震、人工加載等多種因素的影響。正是這種內(nèi)外因素相互作用的復(fù)雜性和難以預(yù)見性,使得滑坡的變形表現(xiàn)出非常復(fù)雜的演化特征。
目前,基于時(shí)間序列的分析方法是滑坡位移預(yù)測(cè)工作中相對(duì)集中的一個(gè)發(fā)展方向。傳統(tǒng)的預(yù)測(cè)方法是直接從單變量的時(shí)間序列出發(fā),建立預(yù)測(cè)模型,分析它的時(shí)間演變規(guī)律[1-2]。但由于時(shí)序數(shù)列是許多因子相互作用的綜合反映,蘊(yùn)含了參與整個(gè)運(yùn)動(dòng)過程中全部變量的信息,所以單變量的時(shí)序數(shù)列無法充分的將序列中的信息顯露出來。針對(duì)這一問題,筆者首先引入了相空間重構(gòu)理論,將單變量的數(shù)據(jù)擴(kuò)展到多維的相空間中去,從而獲得更多的數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。然后,應(yīng)用支持向量回歸算法(Suppert Vector Regression,SVR)[3]對(duì)重構(gòu)后的數(shù)據(jù)進(jìn)行建模,并在此基礎(chǔ)上對(duì)滑坡的水平位移進(jìn)行預(yù)測(cè)。
1.1相空間重構(gòu)
為了從時(shí)間序列中提取更多的有用信息, Packard等提出用時(shí)間序列重構(gòu)相空間的2種方法:導(dǎo)數(shù)重構(gòu)法和坐標(biāo)延遲重構(gòu)法[4]。Takens等提出嵌入定理:對(duì)于無限長(zhǎng)、無噪聲的d維混沌吸引子的標(biāo)量時(shí)間序列{x(n)},只要維數(shù)m≥2d+1,總可以在拓?fù)洳蛔兊囊饬x上找到一個(gè)m維的嵌入相空間[5]。嵌入定理保證了可以從一維混沌時(shí)間序列{x(i),i=1,2,3,…,n}中重構(gòu)一個(gè)與原動(dòng)力系統(tǒng)在拓?fù)湟饬x下等價(jià)的相空間:
X(i)={x(i),x(i+τ),…,x(i+(m-1)τ)}
(1)
式中,i=1,2,…,n-(m-1)τ,n為時(shí)序長(zhǎng)度;m為嵌入維數(shù);τ為延遲時(shí)間。
1.2支持向量回歸算法
支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法,其建立在VC維(Vapnik-Chervonenkis Dimension)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理(Structural Risk Minimization,SRM)基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中。
非線性SVR算法基本思想如下:對(duì)于給定的n個(gè)樣本數(shù)據(jù){xn,yn},其中xn∈Rm的m維向量,yn∈R為相應(yīng)的輸出變量,引入非線性映射φ,將樣本空間映射入一個(gè)高維(以至于無窮維)的特征空間H(Hilbert空間),從而使在樣本空間中的高度非線性問題在特征空間中可以進(jìn)行線性回歸。其具體的實(shí)現(xiàn)是通過核函數(shù)K(xi,xi)=φ(xi)·φ(xj)來實(shí)現(xiàn)的?;貧w函數(shù)表達(dá)式如下:
f(x)=(W,φ(xn))+bφ:Rm→HW∈Rm
(2)
與其他回歸分析方法相比,SVR引入了ε-不敏感誤差函數(shù)和最優(yōu)回歸平面(見圖1),此時(shí)所有樣本點(diǎn)到所求超平面的距離都小于ε,這樣尋求最優(yōu)回歸超平面的問題則轉(zhuǎn)化為求解如下一個(gè)二次凸規(guī)劃問題:
(3)
圖1 回歸超平面圖示
但實(shí)際問題中往往是有噪音干擾的,不可能將所有的樣本點(diǎn)都落在ε管道中,即便有時(shí)能夠達(dá)到,隨著ε的減小,也會(huì)有個(gè)別樣本點(diǎn)“溢出”。為處理函數(shù)f在ε精度不能估計(jì)的數(shù)據(jù),引入松弛變量ξi,則修改上式的目標(biāo)函數(shù)和約束條件,有偏離的點(diǎn)的最優(yōu)回歸超平面歸結(jié)為一個(gè)新的二次凸規(guī)劃問題[3]:
(4)
(5)
引入拉格拉日函數(shù)和對(duì)偶變量:
(6)
(7)
(8)
式中,核函數(shù)K(xi,xj)為滿足Mercer條件的任意對(duì)稱函數(shù)。由于SVR只考慮高維特征空間的點(diǎn)積運(yùn)算K(xi,xi)=φ(xi)·φ(xj),而不是直接使用非線性映射φ,這樣就免去了因?yàn)楹瘮?shù)φ的未知而無法計(jì)算W的表達(dá)式。常見的核函數(shù)有多項(xiàng)式函數(shù)K(xi,xj)=[(xixj)+1]q;高斯徑向基函數(shù)(RBF)K(xi,xj)=exp{-|xi-xj|2/2σ2};Sigmoid函數(shù)tanh[v(xixj)+c]等[3,6]。
2.1數(shù)據(jù)準(zhǔn)備與相空間重構(gòu)
選取李家灣滑坡的變形監(jiān)測(cè)資料[7],該資料顯示滑坡的前部、中部、后部監(jiān)測(cè)點(diǎn)的變形分別受不同的因素影響,如降雨量、庫(kù)水位、孔隙水等。為研究不同影響因素作用下的滑坡變形預(yù)測(cè)模型,選取李家灣滑坡主剖面上3個(gè)地表位移監(jiān)測(cè)點(diǎn)BD7-35、BD7-36、BD7-37作為研究對(duì)象,截取2007-08-08至2009-07-13之間的25組監(jiān)測(cè)數(shù)據(jù)作為樣本,其中以2007-08-08至2009-02-13之間的20組監(jiān)測(cè)數(shù)據(jù)作為訓(xùn)練樣本,2009-03-13至2009-07-13之間的5組監(jiān)測(cè)數(shù)據(jù)作為測(cè)試樣本。
2.2SVR預(yù)測(cè)模型
數(shù)據(jù)預(yù)處理之后就可以建立基于支持向量回歸算法的預(yù)測(cè)模型。筆者選擇高斯徑向基函數(shù)為核函數(shù),其函數(shù)回歸模型可以表示如下[8]:
代入重構(gòu)后的數(shù)據(jù)可以得到第n+1點(diǎn)的預(yù)測(cè)值:
將所得的n+1點(diǎn)的預(yù)測(cè)值加入訓(xùn)練樣本,再代入SVR預(yù)測(cè)模型,即可求出第n+2點(diǎn)的預(yù)測(cè)值。如此遞推,每預(yù)測(cè)一步后,將增加的預(yù)測(cè)值添加到訓(xùn)練樣本中,同時(shí)保持總的訓(xùn)練樣本數(shù)不變,便可得到n+t時(shí)刻的預(yù)測(cè)值:
2.3預(yù)測(cè)結(jié)果分析
將推導(dǎo)的預(yù)測(cè)模型應(yīng)用于李家灣滑坡的預(yù)測(cè)?;缕拭娣謩e為BD7-35、BD7-36、BD7-37水平位移監(jiān)測(cè)點(diǎn)的預(yù)測(cè)值和原始值的比較如圖2所示,精度分析如表1所示。從圖2中可以看出,對(duì)于這3個(gè)分別受不同影響因素作用下的滑坡剖面,其水平位移預(yù)測(cè)值的走勢(shì)與工程實(shí)測(cè)值的走勢(shì)基本一致,沒有出現(xiàn)異常值,效果良好。從表1中可以看出,對(duì)于這3個(gè)滑坡剖面水平位移預(yù)測(cè)值的精度都在94%以上,最高達(dá)到99.6%,已經(jīng)非常逼近實(shí)測(cè)值。并且從圖2和表1都可以看出,越往后,預(yù)測(cè)效果越好。
表1 預(yù)測(cè)精度
圖2 原始值與預(yù)測(cè)值的比較
將相空間重構(gòu)理論與支持向量回歸算法相結(jié)合,建立了滑坡水平位移的預(yù)測(cè)模型,并應(yīng)用于李家灣滑坡位移的預(yù)測(cè)。從工程實(shí)例中可以看出,這2種理論的結(jié)合對(duì)滑坡水平位移的預(yù)測(cè)具有較高的精度,使用該方法可以無需知道巖土結(jié)構(gòu)中的力學(xué)過程和機(jī)制,對(duì)于小樣本、非線性的實(shí)際問題可以直接挖掘出時(shí)序中各數(shù)據(jù)的關(guān)聯(lián)關(guān)系,進(jìn)而進(jìn)行有效的預(yù)測(cè)。
[1]張德成,徐則民.滑坡位移的時(shí)序分析[J].地球與環(huán)境,2011,39(2):224-230.
[2]鄭加柱,郭斐.變形監(jiān)測(cè)數(shù)據(jù)的時(shí)間序列分析[J].森林工程,2008,24(4):50-53.
[3]陳永義,熊秋芬.支持向量機(jī)方法應(yīng)用教程[M].北京:氣象出版社,2011.
[4]Packard N H,Crutchfield J P,Farmer J D,et al.Geometry from a time series[J].Physical Review Letters,1980,45(9):712-716.
[5]Takens F.Detecting strange attractors in turbulence.In:Dynamical Systerms and Turbulence[M].Berlin:Springer-Verlag, 1981:366-381.
[6]王定成.支持向量機(jī)預(yù)測(cè)與控制[M].北京:氣象出版社,2009.12.
[7]程江濤.庫(kù)水變動(dòng)誘發(fā)水庫(kù)滑坡變形演化機(jī)理及預(yù)測(cè)研究[D].武漢:中國(guó)地質(zhì)大學(xué)(武漢),2011.
[8]董輝,傅鶴林,冷伍明.支持向量機(jī)的時(shí)間序列回歸與預(yù)測(cè)[J].系統(tǒng)仿真學(xué)報(bào),2006,18(7):1785-1788.
2012-11-27
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃資助“973”計(jì)劃(2011CB710605)。
劉小珊(1989-),女,碩士生,現(xiàn)主要從事工程概率方面的研究工作。
P642.22;TP391
A
1673-1409(2013)04-0076-03
[編輯] 洪云飛