湯 俊,鄒自力,張曉平
(1.東華理工大學(xué)資環(huán)系,江西南昌 330013;2.東華理工大學(xué)地球科學(xué)與測(cè)繪工程學(xué)院,江西撫州 344000)
相空間重構(gòu)在滑坡預(yù)測(cè)中的應(yīng)用
湯 俊1,鄒自力2,張曉平2
(1.東華理工大學(xué)資環(huán)系,江西南昌 330013;2.東華理工大學(xué)地球科學(xué)與測(cè)繪工程學(xué)院,江西撫州 344000)
針對(duì)滑坡位移時(shí)間序列的非線性特性,引入基于相空間重構(gòu)和最小二乘支持向量機(jī)(LSSVM)的預(yù)測(cè)法。利用Cao氏方法確定嵌入維數(shù),根據(jù)互信息法計(jì)算最佳延遲時(shí)間;然后在相空間中,利用最小二乘支持向量機(jī)(LSSVM)建立預(yù)測(cè)模型,對(duì)滑坡進(jìn)行了實(shí)證計(jì)算,且與LSSVM模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了比較。結(jié)果表明,模型具有較高的精度,是科學(xué)可行的。
滑坡預(yù)測(cè);相空間重構(gòu);最小二乘支持向量機(jī);神經(jīng)網(wǎng)絡(luò)
隧道現(xiàn)場(chǎng)監(jiān)控量測(cè)是隧道施工的重要組成部分,在地鐵施工過(guò)程中,無(wú)論是隧道內(nèi)部的變形,還是對(duì)應(yīng)隧道上方的地表變形,都是一個(gè)復(fù)雜的非平穩(wěn)、非線性動(dòng)態(tài)系統(tǒng)。如何從這些數(shù)據(jù)中提取出內(nèi)在的規(guī)律性的東西,便成為工程技術(shù)人員面臨的艱巨任務(wù),其本質(zhì)就是數(shù)據(jù)挖掘問(wèn)題?;谶@點(diǎn)認(rèn)識(shí),許多科技人員將隧道變形的實(shí)測(cè)數(shù)據(jù)進(jìn)行常規(guī)分析和人工智能分析,并在此領(lǐng)域取得了豐碩的成果[1-4]。作為 SVM 近幾年發(fā)展起來(lái)的新形式[5],最小二乘支持向量機(jī)(LS-SVM)較好地解決了小樣本、非線性、高維數(shù)、局部極小點(diǎn)等實(shí)際問(wèn)題,在模式分類和回歸建模等方面有較好的應(yīng)用前景。經(jīng)驗(yàn)?zāi)J椒纸釫MD(EmpiricalModeDecomposition)是一種處理非線性、非平穩(wěn)信號(hào)的新方法[6],該方法吸取了小波變換的多分辨的優(yōu)勢(shì),同時(shí)克服了小波變換中需要選取小波基的困難,是一種自適應(yīng)的小波分解方法。
將 EMD和最小二乘支持向量機(jī) LS-SVM(Least Square-SupportVectorMachine)相結(jié)合,對(duì)非平穩(wěn)時(shí)間序列進(jìn)行預(yù)測(cè)。首先運(yùn)用EMD將非平穩(wěn)的時(shí)間序列分解成具有不同特征尺度的本征式分量 IMF(Intrinsic Mode Function),然后根據(jù)IMF的變化規(guī)律,利用不同的LS-SVM建立不同的IMF分量預(yù)測(cè)模型。最后,所有分量的預(yù)測(cè)值組合重構(gòu)得到最終的預(yù)測(cè)值。
HUANG等[7]提出將原始信號(hào) EMD分解為若干IMF之和,從而賦予了瞬時(shí)頻率合理的定義及物理意義,可用于非線性與非平穩(wěn)信號(hào)處理[8]。
每個(gè)分解的IMF必須滿足以下兩個(gè)條件:1)極值點(diǎn)的數(shù)量與過(guò)零點(diǎn)的數(shù)量必須相等或最多相差不多于一個(gè);2)在任一時(shí)間點(diǎn)上,信號(hào)局部最大值確定的上包絡(luò)線和局部最小值確定的下包絡(luò)線的均值為零。
EMD通過(guò)如下“篩選”過(guò)程來(lái)獲得各個(gè)IMF:
1)設(shè)給定信號(hào)為 a,找出給定信號(hào)的局部均值,(這個(gè)過(guò)程可以通過(guò)取信號(hào)局部極大值的包絡(luò)和信號(hào)局部極小值的包絡(luò)的平均值來(lái)得到)將其局部均值組成新的序列m。a與均值序列m的差值被定義為序列h;
2)檢查序列h是否滿足IMF的基本條件或者滿足給定的閾值,若滿足則執(zhí)行3);否則,對(duì)信號(hào)繼續(xù)執(zhí)行步驟1);
3)令ci=h,即h即為分解得到的第i個(gè)IMF分量ci;并令ri=ri-1-ci;
4)檢查是否滿足分解停止條件,若滿足則執(zhí)行5);否則令a=r(i)返回1),i=i+1;
5)分解完成,得到基本模式分量 c1,c2,c3……,及殘留分量rn。
最終,通過(guò)基于經(jīng)驗(yàn)的模式分解得到:
式中,ci是從原始信號(hào)中獲得的基本模式分量;rn為趨勢(shì)項(xiàng),即原始信號(hào)被分解為 n個(gè)基本模式分量和一個(gè)趨勢(shì)項(xiàng)。c1~ cn就是原數(shù)據(jù)序列經(jīng)分離后得到的不同尺度信息,c1中應(yīng)包含原始信號(hào)中最短的周期分量,即信號(hào)尺度最小的部分;rn中包含信號(hào)中較大尺度的部分。因?yàn)槌叨仍絹?lái)越大,所以 rn是一個(gè)相對(duì)緩變的信息,最終可能是一個(gè)單調(diào)函數(shù),也可能是一個(gè)恒量。
預(yù)測(cè)建模問(wèn)題實(shí)質(zhì)上就是非線性回歸問(wèn)題。支持向量機(jī)的非線性回歸的主要思想是:通過(guò)非線性映射(·),將輸入數(shù)據(jù)投影到高維特征空間(Hilbert空間),從而將低維非線性回歸問(wèn)題轉(zhuǎn)化為高維特征空間中的線性回歸問(wèn)題。原理如下[9-11]:
構(gòu)造最優(yōu)決策函數(shù):
其中,h為高維特征空間維數(shù)(可能為無(wú)窮維),b為偏置量。
根據(jù)問(wèn)題求解目標(biāo)和結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原則,上式需滿足如下條件:
根據(jù)LS-SVM算法,定義誤差損失函數(shù)為誤差的二次項(xiàng),上述問(wèn)題可轉(zhuǎn)為
用拉格朗日乘子法求解這個(gè)具有等式約束的二次規(guī)劃問(wèn)題,定義Lagrange函數(shù):
其中,ai和b為式 (8)的計(jì)算結(jié)果。
基于EMD和LSSVM預(yù)測(cè)模型,如圖1所示。
圖1 組合預(yù)測(cè)模型示意圖
該模型的基本預(yù)測(cè)步驟如下:
1)采用EMD分解將非平穩(wěn)信號(hào)分解為不同尺度的波動(dòng)或趨勢(shì),各IMF分量分別包含了信號(hào)從高到低不同頻率段的成分,且各分量都是平穩(wěn)的;2)將各個(gè)IMF分量送入LSSVM進(jìn)行預(yù)測(cè),對(duì)每個(gè)時(shí)間序列都通過(guò)交叉驗(yàn)證法[12]得到最優(yōu)參數(shù),從而達(dá)到最佳的預(yù)測(cè)效果;3)所有分量輸出后用各個(gè)分量的預(yù)測(cè)值重構(gòu)出原始信號(hào)的預(yù)測(cè)序列。
4.1 EMD-LSSVM隧道不均勻沉降試驗(yàn)
數(shù)據(jù)來(lái)源于上海某隧道的監(jiān)測(cè)項(xiàng)目,選取某一個(gè)監(jiān)測(cè)點(diǎn)的沉降變化數(shù)據(jù)進(jìn)行分析,觀測(cè)周期為天,共有54期觀測(cè)數(shù)據(jù),趨勢(shì)見(jiàn)圖2,可以看出此序列有明顯的非平穩(wěn)特性。利用EMD-LSSVM模型對(duì)預(yù)測(cè)進(jìn)行分析。
圖2 原沉降時(shí)間序列
取前44期數(shù)據(jù)進(jìn)行建模,將預(yù)測(cè)值與后10期真實(shí)值進(jìn)行比較,預(yù)測(cè)誤差采用平均絕對(duì)百分誤差(MAPE)和相對(duì)誤差(Pe)。其中,ri為實(shí)際負(fù)荷值,fi為預(yù)測(cè)負(fù)荷值,N為預(yù)測(cè)值總個(gè)數(shù)。
經(jīng)EMD分解后,得4個(gè)本征模態(tài)分量和一個(gè)多余分量,如圖3所示。
圖3 原沉降時(shí)間序列及其各個(gè)分解分量
對(duì)各個(gè)分量采用不同的最小二乘支持向量機(jī)模型進(jìn)行訓(xùn)練和測(cè)試,其核函數(shù)全部選用RBF核。經(jīng)過(guò)試算,本文選取的最小二乘支持向量機(jī)模型參數(shù)的選擇對(duì)預(yù)測(cè)結(jié)果的影響較大,這些參數(shù)包括核函數(shù)2和調(diào)節(jié)常數(shù),因此參數(shù)的選擇顯得十分重要。利用交叉驗(yàn)證法得到最佳參數(shù),各個(gè)分量對(duì)應(yīng)的模型參數(shù)如表 1所示。
將各IMF預(yù)測(cè)序列合成重構(gòu),得到原序列的預(yù)測(cè)曲線如圖4所示。
表1 各個(gè)分量LSSVM預(yù)測(cè)模型參數(shù)
圖4 不同模型的不均勻沉降預(yù)測(cè)曲線比較
4.2 對(duì)比分析
分別采用自回歸(AR)模型和單一的LSSVM模型對(duì)該組數(shù)據(jù)進(jìn)行預(yù)測(cè)。其中,對(duì)于 A R模型,依據(jù)AIC推出了AR系列預(yù)報(bào)模型,得出AR(7)模型的結(jié)果最符合真實(shí)值;對(duì)于LSSVM模型,分別取核函數(shù)2=0.91290404和調(diào)節(jié)常數(shù)=5883.6819。得到預(yù)測(cè)曲線如圖4所示。
可見(jiàn),采用EMD-LSSVM模型后,曲線的擬合程度較之直接對(duì)序列進(jìn)行AR(7)預(yù)測(cè)及用LSSVM預(yù)測(cè)有很大的提高,平均相對(duì)誤差由19.6445%和9.4049%降至5.6033%,精度明顯提高,3種模型預(yù)測(cè)結(jié)果見(jiàn)表2。
表2 三種模型的預(yù)測(cè)比較/mm
對(duì)隧道不均勻沉降預(yù)測(cè)建模進(jìn)行研究,利用EMDLSSVM的預(yù)測(cè)模型對(duì)其進(jìn)行分析,得出以下結(jié)論:
1)采用EMD對(duì)原始沉降序列進(jìn)行分解,得到一系列 IMF,并對(duì)其采用不同參數(shù)的最小二乘支持向量機(jī)建模預(yù)測(cè),試驗(yàn)結(jié)果表明,該模型用于此是有效的。
2)通過(guò)與單一LSSVM模型和AR(7)模型進(jìn)行預(yù)測(cè)對(duì)比,結(jié)果表明,該模型具有較高的精度。
3)在最小二乘支持向量機(jī)預(yù)測(cè)階段,選取不同的參數(shù),對(duì)預(yù)測(cè)結(jié)果影響較大;鑒于此,
采用交叉驗(yàn)證法選取參數(shù),雖然耗時(shí)很長(zhǎng),但可以得到最優(yōu)參數(shù),從而大大提高預(yù)測(cè)精度。
4)將EMD-LSSVM用于隧道不均勻沉降預(yù)測(cè),為此提供了一個(gè)新的解決思路。
[1] 尹光志,岳順.基于ARMA模型的隧道位移時(shí)間序列分析[J].巖土力學(xué),2009,30(9):186-191
[2] 韋凱,龔全美,周順華.隧道長(zhǎng)期不均勻沉降預(yù)測(cè)的蟻群算法[J].同濟(jì)大學(xué)學(xué)報(bào),2009,37(8):5-10
[3] 王金明.地鐵隧道施工引起的地表沉降及變形研究[D]湖南:中南大學(xué),2009
[4] 王穗輝,潘國(guó)榮.人工神經(jīng)網(wǎng)絡(luò)在隧道地表變形預(yù)測(cè)中的應(yīng)用[J].同濟(jì)大學(xué)學(xué)報(bào),2001,29(10):1147-1151
[5] 鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法-支持向量機(jī)[M].北京:科學(xué)出版社,2004
[6]戴吾蛟,丁曉利,朱建軍,等.基于經(jīng)驗(yàn)?zāi)J椒纸獾臑V波去噪法及其在GPS多路徑效應(yīng)中的應(yīng)用[J].測(cè)繪學(xué)報(bào),2006,35(4): 27-33
[7]Huang NE,Shen Z,Long SR.The Empirical ModeDecom position and the Hilbert Spectrum for Nonlinear Non-stationary Time Series Analysis[J].Proc.R.Soc.Lond.A,1998,454:903-995
[8] 王軍棟,齊維貴.基于EMD-SVM的江水濁度預(yù)測(cè)方法研究[J].電子學(xué)報(bào),2009,10(10):20-23
[9] LiFangfang,Zhao Yingkai,Jiang Zhibing.The Prediction of Oil Quality Based on Least Squares Support Vector Machines and Daubechies Wavelet and Mallat A lgorithm[C].Proceedings of the Sixth International Conference on Intelligent Systems Design and Applications(ISDA0'6),2006
[10]Zhang M ingguang,Li Zhanm ing,LiWenhu.IStudy on Least Squares Support Vector Machines Algorithm and its Application [C].Proceedingsof the17th IEEE International Conferenceon Tools,With Artificial Intelligence(ICTAI'05),2005
[11]鄭小霞,錢(qián)鋒.基于PCA和最小二乘支持向量機(jī)的軟測(cè)量建模[J].系統(tǒng)仿真學(xué)報(bào),2006,18(3):739-741
[12]MommaM,BennettK P.A Pattern Search Method forModelSelection of Support Vector Regression[C].//Proceedings of the SIAM International Conference on Data M ining.Philadelphia: SIAM,2002:261-274
Prediction of Landslideby Phase Space Reconstruction
by Tang Jun
In view of the non linear characteristics of landslide disp lacement time sequence,introduced the prediction method based on phase space reconstruction and least squares support vector machine(LSSVM).Used Cao'sme thod to determine the embedding dimension,according to mutual information method to compute the best delay time;then in the phase space,used least squares support vector machine(LSSVM)to establish the forecast model to com pared with LSSVM and the neural network predictingm ode.The test result show s that them odelhas the high precision,is scientific and feasible.
landslide prediction,phase space reconstruction,least squares support vector machine,neural network (Page:139)
P258
B
1672-4623(2011)01-0139-04
2010-05-19
項(xiàng)目來(lái)源:東華理工大學(xué)校長(zhǎng)基金資助項(xiàng)目(DHXK1010);江西省數(shù)字國(guó)土重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金資助項(xiàng)目(DLLJ201014)。
湯俊,碩士,助教,主要從事變形監(jiān)測(cè)和數(shù)據(jù)處理方向的研究工作。