陸杰,梁月吉,徐寧輝,陶健春
(1.南寧勘察測繪地理信息院,廣西 南寧 530001; 2.桂林理工大學(xué)測繪地理信息學(xué)院,廣西 桂林 541004; 3.廣西城市建設(shè)學(xué)校,廣西 桂林 541003)
基于EMD的GM-LSSVM在變形預(yù)測中的應(yīng)用
陸杰1*,梁月吉2,徐寧輝1,陶健春3
(1.南寧勘察測繪地理信息院,廣西 南寧 530001; 2.桂林理工大學(xué)測繪地理信息學(xué)院,廣西 桂林 541004; 3.廣西城市建設(shè)學(xué)校,廣西 桂林 541003)
針對變形呈非線性、隨機性變化特征,提出了一種基于經(jīng)驗?zāi)B(tài)分解(EMD)的灰色最小二乘支持向量機(GM-LSSVM)變形預(yù)測模型。該模型首先采用EMD有效分離出隱含在變形序列中的非線性高頻成分和低頻成分;然后根據(jù)各分量特點構(gòu)建了高頻LSSVM預(yù)測模型和低頻GM(1,1)預(yù)測模型,最后疊加各分量預(yù)測值得到預(yù)測結(jié)果。經(jīng)理論分析和算例表明,并與灰色GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)和LSSVM對比分析。結(jié)果表明,EMD能夠有效分離變形序列的不同頻率成分,本文方法具有較強的預(yù)測精度,均方根誤差為 0.40 mm,在變形預(yù)測中具有一定的實用價值。
大壩變形;經(jīng)驗?zāi)B(tài)分解;GM(1,1);最小二乘支持向量機;精度評定
大壩變形往往受水位、溫度等多種因素共同影響,具有一定的非線性和隨機性變化,為保證大壩以及人類的安全,需要及時掌握大壩變形狀態(tài)并及時做出準(zhǔn)確預(yù)測。目前,常用的預(yù)測方法主要有時間序列分析、灰色理論、BP神經(jīng)網(wǎng)絡(luò)和支持向量機等,以上方法均存在一定的局限性?;疑A(yù)測模型具有所需數(shù)據(jù)少、建模簡單等特點,適合用于解決呈指數(shù)增長趨勢的實際問題,而對于復(fù)雜變化、隨機變化的序列,預(yù)測誤差較大[1];人工神經(jīng)網(wǎng)絡(luò)在大壩變形分析中得到了較為廣泛的應(yīng)用[2],但其易陷入局部極小點、模型結(jié)構(gòu)不易確定、泛化能力不強或過于學(xué)習(xí)等。趙洪波等[3]將支持向量機引用到變形預(yù)測中,解決了多因素影響下的復(fù)雜變形預(yù)測問題,預(yù)測精度得到了進一步提高。然而,由于大壩變形受多種因素共同影響,直接通過建立變形量與影響因素之間的復(fù)雜非線性關(guān)系模型難以保證模型預(yù)測的準(zhǔn)確性。 Huang等[4]于1998年提出了一種新的信號處理EMD方法。該方法是一種處理非線性和非平穩(wěn)信號的自適應(yīng)分解方法,不需要確定任何函數(shù),直接對信號進行平穩(wěn)化處理,能夠有效提取原信號的波動項和趨勢項[5]?;谏鲜鲅芯浚疚奶岢隽嘶诮?jīng)驗?zāi)B(tài)分解(EMD)和灰色最小二乘支持向量機(GM-LSSVM)的大壩變形預(yù)測方法。通過算例,證實其有效性和可行性。
2.1 經(jīng)驗?zāi)B(tài)分解法
經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)是一種自適應(yīng)信號分解方法,能夠?qū)⒋嬖谟谠夹蛄兄胁煌卣鞯内厔葜鸺壓Y選出來,得到具有相同特征尺度的固有模態(tài)分量(Intrinsic Mode Function,IMF),IMF必須同時滿足兩個條件[4,5]:第一,在待分解信號中,極值點的數(shù)目與過零點的數(shù)目相等,或最多相差一個;第二,在任一時間上,由局部極大值和局部極小值定義的包絡(luò)均值為零。具體分解過程可參考文獻(xiàn)[4,5]。2.2 灰色GM(1,1)
灰色GM(1,1)是一個單個變量預(yù)測的一階微分方程模型,其離散時間響應(yīng)函數(shù)近似指數(shù)規(guī)律。建模的思路:大壩水平位移變形序列經(jīng)過一次累加,形成一個遞增數(shù)列,經(jīng)不斷累加,形成的數(shù)據(jù)點連線后接近于某個指數(shù)函數(shù),然后通過這個指數(shù)函數(shù)外推到下一個累加和,再累減還原即得到大壩序列預(yù)測值。
2.3 最小二乘支持向量機
設(shè)某變形序列的樣本集為{(xi,yi)|xi∈Rn,yi∈R,i=1,2,…,l)},得到LS-SVM的回歸函數(shù)為[6]:
y(x)=wTφ(x)+b
(1)
式中,φ(x)表示能夠滿足Mercer條件的核函數(shù),w表示超平面的權(quán)值向量,b表示偏置頂。
對于最小二乘支持向量機的估計問題,將回歸問題等價為最小化得到:
(2)
式中,γ表示正則化參數(shù),ei表示誤差項。構(gòu)建式(2)的Lagrange函數(shù)得到:
(3)
式中,a=[a1,a2,…,al]T。根據(jù) KKT(Karush-Kuhn-Tucker)條件,計算Lagrange函數(shù)的最優(yōu)解:
(4)
對式(4)進行簡化,得到的線性方程組為:
(5)
式中,y=[y1,y2,…,yl]T,A=[1,…,1]T,I表示單位矩陣,K(xi,yi)表示滿足Mercer條件的核函數(shù)。
設(shè)B=K(xi,yi)+γ-1I,采用最小二乘運算求解式(5)得到:
(6)
得到LSSVM的估計函數(shù)為:
(7)
2.4 LSSVM參數(shù)的優(yōu)化
由2.3可知,核函數(shù)k()的選擇以及核參數(shù)σ和正則化參數(shù)γ的優(yōu)化直接影響到最小二乘支持向量機的預(yù)測精度。因此,本文選取徑向基函數(shù)作為模型的核函數(shù),該核函數(shù)能夠較好地反映模型的復(fù)雜程度,采用網(wǎng)格搜索法對σ和γ參數(shù)進行優(yōu)化。參數(shù)優(yōu)化步驟如下[7]:
(1)設(shè)定參數(shù)σ和γ的選擇范圍、參數(shù)步長、網(wǎng)格間隔、網(wǎng)格點目標(biāo)函數(shù)值的計算等。
(2)根據(jù)σ和γ的初始值,選擇第一個交叉驗證網(wǎng)點位置,通過交叉驗證方法獲取訓(xùn)練均方誤差作為網(wǎng)格點計算的目標(biāo)函數(shù),并計算所有的網(wǎng)格點。
(3)選取均方誤差最低的一組(σ,γ)為最優(yōu)參數(shù)。若選取的參數(shù)達(dá)不到精度要求,則以選擇的參數(shù)為中心網(wǎng)格點,在較小的范圍內(nèi)構(gòu)建新的二維網(wǎng)格平面重新計算目標(biāo)函數(shù),再次選取均方誤差最低的參數(shù)。如果滿足精度要求,則停止,否則繼續(xù)重復(fù)以上步驟,最終獲取精確的參數(shù)σ和γ作為最優(yōu)值。
2.5 預(yù)測流程
本文模型預(yù)測流程如下:
(1)采用EMD對大壩變形序列進行分解,得到n個IMF高頻分量和1個低頻分量DF。
(2)針對各IMF,建立相應(yīng)的LSSVM預(yù)測模型,同時建立灰色GM(1,1)預(yù)測模型對DF低頻序列進行預(yù)測。
(3)對各模分量預(yù)測的殘差進行組合即得到最終的預(yù)測結(jié)果。
圖1 模型預(yù)測流程圖
本文采用均方根誤差和平均絕對值誤差來評定模型預(yù)測精度[1]:
(8)
(9)
本文以某大壩水平位移變形監(jiān)測數(shù)據(jù)為實驗數(shù)據(jù)[9],監(jiān)測期為91期,如圖2所示。可見,該大壩水平位移變形變化不穩(wěn)定,非線性和隨機性變化較強,難以直接建立較為準(zhǔn)確的預(yù)報模型。因此,為探討大壩變形序列的特征,采用EMD進行分解,分解結(jié)果如圖3所示。由圖3可見,EMD將變形序列分解為4個頻率依次降低的分量,其中IMF1分量具有一定的非線性變化,IMF2和IMF3呈現(xiàn)出周期性和隨機性成分,DF體現(xiàn)出變形序列的整體變化趨勢。顯然,根據(jù)各分量建立對應(yīng)的模型,對提高預(yù)測精度具有較大的可能。
為驗證本文方法的有效性和可行性,建立4種方案進行對比分析:方案1—灰色GM(1,1)預(yù)測模型、方案2—BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型、方案3—最小二乘支持向量機預(yù)測模型、方案4—基于EMD的GM-LSSVM預(yù)測模型。各方案采用前71期變形數(shù)據(jù)作為模型訓(xùn)練輸入,后20期作為模型預(yù)測數(shù)據(jù)。方案1~方案3直接采用原始變形預(yù)測進行建模,方案4采用經(jīng)EMD分解得到的各分量進行建模。同時,為了減少建模誤差,本文統(tǒng)一將變形序列歸化到[-1,1]區(qū)間,再進行建模預(yù)測。各分量的預(yù)測結(jié)果圖4所示。
圖2 大壩變形水平位移序列
圖3 EMD分解結(jié)果
圖4 各分量預(yù)測值和實際值對比
由圖4可得,方案4的預(yù)測結(jié)果和實際分量相吻合,預(yù)測精度較高。各方案預(yù)測結(jié)果如表1和圖5所示。
由表1可見,方案1、方案2和方案3的預(yù)測結(jié)果不穩(wěn)定,部分預(yù)測值和實際值相差比較大,GM(1,1)的最大殘差為 4.33 mm,BP神經(jīng)網(wǎng)絡(luò)的最大殘差達(dá)到 3.96 mm,LSSVM的最大殘差為 2.73 mm。而方案4的預(yù)測結(jié)果均優(yōu)于其他方案,殘差最小值為 0.04 mm,最大值僅為 0.81 mm。結(jié)合圖5進一步看出:GM(1,1)不能正確反映變形的趨勢,過于線性擬合預(yù)測;BP神經(jīng)網(wǎng)絡(luò)由于自身的缺陷,預(yù)測結(jié)果波動較大;LSSVM的部分預(yù)測結(jié)果不穩(wěn)定,而本文方法的預(yù)測結(jié)果比較穩(wěn)定,接近于大壩實際值。可見,采用經(jīng)驗?zāi)B(tài)分解離使得變形序列中不同頻率的成分得到有效分離,預(yù)測模型的自身性能得到充分發(fā)揮。本文方法綜合結(jié)合線性和非線性的擬合能力,預(yù)測結(jié)果更能顯示大壩變形的趨勢。
不同方案的預(yù)測結(jié)果對比 表1
圖5 各方案的預(yù)測值和大壩實際變形值對比
各方案的預(yù)測精度統(tǒng)計如表2所示。
各模型精度對比(單位/mm) 表2
由表2進一步發(fā)現(xiàn),方案4的預(yù)測精度最高,均方根誤差和平均絕對誤差分別為 0.40 mm、 0.34 mm??梢?,基于EMD的GM-LSSVM預(yù)測模型保證了較好的全局預(yù)測精度,更具優(yōu)越性。綜上,采用經(jīng)驗?zāi)B(tài)分解能夠有效分離隱含在變形序列中的特征成分,更有利于模型的建立和預(yù)報。正是本文方法綜合考慮了變形的特征,充分發(fā)揮了模型的線性和非線性預(yù)測能力,無論在預(yù)測結(jié)果還是預(yù)測精度上均優(yōu)于單一的GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機。
本文提出基于EMD的GM-LSSVM變形預(yù)測方法,結(jié)果表明:經(jīng)驗?zāi)B(tài)分解能夠有效分離隱含在時序中隱含的非線性和隨機性高頻成分以及趨勢低頻成分;各分量更加明顯地表現(xiàn)出時序中隱含的特征信息,使得GM-LSSVM預(yù)測模型的自身性能得到充分發(fā)揮。本文方法具有較強的擬合預(yù)測能力,預(yù)測精度較高。
[1] 任超,梁月吉,龐光鋒等. 最優(yōu)非負(fù)變權(quán)組合模型在大壩變形中的應(yīng)用[J]. 大地測量與地球動力學(xué),2014,34(6):162~166.
[2] 劉勇健,李彰明,張建龍等. 基于遺傳-神經(jīng)網(wǎng)絡(luò)的深基坑變形實時預(yù)報方法研究[J]. 巖石力學(xué)與工程學(xué)報,2004,23(6):1010~1014.
[3] 趙洪波. 支持向量機在隧道圍巖變形預(yù)測中的應(yīng)用[J]. 巖石力學(xué)與工程學(xué)報,2005,24(4):649~653.
[4] Huang N E,Shen Z,Long S R. The Empirical Mode Decomposition and Hilbert Spectrum for Nonlinear and Nonstationary Time Series Analysis[J]. Proceedings of the Royal Society of London SERIESA,1998,903~995.
[5] 戴吾蛟,丁曉利,朱建軍等. 基于經(jīng)驗?zāi)J椒纸獾臑V波去噪法及其在 GPS多路徑效應(yīng)中的應(yīng)用[J]. 測繪學(xué)報,2006,35(4):321~327.[6] Suykens J A K,Vandewalle J. Least Squaresupport Vector Machine Classifiers[J]. Neural Processing Letters,1999,9(3):293~300.
[7] Liu Xianglou,Jia Dongxu,Li Hui. Research on Kernel Parameter Optimization of Support Vector Machine in Speaker Recognition[J]. Science Technology and Engineering,2010,10(7):1669~1673.
[8] 姜成科. 基于遺傳算法的神經(jīng)網(wǎng)絡(luò)在大壩變形預(yù)報中的應(yīng)用[D]. 大連:大連理工大學(xué),2009.
GM-LSSVM Based on EMD in The Application of the Dam Deformation
Lu Jie1,Liang Yueji2,Xu Ninghui1,Tao Jianchun3
(1.Nanning Exploration & Survey Geoinformation Institute,Guilin 530001,China; 2.College of Geomatics and Geoinformation,Guilin University of Technology,Guilin 541004,China; 3.Guangxi Urban Construction School,Guilin 541003,China)
A new algorithm based on empirical mode decomposition (EMD)and the grey least squares support vector machine (GM-LSSVM)for dam deformation prediction was presented. Firstly,to effectively separate the nonlinear trend of volatility of high frequency component and low frequency one,the algorithm deformation sequence was decomposed by EMD;Then,the LSSVM was applied to build a prediction model for high frequency component,and the GM(1,1)was applied to build a prediction model for low frequency one;Finally,the predicted values of each component in the forecast was overlay. The calculation result was analyzed and compared with the grey GM(1,1)、BP neural network and LSSVM. The results show that the EMD can effectively separate different frequency components of deformation sequence,prediction accuracy of the method is stronger,root mean square error is 0.40mm,which can be applied to dam deformation prediction practically.
dam deformation;empirical mode decomposition;GM (1,1);least squares support vector machine;precision evaluation
1672-8262(2017)01-142-04
P196,TV698.11
B
2016—05—07 作者簡介:陸杰(1978—),男,工程師,主要從事測繪工程技術(shù)工作。 基金項目:廣西自然科學(xué)基金項目(2014GXNSFAA118288);廣西“八桂學(xué)者”崗位專項經(jīng)費資助項目、廣西空間信息與測繪重點實驗室資助課題(桂科能130511402,130511407)。