陳 曦,高雅萍,涂 銳
(1.成都理工大學(xué)地球科學(xué)學(xué)院,四川 成都 610059;2.中國(guó)科學(xué)院國(guó)家授時(shí)中心,陜西 西安 710600)
滑坡監(jiān)測(cè)得到的地表位移數(shù)據(jù)經(jīng)過科學(xué)處理和有效預(yù)測(cè),可以得到滑坡體未來(lái)一段時(shí)間內(nèi)的位移趨勢(shì)變化,這對(duì)滑坡災(zāi)害防災(zāi)減災(zāi)方案的制訂有重要的數(shù)據(jù)決策支持作用,對(duì)于滑坡災(zāi)害的預(yù)報(bào)預(yù)警具有非常重要的意義。
目前,運(yùn)用較多的預(yù)測(cè)模型有統(tǒng)計(jì)機(jī)器學(xué)習(xí)模型、灰色模型、回歸模型、時(shí)間序列模型等[1,4],其中神經(jīng)網(wǎng)絡(luò)模型、灰色模型、自回歸模型等在滑坡位移預(yù)測(cè)中應(yīng)用較多[2];數(shù)據(jù)序列的分解方法有小波分解、EMD、EEMD、VMD等[1,3,5-6];許多學(xué)者將數(shù)據(jù)分解方法和預(yù)測(cè)模型進(jìn)行組合預(yù)測(cè),預(yù)測(cè)精度相對(duì)提高。宋麗偉[5]對(duì)位移序列進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解和模態(tài)重構(gòu),利用LSTM模型組合預(yù)測(cè),為“階梯狀”滑坡位移的預(yù)測(cè)提供了一種可行的思路。鄢濤等[6]利用極限學(xué)習(xí)機(jī)(ELM)對(duì)大壩變形的EEMD不同分解分量引入影響因子分別預(yù)測(cè)并疊加,預(yù)測(cè)精度有所提高。但這些預(yù)測(cè)模型都需要較多的累積觀測(cè)數(shù)據(jù)進(jìn)行樣本學(xué)習(xí),在實(shí)際監(jiān)測(cè)過程中當(dāng)影響因子監(jiān)測(cè)數(shù)據(jù)積累不足或者影響因子數(shù)據(jù)誤差較大與位移相關(guān)性較少時(shí),位移預(yù)測(cè)就會(huì)比較困難,預(yù)測(cè)精度較低,需要應(yīng)用對(duì)單位移序列擬合預(yù)測(cè)效果較好的模型,使滑坡位移預(yù)測(cè)結(jié)果有較高的精度。吳棟等[7]對(duì)比研究了LSTM 和SVM對(duì)VMD分量位移的組合預(yù)測(cè)發(fā)現(xiàn)LSTM更能有效地預(yù)測(cè)滑坡位移變化的本質(zhì)規(guī)律。簡(jiǎn)文彬等[8]、楊大明[9]利用門限自回歸模型進(jìn)行了地基沉降預(yù)測(cè)。針對(duì)這樣的問題,選擇了應(yīng)用較廣泛的經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)分解方法和對(duì)非線性非穩(wěn)態(tài)序列預(yù)測(cè)效果較好的門限自回歸模型(Threshold Auto Regressive,TAR)[10-12],以組合的形式預(yù)測(cè)滑坡位移變化。門限自回歸模型[13]是在自回歸 (AR) 模型的基礎(chǔ)上增加了門限區(qū)間約束條件,是對(duì)一類非線性的時(shí)間序列進(jìn)行局部線性逼近的非線性時(shí)間序列模型。
本文以三峽庫(kù)區(qū)秭歸縣白水河滑坡為例,首先利用經(jīng)驗(yàn)?zāi)B(tài)分解方法將GPS滑坡地表監(jiān)測(cè)水平累計(jì)位移分解為不同頻率位移分量,然后利用門限自回歸模型對(duì)各位移分解序列進(jìn)行獨(dú)立預(yù)測(cè),最后模態(tài)疊加得到最終預(yù)測(cè)位移序列。選取MAE、MRE、RMSE和擬合優(yōu)度4種精度指標(biāo)來(lái)準(zhǔn)確評(píng)價(jià)組合模型的精度,通過與BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)模型、長(zhǎng)短時(shí)間記憶網(wǎng)絡(luò)模型的單一或組合模型對(duì)比驗(yàn)證其準(zhǔn)確性,為滑坡的位移預(yù)測(cè)提供一種新的方法。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,簡(jiǎn)稱EMD)以數(shù)據(jù)序列的時(shí)變特征為基礎(chǔ),可將序列中存在的各種具有一定周期性規(guī)律的不同變化頻率的分量分離單獨(dú)存在。
對(duì)于滑坡位移數(shù)值序列,由于各種因素的影響,實(shí)測(cè)數(shù)據(jù)會(huì)存在各種模式的波動(dòng)變化,也就是由若干個(gè)不同頻率的數(shù)值波形序列所混合構(gòu)成的,是不同變化頻率數(shù)值序列的復(fù)合非線性數(shù)據(jù),EMD分解的目的就是為了分解出其中的位移本征模函數(shù),將復(fù)雜位移序列分化為多個(gè)近似單一頻率的位移序列形式。
EMD分解方法:在原位移序列極值點(diǎn)基礎(chǔ)上用三次樣條曲線擬合形成上下包絡(luò)線,計(jì)算上下包絡(luò)均值作為第一個(gè)位移序列分離分量,將原位移序列減去該分量,得到1個(gè)新的位移序列。新序列若還存在局部極值,說明還不是1個(gè)無(wú)波動(dòng)趨勢(shì)序列,需要繼續(xù)進(jìn)行擬合分解,使用上述方法得到第一個(gè)分量后,用原始序列減去該分量,作為新的數(shù)據(jù)序列,可以得到所有剩余分量,以此類推,直至完成經(jīng)驗(yàn)?zāi)B(tài)分解得到趨勢(shì)變化序列。
門限自回歸(Threshold Auto Regressive,TAR)模型對(duì)于存在較規(guī)律波動(dòng)變化的時(shí)間序列預(yù)測(cè)效果較好。由于門限的分割,該模型對(duì)數(shù)據(jù)序列可以分段處理,詳細(xì)描述序列的變化情況。
自回歸(Auto Regressive,TAR)模型是分析數(shù)據(jù)內(nèi)部相關(guān)關(guān)系的方法,假設(shè)存在觀測(cè)時(shí)序{xt},則定義p階自回歸模型,簡(jiǎn)稱AR(p):
xt=φ0+φ1xt-1+…+φpxt-p+εt
(1)
式中,φp不為0,{φp}為自回歸系數(shù)序列;εt為零均值白噪聲序列。
φ0+φ1+…+φp<1對(duì)于平穩(wěn)的自回歸模型,其自相關(guān)系數(shù)滿足如下遞推關(guān)系:
ρk=φ1ρk-1+φ2ρk-2+…+φpρk-p
(2)
(3)
AR模型的參數(shù)估計(jì)采用最小二乘估計(jì),估計(jì)自回歸系數(shù)序列{φp},建立各參數(shù)矩陣,Y為AR模型預(yù)測(cè)矩陣,X為AR模型樣本矩陣,φ為AR模型自回歸系數(shù)矩陣,ε為零均值白噪聲序列:
(4)
線性方程組為:
Y=Xφ+ε
(5)
自回歸系數(shù)最小二乘估計(jì)為:
φ=(XTX)-1XT(Y-ε)
(6)
誤差方差的最小二乘估計(jì)為:
(7)
AR模型的定階采用貝葉斯信息準(zhǔn)則:
(8)
其中,N表示樣本序列長(zhǎng)度,σ2表示樣本殘差的方差,使得BIC達(dá)到最小值的p即為該準(zhǔn)則下的最優(yōu) AR 模型的階數(shù)。
TAR模型是分段的AR模型,通過在觀測(cè)時(shí)序{xi}的取值范圍內(nèi)引入k-1個(gè)門限值ri(i=1,2,…,n-1),將該整個(gè)時(shí)間序列分成n個(gè)門限區(qū)間,可用r0,rn分別表示上界和下界,并根據(jù)延遲步數(shù)d按{xi-d}值的大小分配到不同的門限區(qū)間內(nèi),再對(duì)區(qū)間內(nèi)的xi采用不同階數(shù)的自回歸模型(AR模型),從而形成時(shí)間序列的非線性分段動(dòng)態(tài)詳細(xì)描述,其模型形式見式(9):
(9)
(10)
首先利用經(jīng)驗(yàn)?zāi)B(tài)分解方法對(duì)GPS滑坡監(jiān)測(cè)地表位移數(shù)據(jù)進(jìn)行序列分解,得到不同變化頻率的位移序列,對(duì)各變形分量獨(dú)立采用門限自回歸模型進(jìn)行預(yù)測(cè),避免各分量誤差相互影響,最后將所有形變分量模態(tài)疊加得到最終滑坡地表位移數(shù)值預(yù)測(cè)序列。其優(yōu)勢(shì)是利用門限自回歸模型的對(duì)復(fù)雜非線性數(shù)據(jù)序列預(yù)測(cè)效果較好的特點(diǎn),結(jié)合EMD分解算法的只用依據(jù)序列自身時(shí)間特征的特點(diǎn),極大地提高了滑坡形變監(jiān)測(cè)單位移序列的精度。該文組合預(yù)測(cè)模型數(shù)據(jù)處理步驟見圖1。
圖1 組合模型預(yù)測(cè)分析步驟
所采用的滑坡位移預(yù)測(cè)模型的精度評(píng)價(jià)指標(biāo)包括平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方誤差(Root Mean Square Error,RMSE)、平均相對(duì)誤差(Mean Relative Error,MRE)、擬合優(yōu)度R2,計(jì)算式為:
(11)
(12)
(13)
(14)
以三峽庫(kù)區(qū)秭歸縣白水河滑坡GPS地表位移監(jiān)測(cè)數(shù)據(jù)為例,滑坡體呈階梯狀向長(zhǎng)江展布,為堆積層滑坡,坡體屬順向坡。滑坡體共布設(shè)11個(gè)GPS監(jiān)測(cè)點(diǎn),選擇滑坡體中下部監(jiān)測(cè)點(diǎn)ZG118和滑坡體北東部監(jiān)測(cè)點(diǎn)DX-02對(duì)滑坡體不同位置形變位移進(jìn)行預(yù)測(cè)描述,數(shù)據(jù)來(lái)源于國(guó)家冰川凍土沙漠科學(xué)數(shù)據(jù)中心 (http://www.ncdc.ac.cn)。
ZG118監(jiān)測(cè)點(diǎn)為從2006年12月至2012年12月,共73期GPS地表位移觀測(cè)數(shù)據(jù)。為提高單序列位移的預(yù)測(cè)精度,首先利用EMD對(duì)GPS監(jiān)測(cè)點(diǎn)水平位移序列進(jìn)行模態(tài)分解,迭代次數(shù)設(shè)置為200次,得到5個(gè)不同變化頻率的IMF分量和一個(gè)殘差分量,殘差分量作為粗差剔除。各IMF分量見圖2。
a)IMF1
將73期滑坡位移數(shù)據(jù)中的1—50期作為訓(xùn)練樣本,51—73期數(shù)據(jù)作為預(yù)測(cè)檢驗(yàn)值。建立門限自回歸預(yù)測(cè)模型,門限區(qū)間個(gè)數(shù)取2,最大門限延遲量設(shè)置為5,自回歸最大階數(shù)為5,默認(rèn)最小AIC值為1E+10,便于后續(xù)優(yōu)化AIC值獲得最優(yōu)多維參數(shù)。按樣本的30%~70%分位區(qū)間以1%進(jìn)度搜索最優(yōu)門限值。每組分量預(yù)測(cè)步長(zhǎng)為一步,預(yù)測(cè)后數(shù)據(jù)更新,再進(jìn)行下一步預(yù)測(cè),實(shí)現(xiàn)模型的動(dòng)態(tài)更新和預(yù)測(cè)。
為驗(yàn)證所建立組合預(yù)測(cè)模型的精度,分別建立EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型、TAR模型、LSTM模型對(duì)該滑坡位移序列進(jìn)行預(yù)測(cè),組合模型EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型[14-15]的預(yù)測(cè)方法為分別利用TAR模型、LSTM模型、BPNN模型預(yù)測(cè)每個(gè)IMF分量,最后時(shí)序合成得到實(shí)際滑坡預(yù)測(cè)位移序列,各模型的預(yù)測(cè)結(jié)果見圖3。
圖3 各模型預(yù)測(cè)結(jié)果曲線序列
由圖3可看出,單一TAR模型的預(yù)測(cè)效果比LSTM和BPNN更好,LSTM和BPNN單一模型會(huì)隨著時(shí)間推移預(yù)測(cè)誤差變大。相對(duì)于單一TAR模型和其他組合模型,組合EMD-TAR模型與原始位移序列擬合度較高,擬合優(yōu)度最高,較為符合原始位移的變化趨勢(shì)。為了準(zhǔn)確評(píng)價(jià)模型的整體預(yù)測(cè)精度,對(duì)比計(jì)算幾種預(yù)測(cè)模型的精度評(píng)價(jià)指標(biāo),結(jié)果表明,所建立的EMD-TAR預(yù)測(cè)模型在MAE、RMSE、MRE和擬合優(yōu)度上均大幅提高。各模型精度評(píng)價(jià)值見表1。
表1 各模型精度評(píng)價(jià)
為更好地驗(yàn)證所建立預(yù)測(cè)模型的精度和可靠性,選取滑坡體另一監(jiān)測(cè)點(diǎn)進(jìn)行預(yù)測(cè)實(shí)驗(yàn),DX-02監(jiān)測(cè)點(diǎn)為從2006年12月至2010年8月,共45期GPS地表位移觀測(cè)數(shù)據(jù),1—32期作為訓(xùn)練樣本,33—45期數(shù)據(jù)作為預(yù)測(cè)檢驗(yàn)值。EMD模態(tài)分解迭代次數(shù)設(shè)置為2 000次,得到5個(gè)不同變化頻率的IMF分量和一個(gè)殘差分量,殘差分量作為粗差剔除。各IMF分量見圖4。所建立門限自回歸預(yù)測(cè)模型中門限區(qū)間個(gè)數(shù)設(shè)置為2,最大門限延遲量設(shè)置為5,自回歸最大階數(shù)為5,默認(rèn)最小AIC值為1E+10。考慮到分量頻率的變化因素,其中IMF1按樣本的30%~70%分位區(qū)間以1%進(jìn)度搜索最優(yōu)門限值,IMF2-4按樣本的30%~50%分位區(qū)間以1%進(jìn)度搜索最優(yōu)門限值。每組分量預(yù)測(cè)步長(zhǎng)為一步,預(yù)測(cè)后數(shù)據(jù)更新,再進(jìn)行下一步預(yù)測(cè),實(shí)現(xiàn)模型的動(dòng)態(tài)更新和預(yù)測(cè)。
a)IMF1
同樣,以此監(jiān)測(cè)數(shù)據(jù)為例,分別建立EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型、TAR模型、LSTM模型對(duì)該滑坡位移序列進(jìn)行預(yù)測(cè),組合模型EMD-TAR模型、EMD-LSTM模型、EMD-BPNN模型的預(yù)測(cè)方法為分別利用TAR模型、LSTM模型、BPNN模型預(yù)測(cè)每個(gè)IMF分量,最后時(shí)序合成得到實(shí)際滑坡預(yù)測(cè)位移序列,各模型的預(yù)測(cè)結(jié)果見圖5。
圖5 各模型預(yù)測(cè)結(jié)果曲線序列
由圖5可看出,組合EMD-TAR模型與原始位移序列擬合程度最高,最符合原始位移的變化趨勢(shì)。參考分析2個(gè)算例的各模型預(yù)測(cè)結(jié)果曲線圖,樣本數(shù)據(jù)量和預(yù)測(cè)時(shí)間的變化對(duì)組合EMD-TAR模型影響較小,模型預(yù)測(cè)較穩(wěn)定。在算例一中EMD-TAR、EMD-LSTM模型預(yù)測(cè)結(jié)果誤差較小而在算例二中EMD-TAR、LSTM模型預(yù)測(cè)結(jié)果誤差較小,樣本數(shù)據(jù)量變化對(duì)LSTM及其組合模型的預(yù)測(cè)精度產(chǎn)生了影響,算例二較算例一數(shù)據(jù)量減少,EMD分解后的不同頻率分量變少,算例二滑坡位移的整體變化趨勢(shì)較算例一小,所以在算例二中,對(duì)未分解的滑坡位移進(jìn)行預(yù)測(cè)的LSTM模型的預(yù)測(cè)效果相比EMD-LSTM模型更好,綜合分析得到EMD-TAR在預(yù)測(cè)精度和穩(wěn)定性上更優(yōu)。
為了準(zhǔn)確評(píng)價(jià)模型的整體預(yù)測(cè)精度,計(jì)算幾種預(yù)測(cè)模型的精度評(píng)價(jià)指標(biāo),結(jié)果表明,該文所建立的EMD-TAR預(yù)測(cè)模型在MAE、RMSE、MRE和擬合優(yōu)度上均大幅提高。各模型精度評(píng)價(jià)值見表2。
表2 各模型精度評(píng)價(jià)
基于EMD算法和TAR模型構(gòu)建了EMD-TAR滑坡位移預(yù)測(cè)模型,針對(duì)的是在實(shí)際監(jiān)測(cè)過程中當(dāng)影響因子監(jiān)測(cè)數(shù)據(jù)積累不足或者影響因子數(shù)據(jù)誤差較大與位移相關(guān)性較少的情況,利用EMD算法將非穩(wěn)態(tài)的GPS監(jiān)測(cè)滑坡位移序列分解為在時(shí)間尺度上具有不同變化頻率的多個(gè)分量,對(duì)AR模型進(jìn)行門限改進(jìn)得到TAR模型,結(jié)合TAR模型對(duì)非線性波動(dòng)數(shù)據(jù)序列預(yù)測(cè)效果較好的優(yōu)勢(shì),對(duì)滑坡位移序列進(jìn)行分解、預(yù)測(cè)、再疊加得到精度較高的預(yù)測(cè)結(jié)果。經(jīng)過白水河滑坡實(shí)例數(shù)據(jù)的試驗(yàn)驗(yàn)證,該組合模型相比于單一TAR模型、LSTM和BPNN模型及其組合模型預(yù)測(cè)精度更高,為滑坡位移的預(yù)測(cè)提供了一種新方法。但該模型在滑坡環(huán)境影響下監(jiān)測(cè)數(shù)據(jù)積累不足或影響因子關(guān)聯(lián)較小時(shí)對(duì)位移的預(yù)測(cè)具有一定的局限性,后續(xù)可與其他顧及影響因子的模型進(jìn)行組合預(yù)測(cè)研究。