胡 波,譚 涵
(重慶市勘測(cè)院,重慶 400000)
由于受復(fù)雜的地質(zhì)條件的影響,邊坡穩(wěn)定問題一直是巖土工程界關(guān)注的焦點(diǎn)問題。為了保證工程施工和運(yùn)行的安全,對(duì)邊坡監(jiān)測(cè)數(shù)據(jù)進(jìn)行長(zhǎng)期監(jiān)測(cè)并預(yù)測(cè)其變形趨勢(shì)至關(guān)重要。時(shí)間序列分析是一種認(rèn)識(shí)產(chǎn)生觀測(cè)序列的隨機(jī)機(jī)制及對(duì)序列未來的可能取值給出預(yù)測(cè)或預(yù)報(bào)的重要手段,廣泛應(yīng)用于商業(yè)、氣象學(xué)、農(nóng)業(yè)、形變監(jiān)測(cè)、醫(yī)學(xué)等領(lǐng)域[1-6]。如時(shí)序分析方法用于GNSS數(shù)據(jù)處理[7-8],同時(shí)也可與灰色模型、小波分析、頻譜分析進(jìn)行結(jié)合建模[9-11],在大壩、基坑、橋梁等土木工程形變分析中取得了不錯(cuò)的結(jié)果[12-15]?,F(xiàn)有研究表明自回歸滑動(dòng)平均求和(ARIMA)模型是一種常用時(shí)間序列分析模型。本文詳細(xì)論述建立ARIMA模型的關(guān)鍵步驟,并建立模型對(duì)某邊坡工程461 d的觀測(cè)數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),驗(yàn)證利用ARIMA模型對(duì)邊坡監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析與預(yù)測(cè)的可行性和有效性。
本文采用某邊坡工程從2016年6月29日—2017年10月4日期間的監(jiān)測(cè)數(shù)據(jù)成果,該數(shù)據(jù)包含了461 d中1202期觀測(cè)結(jié)果。由于時(shí)間序列分析的基礎(chǔ)數(shù)據(jù)一般為離散、等間隔的數(shù)據(jù)序列[2],而原始觀測(cè)數(shù)據(jù)非等間隔觀測(cè),試驗(yàn)過程中采用內(nèi)插方法對(duì)數(shù)據(jù)進(jìn)行重采樣,從而得到X方向和Y方向每天的平面位移的時(shí)間序列。利用R語(yǔ)言建立模型分析時(shí)間序列,利用前430個(gè)數(shù)據(jù)建立ARIMA預(yù)測(cè)模型,利用后31個(gè)數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
自回歸滑動(dòng)平均(ARMA)模型是目前最常用的一種平穩(wěn)時(shí)間序列預(yù)測(cè)模型。一般來說,如果滿足
Yt=φ1Yt-1+φ2Yt-2+…+φpYt-p+et-
θ1et-1-θ2et-2-…-θqet-q
(1)
則稱{Yt}為自回歸滑動(dòng)混合平均過程,階數(shù)分別為p和q,表示為ARMA(p,q)。
根據(jù)觀測(cè)記錄對(duì)隨機(jī)過程的結(jié)構(gòu)進(jìn)行統(tǒng)計(jì)推斷時(shí),通常對(duì)其做出某些簡(jiǎn)化的(大致合理的)假設(shè),其中最重要的假設(shè)即是平穩(wěn)性。平穩(wěn)性的基本思想是:決定過程特性的統(tǒng)計(jì)規(guī)律不隨時(shí)間的變化而變化。一個(gè)隨機(jī)過程{Yt}稱為弱平穩(wěn)的條件是:均值函數(shù)在所有時(shí)間上恒為常數(shù),且自協(xié)方差值只與滯后階數(shù)有關(guān)。通常非平穩(wěn)時(shí)間序列可以通過差分得到平穩(wěn)的時(shí)間序列。常用的時(shí)間序列平穩(wěn)性檢驗(yàn)方法有圖示法和單位根檢驗(yàn)法。
圖1為X方向位移和Y方向位移的時(shí)間序列圖,可以看出具有明顯的趨勢(shì),均值隨時(shí)間不斷變化,因此可以判斷X方向和Y方向位移的時(shí)間序列為非平穩(wěn)時(shí)間序列。單位根檢驗(yàn)法一般常用的有DF檢驗(yàn)(Dickey-Fuller test)、ADF檢驗(yàn)(augmented Dickey-Fuller test)和PP檢驗(yàn)(Phillips-Perron test)。對(duì)于X方向的位移,ADF檢驗(yàn)的P值為0.107 6,接受原序列非平穩(wěn)的假設(shè);PP檢驗(yàn)的P值小于0.01,拒絕原序列非平穩(wěn)的假設(shè)。對(duì)于Y方向的位移,ADF檢驗(yàn)和PP檢驗(yàn)的P值均小于0.01。結(jié)合時(shí)間序列圖像綜合判斷,X方向和Y方向的位移為非平穩(wěn)時(shí)間序列。
對(duì)X方向和Y方向的位移進(jìn)行一階差分后的時(shí)間序列圖像如圖2所示。從圖2中可以發(fā)現(xiàn)X方向和Y方向位移一階差分后的結(jié)果基本上在0附近波動(dòng),并且ADF檢驗(yàn)和PP檢驗(yàn)的結(jié)果均表明,兩個(gè)一階差分后的時(shí)間序列是平穩(wěn)的。因此,可以考慮使用一階差分的ARIMA模型對(duì)這兩個(gè)時(shí)間序列建模。
要確定ARIMA(p,d,q)模型的參數(shù)p、d、q的值,一般先通過樣本自相關(guān)函數(shù)(ACF)圖和樣本偏自相關(guān)函數(shù)(PACF)圖來判斷。對(duì)于AR(p)模型,其ACF圖一般呈現(xiàn)拖尾特征,而PACF圖則在滯后p階后截尾;對(duì)于MA(q)模型,其ACF圖一般在滯后q階后截尾,而PACF圖呈現(xiàn)拖尾特征;對(duì)于ARMA(p,q)模型,ACF圖和PACF圖都呈現(xiàn)拖尾特征。從圖3可以看出,一階差分后的X方向位移時(shí)間序列的1階滯后自相關(guān)函數(shù)值非常顯著且在1階以后截尾,其偏自相關(guān)函數(shù)值只在1、2、3階較為顯著。一階差分后的Y方向位移時(shí)間序列的1階滯后自相關(guān)函數(shù)值在滯后1、2、3、13階顯著,其偏自相關(guān)函數(shù)同樣在1、2、3、13階顯著。判斷這兩個(gè)時(shí)間序列可能是ARMA混合模型,需要進(jìn)一步判斷其階數(shù)。
樣本ACF和PACF可以有效地識(shí)別純AR(p)或MA(q)模型,但是對(duì)于混合ARMA模型來說,它的理論ACF和PACF有著無限多的非零值,使得根據(jù)樣本ACF和PACF來識(shí)別混合模型非常困難。因此,擴(kuò)展自相關(guān)法(EACF)常常被用于確定ARMA模型的階數(shù),并且EACF法對(duì)于適度大的樣本容量具有較好的樣本性質(zhì)。圖4為兩個(gè)一階差分時(shí)間序列的EACF圖,可以看出X方向的EACF的零三角區(qū)域非常清楚地顯示出p=1、q=1的ARMA模型比較合適。而Y方向的EACF圖的零三角區(qū)域?yàn)閜=2、q=2,還需進(jìn)一步分析,某些系數(shù)可能是因?yàn)榕既灰蛩卦诮y(tǒng)計(jì)上顯著不為零。
為了得到一些可供深入研究的有用的初步模型,使用BIC檢查幾個(gè)最佳子集ARMA模型,匯總在圖5中。圖中的每一行對(duì)應(yīng)著一個(gè)子集ARMA模型,模型所選變量的單元格用陰影表示,根據(jù)BIC值將模型分類,較好的模型(有較低的BIC值)處于較高的行中,并且顏色也較深。對(duì)于X方向的時(shí)間序列,最上面一行說明具有最小BIC值的子集ARMA(7,7)模型只包括觀測(cè)時(shí)間序列誤差過程的1階滯后;其次最好的模型包括時(shí)間序列1階滯后及誤差過程的2階滯后;第3個(gè)較好的模型包括時(shí)間序列1、2階滯后和誤差過程的2階滯后。在不同的子集模型中,時(shí)間序列的1階滯后和誤差過程的2階滯后是出現(xiàn)最頻繁的變量。而對(duì)于Y方向的時(shí)間序列,最好的子集包括觀測(cè)時(shí)間序列2階滯后和誤差過程的1階滯后;其次最好的模型只包括誤差過程的1、2、6階滯后;第3個(gè)較好的模型只包括誤差過程的1階滯后。在不同的子集模型中,時(shí)間序列的2階滯后和誤差過程的1階滯后是出現(xiàn)最頻繁的變量。綜上所述,筆者選擇ARIMA(1,1,1)模型為X方向位移建立時(shí)間序列模型,選擇ARI(2,1)模型為Y方向位移建立時(shí)間序列模型。
在識(shí)別X方向和Y方向位移的時(shí)間序列模型為ARIMA(1,1,1)和ARI(2,1)后,接下來就需要估計(jì)模型的參數(shù)。常用的參數(shù)估計(jì)方法有矩估計(jì)、最小二乘估計(jì)、極大似然估計(jì)和無條件最小二乘估計(jì)。本文使用R語(yǔ)言中的arima函數(shù)進(jìn)行參數(shù)估計(jì),其中的method參數(shù)可以選擇參數(shù)估計(jì)的方法為“CSS”(最小二乘估計(jì))、“ML”(極大似然估計(jì))或“CSS-ML”,默認(rèn)的方法是“CSS-ML”,即先通過最小二乘估計(jì)計(jì)算初值,再用極大似然估計(jì)方法計(jì)算。計(jì)算結(jié)果見表1。
表1 平面位移的時(shí)間序列模型參數(shù)的極大似然估計(jì)值
注:P為似然對(duì)數(shù)值。
為了判斷模型的擬合優(yōu)度,并給出適當(dāng)?shù)恼{(diào)整建議,往往需要分析擬合模型的殘差。殘差等于實(shí)際值減去預(yù)測(cè)值,如果模型正確識(shí)別,殘差應(yīng)當(dāng)具有以下兩條性質(zhì):①參數(shù)估計(jì)充分接近真值,則殘差應(yīng)近似具有白噪聲的特性;②呈現(xiàn)獨(dú)立、同分布、零均值和相同標(biāo)準(zhǔn)差的正態(tài)變量。與這些性質(zhì)的偏離有助于發(fā)現(xiàn)更合適的模型。
過度擬合是指在識(shí)別并擬合出我們認(rèn)為合適的模型之后,擬合一個(gè)更一般的模型,即一個(gè)“接近”的模型。該模型以原始模型為特例包容原始模型,如果額外參數(shù)的估計(jì)不顯著地不為零并且兩個(gè)模型共同參數(shù)的估計(jì)與原始估計(jì)相比沒有顯著的改變,則認(rèn)為原始模型合理。針對(duì)擬合出的ARIMA(1,1,1)和ARIMA(2,1,0)模型,本文選取包容它們的ARIMA(2,1,1)模型作為一個(gè)“接近”的模型,并進(jìn)行參數(shù)估計(jì),結(jié)果見表2。
方向系數(shù)估計(jì)值標(biāo)準(zhǔn)差X方向位移ar1 0.63140.1262ar2-0.04040.0602ma1-0.77200.1177^σ2=0.4435,P=-434.36,AIC=874.72Y方向位移ar1 0.45680.0600ar20.10490.0560ma1-0.92650.0340^σ2=0.5138,P=-466.32,AIC=938.65
注:P為似然對(duì)數(shù)值。
從表2可以看出,對(duì)于X方向位移的時(shí)間序列,新增的參數(shù)ar2估值為-0.040 4,并不顯著,并且過度擬合的參數(shù)標(biāo)準(zhǔn)差都有所增大,AIC值也明顯增大。因此,認(rèn)為ARIMA(2,1,1)模型對(duì)X方向位移是過度參數(shù)化的,ARIMA(1,1,1)模型更加合理。對(duì)于Y方向位移的時(shí)間序列,新增的參數(shù)ma1估值為-0.926 5,非常顯著,AIC值也明顯變小,因此判斷ARIMA(2,1,1)模型是更合理的。其殘差檢核結(jié)果如圖7所示,可以看出結(jié)果是優(yōu)于原ARIMA(2,1,0)模型的。
利用前430個(gè)X和Y方向的位移數(shù)據(jù)分別建立了合理的ARIMA模型,然后向后預(yù)測(cè)20步,與實(shí)測(cè)數(shù)據(jù)的結(jié)果對(duì)比,對(duì)比結(jié)果如圖8所示。圖8中黑色實(shí)心點(diǎn)為預(yù)測(cè)值,十字標(biāo)記為實(shí)測(cè)數(shù)據(jù)值,上下虛線為95%預(yù)測(cè)極限??梢钥闯鰞蓚€(gè)時(shí)間序列的預(yù)測(cè)值變化都很平滑并逐漸趨近于一個(gè)均值,預(yù)測(cè)值的變化趨勢(shì)和實(shí)測(cè)數(shù)據(jù)大致一致,且實(shí)測(cè)數(shù)據(jù)值都在預(yù)測(cè)值的95%預(yù)測(cè)極限之內(nèi),預(yù)測(cè)結(jié)果較好。
本文使用2016年6月29日—2017年10月4日共461 d的邊坡監(jiān)測(cè)數(shù)據(jù)進(jìn)行時(shí)間序列分析。首先利用圖示法、ADF檢驗(yàn)和PP檢驗(yàn)分析了數(shù)據(jù)的平穩(wěn)性,發(fā)現(xiàn)X方向和Y方向位移的時(shí)間序列并不平穩(wěn),然后通過一階差分得到了平穩(wěn)的時(shí)間序列,再利用ACF、PACF、EACF和BIC的結(jié)果來識(shí)別ARIMA模型的階數(shù),對(duì)X方向位移得到了ARIMA(1,1,1)模型,對(duì)Y方向位移得到了ARIMA(2,1,0)模型,并使用CSS-ML方法進(jìn)行了參數(shù)估計(jì)。隨后利用殘差分析和過度擬合的方法進(jìn)行了模型評(píng)價(jià),發(fā)現(xiàn)X方向位移的ARIMA模型符合標(biāo)準(zhǔn),通過檢驗(yàn),而Y方向位移的ARIMA模型則應(yīng)該擴(kuò)展為ARIMA(2,1,1)。最后利用前430個(gè)數(shù)據(jù)的模型預(yù)測(cè)了之后的31個(gè)數(shù)據(jù),與實(shí)測(cè)數(shù)據(jù)符合較為理想。因此,通過ARIMA模型對(duì)邊坡監(jiān)測(cè)數(shù)據(jù)進(jìn)行時(shí)間序列建模是一種有效的分析和預(yù)測(cè)手段,對(duì)工程施工和防災(zāi)減災(zāi)具有重大意義。