王隆安,魏長(zhǎng)壽,張家威,王俊杰,李豪杰
(山東科技大學(xué),山東 青島 266590)
地鐵車(chē)站深基坑開(kāi)挖過(guò)程中最為重要的是其地下工程結(jié)構(gòu)形變監(jiān)測(cè)問(wèn)題,通過(guò)實(shí)測(cè)數(shù)據(jù)進(jìn)行形變分析、建模預(yù)測(cè)形變規(guī)律,是該類(lèi)問(wèn)題研究的重點(diǎn)。在已有的研究當(dāng)中,有AR模型、灰色模型、BP神經(jīng)網(wǎng)絡(luò)模型、遺傳算法等,都在形變擬合及預(yù)測(cè)問(wèn)題上得到了眾多應(yīng)用[1]。容靜等[2]使用改進(jìn)灰色模型,合理剔除數(shù)據(jù)噪聲,做出了地鐵隧道形變預(yù)測(cè)方法;孟慶年等[3]使用AR模型求出模型參數(shù),對(duì)工程形變作出預(yù)測(cè);郭張軍等[4]利用LSTM模型對(duì)大壩形變進(jìn)行預(yù)測(cè),證明其具有工程實(shí)用性。
在眾多學(xué)者的研究中,多數(shù)是單一模型的工程擬合,其研究不能剔除多余噪聲,少有組合模型的形變預(yù)測(cè),筆者發(fā)現(xiàn)ARIMA模型與時(shí)間序列特征相吻合,經(jīng)過(guò)差分后的形變數(shù)據(jù)平穩(wěn)性達(dá)標(biāo),但模型預(yù)測(cè)值略微偏大[5]。LSTM記憶神經(jīng)網(wǎng)絡(luò)對(duì)歷史數(shù)據(jù)有長(zhǎng)期依賴(lài)性,在時(shí)間序列的預(yù)測(cè)中具有很高的契合度,但模型容易出現(xiàn)過(guò)擬合。鑒于此,展開(kāi)ARIMA模型聯(lián)合優(yōu)化LSTM模型的研究,對(duì)數(shù)據(jù)進(jìn)行差分處理、參數(shù)定階、殘差擬合、數(shù)據(jù)還原等步驟,再與眾多模型進(jìn)行動(dòng)態(tài)過(guò)程發(fā)展態(tài)勢(shì)的量化比較分析,其在眾多模型中得出最優(yōu)解,合理擬合預(yù)測(cè)基坑形變,可以為相似工程提供一定參考。
ARIMA模型可劃分為三個(gè)部分,AR:自回歸;I:差分;MA:移動(dòng)平均[6-7]。ARIMA模型對(duì)數(shù)據(jù)有平穩(wěn)性和非白噪聲的要求[8],因此,需用差分法來(lái)實(shí)現(xiàn)序列的平穩(wěn)性操作。通過(guò)白噪聲P值確定差分階數(shù)。
在自回歸模型AR中,
(1)
式中,yt為當(dāng)前值;μ為常數(shù)項(xiàng);p為階數(shù);γi為自相關(guān)系數(shù);εt為誤差項(xiàng)。
移動(dòng)平均模型著重解決AR模型誤差項(xiàng)累加的精度問(wèn)題[9],通過(guò)移動(dòng)平均法剔除噪聲,消除隨機(jī)波動(dòng),在MA中,
(2)
式中,yt為當(dāng)前值;μ為常數(shù)項(xiàng);q為階數(shù);εt為誤差項(xiàng);θi為最優(yōu)參數(shù)(需求解)。
經(jīng)差分后,將AR與MA組合,即:
(3)
式(3)中各符號(hào)含義同式(1)、式(2)。
檢驗(yàn)自相關(guān)系數(shù)ACF,用于隨機(jī)變量與自身的比較。偏自相關(guān)系數(shù)PACF的檢驗(yàn),可以嚴(yán)格x(t)、x(t-k)之間的相關(guān)性。選出ACF和PACF大概范圍后,進(jìn)行熱力圖定階,其目的是選擇更簡(jiǎn)單模型[10-11]。
LSTM 是通過(guò)設(shè)置了三個(gè)“門(mén)”來(lái)實(shí)現(xiàn)對(duì)單元狀態(tài)的控制[9]。其中遺忘門(mén)決定了有多少數(shù)據(jù)會(huì)被記憶;輸入門(mén)決定了有多少數(shù)據(jù)會(huì)被輸入到單元狀態(tài)中;而輸出門(mén)則決定了單元狀態(tài)有多少會(huì)被輸入到輸出值當(dāng)中。單個(gè)單元內(nèi)部結(jié)構(gòu)圖如圖1所示。圖中用四個(gè)虛線框標(biāo)出了四個(gè)結(jié)構(gòu),從左到右分別為:遺忘門(mén)、輸入門(mén)、當(dāng)前單元狀態(tài)輸入部分的計(jì)算模塊、輸出門(mén)。
圖1 LSTM單元內(nèi)部結(jié)構(gòu)圖
LSTM 的訓(xùn)練算法流程與傳統(tǒng) RNN 的訓(xùn)練算法一致[12]:首先,求出各個(gè)神經(jīng)元的輸出值,再根據(jù)誤差反向傳播原理,得出各個(gè)神經(jīng)元的誤差項(xiàng),根據(jù)梯度下降原理對(duì)各個(gè)權(quán)重矩陣與參數(shù)進(jìn)行更新。通過(guò)對(duì)樣本數(shù)據(jù)的學(xué)習(xí),反復(fù)更新 LSTM 內(nèi)部的權(quán)重矩陣及參數(shù),直到網(wǎng)絡(luò)整體誤差達(dá)到標(biāo)準(zhǔn),進(jìn)而利用訓(xùn)練好的模型對(duì)數(shù)據(jù)進(jìn)行擬合預(yù)測(cè)。
首先,通過(guò)ARIMA建模后輸出預(yù)測(cè)值序列、殘差序列;然后,利用LSTM網(wǎng)絡(luò)對(duì)殘差序列建模,輸出新的殘差預(yù)測(cè)序列;最后,將新的殘差序列與ARIMA預(yù)測(cè)值序列組合,得到組合結(jié)果[13]。建模流程如圖2所示。
圖2 ARIMA-LSTM組合模型構(gòu)建方法圖
其中,LSTM采用指數(shù)衰減學(xué)習(xí)率算法,增強(qiáng)模型的泛化性;采用早停止策略,弱化隨機(jī)噪聲的影響,防止過(guò)擬合。其方法在實(shí)例應(yīng)用中給出。
某地鐵車(chē)站主體結(jié)構(gòu)位于綠地內(nèi),場(chǎng)地條件較好,樁頂水平位移監(jiān)測(cè)點(diǎn)使用徠卡TS15A1′R400全站儀觀測(cè),按《工程測(cè)量規(guī)范》(GB50026-2007)二等水平位移技術(shù)要求進(jìn)行。在眾多觀測(cè)點(diǎn)中選取位于主測(cè)斷面二上的測(cè)點(diǎn)ZQS06,從10.17~11.15共計(jì)23期數(shù)據(jù)進(jìn)行擬合和預(yù)測(cè)。
整個(gè)實(shí)驗(yàn)過(guò)程完全按照程序設(shè)計(jì)與應(yīng)用流程表展開(kāi),如表1所示。
表1 程序設(shè)計(jì)與應(yīng)用流程表
以測(cè)點(diǎn)ZQS06實(shí)驗(yàn)過(guò)程為例,選取該測(cè)點(diǎn)10.17~11.15共23期數(shù)據(jù),其測(cè)點(diǎn)位置及原始數(shù)據(jù)可視化如圖3、圖4所示。
圖3 ZQS06測(cè)點(diǎn)位置
圖4 原始數(shù)據(jù)可視化
可以看出數(shù)據(jù)類(lèi)型為時(shí)間序列,有些時(shí)段出現(xiàn)數(shù)據(jù)冗余,數(shù)據(jù)中間時(shí)段波動(dòng)較大,應(yīng)進(jìn)行數(shù)據(jù)預(yù)處理(差分、白噪聲檢驗(yàn)),處理結(jié)果如表2所示。
P-value越接近0越平穩(wěn)。由表2可知,進(jìn)行d=2二階差分,P-vaule=4.212 821e-7,白噪聲為7.933 47e-5,二階差分即可使原始數(shù)據(jù)的平穩(wěn)性達(dá)標(biāo)。
表2 差分、白噪聲結(jié)果
對(duì)二階差分序列做出ACF圖和PACF圖,得到p、q范圍,結(jié)果如圖5所示。
圖5 自相關(guān)與偏自相關(guān)分析
ACF和PACF都呈現(xiàn)拖尾,在ACF圖中,在1階位置就開(kāi)始基本落在置信區(qū)間內(nèi),且后方無(wú)過(guò)多噪聲點(diǎn),確定出q為1;在PACF圖中,在1階或2階位置就開(kāi)始基本落在置信區(qū)間內(nèi),且后方無(wú)過(guò)多噪聲點(diǎn),確定出p為1或2,由此可得(p,q)=(1,1)或(2,1)。
當(dāng)有多組備選參數(shù)可以選擇時(shí),根據(jù)AIC值進(jìn)行模型參數(shù)的選擇,通過(guò)衡量模型的復(fù)雜度來(lái)選擇更簡(jiǎn)單的模型,做出熱力圖如圖6所示,完成最終定階。
圖6 熱力圖定階
在熱力圖中,圖塊數(shù)值為AIC值,橫縱坐標(biāo)的選取原則為AIC值越小模型精度越高,選取盡量黑色的區(qū)域即為p、q最合適取值,結(jié)合偏自相關(guān)函數(shù)所確定的p、q值的范圍最終確定為:p=1,q=1。
數(shù)據(jù)經(jīng)二階差分處理后其穩(wěn)定性如圖7所示,差分值穩(wěn)定在(-1.5,1.5)之間,均值趨于0附近,結(jié)合表2可知,差分值P-vaule=4.212 821e-7,白噪聲為7.933 47e-5,數(shù)據(jù)趨于平穩(wěn),無(wú)較大波動(dòng),已符合平穩(wěn)序列要求。
圖7 二階差分穩(wěn)定性分析
至此,確定為ARIMA(1,2,1)模型,將差分?jǐn)?shù)據(jù)喂入模型,畫(huà)出殘差圖,如圖8所示,對(duì)模型精度進(jìn)行評(píng)估。
圖8 模型殘差圖
殘差均值接近0且方差滿(mǎn)足正態(tài)分布,模型精度符合要求。將殘差序列喂入LSTM模型,LSTM模型采用均方誤差計(jì)算誤差,選擇“Adam”優(yōu)化器,迭代次數(shù)選擇1 000次,網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示。
圖9 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
LSTM輸出預(yù)測(cè)殘差序列,聯(lián)合ARIMA的擬合值,得到最終序列,與LSTM模型、GM(1,1)模型、MLP多層感知器及原始數(shù)據(jù)做出動(dòng)態(tài)過(guò)程發(fā)展態(tài)勢(shì)量化比較分析,如圖10所示。
圖10 ZQS06模型擬合對(duì)比分析
計(jì)算得出,ARIMA模型的RMSE誤差相比于LSTM模型降低了15%,因此,先用ARIMA模型預(yù)測(cè)殘差符合邏輯與實(shí)際。由圖10可知,單一LSTM模型擬合值整體偏低;GM(1,1)模型基本保持單調(diào)上升的趨勢(shì),不適合非指數(shù)型序列的預(yù)測(cè);MLP模型有些時(shí)段噪聲過(guò)大;ARIMA-LSTM組合模型始終隨著觀測(cè)數(shù)據(jù)的變化而變化,且二者的數(shù)值十分接近。相較于單一LSTM模型、GM(1,1)模型和MLP模型,優(yōu)化ARIMA-LSTM組合模型可以挖掘相隔較長(zhǎng)時(shí)間數(shù)據(jù)的關(guān)聯(lián)性,對(duì)此基坑形變規(guī)律的適應(yīng)性更強(qiáng)。
本文挖掘ARIMA對(duì)于時(shí)間序列的優(yōu)勢(shì),結(jié)合深度學(xué)習(xí)優(yōu)化LSTM記憶神經(jīng)網(wǎng)絡(luò)對(duì)歷史數(shù)據(jù)記憶的優(yōu)點(diǎn),將兩者結(jié)合建立了優(yōu)化ARIMA-LSTM組合模型,采用該模型應(yīng)用于地鐵基坑形變預(yù)測(cè),結(jié)果表明:MLP多成傳感器、GM(1,1)等模型單一預(yù)測(cè)精度較低,優(yōu)化ARIMA-LSTM組合模型能充分利用兩種單一預(yù)測(cè)模型各自的優(yōu)勢(shì),在中長(zhǎng)期的基坑形變規(guī)律擬合及預(yù)測(cè)中,該組合模型預(yù)測(cè)精度更高,繼而可以作為該工程的預(yù)測(cè)模型來(lái)進(jìn)行后續(xù)的研究分析。