吳福成 陳 偉 繆 丹 葉建新 曾綺琪 聶竹林 王鳳之
(1 廣州廣檢建設(shè)工程檢測(cè)中心有限公司)
(2 廣東省建筑物健康監(jiān)測(cè)與安全預(yù)警工程技術(shù)研究中心)
改革開放以來,深基坑工程數(shù)量及基坑開挖深度遞增,且大多出現(xiàn)在城市繁華地區(qū)。基坑影響因素多,施工難度大,給城區(qū)帶來許多安全問題。因此,有必要對(duì)深基坑變形進(jìn)行安全監(jiān)測(cè),并對(duì)深基坑位移進(jìn)行預(yù)測(cè)分析,做到提前預(yù)警,提供充分時(shí)間處理危險(xiǎn)基坑。在過去,由于監(jiān)測(cè)數(shù)據(jù)不足,深基坑變形預(yù)測(cè)效果不佳。隨著廣東省住房和城鄉(xiāng)建設(shè)廳新出臺(tái)的《基坑工程自動(dòng)化監(jiān)測(cè)技術(shù)規(guī)范》(DBJ_T 15-185-2020)[1],自動(dòng)化監(jiān)測(cè)技術(shù)的規(guī)范和提高為深基坑變形預(yù)測(cè)數(shù)據(jù)的大量收集提供了實(shí)現(xiàn)條件。由于影響基坑變形的因素有很多,目前,研究人員傾向于用SCM 法代替繁瑣的理論分析法和需要模擬實(shí)際情況的有限元數(shù)值模擬法來完成深基坑位移預(yù)測(cè)任務(wù)[2]。根據(jù)研究者對(duì)基坑位移預(yù)測(cè)所制作的數(shù)據(jù)集不同,基坑位移預(yù)測(cè)可以大致分成兩類,一類是根據(jù)類似基坑資料進(jìn)行的預(yù)測(cè),另一類是根據(jù)已監(jiān)測(cè)數(shù)據(jù)進(jìn)行的預(yù)測(cè)。前者是根據(jù)已開挖的類似工程概況的數(shù)據(jù)建立數(shù)據(jù)集,進(jìn)行位移預(yù)測(cè);后者是根據(jù)同一基坑前期監(jiān)測(cè)得到的位移數(shù)據(jù)建立數(shù)據(jù)集,進(jìn)行位移預(yù)測(cè),大部分預(yù)測(cè)模型針對(duì)后者[3]。
基于軟計(jì)算深基坑位移預(yù)測(cè)模型使用的機(jī)器學(xué)習(xí)算法有灰色模糊[4],時(shí)間序列回歸[5],卡爾曼濾波[6],SVM[7],RF[8],ANN[9-11]以及使用遺傳優(yōu)化混合預(yù)測(cè)算法[4,12-15]等。其中,基于灰色模糊預(yù)測(cè)和時(shí)間序列預(yù)測(cè)方法僅僅適用于短期預(yù)測(cè),卡爾曼濾波在數(shù)據(jù)處理上運(yùn)用較多,三者均僅能按照其時(shí)序變化進(jìn)行回歸預(yù)測(cè),無法分析多個(gè)因素造成的位移變化。而基于SVM、RF、ANN 等預(yù)測(cè)模型屬于有監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,不僅其基坑變形預(yù)測(cè)精度較高,還能分析對(duì)位移造成影響的多個(gè)因素。
支持向量機(jī)應(yīng)用廣泛,由于能夠進(jìn)行線性和非線性的預(yù)測(cè)回歸以及異常值測(cè)量等任務(wù),部分學(xué)者利用SVM進(jìn)行基坑變形預(yù)測(cè)估計(jì)。利用SVM 進(jìn)行分類任務(wù),是在兩個(gè)類別間尋找盡量大的間距,而預(yù)測(cè)回歸任務(wù)則是在限制了間距大小情形下,盡量放置更多的樣本到間隔上[16]。隨機(jī)森林是由多個(gè)決策樹預(yù)測(cè)模型使用Bagging 或pasting 算法融合得到。同支持向量機(jī)一樣,決策樹既可以用于分類任務(wù)也可以用于回歸任務(wù)。林楠[8]等建立了SVM 和RF 深基坑位移預(yù)測(cè)模型,通過一個(gè)實(shí)際樁頂水平位移預(yù)測(cè)算例,得出RF 深基坑位移預(yù)測(cè)模型精度更高的結(jié)論。ANN 法是深基坑位移預(yù)測(cè)中使用較多的機(jī)器學(xué)習(xí)算法[17]。常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有前饋神經(jīng)網(wǎng)絡(luò),反饋神經(jīng)網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)[18]。神經(jīng)網(wǎng)絡(luò)算法的優(yōu)點(diǎn)是具有良好魯棒性,可以容許一定數(shù)據(jù)誤差。并且神經(jīng)網(wǎng)絡(luò)算法具有極強(qiáng)非線性映射能力,可以自動(dòng)逼近任何非線性數(shù)學(xué)函數(shù),尤其在變量關(guān)系未知復(fù)雜,難以統(tǒng)計(jì)處理的情況下[19]。然而,對(duì)于使用人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)基坑位移,確定神經(jīng)網(wǎng)絡(luò)模型中的超參數(shù)是建立人工神經(jīng)網(wǎng)絡(luò)模型中最重要也是最困難的任務(wù)[2]。數(shù)據(jù)量過少,而神經(jīng)網(wǎng)絡(luò)架構(gòu)過于復(fù)雜會(huì)導(dǎo)致過擬合。確定神經(jīng)網(wǎng)絡(luò)模型,首先需要確定輸入層、輸出層的神經(jīng)元個(gè)數(shù)。其次是隱藏層層數(shù)以及每層隱藏層神經(jīng)元個(gè)數(shù)。在深基坑位移預(yù)測(cè)任務(wù)中,輸入層的神經(jīng)元個(gè)數(shù)由考慮影響基坑變形因素個(gè)數(shù)決定,而輸出層的神經(jīng)元個(gè)數(shù)由輸出基坑變形個(gè)數(shù)決定。然而,目前為止仍舊沒有一個(gè)統(tǒng)一的理論來確定一個(gè)最佳的神經(jīng)網(wǎng)絡(luò)模型,只能通過前人經(jīng)驗(yàn)以及不斷試驗(yàn)確認(rèn)預(yù)測(cè)成績(jī)相對(duì)較優(yōu)的神經(jīng)網(wǎng)絡(luò)模型。另外一些研究者指出人工神經(jīng)網(wǎng)絡(luò)收斂速度較慢,數(shù)據(jù)集制作或超參數(shù)設(shè)置不合理容易局部?jī)?yōu)化,導(dǎo)致預(yù)測(cè)結(jié)果誤差較大等問題。利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)基坑變形有多種模型,不同的神經(jīng)網(wǎng)絡(luò)架構(gòu)和超參數(shù)設(shè)置講影響基坑變形的預(yù)測(cè)結(jié)果。用于預(yù)測(cè)基坑變形的常用神經(jīng)網(wǎng)絡(luò)架構(gòu)有傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)[20]、RBF 神經(jīng)網(wǎng)絡(luò)[21]、廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)[11]、Elman 神經(jīng)網(wǎng)絡(luò)[10]和LSTM 神經(jīng)網(wǎng)絡(luò)[22]。其中,BP 和RBF 神經(jīng)網(wǎng)絡(luò)屬于前饋網(wǎng)絡(luò),廣義回歸、Elman 和LSTM 神經(jīng)網(wǎng)絡(luò)屬于反饋神經(jīng)網(wǎng)絡(luò)。為了提高人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度,研究者常常會(huì)結(jié)合其他機(jī)器學(xué)習(xí)算法,秦勝伍[23]等使用了Stacking 算法將ANN、SVM、RF 預(yù)測(cè)模型進(jìn)行了模型融合,得到了精度更高的位移預(yù)測(cè)模型;Liu[24]等先采用小波變換對(duì)變形數(shù)據(jù)進(jìn)行了去噪處理,再結(jié)合灰色預(yù)測(cè)算法與BP 神經(jīng)網(wǎng)絡(luò)對(duì)某深基坑變形進(jìn)行了預(yù)測(cè);Hong 使用了BP 神經(jīng)網(wǎng)絡(luò)、基于遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)、外源輸入非線性自回歸(Based on the nonlinear autoregressive with exogeneous inputs,NARX)神經(jīng)網(wǎng)絡(luò)和Elman 神經(jīng)網(wǎng)絡(luò)構(gòu)建4 種不同的人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)施工過程中監(jiān)測(cè)到的混凝土支架軸力、基坑沉降和開挖墻水平位移進(jìn)行了預(yù)測(cè),得出了基于遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行位移預(yù)測(cè)效果最優(yōu)的結(jié)論[25];Zhan也使用了小波變換對(duì)采集到的位移數(shù)據(jù)進(jìn)行了去噪處理,基于Elman-Markov 模型,提出了一種預(yù)測(cè)深海區(qū)深基坑地表沉降的新方法并利用馬爾可夫鏈模型對(duì)預(yù)測(cè)值進(jìn)行修正,實(shí)現(xiàn)了深海分區(qū)深基坑地表沉降的高精度預(yù)測(cè)[26]。
為后期預(yù)測(cè)模型算法選擇和進(jìn)一步預(yù)測(cè)模型算法優(yōu)化研究提供定量依據(jù),基于某深基坑實(shí)際工程公開位移數(shù)據(jù)進(jìn)行了位移預(yù)測(cè)試驗(yàn)。使用了目前流行的6 個(gè)基于有監(jiān)督機(jī)器學(xué)習(xí)的軟計(jì)算法預(yù)測(cè)模型,分別為基于SVM、RF、BP、RBF、LSTM、Elman 位移預(yù)測(cè)模型,對(duì)深基坑位移進(jìn)行了一至三天位移預(yù)測(cè)分析,并通過模型預(yù)測(cè)值精度分析,得出了基于Elman 神經(jīng)網(wǎng)絡(luò)的深基坑位移預(yù)測(cè)模型適用于一天和兩天深基坑位移預(yù)測(cè),基于BP 神經(jīng)網(wǎng)絡(luò)的深基坑位移模型在三天位移預(yù)測(cè)應(yīng)用中較為合適的結(jié)論。
通常用來的評(píng)價(jià)基坑位移預(yù)測(cè)模型精度指標(biāo)有四個(gè),分別為平均偏差誤差、平均絕對(duì)誤差、均方誤差、均方根誤差。
⑴平均偏差誤差(Mean Bias Error,MBE):預(yù)測(cè)值與真實(shí)值差的均值,如公式⑴示。MBE 表示考慮了方向的預(yù)測(cè)值的平均誤差幅度。在評(píng)價(jià)基坑位移預(yù)測(cè)模型時(shí),MBE 適宜小于0 說明預(yù)測(cè)值大于實(shí)測(cè)值,避免預(yù)測(cè)的基坑位移過小無法起到預(yù)警作用。另外,MBE 的絕對(duì)值越小表示預(yù)測(cè)模型精度越高。
式中,
yi——真實(shí)值即基坑位移實(shí)測(cè)值;
y^i——預(yù)測(cè)值;
n——數(shù)據(jù)個(gè)數(shù)。
⑵平均絕對(duì)誤差(Mean Absolute Error,MAE):預(yù)測(cè)值與真實(shí)值差的絕對(duì)值的均值,如公式⑵所示。表示預(yù)測(cè)值的平均誤差幅度,但不需要考慮誤差的方向。MAE越低,表示預(yù)測(cè)模型精度越高。
⑶均方誤差(Mean Square Error,MSE):預(yù)測(cè)值與真實(shí)值差的平方與測(cè)試樣本數(shù)量的比值,如公式⑶所示。對(duì)比MAE,MSE 對(duì)異常值更敏感。MSE 越低,表示預(yù)測(cè)模型精度越高。
⑷均方根誤差(Root Mean Square Error,RMSE):預(yù)測(cè)值與真實(shí)值差的平方與測(cè)試樣本數(shù)量比值的平方根,如公式⑷所示。RMSE 是MSE 的平方根,可以從單位度量上衡量模型的效果。RMSE 越低,表示預(yù)測(cè)模型精度越高。
為探究基于SVM、RF、BP、RBF、LSTM、Elman 等有監(jiān)督機(jī)器學(xué)習(xí)算法的預(yù)測(cè)模型的基坑位移預(yù)測(cè)性能,分別基于上述方法建立合適的預(yù)測(cè)模型,使用鄭加柱[6]公開的某地鐵車站基坑周邊建筑物形變監(jiān)測(cè)點(diǎn)的累計(jì)沉降量與開挖深度進(jìn)行位移預(yù)測(cè)試驗(yàn)。該項(xiàng)目基坑的基本情況見文獻(xiàn)6。
為了更加深入探究各個(gè)預(yù)測(cè)模型的深基坑位移預(yù)測(cè)性能,試驗(yàn)使用動(dòng)態(tài)預(yù)測(cè)方案,借助前三天的基坑開挖深度與累計(jì)沉降量,分別預(yù)測(cè)一天、兩天和三天的深基坑累計(jì)沉降量。公開數(shù)據(jù)的采集時(shí)間為2007 年6 月1 日至2007 年6 月19 日(原始沉降監(jiān)測(cè)數(shù)據(jù)見表1),按照上述動(dòng)態(tài)預(yù)測(cè)方案,公開沉降監(jiān)測(cè)數(shù)據(jù)集一共含有16 個(gè)數(shù)據(jù)。數(shù)據(jù)集的輸入如表2 所示,每次輸入3 個(gè)基坑開挖深度數(shù)據(jù)與連續(xù)3 天累計(jì)沉降量數(shù)據(jù),共6 個(gè)。由于數(shù)據(jù)較少,使用驗(yàn)證集驗(yàn)證并測(cè)試,不額外劃分測(cè)試集。6 個(gè)模型的訓(xùn)練和驗(yàn)證使用相同的數(shù)據(jù)集,訓(xùn)練集與驗(yàn)證集的劃分比例為7:3,即前11 個(gè)數(shù)據(jù)為訓(xùn)練集數(shù)據(jù),其余為驗(yàn)證集數(shù)據(jù)。
表1 沉降監(jiān)測(cè)公開數(shù)據(jù)
表2 沉降數(shù)據(jù)集輸入
根據(jù)所需預(yù)測(cè)天數(shù),制作數(shù)據(jù)集標(biāo)簽值。預(yù)測(cè)一天、兩天和三天的累計(jì)沉降量的每個(gè)數(shù)據(jù)標(biāo)簽值以及對(duì)應(yīng)模型試驗(yàn)結(jié)果輸出值分別為1、2、3 個(gè),制作的沉降數(shù)據(jù)集標(biāo)簽見表3。為了綜合測(cè)試比較6 個(gè)預(yù)測(cè)模型的預(yù)測(cè)性能,進(jìn)行了沉降模型精度分析,分別計(jì)算了6 個(gè)模型得到的訓(xùn)練集、驗(yàn)證集預(yù)測(cè)結(jié)果的RMSE、MAE 和MBE 三個(gè)精度指標(biāo)值。6 個(gè)模型預(yù)測(cè)基坑后一天沉降量、后兩天沉降量、后三天沉降量的精度指標(biāo)值分別如表4~表6 所示。
表3 沉降位移數(shù)據(jù)集標(biāo)簽
表4 為預(yù)測(cè)一天沉降模型精度各個(gè)指標(biāo)值,基于Elman 預(yù)測(cè)模型驗(yàn)證集的RMSE、MAE 最低,分別為0.255和0.233,預(yù)測(cè)效果較佳,但MBE 為正數(shù),說明模型預(yù)測(cè)的位移值較低;而基于LSTM 預(yù)測(cè)模型的RMSE、MAE 僅次于Elman 模型,且MBE 為負(fù)數(shù),預(yù)測(cè)性能較符合實(shí)際使用。表5 為預(yù)測(cè)兩天沉降模型精度各個(gè)指標(biāo)值,基于Elman 預(yù)測(cè)模型驗(yàn)證集的RMSE、MAE 也為最低,分別為0.184 和0.151,且MBE 為負(fù)數(shù),預(yù)測(cè)效果較為優(yōu)秀。表6 為預(yù)測(cè)三天沉降模型精度各個(gè)指標(biāo)值,基于BP 預(yù)測(cè)模型驗(yàn)證集的RMSE、MAE、MBE 均為最低,分別為0.257,0.202 和0.023,說明預(yù)測(cè)后三天沉降量使用BP預(yù)測(cè)模型更為適合。
表4 預(yù)測(cè)一天沉降模型精度分析
表5 預(yù)測(cè)兩天沉降模型精度分析
表6 預(yù)測(cè)三天沉降模型精度分析
為進(jìn)一步驗(yàn)證比較6 個(gè)模型預(yù)測(cè)沉降值效果,繪制了6 月4 日至6 月19 日6 個(gè)模型預(yù)測(cè)一、兩和三天沉降值對(duì)比圖,見圖1~圖3。其中,4 至15 日為訓(xùn)練集預(yù)測(cè)效果,16 至19 日為驗(yàn)證集預(yù)測(cè)效果。由圖1 可知,基于Elman 預(yù)測(cè)模型的預(yù)測(cè)沉降折線與實(shí)測(cè)值折線最為接近,說明精度指標(biāo)的可靠性,其預(yù)測(cè)效果確實(shí)較佳,驗(yàn)證集預(yù)測(cè)值較低,但在可接受范圍內(nèi)。而基于LSTM 預(yù)測(cè)模型預(yù)測(cè)沉降折線在訓(xùn)練集前期預(yù)測(cè)效果不佳。由圖2可知,Elman 預(yù)測(cè)模型的預(yù)測(cè)沉降折線與實(shí)測(cè)值折線較為近似,也在可接受范圍內(nèi)出現(xiàn)驗(yàn)證集預(yù)測(cè)值較低的情況。圖3 為6 個(gè)模型預(yù)測(cè)三天沉降值對(duì)比圖,基于BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)沉降折線與實(shí)測(cè)值折線最為靠近,且預(yù)測(cè)值結(jié)果符合實(shí)際需要,驗(yàn)證了預(yù)測(cè)后三天沉降量使用BP 預(yù)測(cè)模型更為適合的結(jié)論。
圖1 預(yù)測(cè)一天沉降值對(duì)比
圖2 預(yù)測(cè)兩天沉降值對(duì)比
圖3 預(yù)測(cè)三天沉降值對(duì)比
對(duì)基于SVM、RF、BP、RBF、LSTM、Elman 等有監(jiān)督機(jī)器學(xué)習(xí)算法的預(yù)測(cè)模型進(jìn)行了實(shí)際深基坑工程位移預(yù)測(cè)試驗(yàn),通過公開預(yù)測(cè)數(shù)據(jù)驗(yàn)證集的模型預(yù)測(cè)值精度分析?;贐P、Elman、LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)位移精度均高于其余預(yù)測(cè)模型,驗(yàn)證了人工神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。基于Elman 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在預(yù)測(cè)一天和兩天沉降任務(wù)中,驗(yàn)證集RMSE 和MAE 均為最小值,預(yù)測(cè)精度最高;但驗(yàn)證集MBE 為負(fù)值,預(yù)測(cè)值較實(shí)測(cè)值較低?;贐P 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在預(yù)測(cè)三天沉降任務(wù)中,驗(yàn)證集RMSE 和MAE 均為最小值,且驗(yàn)證集MBE 為負(fù)值,預(yù)測(cè)性能最優(yōu),適合基坑多天位移預(yù)測(cè)任務(wù)的結(jié)論。