孟慶成,李明健,胡 壘,萬 達,吳浩杰,齊 欣
(1. 西南石油大學 土木工程與測繪學院,四川 成都 610500; 2. 西南交通大學 土木工程學院,四川 成都 610031)
截止2020年年底,我國已建成公路橋梁總長6 628.55萬m,共計91.28萬座。數量眾多的橋梁受到各種情況及降雨、降雪和溫差等環(huán)境因素的綜合影響,會出現變形現象。橋梁變形超過一定限值將會對橋梁結構造成損傷,并導致承載力降低等病害出現。因此,為保障橋梁運營安全性和耐久性,建立高精度的橋梁變形預測模型十分有必要[1],這對橋梁結構安全狀態(tài)預警有著重大意義。
近年來,隨著人工智能發(fā)展,運用智能化手段開展橋梁結構狀態(tài)和安全評估成為橋梁健康監(jiān)測的發(fā)展趨勢[2]。國內外學者展開了大量研究,陳國良等[3]通過搭建差分整合移動平均自回歸模型(ARIMA)來預測橋梁撓度,并以黃岡長江大橋進行了實例驗證;鄭棟等[4]采用基于Bayesian理論的融合方法,根據歷史監(jiān)測數據對路堤沉降進行了預測;WANG Xudong等[5]基于融合思維進化算法(MEC)和反向傳播算法(BP),建立了優(yōu)化神經網絡模型,并通過CSWs-PC橋的實例,驗證了該模型比傳統(tǒng)BP神經網絡更優(yōu)的預測性能;吳杰等[6]利用小波神經網絡(WNN)預測了橋梁橫向位移,僅用少量的監(jiān)測數據訓練就取得了較好的預測結果;欒元重等[7]基于RBF神經網絡模型預測了橋梁變形,獲得了較高的短期預測精度;WANG Hao等[8]采用改進后的Bayesian模型,準確預測了由溫度引起的橋梁結構響應;田壯等[9]建立了斜拉橋有限元模型,并以有限元模擬結果為訓練數據,搭建了BP神經網絡模型預測結構變形響應,準確率均超過90%。然而上述預測模型均屬于靜態(tài)模型,忽略了結構變形動態(tài)本質,模型在訓練時沒有連接到不同時刻的變形狀態(tài),限制了預測精度的進一步提升[10]。
當前用于時間序列數據的動態(tài)預測模型主要是基于循環(huán)神經網絡(RNN)建立的[11],長短期記憶神經網絡(LSTM)作為一種特殊的RNN,可有效解決傳統(tǒng)RNN在處理實際問題中因數據時效性等不足的缺陷。LSTM具備強大的非線性處理、學習和記憶能力,在處理長時間序列數據預測中具有顯著優(yōu)勢,可廣泛運用于各種時序數據預測[12]。橋梁結構變形具有復雜性和多尺度性,采用單一模型預測難以充分挖掘橋梁變形響應在不同尺度分量的特征,存在較多局限,而采用組合模型能實現不同方法的信息整合,可提高模型精度、穩(wěn)定性和適用性。因此筆者提出了一種結合集合經驗模態(tài)分解 (EEMD)和長短期記憶神經網絡的(LSTM)方法,通過建立EEMD-LSTM橋梁變形組合預測模型,以武漢沌口長江大橋為實例進行分析,驗證該方法的有效性。
經驗模態(tài)分解法(EMD)可將任意時間序列信號中的不同尺度分量依次分解,產生多組尺度特征互異的數據序列,每組數據序列都是一個本征模態(tài)函數(IMF)[13]。
集合經驗模態(tài)分解法(EEMD)是EMD的改進方法。首先對輸入信號中加入白噪聲,再進行EMD分解,將多次分解后IMF分量對應求均值[14],并給定一個原始輸入信號x(t),EEMD處理過程如圖1。
圖1 EEMD分解時間序列信號流程Fig. 1 EEMD decomposition time series signal flow chart
EEMD在分解時間序列信號時添加了白噪聲,可消除EMD分解時的模態(tài)混疊問題,且保證了最終分解結果在物理上的唯一性。加入時間序列信號的白噪聲均勻分布且均值為0,多次平均處理后會相互抵消,不會對真實時間序列信號結果造成影響。其分解過程如下:
1)原始時間序列信號x(t)加入符合正態(tài)分布的高斯白噪聲ni(t),形成新的時間序列信號xi(t),其計算如式(1):
xi(t)=x(t)+ni(t)
(1)
式中:i為增加的白噪聲次數。
(2)
3)重復以上兩個步驟N次,并將各對應的IMF分量相加再求均值,如式(3):
(3)
4)最終原始時間序列信號x(t)經過EEMD分解后可表示為:
(4)
循環(huán)神經網絡(RNN)與傳統(tǒng)的人工神經網絡(ANN)隱藏層節(jié)點間的連接結構不同。人工神經網絡(ANN)隱藏層間的節(jié)點相互獨立,循環(huán)神經網絡(RNN)在隱藏層的鄰近節(jié)點間相互連接,RNN和ANN結構對比如圖2。RNN隱藏層節(jié)點不僅要接收輸入節(jié)點信息,還要接收上一個隱藏節(jié)點的輸入信息,由于其特殊的網絡結構,RNN可對歷史信息進行存儲,具備記憶功能,可將存儲的歷史信息用于輸出計算,因此RNN在預測時間序列數據時具備很大優(yōu)勢[15]。
圖2 RNN和ANN結構對比Fig. 2 Structure diagram comparison of RNN and ANN
RNN在實際處理長時間序列問題時,存在數據時效性等局限性,長短期記憶神經網絡(LSTM)可很好彌補RNN在處理長序列問題的不足[16]。LSTM可將遺忘門、輸入門、輸出門和記憶單元組成特定結構來替代RNN中的隱藏層神經元,這個結構可讓LSTM有選擇性地篩選狀態(tài)信息、控制信息傳遞,極大提升了處理長時間序列問題的性能。LSTM基本單元結構如圖3。
圖3 LSTM基本單元結構示意Fig. 3 Structure diagram of LSTM basic unit
筆者以第2個基本單元為例,xt為t時刻網絡的輸入;ht為t時刻網絡的輸出;ct-1為t-1時刻單元的狀態(tài);ct為t時刻單元的狀態(tài);tanh為雙曲正切函數,可將數值映射到[-1, 1];σ為Sigmoid激活函數,可將數值映射到[0, 1],其中0表示歷史信息全部丟棄,1表示歷史信息全部保留。LSTM模型關鍵在于基本單元間狀態(tài)的傳遞,通過3個門的組合來控制信息輸入及輸出,決定單元狀態(tài)[17]。3個門限結構具體計算過程為
ft=σ(Wfxxt+Wfhht-1+bf)
(5)
it=σ(Wixxt+Wihht-1+bi)
(6)
Ot=σ(WOxxt+WOhht-1+bO)
(7)
式中:ft、it、Ot分別為遺忘門、輸入門、輸出門在t時刻的輸出結果向量;Wfx、Wix、WOx分別為遺忘門、輸入門、輸出門的輸入和隱藏節(jié)點權值矩陣;Wfh、Wih、WOh分別為遺忘門、輸入門、輸出門的隱藏和輸出節(jié)點的權值矩陣;bf、bi、bO分別為遺忘門、輸入門、輸出門的偏置向量。
橋梁在運營過程中受汽車荷載、風荷載及溫度等因素綜合作用,不同的作用時間、作用周期和影響因素存在差異,因此橋梁結構變形響應存在多尺度效應。針對橋梁變形響應特性,筆者將EEMD分解算法和LSTM網絡融合,提出了一種EEMD-LSTM的橋梁變形組合預測模型。從布置于橋梁結構上的多個監(jiān)測傳感器獲取環(huán)境信息和變形數據,對數據信息進行整理和預處理,使其滿足模型的數據格式要求并剔除異常數據。EEMD算法將變形時間序列依次分解成不同尺度特征的IMF分量和一個剩余分量Res,再搭建LSTM模型提取各變形分量特征并預測其發(fā)展趨勢,然后重構各分量預測值并疊加求和,所得結果即為模型預測變形值,最后對模型預測精度進行評價。EEMD-LSTM預測技術路線如圖4。
圖4 EEMD-LSTM模型技術路線Fig. 4 EEMD-LSTM model technology roadmap
均方根誤差RMSE(ERMS)、平均絕對誤差MAE(EMA)、平均絕對百分誤差MAPE(EMAP)和決定系數(R2)是評價時間序列數據預測效果的重要指標。ERMS表征預測值偏離實測值程度;EMA表征預測誤差實際情況;EMAP表征絕對百分比誤差平均大小;R2表征模型擬合精度。其中:R2越接近1,ERMS、EMA和EMAP越小,模型預測精度越高。各評價指標計算為:
(8)
(9)
(10)
(11)
武漢沌口長江大橋是長江首座按照雙向八車道設計的特大公路橋。該橋于2014年12月動工建設,2017年12月正式運營,橋梁全長8.599 km,橋面全寬46 m,設計速度為100 km/h;主橋為雙塔雙索面斜拉橋,采用PK斷面鋼箱梁,主塔高233.7 m,采用鉆石型結構,斜拉索選用204根平行鋼絲斜拉索,極限強度為1 760 MPa,呈扇形布置;主橋為半漂浮結構體系,全長1.51 km,最高通航水位和最低同行水位分別為26.81、10.17 m;根據橋址地形地質條件、通航要求、結構合理以及經濟等要求,選用(100 + 275 + 760 + 275 + 100)m的跨徑組合[18]。橋梁立面布置如圖5。
圖5 武漢沌口長江大橋立面布置(單位:m)Fig. 5 Elevation of Wuhan Zhuankou Yangze River Bridge
該橋建成運營后的健康監(jiān)測內容包括主梁撓度、溫度、斜拉索索力、風向風速、傾角、主塔應變和橋梁動力特性等。筆者選取2021年5月1日—2021年5月31日的橋梁跨中撓度和環(huán)境監(jiān)測數據作為數據集,監(jiān)測周期為1 h,共744組數據。每組數據包括橋塔塔頂和橋梁跨中截面處的溫度、濕度、風向、風速及橋梁跨中位置撓度變形數據,部分監(jiān)測數據如表1。
表1 武漢沌口長江大橋變形監(jiān)測數據Table 1 Deformation monitoring data of Wuhan Zhuankou Yangze River Bridge
對獲取數據進行如下預處理:
1)歸一化處理:橋梁變形數據和環(huán)境參數量綱和大小有較大差異,原始數據直接用于模型訓練會影響模型的計算效率,故需要對數據進行歸一化處理,將數據范圍映射到[0, 1],再輸入網絡模型訓練時可加快其收斂速度,其計算如式(12):
(12)
式中:x為原始變形數據;xmin、xmax分別為變形數據最小值、最大值;x′為歸一化計算后的結果。
在歸一化處理過程中,異常值不會對歸一化結果造成影響,但為避免對預測精度造成影響,在后續(xù)工作中會對其識別并剔除。
2)孤立森林算法(iForest)降噪:該算法適用于時間序列數據的異常檢測,基本思想是把異常數據歸結為“少量和不同”,即異常數據只占全部數據的少許比例,且異常數據特征與前后正常數據特征有較大差異。iForest算法原理是用隨機特征的超平面對數據進行切割成兩個子數據空間,再分別對各子數據空間進行切割,循環(huán)進行上述步驟直到每個數據空間僅包含單個數據時停止切割,由此形成孤立樹,根據僅包含一個數據葉子結點x到根節(jié)點路徑長度h(x)來計算異常分值,進而判斷數據是否存在異常。其計算如式(13)~式(15)。
(13)
c(n)=2H(n-1)-[2(n-1)/n]
(14)
H(i)=lni+0.577
(15)
式中:s(x,n)為異常分值,s(x,n)越接近1說明存在異常數據可能性越高,若測試數據在0.5左右,則說明全部數據沒有明顯異常值;E[h(x)]為待檢測數據x在孤立森林中的平均路徑長度;c(n)用于對路徑長度h(x)的標準化。
在橋梁變形監(jiān)測中,難免會出現通訊信號干擾、傳感器數據漂移等情況,這會導致監(jiān)測數據存在異常值。為消除異常數據干擾,筆者引用孤立森林算法進行檢測并處理變形異常數據;變形時間序列共檢測出19組異常值(圖6),對異常數據進行剔除。
圖6 變形時間序列異常點檢測結果Fig. 6 Abnormal point detection results of deformation time series
3)數據集劃分:原始變形時序數據剔除掉19組異常值后還剩余725組,選取前675組數據作為訓練集,后50組數據作為測試集。訓練集用于參與模型參數和權重更新;測試集用于評價模型預測精度高低,判斷模型的泛化能力。
3.3.1 EEMD分解變形時間序列
橋梁結構變形響應存在多尺度效應,為充分挖掘不同時間尺度的變形響應特征,獲得其演變趨勢規(guī)律,筆者采用EEMD對橋梁變形時間序列進行多尺度分解,為提升模型泛化能力,向剔除異常數據后的橋梁變形時間序列加入均勻分布白噪聲。變形時間序列經EEMD自適應分解成9個IMF分量和1個剩余分量Res,如圖7。
圖7 EEMD分解變形時間序列結果Fig. 7 EEMD decomposition results of deformation time series
3.3.2 EEMD-LSTM模型分量預測
超參數和優(yōu)化器等對搭建的EEMD-LSTM模型預測結果有重大影響。為獲取最優(yōu)的預測精度,筆者設計了不同的超參數(神經元、批大小等)、回望窗口和優(yōu)化器進行組合。經模型驗證,當神經元為20個、批量大小為24、回望窗口為6及Adam優(yōu)化器的組合為最優(yōu)參數組合,此時EEMD-LSTM模型對不同尺度IMF分量和剩余分量Res的預測結果如圖8。對IMF分量和Res預測結果進行線性求和,再進行反歸一化處理即為橋梁變形的最終預測結果。
圖8 IMF分量和剩余分量Res預測結果Fig. 8 Prediction results of IMF and Res
為綜合比選各類算法變形預測效果,將EEMD-LSTM組合預測模型和單一Bayesian模型[19]、支持向量機SVM模型[20]、LSTM模型進行對比分析。其中:Bayesian模型誤差精度為5×10-4,超參數α1=α2=λ1=λ2=1×10-6;SVM模型核函數選linear,正則化系數c=1;LSTM模型采用和EEMD-LSTM模型相同的超參數組合。各模型變形預測結果對比如圖9。圖9中:Bayesian模型、SVM模型和LSTM模型都能較為準確地預測橋梁變形趨勢,但在變形發(fā)生突變時,這3種模型預測值和實測值存在一定誤差。相比于上述這3種模型,EEMD-LSTM模型不僅能很好地預測橋梁變形趨勢,且預測值和實測值數據非常契合,預測誤差更小,在預測過程中運行速度更迅速,魯棒性更好。
圖9 不同模型變形預測對比Fig. 9 Comparison of deformation prediction of different models
在相同實驗條件下,選取ERMS、EMA、EMAP和R2對各模型預測結果進行定量對比,如表2。由表2可知:LSTM模型變形預測精度高于SVM和Bayesian模型。對SVM和Bayesian模型而言,在模型訓練時只能學習當前時刻信息,無法連接不同時刻的變形狀態(tài),從而導致長期歷史信息會影響模型預測精度,限制了模型預測精度的進一步提升; LSTM模型訓練時能有選擇性地篩選狀態(tài)信息,對變形的歷史信息進行存儲并加以利用,在變形預測時能獲取前后關聯信息,能更好地處理時間序列數據。
表2 不同模型評價指標結果對比Table 2 Comparison of evaluation results of different models
EEMD-LSTM模型與Bayesian模型相比:ERMS、EMA和EMAP分別降低了56.86%、58.55%和59.22%,R2提升了20.14%;與SVM模型相比:ERMS、EMA和EMAP分別降低了55.53%、57.02%和58.61%,R2提升了18.51%;與LSTM模型相比:ERMS、EMA和EMAP分別降低了54.57%、56.50%和57.66%,R2提升了17.38%。EEMD-LSTM模型較其他3種模型在預測精度上有很大提升,這是因為橋梁變形具有多尺度特征,不同尺度變形分量波動特征不同,采用單一預測模型存在一定局限性,難以識別其差異性,這就造成預測精度難以進一步提升。采用EEMD-LSTM模型會先對橋梁變形序列在不同時間尺度上進行分解,再在不同時間尺度變形分量上提取變形特征,契合了橋梁變形的多尺度特性。與單一模型相比,EEMD-LSTM模型充分發(fā)揮了EEMD分解法和LSTM模型在處理時序數據上的優(yōu)勢,在面對新的變形序列時可獲得更加穩(wěn)定和精確的預測結果,提升了模型魯棒性和適用性。
針對橋梁結構變形的非線性、非平穩(wěn)性及多尺度等特性,筆者提出了一種結合集合經驗模態(tài)分解(EEMD)和長短期記憶神經網絡(LSTM)的方法,并以武漢沌口長江大橋為例,選取ERMS、EMA、EMAP和R2參數作為評價指標,對該模型進行了驗證。得出如下結論:
1)EEMD分解是一種高效的分解時序數據算法,無需提前設定基函數,可自適應地將橋梁變形時間序列分解得到多個不同尺度特征變形分量,分解后的各變形分量唯一,可有效消除模態(tài)混疊問題,有利于探究橋梁變形的多尺度變形規(guī)律;
2)與Bayesian模型和SVM模型相比,LSTM模型的橋梁結構變形響應預測效果更優(yōu);
3)基于“分解-分量預測-集成”的EEMD-LSTM模型能極大地提升橋梁變形響應預測精度;與LSTM模型相比,ERMS、EMA和EMAP分別降低了54.57%、56.50%和57.66%,R2提升了17.38%。