任秋兵,沈 揚(yáng),李明超,孔 銳,李明昊
(1.水利工程仿真與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津大學(xué),天津 300354;2.中國(guó)長(zhǎng)江三峽集團(tuán)有限公司,北京 100038;3.中國(guó)電建集團(tuán) 西北勘測(cè)設(shè)計(jì)研究院有限公司,陜西 西安 710065)
為達(dá)到防洪、發(fā)電、灌溉、供水等目的,需要修建不同類(lèi)型的水工建筑物以控制和調(diào)配水流,如擋水建筑物(大壩、堤防等)、輸水建筑物(渠道、渡槽等)、整治建筑物等[1]。結(jié)構(gòu)安全是建筑物發(fā)揮調(diào)控功能的前提,而安全管理為建筑物正常運(yùn)行提供保障,尤以長(zhǎng)期安全監(jiān)控為甚。將各種儀器布設(shè)于水工建筑物關(guān)鍵部位,通過(guò)監(jiān)測(cè)變形、滲流等效應(yīng)量,從不同維度綜合反映其工作性態(tài)[2]。根據(jù)原型觀測(cè)資料,利用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)等方法,構(gòu)建多效應(yīng)量數(shù)學(xué)監(jiān)控模型,能夠及時(shí)掌握和預(yù)測(cè)建筑物結(jié)構(gòu)性能的重要變化,從而為評(píng)價(jià)建筑物安全狀況、發(fā)現(xiàn)建筑物異常跡象提供科學(xué)依據(jù)[3]。
依據(jù)構(gòu)建方法的不同,常規(guī)水工建筑物安全監(jiān)控模型大致分為統(tǒng)計(jì)模型、確定性模型和混合模型。以統(tǒng)計(jì)模型為代表的三大常規(guī)模型應(yīng)用頗廣,時(shí)至今日仍然發(fā)揮著重要作用,其推導(dǎo)過(guò)程和適用范圍詳見(jiàn)文獻(xiàn)[4];然而,常規(guī)建模方法難以適應(yīng)繁多因子與效應(yīng)量間的復(fù)雜非線性關(guān)系,且易受不確定性因素干擾,故無(wú)法確保所建模型的準(zhǔn)確性和穩(wěn)健性[5]。20世紀(jì)末,人工智能技術(shù)攻關(guān)和行業(yè)應(yīng)用發(fā)展勢(shì)頭迅猛。徐洪鐘等[6]和蘇懷智等[7]率先將人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)、支持向量機(jī)(Support Vector Machine,SVM)等建模方法成功應(yīng)用于水工建筑物安全性態(tài)分析;之后,利用機(jī)器學(xué)習(xí)算法對(duì)不同效應(yīng)量進(jìn)行建模預(yù)測(cè)一直是水工建筑物安全監(jiān)控領(lǐng)域的研究熱點(diǎn)[8-11]。Wang等[12]、Wei等[13]和李明超等[14-15]進(jìn)一步發(fā)展并創(chuàng)新提出了組合模型、時(shí)空模型等一系列先進(jìn)方法,并取得了豐富成果。據(jù)此,吳中如等[5]歸納總結(jié)出安全監(jiān)控模型的總體發(fā)展趨勢(shì)如下:三大常規(guī)模型逐漸向組合化、時(shí)空化和智能化發(fā)展,以此提高模型的準(zhǔn)確性、魯棒性和外延性。
隨著安全監(jiān)控理論和計(jì)算機(jī)技術(shù)的不斷進(jìn)步,智能化是水工建筑物安全監(jiān)控發(fā)展的必然趨勢(shì),其主要體現(xiàn)在監(jiān)測(cè)手段、數(shù)據(jù)管理和數(shù)值方法三個(gè)方面。目前,水利信息化建設(shè)偏重于監(jiān)測(cè)儀器和信息集成系統(tǒng)的升級(jí)改造,而對(duì)數(shù)據(jù)分析方法的研究和創(chuàng)新關(guān)注較少[2,16-19]。這就引發(fā)數(shù)學(xué)監(jiān)控模型的信息挖掘能力與數(shù)量日益龐大、形式日漸復(fù)雜的原型觀測(cè)資料不相適應(yīng)的問(wèn)題,直接影響到模型的預(yù)測(cè)表現(xiàn)。盡管ANN、SVM 等淺層學(xué)習(xí)算法相較于統(tǒng)計(jì)模型在非線性信息提取方面有較大提升[20],但在某些場(chǎng)景下仍舊難以滿足監(jiān)控需求。深層非線性網(wǎng)絡(luò)模型[21]為解決上述問(wèn)題提供了可行性。深度學(xué)習(xí)[22]是ANN發(fā)展的突破,亦是機(jī)器學(xué)習(xí)領(lǐng)域的拓展,其利用復(fù)雜結(jié)構(gòu)或多重非線性變換處理層對(duì)數(shù)據(jù)進(jìn)行高度抽象,因而在隱含信息挖掘方面優(yōu)勢(shì)明顯。以長(zhǎng)短期記憶網(wǎng)絡(luò)[23](Long Short-Term Memory,LSTM)為例,其能夠充分挖掘時(shí)序數(shù)據(jù)中的時(shí)間依賴性以增加信息維度,從而實(shí)現(xiàn)對(duì)滑坡位移[24]、地下水埋深[25]等監(jiān)測(cè)量的高精度預(yù)測(cè)。而在水工建筑物安全監(jiān)控領(lǐng)域,有關(guān)LSTM等深度學(xué)習(xí)算法的應(yīng)用探索還鮮有報(bào)道,僅有少量研究[26-29]將其用于大壩變形預(yù)報(bào),目前尚未擴(kuò)展到其他水工建筑物,亦未針對(duì)監(jiān)測(cè)數(shù)據(jù)自身特性進(jìn)行優(yōu)化處理。
為此,本文在LSTM算法的基礎(chǔ)上構(gòu)建水工建筑物安全監(jiān)控深度分析模型,并對(duì)算法進(jìn)行優(yōu)化,以提高所建模型的預(yù)測(cè)可靠性和工程適用性,其主要包括以下三個(gè)方面的內(nèi)容:(1)界定水工建筑物安全監(jiān)控大數(shù)據(jù)的概念,并闡明直接應(yīng)用深度學(xué)習(xí)算法構(gòu)建安全監(jiān)控模型的局限性;(2)有針對(duì)性地提出適用于不同類(lèi)型水工建筑物的安全監(jiān)控深度模型構(gòu)建及優(yōu)化方法;(3)通過(guò)多類(lèi)型水工建筑物的多效應(yīng)量實(shí)測(cè)數(shù)據(jù)驗(yàn)證所提模型方法的有效性。
2.1 安全監(jiān)控大數(shù)據(jù)特性水工建筑物安全監(jiān)控大數(shù)據(jù)并不完全符合信息技術(shù)行業(yè)大數(shù)據(jù)的“5V”特征[30](即Volume、Variety、Velocity、Value和Veracity),具有其獨(dú)特性,主要體現(xiàn)在以下五個(gè)方面。
(1)在容量方面,單一項(xiàng)目監(jiān)測(cè)數(shù)據(jù)量不大,仍屬于小規(guī)模數(shù)據(jù)集;繁多項(xiàng)目長(zhǎng)期監(jiān)測(cè)記錄構(gòu)成的數(shù)據(jù)庫(kù)體量巨大,但遠(yuǎn)達(dá)不到PB級(jí)。
(2)在種類(lèi)方面,數(shù)據(jù)多源自各種監(jiān)測(cè)儀器,如三峽大壩安全監(jiān)測(cè)系統(tǒng)布置的儀器種類(lèi)有六十多種,數(shù)量達(dá)到一萬(wàn)余支;數(shù)據(jù)格式呈現(xiàn)“大部分結(jié)構(gòu)化,小部分半/非結(jié)構(gòu)化”的特點(diǎn),且結(jié)構(gòu)化數(shù)據(jù)演變形式復(fù)雜多樣,總體上以周期性演變?yōu)橹?,但也不乏突變、噪聲等情況。
(3)在獲取速度方面,各種監(jiān)測(cè)儀器本身采集頻率較高,但受限于系統(tǒng)設(shè)置,一般以天為單位進(jìn)行統(tǒng)一采樣;且運(yùn)行初期采樣速度較快,后期逐步放緩,以至于數(shù)據(jù)存儲(chǔ)時(shí)間間隔不固定。
(4)在價(jià)值方面,多數(shù)項(xiàng)目監(jiān)測(cè)數(shù)據(jù)價(jià)值密度較高,即有價(jià)值的數(shù)據(jù)所占比例較大。
(5)在真實(shí)性方面,除非監(jiān)測(cè)儀器發(fā)生故障或失效,否則數(shù)據(jù)質(zhì)量往往較高,但也伴隨著局部離群值等。
2.2 LSTM原理概述水工建筑物在施工和運(yùn)行過(guò)程中所產(chǎn)生的監(jiān)測(cè)數(shù)據(jù)大多為結(jié)構(gòu)化時(shí)序數(shù)據(jù)。傳統(tǒng)ANN每相鄰兩層節(jié)點(diǎn)全互連,同層節(jié)點(diǎn)卻相互獨(dú)立,故難以學(xué)習(xí)時(shí)序數(shù)據(jù)的內(nèi)在延續(xù)性。循環(huán)神經(jīng)網(wǎng)絡(luò)[31](Recurrent Neural Networks,RNN)將時(shí)序概念引入網(wǎng)絡(luò)結(jié)構(gòu)中,表現(xiàn)為隱層間節(jié)點(diǎn)相連,且隱層輸入同時(shí)包含輸入層輸出與上一時(shí)刻隱層輸出,使其在時(shí)序數(shù)據(jù)分析方面適應(yīng)性較佳。但RNN 經(jīng)過(guò)多次迭代容易出現(xiàn)梯度爆炸或梯度消失的問(wèn)題,導(dǎo)致網(wǎng)絡(luò)不穩(wěn)定甚至無(wú)法收斂[32]。為此,LSTM[23]應(yīng)運(yùn)而生,其不僅克服了梯度問(wèn)題,還提高了預(yù)測(cè)間隔或延遲較長(zhǎng)的時(shí)序數(shù)據(jù)的能力,遂成為當(dāng)前處理時(shí)序數(shù)據(jù)最流行的深度學(xué)習(xí)算法之一。
LSTM在RNN的基礎(chǔ)上增加了特殊單元(即記憶模塊),其學(xué)習(xí)當(dāng)前信息的同時(shí),還會(huì)提取長(zhǎng)時(shí)間跨度數(shù)據(jù)之間的關(guān)聯(lián)性,以此減緩信息丟失速度,實(shí)現(xiàn)持久記憶。如圖1所示,記憶模塊由遺忘門(mén)()、輸入門(mén)()和輸出門(mén)()構(gòu)成,用于決定數(shù)據(jù)更新或丟棄。具體來(lái)說(shuō),遺忘門(mén)控制上一時(shí)刻內(nèi)部狀態(tài)()需遺忘的信息量,輸入門(mén)控制當(dāng)前時(shí)刻候選狀態(tài)()需保存的信息量,而輸出門(mén)則控制當(dāng)前時(shí)刻內(nèi)部狀態(tài)()需輸出給外部狀態(tài)()
(1)利用上一時(shí)刻外部狀態(tài)()和當(dāng)前時(shí)刻輸入(),計(jì)算出、和:
(2)結(jié)合和更新記憶單元狀態(tài)():
(3)通過(guò)將信息傳遞給:
式中:σ(?)、tanh(?)分別為Sigmoid函數(shù)和雙曲正切函數(shù);w、b分別為權(quán)重矩陣和偏置向量;⊙表示兩向量的標(biāo)量積。
圖1 LSTM單元內(nèi)部結(jié)構(gòu)[25]
2.3 深度學(xué)習(xí)算法適用性分析對(duì)于水工建筑物安全監(jiān)控大數(shù)據(jù),深度學(xué)習(xí)(如LSTM)與淺層學(xué)習(xí)相比,主要“深”在能夠更為全面地獲取數(shù)據(jù)潛在規(guī)律,從而為提升模型預(yù)測(cè)性能奠定信息基礎(chǔ)。因此,LSTM算法在水工建筑物安全監(jiān)控通用模型構(gòu)建框架中,不僅能承擔(dān)模型層的預(yù)測(cè)功能,而且能減少特征層中手工提取有效信息的工作量。再者,LSTM模型結(jié)構(gòu)便于調(diào)整,可依據(jù)數(shù)據(jù)形式的復(fù)雜程度而定[33]。不過(guò),根據(jù)監(jiān)測(cè)數(shù)據(jù)特性,直接應(yīng)用LSTM算法構(gòu)建安全監(jiān)控模型仍有以下幾點(diǎn)不足:(1)監(jiān)測(cè)數(shù)據(jù)中存在含噪失真、非等間距以及局部空值野值等現(xiàn)象,需加強(qiáng)數(shù)據(jù)前端處理;(2)監(jiān)測(cè)數(shù)據(jù)處理講究及時(shí)有效,模型難以實(shí)現(xiàn)全數(shù)據(jù)處理,需限定記憶區(qū)間以減少模型訓(xùn)練時(shí)長(zhǎng);(3)模型表現(xiàn)易受監(jiān)測(cè)數(shù)據(jù)多重共線性等的影響;(4)模型超參數(shù)較多,而單一項(xiàng)目監(jiān)測(cè)數(shù)據(jù)量并不大,容易發(fā)生過(guò)擬合;加之,監(jiān)測(cè)項(xiàng)目眾多,數(shù)據(jù)形式多樣,對(duì)模型泛化能力提出了更高要求;(5)監(jiān)測(cè)數(shù)據(jù)外延對(duì)模型多步預(yù)測(cè)精度和特殊場(chǎng)景應(yīng)對(duì)能力亦較為重視。因此,有必要優(yōu)化深度模型架構(gòu)以適應(yīng)安全監(jiān)控大數(shù)據(jù)分析的需求。的信息量。其對(duì)應(yīng)計(jì)算過(guò)程如下:
針對(duì)上述不足,以LSTM深度學(xué)習(xí)算法為基礎(chǔ),從數(shù)據(jù)前端處理、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和外延預(yù)測(cè)方法三個(gè)方面著手改進(jìn),提出一種適用于不同類(lèi)型水工建筑物的安全監(jiān)控深度分析模型。
3.1 數(shù)據(jù)前端處理為了提高安全監(jiān)控模型的外延能力,需提前對(duì)原型觀測(cè)資料進(jìn)行清洗、降噪和變換等必要的處理?,F(xiàn)給定包含T個(gè)數(shù)據(jù)的任一效應(yīng)量監(jiān)測(cè)序列yj(t),t=1,2,…,T;j=1,2,…,J,其中缺失值和異常值分別用表示,那么前端處理具體操作步驟如下:(1)步驟1。數(shù)據(jù)清洗。利用筆者先前所提“插值填補(bǔ)”和“異常檢測(cè)”算法分別對(duì)監(jiān)測(cè)數(shù)據(jù)中局部缺失值異常值進(jìn)行實(shí)時(shí)處理(詳見(jiàn)文獻(xiàn)[10]),得到修正序列不同于傳統(tǒng)數(shù)據(jù)清洗方法[34],“插值填補(bǔ)”算法能通過(guò)分布式建模充分利用缺失區(qū)域雙側(cè)已知監(jiān)測(cè)數(shù)據(jù)估計(jì)未知空值yjnu(t),而“異常檢測(cè)”算法則能通過(guò)魯棒分解對(duì)異常值起到明顯放大作用,使其便于識(shí)別。
(2)步驟2。降噪平滑。一般認(rèn)為,實(shí)際監(jiān)測(cè)數(shù)據(jù)往往含有不同程度的噪聲。在處理含噪數(shù)據(jù)時(shí),為了最大限度還原真實(shí)信號(hào),同時(shí)避免相移,先將輸入序列按順序?yàn)V波,再將濾波結(jié)果逆轉(zhuǎn)并反向通過(guò)濾波器,最后將所得結(jié)果逆轉(zhuǎn)后輸出,即為降噪平滑序列其數(shù)學(xué)描述[35]為:
式中:hj(t)為所用數(shù)字濾波器沖激響應(yīng)序列;分別為第一、二次濾波結(jié)果;分別為第一、二次濾波結(jié)果的逆轉(zhuǎn)序列。
需要說(shuō)明的是,上述步驟均是針對(duì)效應(yīng)量yj(t)而言,若是對(duì)影響因子xi(t),t=1,2,…,T;i=1,2,…,I進(jìn)行前端處理,將yj(t)替換為xi(t)即可。此外,倘若優(yōu)化深度模型選擇對(duì)效應(yīng)量yj(t)進(jìn)行一元時(shí)序預(yù)測(cè),就在上述步驟的基礎(chǔ)上,補(bǔ)充運(yùn)用分段三次Hermite 插值函數(shù)[36]完成數(shù)據(jù)均勻化。為表述方便起見(jiàn),下文將經(jīng)過(guò)前端處理的效應(yīng)量(或因子仍稱為yj(t)(或xi(t))。
3.2 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)全部數(shù)據(jù)(包括效應(yīng)量yj(t)及其影響因子xi,j(t))經(jīng)過(guò)預(yù)處理后,按照一定比例劃分為訓(xùn)練集Tr、驗(yàn)證集Va和測(cè)試集Te,隨后采取以下措施對(duì)深層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行優(yōu)化改進(jìn)。
(1)并聯(lián)搭建深層網(wǎng)絡(luò)LSTM1和LSTM(2統(tǒng)稱LSTM1,2),其中LSTM1用于一元時(shí)序預(yù)測(cè),直接根據(jù)歷史監(jiān)測(cè)數(shù)據(jù)對(duì)效應(yīng)量yj(t)未來(lái)變化趨勢(shì)進(jìn)行外延分析;LSTM2則用于多元回歸預(yù)測(cè),即通過(guò)效應(yīng)量yj(t)及其影響因子xi,j(t)間的因果關(guān)系構(gòu)建數(shù)學(xué)模型,進(jìn)而求解待估計(jì)參數(shù)。
(2)超參數(shù)調(diào)試對(duì)深層網(wǎng)絡(luò)的預(yù)測(cè)效果影響較大。以LSTM2為例,通過(guò)試算和隨機(jī)搜索算法,對(duì)隱層數(shù)nh、各隱層節(jié)點(diǎn)數(shù)nn、學(xué)習(xí)率lr和優(yōu)化迭代次數(shù)ni等超參數(shù)進(jìn)行迭代優(yōu)化,選取最優(yōu)超參數(shù)組合相較于LSTM2,LSTM1需將時(shí)序問(wèn)題轉(zhuǎn)化為監(jiān)督學(xué)習(xí)問(wèn)題,故增加時(shí)間窗口長(zhǎng)度wt這一超參數(shù)。
(3)多數(shù)效應(yīng)量監(jiān)測(cè)序列存在長(zhǎng)期相關(guān)性(即記憶性),通常越接近待預(yù)測(cè)值的數(shù)據(jù)對(duì)外延精度的影響越大,且過(guò)多的歷史冗余數(shù)據(jù)會(huì)增加模型的復(fù)雜度[37]。在預(yù)設(shè)范圍內(nèi),通過(guò)限定步長(zhǎng)l改變Tr跨度,循環(huán)訓(xùn)練得到不同的網(wǎng)絡(luò)根據(jù)Va多次評(píng)估選取精度較高的網(wǎng)絡(luò)結(jié)構(gòu)其對(duì)應(yīng)的有效記憶區(qū)間Tr +Va(區(qū)間長(zhǎng)度設(shè)為d)即可滿足預(yù)測(cè)Te的要求。
(4)為避免LSTM1,2因Tr數(shù)據(jù)量較少而出現(xiàn)過(guò)擬合等問(wèn)題,一方面,控制網(wǎng)絡(luò)深度和訓(xùn)練周期,根據(jù)訓(xùn)練損失和Va性能評(píng)估確定何時(shí)提早停止;另一方面,采用L2正則化、Dropout、批標(biāo)準(zhǔn)化等方法對(duì)模型參數(shù)進(jìn)行約束,提高模型的泛化能力[38]。此外,添加正則項(xiàng)也有助于解決共線性問(wèn)題。
(5)針對(duì)不同應(yīng)用場(chǎng)景,將多步預(yù)測(cè)精度和逐步誤差累積作為競(jìng)選指標(biāo),自動(dòng)擇優(yōu)選用或進(jìn)行外延預(yù)測(cè),并利用全連接層進(jìn)行維度變換(一維輸出),以此實(shí)現(xiàn)最優(yōu)化數(shù)學(xué)建模。
3.3 外延預(yù)測(cè)方法直接多步預(yù)測(cè)(Direct Multi-step Prediction,DMP)能夠一次返回多個(gè)時(shí)刻的預(yù)測(cè)值是目前安全監(jiān)控模型中最常用的外延方法。DMP的學(xué)習(xí)、估計(jì)過(guò)程分別見(jiàn)下式:
式中:f1(?)為預(yù)測(cè)模型,文中指代LSTM2;ε為學(xué)習(xí)誤差;H為外延步數(shù)。
與DMP 不同,滾動(dòng)單步預(yù)測(cè)(Rolling One-step Prediction,ROP)是將上一時(shí)刻預(yù)測(cè)值yj(t) 作為下一時(shí)刻預(yù)測(cè)值yj(t+1) 的輸入,利用動(dòng)態(tài)更新間接實(shí)現(xiàn)多步預(yù)測(cè),直至達(dá)到待預(yù)測(cè)步數(shù)H為止。ROP的學(xué)習(xí)、估計(jì)過(guò)程分別見(jiàn)下式:
式中:f2(?)為預(yù)測(cè)模型,文中指代LSTM1;d為有效記憶區(qū)間長(zhǎng)度。
對(duì)于一個(gè)穩(wěn)定的預(yù)測(cè)模型,無(wú)需高頻次學(xué)習(xí)更新,通過(guò)設(shè)定更新時(shí)間tu即可完成周期性的模型迭代。
綜合上述三個(gè)方面的改進(jìn),以LSTM算法為基礎(chǔ)的水工建筑物安全監(jiān)控優(yōu)化深度模型得以構(gòu)建,稱為優(yōu)化LSTM模型(Optimized LSTM,OLSTM)。
圖2 某混凝土壩IP4_01_X方向變形監(jiān)測(cè)數(shù)據(jù)
圖3 某調(diào)水工程多效應(yīng)量監(jiān)測(cè)儀器讀數(shù)記錄
基于上述模型方法,選取多組不同效應(yīng)量實(shí)測(cè)數(shù)據(jù)作為典型應(yīng)用場(chǎng)景,對(duì)OLSTM進(jìn)行有效性和準(zhǔn)確性驗(yàn)證,旨在通過(guò)此實(shí)例說(shuō)明OLSTM在多類(lèi)型水工建筑物安全監(jiān)控方面的優(yōu)勢(shì)。為此,以某混凝土壩IP4_01_X方向變形監(jiān)測(cè)數(shù)據(jù)(數(shù)據(jù)示于圖2,豎線以右為預(yù)測(cè)期)與某調(diào)水工程關(guān)鍵部位鋼筋計(jì)、測(cè)縫計(jì)、應(yīng)變計(jì)和滲壓計(jì)讀數(shù)記錄(數(shù)據(jù)示于圖3,豎線以右為預(yù)測(cè)期)為例,設(shè)定3種實(shí)際應(yīng)用場(chǎng)景,引入逐步回歸統(tǒng)計(jì)模型(SRSM)和SVM、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)等淺層模型與OLSTM深度模型進(jìn)行性能對(duì)比。仿真實(shí)驗(yàn)中需要注意以下幾點(diǎn):(1)確保各模型輸入數(shù)據(jù)前端處理步驟(詳見(jiàn)3.1節(jié))的一致性,濾波結(jié)果示于圖2和圖3;(2)將淺層模型性能調(diào)至最優(yōu),SVM超參數(shù)(懲罰因子、高斯核函數(shù)參數(shù))和BPNN 超參數(shù)(連接權(quán)重、閾值)均由隨機(jī)搜索算法優(yōu)化;(3)OLSTM 采用自適應(yīng)矩估計(jì)算法更新內(nèi)部參數(shù),損失函數(shù)、隱層激活函數(shù)分別設(shè)為均方誤差(MSE)和tanh 函數(shù);(4)由于SVM、BPNN 和OLSTM 預(yù)測(cè)存在隨機(jī)性,遂將各模型10 次運(yùn)行結(jié)果取均值作為最終輸出;(5)選用MSE、平均絕對(duì)誤差(MAE)和平均絕對(duì)百分比誤差(MAPE)作為量化評(píng)估各模型預(yù)測(cè)性能的統(tǒng)計(jì)指標(biāo)。需要說(shuō)明的是,本文限于篇幅僅在圖2和圖3中繪制出效應(yīng)量監(jiān)測(cè)序列。
4.1 場(chǎng)景一:數(shù)據(jù)量大,形式簡(jiǎn)單由圖2可知,該測(cè)點(diǎn)變形呈明顯的周期性變化,是工程中最常見(jiàn)也是最簡(jiǎn)單的一種數(shù)據(jù)演變形式[39];監(jiān)測(cè)數(shù)據(jù)樣本量較大,數(shù)值變化幅度基本一致;存在幾處分布較為離散的異常突變(圖2紅色框選處)。現(xiàn)采用SRSM、SVM、BPNN 和OLSTM 這4種模型對(duì)大壩變形進(jìn)行外延預(yù)測(cè),各模型的DMP結(jié)果如圖4所示。從圖4可以看出:(1)所有模型均未準(zhǔn)確把握大壩變形的局部細(xì)微波動(dòng),僅預(yù)測(cè)出大致變化趨勢(shì);(2)SVM預(yù)測(cè)結(jié)果區(qū)別于其余3種模型,與實(shí)測(cè)值差距較大,說(shuō)明其性能易受數(shù)據(jù)波動(dòng)的影響;(3)前150 步內(nèi),OLSTM 預(yù)測(cè)效果明顯優(yōu)于SRSM 和BPNN,這正是此3 種模型性能差別的主要所在,表現(xiàn)出深度模型在大量數(shù)據(jù)挖掘分析方面的潛力。表1 是上述4 種模型的性能評(píng)估結(jié)果,各模型預(yù)測(cè)效果按照統(tǒng)計(jì)指標(biāo)從優(yōu)到劣排序?yàn)椋篛LSTM>SRSM>BPNN>SVM。
圖4 IP4_01_X測(cè)點(diǎn)變形的多模型預(yù)測(cè)結(jié)果
表1 IP4_01_X測(cè)點(diǎn)變形多模型預(yù)測(cè)性能量化評(píng)估結(jié)果
4.2 場(chǎng)景二:數(shù)據(jù)量小,形式復(fù)雜正如圖3(a)—(c)所示,該調(diào)水工程鋼筋計(jì)、測(cè)縫計(jì)和應(yīng)變計(jì)的讀數(shù)記錄是符合本應(yīng)用場(chǎng)景的3個(gè)實(shí)例,其數(shù)據(jù)特征描述如下:與4.1節(jié)中大壩變形相比,3組數(shù)據(jù)樣本量相對(duì)較小,演變形式復(fù)雜多樣;鋼筋應(yīng)力數(shù)值變化幅度隨著時(shí)間推移逐漸變大,且在預(yù)測(cè)期伊始陡然上升;裂縫開(kāi)合度數(shù)值在實(shí)測(cè)期始末變化速率較快,中間呈平穩(wěn)變化狀態(tài);應(yīng)變數(shù)據(jù)中存在諸多幅度不一的波動(dòng),周期性特征被掩蓋?,F(xiàn)將不同模型(SRSM、BPNN和OLSTM)用于外推估計(jì)上述儀器讀數(shù),各模型的ROP結(jié)果如圖5(a)—(c)所示。由圖可知:(1)3種模型的預(yù)測(cè)誤差均隨外推步長(zhǎng)的增加而增大(即誤差累積效應(yīng)),尤以SRSM為甚,表明傳統(tǒng)統(tǒng)計(jì)模型難以適應(yīng)非平穩(wěn)數(shù)據(jù)處理;(2)BPNN和OLSTM短期預(yù)測(cè)效果相仿,OLSTM長(zhǎng)期預(yù)測(cè)結(jié)果與實(shí)測(cè)值更為接近,說(shuō)明深度模型可用以長(zhǎng)期安全監(jiān)控;(3)3種模型中僅有OLSTM 捕捉到局部數(shù)據(jù)波動(dòng),但仍存在一定偏差。從“多步預(yù)測(cè)精度”角度而言,3種模型在不同效應(yīng)量預(yù)測(cè)中的性能量化評(píng)估結(jié)果(表2)亦能佐證上述觀點(diǎn),各模型預(yù)測(cè)效果按照統(tǒng)計(jì)指標(biāo)從優(yōu)到劣排序?yàn)椋篛LSTM>BPNN>SRSM。
圖5 多效應(yīng)量多模型預(yù)測(cè)結(jié)果
表2 多效應(yīng)量多模型預(yù)測(cè)性能量化評(píng)估結(jié)果
4.3 場(chǎng)景三:因子缺失,形式復(fù)雜圖3(d)中滲壓計(jì)讀數(shù)表現(xiàn)為密集型振蕩模式,隨機(jī)噪聲較大;數(shù)據(jù)樣本量較小,且缺失預(yù)測(cè)因子,難以依靠外生變量修正原始數(shù)據(jù),準(zhǔn)確預(yù)測(cè)未來(lái)趨勢(shì)難度較大。在此場(chǎng)景下,無(wú)法使用傳統(tǒng)統(tǒng)計(jì)模型,只能將BPNN和OLSTM用于水位變化的外延預(yù)測(cè),兩種模型的ROP結(jié)果如圖5(d)所示。從圖中可以看出:前10步內(nèi),OLSTM預(yù)測(cè)結(jié)果更加貼近實(shí)測(cè)值,且數(shù)值存在恰當(dāng)?shù)牟▌?dòng);10步之后,實(shí)測(cè)數(shù)據(jù)變化幅度增大,OLSTM保守選取中值作為預(yù)測(cè)結(jié)果,而B(niǎo)PNN一直維持固有速率呈下降趨勢(shì)??傮w而言,同等情況下深度模型能夠抓取更多信息來(lái)提高逐步預(yù)測(cè)精度。
針對(duì)復(fù)雜非線性安全監(jiān)控大數(shù)據(jù),從前端處理、網(wǎng)絡(luò)結(jié)構(gòu)和外延預(yù)測(cè)三個(gè)方面出發(fā),通過(guò)改進(jìn)加強(qiáng)LSTM深層網(wǎng)絡(luò),提出適用于不同類(lèi)型水工建筑物的安全監(jiān)控優(yōu)化深度模型,為深度學(xué)習(xí)推廣應(yīng)用奠定了研究基礎(chǔ)。基于所提出的模型,結(jié)合某混凝土壩和某調(diào)水工程多效應(yīng)量監(jiān)測(cè)數(shù)據(jù),設(shè)置3種典型應(yīng)用場(chǎng)景下的多模型性能對(duì)比仿真實(shí)驗(yàn),結(jié)果表明該模型在外推估計(jì)方面優(yōu)勢(shì)明顯,主要表現(xiàn)為:(1)相比于常規(guī)、淺層模型,深度模型適用于更多場(chǎng)景,且同一場(chǎng)景下其預(yù)測(cè)效果提升顯著;(2)通過(guò)數(shù)據(jù)清洗、降噪平滑等前處理方法提高了數(shù)學(xué)建模效率,并改善了模型計(jì)算復(fù)雜度;(3)借助競(jìng)爭(zhēng)機(jī)制和超參數(shù)優(yōu)化,自動(dòng)選取較優(yōu)預(yù)測(cè)方式,不僅提高了模型的泛化能力,還減少了人工干預(yù)成本;(4)采用限定區(qū)間、早停、正則化等策略,縮短了模型訓(xùn)練時(shí)長(zhǎng),同時(shí)緩解了過(guò)擬合和共線性問(wèn)題;(5)DMP重在把握整體演變趨勢(shì),ROP則能反映局部數(shù)據(jù)波動(dòng)。
鑒于深度學(xué)習(xí)算法在水工建筑物安全監(jiān)控領(lǐng)域的應(yīng)用研究尚處于起步階段,本文未能詳盡討論其他應(yīng)用場(chǎng)景,現(xiàn)提出以下兩點(diǎn)展望供相關(guān)人員參考:(1)深度模型預(yù)測(cè)性能與數(shù)據(jù)量密切相關(guān),而部分地區(qū)水工建筑物歷史觀測(cè)資料完整性、可靠性均不足,如何利用有限數(shù)據(jù)開(kāi)發(fā)高精度網(wǎng)絡(luò)是一個(gè)重要的研究課題;(2)目前多數(shù)從業(yè)人員只能通過(guò)加深或加寬網(wǎng)絡(luò)改善模型性能,而無(wú)法對(duì)網(wǎng)絡(luò)內(nèi)部進(jìn)行有效的數(shù)學(xué)解釋?zhuān)蚨酱芯可顚泳W(wǎng)絡(luò)的可判讀性和可理解性。