曾 欣,馬 力,戴子卿
(1.水利部水利水電規(guī)劃設(shè)計總院,北京 100120;2.南京市水利規(guī)劃設(shè)計院股份有限公司,江蘇 南京 210022;3.中國人民解放軍總醫(yī)院第六醫(yī)學(xué)中心,北京 100037)
水庫大壩的結(jié)構(gòu)健康監(jiān)測一直為國內(nèi)外學(xué)者研究的熱點(diǎn)內(nèi)容之一。由于結(jié)構(gòu)健康監(jiān)測(Structural health monitoring,SHM)屬于多學(xué)科交叉領(lǐng)域,涉及大量傳感器或儀器自動監(jiān)測結(jié)構(gòu)對荷載的響應(yīng)情況,根據(jù)采集得到的數(shù)據(jù)對結(jié)構(gòu)健康進(jìn)行診斷[1]。SHM的核心部分就是數(shù)據(jù),包括數(shù)據(jù)采集、異常數(shù)據(jù)處理、數(shù)據(jù)挖掘和數(shù)據(jù)建模等方面的相關(guān)算法和應(yīng)用[2]。近年來,隨著大型水利工程監(jiān)測系統(tǒng)與數(shù)據(jù)科學(xué)發(fā)展,SHM系統(tǒng)已經(jīng)廣泛應(yīng)用于水利工程領(lǐng)域。水利工程SHM系統(tǒng)的應(yīng)用算法經(jīng)歷了3個階段,從傳統(tǒng)回歸算法[3]、機(jī)器學(xué)習(xí)算法[4-5]到目前的深度學(xué)習(xí)算法[6]。其中混凝土大壩作為水工結(jié)構(gòu)中重要的組成部分,大壩的安全始終影響著上下游人民的生命財產(chǎn)、社會的經(jīng)濟(jì)的安全[7]。為了監(jiān)控混凝土大壩的安全,通過大壩的變形、溫度、滲流、應(yīng)力等指標(biāo)進(jìn)行監(jiān)測,其中大壩變形是混凝土大壩安全重要的控制和評價指標(biāo)。由于大壩變形與影響因子間為非線性關(guān)系,前人已經(jīng)通過各種數(shù)學(xué)算法模型進(jìn)行研究預(yù)測大壩變形,并得到了工程運(yùn)用。為了處理變量間映射的非線性問題,人工神經(jīng)網(wǎng)絡(luò)[8](Artificial neural network,ANN)應(yīng)運(yùn)而生。其發(fā)展最初基于數(shù)學(xué)和閾值邏輯算法[9-10],神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練擬合過程實(shí)質(zhì)是通過相關(guān)學(xué)習(xí)算法不斷逼進(jìn)損失函數(shù)極小值的超高維度的非線性函數(shù)擬合過程。目前,神經(jīng)網(wǎng)絡(luò)依據(jù)不同的研究對象已經(jīng)發(fā)展出多種網(wǎng)絡(luò)構(gòu)型[11-12]。其中對于監(jiān)測、檢測數(shù)據(jù)的分析,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)的應(yīng)用最為廣泛,包括醫(yī)學(xué)[13]、機(jī)械工業(yè)[14]、土木工程[15]、教育[16]等領(lǐng)域。在處理大壩變形的離散時間序列的神經(jīng)網(wǎng)絡(luò)中,一維CNN適應(yīng)性較好。而一維CNN由于卷積核的限制,對于數(shù)據(jù)較大的數(shù)據(jù)庫的處理能力不足,容易出于收斂不穩(wěn)定和數(shù)據(jù)爆炸的問題。為了解決上述CNN的存在問題,本文對CNN的因果卷積、膨脹卷積進(jìn)行約束與殘差鏈接操作而建立時間卷積網(wǎng)絡(luò)樣本訓(xùn)練預(yù)測模型。
由于混凝土大壩的變形對外部條件變化的反饋不可能即刻完成,該過程需有一定的時間并且屬于復(fù)雜的非線性過程。為了實(shí)現(xiàn)混凝土大壩變形的因變量與環(huán)境量的自變量之間在時序關(guān)系上刻畫,采用動態(tài)MIC進(jìn)行研究計算。其中MIC在研究水利工程的水位荷載與工程性態(tài)的相關(guān)性已經(jīng)得到了較好地應(yīng)用,如孟慶筱等[17]運(yùn)用MIC算法研究了三峽蓄水進(jìn)程中庫首區(qū)地震活動與庫水位的關(guān)聯(lián)性;黃觀文等[18]結(jié)合MIC算法分析了降雨和庫水位與滑坡變形的時滯性并進(jìn)行了滑坡變形的預(yù)測。為解決混凝土壩變形的時滯性問題并提高變形預(yù)測的精度,本文提出基于動態(tài)MIC優(yōu)化的時域卷積神經(jīng)網(wǎng)絡(luò)的混凝土壩位移預(yù)測模型。首先通過動態(tài)MIC確定變量間的最佳時滯時間;以環(huán)境量因子構(gòu)建的矩陣作為輸入,目標(biāo)向量為大壩變形測點(diǎn)的變形量,建立時間卷積網(wǎng)絡(luò)的變形時序模型。并且采用均方根誤差、擬合優(yōu)度和平均絕對百分比誤差等指標(biāo)評價模型的精度和可靠度,以此評價大壩變形的變化趨勢。
由前文可知,卷積神經(jīng)網(wǎng)絡(luò)CNN是人工神經(jīng)網(wǎng)絡(luò)的一種。人工神經(jīng)網(wǎng)絡(luò)簡稱神經(jīng)網(wǎng)絡(luò)(neural network,NN)是一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的數(shù)學(xué)模型或計算模型,其本質(zhì)還是搜尋一種線性空間與非線性空間之間的映射關(guān)系的擬合過程[19],神經(jīng)網(wǎng)絡(luò)的求解結(jié)構(gòu)如圖1所示。人工神經(jīng)網(wǎng)絡(luò)本質(zhì)是解決兩類問題——分類和回歸問題。
卷積神經(jīng)網(wǎng)絡(luò)求解結(jié)構(gòu)的核心在于“卷”和“積”。如果求解維度是多維的,則網(wǎng)絡(luò)的卷積計算是一個積分過程,即
(1)
式中,f為網(wǎng)絡(luò)的表征函數(shù);g為網(wǎng)絡(luò)的卷積核。
一般地,大壩位移測點(diǎn)為時間序列,屬于離散函數(shù),需要進(jìn)行積分退化處理,求解網(wǎng)絡(luò)為
(2)
卷積神經(jīng)網(wǎng)絡(luò)中的卷積核又稱過濾器(filter),是按照給定規(guī)則隨機(jī)初始化,然后經(jīng)過訓(xùn)練得到的。在模型訓(xùn)練過程中,為了提高運(yùn)算層面上的效率,訓(xùn)練得出的正向存儲的過濾器便可以看作是已經(jīng)翻轉(zhuǎn)的卷積核。卷積算子較卷積網(wǎng)絡(luò)模型中的卷積操作多了一步對“卷積核”的反轉(zhuǎn)操作,神經(jīng)網(wǎng)絡(luò)中的卷積運(yùn)算其核心是一種互相關(guān)運(yùn)算,而并非嚴(yán)格數(shù)學(xué)意義上的卷積操作,如圖2所示。
對于離散的大壩變形時間序列,1D CNN較之標(biāo)準(zhǔn)CNN的精度更高,其中1D CNN輸入矩陣以及卷積核的維度為1,所以更適合用于序列問題的解決,1D CNN具體的卷積操作如圖3所示。由于1D CNN受到卷積核尺寸的限制,相對于循環(huán)神經(jīng)網(wǎng)絡(luò)解決時序數(shù)據(jù)的能力就顯得不足。
為了突破卷積核尺寸的限制,時間卷積網(wǎng)絡(luò)在普通1D CNN基礎(chǔ)上,進(jìn)行嚴(yán)格時間約束的因果卷積膨脹卷積與殘差鏈接操作,TCN結(jié)構(gòu)如圖4所示。該網(wǎng)絡(luò)可以較好地捕捉數(shù)據(jù)時序上的前后依賴關(guān)系,強(qiáng)化了卷積結(jié)構(gòu)處理時序數(shù)據(jù)建模任務(wù)的能力;在不損失信息的情況下,能夠以層數(shù)的指數(shù)級擴(kuò)大處理信息的能力。
在混凝土大壩的變形監(jiān)測中,大壩變形與其影響因子存在一定時滯性。準(zhǔn)確捕捉時滯時間,可以進(jìn)一步提高TCN模型訓(xùn)練樣本的精度。由于MIC的廣泛性和均勻性使之較MI等能夠更準(zhǔn)確檢測兩個變量間的線性、非線性或非函數(shù)關(guān)系,避免產(chǎn)生誤導(dǎo)性結(jié)論,所以MIC能夠覆蓋所有的函數(shù)關(guān)系且無須對數(shù)據(jù)分布做任何假設(shè)。并且只要兩變量之間存在某種映射關(guān)系,則它們的理論MIC值為1。但MIC只能度量序列時域上對應(yīng)的數(shù)據(jù),對存在多個影響因子的時間序列類型的映射關(guān)系的能力可能不強(qiáng)。所以采用時滯互相關(guān)的分析思路,將監(jiān)測序列進(jìn)行平移處理,計算輸入序列和輸出序列間的動態(tài)MIC值[20],即
f(t)=fMIC({(x1,y1+t),…,(xi,yi+t),…(xN-t,yN)})
(3)
式中,t為滯后步數(shù);X=(x1,x2,…,xN)為樣本輸入層;Y=(y1,y2,…,yN)為樣本輸出層,并且兩者為等間隔監(jiān)測序列。
為了保證時序數(shù)據(jù)樣本在模型訓(xùn)練和測試過程中的統(tǒng)一性,采用滑動窗口方式構(gòu)建,選擇特定窗口時長,然后以固定步長滑動,每一個窗口的數(shù)據(jù)作為模型的訓(xùn)練或測試的一個樣本。從而可以得到變形與影響因子間的時滯關(guān)系曲線,由關(guān)系曲線則可以確實(shí)最佳時滯時間。
為了定量的評價MIC-TCN預(yù)測模型的擬合及預(yù)測精度,采用評價數(shù)學(xué)模型常用的3種誤差評價指標(biāo),分別為均方根誤差RMSE(Root Mean Square Error)、擬合優(yōu)度R(Correlation Coefficient)和平均絕對百分比誤差MAPE(Mean Absolute Percentage Error)。RMSE用來表示實(shí)測值與計算值之間的偏差,表征計算值的離散程度,如式(4)。R是量化模型擬合值和預(yù)測值與實(shí)測值之間統(tǒng)計關(guān)系的系數(shù),如式(5)。MAPE用來評價計算結(jié)果的相對誤差,如式(6)。由式(4)~(6)可知,變形預(yù)測模型的性能越好,精度越高,則RMSE、MAPE和R的值越小。
(4)
(5)
(6)
Smith等[21]建議為了提高樣本數(shù)據(jù)的利用率,同時使用較少類型的層次以保持網(wǎng)絡(luò)簡潔,避免在重復(fù)卷積池化過程中丟失某些重要特征。因此,在TCN網(wǎng)絡(luò)的層與層之間本文采用1×1卷積,具體TCN網(wǎng)絡(luò)結(jié)構(gòu)模型的示意如圖5所示。
根據(jù)樣本的具體情況,確定TCN網(wǎng)絡(luò)結(jié)構(gòu)的層次和類型之后,則可進(jìn)行混凝土大壩變形預(yù)測模型的構(gòu)建。基于MIC-TCN的混凝土大壩變形預(yù)測模型如6所示。具體步驟為①通過動態(tài)MIC,計算訓(xùn)練樣本的輸入層自變量和輸出層因變量之間的動態(tài)相關(guān)關(guān)系,確定環(huán)境量(輸入層)和位移(輸出層)之間的滯后關(guān)系。②利用TCN學(xué)習(xí)擬合訓(xùn)練樣本環(huán)境量和位移的映射關(guān)系,即變形網(wǎng)絡(luò)模型。③根據(jù)變形網(wǎng)絡(luò)模型,輸入預(yù)測樣本的環(huán)境量,得到位移的預(yù)測值。④將模型的預(yù)測值與實(shí)測值進(jìn)行對比,分析誤差,評價模型的精度。
本文選擇某水電站大壩的變形作為研究對象,通過訓(xùn)練模型的結(jié)構(gòu)參數(shù),不斷逼近影響因子空間與效應(yīng)量空間之間的最佳映射關(guān)系,將影響因子空間映射到高維的非線性空間,然后再映射到效應(yīng)量空間上。考慮到數(shù)據(jù)完整性和代表性,選擇2013-01-01~2016-12-31期間的壩體某條倒垂線測點(diǎn)的水平順河向位移監(jiān)測數(shù)據(jù)與環(huán)境量監(jiān)測數(shù)據(jù),其中2013-01-01~2015-12-31為訓(xùn)練測試集,2016-01-01~2016-12-31為位移預(yù)測集。圖7為該變形測點(diǎn)以及庫水位和日降雨量的監(jiān)測時序,位移的正負(fù)代表方向。由圖7可知,在庫水位周期調(diào)度和季節(jié)性降雨情況下,測點(diǎn)位移出現(xiàn)了較明顯的變化,雨季位移正向增加,旱季位移負(fù)向增加,并且?guī)焖坏恼{(diào)度也會影響位移的變化。
由于該壩體測點(diǎn)是每隔1~2 d的自動化監(jiān)測,因此數(shù)據(jù)存在缺失值,直接建模會增大結(jié)果誤差,因此在構(gòu)建模型前,采用3階樣條插值法對變形量數(shù)據(jù)進(jìn)行升采樣處理,重采樣結(jié)果較原數(shù)據(jù)量增加約130%。為避免插值和去噪過程對預(yù)測結(jié)果造成的影響,及時更新模型的輸入樣本空間,而對測試集未預(yù)測樣本不進(jìn)行數(shù)據(jù)預(yù)處理,并采用實(shí)際監(jiān)測日數(shù)據(jù)與測試樣本輸出進(jìn)行對比分析。
由于序列數(shù)據(jù)在時間上的前后相關(guān)性,本文選擇文獻(xiàn)[22]提出的時間序列預(yù)測模型的滾動原點(diǎn)交叉驗(yàn)證(GROE,generalized rolling origin evaluation cross-validation)方法來優(yōu)化模型參數(shù)。根據(jù)文獻(xiàn)[23],本文設(shè)置GROE交叉驗(yàn)證方法的折數(shù)p=5,預(yù)測步數(shù)H根據(jù)模型為單步或多步預(yù)測具體設(shè)置,最后將5個模型的輸出向量平均化處理,以作為該模型結(jié)構(gòu)的最終輸出。
采用動態(tài)MIC計算了大壩變形與水位變量之間的時滯關(guān)系,關(guān)系曲線如圖8所示。由圖8可知,水位與大壩變形具有很高的相關(guān)性,隨著時間的增加(前期),MIC相關(guān)性越高,相關(guān)性最大的為20 d處,說明大壩變形的變化對水位的反饋具有時滯性。滯后天數(shù)在20 d后,相關(guān)度開始下降,該大壩的水位最佳滯后時間為20 d。
確定最佳滯后天數(shù),則可以確定TCN模型的視野域的輸入序列長度為20 d。序列的輸入長度采用滑動時窗方法構(gòu)建模型樣本空間,便于后續(xù)模型調(diào)參與優(yōu)化。
先后輸入該壩的監(jiān)測點(diǎn)的訓(xùn)練樣本及預(yù)測樣本,經(jīng)過MIC-TCN變形預(yù)測模型學(xué)習(xí)訓(xùn)練及預(yù)測計算,則可得到該壩的位移擬合及預(yù)測結(jié)果,其中2013-01-01~2015-12-31為位移擬合結(jié)果,2016-01-01~2016-12-31為位移預(yù)測結(jié)果,如圖9所示。動態(tài)MIC-TCN變形預(yù)測模型的位移擬合精度如表1所示。由圖9和表1可知,動態(tài)MIC-TCN變形預(yù)測模型具有較高的學(xué)習(xí)擬合能力和精度。
表1 擬合精度評價指標(biāo)值
為了更好地評判MIC-TCN大壩變形預(yù)測模型地好壞,本文還通過差分自回歸滑動平均模型(ARIMA)預(yù)測了該壩的位移情況,兩者預(yù)測的結(jié)果如圖10所示,兩者的誤差分析如表2所示。
表2 ARIMA模型與TCN模型預(yù)測精度評價指標(biāo)表
由圖5和表2可知,ARIMA和MIC-TCN兩個模型在預(yù)測反映大壩變形的趨勢上都有較好的精度。但在反映和影響大壩性態(tài)的測點(diǎn)突跳點(diǎn)的位移預(yù)測方面,ARIMA模型沒有MIC-TCN模型的預(yù)測精度高,并且在RMSE、R2和MAPE的3個誤差分析指標(biāo)上,MIC-TCN模型都好于ARIMA模型。說明基于動態(tài)MIC-TCN大壩變形預(yù)測模型的整體預(yù)測能力較強(qiáng)。
本文基于動態(tài)MIC-TCN模型構(gòu)建了混凝土壩變形預(yù)測模型,可以得到以下結(jié)論:
(1)通過動態(tài)MIC可以計算分析大壩變形與影響因子間的時滯關(guān)系,并能確定最佳時滯時間;TCN神經(jīng)網(wǎng)絡(luò)可以對大壩測點(diǎn)的樣本進(jìn)行學(xué)習(xí)訓(xùn)練以及擬合預(yù)測,能夠適用于大樣本的情形。
(2)由案例應(yīng)用可知,MIC-TCN變形預(yù)測模型的擬合及預(yù)測精度較高,較之常規(guī)ARIMA模型具有更高的訓(xùn)練預(yù)測能力,能夠較好地預(yù)測混凝土大壩的變形情況。說明MIC-TCN變形預(yù)測模型具有較高的工程使用價值。
(3)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)往往存在獨(dú)一性,當(dāng)處理新任務(wù)時,需要重新訓(xùn)練模型結(jié)構(gòu),效率不高,因此考慮通過遷移學(xué)習(xí)(Transfer Learning),將一個訓(xùn)練好的不同特征空間上映射關(guān)系進(jìn)行一定的算子變換,然后應(yīng)用于類似的任務(wù)上。