韓行進(jìn),楊松林,匡楚豐,陳 冰,張健飛,余天堂
(1.湖南五凌電力科技有限公司,湖南 長沙 410004;2.五凌電力有限公司,湖南 長沙 410004;3.河海大學(xué)工程力學(xué)系,江蘇 南京 211100)
根據(jù)大壩原型監(jiān)測資料,運(yùn)用統(tǒng)計數(shù)學(xué)、工程力學(xué)、信息科學(xué)等建立大壩安全監(jiān)控模型,定量地評估大壩的安全狀況是保障大壩安全的重要手段。統(tǒng)計模型由于實(shí)施簡單且精度能達(dá)到工程需要,因此是大壩安全監(jiān)測資料分析中最常用的模型[1]。大壩安全監(jiān)測常用統(tǒng)計模型采用的回歸方法有多種[2-6],這些回歸方法各有其特點(diǎn)和適用性。由于大壩的情況千差萬別,因此結(jié)合大壩實(shí)際特點(diǎn)有比較地選擇分析方法,對監(jiān)測資料分析的準(zhǔn)確性、系統(tǒng)性具有重要影響。常用的統(tǒng)計分析方法有逐步回歸法和偏最小二乘回歸法。逐步回歸法是通過計算各因子影響的顯著性,去掉顯著性小的因子以排除因子的共線性關(guān)系,這導(dǎo)致其并不一定能獲得最佳回歸模型[7]。偏最小二乘回歸法能在自變量存在嚴(yán)重多重相關(guān)性的條件下進(jìn)行回歸建模。
近年,隨著深度學(xué)習(xí)的不斷發(fā)展,一些深度學(xué)習(xí)的模型,如卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等,也被應(yīng)用到大壩變形預(yù)測之中[8-11]?;谏疃葘W(xué)習(xí)的模型在解決監(jiān)控模型因子不確定性和非線性問題、預(yù)測精度及泛化性等方面表現(xiàn)出了特有的優(yōu)勢。胡安玉等[12]提出一種基于長短期記憶網(wǎng)絡(luò)(LSTM)的大壩變形預(yù)測模型,利用自回歸差分移動平均模型對預(yù)測殘差進(jìn)行誤差修正以提升預(yù)測精度。郭張軍等[13]借助開源深度學(xué)習(xí)框架Tensor Flow建立了基于深度學(xué)習(xí)的混凝土壩變形預(yù)測模型。
本文研究五強(qiáng)溪水電站大壩變形預(yù)測的統(tǒng)計回歸模型和LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)模型。根據(jù)五強(qiáng)溪水電站大壩壩頂J23測點(diǎn)2006年至2020年的監(jiān)測數(shù)據(jù),構(gòu)建含水壓、溫度、時效因素的逐步回歸和偏最小二乘回歸統(tǒng)計模型。取2006年~2017年的監(jiān)測數(shù)據(jù)作為LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練集數(shù)據(jù),2018年~2020年的監(jiān)測數(shù)據(jù)作為測試集數(shù)據(jù),比較3種模型結(jié)果,獲得該測點(diǎn)較佳的變形預(yù)測模型。
在監(jiān)測過程中,監(jiān)測數(shù)據(jù)易受到環(huán)境因素影響,產(chǎn)生一些不符合規(guī)律性變化的監(jiān)測數(shù)據(jù),這些數(shù)據(jù)屬不可靠數(shù)據(jù)。構(gòu)建預(yù)測模型時應(yīng)去掉不可靠數(shù)據(jù),以提高模型預(yù)測精度。
(1)
第j個監(jiān)測值跳動偏差的絕對值與均方差的比值為qj,即
(2)
當(dāng)qj>3時,表明該值為異常值或不可靠值。
水壓分量δH、溫度分量δT和時效分量δθ是壩體位移δ的3個主要組成,即
δ=δH+δT+δθ
(3)
水壓分量δH與上游水深H,H2,H3和下游水深h,h2,h3呈線性關(guān)系,即
(4)
式中,a1i和a2i均為回歸系數(shù)。
五強(qiáng)溪水電站大壩已運(yùn)行20余年,壩體內(nèi)部溫度達(dá)到準(zhǔn)穩(wěn)定,因此可假設(shè)壩體內(nèi)部溫度受氣溫和水溫影響做簡諧變化,變幅小,且有一個相位差。取年周期簡諧波作為因子,溫度分量δT可表示為[1]
(5)
式中,b11和b21均為回歸系數(shù);t為始測日與監(jiān)測日之間間隔天數(shù)。
蓄水初期時效位移一般變化劇烈,其后漸趨平穩(wěn)。根據(jù)五強(qiáng)溪水電站大壩實(shí)際情況,時效位移δθ可表示為
δθ=c1θ+c2lnθ
(6)
式中,θ=0.01t;c1和c2均為系數(shù)。
根據(jù)以上分析可知,五強(qiáng)溪水電站大壩壩體垂直位移的統(tǒng)計模型為
(7)
逐步回歸法的基本思想是選取對因變量影響顯著的自變量,對統(tǒng)計數(shù)據(jù)進(jìn)行預(yù)測或建立解釋模型[15]。依次將顯著的自變量引入回歸方程,同時從回歸方程中去掉不顯著的自變量?!爸鸩健敝赣械牟揭胱宰兞亢陀械牟饺サ糇宰兞?。每步均做F檢驗(yàn),以保證回歸方程僅含顯著的自變量。回歸方程無顯著的自變量引入就結(jié)束。
偏最小二乘回歸法是多因變量對多自變量的回歸[6]。設(shè)有q個因變量{x1,x2,x3,…,xq}、p個自變量{y1,y2,y3,…,yp}和n個樣本點(diǎn),構(gòu)成了因變量與自變量的數(shù)據(jù)表X={x1,x2,x3,…,xq}和Y={y1,y2,y3,…,yp}。在X和Y中分別提取成分t1和u1(t1是x1,x2,x3,…,xq的線性組合,u1是y1,y2,y3,…,yp線性組合)。提取成分的過程中需滿足:①t1和u1包含各自數(shù)據(jù)表中的變異信息越多越好;②t1和u1的相關(guān)程度達(dá)到最大。提取第1個成分后,分別執(zhí)行X、Y對t1、u1的回歸。若回歸方程沒達(dá)到滿意的精度,則用X被t1解釋過的殘余信息和Y被u1解釋過的殘余信息進(jìn)行第2次成分提取,直至達(dá)到滿意的精度。若最終對X提取了m個成分t1,t2,t3,…,tm,執(zhí)行yk對t1,t2,t3,…,tm的回歸,建立yk(k=1,2,3,…,p)關(guān)于原變量X1,X2,X3,…,Xq的回歸方程。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)利用時間序列的歷史信息對時序數(shù)據(jù)建模,從而進(jìn)行序列識別及預(yù)測。RNN存在梯度爆炸和梯度消失問題,因此其在長期學(xué)習(xí)方面表現(xiàn)十分薄弱。為了克服RNN的不足,LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)使用記憶細(xì)胞代替一般循環(huán)神經(jīng)網(wǎng)絡(luò)中的隱藏層細(xì)胞,有效解決了梯度爆炸及梯度消失問題。LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)中,用遺忘門、輸入門和輸出門等一些門控單元控制記憶細(xì)胞的輸入和輸出[16]。LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)能有效地利用長距離的時序數(shù)據(jù),因此非常適合進(jìn)行大壩變形預(yù)測。
基于LSTM的混凝土壩變形預(yù)測模型建模步驟為[13]:①數(shù)據(jù)預(yù)處理。對監(jiān)測數(shù)據(jù)進(jìn)行粗差處理,去掉不可靠數(shù)據(jù)。②模型訓(xùn)練。將經(jīng)預(yù)處理的標(biāo)準(zhǔn)化數(shù)據(jù)集訓(xùn)練樣本作為模型輸入,通過隨機(jī)搜索對LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的超參數(shù)進(jìn)行優(yōu)化,本文激活函數(shù)采用整流線性單元函數(shù)。③模型預(yù)測。將測試集自變量因子數(shù)據(jù)輸入到訓(xùn)練好的最優(yōu)參數(shù)預(yù)測模型,獲得相應(yīng)的變形預(yù)測結(jié)果。④模型性能評價。
五強(qiáng)溪水電站工程于1999年竣工,大壩為混凝土重力壩,最大壩高85.83 m,壩頂總長719.7 m。壩頂有51個靜力水準(zhǔn)測點(diǎn)(見圖1),編號為J0~J47,其中在16號、44號和46號壩段各布置了2個靜力水準(zhǔn)測點(diǎn),壩頂靜力水準(zhǔn)系統(tǒng)以右岸J0為基準(zhǔn),且在該部位埋設(shè)有雙金屬標(biāo)SJ1、SJ2?;贘23測點(diǎn)的2006年~2020年監(jiān)測數(shù)據(jù),構(gòu)建該測點(diǎn)垂直位移的預(yù)測模型,正值為下沉。
圖1 壩頂靜力水準(zhǔn)布置示意
采用拉伊特準(zhǔn)則確定不可靠的沉陷監(jiān)測數(shù)據(jù)。圖2為J23沉陷實(shí)測值過程線。去掉不可靠監(jiān)測數(shù)據(jù)后,J23沉陷過程線更光滑。
圖2 J23沉陷實(shí)測值過程線
為了方便表達(dá),式(7)可以改寫為
δ=a11H+a12H2+a13H3+a21h+a22h2+
a23h3+b11d+b21e+c1θ+c2f
(8)
3.3.1 偏最小二乘法回歸模型
(9)
(10)
(11)
標(biāo)準(zhǔn)化位移變量的回歸方程為
(12)
標(biāo)準(zhǔn)化變量還原為原始變量,可得偏最小二乘法回歸方程為
y=-0.341 214-0.020 904H-0.000 156H2-
0.000 002H3+0.007 222h+0.000 047h2-
0.000 002h3-2.934 919sin(2πt/365)+
3.031 150cos(2πt/365)+0.021 690θ+
0.371 438ln(θ)
(13)
用偏最小二乘法對J23測點(diǎn)進(jìn)行回歸分析,得到的統(tǒng)計模型的復(fù)相關(guān)系數(shù)為0.911 8,剩余標(biāo)準(zhǔn)差為0.083 0。圖3和圖4分別顯示了偏最小二乘法擬合曲線和各分量過程線。由圖3、4可見,此模型能較好地反應(yīng)壩頂沉陷的變化規(guī)律。
圖3 J23測點(diǎn)沉陷變量偏最小二乘法擬合示意
圖4 J23測點(diǎn)沉陷變量偏最小二乘法模型各分量過程線
3.3.2 逐步回歸模型
表1為逐步回歸法各因子的F顯著性檢驗(yàn),展示了各因子的顯著性水平。依據(jù)因子的顯著性水平,依次引入變量e、d、θ、H3、H2、f和h2,可得逐步回歸方程如下:
表1 逐步回歸法各因子的F顯著性檢驗(yàn)
y=0.010 839H2-0.000 111 59H3+0.0016 013h2-
3.174 9sin(2πt/365)+2.831cos(2πt/365)+
0.071 16θ-1.036 9lnθ-15.219
(14)
圖5和圖6分別顯示了逐步回歸法擬合曲線和各分量過程線。用逐步回歸法對該測點(diǎn)進(jìn)行回歸分析所得統(tǒng)計模型的復(fù)相關(guān)系數(shù)為0.916 1,剩余標(biāo)準(zhǔn)差為0.401 3。
圖5 J23測點(diǎn)沉陷變量逐步回歸法擬合示意
圖6 J23測點(diǎn)沉陷變量逐步回歸法模型各分量過程線
根據(jù)數(shù)值試驗(yàn),最終選定的LSTM模型包括2個LSTM層,激活函數(shù)采用整流線性單元函數(shù),輸入序列長度為20,即采用前20 d的沉降數(shù)據(jù)預(yù)測第21 d的沉降。訓(xùn)練集數(shù)據(jù)取2006年~2017年的監(jiān)測值,2018年~2020年的監(jiān)測數(shù)據(jù)作為測試集數(shù)據(jù)。訓(xùn)練后的模型在訓(xùn)練集上的均方根誤差為0.40,測試集上的均方根誤差為0.37。圖7為基于LSTM模型的訓(xùn)練和測試過程線,預(yù)測的過程線和實(shí)測線吻合非常好。
圖7 J23測點(diǎn)沉陷變量LSTM模型過程線
基于逐步回歸模型和偏最小二乘法回歸模型的擬合效果非常相似,模型質(zhì)量好,都能較好地反應(yīng)壩頂J23測點(diǎn)沉陷變化規(guī)律。逐步回歸法比偏最小二乘法的復(fù)相關(guān)系數(shù)稍高,但剩余標(biāo)準(zhǔn)差要高多了。
由逐步回歸法和偏最小二乘法分量過程線可以發(fā)現(xiàn),溫度分量變化最為明顯,水壓分量和時效分量的變化較小。也就是說J23測點(diǎn)位移受溫度變化影響較大,受水位和時效影響較小,這點(diǎn)從逐步回歸法自變量的引入順序也可看出,符合一般大壩運(yùn)行的實(shí)際情況。溫升時壩體上升,溫降時壩體下沉,呈現(xiàn)周期性變化,這與大壩的實(shí)際情況相符。
由于水壓分量中因子的線性相關(guān)性較大,逐步回歸法去掉了上游水位一次項(xiàng)的因子和下游水位一次項(xiàng)與三次項(xiàng)的因子,一定程度上會影響回歸分析精度。從這點(diǎn)而言,偏最小二乘回歸法更有優(yōu)越性。
在時效分量中,偏最小二乘回歸法的擬合體現(xiàn)出大壩有沉降的效果,且沉降隨時間的推移會逐步變緩;逐步回歸法的擬合體現(xiàn)出大壩有上升的效果,上升量隨時間的推移會減小。測點(diǎn)不是以大壩建成的時間作為統(tǒng)計模型的起始時間,因此時效分量一開始就有位移。一般而言,正常運(yùn)行的大壩時效位移變化規(guī)律為初期變化急劇,后期漸趨于穩(wěn)定,但由J23測點(diǎn)的真實(shí)位移曲線可以看出,該測點(diǎn)有明顯的沉降趨勢,因此兩種模型的時效分量都未趨于穩(wěn)定值,符合實(shí)際情況。整體上看偏最小二乘法獲得的時效分量更符合真實(shí)情況。
圖8比較了3種模型的預(yù)測過程線。LSTM模型的精度最高。由于統(tǒng)計模型是基于15 a的監(jiān)測數(shù)據(jù)進(jìn)行回歸擬合的,跨度較大,因此其精度有所降低。用12 a的監(jiān)測數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測3 a的數(shù)據(jù),由此可見,在訓(xùn)練數(shù)據(jù)充足的情況下,LSTM模型的預(yù)測精度高,符合深度學(xué)習(xí)算法的特點(diǎn)。
圖8 J23測點(diǎn)沉陷變量預(yù)測過程線比較
綜上,3種模型均能有效地預(yù)測J23測點(diǎn)位移,采用偏最小二乘法回歸模型或LSTM模型更為妥當(dāng)。
采用基于逐步回歸法、偏最小二乘回歸法和長短期記憶(LSTM)循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建了五強(qiáng)溪水電站大壩壩頂J23測點(diǎn)沉陷的預(yù)測模型,對比分析預(yù)測效果和各分量對位移值的影響,得出以下結(jié)論:
(1)從復(fù)相關(guān)系數(shù)上來看,偏最小二乘法與逐步回歸法擬合效果相似,偏最小二乘法獲得的剩余標(biāo)準(zhǔn)差更低。
(2)逐步回歸法去掉了一些因子,使得分量在還原時效果不太理想,具有較大的殘差值。偏最小二乘法考慮因子全面,解釋各分量更嚴(yán)謹(jǐn)。
(3)訓(xùn)練數(shù)據(jù)充足的情況下,LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)能高精度地預(yù)測變形。
(4)J23測點(diǎn)沉陷采用偏最小二乘法回歸模型或LSTM模型進(jìn)行預(yù)測更為妥當(dāng)。