李維華,婁健康,李 星
(1.黃河勘測(cè)規(guī)劃設(shè)計(jì)研究院有限公司,河南 鄭州 450003; 2.水利部黃河流域水治理與水安全重點(diǎn)實(shí)驗(yàn)室(籌),河南 鄭州 450003; 3.河南省豫北水利勘測(cè)設(shè)計(jì)院有限公司,河南 鄭州 450046; 4.南京水利科學(xué)研究院,江蘇 南京 210029)
為充分開(kāi)發(fā)利用水能資源,我國(guó)在西南地區(qū)修建了一大批200~300 m 特高拱壩,這些高拱壩普遍位于地質(zhì)條件惡劣的深山峽谷地區(qū)。其運(yùn)行過(guò)程中會(huì)承受如極端溫度荷載、超限制水位洪水荷載、地震荷載等多種不利荷載的疊加作用。保障高拱壩全生命周期安全穩(wěn)定運(yùn)行是當(dāng)前大壩安全管理工作的重點(diǎn)。
大壩結(jié)構(gòu)安全監(jiān)控通過(guò)在大壩壩體內(nèi)部及地基布置大量傳感器,實(shí)時(shí)感知和評(píng)估多種結(jié)構(gòu)相關(guān)的物理量,如變形、滲流、應(yīng)力、裂縫開(kāi)度等[1]。準(zhǔn)確有效預(yù)測(cè)大壩在多重環(huán)境荷載組合作用下的結(jié)構(gòu)響應(yīng)及行為變化,對(duì)于大壩運(yùn)行維護(hù)、安全預(yù)警具有重要意義。變形是混凝土壩在多種荷載疊加作用下的真實(shí)反映,是安全監(jiān)控的重點(diǎn)內(nèi)容。大壩變形預(yù)測(cè)模型依據(jù)方法手段的不同,可分為統(tǒng)計(jì)模型和人工智能模型。傳統(tǒng)統(tǒng)計(jì)模型主要是將大壩變形分解為水壓分量、溫度分量和時(shí)效分量三部分,通過(guò)多重線性回歸、逐步線性回歸等統(tǒng)計(jì)學(xué)方法,依據(jù)輸入環(huán)境變量預(yù)測(cè)大壩變形[2]。傳統(tǒng)統(tǒng)計(jì)模型只能考慮輸入和輸出變量間的線性關(guān)系,而大壩變形是結(jié)構(gòu)性態(tài)在環(huán)境因子作用下的非線性響應(yīng),使得統(tǒng)計(jì)模型預(yù)測(cè)能力受限,很難準(zhǔn)確、高效、長(zhǎng)期預(yù)測(cè)變形。
人工智能算法主要是通過(guò)人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等機(jī)器學(xué)習(xí)算法,充分挖掘大壩監(jiān)測(cè)數(shù)據(jù)里的信息,實(shí)現(xiàn)大壩環(huán)境變量和輸出變量的非線性關(guān)系精確模擬[3]。許多學(xué)者在人工智能算法預(yù)測(cè)大壩變形方面開(kāi)展了研究,如:李明軍等[4]提出一種基于改進(jìn)灰狼優(yōu)化算法和支持向量機(jī)的大壩變形組合預(yù)測(cè)模型;陳優(yōu)良等[5]提出一種基于極限學(xué)習(xí)機(jī)和彈性網(wǎng)絡(luò)支持的大壩位移預(yù)測(cè)方法,試驗(yàn)結(jié)果表明該方法可簡(jiǎn)化隱含層神經(jīng)元個(gè)數(shù)選擇問(wèn)題,便于參數(shù)調(diào)整;楊恒等[6]將支持向量機(jī)(SVM)和差分自回歸移動(dòng)平均模型(ARIMA)結(jié)合,提出一種時(shí)間序列大壩位移預(yù)測(cè)分析方法,可實(shí)現(xiàn)大壩位移變化趨勢(shì)的精確預(yù)測(cè),具有一定實(shí)用價(jià)值。然而這些方法普遍存在易陷入局部最優(yōu)、過(guò)擬合、調(diào)參過(guò)程復(fù)雜等缺陷,限制了其應(yīng)用。此外,這些方法并未考慮大壩變形受多環(huán)境因素交叉耦合的影響,因此有必要研究考慮多環(huán)境因素交叉耦合影響的大壩變形預(yù)測(cè)方法。
高斯過(guò)程回歸是一種基于貝葉斯理論的機(jī)器學(xué)習(xí)方法,它可為概率回歸預(yù)測(cè)提供一個(gè)靈活簡(jiǎn)捷的建??蚣?。已有許多學(xué)者應(yīng)用高斯過(guò)程回歸解決實(shí)際工程問(wèn)題[7-8],高斯過(guò)程回歸在解決高維度小樣本問(wèn)題時(shí)優(yōu)勢(shì)顯著,可有效評(píng)估監(jiān)測(cè)信號(hào)的不確定性行為,精度高、泛化能力強(qiáng)。
協(xié)方差函數(shù)是高斯過(guò)程回歸的重要組成部分,也是高斯過(guò)程回歸實(shí)現(xiàn)非線性預(yù)測(cè)的基礎(chǔ)。然而常規(guī)線性協(xié)方差函數(shù)只能處理平穩(wěn)序列,大壩變形時(shí)間序列是一種非平穩(wěn)時(shí)間序列,因此有必要研究組合協(xié)方差函數(shù)以更好地考慮大壩變形時(shí)間序列的非平穩(wěn)性。
高斯過(guò)程回歸是一類隨機(jī)變量的集合,任意有限個(gè)隨機(jī)變量具有一致的聯(lián)合高斯分布,典型高斯過(guò)程f(x)(x為影響大壩位移的環(huán)境因子,如水位、溫度、時(shí)效等)可以用其均值m(x)和協(xié)方差函數(shù)C(x,x′)(x為訓(xùn)練集的模型輸入,即訓(xùn)練集對(duì)應(yīng)的環(huán)境因子;x′為測(cè)試集的模型輸入,即測(cè)試集對(duì)應(yīng)的環(huán)境因子)來(lái)近似描述[9],為了便于簡(jiǎn)化,均值函數(shù)通常設(shè)置為0。
式中:ε為獨(dú)立同分布的白噪聲,即ε~N(0,),σn為噪聲標(biāo)準(zhǔn)差,任何有限數(shù)目觀測(cè)值均可形成高斯過(guò)程[9]。
高斯過(guò)程的后驗(yàn)分布可以通過(guò)對(duì)給定數(shù)據(jù)訓(xùn)練集和測(cè)試集進(jìn)行聯(lián)合先驗(yàn)分布來(lái)推導(dǎo):
式中:f?為用于驗(yàn)證的新輸入數(shù)據(jù);X為輸入監(jiān)測(cè)變量;為輸出結(jié)果的平均值;v(f?)為驗(yàn)證集上模型的輸出結(jié)果。
此外,高斯過(guò)程不僅能給出預(yù)測(cè)值,還能利用協(xié)方差函數(shù)估計(jì)輸出預(yù)測(cè)值的置信度。作為一種非參數(shù)估計(jì)方法,高斯回歸的預(yù)測(cè)值只取決于輸入變量和觀測(cè)值,而模型超參數(shù)Θ可視為高斯過(guò)程回歸的超參數(shù)。最大似然估計(jì)是高斯過(guò)程回歸的常用參數(shù)估計(jì)方法,最大似然函數(shù)通??捎韶惾~斯理論獲得:
參數(shù)估計(jì)通過(guò)最大似然估計(jì)獲取。
協(xié)方差函數(shù)控制模型估計(jì)未知函數(shù)時(shí)數(shù)據(jù)平滑程度,其選取對(duì)模型非線性重建性能影響顯著。最常見(jiàn)的協(xié)方差函數(shù)是平方指數(shù)協(xié)方差函數(shù),其主要應(yīng)用于平穩(wěn)序列建模,而大壩位移時(shí)間序列是一個(gè)典型受多因素影響的非平穩(wěn)時(shí)間序列。本研究為進(jìn)一步提高高斯過(guò)程回歸模型對(duì)非線性時(shí)間序列的建模能力,引入組合協(xié)方差函數(shù)概念,通過(guò)組合Matern 核函數(shù)和白噪聲核函數(shù),構(gòu)造如式(4)所示的非平穩(wěn)協(xié)方差函數(shù),以更好地體現(xiàn)輸入和輸出變量間的非線性關(guān)系。其中,白噪聲核函數(shù)主要用于解釋信號(hào)的噪聲是獨(dú)立和正態(tài)分布的,式(4)中參數(shù)noise_level等于該白噪聲的方差。
式中:k(xi,xj)為協(xié)方差函數(shù);xi、xj為第i個(gè)和第j個(gè)樣本數(shù)據(jù);d(xi,xj)為歐氏距離;Kν(·)為修正貝葉斯函數(shù);ν為數(shù)據(jù)序列的均值;l為修正線性激活函數(shù)值。
為量化評(píng)估上述方法和現(xiàn)階段常用的多重線性回歸(HST)、隨機(jī)森林(RF)和支持向量機(jī)(SVR)的預(yù)測(cè)精度和泛化能力,本文選擇確定系數(shù)R2、均方誤差MSE和平均絕對(duì)誤差MAE作為大壩變形預(yù)測(cè)的評(píng)價(jià)指標(biāo)。
某混凝土高拱壩,位于黃河上游,壩型為混凝土雙曲拱壩,最大壩高為105 m,水庫(kù)正常蓄水位為700 m、死水位為660 m。大壩布置5 組正、倒垂線監(jiān)測(cè)點(diǎn),其中:PL 為正垂線,用于監(jiān)測(cè)大壩壩體位移;IP 為倒垂線,用于監(jiān)測(cè)大壩壩體相對(duì)地基的位移。
本研究選用2014 年1 月1 日至2017 年12 月31日大壩正、倒垂線1 451 個(gè)監(jiān)測(cè)樣本數(shù)據(jù)用于模型建立和驗(yàn)證,其中2014 年1 月1 日至2016 年12 月31日共計(jì)1 086個(gè)監(jiān)測(cè)樣本數(shù)據(jù)用于模型訓(xùn)練和驗(yàn)證,2017 年1 月1 日至2017 年12 月31 日共計(jì)365 個(gè)監(jiān)測(cè)樣本數(shù)據(jù)用于模型測(cè)試和泛化能力評(píng)估。圖1 為2014—2017 年水庫(kù)水位變化曲線,可以看出庫(kù)水位基本呈現(xiàn)以年為周期的規(guī)律性變化,平均年變幅為10.425 m 左右。選用3 個(gè)典型正垂線監(jiān)測(cè)點(diǎn)PL13-1、PL15-1 和PL16-1 用于評(píng)估模型的有效性。3 個(gè)典型監(jiān)測(cè)點(diǎn)的位移過(guò)程線如圖2 所示。
圖1 2014—2017 年水庫(kù)水位變化曲線
圖2 3 個(gè)典型監(jiān)測(cè)點(diǎn)位移過(guò)程線
利用3 種常用的大壩變形預(yù)測(cè)分析方法即多重線性回歸、隨機(jī)森林和支持向量機(jī)方法作對(duì)比來(lái)驗(yàn)證本文方法的泛化能力,3 個(gè)典型大壩位移監(jiān)測(cè)點(diǎn)位移預(yù)測(cè)值與實(shí)測(cè)值對(duì)比見(jiàn)圖3~圖5。
圖3 PL16-1 監(jiān)測(cè)點(diǎn)位移預(yù)測(cè)值和實(shí)測(cè)值對(duì)比
圖4 PL13-1 監(jiān)測(cè)點(diǎn)位移預(yù)測(cè)值和實(shí)測(cè)值對(duì)比
圖5 PL15-1 監(jiān)測(cè)點(diǎn)位移預(yù)測(cè)值和實(shí)測(cè)值對(duì)比
可以看出,本文所提的基于組合核函數(shù)的高斯過(guò)程回歸的預(yù)測(cè)值與實(shí)測(cè)值趨勢(shì)基本保持一致,而多重線性回歸方法存在一定程度的偏差。這主要是由于高斯過(guò)程回歸對(duì)非線性關(guān)系的擬合能力更強(qiáng),因此在長(zhǎng)序列大壩變形分析上更具優(yōu)勢(shì)。3 種量化評(píng)估指標(biāo)下本文方法和對(duì)比方法在測(cè)試集上的回歸性能評(píng)估結(jié)果見(jiàn)表1,可以看出,高斯過(guò)程回歸大壩變形預(yù)測(cè)方法性能優(yōu)于對(duì)比方法,這驗(yàn)證了其泛化能力。
表1 不同方法測(cè)試集性能評(píng)估結(jié)果
續(xù)表1
圖6 為本文方法和對(duì)比方法的回歸結(jié)果殘差對(duì)比圖,可以看出,本文方法的殘差分布更集中,更接近于0,且其超過(guò)1.5 倍閾值區(qū)間實(shí)測(cè)值數(shù)目顯著少于對(duì)比方法的,這說(shuō)明本文模型的魯棒性更好。
圖6 本文方法和多重線性回歸(HST)、隨機(jī)森林(RF)、支持向量機(jī)(SVR)方法殘差對(duì)比
本文提出基于混合協(xié)方差函數(shù)高斯過(guò)程回歸的大壩變形非線性預(yù)測(cè)分析方法,可簡(jiǎn)捷地建立大壩結(jié)構(gòu)行為預(yù)測(cè)模型,并給出結(jié)果的概率非參數(shù)估計(jì)。計(jì)算結(jié)果表明,該方法在大壩典型監(jiān)測(cè)點(diǎn)位移分析中效果較好,確定系數(shù)、均方誤差等評(píng)估指標(biāo)均顯著優(yōu)于現(xiàn)有主流大壩變形預(yù)測(cè)方法,說(shuō)明了該方法預(yù)測(cè)大壩變形具有優(yōu)勢(shì)。此外,該方法可進(jìn)一步用于識(shí)別潛在大壩監(jiān)測(cè)數(shù)據(jù)異常信息,可為大壩結(jié)構(gòu)性態(tài)評(píng)估與風(fēng)險(xiǎn)鑒定提供參考。