羅亦泳, 吳大衛(wèi), 張立亭, 黃 城, 劉宏宏
(1. 東華理工大學(xué) 測繪工程學(xué)院,江西 南昌 330013;2. 南昌市新建區(qū)土地管理勘察測量隊,江西 南昌 330100)
目前,我國水庫大壩面臨大壩數(shù)量多、氣候變化、建設(shè)條件復(fù)雜等多重因素帶來的風(fēng)險(中華人民共和國水利部,2018)。大壩在運營過程中受到水位、溫度等多種復(fù)雜因素影響,大壩的安全將受到巨大的威脅。大壩變形監(jiān)測技術(shù)是保障大壩安全運行的重要技術(shù)手段,通過建立大壩變形預(yù)測模型可及時掌握大壩變形發(fā)展趨勢,為大壩安全預(yù)報預(yù)警提供可靠的理論依據(jù)(顧沖時等,2016)。因此,大壩變形預(yù)測模型研究是大壩安全監(jiān)測的核心內(nèi)容之一,對大壩變形災(zāi)害防治具有重要的意義。
近年來,大壩變形預(yù)測模型的研究成果較為豐富,主要包括確定性模型、統(tǒng)計預(yù)測模型及機(jī)器學(xué)習(xí)算法等(吳中如,2003;Mata et al.,2013;Liang et al.,2018;汪宏宇等,2021)。大壩變形是一個多因素影響的非線性系統(tǒng),無法精確地掌握變形過程及機(jī)理。因此,確定性預(yù)測模型非線性映射能力不足,預(yù)測結(jié)果的精度有待于提高。大壩統(tǒng)計預(yù)測模型主要包括統(tǒng)計回歸模型、時序分析模型(潘國榮,2005)、模糊數(shù)學(xué)模型和灰色系統(tǒng)模型(靖洪文等,2012)等,這類方法是一種經(jīng)驗?zāi)P?,存在過度依靠數(shù)學(xué)處理、隨機(jī)性大和預(yù)報時間短等缺點。隨著機(jī)器學(xué)習(xí)方法的快速發(fā)展,機(jī)器學(xué)習(xí)算法在變形預(yù)測領(lǐng)域得到較好的應(yīng)用。智能算法、人工神經(jīng)網(wǎng)絡(luò)模型被應(yīng)用于大壩變形,該方法預(yù)測精度得到較大提高(陳俊風(fēng)等,2020;王新洲等,2005;胡紀(jì)元等,2014;徐鋒等,2012)。但神經(jīng)網(wǎng)絡(luò)模型存在局部最優(yōu)、收斂慢、結(jié)構(gòu)設(shè)計難,并且當(dāng)樣本較少時,預(yù)測精度不理想。針對神經(jīng)網(wǎng)絡(luò)模型的經(jīng)驗風(fēng)險最小原則的缺點,提出基于支持向量機(jī)的大壩變形預(yù)測方法(王新洲等,2008;董明等,2017;宋志宇等,2007;張豪等,2011;羅亦泳等,2010;朱軍桃等,2019),但支持向量機(jī)存在核函數(shù)參數(shù)和損失函數(shù)難以確定等問題?;跇O限學(xué)習(xí)機(jī)(ELM)構(gòu)建了變形預(yù)測模型,預(yù)測結(jié)果的精度得到一定的提高(王曉玲等,2020)。但由于 ELM 對噪聲敏感,且特征映射存在隨機(jī)性,因此降低了算法的魯棒性和泛化能力。當(dāng)前研究成果表明,機(jī)器學(xué)習(xí)算法能較好地表達(dá)變形影響因素與變形量之間的復(fù)雜關(guān)系,是變形預(yù)測研究的發(fā)展趨勢。當(dāng)前研究主要集中在提高變形預(yù)測方法精度方面,而對預(yù)測結(jié)果的可靠性分析研究較少。用于變形的機(jī)器學(xué)習(xí)算法通常包含多個需要用戶確定的參數(shù),參數(shù)取值是否合理嚴(yán)重影響預(yù)測精度及可靠性。因此,需要構(gòu)建一種參數(shù)自適應(yīng)及結(jié)果可靠性高的大壩變形預(yù)測模型。
標(biāo)準(zhǔn)高斯過程回歸(GP)是近年來一種基于貝葉斯網(wǎng)絡(luò)的新型學(xué)習(xí)算法,對處理高維、小樣本數(shù)據(jù)及非線性問題具有很好的適應(yīng)性和泛化能力,并且參數(shù)自適應(yīng),可以輸出預(yù)測變量的方差與期望,可分析結(jié)果的可靠性(蘇國韶等,2008;Rasmussen et al.,2006; Gibbs,1997;Kocian et al.,2008)。因此,GP受到廣泛關(guān)注而成為機(jī)器學(xué)習(xí)的研究熱點,并已被應(yīng)用于變形預(yù)測(羅亦泳,2016)。但標(biāo)準(zhǔn)的GP假定噪聲為高斯分布,且整個數(shù)據(jù)集中噪聲方差為常值。在實際的變形監(jiān)測過程中,監(jiān)測環(huán)境在不斷地變化。因此,假設(shè)噪聲方差為常數(shù)不符合實際,影響預(yù)測結(jié)果及可靠性。針對標(biāo)準(zhǔn)GP算法的上述缺點,GP的改進(jìn)算法——異方差高斯過程回歸算法(HGP)被構(gòu)建(Kersting et al.,2007)。HGP算法將觀測數(shù)據(jù)中的噪聲方差作為變量,并利用高斯過程進(jìn)行對其建模,基于變分推理進(jìn)行解算。由于HGP算法充分考慮了數(shù)據(jù)中的噪聲變化特征,其改進(jìn)方法更加符合實際工程環(huán)境,可以有效提高算法實際應(yīng)用效果(Rogers et al.,2020;Wang et al.,2019;Rodrigues et al.,2018; Lzaro-Gredilla et al.,2013)。鑒于HGP算法在處理復(fù)雜系統(tǒng)建模上的優(yōu)勢,筆者針對當(dāng)前大壩變形預(yù)測模型存在的問題,提出一種基于異方差高斯過程的大壩變形預(yù)測模型,以提高變形預(yù)測結(jié)果的精度及可靠性,并與多種變形預(yù)測方法進(jìn)行對比,驗證新方法的有效性。
標(biāo)準(zhǔn)的高斯過程學(xué)習(xí)算法將測量噪聲的方差作為常數(shù),但變形監(jiān)測過程往往受到多種隨機(jī)性因素干擾。因此,將噪聲的方差看成常數(shù)進(jìn)行建模和解算會影響算法的預(yù)測精度。對此,異方差高斯過程被提出應(yīng)用于復(fù)雜系統(tǒng)的建模。相比標(biāo)準(zhǔn)高斯過程學(xué)習(xí)算法,該方法取得更好的預(yù)測結(jié)果。HGP是標(biāo)準(zhǔn)高斯過程算法的拓展,將建模過程分成兩部分(Wang et al.,2019;史宇偉等,2014;Lzaro-Gredilla et al.,2011;嚴(yán)宏等,2018)。首先運用標(biāo)準(zhǔn)高斯過程對無噪聲輸出進(jìn)行建模,然后對噪聲再運用高斯過程進(jìn)行建模,該方法能體現(xiàn)出變形監(jiān)測量的隨機(jī)性及波動性。
HGP算法將變形量分為兩部分:
y=s+r
(1)
式中,y為變形監(jiān)測值,s為時間t對應(yīng)的理想標(biāo)準(zhǔn)值,r為對應(yīng)的偏差項。
p(s,s*)~N(0,KN+1)
(2)
式中,KN+1為此多元高斯分布的協(xié)方差矩陣,具有如下的形式:
(3)
式中,k**=k(t*,t*),k*=[k(t1,t*)k(t2,t*)…k(tN,t*)]T,KN如式(4)所示。k(ti,tj)為核函數(shù),通常采用squared exponential核函數(shù)(史宇偉等,2014)。
(4)
因此,可以利用標(biāo)準(zhǔn)高斯過程的結(jié)果計算測試集中時間t*對應(yīng)的標(biāo)準(zhǔn)值s*的后驗分布,計算公式如下:
(5)
(6)
(7)
利用高斯過程原理分別對標(biāo)準(zhǔn)值和偏差項建模后,需要對模型進(jìn)行解算,求解超參數(shù),最終得到預(yù)測變量的驗后分布(期望和方差)。根據(jù)標(biāo)準(zhǔn)高斯過程的推導(dǎo)結(jié)論,可以計算出關(guān)于s*的后驗分布p(s*|t*,y,t,r,r*):
p(s*|t*,y,t,r,r*)~N(μ*,σ2)
(8)
對r和r*進(jìn)行積分,得到y(tǒng)*的后驗分布:
(9)
由于無法直接求解式(9),因此采用變分推斷求取近似解。首先對邊緣概率p(y)的對數(shù)進(jìn)行分解,如式(10)。當(dāng)尋求分布q(s)和q(r)最大化下界時,也就會使式(10)中KL散度最小化。優(yōu)化p(s,r|y)在分解形式q(s)q(r)關(guān)于q(s)最大化的推導(dǎo)結(jié)論,可以進(jìn)一步得到一個依賴于q(r)的近似下界,如式(11)所示。
ln(p(y))=L(q(s),q(r))+KL(q(s)
q(r)‖p(s,r|y))
(10)
式中,KL(·‖·)表示KL散度(Kullback-Leibler divergence),L(q(s),q(r))是ln(p(y))的下界。根據(jù)式(11)的極值點與偏導(dǎo)數(shù)的關(guān)系,可得到μq和Σq,如式(12)和式(13)所示。
(11)
(12)
(13)
式中,tr(·)表示矩陣的跡,R為一對角矩陣,其對角元素為[R]ii=exp([μq]i-[Σq]ii),而Kr是使用協(xié)方差函數(shù)kr(t,t′)計算的協(xié)方差矩陣,Λ表示半正定對角矩陣。
采用共軛梯度法優(yōu)化參數(shù)高斯過程協(xié)方差函數(shù)中的參數(shù)、矩陣Λ中的對角線元素以及用于控制偏差項方差平均水平的μr,進(jìn)而得到s*的后驗分布:
(14)
基于以上結(jié)果,可以得到y(tǒng)*的后驗分布(Lzaro-Gredilla et al.,2011;嚴(yán)宏等,2018):
(15)
(16)
圖1 基于HGP的大壩變形預(yù)測方法建模流程Fig.1 Modeling flow of dam deformation prediction method based on HGP
以豐滿大壩為例,驗證大壩變形預(yù)測HGP模型的有效性及可靠性。豐滿水電站是中國最早建成的大型水電站,東北電網(wǎng)骨干電站之一,位于吉林省吉林市第二松花江的中游,吉林市東南為24 km處。攔江大壩為鋼筋混凝土重力壩,壩長為1 080 m,壩高為91 m,水庫正常蓄水位標(biāo)高為263.5 m,庫容為108億m3。壩體從左岸到右岸共分60個壩段,每個壩段長為18 m。本研究選取30號壩段變形數(shù)據(jù)開展變形預(yù)測模型研究,收集了大約3年的大壩變形監(jiān)測數(shù)據(jù),包括大壩變形量γ(mm)、氣溫T(℃)、上游水位H(m)和累積時間t(d)數(shù)據(jù)。顧沖時等(2016)、吳中如(2003)、陳俊風(fēng)等(2020)、王曉玲等(2020)較好地分析了豐滿大壩和類似大壩的變形影響因子,在此基礎(chǔ)上確定豐滿大壩變形的影響因子包括11個,其中4個與水位有關(guān)的影響因子H、H2、H3、H4,5個溫度有關(guān)的因子T、sin(2πt/365)、cos(2πt/365)、sin(4πt/365)、cos(4πt/365),2個時間效應(yīng)影響因子θ=0.01t、lnθ。將11個大壩變形影響因子作為HGP算法的輸入,對應(yīng)變形量作為輸出??偣彩占?64期變形數(shù)據(jù),其中前129期數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,用于確定HGP算法的超參數(shù),進(jìn)而建立變形預(yù)測模型(表1);后35期數(shù)據(jù)作為測試集,用于分析預(yù)測模型的精密度及可靠性(表2)。
表1 訓(xùn)練集中的部分?jǐn)?shù)據(jù)
表2 測試數(shù)據(jù)集
近年來,反向傳播(BP)神經(jīng)網(wǎng)絡(luò)算法、最小二乘支持向量機(jī)(LS-SVM)和標(biāo)準(zhǔn)GP在變形預(yù)測領(lǐng)域得到較好的應(yīng)用。為了進(jìn)一步驗證HGP算法具有更好的大壩變形預(yù)測精度,分別利用標(biāo)準(zhǔn)的GP算法(采用與HGP相同的核函數(shù))、BP神經(jīng)網(wǎng)絡(luò)算法和LS-SVM算法構(gòu)建大壩變形預(yù)測模型。分別對測試集進(jìn)行預(yù)測(表3)。
表3 變形預(yù)測結(jié)果
為了定量評價各預(yù)測模型的精度,采用平均絕對誤差(MAE)和均方根誤差(RMSE)評價各模型的精度,具體計算見式(17)和式(18)。根據(jù)各模型的預(yù)測結(jié)果,分別統(tǒng)計各模型的精度指標(biāo)MAE和RMSE(表3)。由表3中的4種變形預(yù)測方法的精度指標(biāo)可知,HGP算法的平均絕對誤差和均方根誤差均小于BP、LS-SVM和GP算法,驗證了HGP算法具有更好的大壩變形預(yù)測精度。HGP算法的預(yù)測精度優(yōu)于標(biāo)準(zhǔn)GP算法,表明HGP算法在標(biāo)準(zhǔn)GP的基礎(chǔ)上,充分考慮了數(shù)據(jù)噪聲變化的特點,有效改善了標(biāo)準(zhǔn)GP算法的大壩變形預(yù)測精度。
(17)
(18)
圖2 HGP的預(yù)測結(jié)果及95%置信度的置信區(qū)間圖Fig.2 HGP prediction results with the 95% confidence interval chart
針對大壩變形的特點,利用標(biāo)準(zhǔn)GP的改進(jìn)HGP算法構(gòu)建大壩變形預(yù)測新模型,并對其預(yù)測精度及可靠性進(jìn)行分析驗證。結(jié)果表明,與GP、LS-SVM、BP神經(jīng)網(wǎng)絡(luò)等算法相比,HGP算法具有更高的大壩變形預(yù)測精度和可靠性,并且彌補(bǔ)了當(dāng)前大壩變形預(yù)測方法缺少結(jié)果可靠性分析功能的缺點。