摘要:為提高大壩變形預(yù)測(cè)精度,針對(duì)變形數(shù)據(jù)影響因子間的多重共線性問題,構(gòu)建了基于核主成分分析(KPCA)、全局搜索策略的鯨魚優(yōu)化算法(GSWOA)和門控循環(huán)單元(GRU)的組合預(yù)測(cè)模型。首先利用KPCA對(duì)高維變形序列進(jìn)行降維處理,同時(shí)使用GSWOA對(duì)GRU參數(shù)進(jìn)行優(yōu)化,進(jìn)而構(gòu)建出最優(yōu)變形預(yù)測(cè)模型。以小灣特高拱壩變形數(shù)據(jù)為例,將KPCA-GSWOA-GRU模型與KPCA-WOA-GRU模型、PCA-GSWOA-GRU模型以及傳統(tǒng)模型進(jìn)行預(yù)測(cè)擬合對(duì)比。結(jié)果表明:KPCA-GSWOA-GRU模型有效降低了多重共線性問題,且在均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)和決定系數(shù)(R2)等方面均優(yōu)于對(duì)比模型。
關(guān) 鍵 詞:特高拱壩;變形監(jiān)測(cè);降維分析;核主成分分析(KPCA);全局搜索策略的鯨魚優(yōu)化算法(GSWOA);門控循環(huán)單元(GRU);小灣水電站
中圖法分類號(hào):TV698.1
文獻(xiàn)標(biāo)志碼:ADOI:10.16232/j.cnki.1001-4179.2024.10.033
0 引 言
在混凝土壩長(zhǎng)期服役過程中,受多種內(nèi)外因素協(xié)同影響,結(jié)構(gòu)狀態(tài)不斷劣化。大壩變形為結(jié)構(gòu)狀態(tài)的直觀表征[1-2],對(duì)其精準(zhǔn)預(yù)測(cè)是保障大壩安全運(yùn)行的重要手段?;谧冃闻c其影響因子間數(shù)學(xué)關(guān)系而構(gòu)建的統(tǒng)計(jì)模型,如多元回歸和逐步回歸,因其數(shù)學(xué)關(guān)系簡(jiǎn)單、計(jì)算高效,在工程實(shí)踐中得到廣泛應(yīng)用。然而,這些方法對(duì)于數(shù)據(jù)中存在的多重共線性問題仍無法有效地進(jìn)行處理,這導(dǎo)致模型預(yù)測(cè)精度總體不高[3-4]。近年來隨著多學(xué)科交融、人工智能科技異軍突起,眾多機(jī)器學(xué)習(xí)方法如支持向量機(jī)[5-7]、人工神經(jīng)網(wǎng)絡(luò)[8]、極限學(xué)習(xí)機(jī)[9]、循環(huán)神經(jīng)網(wǎng)絡(luò)[10-12]等廣泛應(yīng)用于大壩變形預(yù)測(cè)中。張才溢等[7]在孿生支持向量機(jī)的框架下引入位置和速度因子,并結(jié)合自適應(yīng)粒子群優(yōu)化(adapitve particle swarm optimizati,APSO)算法進(jìn)行尋優(yōu),建立了針對(duì)特高拱壩的APSO-TWSVM預(yù)測(cè)模型;該模型相較于傳統(tǒng)模型,在處理變形與影響因子之間的非線性關(guān)系方面有顯著提升。李明軍等[13]運(yùn)用差分進(jìn)化算法豐富初始種群,結(jié)合改進(jìn)的灰狼算法(multi-objective grey wolf optimizer,MGWO)與支持向量機(jī)(support vector machine,SVM)構(gòu)建大壩變形預(yù)測(cè)模型。歐斌等[11]應(yīng)用長(zhǎng)短期記憶網(wǎng)絡(luò)(long short term memory network,LSTM)構(gòu)建了混凝土壩變形預(yù)測(cè)模型,該模型具備出色的非線性數(shù)據(jù)分析能力。這些模型算法改進(jìn)有效減少了因子間的多重共線性影響,并顯著提升了預(yù)測(cè)模型的精度。研究還發(fā)現(xiàn),降低輸入變量的維度能有效消除多重共線性影響,進(jìn)而提高預(yù)測(cè)模型的精度和效率。如馬杰等[14]針對(duì)裂縫開合度時(shí)間序列數(shù)據(jù),利用主成分分析法(principal component analysis,PCA)提取原始自變量監(jiān)測(cè)數(shù)據(jù)的主成分,以降低模型輸入數(shù)據(jù)的維度,并構(gòu)建了基于PCA-PSO-GRU的裂縫高精度預(yù)測(cè)模型。漆一寧等[15]對(duì)大壩變形影響因子與分量之間的關(guān)系進(jìn)行分析,利用LSTM模型構(gòu)建了變形監(jiān)測(cè)模型,該模型融合灰狼算法、最小能量誤差標(biāo)準(zhǔn)和最小冗余最大相關(guān)性方法,實(shí)現(xiàn)了建模的最優(yōu)化。牛景太等[16]引入核獨(dú)立成分分析(kernel independent component analysis,KICA)方法,對(duì)多個(gè)測(cè)點(diǎn)數(shù)據(jù)以及相關(guān)影響因素進(jìn)行非線性提取,對(duì)大壩變形數(shù)據(jù)的多元共線性進(jìn)行了處理,以提升模型的預(yù)測(cè)精度。
本文使用核主成分分析法(kernel principal component analysis,KPCA)將數(shù)據(jù)映射到高維空間,以增強(qiáng)數(shù)據(jù)的可分性。KPCA利用核函數(shù)將原始數(shù)據(jù)轉(zhuǎn)換到高維特征空間,增強(qiáng)了表達(dá)能力,有助于處理非線性關(guān)系。同時(shí)利用KPCA提取原始自變量的主成分,降低模型輸入數(shù)據(jù)維度;然后將全局搜索策略的鯨魚優(yōu)化算法(global search strategy whale optimization algorithm,GSWOA)應(yīng)用于門控循環(huán)單元(gated recurrent unit,GRU)模型參數(shù)尋優(yōu),以提升模型預(yù)測(cè)精度,最終構(gòu)建了KPCA-GSWOA-GRU組合預(yù)測(cè)模型,并通過實(shí)例分析驗(yàn)證了其可行性。
1 基于核主成分分析的降維處理
1.1 核主成分分析法(KPCA)
首先將大壩變形數(shù)據(jù)作為訓(xùn)練集h=h,h,…,h,其中第k個(gè)訓(xùn)練集h∈R,k=1,2,…,n,n為訓(xùn)練集總數(shù),h可由多個(gè)自變量組成。定義非線性映射φ(h),R→F,通過函數(shù)φ(h)可將訓(xùn)練集映射到高維特征空間F中[17]。若映射均值為0,即1n∑nk=1φ(h)=0,則F空間中的訓(xùn)練集協(xié)方差矩陣C為[18]
C=1n∑nk=1φ(h)φ(h)T(1)
所對(duì)應(yīng)的特征方程為
λV=CV(2)
式中:λ為特征值所構(gòu)成的向量;V為特征向量。
所有具有非零特征值的特征向量V,都可以通過對(duì)樣本向量在特征空間中的線性表示得到。故存在系數(shù)?,使下式成立:
將方程(1)和(3)代入方程(2),然后對(duì)等式兩邊進(jìn)行內(nèi)積運(yùn)算φ(h)(j=1,2,…,n),變量j與k可以是相等的(也可不等),同時(shí)定義一個(gè)n×n的核函數(shù)K,然后求取矩陣K的特征值和特征向量:
核函數(shù)K的各元素K為
K=K(h,h)=[φ(h)·φ(h)](5)
式中:K(h,h)為核函數(shù)。
選擇較大特征值對(duì)應(yīng)的特征向量來構(gòu)建特征子空間。假設(shè)提取m個(gè)特征向量β1,β2,…,βm,其中βi=(β1,β2,…,βi),i=1,2,…,m,通過下式對(duì)F空間的相應(yīng)主元v進(jìn)行歸一化處理[18]:
λ(βi·βi)=1(6)
式中:λ為相應(yīng)主元v對(duì)應(yīng)的特征值。
變形數(shù)據(jù)h均可映射至F空間中,表示為(r,r,…,r),其中投影分量r(i=1,2,…,m)為
r=vφ(h)=∑mj=1βiK(h,h)(7)
實(shí)際數(shù)據(jù)并不滿足均值為零的情況。故將核矩陣K變?yōu)镵—:
K—=K-LK-KL+LKL(8)
式中:L為n×n單位矩陣,系數(shù)為1/n。
1.2 降維方法對(duì)比分析
為驗(yàn)證本文降維方法的優(yōu)越性,本文利用傳統(tǒng)主成分分析(PCA)與核主成分分析(KPCA)對(duì)同一組大壩原始序列進(jìn)行了降維處理,效果如圖1所示。
由圖1可見,在處理高維非線性數(shù)據(jù)時(shí),KPCA較PCA表現(xiàn)出更優(yōu)越的性能。PCA傾向于捕捉數(shù)據(jù)中方差較大的方向,未能充分揭示數(shù)據(jù)的內(nèi)在非線性結(jié)構(gòu)。相比之下,KPCA通過引入核函數(shù)技術(shù),可有效處理原始空間中的非線性不可分?jǐn)?shù)據(jù),揭示出數(shù)據(jù)中的復(fù)雜非線性關(guān)系。因此,核函數(shù)的引入顯著提升了降維性能,凸顯了KPCA在解析復(fù)雜數(shù)據(jù)結(jié)構(gòu)方面的優(yōu)勢(shì)。
2 GSWOA-GRU預(yù)測(cè)模型
2.1 門控循環(huán)單元(GRU)
門控循環(huán)單元(GRU)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,與長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)相比,GRU將遺忘門和輸入門整合為更新門,使其結(jié)構(gòu)更簡(jiǎn)潔,訓(xùn)練更為便捷,有效提升了運(yùn)行效率和訓(xùn)練效果[19]。GRU網(wǎng)絡(luò)結(jié)構(gòu)見圖2。
更新門公式如下:
重置門公式如下:
當(dāng)前t時(shí)刻隱含層的激活狀態(tài)為
前t時(shí)刻的隱含層狀態(tài)為
h=(1-z)*h+z*h~(12)
式中:z和r分別為更新門和重置門,更新門決定了前一時(shí)刻的狀態(tài)信息有多少被帶入當(dāng)前狀態(tài),取值越大表明帶入的信息越多;重置門控制前一時(shí)刻的狀態(tài)信
息被帶入候選集h~的程度,取值越小則被帶入的信息越少。h為前一時(shí)刻的隱含層狀態(tài)輸出;W為更新門的權(quán)重矩陣;W為重置門的權(quán)重矩陣;W為輸入層到隱含層的權(quán)重矩陣;σ、tanh分別為Sigmoid、tanh激活函數(shù); 為Hadmard積運(yùn)算;*表示前后兩個(gè)因素的點(diǎn)乘關(guān)系;x為偏置值[19]。
2.2 全局搜索策略的鯨魚優(yōu)化算法(GSWOA)
鑒于GRU參數(shù)對(duì)模型訓(xùn)練性能有顯著影響,為提高預(yù)測(cè)精度,本文采用全局搜索策略的鯨魚優(yōu)化算法(GSWOA)尋求最優(yōu)參數(shù)解。傳統(tǒng)鯨魚優(yōu)化算法(whale optimization algorithm,WOA)因其結(jié)構(gòu)簡(jiǎn)單、參數(shù)較少,在多元函數(shù)求解速度及精確度上優(yōu)于其他算法[20-21]。然而,WOA在全局搜索能力和優(yōu)解精度方面卻存在不足。本文通過引入全局搜索策略改進(jìn)WOA,以提升其全局搜索能力和優(yōu)解精度[22]。其算法具體優(yōu)化方式如下:
2.2.1 自適應(yīng)權(quán)重
在鯨魚位置更新過程中,增加一個(gè)會(huì)隨迭代次數(shù)的增加而改變的慣性權(quán)重ω。
ω(t)=0.2cosπ2·1-tt(13)
式中:慣性權(quán)值ω是一種存在于[0,1]區(qū)間內(nèi)的非線性轉(zhuǎn)變;t為迭代次數(shù);t為最大迭代次數(shù)。
改進(jìn)的鯨魚優(yōu)化算法的位置更新公式可以表述為
式中:X為鯨魚位置;X*為全局最優(yōu)位置;X為鯨魚可能存在的隨機(jī)點(diǎn)位;b為常數(shù);l是從[-1,1]區(qū)間內(nèi)取出的隨機(jī)數(shù);p為[0,1]中取值的任意數(shù);D為搜索半徑;ω為慣性權(quán)值[22];A和C為系數(shù)矩陣,表達(dá)式如下:
式中:r,r為[0,1]的隨機(jī)數(shù);a為收斂因子。
2.2.2 變螺旋位置更新
當(dāng)鯨魚搜索獵物時(shí),它會(huì)根據(jù)與目標(biāo)點(diǎn)之間的螺旋形狀來調(diào)整每次位置更新的移動(dòng)距離。通過設(shè)定參數(shù)b隨著迭代次數(shù)的增加而遞減,搜索軌跡逐漸呈現(xiàn)螺旋狀,這種調(diào)整有效提高了算法的全局搜索能力。新的旋轉(zhuǎn)搜尋數(shù)學(xué)模型為
2.2.3 最優(yōu)領(lǐng)域波動(dòng)
本文采用最優(yōu)領(lǐng)域波動(dòng)搜索提高算法收斂速度,公式如下:
X′(t)=X*(t)+0.5·rand1·X*(t)rand2<0.5
X*(t)rand2≥0.5(18)
式中:rand1和rand2為[0,1]間的隨機(jī)數(shù);X′(t)為隨機(jī)搜索出的新位置。若新的位置優(yōu)于最優(yōu)位置,則將兩者進(jìn)行交換,否則最優(yōu)位置不變。
針對(duì)新產(chǎn)生的位置,運(yùn)用貪心算法去評(píng)估其是否應(yīng)被保留,具體公式如下:
X*(t)=X′(t)f(X*(t))>f(X′(t))
X*(t)f(X*(t))≤f(X′(t))(19)
式中:f(x)為x的位置適應(yīng)值;X′(t)為隨機(jī)搜索出的新位置。
GSWOA-GRU模型構(gòu)建步驟如下:
(1)初始化鯨魚群體。生成一組隨機(jī)的鯨魚,其中每一只代表GRU模型的一組潛在參數(shù)。
(2)計(jì)算適應(yīng)度。針對(duì)每只鯨魚的參數(shù),利用GRU模型在訓(xùn)練集或驗(yàn)證集上進(jìn)行性能評(píng)估,通過計(jì)算交叉驗(yàn)證誤差來確定適應(yīng)度。
(3)確定最優(yōu)解。發(fā)現(xiàn)鯨魚群體中的當(dāng)前最優(yōu)解,該解將指導(dǎo)其他鯨魚更新其位置。
(4)更新位置。根據(jù)鯨魚優(yōu)化算法的搜索機(jī)制,結(jié)合當(dāng)前最優(yōu)解的位置,更新鯨魚的位置。
(5)迭代搜索。通過反復(fù)執(zhí)行上述步驟,每次迭代后更新最優(yōu)解,并根據(jù)全局搜索策略調(diào)整搜索行為,直至滿足終止條件。
(6)參數(shù)確定及最終模型訓(xùn)練。在迭代結(jié)束時(shí),將最優(yōu)解(最佳鯨魚位置)作為GRU模型的參數(shù)。使用優(yōu)化后的參數(shù)重新對(duì)GRU模型進(jìn)行訓(xùn)練,以確保模型充分學(xué)習(xí)了數(shù)據(jù)特征。
3 組合預(yù)測(cè)模型構(gòu)建
基于KPCA-GSWOA-GRU的組合預(yù)測(cè)模型具體工作流程見圖3,主要包括數(shù)據(jù)處理、模型構(gòu)建、模型預(yù)測(cè)3部分。細(xì)分步驟有:
(1)數(shù)據(jù)預(yù)處理。收集目標(biāo)數(shù)據(jù)并進(jìn)行標(biāo)準(zhǔn)化處理以消除量綱的影響,確保數(shù)據(jù)一致性。
(2)特征工程。采用KPCA進(jìn)行數(shù)據(jù)的降噪和特征提取,選擇主要成分作為預(yù)測(cè)變量,并將數(shù)據(jù)集分割為訓(xùn)練集和測(cè)試集。
(3)模型優(yōu)化。通過GSWOA優(yōu)化GRU的參數(shù)設(shè)置,采用特定的初始化和迭代過程,以找到最佳參數(shù)。
(4)模型構(gòu)建。將優(yōu)化后的參數(shù)應(yīng)用于GRU網(wǎng)絡(luò),完成預(yù)測(cè)模型的構(gòu)建。
(5)模型評(píng)估。運(yùn)用均方根誤差(RMSE)和決定系數(shù)(R2)等統(tǒng)計(jì)指標(biāo)在測(cè)試集上對(duì)模型性能進(jìn)行評(píng)估和驗(yàn)證。
4 工程應(yīng)用
小灣水電站位于云南省瀾滄江中游河段,工程主體包括混凝土雙曲拱壩、水墊塘、二道壩、泄洪洞和地下引水發(fā)電系統(tǒng)?;炷岭p曲拱壩的最大高度為294.5 m,其拱冠梁在最窄處寬度為13 m,最寬處達(dá)69.49 m。壩頂高程1 245 m,正常蓄水位1 240.00 m,總庫容達(dá)150億m3。其中,變形監(jiān)測(cè)設(shè)施(正倒垂線)布置方案、上下游水位和溫度變化如圖4所示。為驗(yàn)證模型可靠性,選取拱冠梁處A22-PL-02和A22-PL-04測(cè)點(diǎn)的1 000組數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,并將大壩原始變形序列按8∶2的比例劃分為訓(xùn)練集和測(cè)試集。
4.1 數(shù)據(jù)預(yù)處理與影響因子構(gòu)建
在收集大壩變形監(jiān)測(cè)原型數(shù)據(jù)的過程中,面臨了一系列技術(shù)挑戰(zhàn),包括設(shè)備功能故障和數(shù)據(jù)傳輸問題,導(dǎo)致數(shù)據(jù)集中存在少量缺失。為確保訓(xùn)練預(yù)測(cè)模型所需的數(shù)據(jù)完整性,對(duì)于部分缺失的監(jiān)測(cè)數(shù)據(jù)采用三次Hermite插值法進(jìn)行數(shù)據(jù)補(bǔ)充。大壩位移變形主要由水壓分量δ,溫度分量δ及時(shí)效分量δ構(gòu)成,對(duì)于拱壩而言:
δ=∑4i=1a(Hi-Hi)
δ=∑2i=1bsin(2πit365)-sin(2πit365)+
bcos(2πit365)-cos(2πit365)
δ=c(θ-θ)-c(lnθ-lnθ)(20)
式中:H,H分別為特定時(shí)刻的上游水位和壩基水位高程;t,t分別為變形數(shù)據(jù)特定時(shí)刻和選定基準(zhǔn)時(shí)刻;θ,θ分別為t,t與100的比值;a,b,b,c,c為擬合系數(shù)。由此得到水壓影響因子為Hi-Hi(i=1,2,3,4),溫度影響因子為sin(2πit365)-sin(2πit365)和cos(2πit365)-cos(2πit365)(i=1,2,…,n),時(shí)效影響因子為θ-θ和lnθ-lnθ。
為了確保模型精度不受特征值域差異的影響,并統(tǒng)一特征間的尺度,本文采用最小-最大歸一化方法,將數(shù)據(jù)范圍調(diào)整到固定區(qū)間(通常為0~1),使不同特征在相同尺度下可比較。歸一化處理不僅有助于提高算法的收斂速度,還增強(qiáng)了模型在處理不同量級(jí)特征時(shí)的穩(wěn)定性和性能。
4.2 原始數(shù)據(jù)多重共線性分析
對(duì)大壩原始數(shù)據(jù)進(jìn)行歸一化處理后,利用KPCA進(jìn)行高維特征空間分析。首先,通過計(jì)算核矩陣獲得特征值和特征向量,以識(shí)別和提取主成分,并依據(jù)其在數(shù)據(jù)方差中的表示能力進(jìn)行排序,優(yōu)先選擇累計(jì)貢獻(xiàn)率較高的主成分(表1)。這一過程不僅降低了數(shù)據(jù)維度,通過有限主成分替代原始參數(shù),還簡(jiǎn)化了模型結(jié)構(gòu),有效避免過擬合,增強(qiáng)了模型對(duì)未知數(shù)據(jù)的泛化能力。
根據(jù)表1的分析,前4個(gè)特征值顯著大于其他特征值,累計(jì)貢獻(xiàn)率達(dá)到99.58%,表明原始變量之間存在多重共線性。因此,本文選取前4個(gè)主成分作為所
有輸入變量的代表。這一選擇不僅壓縮了數(shù)據(jù)維度,還保留了數(shù)據(jù)集中的大部分信息,從而提高了后續(xù)模型訓(xùn)練的效率和精度。
為驗(yàn)證本文模型能夠有效處理數(shù)據(jù)中的多重共線性,采用方差膨脹因子(VIF)進(jìn)行分析。其核心思想是計(jì)算每個(gè)特征與其他特征的相關(guān)性,并利用方差膨脹因子值表示每個(gè)特征的相關(guān)性程度。方差膨脹因子的計(jì)算方法是將每個(gè)特征視為因變量,其他特征視為自變量,擬合線性回歸模型,然后計(jì)算自變量與因變量的均方誤差比值[23-24],即:
式中:R2為指標(biāo)變量i的可決系數(shù);VIF為指標(biāo)變量i的方差膨脹因子;p^為j地區(qū)指標(biāo)變量i的估計(jì)值;p—為指標(biāo)變量i的均值。當(dāng)0≤VIF≤10時(shí),表示沒有多重共線性;當(dāng)10<VIF≤100時(shí),表明存在較強(qiáng)的多重共線性;而當(dāng)VIF>100時(shí),則表示存在嚴(yán)重的多重共線性[24]。
4.3 KPCA核函數(shù)對(duì)比
KPCA是將線性主成分分析推廣到非線性領(lǐng)域的一種方法,整個(gè)過程通過引入核函數(shù)來實(shí)現(xiàn)。核函數(shù)的選擇涉及兩個(gè)方面:核函數(shù)類型的選擇和相關(guān)參數(shù)的選擇。不同KPCA核函數(shù)對(duì)比如圖5所示。
由圖5可知,RBF核KPCA模型的預(yù)測(cè)效果明顯優(yōu)于Poly核和Sigmoid核KPCA模型。Poly核和Sigmoid核KPCA模型僅能預(yù)測(cè)變形趨勢(shì),而無法有效反映其波動(dòng)。盡管線性核KPCA模型能夠較好地適應(yīng)變形預(yù)測(cè),但其擬合精度相對(duì)于RBF核KPCA模型較差。因此,本文選擇RBF核KPCA模型用于預(yù)測(cè)大壩變形。
4.4 模型對(duì)比
在確定最優(yōu)KPCA核函數(shù)后,設(shè)置最終模型參數(shù)也是至關(guān)重要的。設(shè)置GSWOA算法中鯨魚群體為10,迭代50次,利用A22-PL-02和A22-PL-04測(cè)點(diǎn)的1 000組數(shù)據(jù)進(jìn)行預(yù)測(cè)(其中800組用于訓(xùn)練,200組用于測(cè)試)。核函數(shù)參數(shù)設(shè)置為2,PCA維度設(shè)置為5。適應(yīng)度函數(shù)被設(shè)定為平均絕對(duì)誤差(MAE)。為驗(yàn)證KPCA-GSWOA-GRU模型的性能,分別構(gòu)建PCA-GSWOA-GRU模型和KPCA-WOA-GRU模型,將它們的適應(yīng)度值進(jìn)行對(duì)比(圖6)。
由圖6可知,KPCA-GSWOA-GRU模型呈現(xiàn)快速下降后趨于穩(wěn)定的趨勢(shì)。這表明所構(gòu)建的模型能夠有效且迅速地找到較優(yōu)解,具有更好的速降性。而其他兩種對(duì)比模型波動(dòng)較大,這表明算法在優(yōu)化過程中可能存在不穩(wěn)定性,需要進(jìn)一步調(diào)整和優(yōu)化。
在大壩變形預(yù)測(cè)模型中,本文利用GSWOA優(yōu)化GRU模型參數(shù),通過有效搜索參數(shù)空間,使模型能夠更好地適應(yīng)數(shù)據(jù),并減少了模型參數(shù)之間的相關(guān)性,從而有助于降低多重共線性的影響。
為了驗(yàn)證本文所建立模型的預(yù)測(cè)性能,建立了PCA-GSWOA-GRU模型、KPCA-WOA-GRU模型以及傳統(tǒng)模型作為對(duì)照模型。所有模型均使用相同的原始變形序列,并確保訓(xùn)練集和測(cè)試集的一致性。采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)、相關(guān)系數(shù)(R2)來評(píng)估各模型的預(yù)測(cè)準(zhǔn)確性。各模型的測(cè)試集擬合預(yù)測(cè)曲線見圖7,測(cè)試集殘差曲線見圖8,各模型評(píng)價(jià)指標(biāo)見表2。
由圖7可知,相較于PCA-GSWOA-GRU模型、KPCA-WOA-GRU模型及其他傳統(tǒng)模型,KPCA-GSWOA-GRU模型在預(yù)測(cè)性能上均有提升,同時(shí)在去除高共線性變量后的數(shù)據(jù)集上表現(xiàn)穩(wěn)定,說明模型具有一定的抗共線性能力。以表2的A22-PL-04測(cè)點(diǎn)為例,KPCA-GSWOA-GRU模型在MAE、MAPE、RMSE方面相較于KPCA-WOA-GRU模型分別降低了0.264 8 mm、2.96%和0.315 9 mm,且R2提高了0.095 6。這表明GSWOA算法相較于WOA算法更有效地優(yōu)化了GRU模型參數(shù),從而顯著提升了預(yù)測(cè)精度。相較于PCA-GSWOA-GRU模型,KPCA-GSWOA-GRU模型在MAE、MAPE、RMSE上分別降低了0.109 0 mm、1.08%和0.171 2 mm,R2提高了0.025 6。這表明,KPCA在處理大壩變形影響因子的降維過程中,能夠?qū)?shù)據(jù)映射到更高維的特征空間,并應(yīng)用核技術(shù)有效處理非線性問題,從而在數(shù)據(jù)預(yù)處理和特征提取方面性能更優(yōu)。
本文所構(gòu)建模型相較于傳統(tǒng)模型的優(yōu)勢(shì)如下:① 相較于GRU,KPCA能夠有效降維,提取主要特征,提高模型泛化能力。同時(shí),GSWOA優(yōu)化GRU的超參數(shù)和初始權(quán)重,避免了陷入局部最優(yōu)解。② 相較于CNN,GRU能保留和更新序列信息,并通過KPCA降維和GSWOA優(yōu)化,減少過擬合風(fēng)險(xiǎn),提高泛化能力。③ KPCA在處理非線性數(shù)據(jù)上優(yōu)于傳統(tǒng)的SVM核方法,可以更好地捕捉數(shù)據(jù)復(fù)雜關(guān)系,GRU在處理時(shí)序數(shù)據(jù)方面比SVM更具優(yōu)勢(shì),能學(xué)習(xí)數(shù)據(jù)的時(shí)間依賴性。④ 相較于ELM,GRU的學(xué)習(xí)能力更強(qiáng),能夠處理復(fù)雜模式和長(zhǎng)時(shí)間依賴。⑤ 相較于BP神經(jīng)網(wǎng)絡(luò),KPCA在非線性特征提取上有明顯優(yōu)勢(shì),BP神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜非線性時(shí)可能需要更多隱藏層和神經(jīng)元。GRU專為處理時(shí)間序列數(shù)據(jù)設(shè)計(jì),比BP神經(jīng)網(wǎng)絡(luò)更有效率,能更好地捕捉時(shí)間依賴性。
同時(shí)為驗(yàn)證此模型是否能夠較好地處理數(shù)據(jù)多重共線性,本文分析了大壩原始變形數(shù)據(jù)與上下游水位和溫度變化的多重共線性,并且在模型訓(xùn)練后使用方差膨脹因子(VIF)檢驗(yàn)來評(píng)估多重共線性的程度(表3)。
由表3可知,各變量的VIF值最高為1.22(氣溫),最低為1.09(下游水位),平均為1.16。這表明模型有效降低了變量之間的多重共線性,每個(gè)解釋變量均提供了獨(dú)特的信息,不會(huì)對(duì)預(yù)測(cè)準(zhǔn)確性產(chǎn)生負(fù)面影響。因此,本文所構(gòu)建的模型適合進(jìn)行進(jìn)一步的回歸分析。
由圖8測(cè)試集殘差曲線可知,KPCA-GSWOA-GRU模型的殘差波動(dòng)接近于零,表明模型良好地捕捉了變形趨勢(shì)。相較之下,其他組合模型的殘差呈現(xiàn)明顯變化趨勢(shì)或不規(guī)則波動(dòng),表明存在擬合誤差或未能捕捉數(shù)據(jù)中的某些重要特征。
5 結(jié) 論
(1)采用KPCA對(duì)原始數(shù)據(jù)進(jìn)行非線性降維,有效提取了混凝土壩變形的關(guān)鍵特征向量,為精確預(yù)測(cè)模型提供了關(guān)鍵輸入。通過融入自適應(yīng)調(diào)整機(jī)制和鄰域探索策略,GSWOA算法加快了優(yōu)化過程并提升了預(yù)測(cè)精度。最終,結(jié)合GRU構(gòu)建了KPCA-GSWOA-GRU模型,可有效捕捉混凝土壩變形的時(shí)間動(dòng)態(tài)特征。
(2)實(shí)例分析表明,KPCA-GSWOA-GRU模型能夠準(zhǔn)確模擬大壩實(shí)際變形數(shù)據(jù),并有效降低多重共線性,證明了其在混凝土壩變形預(yù)測(cè)中的有效性和準(zhǔn)確性。通過對(duì)比KPCA與PCA的降維方法,驗(yàn)證了KPCA在數(shù)據(jù)降維處理中的優(yōu)越性,并通過比較KPCA不同核函數(shù)的預(yù)測(cè)性能,選取了最優(yōu)核函數(shù)進(jìn)行預(yù)測(cè)。最終,將該模型與其他對(duì)比模型進(jìn)行比較,評(píng)價(jià)指標(biāo)顯示該模型具備優(yōu)越的泛化能力和穩(wěn)定性,證明了其對(duì)新數(shù)據(jù)集的良好適應(yīng)性和應(yīng)用潛力。
參考文獻(xiàn):
[1] 顧沖時(shí),蘇懷智,劉何稚.大壩服役風(fēng)險(xiǎn)分析與管理研究述評(píng)[J].水利學(xué)報(bào),2018,49(1):26-35.
[2] 鈕新強(qiáng).大壩安全診斷與加固技術(shù)[J].水利學(xué)報(bào),2007(增1):60-64.
[3] 吳中如,顧沖時(shí),蘇懷智,等.水工結(jié)構(gòu)工程分析計(jì)算方法回眸與發(fā)展[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,43(5):395-405.
[4] 吳中如.大壩與壩基安全監(jiān)控理論和方法及其應(yīng)用研究[J].江蘇科技信息,2005(12):1-6.
[5] SU H Z,CHEN Z X,WEN Z P.Performance improvement method of support vector machine-based model monitoring dam safety[J].Structural Control and Health Monitoring,2016,23(2):252-266.
[6] SU H Z,LI X,YANG B B,et al.Wavelet support vector machine-based prediction model of dam deformation[J].Mechanical Systems and Signal Processing,2018,110:412-427.
[7] 張才溢,傅蜀燕,歐斌,等.基于APSO和TWSVM的特高拱壩變形預(yù)測(cè)模型[J].水利水電科技進(jìn)展,2023,43(4):46-51.
[8] WANG X Y,YANG K,SHEN C S.Study on MPGA-BP of gravity dam deformation prediction[J].Mathematical Problems in Engineering,2017,32:2586107.
[9] CAO E H,BAO T F,GU C S,et al.A novel hybrid decomposition-ensemble prediction model for dam deformation[J].Applied Sciences,2020,10(16):5700.
[10]歐斌,張才溢,傅蜀燕,等.基于CNN-BiLSTM的特高拱壩變形預(yù)測(cè)模型[J/OL].排灌機(jī)械工程學(xué)報(bào),1-8[2024-02-21].http:∥kns.cnki.net/kcms/detail/32.1814.TH.20231101.1538.002.html.
[11]歐斌,吳邦彬,袁杰,等.基于LSTM的混凝土壩變形預(yù)測(cè)模型[J].水利水電科技進(jìn)展,2022,42(1):21-26.
[12]XU G Y,LU Y W,JING Z X,et al.IEALL:dam deformation prediction model based on combination model method[J].Applied Sciences,2023,13(8):5160.
[13]李明軍,王均星,潘江洋,等.基于改進(jìn)GWO和SVM的大壩變形預(yù)測(cè)[J].水力發(fā)電,2021,47(3):89-93.
[14]馬杰,劉曉青,黃永濤.基于PCA-PSO-GRU模型的重力拱壩誘導(dǎo)縫開合度預(yù)測(cè)[J].水電能源科學(xué),2023,41(2):95-99.
[15]漆一寧,蘇懷智,姚可夫,等.耦合時(shí)序特征分解篩選的大壩變形分析模型[J].水力發(fā)電學(xué)報(bào),2023,42(7):56-68.
[16]牛景太,周華,吳邦彬,等.考慮多重共線性影響的特高拱壩時(shí)空監(jiān)控模型[J].水利水電科技進(jìn)展,2023,43(1):29-35.
[17]徐曄,杜文莉,錢鋒.基于核主元分析和最小二乘支持向量機(jī)的軟測(cè)量建模[J].系統(tǒng)仿真學(xué)報(bào),2007(17):3873-3875,3918.
[18]馬春輝,楊杰,程琳,等.基于KPCA-RVM的土石壩沉降預(yù)測(cè)模型研究[J].西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,45(1):211-217.
[19]WEN Z P,ZHOU R L,SU H Z.MR and stacked GRUs neural network combined model and its application for deformation prediction of concrete dam[J].Expert Systems with Applications,2022,201:117272.
[20]MIRJALILI S,LEWIS A.The whale optimization algorithm[J].Advances in Engineering Software,2016,95(5):51-67.
[21]OILVA D,AZIZ M A E,HASSANIEN A E.Parameter estimation of photovoltaic cells using an improved chaotic whale optimization algorithm[J].Applied Energy,2017,200(8):141-154.
[22]劉磊,白克強(qiáng),但志宏,等.一種全局搜索策略的鯨魚優(yōu)化算法[J].小型微型計(jì)算機(jī)系統(tǒng),2020,41(9):1820-1825.
[23]萬祥,魏博文,徐富剛,等.融合小波閾值與多維自回歸的時(shí)序預(yù)報(bào)模型研究[J].人民長(zhǎng)江,2023,54(7):203-209.
[24]朱佳慧,于麗英.我國(guó)科技創(chuàng)新與金融發(fā)展的耦合協(xié)同測(cè)度:基于VIF-變異系數(shù)的篩選[J].上海大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,27(4):785-794.
(編輯:胡旭東)
Monitoring model for super high arch dams based on KPCA dimension reduction analysisWANG Zixuan1,2,CHEN Dehui1,2,OU Bin1,2,YANG Shiyong1,2,F(xiàn)U Shuyan1,2
(1.College of Water Conservancy,Yunnan Agricultural University,Kunming 650201,China; 2.Yunnan Province Research Center for Smart Management and Maintenance of small and medium-sized Water Conservancy Projects,Kunming 650201,China)
Abstract: In order to improve the prediction accuracy of dam deformation,a prediction model based on kernel principal component analysis (KPCA),global search strategy whale optimization algorithm (GSWOA) and gated recurrent unit (GRU) was constructed to solve the multicollinearity problem among influence factors of deformation data.Firstly,KPCA was used to reduce the dimension of high-dimensional deformation sequence,and then GSWOA was used to optimize the GRU parameters,so the optimal deformation prediction model was constructed.Taking the deformation data of Xiaowan super high arch dam as an example,the prediction effect of KPCA-GSWOA-GRU model was compared with KPCA-WOA-GRU model,PCA-GSWOA-GRU model and traditional models.The results showed that the KPCA-GSWOA-GRU model not only effectively reduced the multicollinearity problem,but also outperformed the compared model in terms of root mean square error (RMSE),mean absolute error (MAE),mean absolute percentage error (MAPE) and coefficient of determination (R2).The research results provide a theoretical basis and technical support for verifying the validity of KPCA-GSWOA-GRU model on a wider data set and its application in other dam deformation prediction in the future.
Key words: super high arch dam;deformation monitoring;dimension reduction analysis;kernel principal component analysis (KPCA);global search strategy whale optimization algorithm (GSWOA);gated recurrent unit (GRU) ;Xiaowan Hydropower Station