繆新穎,單玉鵬,紀(jì)建偉
(1. 大連海洋大學(xué)a.信息工程學(xué)院, b.食品科學(xué)與工程學(xué)院,遼寧大連116023;2. 沈陽農(nóng)業(yè)大學(xué) 信息與電氣工程學(xué)院,沈陽110161)
水庫大壩的安全直接關(guān)系到水庫的正常使用和下游農(nóng)田及農(nóng)村的安全[1]。在中國現(xiàn)存的大壩中,土石壩居多,而在影響土石壩安全的因素中,滲流占有很大的比例[2]。因此,及時(shí)分析滲流監(jiān)測數(shù)據(jù)和做出可靠的水庫大壩安全預(yù)測非常重要[3]。一些統(tǒng)計(jì)模型[4]被用于安全評價(jià)分析和預(yù)測,在一定程度上可以揭示水庫大壩效應(yīng)變量與其影響因素之間的定量關(guān)系[5],然而數(shù)學(xué)模型通常是基于一些假設(shè),如:觀測值之間相互獨(dú)立的,誤差滿足正態(tài)分布,誤差的數(shù)學(xué)期望值是0等[6-7]。此外,數(shù)學(xué)模型的輸入量選擇不當(dāng),模型的準(zhǔn)確性將受到很大影響[7]。
神經(jīng)網(wǎng)絡(luò)作為一種非線性優(yōu)化工具[8-9],適應(yīng)水庫大壩滲流及其影響因素之間的非線性關(guān)系,已被許多研究者采用[10-15]。然而,傳統(tǒng)的BP(back propagation)神經(jīng)網(wǎng)絡(luò)在收斂速度[16-18]和泛化能力[19-22]等方面存在缺陷,而且大多數(shù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是通過試湊法[23]確定的,耗時(shí)較長[24]。此外,神經(jīng)網(wǎng)絡(luò)影響因素確定的準(zhǔn)確與否對預(yù)測結(jié)果至關(guān)重要[24]。Levenberg marquardt (LM)算法[25]采用Gauss-Newton 法搜索最優(yōu)值,下降速度快[26],通過自適應(yīng)調(diào)整網(wǎng)絡(luò)權(quán)值,使每次迭代不再沿單一的負(fù)梯度方向進(jìn)行,從而大大提高網(wǎng)絡(luò)的收斂速度和泛化能力[5,7]。遺傳算法(genetic algorithm, GA)[27]是受達(dá)爾文進(jìn)化論的啟發(fā),利用編碼串種群表示參數(shù),基于一定的適應(yīng)度函數(shù),由遺傳算子選擇個(gè)體,通過連續(xù)的迭代與進(jìn)化不斷提高新種群個(gè)體的適應(yīng)度,直到滿足預(yù)設(shè)條件停止進(jìn)化,并將適應(yīng)度最高的個(gè)體作為待優(yōu)化參數(shù)的最優(yōu)解[7]。與傳統(tǒng)的結(jié)構(gòu)優(yōu)化算法和試湊法相比,GA 通常能夠快速地得到較好的優(yōu)化結(jié)果,因此被用來優(yōu)化神經(jīng)網(wǎng)絡(luò)[24,28-30]。
對于水庫大壩的安全監(jiān)測,影響水庫大壩滲流的因素不止一個(gè)[31]。這些水庫大壩影響因素的確定通常依賴于經(jīng)驗(yàn)[7],項(xiàng)目組利用試驗(yàn)方法來確定水庫大壩滲流的影響因素[24],證明了并非影響因素越多,預(yù)測效果越好,主要是因?yàn)橛绊懸蛩刂g存在著信息重疊,從而導(dǎo)致復(fù)雜性升高[24]。主成分分析(principal component analysis,PCA)是PEARSON[32]在1901年提出的,通過提取正交的主成分避免多重共線性,從而準(zhǔn)確提高參數(shù)估計(jì)。此外,可以降低包含許多變量的數(shù)據(jù)集的維數(shù),從而盡可能減少變量以包含盡可能多的信息,這可以使模型更有效[33-35]。
本研究提出了一種預(yù)測水庫土石壩滲流的PCA-GA-LM 模型。采用PCA 確定影響因素,實(shí)現(xiàn)影響因素的去耦和降維,在此基礎(chǔ)上,結(jié)合GA-LM 建立了水庫土石壩滲流預(yù)測模型,并將算法與未用PCA算法的GA-LM 進(jìn)行比較,以期為水庫土石壩滲流預(yù)測提供參考。
綜合學(xué)者們的研究結(jié)果,土石壩的滲流特性可以通過測壓管水位反映出來,并受到水庫水位、降雨、溫度、老化等多種因素的影響[7]。為了找到相對合適的滲流影響因素,項(xiàng)目組利用試驗(yàn)法對表1中滲流的3種影響因素方案進(jìn)行GA-LM 預(yù)測比較,發(fā)現(xiàn)模型1的方案雖然不是影響因素最多,但卻是預(yù)測精度相對最高[7],說明如何確定土石壩滲流的影響因素沒有必然的規(guī)律,究其原因是影響因素之間存在著耦合性,相互影響,因此有必要尋找一種更科學(xué)有效的方式來確定滲流的影響因素。表1 中,H是水庫水位,R是降雨量,T是溫度,θ是時(shí)效因子。H0,H5,H10,H20和H30分別表示觀測前0,5,10,20,30d 的平均庫水位;同理,R和T也包含了5 個(gè)平均降雨量和溫度;時(shí)效分量包括θ和lnθ,θ為從觀測起始日期算起的天數(shù)的1%。
表1 滲流影響因素試驗(yàn)方案Table 1 Testing scheme of influence factors of the seepage
本研究數(shù)據(jù)取自遼寧撫順渾河上的大伙房水庫,主壩壩型為黏土心墻土壩,最大壩高49.2m,壩頂長度1366.7m,控制流域面積5437km2,涉及農(nóng)田灌溉面積8.6萬hm2,是保障沈撫大地灌溉的重要水利工程。以大伙房水庫某關(guān)鍵斷面“pie3140”測壓管觀測數(shù)據(jù)為研究對象,利用2018 年的365 組數(shù)據(jù)作為訓(xùn)練樣本,選取2019 年15組數(shù)據(jù)作為測試樣本對滲流進(jìn)行預(yù)測。在用GA-LM進(jìn)化神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測之前,先采用主成分分析法對影響因子進(jìn)行解耦和降維。流程圖見圖1。
圖1 PCA-GA-LM土石壩滲流預(yù)測模型流程圖Figure 1 Flowchart of PCA-GA-LM prediction model of seepage of the earth-rockfill dam
1.2.1 水庫土石壩滲流影響因子的確定 考慮到水庫土石壩滲流影響因素之間的多重共線性和數(shù)量眾多,利用主成分分析方法確定影響因子,從而實(shí)現(xiàn)去耦和降維。具體步驟如下。
步驟1:為了不丟失影響因素信息,選取表1 中的模型3 影響因素方案作為主成分分析的輸入。由于17 個(gè)影響因素的維數(shù)大多不同,且數(shù)值變化很大,因此在測量影響因素的變化程度時(shí),結(jié)果容易失真,偏向于大范圍的影響因素。為了消除不同均值和方差對變量比較的影響,利用式(1)對17個(gè)影響因素的數(shù)據(jù)進(jìn)行歸一化。
式中:mean(X i)為平均值;σ(Xi)為標(biāo)準(zhǔn)差。
步驟2:利用式(2)求樣本的協(xié)方差矩陣。
步驟3:計(jì)算樣本協(xié)方差矩陣Cx的特征值λi及相應(yīng)特征向量μi,其中i=1,2,…,p。
步驟4:特征值按降序排列,前m(m<p)個(gè)主元的累積貢獻(xiàn)率計(jì)算公式為:
此處將累積貢獻(xiàn)率大于95%的前m個(gè)新生成分量作為主元。
步驟5:將前m個(gè)主元所對應(yīng)的特征向量選出來,利用式(4)構(gòu)建變換矩陣T,并利用式(5)計(jì)算出前m個(gè)主成分。
1.2.2 預(yù)測水庫土石壩滲流 將體現(xiàn)滲流的水庫土石壩測壓管水位作為輸出,將1.2.1中所確定的主成分作為輸入,利用GA-LM模型預(yù)測水庫土石壩滲流。具體的GA-LM算法如下。
(1)初始種群和編碼。結(jié)構(gòu)基因采用二進(jìn)制編碼,表示隱層節(jié)點(diǎn)結(jié)構(gòu)(“1”表示存在隱層節(jié)點(diǎn),“0”則表示不存在);連接權(quán)值和閾值用權(quán)重基因表示,利用實(shí)數(shù)進(jìn)行編碼。當(dāng)有n個(gè)隱層節(jié)點(diǎn)、x個(gè)輸入、y個(gè)輸出時(shí),染色體結(jié)構(gòu)見圖2。
圖2 染色體結(jié)構(gòu)Figure 2 Construction of chromosomes
本研究選取種群大小為100,初始n=36。
(2)在式(6)求取誤差平方和的基礎(chǔ)上,按照式(7)進(jìn)行適應(yīng)度評價(jià)。
式中:V為經(jīng)LM神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到的輸出值;T為V所對應(yīng)的實(shí)際測量值;E為誤差平方和(SSE)。
式中:F為適應(yīng)度函數(shù)。通過向F高的方向進(jìn)化,使誤差逐步減小, 結(jié)構(gòu)逐步趨于簡單[7]。
(3)確定終止進(jìn)化條件。以進(jìn)化代數(shù)是否滿足100代或均方誤差MSE是否小于0.001為準(zhǔn)則終止進(jìn)化。
(4)遺傳算子。選擇算子采用輪盤賭策略;交叉和變異算子均根據(jù)染色體編碼形式采用混合策略[6]。其中結(jié)構(gòu)基因采用單點(diǎn)交叉和基本位變異算子;權(quán)重基因采用算術(shù)交叉和非均勻變異算子。初始交叉率和變異率分別為0.6和0.08。
(5)在LM算法中,權(quán)值的調(diào)整算法為:
式中:J(ω)為Jacobian 矩陣;β為大于零的調(diào)整因子,用于控制LM 算法迭代;I為單位矩陣。本研究β的初始值設(shè)為0.01。
按照1.2.1 算法,對365 組數(shù)據(jù)歸一化后的水庫土石壩滲流部分?jǐn)?shù)據(jù)見表2。由表2 可知,經(jīng)過歸一化的數(shù)值變化明顯變小,可以消除不同均值和方差對變量比較的影響。
表2 歸一化土石壩滲流影響因素Table 2 Normalized influence factors of the earth-rockfill dam seepage
對應(yīng)的水庫土石壩樣本的協(xié)方差矩陣見表3。由表3 可知,17 個(gè)影響因素之間有一定的相關(guān)性,存在著較高的耦合,需要去耦。
表3 土石壩樣本的協(xié)方差矩陣Table 3 Covariance matrix of the earth-rockfill dam samples
計(jì)算出來的降序特征值和貢獻(xiàn)率見表4。由表4可知,前8個(gè)主元的累計(jì)貢獻(xiàn)率大于95%,且特征值較大,因此選取主成分?jǐn)?shù)為8,按照式(4)和式(5),對應(yīng)的主成分表達(dá)式如式(9)。
表4 降序特征值和貢獻(xiàn)率Table 4 Eigenvalue in descending order and corresponding contribution rates
在此基礎(chǔ)上,利用1.2.2的GA-LM算法,得到的PCA-GA-LM 預(yù)測網(wǎng)絡(luò)結(jié)構(gòu)如圖3,并據(jù)此完成測壓管水位的預(yù)測。為了驗(yàn)證PCA-GA-LM 算法的預(yù)測效果,將采用PCA 方法的GA-LM 預(yù)測模型與表1中的3個(gè)GA-LM預(yù)測模型進(jìn)行比較,比較結(jié)果見圖4??梢钥闯?在4種模型中,PCA-GA-LM 模型的測壓管水位預(yù)測值與測壓管水位實(shí)測值擬合效果最好,吻合程度最高。由具體誤差分析(表5)可知,PCA-GA-LM 模型的影響因子個(gè)數(shù)最少,平均誤差、標(biāo)準(zhǔn)偏差和平均相對誤差最小,預(yù)測準(zhǔn)確率最高,能達(dá)到99.98%。采用試驗(yàn)法所確定的3 個(gè)模型中,模型2和模型3的影響因子數(shù)與PCA方法所確定的影響因子數(shù)相差較大,準(zhǔn)確率也相差較多;模型1的影響因子數(shù)接近于PCA 方法,預(yù)測準(zhǔn)確率與PCA 方法最為接近,說明模型1確定的影響因子有效性恰好接近PCA 方法,但該方法受試驗(yàn)法本身特點(diǎn)所限,確定過程帶有很大的隨機(jī)性。綜合4種模型誤差分析結(jié)果可知,本研究所提出的PCA-GA-LM 水庫土石壩滲流預(yù)測模型是可靠的。
圖3 PCA-GA-LM土石壩滲流預(yù)測網(wǎng)絡(luò)結(jié)構(gòu)Figure 3 Structure of PCA-GA-LM network for predicting seepage of the earth-rockfill dam
圖4 基于PCA-GA-LM所預(yù)測的測壓管水位與表1模型的比較Figure 4 Comparison of the predicted piezometric levels between PCA-GA-LM model and models in table 1
表5 基于PCA-GA-LM的測壓管水位預(yù)測模型與表1模型的誤差分析比較Table 5 Comparison of the dam prediction performance of the piezometric levels under the condition of PCA and without PCA
對大壩重要效應(yīng)量進(jìn)行精準(zhǔn)預(yù)測和確保大壩安全是使水庫正常發(fā)揮蓄水功能、保障農(nóng)業(yè)生產(chǎn)用水需求的重要舉措。由此,研究準(zhǔn)確率高、可操作性強(qiáng)的大壩滲流預(yù)測方法,例如本研究設(shè)計(jì)的方法,取代隨機(jī)性的試驗(yàn)法,在有效影響因子確定、網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化和預(yù)測算法3方面均有可操行性強(qiáng)的算法,且實(shí)際應(yīng)用預(yù)測準(zhǔn)確率高于其他文獻(xiàn)方法,可以實(shí)現(xiàn)對大壩滲流的精準(zhǔn)預(yù)測。
本研究在對土石壩滲流影響因素分析基礎(chǔ)上,將PCA 算法與GA-LM 算法相結(jié)合,提出了一種用于水庫大壩滲流預(yù)測的PCA-GA-LM 模型。作為一種有效的搜索方法,遺傳算法被用來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。針對傳統(tǒng)BP 算法收斂速度慢、易陷入局部最優(yōu)的缺點(diǎn),采用了LM 算法進(jìn)行滲流預(yù)測。為了確定合適的影響因子,使模型更加有效,采用PCA 確定水庫土石壩壩體滲流的影響因素。從大伙房水庫土石壩的應(yīng)用實(shí)例可以看出,采用該模型預(yù)測的水庫土石壩測壓管水位值和實(shí)測值吻合度較高。采用PCA 和試驗(yàn)法情況下的水庫土石壩滲流預(yù)測誤差比較分析表明,采用PCA 的模型預(yù)測誤差最小,可以獲得更高的預(yù)測準(zhǔn)確率。由此可見,本研究所建立的模型可以作為水庫土石壩滲流預(yù)測的一種有效工具。