郎學(xué)政,許同樂,黃湘俊,杜華程,宋洪宇
(1.山東理工大學(xué)機(jī)械工程學(xué)院,山東淄博 255049;2.山東中礦集團(tuán)有限公司,山東招遠(yuǎn) 265401)
近年來,尾礦壩潰壩、滲漏事件頻繁發(fā)生。這些事故多由于壩內(nèi)地下水位控制不當(dāng),基本上都與地下水的滲流有關(guān)[1]。尾礦壩地下水的自由水面即浸潤線,是影響尾礦壩穩(wěn)定性最重要因素之一[2]。因此,建立地下水實(shí)時(shí)監(jiān)測預(yù)警系統(tǒng),分析評估尾礦壩的穩(wěn)定性,十分必要。在尾礦壩重要位置的橫截面布置多傳感器監(jiān)測地下水位,然后將多測點(diǎn)數(shù)據(jù)進(jìn)行曲線擬合,可以形成浸潤線的實(shí)時(shí)監(jiān)測曲線。然而,由于尾礦壩地下水位受多種隨機(jī)不確定性因素的影響,如:尾礦壩所依存的地質(zhì)環(huán)境和氣候因素、尾礦庫基礎(chǔ)相對于尾礦沉積層的滲透性、顆粒分級程度和尾礦沉積層滲透性的側(cè)向變化、干灘長度、以及庫內(nèi)水位相對于壩頂?shù)奈恢玫?,發(fā)展演化為動(dòng)態(tài)變化的非線性動(dòng)力系統(tǒng),所以準(zhǔn)確預(yù)測地下水位十分困難[3]。神經(jīng)網(wǎng)絡(luò)模型為尾礦壩地下水位精確預(yù)測提供了一種很有效的方法。這種方法已成功應(yīng)用在許多滲流預(yù)測和模式識別工程中[4~6]。
本文首先利用相關(guān)性分析法,確定尾礦壩地下水位神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入變量;然后,通過主成分分析法分析輸入變量間的相關(guān)性,對原始變量加以處理,生成少量互不相關(guān)的、包含原始變量絕大部分信息的新變量,達(dá)到簡化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提高其泛化能力的目的;最后,通過處于穩(wěn)定運(yùn)行期的某尾礦壩的工程實(shí)例,驗(yàn)證利用主成分分析法和神經(jīng)網(wǎng)絡(luò)對尾礦壩地下水位的預(yù)測方法。
利用神經(jīng)網(wǎng)絡(luò)建立尾礦壩地下水位預(yù)測模型需要考慮兩個(gè)問題:(1)建立的模型應(yīng)該具有足夠泛化能力,這要求該模型僅含有導(dǎo)致自由參數(shù)最少的相關(guān)輸入或特征,即降維的問題;(2)多個(gè)輸入變量間可能是共線性的,這就可能導(dǎo)致各變量彼此相關(guān),而這種相關(guān)性會(huì)隨著輸入變量間的相互作用傳遞到權(quán)值上,使得自由參數(shù)最優(yōu)化變得復(fù)雜,導(dǎo)致解的非唯一性,即輸入變量的獨(dú)立性問題。主成分分析可以有效解決上述兩個(gè)問題。
設(shè)預(yù)測模型輸入變量為X1,X2,…Xn,每個(gè)變量包含著m個(gè)不同時(shí)刻測量值,原始收入變量矩陣表示為:
不同變量的閾值差別很大,為防止對輸出影響小而值域大的變量淹沒對輸出影響大而值域小的變量,首先將所有變量值域進(jìn)行標(biāo)準(zhǔn)化,放在一個(gè)相似的范圍 [ -2σ,+2σ]內(nèi)。每個(gè)輸入變量的標(biāo)準(zhǔn)化公式為:
設(shè)新變量矩陣為Y,與原始變量矩陣X轉(zhuǎn)換關(guān)系為:
式中:COV——X的協(xié)方差矩陣;
當(dāng)Uj滿足式(4)時(shí),Y1捕捉最大的原始數(shù)據(jù)方差,Y2捕捉剩余的最大方差,依次類推。這樣得到新變量間協(xié)方差為0,說明新變量間相互獨(dú)立;且它們的方差總和與原始輸入變量方差總和相同,但新變量前幾個(gè)變量集中了原始數(shù)據(jù)中絕大部分的信息,方便作降維處理。
總方差中第j個(gè)主成分的方差所占的比例,為主成分Yj貢獻(xiàn)率,可以作為選取主成分的依據(jù),表示為:
本文算例數(shù)據(jù)來源于某尾礦壩提供的從2012年1月~8月尾礦壩穩(wěn)定運(yùn)行期間的安全監(jiān)測歷史數(shù)據(jù),包括干灘長度、庫水位和某一浸潤線監(jiān)測橫斷面上5個(gè)地下水位測點(diǎn)數(shù)據(jù)。選擇其中160組實(shí)測數(shù)據(jù)為依據(jù),對預(yù)測點(diǎn)水位進(jìn)行預(yù)測,取前150組作為訓(xùn)練樣本,取后10組作為檢驗(yàn)樣本(表1)。
表1 部分原始監(jiān)測數(shù)據(jù)Table 1 Part of the original monitoring data
在尾礦庫穩(wěn)定筑壩時(shí)期,起主要作用的因素為干灘長度和庫水位。干灘長度越長,壩體浸潤線逸出點(diǎn)位置就越低,同時(shí),滲流逸出點(diǎn)比降值也會(huì)隨著干灘長度的增大進(jìn)一步變小;庫水位與浸潤線密切相關(guān),庫水位的變化直接影響了浸潤線位置變化。另外,由于空間上的連續(xù)性,被分析測點(diǎn)會(huì)受相鄰兩個(gè)測點(diǎn)浸潤線位置的影響,也需將這些因素作為它的輸入?yún)?shù)。因此,考慮到各個(gè)監(jiān)測量對浸潤線預(yù)測輸出的影響,預(yù)測模型輸入變量應(yīng)該選擇預(yù)測點(diǎn)前一天的干灘長度、庫水位、相鄰兩個(gè)測點(diǎn)地下水位以及預(yù)測點(diǎn)前n天的歷史數(shù)據(jù),預(yù)測模型輸出變量為某一位置測點(diǎn)未來一天的地下水位。n的取值需要時(shí)間序列自相關(guān)系數(shù)來確定。
分別以1天到10天的延時(shí)步長計(jì)算尾礦壩地下水位時(shí)間序列自相關(guān)系數(shù)(圖1)。設(shè)置選擇輸入變量自相關(guān)系數(shù)閾值為0.8,對應(yīng)延時(shí)步長為3天,則n取值為3,原始神經(jīng)網(wǎng)絡(luò)預(yù)測模型輸入變量為7個(gè)。
圖1 尾礦壩地下水位時(shí)間序列自相關(guān)計(jì)算Fig.1 Autocorrelation coefficient of the time series of groundwater levels
根據(jù)預(yù)測模型輸入變量相關(guān)性分析,選擇7個(gè)輸入變量對浸潤線2#測點(diǎn)的地下水位進(jìn)行預(yù)測。利用主成分分析對輸入變量進(jìn)行降維和去相關(guān)性處理。
首先,計(jì)算標(biāo)準(zhǔn)化后的訓(xùn)練樣本協(xié)方差系數(shù)矩陣(表2)。其中,X1代表預(yù)測點(diǎn)前1天庫水位;X2代表預(yù)測點(diǎn)前1天干灘長度;X3代表預(yù)測點(diǎn)相鄰1#測點(diǎn)前1天地下水位;X4代表預(yù)測點(diǎn)前1天地下水位;X5代表預(yù)測點(diǎn)相鄰3#測點(diǎn)前1天地下水位;X6代表預(yù)測點(diǎn)前2天地下水位;X7代表預(yù)測點(diǎn)前3天地下水位。
表2 7個(gè)變量的協(xié)方差矩陣Table 2 Covariance matrix of the seven variables
通過協(xié)方差矩陣可以看出干灘長度和庫水位歷史數(shù)據(jù)協(xié)方差為1,兩者完全線性相關(guān),這是因?yàn)樵谖驳V庫穩(wěn)定運(yùn)行的一段時(shí)間內(nèi),干灘長度完全取決于庫水位的高低。像這種相關(guān)度很高的輸入變量不但會(huì)增加預(yù)測模型的復(fù)雜度,還會(huì)影響權(quán)值的優(yōu)化過程,造成解的非唯一性,須對其進(jìn)行去相關(guān)處理。
其次,利用訓(xùn)練樣本的協(xié)方差矩陣,計(jì)算協(xié)方差矩陣特征值以及協(xié)方差矩陣的各特征值對應(yīng)的特征向量,依據(jù)累積貢獻(xiàn)率提取主成分。計(jì)算結(jié)果如表3,圖2是方差相對于主成分序號的散點(diǎn)圖,Y1表示第一主成分,Y2表示第二主成分,依此類推。
表3 方差及主成分貢獻(xiàn)率Table 3 Eigenvalue and principle component contribution rates
圖2 方差相對于主成分序號的散點(diǎn)圖Fig.2 Scattered diagram of variance relative to the number of component
主成分選擇的一個(gè)依據(jù)是方差的累積貢獻(xiàn)率須在75%~95%的范圍內(nèi),另一個(gè)依據(jù)是基于方差的散點(diǎn)圖,選擇點(diǎn)所在的散點(diǎn)圖處近似為一條直線[7]。顯然,滿足兩種選擇依據(jù)的主成分個(gè)數(shù)為3。當(dāng)然也可以采用交叉驗(yàn)證,選取使驗(yàn)證誤差最小的主成分個(gè)數(shù)。本文選擇前三個(gè)主成分,作為神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入變量。
最后,利用方差矩陣的各特征值對應(yīng)的特征向量,如表4,將7個(gè)原始輸入變量轉(zhuǎn)換為3個(gè)主成分。主成分表達(dá)式為:
表4 方差矩陣的各特征值對應(yīng)的特征向量Table 4 Characteristic vector of eigenvalue of covariance matrix
利用主成分分析和神經(jīng)網(wǎng)絡(luò)建立的尾礦壩地下水位預(yù)測模型(圖3)。首先對原始輸入變量進(jìn)行主成分提取,然后,利用去相關(guān)性和降維后的新數(shù)據(jù)進(jìn)行 BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)建模,最后,將訓(xùn)練好的網(wǎng)絡(luò)對尾礦壩地下水位進(jìn)行預(yù)測。神經(jīng)網(wǎng)絡(luò)建模一般選用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、隱層和輸出層[8]。隱層節(jié)點(diǎn)數(shù)需要經(jīng)過代入不同的數(shù)值進(jìn)行試驗(yàn)確定。將隱層節(jié)點(diǎn)數(shù)從4到15,分別代入到BP神經(jīng)網(wǎng)絡(luò)(簡稱 BP)預(yù)測模型和利用主成分分析(Principal Component Analysis)后建立的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型(簡稱PCA-BP)中進(jìn)行驗(yàn)算,每個(gè)數(shù)值驗(yàn)算20次,取其平均值,結(jié)果列入表5。
圖3 尾礦壩地下水位預(yù)測模型結(jié)構(gòu)Fig.3 Predicted model of groundwater level prediction
通過表5可以看出:BP預(yù)測模型驗(yàn)算結(jié)果隨著隱層節(jié)點(diǎn)數(shù)的增加,先減小后增加,在8個(gè)節(jié)點(diǎn)時(shí)預(yù)測模型輸出結(jié)果最好,說明其為BP預(yù)測模型的最優(yōu)隱層節(jié)點(diǎn)個(gè)數(shù);PCA-BP預(yù)測模型驗(yàn)算結(jié)果相對與BP預(yù)測模型較為平穩(wěn),體現(xiàn)了其良好的恢復(fù)能力,這里選擇PCA-BP預(yù)測模型的隱層節(jié)點(diǎn)個(gè)數(shù)為6。
表5 選取隱層節(jié)點(diǎn)數(shù)試驗(yàn)結(jié)果Table 5 Performance of various neural network models with different numbers of hidden nodes
根據(jù)上述分析,建立尾礦壩地下水位BP預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu)為7-8-1,PCA-BP預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu)為3-6-1。為了充分比較兩個(gè)預(yù)測模型的性能,將兩個(gè)模型分別放在從100次到5000次迭代次數(shù)的不同情況下進(jìn)行訓(xùn)練,將未來10天的地下水位作為驗(yàn)證集,驗(yàn)證模型的預(yù)測輸出準(zhǔn)確性,將預(yù)測結(jié)果與期望結(jié)果的均方誤差繪制成圖4。記錄BP預(yù)測模型最優(yōu)結(jié)果對應(yīng)的訓(xùn)練迭代次數(shù),用相同的迭代次數(shù)訓(xùn)練PCA-BP預(yù)測模型,將此時(shí)的兩個(gè)預(yù)測結(jié)果和未來十天地下水位的實(shí)測值繪制圖5。
圖4 PCA對神經(jīng)網(wǎng)絡(luò)性能的影響Fig.4 Effect of PCA on neural network performance
圖5 尾礦壩地下水位預(yù)測結(jié)果Fig.5 Prediction results of groundwater levels near the tailing dam
通過圖4可以看出,隨著訓(xùn)練次數(shù)的增加,預(yù)測結(jié)果的均方誤差不斷下降,但當(dāng)訓(xùn)練次數(shù)達(dá)到一定值后,均方誤差不再減小反而不斷增加,說明BP預(yù)測模型出現(xiàn)了過擬合現(xiàn)象,這是因?yàn)楫?dāng)訓(xùn)練次數(shù)過多后,BP預(yù)測模型受到大量共線性數(shù)據(jù)的影響產(chǎn)生了病態(tài)。而PCA-BP預(yù)測模型因?yàn)橐婚_始就移除了共線性的影響,不但預(yù)測精度比BP預(yù)測模型要好得多,而且隨著訓(xùn)練次數(shù)的增加,預(yù)測結(jié)果的均方誤差一直在減小。圖5中BP預(yù)測模型均方誤差為0.0129,PCA-BP預(yù)測模型均方誤差為0.0018,也可以看出當(dāng)BP預(yù)測模型達(dá)到最優(yōu)的預(yù)測結(jié)果時(shí),PCA-BP預(yù)測模型也可以取得更為精確的預(yù)測結(jié)果,這體現(xiàn)后者具有較強(qiáng)穩(wěn)定性。
(1)當(dāng)訓(xùn)練迭代次數(shù)增加超過一定值后,尾礦壩地下水位BP預(yù)測模型發(fā)生過擬合現(xiàn)象,產(chǎn)生病態(tài),導(dǎo)致預(yù)測精度下降。
(2)相對于BP預(yù)測模型,PCA-BP預(yù)測模型的預(yù)測結(jié)果更為精確,說明經(jīng)過主成分分析法降維和去相關(guān)性后,提高了神經(jīng)網(wǎng)絡(luò)預(yù)測的泛化能力和魯棒性。
[1] 路美麗,崔莉.影響尾礦壩滲流場的因素分析[J].中國安全科學(xué)學(xué)報(bào),2004,14(6):17-20.[LU M L,CUI L.Analysis of Factors Affecting Seepage Field of Tailings Dam[J].China Safety Science Journal,2004,14(6):17-20.(in Chinese)]
[2] 李兆煒,胡再強(qiáng).基于滲流理論的尾礦壩壩體穩(wěn)定性分析研究[J].水利與建筑工程學(xué)報(bào),2010,8(1):55-59.[LI Z W,HU Z Q.Analysis of Tailing Dam’s Stability Based on Seepage Theory[J].Journal of Water Resources and Architectural Engineering,2010,8(1):55-59.(in Chinese)]
[3] 王飛躍,楊鎧騰,徐志勝,等.基于浸潤線矩陣的尾礦壩穩(wěn)定性分析[J].巖土力學(xué),2009,30(3):840-844.[WANG F Y,YANG K T,XU Z S,et al.Stability analysis of tailings dam based on saturation line matrix[J].Rock and Soil Mechanics,2009,30(3):840-844.(in Chinese)]
[4] 劉長吉,陳建生,陳亮,等. 庫壩區(qū)地下水滲流場模式識別模型研究[J]. 巖石力學(xué)與工程學(xué)報(bào), 2009,28( S1) : 2808 - 2814. [LIU C J,CHEN J S,CHENL,et al. Study on pattern recognition model of groundwater seepage field in reservoir and dam sites [J]. Chinese Journal of Rock Mechanics and Engineering,2009,28 ( S1 ) : 2808 - 2814. ( in Chinese) ]
[5] Farrokhzad F,Barari A,Choobbasti A J,et al.Neural network-based model for landslide susceptibility and soil longitudinal profile analyses:Two case studies[J]. Journal of African Earth Sciences,2011,61:349-357.
[6] Ali Mollahasani,Amir Hossein Alavi,Amir Hossein Gandomi.Nonlinear Neural-Based Modeling of Soil Cohesion Intercept[J]. KSCE JournalofCivil Engineering,2011,15(5):831-840.
[7] Ali Mollahasani,Amir Hossein Alavi,Amir Hossein Gandomi.Nonlinear Neural-Based Modeling of Soil Cohesion Intercept[J]. KSCE JournalofCivil Engineering,2011,15(5):831-840.
[8] Sandhya S.神經(jīng)網(wǎng)絡(luò)在應(yīng)用科學(xué)和工程中的應(yīng)用—從基本原理到復(fù)雜的模式識別[M].史曉霞,譯.北京:機(jī)械工業(yè)出版社,2009.[Sandhya S.Neural network in the application of science and engineering applications-from basic principles to complex pattern recognition[M].SHI X X,trans.Beijing:Machinery Industry Press,2009.(in Chinese)]