鄧 超,胡煥校,2,張?zhí)鞓?,?童
(1.中南大學地球科學與信息物理學院,湖南 長沙 410083;2.湖南有色資源與地質災害探查 湖南省重點實驗室,湖南 長沙 410083;3.中南大學數學與統(tǒng)計學院,湖南 長沙 410083; 4.長沙理工大學,湖南 長沙 410076)
滑坡是邊坡物質與能量釋放的一種動力學形式。滑坡每年導致的生命財產損失高于泥石流、洪水、風暴等自然災害,且超出我們的普遍認知[1-2]。世界范圍內經報道的巨大滑坡主要集中在發(fā)展中國家。在發(fā)展中國家,滑坡導致的損失約是國民生產總值的0.5%[3]。我國山嶺坡地眾多,地質環(huán)境復雜,滑坡已成為我國嚴重的地質災害之一。根據中國地質調查局官網信息,每年可預測的滑坡占滑坡總量不足20%,因此迫切需要一種簡單、快捷、可靠、低成本的方法來判斷邊坡的穩(wěn)定性。巖質邊坡滑坡能量更巨大,破壞性更強,因此巖質邊坡穩(wěn)定性評價成為專家學者們共同關注的焦點之一[4-6]。
鑒于線性的Mohr-Coulomb(M-C)準則不能準確的反映巖體破壞的非線性特性[7],因此廣義的非線性Hoek-Brown(H-B)經驗準則在巖質邊坡穩(wěn)定性分析中廣泛應用[8]。但在工程實踐中,巖質邊坡穩(wěn)定性分析還存在許多問題,如現有的適用于巖質邊坡穩(wěn)定性分析的軟件一般基于M-C準則而不夠準確、快捷[9]。HOEK E等[10-11]為使H-B準則適用于各種巖土工程軟件,對非線性H-B準則進行修正,求解巖體的等效黏聚力和摩擦角,雖可采用M-C準則對邊坡穩(wěn)定性進行分析,但轉換過程稍顯復雜。因此,本文采用H-B準則參數作為巖質邊坡穩(wěn)定性分析的參量。
大數據智能計算技術以其高效、快速的自主學習和準確的預測能力等優(yōu)點得到飛速發(fā)展,并在各個領域廣泛應用[12]。世界上每年都有大量的邊坡需要進行穩(wěn)定性評價及滑坡防治,這些工程和研究實例提供了大量有價值的經驗數據和研究數據。因此,許多專家學者利用這些有價值的數據,基于智能計算技術,對邊坡穩(wěn)定性進行評價和預測[13-15]并反演未知的邊坡參數[16],以提高邊坡穩(wěn)定性評價的精確性和效率。一般以反映邊坡綜合性狀的安全系數(F)來作為邊坡穩(wěn)定性評價的重要指標。智能計算模型依賴于獲取的一系列反映邊坡綜合性狀的參數,并以邊坡參數作為輸入變量,以安全系數F作為輸出變量。LI等[16]和DENG等[17]的研究表明基于極限學習機模型(ELM)的智能計算對邊坡變形和穩(wěn)定性分析具有明顯的優(yōu)勢。本文基于ELM模型結合變量遺忘因子(FOS),提出一種正則化的在線序列極值學習機模型(FOS-ELM),應用貝葉斯信息準則(BIC)優(yōu)選H-B準則參數及邊坡幾何力學參數來預測邊坡穩(wěn)定安全系數(F)的最優(yōu)輸入組合,對巖質邊坡穩(wěn)定性進行評價和預測。FOS-ELM算法無須預設控制變量,對優(yōu)化問題的影響很小,且隨著邊坡輸入數據的增加無需重新訓練,具有更好的泛化能力,避免了異常點和過度擬合問題,克服了其他智能計算模型的缺點。對比分析了ELM與FOS-ELM模型預測巖質邊坡穩(wěn)定性的精確性,論證了輸入變量7因素BIC最優(yōu)組合的科學性,為大數據智能計算在巖質邊坡穩(wěn)定性評價中的應用提供了一種新方法。鑒于巖土勘察僅能獲得有限的試驗數據,具有費用高、周期長[18],測量不確定性、轉換模型不確定性[19]等缺點,且難以真實反映巖體參數的空間變異性[20],采用不同賦值的全參數輸入模型(FOS-ELM-M7)作為邊坡參數反演計算模型,對巖質邊坡的參數進行反演計算,為巖質邊坡的參數快速估計提供了一種新的方法。
控制巖質邊坡穩(wěn)定性的主要因素是巖體中具有不同力學性質和規(guī)模的結構面。HOEK等[8]提出了最新版本的節(jié)理巖體強度的廣義經驗準則,可表示為:
(1)
式中:σ1、σ3——分別表示為巖石破壞過程中的最大、最小主應力;
σci——巖石單軸抗壓強度;
mb、s和ɑ——巖體材料常數;
mb和s——巖體的經驗參數;
s——用于量化巖體的破碎程度指標。
mb、s和ɑ可由下式得到:
mb=miexp[(GSI-100)/(28-14D)]
(2)
s=exp[(GSI-100)/(9-3D)]
(3)
α=1/2+1/6(e-GSI/15-e-20/3)
(4)
mb、s的值取決于地質強度指標(GSI)與巖體擾動因子(D),ɑ的值僅取決于GSI。GSI的值(10≤GSI≤100)采用節(jié)理化巖體強度與力學參數估計的地質強度指標GSI法確定;D值大小取決于工程經驗(0≤D≤1),原狀未擾動巖體D=0,擾動巖體D=1;mi(1≤mi≤35)是一個與巖石類型有關的材料常數,可通過巖石三軸試驗擬合得到,也可以根據巖石類型確定。
如前所述,H-B準則具有非線性特征,能較好地反映節(jié)理巖體的強度特性,但其應用也具有一定的局限性[21-22]?;贕SI指標的H-B準則適用于圖1中I組和III組的巖體,即完整巖體和節(jié)理組數不少于3的巖體[9]。文中搜集的1 235例巖質邊坡均為重節(jié)理巖體,屬第三類。
圖1 H-B準則的適用性Fig.1 Applicability of the Hoek-Brown criterion
考慮反映巖體特性的H-B準則參數與邊坡的坡高(H)、坡角(β)、巖體重度(γ)等對邊坡穩(wěn)定性的影響,故本文采用GSI、mi、D、σci、γ、H、β作為輸入變量,以邊坡安全系數F作為輸出變量。LI等[16]對基于H-B準則的Bishop方法與上、下限分析法計算的巖體邊坡的安全系數進行比較,表明基于H-B準則的SLIDE軟件的解更接近邊坡穩(wěn)定的真實解。因此,以基于H-B準則的Bishop法的GEOSLOPE軟件求解的邊坡穩(wěn)定安全系數作為真值。
對于邊坡穩(wěn)定性預測,變量選擇是關鍵。已有研究表明,選擇相關性小的變量將導致預測精度顯著降低。若選擇無關或影響效應低的輸入變量,不僅影響輸入變量間的相互關系,而且可能增加地質勘察工作的工作量。在地質調查中,若部分邊坡參數難以獲得,可利用僅有的參數對邊坡穩(wěn)定性進行初步預測。因此,對變量進行優(yōu)化,確定其相關性和預測誤差具有重要的現實意義。
BIC[23]是在主觀概率估計的基礎上,利用貝葉斯公式對概率進行修正,最后利用期望值和修正概率做出最優(yōu)決策選擇后驗概率最大的模型。即以BIC值最小化的變量子集為最優(yōu),因此,BIC可用于優(yōu)化邊坡輸入變量組合,確定不同組合下的誤差,從而對邊坡穩(wěn)定性做出可靠的預測。BIC的值可表示為:
BIC=-2lnL+klogn
(5)
式中:L——估計模型似然函數的最大值;
k——模型中估計參數的個數;
n——樣本量。
ELM模型是2006年提出的基于隨機權重配置的單隱含層模型,后將ELM模型推廣到廣義單層前饋網絡(SLFNs)中,其中隱含層神經元不必相同[24]。ELM模型的單隱層前饋神經網絡如圖2所示。
圖2 ELM模型的單隱層前饋神經網絡圖Fig.2 The network of classical ELM
給定一個包含N個不同樣本的訓練集,Γ={(xj,tj) |xj∈Rn,|tj∈Rm,j=1,…,N},其中x為n維的輸入變量,t為m維的目標變量。具有M個隱藏神經元SLFN的數學模型的激勵函數G(·)可表示為:
(6)
式中:wi——連接第i個隱藏節(jié)點和輸出節(jié)點的隨機分配的輸入權向量;
bi——第i個隱藏節(jié)點的任意分配偏差;
G(wi,bi,xj)——xj輸入樣本的第i個隱藏節(jié)點的輸出結果,其作用是將輸入層的數據由其原本的空間映射到ELM的特征空間。
當SLFN模型完全逼近樣本數據,即當輸出值與真值之間的誤差為零,之間對應關系可表示為:
(7)
式(7)可寫成矩陣式:
Hβ=T
(8)
其中,
(9)
(10)
輸出權值可利用式(8)通過尋找SLFNs最小二乘解得到,其表達式為:
β=H?T
(11)
其中H?為矩陣H的Moore-Penrose廣義逆,若HTH為非奇異矩陣,那么式(11)可表示為:
β=H?T=(HTH)-1HTT
(12)
ELM算法的核心是求解輸出權重使得誤差函數最小,因此我們在ELM的loss函數中引入l-2正則化約束提高模型的泛化能力和穩(wěn)定性。式(12)可轉化為:
(13)
式中:C——正則化系數;
I——單位矩陣;
N——樣本個數;
L——隱層神經元個數。
但傳統(tǒng)的人工智能算法,如人工神經網絡、支持向量機、極限學習模型等,在獲取大量邊坡新數據時,需要同時收集新舊數據進行重新訓練[25]。因此,傳統(tǒng)的人工智能算法很難解決大數據、非平穩(wěn)、數變、時變等預測問題。為了有效地解決數據流的非平穩(wěn)和數變問題,開發(fā)了在線順序極值學習機模型(OS-ELM)。OS-ELM的學習包括一個初始的ELM批量學習過程和一個連續(xù)的逐塊學習過程。但當學習過程中隱含層輸出矩陣的自相關矩陣是奇異的或病態(tài)的,OS-ELM的泛化能力急劇退化。BOU-RABEE[26]為克服OS-ELM的這一缺點將Tikhonov正則化與OS-ELM相結合,提出了一種正則化的OS-ELM,以提高算法的穩(wěn)定性和泛化能力。為解決樣本增加在線學習過程中的時變性和量變性問題,故將遺忘因子(Forgetting Factor)[27]引入到OS-ELM當中。R-ELM-FF算法在理論等價于最小化下列基于FF和l-2正則化的最小二乘誤差函數:
(14)
式中:λ——新舊樣本權重的FF參數;
δ——提高算法穩(wěn)定性和泛化能力的正則化參數。
基于遞推計算式[28],采用遞推最小二乘法求解式(14),βk可推導為:
(15)
(16)
FOS-ELM的運行如下:
設數據樣本為數據流的形式,激勵函數為G(w,b,x),隱藏神經元數為n,正則化參數為δ,遺忘因子為λ。
步驟1:初始化。
給定初始訓練子集Ωk-1={(xj,tj)|xj∈Rn,|tj∈Rm,j=1,…,k-1},執(zhí)行下述操作:
(1)隨機生成隱藏層神經元參數(wi,bi),i=1,2,…,n;
步驟2:在線學習與預測。
對新樣本(xk,tk)執(zhí)行以下操作:
(1)計算新樣本輸入xk:hk=[G(a1,b1,xk) …G(an,bn,xk)]的隱含層輸出向量;
(3)根據真值tk調整輸出權重。
(4)返回步驟2。
采用多種統(tǒng)計指標對FOS-ELM模型和經典的ELM模型在巖質邊坡穩(wěn)定性安全系數F預測結果進行評估,如式(17-19)所示。
(1)相關系數(r)可表示為:
(17)
(2)均方根誤差(RMSE)表示為:
(18)
(3)平均絕對誤差(MAE)表示為:
(19)
式中:Fpr、Fre——分別表示巖質邊坡穩(wěn)定性安全系數預測值與真值;
FOS-ELM模型最優(yōu)輸入組合(GSI,mi,σci,D,γ,β,H)的巖質邊坡穩(wěn)定安全系數F的預測及參數反演過程(圖3)。
圖3 FOS-ELM模型預測F及參數反演過程示意Fig.3 Process diagram of the FOS-ELM model for predicting F and parameter inversion
如1.1所述,選用巖質邊坡的GSI,mi,σci,D,γ,H和β作為FOS-ELM模型的輸入變量,安全系數作為輸出變量(Fpr)。因此,該模型選擇7個輸入量和1個輸出量。從樣本中隨機抽取1 085組數據作為訓練集,其余150組數據作為驗證集。利用BIC值進行變量組合優(yōu)選,生成輸入參數的最佳組合,建立了7種最優(yōu)組合模型。在Geo-slope軟件中基于H-B準則的極限平衡法計算真值(Fre)。利用預測值(Fpr)與真值(Fre)在驗證階段的統(tǒng)計指標與誤差分布對比分析FOS-ELM模型與經典的ELM模型。
在Matlab中計算所有輸入變量組合的BIC值,其中BIC值最小的變量組合為最優(yōu)。針對不同數量的輸入變量,在最優(yōu)輸入組合的基礎上建立了7種不同的模型(M1、M2、M3、M4、M5、M6、M7),包括所有輸入變量的模型。基于FOS-ELM與經典ELM的7種模型對巖質邊坡穩(wěn)定性安全系數預測值(Fpr)與真值(Fre)線性關系如圖4所示。
若預測值Fpr和真值Fre的相關關系可用線性方程y=kx擬合,且指數系數r2和斜率k接近1,說明該模型的預測性能好,擬合效果優(yōu)。因此,本文在Origin軟件中利用y=kx的線性擬合Fpr和Fre。圖4通過散點圖分別顯示了不同優(yōu)選輸入組合下的FOS-ELM與ELM模型的Fre和Fpr的擬合結果。所有參數作為最優(yōu)輸入組合的模型M7,圖4(g)中指數系數r2和斜率k(FOS-ELM:r2=0.991 3,k=1.005 9;ELM:r2=0.967 3,k=1.013 2)表明FOS-ELM模型的預測效果優(yōu)于經典的ELM模型。同樣,以六參數(GSI,σci,mi,D,H,β)最優(yōu)輸入組合的模型M6,FOS-ELM與ELM模型的指數系數r2(FOS-ELM:r2=0.904 5;ELM:r2=0.706 8)和斜率k(FOS-ELM:k=0.990 9;ELM:k=0.981 1)表明本文建立的FOS-ELM模型預測效果優(yōu)于ELM模型。類似地,最優(yōu)輸入組合M5,M4,M3,M2,M1模型的預測結果亦同上。對比圖4(a)~(g)表明基于FOS-ELM模型M7預測效果最優(yōu),精度最高。同時,基于FOS-ELM模型的M5預測效果僅次于M7,表明輸入參量的個數對預測效果的優(yōu)劣產生影響,即采用FOS-ELM模型進行巖質邊坡穩(wěn)定性安全系數預測時并不是確定的輸入參量越多預測效果更優(yōu)。
圖4 基于FOS-ELM與ELM的7種輸入組合模型對巖質邊坡穩(wěn)定性安全系數預測值(Fpr)與真值(Fre)關系Fig.4 The relationship between predicted Fpr and Freof rock slope stability by seven models,FOS-ELM vs. ELM
基于大數據智能計算預測是未來應用的方向之一,但LI A J[16]等的研究表明ELM模型訓練巖質邊坡參量并預測穩(wěn)定數Nr,這一過程需耗時數小時。同時,智能計算需要大量的數據以提高模型預測能力,工程實踐的開展使得巖質邊坡工程數據不斷增加,新數據組增加的同時計算工作量也將增加,且須重新訓練,這將大大降低預測工作的效率。而基于FOS-ELM模型的無需重新訓練這一優(yōu)點,將一定程度上提高預測效率(圖5),訓練數據組增加到500時FOS-ELM的訓練效果。因此,ELM模型的預測效率較FOS-ELM模型低,且圖4表明FOS-ELM預測精度較高,圖6驗證結果亦表明FOS-ELM的預測精度高這一優(yōu)點。
圖5 數據增加至500時FOS-ELM模型的訓練效果Fig.5 Train performance using FOS-ELM model with data increased to 500
圖6 ELM與FOS-ELM模型150組數據驗證效果 (訓練數據增加至500)Fig.6 Performance of 500 data trained by ELM and FOS-ELM with 150-validation data set
為進一步分析FOS-ELM模型預測的精確性,計算了訓練數據從500增加至1 085組時的相關系數(r)、均方誤差(RSME)、平均絕對誤差(MAE),與每個輸入組合的ELM模型比較(表1)。顯然,訓練集增加至1 085 時七參量最優(yōu)輸入組合的FOS-ELM模型具有最大的相關系數(FOS-ELM:r=0.994;ELM:r=0.987),最小的均方誤差(FOS-ELM:RSME=0.069;ELM:RSME=0.100)和平均絕對誤差(FOS-ELM:MAE=0.060;ELM:MAE=0.090)。此外,訓練集為500或1 085 時,不同輸入參量最優(yōu)組合(M1,M2,M3,M4,M5,M6)的FOS-ELM較ELM模型具有更大的相關系數(r),較小的均方誤差(RSME)和平均絕對誤差(MAE)(數集增加至1 085時M2除外)。前述表明,提出的FOS-ELM模型是一種較經典的ELM模型更優(yōu)的巖質邊坡穩(wěn)定性安全系數預測的智能工具。
邊坡參數反演法克服了室內實驗與現場試驗的缺點[20],是獲得巖土體參數的一種有效方法。2.1節(jié)表明全參數最優(yōu)輸入的FOS-ELM-M7模型具有較好的工作性能,因此基于該模型建立參數反演計算過程(圖3)。
針對工程實踐中難以客觀量化的地質強度指標GSI、邊坡擾動因子D、材料常數mi的反演結果分析反演模型的計算精度。在Matlab中實現該計算過程得到巖質邊坡單未知參數、雙未知參數、三未知參數。反演結果與文獻[16,29-30]工程例對比結果見表2。為進一步分析參數反演精度,分別對比反演結果與工程例參數(圖7~圖9)。
表1 七組輸入組合模型下的邊坡參量變化影響(三統(tǒng)計指標作為評價依據)
注:加粗行代表最優(yōu)輸入組合。
表2 工程例參數(GSI、mi、D)反演結果
注:單參數反演時,即該反演參數未知,其他為已知參量;雙參數反演時,即該反演雙參數未知,其他為已知參量;三參數反演時,即反演三參數未知,其他為已知參量。
圖7 GSI反演結果Fig.7 The inversion results of GSI
圖8 mi反演結果Fig.8 The inversion results of mi
圖9 D反演結果Fig.9 The inversion results of D
由圖7~9知,該模型對1~2個未知參數反演計算與工程例參數接近,反演精度較高。其中單參數和雙參數GSI反演的偏差絕對值分別為0%~6.5%、1.5%~9.5%,反演精度最高。單參數mi反演偏差絕對值為0%~28.5%,單參數D反演偏差絕對值為0%~14.3%,由于mi在取值是通過地質工程師根據巖石種類半經驗主觀確定參數,同時D值取值根據H-B準則經驗取值均為0、0.7、1.0,故在FOS-ELM訓練數據中同類巖體mi取值幅度較小及D值取值相對固定,這就導致模型的學習效果欠佳,對于mi、D的個別反演結果偏差分別達28.5%和14.3%。由于模型訓練數據有限,三參數的反演計算結果偏差較大。
本文拓展了大數據智能計算在巖質穩(wěn)定性預測及參數反演中的應用,提出了一種結合ELM模型的變量遺忘因子正則化在線序列極值學習機模型(FOS-ELM),并將其應用于巖質邊坡穩(wěn)定性預測和邊坡參數的反演。主要結論如下:
(1)采用7變量組合,邊坡安全系數的預測精度最高,但預測精度并不隨輸入變量個數增加成正比。
(2)與經典的ELM模型比較,FOS-ELM模型具有高效和精確的優(yōu)點。
(3)FOS-ELM模型試圖更新網絡的輸出權值,并隨著數據的增加對網絡模型進行自“修正”,以達到更高的預測精度,為處理數據增長問題提供了一種新的方法。
(4)基于FOS-ELM模型的參數反演,1~2個未知參數反演精度較高,其中GSI反演精度最高,反演偏差絕對值分別為0%~6.5%、1.5%~9.5%。