楊念江,樊方濤
(湖南省水利水電勘測(cè)設(shè)計(jì)研究總院,湖南 長(zhǎng)沙 410007)
邊坡穩(wěn)定性預(yù)測(cè)是工程研究領(lǐng)域的熱點(diǎn)問(wèn)題,邊坡穩(wěn)定性受自身物質(zhì)組成、沉積形成過(guò)程和外界環(huán)境多種因素的影響,一般很難通過(guò)確定性的數(shù)學(xué)模型來(lái)表達(dá)[1]。位移作為邊坡巖土體在變形破壞演化過(guò)程中反饋出的重要信息,通過(guò)實(shí)際監(jiān)測(cè)的邊坡位移序列來(lái)預(yù)測(cè)邊坡未來(lái)變形,便可以判斷邊坡的穩(wěn)定性。目前用于邊坡位移預(yù)測(cè)的方法很多,主要有時(shí)間序列模型[2~3]、灰色模型[4~5]、神經(jīng)網(wǎng)絡(luò)模型[6~7]等方法。但這些方法都存在著理論或應(yīng)用上的不足,如時(shí)間序列分析法的應(yīng)用前提是假設(shè)監(jiān)測(cè)數(shù)據(jù)為非平穩(wěn)時(shí)間序列,灰色理論則需要假設(shè)時(shí)間序列中與歷史時(shí)序吻合的模式,即假定在數(shù)據(jù)系列中該模式可以在時(shí)間上再現(xiàn),然而這種假設(shè)往往與時(shí)間不符;而人工神經(jīng)網(wǎng)絡(luò)也存在著一定的缺陷,在學(xué)習(xí)樣本數(shù)量有限時(shí),精度難以保證,當(dāng)學(xué)習(xí)樣本的維數(shù)很高時(shí),其高維空間中往往存在眾多差異較大的局部極值,會(huì)使學(xué)習(xí)結(jié)果呈現(xiàn)出較大的隨機(jī)性[8]。
近年來(lái),支持向量機(jī)[9](support vector machine,SVM)被廣大學(xué)者應(yīng)用于邊坡的穩(wěn)定性評(píng)價(jià)中[10~12]。支持向量機(jī)是以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理為基礎(chǔ)的算法,具有良好的數(shù)學(xué)性能,如解的唯一性、不依賴輸入空間的維數(shù)等。而最小二乘支持向量機(jī)[13](LS-SVM)是支持向量機(jī)的一個(gè)變種,解決了大樣本訓(xùn)練過(guò)程中計(jì)算速度變慢的問(wèn)題。和其他學(xué)習(xí)算法一樣,其性能依賴于學(xué)習(xí)機(jī)的參數(shù),然而到目前為止,還沒(méi)有指導(dǎo)LS-SVM 參數(shù)選擇的系統(tǒng)方法。
本文采用混沌遺傳算法參數(shù)優(yōu)化應(yīng)用于LS-SVM預(yù)測(cè)模型,將混沌運(yùn)動(dòng)的遍歷性和遺傳算法的高效并行計(jì)算能力相結(jié)合,并隨著尋優(yōu)次數(shù)的增長(zhǎng)動(dòng)態(tài)縮減尋優(yōu)區(qū)間,在一定程度上克服了傳統(tǒng)尋優(yōu)方法存在早熟收斂、非全局收斂以及收斂速度慢的弱點(diǎn)。并將之應(yīng)用于實(shí)際工程的分析與預(yù)測(cè),以驗(yàn)證這種變尺度混沌遺傳算法參數(shù)優(yōu)化的LS-SVM 模型在邊坡變形預(yù)測(cè)領(lǐng)域應(yīng)用的效果。
最小二乘支持向量機(jī)(LS-SVM)是Suykens 等提出的一種改進(jìn)的SVM 算法。LS-SVM 將標(biāo)準(zhǔn)SVM 中的不等式約束改為等式約束,以誤差平方和作為訓(xùn)練樣本的損失函數(shù),從而將2 次規(guī)劃問(wèn)題轉(zhuǎn)化為求解線性方程組問(wèn)題。
訓(xùn)練集可以表示為:(xi,yi)li=1,其中yi是目標(biāo)值,xi是輸入向量,l 為樣本個(gè)數(shù),對(duì)于線性回歸問(wèn)題采用線性函數(shù)f(x)=ω·x+b 來(lái)擬合,函數(shù)估計(jì)問(wèn)題可以描述為求解以下問(wèn)題:
約束條件:
其中φ(xi):Rn→Rnh是核空間映射函數(shù),權(quán)矢量ω∈Rnh,誤差變量ξi∈R,b 是偏差量,γ 是懲罰參數(shù)。核函數(shù)可以將原始空間中的樣本映射為高維特征空間中的一個(gè)向量,以解決線性不可分的問(wèn)題,用拉格朗日法求解這個(gè)優(yōu)化問(wèn)題:
其中φ(·):Rn→Rnh,αi,i=1,2…l,是拉格朗日乘子。根據(jù)優(yōu)化條件:
可得:
其中x=[x1,…xl],y=[y1,…yl],α=[α1,…αl],核函數(shù)K(xk,x1)=Φ(xk)TΦ(xl),是滿足Mercer 條件的對(duì)稱函數(shù)。
最小二乘支持向量機(jī)回歸估計(jì)為:
通常情況下,最小二乘支持向量機(jī)的核函數(shù)選用高斯核函數(shù)。定義為:
其中懲罰參數(shù)γ 和高斯核參數(shù)σ 直接影響到LSSVM 模型的預(yù)測(cè)效果。
為了提高LS-SVM 模型的預(yù)測(cè)準(zhǔn)確率,本文采用變尺度混沌遺傳算法對(duì)LS-SVM 中的參數(shù)σ 和懲罰參數(shù)γ 進(jìn)行優(yōu)化。
目前,關(guān)于LSSVM 的參數(shù)優(yōu)化的方法,主要有混沌優(yōu)化[14]、遺傳算法[15]和粒子群算法[16]等。但這些方法都存在一定的不足。例如,混沌優(yōu)化算法因?yàn)槠浔闅v性,其尋優(yōu)速度相對(duì)較慢,遺傳算法和粒子群算法存在早熟及局部收斂的問(wèn)題。為了彌補(bǔ)其不足,本文將混沌優(yōu)化和遺傳算法結(jié)合起來(lái)?;煦邕\(yùn)動(dòng)的遍歷性避免了遺傳算法的早熟及局部收斂的不足,遺傳算法的并行處理方法彌補(bǔ)了混沌遍歷所需時(shí)間。該改進(jìn)算法具有收斂速度快,不易陷入局部最值點(diǎn)的特點(diǎn)。本文采用常用的一維logistic 映射[17]為:
其中,0≤x1≤1;k 是迭代次數(shù),k=1,2,…;μ 是控制參量,當(dāng)μ=4 時(shí)系統(tǒng)完全處于混沌狀態(tài),此時(shí)xk在[0,1]的范圍內(nèi)變化。
其主要步驟如下:
1)初始化LS-SVM 參數(shù)并對(duì)其進(jìn)行二進(jìn)制編碼,產(chǎn)生遺傳算法的初始群體,選擇樣本均方根誤差(RMSE)作為適應(yīng)度函數(shù)值。LS-SVM 模型需要優(yōu)化的參數(shù)為σ 與γ,其優(yōu)化區(qū)間分別為[a1,b1]、[a2,b2],碼串中包括兩個(gè)參數(shù)的二進(jìn)制碼。
2)將長(zhǎng)為m 的位串按照參數(shù)σ 與γ 分成兩段,分別映射到[0,1]的區(qū)間,如
其中,dec(β)是二進(jìn)制位串β 的十進(jìn)制數(shù)值;v 是位串β 的長(zhǎng)度。
3)利用式(11)迭代得到兩個(gè)[0,1]區(qū)間的新值,分別將其逆映射為長(zhǎng)度是p、q 的位串,組合成長(zhǎng)度為m的新二進(jìn)制位串,產(chǎn)生一組新的種群。并利用訓(xùn)練集運(yùn)行LS-SVM 算法,計(jì)算適應(yīng)值f1(σ,γ)。
4)按照遺傳算法對(duì)參數(shù)映射種群進(jìn)行選擇操作。
5)按照遺傳算法對(duì)參數(shù)映射種群以概率pc進(jìn)行交叉操作。
6)按照遺傳算法對(duì)參數(shù)映射種群以概率pm進(jìn)行變異操作。
7)利用變異后的個(gè)體計(jì)算新的適應(yīng)值f2(σ,γ),如果f2(σ,γ)<f1(σ,γ),則根據(jù)遺傳算法對(duì)參數(shù)映射種群進(jìn)行復(fù)制運(yùn)算接受新個(gè)體,并標(biāo)記性能最好的個(gè)體。
8)重復(fù)步驟(2~6)的操作,如果種群最優(yōu)值在一定步數(shù)內(nèi)保持不變,則將最優(yōu)個(gè)體記做pi*(i=1,2)。
9)進(jìn)行變尺度操作,縮小變量搜索范圍,如
其中,λ∈(0,0.5),r 是縮小搜索方位的操作次數(shù)。為使變量落入正確取值區(qū)間內(nèi),做出以下界定:若air+1<air,則令air+1取值air;若bir+1>bir,則bir+1取值bir。
10)按照縮小了的搜索范圍內(nèi)產(chǎn)生新種群,執(zhí)行步驟(2~8)。若最優(yōu)值在若干次內(nèi)保持不變,則結(jié)束尋優(yōu)操作。得到的pi*(i=1,2)對(duì)應(yīng)于參數(shù)σ 與γ 優(yōu)化值。
解空間的搜索空間越大,優(yōu)化方法的搜索精度越低,且失效的可能性越大,且在相同區(qū)間內(nèi)盲目的重復(fù)搜索,會(huì)降低優(yōu)化效率。該優(yōu)化算法首先在較大范圍內(nèi)進(jìn)行粗搜索,確定參數(shù)的次優(yōu)值,然后利用變尺度混沌優(yōu)化方法縮小搜索范圍,在其縮小的范圍內(nèi)進(jìn)行細(xì)搜索以確定參數(shù)的最優(yōu)值,加快了搜索速度和精度。
本文采用Matlab 語(yǔ)言編制了基于混沌遺傳算法參數(shù)優(yōu)化的最小二乘支持向量機(jī)邊坡位移預(yù)測(cè)程序,為本文研究作為基礎(chǔ)。
將該模型應(yīng)用于某水利水電工程左岸巖質(zhì)邊坡EL1885~EL1960 的位移觀測(cè)點(diǎn)中,以2007 年10 月18日到2008 年07 月03 日時(shí)間段實(shí)測(cè)監(jiān)測(cè)數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù)和檢驗(yàn)數(shù)據(jù),共40 個(gè)監(jiān)測(cè)數(shù)據(jù),如表1所示,前30 個(gè)數(shù)據(jù)用于對(duì)邊坡變形監(jiān)測(cè)時(shí)序進(jìn)行回歸建模,后10 個(gè)數(shù)據(jù)用于預(yù)測(cè)驗(yàn)證。
表1 用于構(gòu)建訓(xùn)練數(shù)據(jù)集的實(shí)測(cè)位移
本文首先對(duì)數(shù)據(jù)進(jìn)行歸一化處理,以將數(shù)據(jù)控制在(0,1)的范圍。這樣可以有效減小預(yù)測(cè)誤差,所用歸一化公式如下:
選擇均方根誤差(RMSE)作為適應(yīng)度函數(shù)值:
利用建立起來(lái)的LS-SVM 模型對(duì)后10 個(gè)時(shí)間段的位移數(shù)據(jù)進(jìn)行預(yù)測(cè),并與使用標(biāo)準(zhǔn)遺傳算法對(duì)LSSVM 參數(shù)優(yōu)化預(yù)測(cè)模型做個(gè)比較,詳細(xì)結(jié)果如表2 所示,可以看出基于CAG 優(yōu)化的LS-SVM 模型的預(yù)測(cè)值均方根誤差為0.21,最大相對(duì)誤差為0.057,明顯小于基于SGA 優(yōu)化的模型預(yù)測(cè)的0.32 和0.076。從表2 可以更加直觀的看到基于CAG 優(yōu)化的LS-SVM 模型具備更好的預(yù)測(cè)性能,且預(yù)測(cè)效果令人滿意。
圖1 LS-SVM 模型的兩種參數(shù)優(yōu)化算法的收斂性比較
表2 兩組參數(shù)優(yōu)化LS-SVM 模型的預(yù)測(cè)結(jié)果
1)針對(duì)工程邊坡位移變化的復(fù)雜性,采用最小二乘支持向量機(jī)(LS-SVM)建立邊坡位移預(yù)測(cè)模型,對(duì)邊坡位移進(jìn)行短期預(yù)測(cè),考慮到參數(shù)選擇對(duì)模型預(yù)測(cè)的重要影響,提出了基于變尺度混沌遺傳算法的聯(lián)合優(yōu)化的模型方法(CGA-LSSVM)。
2)采用混沌遺傳算法(CGA)對(duì)LS-SVM 的參數(shù)進(jìn)行優(yōu)化,其參數(shù)尋優(yōu)速度比普通遺傳算法(SGA)有了明顯的提高,同時(shí)在一定程度上克服了遺傳算法易陷于局部最優(yōu)的缺陷,加強(qiáng)了對(duì)最優(yōu)解的局部搜索能力,因此搜索效率及其預(yù)測(cè)精度都有了進(jìn)一步的提高。
3)將其模型應(yīng)用到某水利水電工程左岸巖質(zhì)邊坡體邊坡位移時(shí)間序列的預(yù)測(cè)中,顯示了良好的預(yù)測(cè)效果,表明本文提出的CGA-LSSVM 模型在邊坡非線性時(shí)間序列預(yù)測(cè)中有較好的普適性和實(shí)用價(jià)值。