劉小生,于 良(江西理工大學,江西 贛州 341000)
修建電站、水庫會形成大量人工開挖邊坡。由于大壩邊坡受水文氣候、地質(zhì)構造等重要因素的影響,導致邊坡滑坡事件屢見不鮮,給人民的生產(chǎn)和生活帶來了巨大影響并會造成財產(chǎn)損失,因此對邊坡的變形預測和預警就顯得尤為迫切和重要。在已經(jīng)提出的許多預測方法中[1],回歸分析法實際工作時很難建立顧及各因素的非線性數(shù)學監(jiān)控模型[2];時間序列分析法很難針對特定數(shù)據(jù)構造合適的模型[3];灰色理論對原始數(shù)據(jù)要求較高,當原始數(shù)據(jù)序列波動較大、信息過于分散時預測精度往往降低[4];神經(jīng)網(wǎng)絡模型存在收斂速度慢和陷入局部極值等問題[5]。海量數(shù)據(jù)大量涌現(xiàn),高維數(shù)據(jù)給傳統(tǒng)機器學習方法提出了嚴峻的挑戰(zhàn)。
支持向量機(support vector machine,SVM)較好地解決了以往困擾很多學習方法的小樣本、非線性、過學習、高維數(shù)、局部極小點等實際問題,具有很強的泛化能力[6]。為了使支持向量機更好地運用到邊坡位移預測中,近年來不少學者對支持向量機中參數(shù)尋優(yōu)方法進行了改進研究。關于支持向量機參數(shù)尋優(yōu)的方法,國際上并沒有公認統(tǒng)一的最好方法。常用的方法有:網(wǎng)格法、粒子群算法、遺傳算法。其中粒子群算法和遺傳算法由于初始值隨機選取,造成參數(shù)搜索結果隨機性較大,需多次訓練才能得到較好的參數(shù)[7];傳統(tǒng)網(wǎng)格法相對于粒子群算法和遺傳算法參數(shù)尋優(yōu)穩(wěn)定,但搜索速度較慢,精度較低[8]。因此本文改進傳統(tǒng)網(wǎng)格法的參數(shù)尋找范圍和搜索步距,目的是為了防止參數(shù)選取范圍過大而造成收斂速度過慢,步距不夠小而造成找不到準確的參數(shù)組,從而得到改進網(wǎng)格法,并在此基礎上進行改進的支持向量機大壩邊坡預測研究。
支持向量機是由Vapnik基于統(tǒng)計學習理論提出的一種機器學習方法[9]。目前分為支持向量分類機和支持向量回歸機。支持向量回歸機(support vector regression machine,SVR)基本原理[10]為:設原來的訓練集為給定某邊坡的監(jiān)測數(shù)據(jù)
T={(xi,yi),i=1,2,…,l}∈(Rn×R)l
式中,xi∈Rn;yi=R,i=1,2,…,l。選取適當?shù)木圈?0和懲罰參數(shù)c>0,便可得到與線性分化相對應的原始問題
(1)
代入拉格朗日函數(shù),求解凸二次規(guī)劃問題,可解得
(2)
(3)
則得構造決策函數(shù)
(4)
運用“相似程度”的原理選取核函數(shù),目前常用的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)(RBF)。本文運用徑向基核函數(shù),構造函數(shù)變?yōu)?/p>
(5)
在支持向量機回歸估計算法中,RBF核函數(shù)的參數(shù)g及懲罰系數(shù)c均為很重要的參數(shù),其中,核函數(shù)g的選取決定了輸入空間到特征空間映射的方式,懲罰系數(shù)c用于平衡訓練誤差和模型復雜度。因此必須找到較好的參數(shù)尋優(yōu)方法,本文采用改進網(wǎng)格法對支持向量機進行參數(shù)尋優(yōu)。
針對徑向基核函數(shù)的支持向量機而言,網(wǎng)格法參數(shù)尋優(yōu)所要搜索的參數(shù)組為懲罰因子c和核參數(shù)g,將兩個參數(shù)各自設置較大的搜索范圍和較小的步距,形成一個二維空間的網(wǎng)格,遍歷網(wǎng)格中所有交叉點,并用K折交叉驗證方法得到每組的性能,最終取使系統(tǒng)達到最優(yōu)的參數(shù)作為最佳參數(shù)。
當步距足夠小,支持向量機懲罰因子c與徑向基核參數(shù)g取值范圍足夠廣,一定能夠得到最優(yōu)解,但同樣也會花費很長時間。傳統(tǒng)網(wǎng)格法參數(shù)尋優(yōu)遍歷網(wǎng)格中所有交叉點,往往只進行兩步,粗搜過后只進行一次細尋,但是步距有可能沒達到最小步距,參數(shù)范圍也有可能不足夠小,最終可能與最優(yōu)參數(shù)錯過。
針對傳統(tǒng)的網(wǎng)格法參數(shù)尋優(yōu)的不足,對傳統(tǒng)網(wǎng)格法作出改進[11-12],得到本文改進的網(wǎng)格參數(shù)尋優(yōu)方法。先粗略搜索即大步距、大范圍,即以2的冪次方沿著兩個參數(shù)的不同增長方向生成網(wǎng)格,這樣既能遍歷所有參數(shù),又能方便網(wǎng)格的收縮與增長。網(wǎng)格中的節(jié)點即為給定范圍內(nèi)所有可能得到的參數(shù)對;根據(jù)樣本集,利用5-折交叉驗證[13]找出最佳參數(shù)組,判斷是否滿足精度要求或結果穩(wěn)定。如果滿足要求,儲存參數(shù),參數(shù)優(yōu)化結束;如果不滿足要求,再把c和g的取值范圍縮小到最優(yōu)值左右并適當減小步距,如果同時出現(xiàn)兩處最優(yōu)位置,取c值較小的最優(yōu)位置,依次類推,逐步減小步距與參數(shù)取值范圍,直到滿足精度要求或結果穩(wěn)定為止。
為了消除或減弱基于啟發(fā)式參數(shù)尋優(yōu)算法的支持向量機邊坡預測模型的不足,改進傳統(tǒng)網(wǎng)格法參數(shù)尋優(yōu)算法搜索速度較慢、精度較低等問題,提出了改進SVR組合預測模型。其具體思路如下:
首先,對原始數(shù)據(jù)做數(shù)據(jù)預處理。原始數(shù)據(jù)難免存在奇異值,運用“3δ準測”剔除奇異值,將剔除的奇異值“斷鏈”現(xiàn)象運用內(nèi)在物理聯(lián)系、線性內(nèi)插法、多項式曲線擬合等進行插補,由于所研究的數(shù)據(jù)可能不在同一個量綱單位,或為加快預測組合模型運行速度,因此需要對樣本數(shù)據(jù)進行標準化處理,將樣本數(shù)據(jù)歸一化到區(qū)間[0,1]中。
其次,建立支持向量回歸機。支持向量回歸機尋求的是利用一個線性回歸方程(函數(shù)y=g(x)可能為一維、二維、…、n維)去擬合所有的樣本點,即使用y=g(x)來推斷任意輸入x所對應的輸出值。求解回歸方程可以將其簡化為一個求二次凸規(guī)劃問題,運用最小貫序列方法(sequential minimal optimization,SMO)等求解,依據(jù)“相似程度”的概念來選取適當?shù)暮撕瘮?shù),本文采用徑向基核函數(shù)。
最后,運用改進的網(wǎng)格法進行支持向量機參數(shù)尋優(yōu)。先粗略搜索即大步距、大范圍,得到最優(yōu)解大致位置,再把c和g的取值范圍縮小到最優(yōu)值左右并適當減小步距,如果同時出現(xiàn)兩處最優(yōu)位置,取c值較小的最優(yōu)位置,依次類推,逐步減小步距與參數(shù)取值范圍,直到滿足精度要求或結果穩(wěn)定為止。
圖1為改進的SVR大壩邊坡位移預測模型構建流程。
圖1 改進SVR組合模型構建流程
試驗采用的數(shù)據(jù)是錦屏一級工程壩區(qū)左岸纜機平臺邊坡位于f42-9斷層出露部分的多點位移計M4-7(高程1886 m)的孔口位移數(shù)據(jù),作為本文工程實例的原始數(shù)據(jù)[14],見表1。
表1 M4-7觀測點監(jiān)測數(shù)據(jù)
采用基于改進網(wǎng)格法參數(shù)尋優(yōu)的支持向量機的左岸纜機平臺邊坡的預測變形過程如下:
(1) 首先對左岸纜機平臺邊坡監(jiān)測位移數(shù)據(jù)“剔異補缺”,然后將數(shù)據(jù)歸一化到[0,1]。將觀測數(shù)據(jù)1~30設為訓練集,31~34設為測試集。
(2) 選擇適當?shù)暮撕瘮?shù),由左岸纜機平臺邊坡監(jiān)測位移數(shù)據(jù)可知,采用徑向基核函數(shù)(RBF)為最佳選擇。
(3) 用改進網(wǎng)格法搜索參數(shù)c、g,粗搜c的初始范圍設為[2-8,28],g的初始范圍設置為[2-8,28]。由于傳統(tǒng)的網(wǎng)格法初始步距為1,因此本文改進網(wǎng)格法初始步距也設置為1。
(4) 采用K折交叉驗證方法對訓練集進行測試,其中K=5,初步得到最優(yōu)參數(shù)c=0.4和g=11.6。
(5) 根據(jù)得到的最優(yōu)值可將范圍縮小c∈(2-4,24),g∈(2-4,24),步距改為0.1,從而得到最優(yōu)參數(shù)c=0.51、g=12.17。
(6) 繼續(xù)步驟(5)細搜,范圍縮小c∈(21.5,22.5),g∈(23,24),步距改為0.01,依此類推,縮小范圍和步距,最終得到最優(yōu)參數(shù)c=0.574 3、g=12.125 7,使預測結果趨于穩(wěn)定。
(7) 用得到的c=0.574 3、g=12.125 7在訓練樣本上進行訓練,得出邊坡預測模型。
(8) 用基于改進的SVR大壩邊坡位移預測模型對樣本數(shù)據(jù)進行測試。
試驗平臺采用Faruto等基于Matlab數(shù)學軟件開發(fā)設計的加強版LIBSVM3.1-[FarutoULtimate3.1 Mcode]工具箱進行測試。用均方誤差MSE作為評價指標
(6)
式中,Xi(i=1,2,…,n)為真實值;Yi(i=1,2,…,n)為預測值。MSE越接近于0,預測效果越好。SVR參數(shù)精確搜索3D效果圖和等高線圖,如圖2、圖3所示。
圖2 SVR參數(shù)尋優(yōu)(3D視圖)
圖3 SVR參數(shù)尋優(yōu)等高線
為方便分析改進網(wǎng)格法參數(shù)尋優(yōu)的支持向量機邊坡預測模型所得結果的優(yōu)越性,同時采用傳統(tǒng)網(wǎng)格法的支持向量機預測模型進行了預測,預測誤差用相對誤差Erep表示,對比結果見表2。
(7)
式中,Xi(i=1,2,…,n)為真實值;Yi(i=1,2,…,n)為預測值。
表2 M4-7監(jiān)測點邊坡變形預測結果
從表2可知,改進網(wǎng)格法參數(shù)尋優(yōu)的支持向量機預測模型的相對誤差最大為1.225 6%,最小為0.058 9%。傳統(tǒng)網(wǎng)格法參數(shù)尋優(yōu)的支持向量機預測模型的相對誤差最大為20.227 3%,最小為14.456 4%。兩種最大相對誤差相差19.001 7%,兩種最小相對誤差相差14.397 5%。
同理應用粒子群算法(particle swan optimization,PSO)的支持向量機邊坡預測模型[15]對左岸纜機平臺邊坡變形進行了二次預測,結果如圖4所示。
圖4 PSO+SVR兩次邊坡位移預測
從圖4中可知,基于粒子群算法的支持向量機邊坡預測模型,兩次預測值不同,證實了PSO參數(shù)尋優(yōu)方法具有搜索結果隨機性較大的特性,預測值不穩(wěn)定性,需要多次訓練才能確定較好的結果,不如本文改進網(wǎng)格法參數(shù)尋優(yōu)結果穩(wěn)定。
本文針對傳統(tǒng)支持向量機參數(shù)尋優(yōu)的不足,對網(wǎng)格法參數(shù)尋優(yōu)作出改進,即在粗略搜索最優(yōu)解大致位置的基礎上,進行多次精細搜索,直至找到滿足精度要求的解,在此基礎上建立了改進的SVR大壩邊坡位移預測模型。試驗結果表明,該改進模型可應用到邊坡預測中,與傳統(tǒng)預測模型對比,穩(wěn)定性和精度都有較大的提高,可以推廣應用。
參考文獻:
[1] 蘇巧榮.基于MATLAB下BP神經(jīng)網(wǎng)絡的邊坡穩(wěn)定分析[J].河南大學學報(自然科學版),2007,31(6):595-600.
[2] 蔣晨,張書畢,文小勇.基于中位數(shù)回歸分析的礦區(qū)變形監(jiān)測數(shù)據(jù)處理[J].金屬礦山,2016,479(5):192-195.
[3] 張拯,張獻州.時間序列協(xié)整關系及其在變形分析中的應用研究[J].測繪工程,2015,24(9):53-58.
[4] 趙財軍,陳鵬宇,李莉.改進GM(1,1)模型在基坑變形預測中的應用[J].人民長江,2010,41(6):32-34,39.
[5] 趙文秀,張曉麗,李國會,等.基于隨機森林和RBF神經(jīng)網(wǎng)絡的長期徑流預報[J].人民黃河,2015,37(2):10-12.
[6] 趙洪波,馮夏庭.非線性位移時間序列預測的進化-支持向量機方法及應用[J].巖土工程學報,2003,25(4):468-471.
[7] 張玉欣,程志峰,徐正平,等.參數(shù)尋優(yōu)支持向量機在基于光聲光譜法的變壓器故障診斷中的應用[J].光譜學與光譜分析,2015,35(1):10-13.
[8] 趙朝賀.一種改進的支持向量機參數(shù)優(yōu)化方法[J].地理空間信息,2017,15(1):53-55,11.
[9] 李丹娜,郭云開,朱善寬,等.利用PRO4SAIL與支持向量機回歸的組合模型反演植被等效水厚度[J].測繪通報,2017(8):50-55.
[10] 米蘭,王文斌.基于支持向量回歸機的汽輪機排汽焓預測研究[J].熱能動力工程,2016,31(11):38-42.
[11] 郭美麗,覃錫忠,賈振紅,等.基于改進的網(wǎng)格搜索SVR的話務預測模型[J].計算機工程與科學,2014,36(4):707-712.
[12] 楊學存,侯媛彬,洪衛(wèi)林,等.基于參數(shù)優(yōu)化支持向量機的煤泥輸送管道壓力預測[J].煤炭工程,2013,45(12):112-115.
[13] 郭際明,王威,張帥.支持向量機輔助下的智能手機行人運動模式識別[J].測繪通報,2018(2):1-5.
[14] 鄭志成,徐衛(wèi)亞,等.基于混合核函數(shù)PSO-LSSVM的邊坡變形預測[J].巖土工程,2012,33(5):1421-1426.
[15] 高昆侖,劉建明,徐茹枝,等.基于支持向量機和粒子群算法的信息網(wǎng)絡安全態(tài)勢復合預測模型[J].電網(wǎng)技術,2011,35(4):176-182.