肖 陽,唐詩華,王江波,袁隆疆,王 凱
(1.廣西空間信息與測繪重點實驗室,廣西桂林541004;2.桂林理工大學測繪地理信息學院,廣西桂林541004)
大壩變形監(jiān)測作為保障大壩安全的重要措施,一直以來都是壩工建設(shè)和大壩管理中必不可少的一環(huán)[1],其變形量受諸多因素影響,如:水位、溫度、時效等。這些影響因子的隨機性和非線性通常較強,這使得直接建立精確的大壩變形量與影響因子之間的關(guān)系模型存在很大困難[2]。為解決此類問題,國內(nèi)外常用的預測模型有:神經(jīng)網(wǎng)絡(luò)[3]、時間序列分析法[4]、支持向量機[5]等,并取得了較好的效果。其中,神經(jīng)網(wǎng)絡(luò)存在預測樣本需求大,算法效率低且易收斂于局部最小的缺陷;時間序列存在要求數(shù)據(jù)平穩(wěn)、正態(tài)和零均值等不足。最小二乘支持向量機(Least SquaresSupport Vector Machine,LS-SVM)是支持向量機的一種改進,具有模型構(gòu)造簡單、全局尋優(yōu)效果好、自適應(yīng)能力強等優(yōu)點,精于解決各種具有小樣本、非線性、高維數(shù)等問題的數(shù)據(jù)。但其選取參數(shù)所采用的交叉驗證法盲目又耗時,選擇不當時,得到的擬合效果不是很理想[6]。果蠅算法(Fruit Fly Optimization Algorithm,F(xiàn)OA)相對于其他智能算法,具有原理簡單易理解,程序易實現(xiàn),運行時間少,需調(diào)整的參數(shù)少等優(yōu)點,一經(jīng)提出就引起了國內(nèi)外許多學者的廣泛關(guān)注[7- 9]?;诖耍疚膶OA算法引入LS-SVM模型中,充分利用其優(yōu)越的參數(shù)優(yōu)化能力,精確快速搜索LS-SVM的最佳模型參數(shù)以實現(xiàn)較為精準的大壩變形預測,并通過算例探討優(yōu)化模型的可行性與優(yōu)越性。
1990年,Suykens和Vandewalb[10]基于最基本的支持向量機,提出了一種新的預測模型,即LS-SVM。其將最小二乘原理引入基礎(chǔ)支持向量機中,采用等式約束來代替標準SVM中的不等式約束,并將其所選用的數(shù)據(jù)的誤差平方和損失函數(shù)作為訓練樣本的經(jīng)驗損失。LS-SVM將數(shù)據(jù)通過某個非線性映射函數(shù)映射到高維特征空間,于高維空間構(gòu)造線性優(yōu)化函數(shù),根據(jù)結(jié)構(gòu)風險最小化原則將擬合問題轉(zhuǎn)換為函數(shù)優(yōu)化問題,即設(shè)訓練樣本集為(xi,yi),i=1,2,…,n,其中xi∈Rm,yi∈R。依據(jù)結(jié)構(gòu)風險最小化原則,將其轉(zhuǎn)換為函數(shù)優(yōu)化問題,即
(1)
引入約束條件
yi=wTφ(xi)+b+ξi
(2)
式中,w∈Rm為權(quán)系數(shù)向量;φ(x)為非線性映射函數(shù);ξi為樣本點的訓練誤差;c為懲罰系數(shù);b為閾值。為解決該優(yōu)化問題,文獻[11]給出了詳細的推導過程。
此外,如何選擇適當?shù)暮撕瘮?shù)對LS-SVM的運行起重要作用,不同的核函數(shù)將直接影響其預測結(jié)果的精度。其中,多項式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù)在LS-SVM預測中應(yīng)用的最為普遍。對于何種核函數(shù)適用于LS-SVM回歸估計,文獻[12]中通過各種分析及仿真實驗,發(fā)現(xiàn)徑向基核函數(shù)為LS-SVM在回歸估計中的首選?;诖耍疚膶⒉捎脧较蚧撕瘮?shù)的LS-SVM進行優(yōu)化模型的構(gòu)建以及算例的對比分析。
2011年,臺灣學者潘文超受果蠅覓食過程啟發(fā),提出一種全新的全局尋優(yōu)算法,即FOA優(yōu)化算法。對比其他智能優(yōu)化算法,該算法普適性更強,且在程序計算中不需計算目標函數(shù)的偏導數(shù),具有實現(xiàn)簡單,全局尋優(yōu)能力強的特點,該算法的搜索效率很高。關(guān)于FOA優(yōu)化算法,其大致思路可參考文獻[13]。
FOA-LS-SVM模型基本思想:利用FOA算法快速簡便的全局搜索能力對LS-SVM建模過程中的參數(shù)c和g進行優(yōu)化處理,以獲得更高精度的LS-SVM模型。其預測模型的基本流程如圖1所示。
圖1 果蠅算法優(yōu)化最小二乘支持向量機流程
本文以文獻[14]的大壩Y向形變量監(jiān)測值為例,驗證本文提出的預測模型的有效性和可行性,其變形實測量如圖2所示。
圖2 大壩變形實測值
由圖2可看出,大壩變形值總體波動幅度較大,隨機變化性較強,呈現(xiàn)明顯的非線性和非平穩(wěn)性。為對比不同模型的效果,本文擬通過3種方案對大壩變形預測值進行分析:①方案1,BP神經(jīng)網(wǎng)絡(luò)預測模型;②方案2,LS-SVM預測模型;③方案3,F(xiàn)OA算法優(yōu)化的LS-SVM模型(FOA-LS-SVM)。為方便比較,方案2、3都采用相同核函數(shù)的LS-SVM模型。其中,方案3中果蠅種群規(guī)模設(shè)置為10,最大迭代次數(shù)取50。各模型分別采用大壩第1~51期進行建模,第52~64期進行預測,預測結(jié)果如圖3所示。
圖3 各模型預測結(jié)果對比
由圖3可知,各模型雖能大概描述實測值的變化趨勢,但就總體而言,方案3的預測曲線與原值曲線吻合得最好。而對比各觀測點的預測值可知,方案3的預測值較前兩者有了明顯的提升,不僅各個預測值與實測值之間的差距最小,且有4個點明顯與實測值點重合。
為進一步說明各個模型預測結(jié)果的優(yōu)劣,對各模型的預測結(jié)果與殘差進行統(tǒng)計,結(jié)果見表1。
表1 各模型預測結(jié)果與殘差對比 mm
從表1可以看出,方案1的預測殘差普遍偏大,殘差的絕對值最大值為0.614 mm,最小值為0.033 mm,且僅有一期殘差小于0.1 mm,大部分預測值與實際值的殘差較大;方案2略優(yōu)于前者,殘差的絕對值最大值為0.339 6 mm,最小值為0.008 3 mm;而方案3殘差的絕對值明顯優(yōu)于前兩者,其最大值僅為0.28 mm,最小值僅為0.004 8 mm,且有五期殘差的絕對值在0.1 mm以下。綜上,優(yōu)化模型有較強的非線性擬合能力,能保證較優(yōu)的局部預測值和整體精度,其預測結(jié)果能更加清晰地反映出大壩變形的趨勢,凸顯了優(yōu)化模型的優(yōu)越性。
為進一步綜合驗證優(yōu)化模型的可行性,以均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)為精度評定參數(shù),統(tǒng)計3種模型的預報精度,結(jié)果如表2所示。
表2 各模型精度對比
由表2可看出,方案1均方根誤差為0.346 6 mm,平均絕對值誤差與平均絕對百分比誤差分別為0.294 1 mm和0.243 3%;方案2均方根誤差為0.212 5 mm,平均絕對值誤差與平均絕對百分比誤差分別為0.184 4 mm和0.140 4%;方案3的預測精度較高,均方根誤差僅為0.141 2 mm,平均絕對值誤差與平均絕對百分比誤差分別為0.115 7 mm和0.090 2%,遠優(yōu)于方案1與方案2,可見新模型有較優(yōu)的預測精度,預測可信度高。綜合上述圖表可發(fā)現(xiàn),對比方案1和方案2,無論是從擬合效果還是預測精度來看,方案3的優(yōu)越性都十分明顯。
本文探討了3種不同的預測模型在大壩變形監(jiān)測中的應(yīng)用,從模型的預測精度出發(fā),對BP神經(jīng)網(wǎng)絡(luò)、LS-SVM、FOA-LS-SVM模型3種方案的預測結(jié)果進行了對比分析,得出如下結(jié)論:
(1)相較于BP神經(jīng)網(wǎng)絡(luò),LS-SVM模型具有較高精度的非線性預測能力,較好地解決了非線性、高維數(shù)等問題,在大壩變形預測的應(yīng)用方面,LS-SVM模型的優(yōu)越性比較明顯。
(2)LS-SVM模型與BP神經(jīng)網(wǎng)絡(luò)仍存在一定的局限性,如對于大壩變形值這樣具有諸多隨機非線性因素影響的數(shù)據(jù),單一的非線性模型想要取得理想的預測值是十分困難的。
(3)利用FOA算法對LS-SVM模型本身的參數(shù)搜索進行優(yōu)化,可以顯著提高參數(shù)尋優(yōu)效率以及模型預測精度,優(yōu)化模型整體應(yīng)用效果較好,應(yīng)用價值較高。優(yōu)化模型的提出,對于大壩變形監(jiān)測的研究有著深遠的意義。