劉敏,鄭上雄
(1.江門市勘測(cè)院有限公司,廣東 江門 529000; 2.江西理工大學(xué),江西 贛州 341000)
改進(jìn)支持向量機(jī)在大壩變形預(yù)測(cè)中的應(yīng)用研究
劉敏1*,鄭上雄2
(1.江門市勘測(cè)院有限公司,廣東 江門 529000; 2.江西理工大學(xué),江西 贛州 341000)
支持向量機(jī)算法進(jìn)行建模的過(guò)程中,選取合適的核函數(shù)以及相關(guān)的參數(shù)組合是最重要的部分,參數(shù)選取的好壞將直接影響到預(yù)測(cè)結(jié)果的精度。本文采用基因表達(dá)式編程算法對(duì)支持向量機(jī)算法進(jìn)行參數(shù)組選取,得到改進(jìn)支持向量機(jī)算法并將其應(yīng)用于具體工程實(shí)例之中。結(jié)果表明改進(jìn)支持向量機(jī)大壩變形預(yù)測(cè)模型比傳統(tǒng)支持向量機(jī)大壩變形預(yù)測(cè)模型得出的預(yù)測(cè)結(jié)果的精度提高了近3倍,從而說(shuō)明基于基因表達(dá)式編程的改進(jìn)支持向量機(jī)的預(yù)測(cè)模型在大壩變形預(yù)測(cè)中具有良好的預(yù)測(cè)效果。
大壩變形;支持向量機(jī);基因表達(dá)式編程;預(yù)測(cè)模型;精度
支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱SVM)算法在數(shù)據(jù)樣本范圍較小時(shí),也能獲得滿意預(yù)測(cè)值,其主要思想是當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)降低的時(shí)候,期望風(fēng)險(xiǎn)的主界值也能降低,在原有小范圍數(shù)據(jù)的基礎(chǔ)上,保證模型能獲得滿意的預(yù)測(cè)精度。在處理非線性問(wèn)題上,由內(nèi)積函數(shù)架構(gòu)的非線性變換可把輸入空間轉(zhuǎn)換成一個(gè)高維空間,并在這個(gè)高維空間中尋找輸入與輸出變量之間的非線性關(guān)系[1]。大壩變形受到溫度、時(shí)效因子以及水位等因素影響,所以其變形值呈現(xiàn)出非線性的特性[2],將SVM算法于大壩沉降影響因子建立起數(shù)學(xué)模型能有效預(yù)測(cè)出大壩的變形情況。然而,SVM進(jìn)行建模的過(guò)程中,選取合適的核函數(shù)以及相關(guān)的參數(shù)組合是最重要的部分,參數(shù)選取的好壞將直接影響到預(yù)測(cè)結(jié)果的精度,基于此本文采取用基因表達(dá)式編程算法[3](Gene Expression Programming, 簡(jiǎn)稱GEP)進(jìn)行對(duì)其進(jìn)行參數(shù)選取,利用GEP強(qiáng)大的全局搜索能力尋找出支持向量機(jī)的最佳參數(shù)組合[4],建立經(jīng)基因表達(dá)式編程優(yōu)化的支持向量機(jī)大壩變形預(yù)測(cè)模型[5~9]。
SVM大壩變形模型建立受懲罰因子C、松弛變量ε以及核函數(shù)K(xi,xj)多個(gè)參數(shù)的影響,選取合適的參數(shù)是本文研究的核心。
2.1 懲罰因子C
懲罰因子C決定了本算法有多重視離群點(diǎn)的損失,定的C越大,則目標(biāo)函數(shù)損失越大,而且C是非變量,它是事先被定好的數(shù)值,數(shù)值定好之后得到一個(gè)分類器,根據(jù)樣本數(shù)據(jù)測(cè)試,如果測(cè)試不及格,就換一個(gè)C值,如此循環(huán)尋優(yōu),直到找出符合條件的C值為止,但是這和優(yōu)化本身不同,懲罰因子C始終是個(gè)定值。
2.2 松弛變量ε
松弛變量ε則代表相對(duì)應(yīng)點(diǎn)的離群程度,其值越大,就代表點(diǎn)離的更遠(yuǎn)。它能協(xié)調(diào)經(jīng)驗(yàn)風(fēng)險(xiǎn)和推廣性能兩者之間的關(guān)系,起到平衡作用。
2.3 核參數(shù)g
核參數(shù)g代表了核函數(shù)性能的優(yōu)劣。若g過(guò)大,則模型泛化能力弱;若g過(guò)小,則模型相關(guān)性弱,所以選取適當(dāng)?shù)暮藚?shù)也是本文的核心部分。
改進(jìn)SVM建模的中心思想是:將參數(shù)組合群進(jìn)行初始化,通過(guò)GEP算法對(duì)參數(shù)組合群進(jìn)行基本的遺傳操作,計(jì)算每個(gè)個(gè)體組合的適應(yīng)值,若達(dá)到計(jì)算精度,則進(jìn)化結(jié)束;若沒(méi)有達(dá)到計(jì)算精度則繼續(xù)進(jìn)行循環(huán)操作,直到尋找出最優(yōu)參數(shù)組合[10]。
把監(jiān)測(cè)點(diǎn)原始值分為兩組,第一組當(dāng)作訓(xùn)練樣本,第二組作為預(yù)測(cè)樣本。運(yùn)用GEP算法選出的參數(shù)組,建立改進(jìn)后SVM模型,通過(guò)改進(jìn)SVM模型預(yù)測(cè)監(jiān)測(cè)點(diǎn)的變形情況得到后期變形數(shù)據(jù)再與原來(lái)預(yù)測(cè)樣本數(shù)據(jù)作對(duì)比,最后進(jìn)行精度比較。具體分為三大步:首先是通過(guò)GEP算法對(duì)參數(shù)組合群進(jìn)行擇優(yōu)篩選,以尋選得最優(yōu)參數(shù)組;其次利用最優(yōu)參數(shù)組應(yīng)用于標(biāo)準(zhǔn)SVM算法中建立改進(jìn)SVM大壩預(yù)測(cè)模型;最后將改進(jìn)SVM大壩預(yù)測(cè)模型應(yīng)用在實(shí)例中得出結(jié)果并進(jìn)行精度分析,流程圖如1所示。
圖1 改進(jìn)SVM預(yù)測(cè)模型建模流程圖
具體步驟如下:
(1)數(shù)據(jù)預(yù)處理。先將所獲得大壩原始觀測(cè)數(shù)據(jù)經(jīng)小波變換處理,剔除噪聲及相關(guān)無(wú)用信號(hào),使得原始數(shù)據(jù)更為平滑完整,便于后期的數(shù)據(jù)處理分析。
(2)數(shù)據(jù)樣本構(gòu)造。將大壩原始觀測(cè)值分成兩組,其一為訓(xùn)練樣本,另一組為預(yù)測(cè)樣本。其中,訓(xùn)練樣本數(shù)據(jù)被用于進(jìn)行建模,預(yù)測(cè)樣本數(shù)據(jù)被用于進(jìn)行精度對(duì)比。
(3)確定參數(shù)組(C,g,ε)的約束范圍。
(4)設(shè)定GEP的控制參數(shù)。
(5)初始化參數(shù)組種群。參數(shù)組合群初始化是隨機(jī)的,所以想要從種群中找到最優(yōu)解是比較困難的。然而只要反復(fù)的初始化種群直到產(chǎn)生最少一個(gè)合法個(gè)體,本算法即可開(kāi)始。
(6)適應(yīng)度評(píng)價(jià)。適應(yīng)度就是來(lái)檢測(cè)個(gè)體能否適應(yīng)外界環(huán)境的一個(gè)指標(biāo)。個(gè)體表現(xiàn)好壞可以依據(jù)適應(yīng)度函數(shù)計(jì)算出來(lái)。本文選取的適應(yīng)度函數(shù)為:
式中,m為參數(shù)組合訓(xùn)練個(gè)數(shù),yi為對(duì)應(yīng)的對(duì)應(yīng)訓(xùn)練數(shù)據(jù)集合的訓(xùn)練數(shù)據(jù),yj為利用表達(dá)式由訓(xùn)練數(shù)據(jù)集合得到的yi的估計(jì)值。然后根據(jù)適應(yīng)度函數(shù)解析GEP的基因編碼,計(jì)算每個(gè)參數(shù)組合的適應(yīng)度值來(lái)評(píng)價(jià)種群,若滿足計(jì)算精度要求,則進(jìn)化完成,否則繼續(xù)下一步。
(7)GEP算法參數(shù)設(shè)定。設(shè)定種群數(shù)目、基因數(shù)目、變異率、倒串率以及插串率重組率等參數(shù)。
(8)輸出SVM的參數(shù)最優(yōu)解。通過(guò)輸入原始參數(shù)組合種群經(jīng)GEP算法運(yùn)算之后輸出最優(yōu)參數(shù)組合即:
(Best-C,Best-g,Best-ε)。
(9)改進(jìn)SVM模型的建立。通過(guò)GEP算法獲得最佳參數(shù)組合后,結(jié)合傳統(tǒng)SVM算法通過(guò)改變傳統(tǒng)SVM算法的參數(shù)值獲得改進(jìn)SVM算法,通過(guò)改進(jìn)SVM算法構(gòu)建改進(jìn)SVM大壩變形預(yù)測(cè)模型。
(10)用改進(jìn)SVM大壩預(yù)測(cè)模型預(yù)測(cè)大壩變形量得出的預(yù)測(cè)結(jié)果與傳統(tǒng)大壩預(yù)測(cè)模型得出的預(yù)測(cè)值作對(duì)比分析。
本次大壩監(jiān)測(cè)數(shù)據(jù)來(lái)源于對(duì)云南省某大壩升船機(jī)的真實(shí)監(jiān)測(cè)采集數(shù)據(jù),選取其中左上塔筒ZS-305監(jiān)測(cè)點(diǎn)進(jìn)行數(shù)據(jù)研究,通過(guò)改進(jìn)SVM大壩變形預(yù)測(cè)模型計(jì)算出實(shí)驗(yàn)結(jié)果如下:
兩種模型預(yù)測(cè)值與觀測(cè)值數(shù)據(jù)對(duì)比表(左上塔筒ZS-305監(jiān)測(cè)點(diǎn)) 表1
對(duì)應(yīng)的數(shù)據(jù)結(jié)果對(duì)比圖如2所示:
圖2 兩種模型預(yù)測(cè)值與觀測(cè)值數(shù)據(jù)對(duì)比圖(左上塔筒ZS-305監(jiān)測(cè)點(diǎn))
本文利用改進(jìn)支持向量機(jī)大壩變形預(yù)測(cè)模型對(duì)大壩變形進(jìn)行預(yù)測(cè)研究,得出以下結(jié)論:
(1)參數(shù)選擇上,如何選取最優(yōu)參數(shù)組是本次研究的核心。本文通利用GEP算法強(qiáng)大的全局搜索能力尋找出支持向量機(jī)的最佳參數(shù)組合,建立了經(jīng)基因表達(dá)式編程優(yōu)化的支持向量機(jī)大壩變形預(yù)測(cè)模型。
(2)精度方面,比較基于兩種預(yù)測(cè)模型所得的預(yù)測(cè)結(jié)果,改進(jìn)SVM預(yù)測(cè)模型所得預(yù)測(cè)結(jié)果的精度比傳統(tǒng)SVM預(yù)測(cè)模型所得預(yù)測(cè)結(jié)果提高了將近3倍,說(shuō)明改進(jìn)SVM大壩變形預(yù)測(cè)模型相對(duì)于傳統(tǒng)SVM大壩變形預(yù)測(cè)模型的預(yù)測(cè)精度更高[11]。
[1] 白鵬,張喜斌,張斌等. 支持向量機(jī)理論及工程應(yīng)用實(shí)例[M]. 西安電子科技大學(xué)出版社: 2008,7~40.
[2] 高永剛,岳建平,石杏喜. 支持向量機(jī)在變形監(jiān)測(cè)數(shù)據(jù)處理中的應(yīng)用[J]. 水電自動(dòng)化與大壩監(jiān)測(cè),2005(5):36~39.
[3] 元昌安,彭昱忠,覃曉等.基因表達(dá)式編程算法原理與應(yīng)用[M]. 北京:科學(xué)出版社,2010.
[4] 王文棟,鐘智,元昌安. 基于GEP的支持向量機(jī)參數(shù)優(yōu)化[J]. 廣西師范學(xué)院學(xué)報(bào)·自然科學(xué)版,2010(2):66~70.
[5] 王新洲,范千,許承權(quán)等. 基于小波變換和支持向量機(jī)的大壩變形預(yù)測(cè)[J]. 武漢大學(xué)學(xué)報(bào)·信息科學(xué)版,2008(5):469-471+507.
[6] 宋志宇,李俊杰. 最小二乘支持向量機(jī)在大壩變形預(yù)測(cè)中的應(yīng)用[J]. 水電能源科學(xué),2006(6):49-52+115-116.
[7] 任超,梁月吉,龐光鋒等. 基于灰色最小二乘支持向量機(jī)的大壩變形預(yù)測(cè)[J]. 大地測(cè)量與地球動(dòng)力學(xué),2015(4):608~612.
[8] 王騰軍,楊海彥,楊志強(qiáng). 基于云模型的大壩變形監(jiān)測(cè)數(shù)據(jù)分析研究[J]. 測(cè)繪通報(bào),2012(2):23~25.
[9] 徐鋒,王崇倡,張飛. 粒子群-BP神經(jīng)網(wǎng)絡(luò)模型在大壩變形監(jiān)測(cè)中的應(yīng)用[J]. 測(cè)繪科學(xué),2012(4):181~183.
[10] 龔文引,蔡之華,劉亞?wèn)|. 基因表達(dá)式程序設(shè)計(jì)在復(fù)雜函數(shù)自動(dòng)建模中的應(yīng)用[J]. 系統(tǒng)仿真學(xué)報(bào),2006(6):1450-1454+1457.
[11] 李瀟. 灰色最小二乘支持向量機(jī)在滑坡變形預(yù)測(cè)中的應(yīng)用[J]. 測(cè)繪通報(bào),2010(6):44~46.
Application of Improved Support Vector Machine in Dam Deformation Prediction
Liu Min1,Zheng Shangxiong2
(1.Jiangmeng Investigation and Surveying Institute,Jiangmen 529000,China; 2.Jiangxi University of Science and Technology,Ganzhou 341000,China)
SVM modeling process, select the appropriate kernel function and the associated parameter combination is the most important part of the parameter selection will directly affect the accuracy of the prediction results. In this paper, gene expression programming algorithm support vector machine algorithm parameter set selection, get into improved support vector machine algorithm and its application to specific engineering examples. The results show that the improved accuracy of deformation prediction model of dam than the traditional support vector machine Support vector machine prediction model of dam deformation prediction results obtained increased nearly three-fold, so that prediction model described GEP improved support vector machine based on dam deformation prediction has a good prediction.
dam deformation;support vector machine;gene expression programming;prediction model;accuracy
1672-8262(2017)01-126-03
TU196
B
2016—09—19 作者簡(jiǎn)介:劉敏(1990—),男,碩士,工程師,主要從事測(cè)繪工程技術(shù)工作。 基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(41561091)