李明飛,郇敏,秦川
(1.陜西省土地工程建設集團有限責任公司,西安 710000;2.陜西匯圖測繪地理信息有限公司,西安710000)
基于遺傳算法的加權(quán)最小二乘支持向量機GPS高程擬合法
李明飛1,郇敏2,秦川1
(1.陜西省土地工程建設集團有限責任公司,西安 710000;2.陜西匯圖測繪地理信息有限公司,西安710000)
由于GPS高程數(shù)據(jù)中往往含有粗差,采用最小二乘法進行GPS高程擬合時,無法探測和處理粗差,擬合結(jié)果精度較低。本文將加權(quán)最小二乘支持向量機應用于GPS高程擬合,并采用遺傳算法對參數(shù)進行優(yōu)化。結(jié)合實例,對比分析了傳統(tǒng)的二次曲面擬合法、最小二乘支持向量機、基于遺傳算法的加權(quán)最小二乘支持向量機的實驗結(jié)果,驗證了基于遺傳算法的加權(quán)最小二乘支持向量機方法具有精度高、抗差穩(wěn)定性強的特點,是一種更為合理的高程擬合方法。
粗差;精度;權(quán)函數(shù);參數(shù)尋優(yōu);遺傳算法
最小二乘支持向量機(LSSVM)以支持向量機為基礎,用等式約束代替非等式約束,能較好地解決了小樣本、非線性、高維數(shù)、局部極小點等實際問題[1],并且具有較高的運算效率。李超、任和旺[2]將LSSVM應用到GPS高程擬合中,并通過實驗驗證了該方法具有較高的精度。但當數(shù)據(jù)中含有粗差時,該方法的擬合結(jié)果受到嚴重影響。為了克服粗差的影響,本文將加權(quán)最小二乘支持向量機引入到GPS高程模型構(gòu)建,并以遺傳算法對模型進行參數(shù)優(yōu)化,抑制或剔除高程數(shù)據(jù)中含有粗差的點位坐標,提高GPS高程模型的擬合預測精度。
(1)
yk=ωTφ(xk)+b+ek,k=1,2…n,
(2)
其中:ω為權(quán)向量;γ為懲罰系數(shù);φ(.)是非線性映射函數(shù),將樣本的輸入空間映射到高維特征空間;b為偏差量。
根據(jù)Lagrange 定理可得:
b+ek-yk},
(3)
根據(jù)Karush Kuhn Tucker優(yōu)化條件[5],先后求出L關(guān)于ω,b,e,α的偏導數(shù),并讓數(shù)值為0.通過整理式子可得矩陣方程:
(4)
根據(jù)式(4)求出系數(shù)陣α和b,然后求出誤差變量的權(quán)重vk,重新組成LSSVM-W的目標函數(shù),迭代多次,直至求得穩(wěn)定的α.
最后,得到LSSVM-W函數(shù)估計模型:
(5)
遺傳算法是由Holland于1975年首次提出來的[8],是基于適者生存的進化論學說和遺傳學理論的智能算法[9]的理論。它模擬自然界生物進化的過程, 從任意給定的初始種群出發(fā), 通過遺傳學中的選擇、交叉和變異, 產(chǎn)生一群更適應環(huán)境的個體, 使群體向好的參數(shù)區(qū)域移動。通過一代代的繁衍進化,群體最后收斂到系統(tǒng)需求的樣本個體上,最終得到所尋找的最優(yōu)值。
用遺傳算法優(yōu)化加權(quán)最小二乘支持向量機參數(shù)主要步驟為:
1) 遺傳算法參數(shù)的設置,如群體規(guī)模、交叉概率、變異概率、種群的取值范圍以及算法終止進化代數(shù)。
2) 對C和γ兩個參數(shù)進行二進制編碼,并在參數(shù)取值范圍內(nèi)通過隨機函數(shù)產(chǎn)生一定數(shù)目的個體作為進化的初始種群。
3) 對群體中的每一個個體進行適應能力的評價。這里將加權(quán)最小二乘支持向量機的預測高程中誤差(RMSE)作為目標函數(shù)值。RMSE越小,則個體的適應能力就越大;反之,則越小。
4) 根據(jù)適應度的大小,按一定的規(guī)則選出優(yōu)秀的下一代,并對部分個體進行交叉、變異操作。
5) 依據(jù)當前進化代數(shù)判斷算法是否終止,如果當前進化代數(shù)小于最大遺傳代數(shù),則算法重新回到第二步,進行下一次循環(huán);如果當前進化代數(shù)大于等于最大遺傳代數(shù),則算法終止,輸出最優(yōu)參數(shù)值。
為驗證Ga-wlssvm在高程擬合中的有效性和準確性,以某一區(qū)域GPS控制網(wǎng)的的實測數(shù)據(jù)為
例進行計算。該地區(qū)長約13.2 km,寬約5.5 km,平均點間距約為2 km,如圖1所示,在測區(qū)控制點中,最大高程為1 261.831 m,最小高程為1 121.662 m,最大高差140.169 m.控制網(wǎng)共有20個實驗點,水準測量采用的三等水準。實驗以其中11個均勻分布的點作為擬合點,用其余9個點作為檢核點。
圖1 GPS點的平面分布
利用Ga-wlssvm進行GPS高程擬合的主要步驟為:
1) 數(shù)據(jù)處理:采集到的GPS數(shù)據(jù)數(shù)值較大,為避免擬合結(jié)果產(chǎn)生影響,需對數(shù)據(jù)進行平移和縮放處理。
2) 利用實驗點的GPS高程和水準數(shù)據(jù)求出高程異常值。
3) 采用遺傳算法對加權(quán)最小二乘支持向量機進行參數(shù)C和γ優(yōu)化,求出最優(yōu)值。
4) 結(jié)合參數(shù)最優(yōu)值,構(gòu)建出加權(quán)最小二乘支持向量機模型。
5) 利用模型對未知點的高程異常值進行預測,結(jié)合GPS數(shù)據(jù)求出預測點高程。
在實驗中,任意選取擬合點中的一個點為研究對象,依次加入粗差0.05 m、0.1 m、0.2 m和0.5 m.然后分別用傳統(tǒng)的二次曲面擬合法、最小二乘支持向量機、和Ga-wlssvm生成GPS高程模型,再對檢測點進行預測。實驗選取檢測點的誤差絕對值最大值和中誤差來對這三種高程擬合法進行評定,如表1所示。
表1 三種方法的對比
從表1中可知,隨著粗差的增大,二次曲面法和LSSVM得到的Max和RMSE逐漸增大,說明這兩種方法的精度逐漸降低。當粗差為0.2 m時,二次曲面法和LSSVM得到Max均達到了0.079 m,RMSE分別達到了0.035 7 m和0.027 1 m.這兩種方法的預測值與實際值相比,均有較大偏差;當粗差為0.5 m時,二次曲面法和LSSVM都已失效;Ga-wlssvm方法得到的RMSE先是隨著粗差的增大而增大,后趨于穩(wěn)定,且均小于前兩種方法的結(jié)果。通過試驗可以看出,Ga-wlssvm精度較高,具有良好的抗差性,可以運用到GPS高程擬合。
本文利用基于遺傳算法的加權(quán)最小二乘支持向量機擬合法,結(jié)合實際工程實際數(shù)據(jù),通過與傳統(tǒng)的二次曲面擬合法、最小二乘支持向量機擬合法對比,驗證了在一定條件下該方法的可行性與精確性。在實驗中,Ga-wlssvm擬合方法的核函數(shù)為高斯徑向基核,權(quán)函數(shù)為“whampel”,而不同的核函數(shù)和權(quán)函數(shù)都會對實驗產(chǎn)生影響,核函數(shù)和權(quán)函數(shù)的選取有待進一步研究。
[1] 方瑞明.支持向量機理論及其應用分析 [M].北京:中國電力出版社, 2007.
[2] 任超,李和旺.最小二乘支持向量機在GPS高程擬合中的應用[J].工程勘察,2012(7):55-57.
[3] 閻輝,張學工,李衍達.支持向量機與最小二乘法的關(guān)系研究[J].清華大學學報(自然科學版),2001,41(9):77-80.
[4] 李明飛,陳傳法,戴洪磊,等.DEM構(gòu)建的加權(quán)最小二乘支持向量機算法[J].地理空間信息,2015(6):82-83.
[5] 鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機[M].北京:科學出版社,2006.
[6] 孫凱,王穎龍.支持向量機中Mercer核函數(shù)的構(gòu)造研究[J].兵工自動化,2008,27(11):40-42.
[7] 葉俊勇.人臉檢測與識別方法研究[D].重慶:重慶大學,2002.
[8] HOLLAND J H. Adaptation in natural and artificial System[M]. Ann Arbor: University of Miehigan Press,1975.
[9] 趙義武,牛慶銀,王憲成.遺傳算法與蟻群算法的融合研究[J].科學技術(shù)與工程,2010,10(16):4017-4020.
Application of the Weighted Least Squares Support Vector Machine Based on Genetic Algorithm in GPS Leveling
LI Mingfei1,HUAN Min2,QIN Chuan1
(1.ShaanxiProvincialLandEngineeringConstructionGroup,Xi’an710000,China;2.ShaanxiHuiTumappingGeographicCompany,Xi’an710000,China)
Because of various factors, the elevation data collected by GPS equipment often contain outliers. The least square method often used to GPS elevation fitting, can not detect and handle outliers, so the the accuracy of the fitting results is low. This paper applies the weighted least squares support vector machine to GPS elevation fitting, and uses the genetic algorithm to optimize its parameters. Through the calculation experiment,we compare the experimental result of the quadratic curve fitting, the least squares support vector machine,and the weighted least squares support vector machine based on genetic algorithm,and verify that the weighted least squares support vector machine based on genetic algorithm is a more reasonable elevation fitting method, with characteristics of high precision and stability.
Gross error; accuracy; weight function; parameters optimization; genetic algorithm
2016-08-27
10.13442/j.gnss.1008-9268.2016.06.019
P228.4
1008-9268(2016)06-0098-04
李明飛(1987-)男,助理工程師,研究方向為數(shù)字高程模型,目前從事土地整治工作。
郇敏(1987-)女,助理工程師,從事測繪內(nèi)業(yè)處理工作。
秦川(1987-)男,助理工程師,從事土地整治工作。
聯(lián)系人:李明飛 E-mail: 1045652087@qq.com