羅亦泳,姚宜斌,張立亭,周世健,魯鐵定
基于高斯過程的GPS高程轉(zhuǎn)換模型
羅亦泳1,2,姚宜斌2,張立亭1,周世健3,魯鐵定1
( 1.東華理工大學測繪工程學院,江西南昌330013; 2.武漢大學測繪學院,湖北武漢430079; 3.江西省科學院,江西南昌330096)
GPS定位技術(shù)具有精度高、速度快、全天候、測站間無須通視等優(yōu)點,能快速提供目標三維坐標,因此在各領(lǐng)域得到廣泛應(yīng)用。但由于GPS采用WGS-84坐標系,得到的是目標的大地高H大地,而在實際工程應(yīng)用中采用的是正常高H正常,并且大地高與正常高之間存在高程異常ξ,導致GPS測量得到的高程數(shù)據(jù)不能服務(wù)于實際工程項目而造成數(shù)據(jù)浪費[1-2]。目前通常采用傳統(tǒng)水準測量獲得目標正常高,需要投入較大的人力、物力及財力,并且工作效率較低。因此,如何構(gòu)建GPS高程轉(zhuǎn)換模型,對利用GPS定位技術(shù)快速地為工程建設(shè)提供可靠的正常高數(shù)據(jù)具有重要的現(xiàn)實與理論意義,成為當前GPS研究的重要內(nèi)容。
當前GPS高程轉(zhuǎn)換模型研究成果較為豐富,主要包括多項式擬合、多面函數(shù)法及BP神經(jīng)網(wǎng)絡(luò)等常規(guī)方法。由于這些擬合方法均基于傳統(tǒng)的統(tǒng)計理論,在具有較大的訓練樣本數(shù)據(jù)時,GPS高程轉(zhuǎn)換成正常高具有較好的精度[3-4]。但在實際工程領(lǐng)域,通常具有較少的訓練數(shù)據(jù)(即經(jīng)過水準測量聯(lián)測的GPS高程點較少),嚴重影響GPS高程轉(zhuǎn)換精度。針對該問題,許多學者基于支持向量機構(gòu)建GPS高程轉(zhuǎn)換模型,對小樣本數(shù)據(jù)具有較好的高程轉(zhuǎn)換精度[5-6]。但是支持向量機存在核函數(shù)選擇及參數(shù)優(yōu)化問題,并且損失函數(shù)構(gòu)建對模型影響較大。綜上所述,當前GPS高程轉(zhuǎn)換模型對處理小樣本問題在精度、可靠性方面有待提高,并且很少對模型預測結(jié)果進行不確定分析。因此,如何構(gòu)建基于小樣本、參數(shù)自適應(yīng)、具有概率意義的GPS高程轉(zhuǎn)換模型具有重要研究價值。
高斯過程( Gaussian process,GP)是近期發(fā)展的基于統(tǒng)計學習理論的機器學習新方法,適合處理高維數(shù)、小樣本、非線性等復雜問題,并且模型參數(shù)自適應(yīng)化,具有概率式的預測結(jié)果,是當今國內(nèi)外機器學習領(lǐng)域研究熱點[7-8]。鑒于GP算法的以上特點,本文提出基于高斯過程的GPS高程轉(zhuǎn)換模型。通過與其他GPS高程轉(zhuǎn)換模型進行精度對比,以證實新方法的可行性及可靠性。
利用GP算法建立目標高程異常ξ與其對應(yīng)的平面坐標( x,y)之間的復雜函數(shù)關(guān)系,構(gòu)建基于GP 的GPS高程轉(zhuǎn)換模型。利用該模型求解其余GPS高程點對應(yīng)的高程異常ξ,實現(xiàn)大地高與正常高之間的轉(zhuǎn)換。
1.高斯過程學習回歸模型基本原理
GP算法定義任意一組隨機變量X = { xi∈Rd,i=1,2,…,N}及其對應(yīng)的過程函數(shù)f( X) = { f( xi)∈R,i= 1,2,…,N}的聯(lián)合概率密度分布服從N維高斯分布。因此,高斯過程f( X)完全由其均值函數(shù)m( X)與協(xié)方差函數(shù)K( X,X')確定[9-10]。高斯過程可表示為式中,核函數(shù)K( X,X')為正半定矩陣。
假設(shè)有觀測訓練數(shù)據(jù)集E = { ( xi,yi),i = 1,2,…,n},xi為模型輸入,yi為受到噪聲影響的模型輸出觀測值,噪聲服從分布ε~N( 0,σ2n)。則yi可表示為
從式( 1)、式( 2)可推導y的分布,具體概率分布見式( 3),其中In為n階單位矩陣。
對于新的輸入X*,預測對應(yīng)的輸出為y*,y與y*的聯(lián)合概率分布為
由以上公式,可得到預測值y*的后驗概率分布
式中,u( X*)、σ2y*為y*的期望與方差,即
建立訓練樣本集E的對數(shù)邊緣似然函數(shù),對超參數(shù)求偏導,采用共軛梯度優(yōu)化方法搜索出模型的超參數(shù)最優(yōu)解,自適應(yīng)確定模型參數(shù),最終構(gòu)建高斯過程回歸模型。
2.GPS高程轉(zhuǎn)換模型建立
以GPS高程點平面位置( x,y)作為GP算法的輸入,對應(yīng)的高程異常ξ為模型輸出,構(gòu)建訓練數(shù)據(jù)集S={ Xi,ξi},其中Xi=( xi,yi),i= 1,2,…,n,n為訓練數(shù)據(jù)個數(shù)。通過GP模型對訓練數(shù)據(jù)的學習,確定對應(yīng)參數(shù),建立高程異常ξ預測模型。通過GPS高程減去高程異常預測值將GPS高程轉(zhuǎn)換成正常高?;贛atlab語言和GP的GPS高程轉(zhuǎn)換模型具體建立過程如下:
1)建立訓練數(shù)據(jù)集S = { Xi,ξi}ni=1及測試數(shù)據(jù)集D={ Xj,ξj}Tj=1,并對S、D進行歸一化。
2)選擇協(xié)方差函數(shù)K( X,X'),確定模型超參數(shù)解算方法。依據(jù)文獻[7]對協(xié)方差函數(shù)的分析結(jié)果,通過反復試算選擇Materniso協(xié)方差函數(shù),采用共軛梯度優(yōu)化方法搜索出模型的超參數(shù)最優(yōu)解。
3)訓練數(shù)據(jù)集S訓練GP算法,確定模型超參數(shù)。對S、D數(shù)據(jù)集的高程異常進行預測,獲得對應(yīng)的高程異常預測值ξi、ξj,以及對應(yīng)方差σ2ξ'i、σ2ξ'j。
4)將GPS高程減去高程異常預測值ξ',預測GPS點的正常高
5)計算模型的內(nèi)附精度σ內(nèi)及外符精度σ外,評價模型精度
6)由GP算法估計得到的高程異常期望與方
差(ξi'、ξj'、σ2ξ'i、σ2ξ'j)可計算H常'的置信區(qū)間,分析預測結(jié)果的可靠性。以95%置信度的置信區(qū)間為例,建立GP算法置信區(qū)間估計公式( 11),其中zθ/2= 1.96[11]。
1.建模數(shù)據(jù)方案建立
以某沿江地形平緩區(qū)域的GPS控制網(wǎng)為例,控制網(wǎng)包含17個控制點,平均邊長約1 km,區(qū)域面積約10 km2[6]。按國家GPS網(wǎng)B級要求實測,采用二等水準聯(lián)測各GPS點,通過計算獲得17個GPS點的平面坐標、大地高、正常高、高程異數(shù)據(jù),具體數(shù)據(jù)見表1。
表1 GPS點平面坐標、高程數(shù)據(jù) m
續(xù)表1
由于不同訓練數(shù)據(jù)集對GPS高程轉(zhuǎn)換模型精度具有較大影響,選擇不同數(shù)量的訓練數(shù)據(jù)集及測試數(shù)據(jù)集,構(gòu)建4種建模數(shù)據(jù)方案( plan1、plan2、plan3、plan4),評價GP模型可靠性,具體方案見表2。本文同時采用平面擬合、二次曲面擬合、支持向量機( SVM)方法建立GPS高程轉(zhuǎn)換模型,并與GP方法進行精度對比,證實新方法的精度優(yōu)越性。
表2 建模數(shù)據(jù)方案
2.模型精度及可靠性分析
針對以上4種方案,分別基于平面擬合、二次曲面擬合、支持向量機、高斯過程算法建立GPS高程轉(zhuǎn)換模型,計算不同方案的各GPS高程轉(zhuǎn)換模型的內(nèi)附精度σ內(nèi)及外符精度σ外,對比評價模型預測精度,具體數(shù)據(jù)見表3。
表3 GPS高程轉(zhuǎn)換模型精度 mm
由表3可知,對于訓練數(shù)據(jù)較少的plan1、plan2方案,高斯過程模型的內(nèi)附精度及外符精度明顯優(yōu)于平面擬合、二次曲面擬合、支持向量機方法,證實高斯過程模型能很好地處理小樣本數(shù)據(jù)問題,具有很好的預測精度。當訓練數(shù)據(jù)較多時,對于plan3、plan4方案,高斯過程模型精度與支持向量機相當,略優(yōu)于二次曲面擬合,較大程度地優(yōu)于平面擬合。
由式( 11)可計算GP算法各方案的GPS高程轉(zhuǎn)換結(jié)果的置信區(qū)間。表4、表5、表6、表7分別為各方案的95%置信度的置信區(qū)間。
將各GPS高程點實測正常高與各方案的GP模型置信區(qū)間數(shù)據(jù)(表4、表5、表6、表7)進行對比,實測正常高均落在各方案GP算法估計得到的置信區(qū)間內(nèi),證實基于GP的GPS高程轉(zhuǎn)換模型對不同數(shù)量特征訓練集具有可靠的建模精度,證實了新方法的可靠性。
表4 plan1方案置信區(qū)間 m
表5 plan2方案置信區(qū)間估計m
表6 plan3方案置信區(qū)間估計 m
表7 plan4方案置信區(qū)間估計m
本文提出了基于GP的GPS高程轉(zhuǎn)換模型,并構(gòu)建了不同的建模方案。通過與多種GPS高程轉(zhuǎn)換模型進行精度對比及置信區(qū)間分析,得到以下結(jié)論:
1)基于GP的GPS高程轉(zhuǎn)換模型針對4種方案均取得很高精度。當訓練數(shù)據(jù)較少時,GP方法的內(nèi)附精度σ內(nèi)及外符精度σ外明顯優(yōu)于平面擬合、二次曲面擬合、支持向量機方法,證實GP模型處理小樣本GPS高程轉(zhuǎn)換問題具有很高的精度。
2)通過建立基于GP的GPS高程轉(zhuǎn)換結(jié)果的置信區(qū)間估計方法,計算4種方案的正常高轉(zhuǎn)換結(jié)果置信區(qū)間。實測正常高均在置信區(qū)間內(nèi),證實新方法的結(jié)果具有很高的可靠性。同時彌補了當前GPS高程轉(zhuǎn)換方法很少對預測結(jié)果進行可靠性分析這一缺點。
[1] 胡伍生,華錫生,張志偉.平坦地區(qū)轉(zhuǎn)換GPS高程的混合轉(zhuǎn)換方法[J].測繪學報,2002,31( 2) : 128-134.
[2] 胡伍生,高成發(fā).GPS測量原理及其應(yīng)用[M].北京:人民交通出版社,2004.
[3] 楊明清,靳蕃,朱達成,等.用神經(jīng)網(wǎng)絡(luò)方法轉(zhuǎn)換GPS高程[J].測繪學報,1999,28( 4) : 301-307.
[4] 楊天宇.基于BP神經(jīng)網(wǎng)絡(luò)的GPS高程異常擬合及其在杭州灣跨海大橋中的應(yīng)用[D].成都:西南交通大學,2006.
[5] 吳兆福,宮鵬,高飛,等.基于支持向量機的GPS似大地水準面擬合[J].測繪學報,2004,33( 4) : 303-307.
[6] 叢康林,岳建平.基于SVR的GPS高程擬合模型研究[J].測繪通報,2011( 2) : 8-12.
[7] RASMUSSEN C E,VVILLIAMS K.Gaussian Process for Machine Learning[M].[S.l.]: The MIT Press,2006.
[8] GIBBS M N.Bayesian Gaussian Processes for Regression and Classification[D].( PhD Thesis) Cambridge: Universityof Cambridge,1997.
[9] KOCIAN J,AZMAN K.Gaussian Process Model Identification: a Process Engineering Case Study[J].Systems Science,2008,34( 3) : 31-38.
[10]賀建軍.基于高斯過程模型的機器學習算法研究及應(yīng)用[D].大連:大連理工大學,2012.
[11]盧獻健,晏紅波,梁月吉,等.各組合模型在GPS高程擬合中的應(yīng)用研究[J].測繪通報,2015( 5) : 20-23.
[12]羅玉彬,牛冉雯.樣本數(shù)據(jù)歸一化對GPS高程轉(zhuǎn)化結(jié)果的影響分析[J].測繪通報,2013( 8) : 33-35.
[13] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(新版) [M].北京:高等教育出版社,2010.
GPS Height Transformation Model Based on Gaussian Process
LUO Yiyong,YAO Yibin,ZHANG Liting,ZHOU Shijian,LU Tieding
針對GPS高程轉(zhuǎn)換的小樣本、非線性特點,基于高斯過程算法提出了具有概率意義的GPS高程轉(zhuǎn)換模型。利用高斯過程采用4種不同建模方案建立了GPS高程轉(zhuǎn)換模型,并與平面擬合、二次曲面擬合、支持向量機方法進行了精度對比。同時構(gòu)建了基于高斯過程的GPS高程轉(zhuǎn)換結(jié)果置信區(qū)間估計方法,分析了結(jié)果的可靠性。實例分析證實,高斯過程方法針對4種方案均獲得很高精度,并且精度指標優(yōu)于其余3種方法;各GPS點的實測正常高均在置信區(qū)間內(nèi),證實高斯過程方法具有很好的可靠性。
高斯過程;高程轉(zhuǎn)換;高程異常
羅亦泳( 1982—),男,博士生,講師,主要從事測繪數(shù)據(jù)處理理論與方法研究工作。E-mail: ecityyluo@ 163.com
羅亦泳,姚宜斌,張立亭,等.基于高斯過程的GPS高程轉(zhuǎn)換模型[J].測繪通報,2015( 11) : 11-14.
10.13474/j.cnki.11-2246.2015.0335
P228.4
B
0494-0911( 2015) 11-0011-04
2015-04-17;
2015-07-10
國家自然科學基金( 41374007) ;江西省自然科學基金( 20151BAB213031)