黎峻宇,劉立龍,韋相任
(1.桂林理工大學(xué)廣西礦冶與環(huán)境科學(xué)實驗中心,廣西 桂林 541004;2.桂林理工大學(xué)測繪地理信息學(xué)院,廣西 桂林 541004;3.廣西空間信息與測繪重點實驗室,廣西 桂林 541004;4.廣東省有色金屬地質(zhì)局九三三隊勘測公司,廣東 肇慶 526060)
當(dāng)前,GPS 測量技術(shù)已經(jīng)在國家基礎(chǔ)性建設(shè)中得到廣泛應(yīng)用。在這些基礎(chǔ)設(shè)施中,鐵路、公路、石油與燃氣管道,水渠與排灌管道,電力設(shè)施中的輸電線路,能源開發(fā)項目中的石油物探等等,往往集中在一些大面積的帶狀區(qū)域內(nèi)[1]。GPS 測量直接獲得的高程是相對于WGS-84 橢球面的大地高,實際生產(chǎn)過程中使用的卻是相對于似大地水準面的正常高,如何直接利用GPS 大地高來獲得滿足工程需要的正常高,以便節(jié)省人力、物力和時間,一直是測量界關(guān)注和研究的一個重點,對大面積帶狀區(qū)域高程擬合方法的研究對國家基礎(chǔ)性建設(shè)更是具有十分重要的現(xiàn)實意義。然而除了文獻[1]等少數(shù)文獻涉及帶狀高程擬合研究之外,鮮有人詳細探討涉及大面積帶狀區(qū)域的高程擬合方法。高程異常轉(zhuǎn)換方法主要有四類:幾何解析法、物理大地測量法、人工智能法和混合轉(zhuǎn)換法,其中BP 神經(jīng)網(wǎng)絡(luò)、二次曲面擬合等方法在高程擬合中得到比較廣泛的應(yīng)用[2]。最小二乘支持向量機具有結(jié)構(gòu)簡單、全局最優(yōu),泛化能力較好的優(yōu)點,能夠很好地解決小樣本、非線性、高維數(shù)、局部極小等問題,同時還克服了神經(jīng)網(wǎng)絡(luò)等一般學(xué)習(xí)機器中存在過學(xué)習(xí)、局部優(yōu)化和樣本數(shù)量要求多的弊端,基于以上原因文獻[3][4]等開始將其應(yīng)用到高程擬合中。本文使用一個大面積帶狀的GPS 網(wǎng)數(shù)據(jù)為基礎(chǔ),經(jīng)最小二乘支持向量機、BP 神經(jīng)網(wǎng)絡(luò)、二次曲面擬合三種方法進行高程擬合,就不同方法擬合結(jié)果進行對比分析,獲得一些具有一定價值的理論結(jié)果。最后根據(jù)這些理論結(jié)果,為國家基礎(chǔ)性建設(shè)中大面積帶狀區(qū)域高程擬合提出一些實用性建議。
最小二乘支持向量機原理是將最小二乘引入支持向量機中,采用等式約束代替不等式約束作為損失函數(shù)。訓(xùn)練過程由二次規(guī)劃問題求解轉(zhuǎn)化為線性方程組求解,同時使誤差平方項達到最小化的計算過程[3]。設(shè)給定一個有M 個訓(xùn)練樣本的集合(xi,yi),i=1,2…~M,其中訓(xùn)練m 維向量,xi∈Rm,輸出數(shù)據(jù)yi∈R。按照結(jié)構(gòu)風(fēng)險最小化原則,函數(shù)擬合問題可轉(zhuǎn)為下列函數(shù)的約束優(yōu)化問題:
約束條件為:
式中:W∈Rm為權(quán)矢量;g(xi)是將x 從輸入空間映射到特征空間的函數(shù);ξi為誤差項;C 為正規(guī)化參數(shù),控制對超出誤差樣本的懲罰程度,b 為偏置量。
經(jīng)過簡化后得到最小二乘支持向量機函數(shù)為:
為了解決高維計算問題,引入一核函數(shù)K(xk,xj)來等效高維空間的內(nèi)積形式[g(xk)g(xi)],即:
目前常用的核函數(shù)主要有多項式核函數(shù)K(x,x)=(x* y+1)p、徑向基核函數(shù)(Radial Basis Function,RBF)K(x,x)=exp[-‖x-y‖2/(2σ2)]和Sigmoid核函數(shù)k(x,xi)=tanh[v(x* xi)+c]等形式。根據(jù)數(shù)值限制條件和參數(shù)較少以及優(yōu)秀的局部逼近特征,本文選擇RBF 作為支持向量機核函數(shù)。最小二乘支持向量機模型的確定最重要的是核函數(shù)參數(shù)σ 和正規(guī)化參數(shù)的選擇,廣泛采取的方法是試算法、交叉驗證法、留一法[5]。我們輸入的訓(xùn)練樣本為三維向量,分別為高程點平面坐標和高程異常;輸出向量只有一維,即高程異常;基于MATLAB 工具箱中最小二乘支持向量機自帶的尋優(yōu)函數(shù)進行參數(shù)尋優(yōu)σ、C。
BP 神經(jīng)網(wǎng)絡(luò)是一個多層前向型神經(jīng)網(wǎng)絡(luò),其權(quán)值調(diào)整采用誤差反向傳播算法,該網(wǎng)絡(luò)由輸入層、隱含層和輸出層組成。設(shè)神經(jīng)網(wǎng)絡(luò)的輸入向量為X=(X1,…,Xn)T,期望輸出為d=(d1,…,dm)T,輸入層與隱含層的權(quán)為W,其維數(shù)為n×s,閥值為θ1,維數(shù)為s×1,隱含層與輸出層的權(quán)W',其維數(shù)為s×m,閥值為θ2,維數(shù)為m×1,其中n、s 和m 為別為輸入層、隱含層和輸出層的神經(jīng)元節(jié)點數(shù)[6~7]。神經(jīng)網(wǎng)絡(luò)的正向傳輸?shù)挠嬎氵^程如下:
隱含層的輸出計算公式為:
輸出層的輸出計算公式為:
上式中,f1(I1)、f2(I2)為隱含層與輸出層的傳遞函數(shù),f1(I1)通常為Sigmoid 函數(shù)。f2(I2)可以為Sigmoid 函數(shù)或Purelin 函數(shù),y2為最終的輸出值。
常用BP 神經(jīng)網(wǎng)絡(luò)通常采用誤差反向傳播法調(diào)整連接權(quán)。神經(jīng)網(wǎng)絡(luò)的目標函數(shù)為:
式中p 表示第p 個樣本,k 表示第k 個節(jié)點,dk表示期望輸出。
本文BP 神經(jīng)網(wǎng)絡(luò)在MATLAB 程序環(huán)境下建立,BP 神經(jīng)網(wǎng)絡(luò)構(gòu)造各項內(nèi)容如下:
(1)輸入層神經(jīng)元個數(shù)3 個,分別為高程點平面坐標和高程異常;
(2)輸出層神經(jīng)元個數(shù)1 個,即高程異常;
(3)訓(xùn)練函數(shù)取:tansig、purelin、trainlm.
(4)設(shè)置訓(xùn)練參數(shù)net.tranParam.show=100,net.tranParam.epochs=1000,net.tranParam.lr=0.01,net.tranParam.goal=1e-3,其他參數(shù)使用MATLAB 神經(jīng)網(wǎng)絡(luò)工具箱默認的取值。
二次曲面擬合公式為:
在(10)式中ξ 表示高程異常,(x,y)為已知點平面坐標,ε 是誤差。在式(11)中有6 個參數(shù),此時需要重合點不少于6 個。重合點個數(shù)多于6 個,采用最小二乘原理進行數(shù)學(xué)模擬,確定模型。
將式(11)寫成矩陣形式:
對每個重合點,都可以列以上方程,在∑ε2=min的條件下,解出ai,再通過式(11)求取未知點的ξ,從而解算得各點正常高。
本文采用某大型工程的D 級GPS 控制網(wǎng)點作為樣本數(shù)據(jù),該控制網(wǎng)共有點41 個,控制面積約為1 387.342 km2,控制網(wǎng)呈帶狀分布(點位分布如圖1所示),水準按照二等水準測量要求施測。取33 個分布相對均勻的點作為樣本點,8 個點作為擬合點。
圖1 點位分布圖
為了驗證不同模型的內(nèi)符合精度,就擬合求取的樣本點高程異常值與實測高程異常值之差進行統(tǒng)計,分析模型的可塑性。驗證內(nèi)符合精度的誤差最大值(max)、誤差最小值(min)、均方根誤差(RMS)、平均絕對誤差(MAE)見表1,不同方法在對應(yīng)點擬合誤差如圖2 所示。
內(nèi)符合精度對比 表1
圖2 樣本點誤差分布圖
由表1、圖2 知:支持向量機的誤差最大值最小值之差在3 種方法中最小,MAE 最小,RMS 也最小;支持向量機與其他兩種方法相比,進行高程擬合可以很好地控制較大的誤差出現(xiàn),同時支持向量機擬合誤差變化范圍更小,支持向量機擬合誤差更好地控制在某一范圍內(nèi);最小二乘支持向量機誤差變化最小,內(nèi)符合精度最高,相對其他的擬合方法提高了約1 cm,模型具有很好的可塑性;
驗證模型的內(nèi)符合精度只能達到分析模型可塑性的目的,為了充分說明各模型在大面積區(qū)域的泛化能力,還需要對模型的外符合精度進行驗證。分析了各種方法在擬合點高程異常值與實測高程異常值之差,各種方法的max、min、RMS、MAE 如表2、圖3 所示。
外符合精度對比 表2
圖3 擬合點誤差分布圖
通過表2、圖3 可以清晰地看到,支持向量機的誤差最大值最小值之差在3 種方法中最小;3 種方法外符合精度比較接近,支持向量機MAE 比最小的BP 神經(jīng)網(wǎng)絡(luò)僅差1.9 mm,RMS 較最小的BP 神經(jīng)網(wǎng)絡(luò)也僅差1.3 mm;支持向量機與其他兩種方法相比,進行高程擬合可以很好地控制較大的誤差出現(xiàn),最小二乘支持向量機誤差變化較小,RMS 等于0.023 6 m,外符合精度可達cm 級精度,模型具有較好的泛化能力;
綜上,對于本文所選實例區(qū)域,最小二乘支持向量機模型的內(nèi)外符合精度可以達到厘米級精度,內(nèi)符合精度為0.026 7 m,外符合精度為0.023 6 m,達到高程擬合的精度要求,可應(yīng)用于大面積帶狀區(qū)域高程擬合。最小二乘支持向量機擬合模型同時獲得較高的內(nèi)外符合精度,具備較好的可塑性和泛化能力。
本文以大面積帶狀區(qū)域GPS 控制網(wǎng)為實驗區(qū)域,使用最小二乘支持向量機、BP 神經(jīng)網(wǎng)絡(luò)、二次曲面擬合三種方法實施高程擬合,進行大面積帶狀區(qū)域高程擬合方法研究。通過探討得出:
(1)最小二乘支持向量機可應(yīng)用于大面積帶狀區(qū)域高程擬合,在本文大面積帶狀區(qū)域中擬合精度達到較理想的厘米級,且三種擬合方法的泛化能力很接近,BP 神經(jīng)網(wǎng)絡(luò)最強,最小二乘支持向量機次之。
(2)最小二乘支持向量機在大面積帶狀區(qū)域高程擬合中具有相當(dāng)?shù)膬?yōu)勢,可同時獲得較高的內(nèi)外符合精度,該方法在可塑性優(yōu)勢明顯的同時也具有較強的泛化能力。
(3)同一區(qū)域,不同方法擬合精度不同,本文試驗獲取數(shù)據(jù)具有局域性,不同的高程擬合方法在其他區(qū)域的適用性有待進一步驗證。
綜上所述,在大面積區(qū)域,進行高程擬合,建議可采用最小二乘支持向量機模型。
[1]高西峰.GPS 水準在帶狀區(qū)域似大地水準面精化中的應(yīng)用研究[D].長安,長安大學(xué),2007.
[2]任超,吳偉,黃征凱等人.基于ACI 準則的徑向基函數(shù)網(wǎng)絡(luò)在GPS 高程轉(zhuǎn)換中的應(yīng)用[J].測繪科學(xué),2013(2):77~79.
[3]黃磊,張書畢,王亮亮等人.粒子群最小二乘支持向量機在GPS 高程擬合中的應(yīng)用[J].測繪科學(xué),2010(5):190~192.
[4]姬張建,袁運斌,盛傳貞.混沌粒子群支持向量機并考慮地形改正的GPS 高程擬合[J].大地測量與地球動力學(xué),2010(2):95~98.
[5]吳吉賢,杜海燕,張耀文.LSSVM 回歸模型在局部區(qū)域GPS 高程擬合中的應(yīng)用[J].測繪科學(xué),2013(6):66~68.
[6]張德豐.MATLAB 神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計[M].北京:機械工業(yè)出版社,2011:137~139.
[7]王小輝,王琪潔,丁元蘭等人.基于二次曲面和BP 神經(jīng)網(wǎng)絡(luò)組合模型的GPS 高程異常擬合[J].大地測量與地球動力學(xué),2012(6):103~106.
[8]張昊,王琪潔,朱建軍等人.樣本數(shù)據(jù)預(yù)處理對基于BP神經(jīng)網(wǎng)絡(luò)的高程轉(zhuǎn)換的影響[J].大地測量與地球動力學(xué),2011(2):125~128.
[9]邱衛(wèi)寧.具有穩(wěn)健初值的選權(quán)迭代法[J].武漢大學(xué)學(xué)報·信息科學(xué)版,2003(4):452~454.
[10]張恒璟,程鵬飛.基于GPS 高程時間序列粗差的抗差探測與插補研究[J].大地測量與地球動力學(xué),2011(4):71~75.