黎峻宇,劉立龍,蔡成輝,林國標,黃良珂(桂林理工大學a.測繪地理信息學院; b.廣西空間信息與測繪重點實驗室; c.廣西礦冶與環(huán)境科學實驗中心,廣西桂林 541004)
?
數(shù)據(jù)預處理對基于徑向基函數(shù)網(wǎng)絡高程轉換的影響
黎峻宇a,b,劉立龍,蔡成輝a,b,林國標a,b,黃良珂a,b
(桂林理工大學a.測繪地理信息學院; b.廣西空間信息與測繪重點實驗室; c.廣西礦冶與環(huán)境科學實驗中心,廣西桂林541004)
摘要:介紹了數(shù)據(jù)預處理對基于徑向基函數(shù)網(wǎng)絡的高程轉換的必要性,提出了基于徑向基函數(shù)網(wǎng)絡高程轉換建模的基本原理和實現(xiàn)步驟。結合工程實例,重點對歸一化、中心化、標準化3種不同的數(shù)據(jù)預處理方法對基于徑向基函數(shù)網(wǎng)絡高程轉換的影響進行計算分析。結果表明:針對大面積、高程異常值變化較大的區(qū)域,經(jīng)過數(shù)據(jù)預處理后模型能夠達到更高的轉換精度;不同的預處理方法對轉換結果影響不同,中心化預處理較其他兩種方法能夠更大程度地提高徑向基函數(shù)網(wǎng)絡高程轉換的精度;歸一化預處理方法不一定是最優(yōu)的,進行高程轉換前有必要對預處理方法進行選擇。
關鍵詞:歸一化;中心化;標準化;數(shù)據(jù)預處理;徑向基函數(shù)網(wǎng)絡;高程轉換;改善精度
當前,GPS測量技術已經(jīng)在測繪生產(chǎn)實踐中得到廣泛應用,然而GPS測量直接獲得的高是相對于WGS-84橢球面的大地高,實際生產(chǎn)過程中使用的卻是相對于似大地水準面的正常高[1]。因此,為了使GPS測量技術能夠得到更普遍的應用,必須將大地高H轉換為正常高h,它們之間的關系是: h = H-ε,ε稱為高程異常。故只需知道每一點的高程異常,就能夠將該點大地高H轉換為正常高h。高程異常轉換方法主要有4類:幾何解析法、物理大地測量法、人工智能法和混合轉換法[2]。人工神經(jīng)網(wǎng)絡屬于人工智能法的范疇[3],近年來許多學者對人工神經(jīng)網(wǎng)絡高程轉換模型作了進一步研究[4-14],這些研究在一定程度上對高程轉換模型進行了改進。然而,除了文獻[3]進行了數(shù)據(jù)預處理對基于BP神經(jīng)網(wǎng)絡的高程轉換的影響研究外,很少有人詳細研究不同的數(shù)據(jù)預處理方法對高程轉換結果的影響。徑向基函數(shù)網(wǎng)絡是一種結構簡單、收斂速度快、能夠逼近任意非線性函數(shù)網(wǎng)絡,文獻[1-2]中已經(jīng)有一部分學者將徑向基函數(shù)網(wǎng)絡用于高程轉換,并在一定程度上改善了高程轉換的精度;然而進行高程轉換的樣本數(shù)據(jù)往往是相當龐大的,特別對于面積廣、高程起伏較大的地區(qū),樣本數(shù)據(jù)中的信息很繁雜,且樣本數(shù)據(jù)的北、東方向坐標不在一個數(shù)量級上,對數(shù)據(jù)進行預處理或許可以使得北、東坐標以及高程異常之間的關系挖掘過程更快捷、更精確,如此徑向基函數(shù)才能更好地逼近北、東坐標與高程異常之間的函數(shù)關系。為了使得徑向基函數(shù)網(wǎng)絡在高程轉換領域得到更好的發(fā)展,本文通過在嚴格的徑向基函數(shù)網(wǎng)絡結構基礎上,增加一個數(shù)據(jù)預處理層,采用3種不同的預處理層構造3種不同的徑向基函數(shù)網(wǎng)絡模型進行高程轉換,并將轉換結果與不帶數(shù)據(jù)預處理層的徑向基函數(shù)網(wǎng)絡模型的轉換結果進行對比、分析,探討數(shù)據(jù)預處理對基于徑向基函數(shù)網(wǎng)絡高程轉換的影響。
1. 1徑向基函數(shù)網(wǎng)絡基本原理
徑向基函數(shù)網(wǎng)絡是具有3層結構的前向網(wǎng)絡:輸入層在第1層,其節(jié)點個數(shù)等于輸入向量的維數(shù);第2層叫隱含層,節(jié)點個數(shù)由問題的復雜程度確定;第3層是輸出層,節(jié)點個數(shù)等于輸出數(shù)據(jù)的維數(shù)。徑向基函數(shù)網(wǎng)絡不同層的功能各不相同,隱含層是非線性的,以徑向基函數(shù)為基函數(shù),在此將輸入向量空間轉換到隱含層空間,達到將原來線性不分的問題變得線性可分的目的,輸出層則是線性的[10]。一個嚴格的徑向基函數(shù)網(wǎng)絡結構如圖1所示。
圖1 嚴格的徑向基函數(shù)網(wǎng)絡結構Fig. 61Strict radial basis function network structure
隱含層Φi( i = 1,2,…,N)為基函數(shù),本文使用高斯函數(shù)為基函數(shù),則有徑向基函數(shù)網(wǎng)絡模型為其中: Xk是m維的網(wǎng)絡輸入向量; y = F( x)為對應的輸出;ωij( i = 1,2,…,N)為從第i個隱含節(jié)點到第j個輸出節(jié)點的權值; N為隱含層神經(jīng)元個數(shù);是高斯函數(shù)基函數(shù); Xi=[xi1,xi2,…,xim]為每個隱含層神經(jīng)元基函數(shù)的中心;σi為拓展常數(shù),且是所選取中心之間的最大距離,m為選取中心個數(shù)[1];建立和訓練一個嚴格的徑向基函數(shù)網(wǎng)絡,就是使其通過學習來確定Xi、ωi、σi的過程,以完成所需要的輸入到輸出的映射[2]。
1. 2徑向基函數(shù)網(wǎng)絡高程轉換的實現(xiàn)
本文的徑向基函數(shù)網(wǎng)絡輸入層神經(jīng)元個數(shù)是2個,即控制點的平面坐標( x,y) ;輸出層神經(jīng)元個數(shù)為1個,即高程異常ε[1]。假設R = { ( Pi,Ti) | i = 1,2,…,M}為訓練樣本集,M為訓練樣本數(shù),稱P = [P1,P2,…,PM]T為樣本輸入陣,其中Pi= ( xi,yi),相應的教師輸出為T =[T1,T2,…,TM]T,其中
徑向基函數(shù)網(wǎng)絡的高程轉換步驟為
①生成函數(shù)網(wǎng)絡:本文中的徑向基函數(shù)網(wǎng)絡是通過MATLAB內(nèi)的newrbe函數(shù)實現(xiàn)的,形式為net = newrbe ( P,T,goal),P為樣本輸入陣,T為教師輸出陣,均方差精度goal選用默認的微小值。
②調(diào)試網(wǎng)絡:利用仿真函數(shù)Ts= sim ( net,P)對網(wǎng)絡進行調(diào)試,net為①生成的函數(shù)網(wǎng)絡,P為樣本輸入陣,將仿真輸出Ts與T教師輸出進行比較判斷生成網(wǎng)絡的可靠性,本文所生成網(wǎng)絡滿足可靠性要求(由文獻[10]可知newrbe可以迅速創(chuàng)建一個誤差為零的嚴格徑向基函數(shù)網(wǎng)絡)。
③高程轉換:利用①中生成的函數(shù)網(wǎng)絡,運用函數(shù)G = sim ( net,J)求驗證樣本點的高程異常,其中J = ( J1,J2,…,JN)T,Ji= ( xi,yi) ;輸出陣G為利用徑向基函數(shù)網(wǎng)絡計算得到的高程異常陣,將G與正常高陣h = ( h1,h2,…,hN)相加就完成了所有點的高程轉換。
數(shù)據(jù)預處理方法種類很多,適用范圍也因實際處理問題的不同而不同。在高程轉換相關文獻中學者們最常用的方法是歸一化、標準化,中心化也是比較經(jīng)典的數(shù)據(jù)預處理方法,本文將就此3種數(shù)據(jù)預處理方法進行討論。
將輸入數(shù)據(jù)表示為Z = ( Z1,Z2),Z1= ( x1,x2,…,xn)表示輸入樣本的北坐標矩陣,Z2= ( y1,y2,…,yn)表示輸入樣本的東坐標矩陣。
歸一化公式為式中:Zij為樣本數(shù)據(jù)Zij歸一化的結果,Zmax、Zmin分別為Z1、Z2中的最大值和最小值[3]。
3. 1建立模型
本文在嚴格的徑向基函數(shù)網(wǎng)絡結構基礎上,于輸入層前分別增加1個歸一化、標準化、中心化數(shù)據(jù)預處理層,構成3種不同的徑向基函數(shù)網(wǎng)絡訓練方法來建立模型,分別簡稱歸一化模型、標準化模型、中心化模型。實驗過程中,運用這3種不同的模型和嚴格的徑向基函數(shù)網(wǎng)絡結構(無數(shù)據(jù)預處理層,在此稱徑向基模型)用同樣的樣本進行訓練,并對相同驗證樣本進行高程轉換[11]。
3. 2數(shù)據(jù)來源
采用某大型工程的D級GPS控制網(wǎng)點作為樣本數(shù)據(jù),該控制網(wǎng)共有點23個,控制區(qū)域面積較大,達850 km2。水準按照二等水準測量要求施測,高程異常變化較大,異常值變化如圖2所示,其中坐標、異常值已通過歸一化。取18個分布相對均勻的點作為訓練樣本,5個點作為驗證樣本[12-13]。樣本數(shù)據(jù)點位分布見圖3。
圖2 異常值變化Fig. 62Change of elevation anomaly change
圖3 樣本數(shù)據(jù)點位分布Fig. 63Distribution of example points
3. 3模型精度分析
由文獻[10]可知,newrbe可以迅速創(chuàng)建一個誤差為零的嚴格的徑向基函數(shù)網(wǎng)絡,因此,不同的嚴格的徑向基函數(shù)網(wǎng)絡模型的可塑性都較好,在此不再就模型可塑性進行比較。本文通過比較不同模型轉換所得高程異常與真值之差進行轉換精度的評定,運用標準差來考察不同轉換模型的泛化能力。比較統(tǒng)計見表1、圖4。
標準差公式
式中: n為驗證樣本點總數(shù),Δε表示模型轉換所得高程異常εi與高程異常真值ε之差。
本文實驗區(qū)域中,數(shù)據(jù)預處理使得徑向基函數(shù)
表1 轉換精度比較Table 1 Comparison of fitting accuracy m
圖4 不同模型轉換結果誤差絕對值Fig. 64Absolute value of fitting error based on different models
網(wǎng)絡高程轉換精度有較明顯的提高,且大大改善了徑向基函數(shù)網(wǎng)絡模型的泛化能力。由此可見,在應用徑向基函數(shù)網(wǎng)絡進行高程轉換時,對數(shù)據(jù)樣本進行預處理是非常必要的。
由表1和圖4得知,在本文實驗中,中心化模型高程轉換精度最高,幾乎在所有驗證點處的轉換誤差絕對值都是最小的,標準差最小,在3種模型中具有最強的泛化能力。標準化模型高程轉換精度稍低于中心化模型,其各驗證點轉換誤差接近于中心化模型,也具有一定的泛化能力。歸一化模型高程轉換精度較低,且在某些驗證點處轉換誤差絕對值偏大,模型泛化能力較差。
本文通過對選定區(qū)域數(shù)據(jù)實驗分析表明,針對大面積、高程異常值變化較大的區(qū)域,在3種預處理數(shù)據(jù)中,中心化預處理數(shù)據(jù)對徑向基函數(shù)網(wǎng)絡高程轉換精度提高程度最大,中心化預處理與徑向基函數(shù)網(wǎng)絡結合的模型具有較強的泛化能力。一部分參考文獻中常用的歸一化預處理方法,可能不是提高高程轉換精度的最優(yōu)數(shù)據(jù)預處理方式。在進行高程轉換時,有必要通過比較不同的數(shù)據(jù)預處理方法尋找更優(yōu)的數(shù)據(jù)預處理方式,以達到更優(yōu)化模型的目的。本文實驗獲取數(shù)據(jù)具有局域性,不同的數(shù)據(jù)預處理方式對其他高程轉換模型以及在其他區(qū)域的優(yōu)化能力有待進一步驗證。
參考文獻:
[1]劉建,王琪潔,王小輝,等.基于遺傳算法的RBF神經(jīng)網(wǎng)絡在GPS高程轉換中的應用[J].測繪科學,2013,38 ( 2) : 143-145.
[2]任超,吳偉,黃征凱,等.基于AIC準則的RBF神經(jīng)網(wǎng)絡在GPS高程擬合中的應用[J].測繪科學,2013,38 ( 2) : 77-79.
[3]張昊,王琪潔,朱建軍,等.樣本數(shù)據(jù)預處理對基于BP神經(jīng)網(wǎng)絡的GPS高程擬合的影響[J].大地測量與地球動力學,2011,31 ( 2) : 125-128.
[4]王小輝,王琪潔,丁元蘭,等.基于二次曲面和BP神經(jīng)網(wǎng)絡組合模型的GPS高程異常擬合[J].大地測量與地球動力學,2012,32 ( 6) : 103-106.
[5]姬張建,袁運斌,盛傳貞.混沌粒子群支持向量機并考慮地形改正的GPS高程擬合[J].大地測量與地球動力學,2010,30 ( 2) : 95-98.
[6]焦明連,蔣廷臣.基于小波方法和Kriging估計的GPS高程轉換[J].大地測量與地球動力學,2008,28( 2) :100-103.
[7]魏子卿.GPS重力位水準[J].大地測量與地球動力學,2007,27 ( 4) : 1-7.
[8]趙輝,張書畢,張秋昭.基于加權總體最小二乘法的GPS高程擬合[J].大地測量與地球動力學,2011,31( 5) :88-91.
[9]孫傳勝,楊國東,吳瓊.神經(jīng)網(wǎng)絡在GPS高程擬合中的應用[J].測繪通報,2011 ( 8) : 48-50.
[10]陳明.MATLAB神經(jīng)網(wǎng)絡原理與實例精解[M].北京:清華大學出版社,2013.
[11]黃良珂,劉立龍,唐艷新,等.基于改進的Kriging法區(qū)域似大地水準面精華[J].桂林理工大學學報,2012,32 ( 4) : 532-536.
[12]王新橋,黃良珂,劉立龍,等.GPS高程轉換模型[J].桂林理工大學學報,2013,33 ( 3) : 504-508.
[13]張騰旭,劉立龍,周淼,等.基于LS-SVM和BP神經(jīng)網(wǎng)絡組合模型的GPS高程擬合[J].桂林理工大學學報,2014,34 ( 3) : 505-509.
[14]張騰旭,劉立龍,周淼,等.基于最小二乘配置法的高程擬合及精度評定方法[J].桂林理工大學學報,2014,34(4) :728-731.
Effects of data pretreatment to elevation fitting on radial basis function network
LI Jun-yua,b,LIU Li-long,CAI Cheng-huia,b,LIN Guo-biaoa,b,HUANG Liang-kea,b
( a. College of Geomatics Engineering and Geoinformations; b. Guangxi key laboratory of Spatial Information and Geomatics; c. Guangxi Scientific Experiment Center of Mining,Metallurgy and Environment,Guilin University of Technology,Guilin 541004,China)
Abstract:The necessity of data pretreatment to the elevation fitting on radial basis function network modeling is described.The basic principle and implementation steps of the conversion modeling is depicted based on radial basis function networks elevation.With engineering examples,normalization,centralization,standardization of three different data pretreatment methods is used to calculate the impact of good conversion on radial basis function network.It is shown that data pretreatment model can achieve better conversion accuracy in a large area with elevation changes over the outliers.Different pretreatment methods result in different conversion.The centralization can improve the elevation accuracy on radial conversion function network in a greater degree.Normalization wouldn't be the best data pretreatment method.It is necessary for the selection of pretreatment method before elevation conversion.
Key words:normalization; centralization; standardization; pretreatment of data; radial basis function network; elevation fitting; raise accuracy
通訊作者:劉立龍,博士,教授,hn_liulilong@163. com。
作者簡介:黎峻宇( 1989—),男,碩士研究生,研究方向: GNSS技術及應用,lijunyu36@163. com。
基金項目:國家自然科學基金項目( 41064001) ;廣西自然科學基金項目( 2012GXNSFAA053183; 2012GXNSFGA060001) ;廣西研究生教育創(chuàng)新計劃項目( YCSZ2013077) ;廣西空間信息與測繪重點實驗室項目(桂科能1207115-07) ;廣西礦冶與環(huán)境科學實驗中心項目( KH2012ZD004) ;廣西“八桂學者”專項經(jīng)費項目
收稿日期:2014-05-05
doi:10. 3969/j.issn. 1674-9057. 2015. 01. 015
文章編號:1674-9057( 2015) 01-0103-04
文獻標志碼:A
中圖分類號:P228. 49
引文格式:黎峻宇,劉立龍,蔡成輝,等.數(shù)據(jù)預處理對基于徑向基函數(shù)網(wǎng)絡高程轉換的影響[J].桂林理工大學學報,2015,35 ( 1) : 103-106.