譚興龍 趙曉慶 張玉華 胡 洪
(1.中國礦業(yè)大學(xué)(徐州)環(huán)境與測繪學(xué)院;2.國土環(huán)境與災(zāi)害監(jiān)測國家測繪局重點實驗室;3.江蘇省資源環(huán)境信息工程重點實驗室;4.兗礦集團東華地礦建設(shè)分公司)
礦山高精度高程基準(zhǔn)的建立是礦山變形災(zāi)害監(jiān)測的基礎(chǔ)、安全生產(chǎn)的重要保障。由于礦區(qū)地形條件復(fù)雜,坡度變化較大,采用常規(guī)水準(zhǔn)儀測量工作量大,時效性差[1],難以滿足復(fù)雜礦區(qū)高程快速測定的需求。隨著全球定位系統(tǒng)(Global Position System,GPS)技術(shù)迅速普及,GPS已成為大地測量的重要手段,可以實現(xiàn)礦區(qū)高程的快速測定。但GPS高程是基于WGS-84參考橢球的大地高,實際應(yīng)用中通常采用基于似大地水準(zhǔn)面的正常高,它們之間的差值稱為高程異常[2],因而精確地確定高程異常是將GPS高程應(yīng)用到礦區(qū)高程測量的關(guān)鍵。目前,國內(nèi)外常用高程異常計算方法有多項式擬合(Polynomial fitting,Polyfit)[3-4]、神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN)[5-6]、支持向量回歸(Support Vector Regression,SVR)[7]。支持向量回歸的理論基礎(chǔ)是小樣本統(tǒng)計學(xué)習(xí)的結(jié)構(gòu)風(fēng)險最小化原則,基本思想是通過用內(nèi)積函數(shù)定義的非線性變換將輸入空間映射到一個高維的特征空間,在高維的特征空間中尋找輸入變量和輸出變量之間的映射關(guān)系[8]。本研究基于遺傳算法(Genetic Algorithm,GA)選取支持向量回歸算法最優(yōu)參數(shù),構(gòu)建GPS測站坐標(biāo)與對應(yīng)高程異常的非線性映射模型,內(nèi)插出其他各點的高程異常值。最后選取某礦區(qū)實測數(shù)據(jù)對算法進(jìn)行計算分析,驗證算法可行性。
假設(shè)訓(xùn)練數(shù)據(jù)集
式中,xi是第i個輸入向量,yi是第i個標(biāo)量輸出,l是樣本數(shù)。SVR回歸的基本思想是利用滿足Mercer條件的核函數(shù)將輸入數(shù)據(jù)x映射到高維特征空間,并在該空間構(gòu)造優(yōu)化超平面f(x),
式中,ω為權(quán)重向量,b為偏置項。為求優(yōu)化超平面,引入不敏感損失函數(shù)ε和懲罰參數(shù)c,根據(jù)Wolfe對偶理論,將參數(shù)ω,b的求解問題轉(zhuǎn)變?yōu)樽顑?yōu)化問題:
其中,Qmin為優(yōu)化問題最優(yōu)解;αi,αj,為非負(fù)拉格朗日乘子;i,j=1,2,…,l;α*∈ R2l。
式(1)屬于凸二次規(guī)劃問題,其可行域為空,所以一定有解[8]。設(shè)優(yōu)化問題Q的最優(yōu)解為
則
鑒于徑向基函數(shù)在處理空間線性不可分?jǐn)?shù)據(jù)時具有較好的效果,引入徑向基核函數(shù)
將其作為式(1)中xixj的映射函數(shù),則超平面回歸函數(shù)為
值得注意的是,徑向基核函數(shù)中控制半徑的參數(shù)γ和懲罰參數(shù)c選取是否合理直接決定最優(yōu)超平面的泛化能力和回歸精度。
將參數(shù)γ,c表示為適于遺傳算法求解的2個染色體問題,尋找其最優(yōu)值,計算步驟如下。
(1)參數(shù)編碼。為避免聯(lián)系狀態(tài)之間轉(zhuǎn)換時可能出現(xiàn)邏輯混淆,采用二進(jìn)制雷格碼編碼。
(2)生成初始群體。設(shè)定參數(shù)的取值范圍0≤γ≤1 000,0<c≤100,隨機產(chǎn)生染色體數(shù)量為20,變量數(shù)為2(即核函數(shù)參數(shù)γ和懲罰參數(shù)c),染色體用20位雷格碼表示。
(3)基于交叉驗證法和線性排序分配適應(yīng)度函數(shù)值,計算個體適應(yīng)度函數(shù)值。
(4)對個體進(jìn)行遺傳算子操作。采用適應(yīng)度比例方法進(jìn)行選擇運算,以概率為0.7進(jìn)行交叉運算,以概率為0.05進(jìn)行變異運算,生成子代群體。
(5)判斷是否滿足終止條件(遺傳代數(shù)達(dá)到100次),若滿足則停止計算解碼輸出優(yōu)化解,否則將子代染色體代替父染色體轉(zhuǎn)入步驟(3)。
根據(jù)礦區(qū)GPS測站分布,選取部分均勻分布的站點作為支持向量回歸算法的訓(xùn)練數(shù)據(jù),基于遺傳算法自動選取支持向量回歸訓(xùn)練最優(yōu)參數(shù),構(gòu)建適用于訓(xùn)練數(shù)據(jù)的支持向量回歸模型,將剩余GPS測站數(shù)據(jù)作為預(yù)測數(shù)據(jù),采用訓(xùn)練好的支持向量回歸模型預(yù)測出回歸結(jié)果。同時基于多項式擬合和神經(jīng)網(wǎng)絡(luò)算法分別對預(yù)測數(shù)據(jù)進(jìn)行計算,通過對比殘差,分析3種算法優(yōu)劣。數(shù)據(jù)處理流程圖見圖1。
圖1 數(shù)據(jù)處理流程
在沿江某礦區(qū)布設(shè)GPS控制網(wǎng),經(jīng)后處理得到無粗差且同精度的GPS高程點32個,平均邊長為1.2 km,測區(qū)面積約50 km2,按國家GPS網(wǎng)B級要求實測,同時采用二等水準(zhǔn)聯(lián)測得到各GPS點的平面位置和高程異常,選擇第1~第20個平均分布的點作為訓(xùn)練樣本,選取第21~第32個點作為測試樣本。數(shù)據(jù)見表1,其中X,Y為地方坐標(biāo),ζ為高程異常。
表1 原始數(shù)據(jù)
為避免數(shù)據(jù)較大影響回歸效果,將樣本數(shù)據(jù)做歸一化處理?;谶z傳算法對訓(xùn)練數(shù)據(jù)計算支持向量回歸最優(yōu)參數(shù)γ和c過程見圖2。迭代18次后收斂到均方差精度為0.001 m,收斂后支持向量回歸最優(yōu)參數(shù)為:核函數(shù)寬度γ為0.55,邊界系數(shù)c為455。
圖2 遺傳算法參數(shù)尋優(yōu)△—最佳適應(yīng)度;○—平均適應(yīng)度
采用遺傳算法尋優(yōu)后的參數(shù),對訓(xùn)練數(shù)據(jù)進(jìn)行支持向量訓(xùn)練構(gòu)造回歸模型,產(chǎn)生13個支持向量,得到如式(2)所示的回歸函數(shù),其中權(quán)重向量α*iαi的值見表2,偏置項b為0.148。
表2 支持向量回歸參數(shù)
經(jīng)多次驗證,采用 a0,a1,a2,a3,a4,a56 個參數(shù)的二次多項式擬合對訓(xùn)練數(shù)據(jù)擬合效果最好,基于最小二乘法擬合后得到擬合函數(shù)
其中,擬合多項式參數(shù) a0,a1,a2,a3,a4,a5的值分別為 -82.01、3.254 ×10-4、-1.399 ×10-3、-2.984×10-10、2.309 ×10-9、8.729 ×10-10。
徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)具有全局最優(yōu)和最佳逼近性能。令神經(jīng)元的最大數(shù)目為20,徑向基函數(shù)的擴展速度為 5,訓(xùn)練截止均方誤差為 0.01,采用RBFNN算法對訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練。
將訓(xùn)練數(shù)據(jù)、測試數(shù)據(jù)分別代入遺傳算法輔助的支持向量回歸(GA-SVR)、多項式函數(shù)(Polyfit)、徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)模型預(yù)測高程異常值,并與真值對比計算殘差,見圖3。
圖3 殘差對比□—Polyfit;●—RBFNN;○—GA -SVR
支持向量回歸算法、多項式擬合和徑向基神經(jīng)網(wǎng)絡(luò)模型分別對實測數(shù)據(jù)擬合精度比較見表4。結(jié)果表明:3種方法的預(yù)測精度都可滿足礦區(qū)四等水準(zhǔn)的精度要求;三者對測試數(shù)據(jù)預(yù)測的殘差最大值基本相當(dāng);GA-SVR算法殘差曲線更為平緩,其內(nèi)外符合精度分別為5.162、5.972 mm,為三者之中最小,精度最高。
表3 不同方法精度比較 mm
(1)支持向量回歸機結(jié)構(gòu)簡單,基于遺傳算法可以尋找到最優(yōu)參數(shù),且具有全局最優(yōu)解,增強泛化能力強,可有效避免人為設(shè)定參數(shù)的盲目性。
(2)GA-SVR、多項式擬合和RBFNN均可用于礦區(qū)GPS高程異常擬合,其精度與礦區(qū)似大地水準(zhǔn)面的復(fù)雜情況、測站點分布有直接關(guān)系。基于凸最優(yōu)化理論,SVR訓(xùn)練時選取凸域內(nèi)的訓(xùn)練數(shù)據(jù)預(yù)測精度最高,選擇凸域外的訓(xùn)練數(shù)據(jù)精度較低,因而,如何選取最合理的訓(xùn)練數(shù)據(jù)是下一步值得深入研究的課題。
[1] 劉曉君,孫久運,周 峰.支持向量機回歸在礦區(qū)GPS高程轉(zhuǎn)換中的應(yīng)用[J].金屬礦山,2011(1):98-101.
[2] 周忠謨.GPS衛(wèi)星測量原理與應(yīng)用[M].北京:測繪出版社.1997:238-241.
[3] Reguzzoni M,Sanso F,Venuti G.The theory of general kriging,with applications to the determination of a local geoid[J].Geophysical Journal International,2005,162(2):303-314.
[4] 陳俊勇,李建成,寧津生,等.中國似大地水準(zhǔn)面[J].測繪學(xué)報,2002(S1):1-6.
[5] 胡伍生,華錫生,鮑興南.轉(zhuǎn)換GPS高程的神經(jīng)元網(wǎng)絡(luò)方法[J].河海大學(xué)學(xué)報,2001,29(6):87-89.
[6] 楊明清,靳蕃,朱達(dá)成,等.用神經(jīng)網(wǎng)絡(luò)方法轉(zhuǎn)換 GPS高程[J].測繪學(xué)報,1999,28(4):301-307.
[7] 吳兆福,宮 鵬,高 飛,等.基于支持向量機的GPS似大地水準(zhǔn)面擬合[J].測繪學(xué)報,2004,33(4):303-306.
[8] 鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機[M].北京:科學(xué)出版社.2004:34-95.