張 炎,周 飛,唐詩華,肖 燕,張 躍
(1.廣西空間信息與測繪重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541006;2.桂林理工大學(xué)測繪地理信息學(xué)院,廣西 桂林 541006;3.廣西基礎(chǔ)地理信息中心,廣西 南寧 530023)
隨著現(xiàn)代測量技術(shù)的快速發(fā)展,全球定位系統(tǒng)(GPS)憑借其全能性、全天候、連續(xù)性和實(shí)時(shí)性得到了廣泛應(yīng)用[1]。GPS測量可以同時(shí)測定目標(biāo)位置的平面坐標(biāo)和大地高程,并且平面定位精度可達(dá)到1~2 cm。但是大地高并不是實(shí)際工程中所用到的高程,需要將大地高轉(zhuǎn)化為正常高才能滿足工程需求[2],兩者之間存在一個(gè)高程異常值。因此,如何獲取高精度的高程異常值始終是測繪工作者面臨的問題。目前,采用少量GPS水準(zhǔn)重合點(diǎn)來實(shí)現(xiàn)高程擬合越來越受到業(yè)界認(rèn)可。常規(guī)的GPS高程擬合方法有二次曲面擬合、三次樣條擬合、多項(xiàng)式曲線擬合、多面函數(shù)法等,但前3種方法擬合精度往往難于滿足實(shí)際工程需求,多面函數(shù)法中心點(diǎn)的選取過于繁瑣[3- 4]。最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)是一種新型機(jī)器學(xué)習(xí)方法,可以利用少量樣本數(shù)據(jù)快速精確地建立擬合模型,但參數(shù)的選擇較為復(fù)雜。
本文提出將果蠅優(yōu)化算法(fruit fly optimization algorithm,F(xiàn)OA)引入最小二乘支持向量機(jī)(LSSVM),建立區(qū)域GPS擬合模型。利用FOA全局尋優(yōu)能力強(qiáng)、過程簡練的特性,快速精準(zhǔn)的為LSSVM選擇最佳參數(shù),近一步提高利用少量GPS水準(zhǔn)重合點(diǎn)建立區(qū)域高程擬合模型的精度。
最小二乘支持向量機(jī)(LSSVM)是由Suykens在原有支持向量機(jī)的基礎(chǔ)上提出的。支持向量機(jī)具有結(jié)構(gòu)簡單、全局優(yōu)化、泛化能力較好等優(yōu)點(diǎn),而LSSVM除具備這些優(yōu)點(diǎn)之外還提高了收斂速度,化簡了計(jì)算過程[5- 6]。兩者區(qū)別主要在于用等式約束代替標(biāo)準(zhǔn)支持向量機(jī)中的不等式約束,并收集數(shù)據(jù)的誤差平方和損失函數(shù)作為訓(xùn)練集的經(jīng)驗(yàn)損失[7]。其具體步驟如下:
針對給定的訓(xùn)練集Α={(x1,y1),…,(xl,yl)}∈(Rn×Y)l,xi∈Rn,yi∈Y=R,i=1,2,…,l。其中,A為訓(xùn)練樣本集;(xl,yl)為訓(xùn)練樣本;R、Y為實(shí)數(shù)集。利用非線性映射將樣本輸入映射到高維特征空間,構(gòu)造出高維特征空間的線性回歸函數(shù),即
g(x,w)=wTφ(x)+b
(1)
式中,g為線性回歸函數(shù);w為權(quán)值向量;φ(x)為非線性映射函數(shù);b為閾值。根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,將其轉(zhuǎn)化為以下優(yōu)化問題,公式為
(2)
約束條件為
s.t.yi=wTφ(xi)+b+ξi
(3)
式中,c為正則化參數(shù);ξ為誤差項(xiàng)。利用Lagrange函數(shù)和KKT(Karush-Kuhn-Tucker)優(yōu)化條件可以求得LSSVM的函數(shù)模型,即
Z(x)=ai[φ(xk)φ(xi)]+b
(4)
式中,Z(x)為LSSVM的函數(shù);ai為Lagrange乘子。
根據(jù)Hilbert-Schmidt原理,引入核函數(shù)K(xk,xj)=[φ(xk)φ(xi)],近而將高維空間的內(nèi)積計(jì)算轉(zhuǎn)換為原空間中的函數(shù)的計(jì)算,解決了高維特征空間的計(jì)算問題,即
(5)
目前,核函數(shù)主要有多項(xiàng)式核函數(shù)、徑向基核函數(shù)和線性核函數(shù)??紤]到GPS高程擬合預(yù)測模型較為復(fù)雜,本文選用徑向基核函數(shù)作為LSSVM的核函數(shù),可以達(dá)到比較好的預(yù)測效果,即
(6)
式中,σ為核函數(shù)參數(shù)。
從上面整個(gè)過程可以看出,利用最小二乘支持向量機(jī)(LSSVM)構(gòu)建擬合模型只需要確定核函數(shù)參數(shù)σ和正則化參數(shù)c。相比原有支持向量機(jī),計(jì)算過程簡潔許多。
果蠅優(yōu)化算法(FOA)是由臺灣學(xué)者潘文超提出的一種基于果蠅覓食行為的群智能優(yōu)化算法。相比于其他智能優(yōu)化算法,F(xiàn)OA具備全局尋優(yōu)能力強(qiáng)、運(yùn)行時(shí)間少、參數(shù)少等優(yōu)點(diǎn),在各個(gè)領(lǐng)域得到廣泛應(yīng)用。其基本原理是果蠅在嗅覺與視覺上的感知能力要優(yōu)于其他生物,憑借靈敏的嗅覺器官,果蠅可以快速地搜索并分辨出空氣中存在的各種氣味,達(dá)到食物的周圍后,借助于優(yōu)越的視覺定位出同伴與食物的所在地。果蠅優(yōu)化算法流程見圖1。詳細(xì)操作步驟[8-9]:
(1)初始確定果蠅種群的規(guī)模、迭代次數(shù),隨機(jī)給出每個(gè)果蠅個(gè)體根據(jù)嗅覺尋找食物的初始方向和距離。
(2)在剛開始仍然無法得知食物所在的準(zhǔn)確位置,只能先獲取果蠅與原點(diǎn)的距離L,進(jìn)一步計(jì)算味道濃度判定值S,利用味道濃度判定值S確定味道濃度判定函數(shù)值,最終獲取目前所在位置的食物味道濃度。
(3)確定味道濃度最大的位置,記錄保存下來,之后所有果蠅均朝此方向飛去。
(4)重復(fù)以上步驟,迭代多次,每次的迭代結(jié)果均與上一次迭代結(jié)果比較,保留食物味道濃度的最佳位置及方向,最終獲取食物的最佳位置。
圖1 果蠅優(yōu)化算法流程
在實(shí)際的工程應(yīng)用中,要想獲取最佳的GPS高程擬合模型去解決工程中的問題,現(xiàn)有的一些方法難以達(dá)到理想的要求。吳吉賢,杜海燕等[10]曾提出過利用LSSVM擬合方法進(jìn)行區(qū)域GPS擬合模型的建立,但需要合理的方法來提取最佳參數(shù)。因此,本文提出利用FOA-LSSVM的組合方法來解決這個(gè)問題。利用FOA的廣泛快速的搜索能力,為LSSVM選取建模過程中的正則化參數(shù)c和核參數(shù)σ最優(yōu)值,進(jìn)一步提高LSSVM方法構(gòu)建模型的擬合精度。FOA-LSSVM擬合方法的基本步驟是:
(1)輸入訓(xùn)練樣本數(shù)據(jù),并對其進(jìn)行歸一化處理。
(2)設(shè)置初始果蠅的種群參數(shù),主要有種群大小D、迭代最大限值Bmax、初始位置(x,y)、方向、搜尋距離L。
(3)計(jì)算味道濃度判定值S,并將其映射為LSSVM的參數(shù),建立高程擬合模型及預(yù)測。
(4)以均方根誤差RSME為味道濃度函數(shù),獲取種群內(nèi)最優(yōu)個(gè)體的位置及最佳味道濃度值記錄并保存。
(5)將種群位置、方向、搜尋距離、味道濃度值進(jìn)行迭代尋優(yōu)。
(6)輸出結(jié)果。
迭代次數(shù)存在最大限值,若迭代次數(shù)達(dá)到了最大限值或找到了符合要求的果蠅味道濃度函數(shù)值,則結(jié)束迭代,將最終結(jié)果輸出;否則,重復(fù)步驟(3)~(6),直到達(dá)到最大限度或獲取符合要求的最佳味道濃度函數(shù)值為止。
表2 3種模型擬合結(jié)果的殘差值
研究區(qū)域選擇在廣西東南小范圍區(qū)域,覆蓋面積約200 km2,以此來分析FAO-LSSVM擬合方法在區(qū)域GPS高程擬合中應(yīng)用的精度。本文選取了30個(gè)GPS水準(zhǔn)重合點(diǎn)數(shù)據(jù)進(jìn)行擬合模型的建立,剩余的10個(gè)作為檢測樣本。步驟如下:
(1)將果蠅種群規(guī)模設(shè)置為20個(gè),最大迭代次數(shù)為80次。
(2)隨機(jī)選取種群個(gè)體的初始位置、方向、搜尋距離。
(3)將徑向基函數(shù)(RBF)選定為FOA-LSSVM擬合方法的核函數(shù)。
為證明FOA-LSSVM擬合方法的有效性,將其結(jié)果與BP神經(jīng)網(wǎng)絡(luò)、LSSVM擬合方法的擬合結(jié)果進(jìn)行對比。表1為不同擬合方法的符合精度。從表1可知,BP神經(jīng)網(wǎng)絡(luò)的內(nèi)符合精度為0.013 7 m,標(biāo)準(zhǔn)LSSVM擬合方法的內(nèi)符合精度為0.010 7 m,F(xiàn)OA-LSSVM擬合方法的內(nèi)符合精度為0.007 9 m,比標(biāo)準(zhǔn)LSSVM擬合方法的內(nèi)符合精度提高了26%,同時(shí)也可以看出其外符合精度也均優(yōu)于其他2種方法。因此,利用FOA-LSSVM擬合方法構(gòu)建區(qū)域GPS擬合模型具有一定的可行性,且模型的擬合精度較高。
表1 不同擬合方法的符合精度對比
為近一步檢驗(yàn)FOA-LSSVM擬合方法的穩(wěn)定性,選用10個(gè)檢測數(shù)據(jù)在該模型中獲取GPS高程異常值,從檢測數(shù)據(jù)的擬合結(jié)果中得到殘差值,并進(jìn)行對比分析。3種模型擬合結(jié)果的殘差值見表2。3種擬合方法的殘差對比見圖2。
由表2和圖2可知,相比于BP神經(jīng)網(wǎng)絡(luò)、LSSVM擬合方法擬合結(jié)果,F(xiàn)OA-LSSVM擬合方法擬合結(jié)果波動較小,尤其是相對于常規(guī)的LSSVM擬合方法而言,擬合精度更加穩(wěn)定,總體的波動范圍也有所減小,充分證明了該組合方法的現(xiàn)實(shí)性及有效性,并且確保了在區(qū)域范圍內(nèi)進(jìn)行擬合模型建立的穩(wěn)定性。
圖2 3種擬合方法的殘差對比
本文基于果蠅優(yōu)化算法對最小二乘支持向量機(jī)擬合方法進(jìn)行了參數(shù)優(yōu)化,進(jìn)一步解決了其在構(gòu)建區(qū)域GPS高程擬合模型過程中難以獲取最佳參數(shù)的問題,并與BP神經(jīng)網(wǎng)絡(luò)擬合方法、常規(guī)的LSSVM擬合方法進(jìn)行了對比分析,得出以下結(jié)論:
(1)利用果蠅優(yōu)化算法為最小二乘支持向量機(jī)擬合方法選擇參數(shù)時(shí),由于果蠅優(yōu)化算法本身具有全局尋優(yōu)能力強(qiáng)、參數(shù)少、過程簡單、易實(shí)現(xiàn)的優(yōu)點(diǎn),使得經(jīng)過其優(yōu)化的最小二乘支持向量機(jī)擬合方法的擬合結(jié)果更佳,避免了常見的易陷入局部最優(yōu)的缺陷,模型的整體擬合精度有了一定的提高。
(2)相比于BP神經(jīng)網(wǎng)絡(luò),在選擇了合適的函數(shù)、最佳參數(shù)的情況下,最小二乘支持向量機(jī)擬合方法針對非線性的少量樣本數(shù)據(jù)有更高精度的擬合效果,且FOA-LSSVM組合方法解決了BP神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)化的問題,也避免了其需要大量的樣本數(shù)據(jù)的麻煩,具有一定的現(xiàn)實(shí)性及有效性。
本文提出的果蠅優(yōu)化算法結(jié)合最小二乘支持向量機(jī)擬合法構(gòu)建的區(qū)域高程擬合模型的精度相比于常規(guī)LSSVM擬合法、BP神經(jīng)網(wǎng)絡(luò)擬合法有一定的提高,為以后的擬合模型構(gòu)建提供了思路,但試驗(yàn)對比僅針對了小范圍區(qū)域,今后需要采集大范圍的研究區(qū)域數(shù)據(jù)進(jìn)行進(jìn)一步對比分析。