孫佳龍,郭淑艷,龍冰心,秦思遠(yuǎn)
(1. 淮海工學(xué)院測(cè)繪與海洋信息學(xué)院,江蘇 連云港 222005; 2. 海島(礁)測(cè)繪技術(shù)國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室,山東 青島 266590; 3. 海岸帶地理環(huán)境監(jiān)測(cè)國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518060; 4. 江蘇省海洋資源開(kāi)發(fā)研究院,江蘇 連云港 222001; 5. 北京大地宏圖勘測(cè)科技有限公司,北京 100029)
高程異常是似大地水準(zhǔn)面與參考橢球面之間的高程差值。在一個(gè)區(qū)域內(nèi)精確確定高程異常,就可以通過(guò)GPS觀測(cè)的大地高準(zhǔn)確地求出正常高,從而減少對(duì)水準(zhǔn)測(cè)量工作的依賴,提高測(cè)量效率[1-3]。在一個(gè)區(qū)域內(nèi)確定高程異常,通常是利用已知點(diǎn)的高程異常擬合高程異常曲面,從而插值得出待定點(diǎn)的高程異常。高程異常曲面的擬合方法主要有多項(xiàng)式擬合法、二次曲面擬合法和多面函數(shù)擬合法等[4-6]。多面函數(shù)法是從幾何觀點(diǎn)出發(fā),解決根據(jù)數(shù)據(jù)點(diǎn)所形成的平差數(shù)學(xué)曲面問(wèn)題,該方法主要應(yīng)用于擬合重力異常、大地水準(zhǔn)面差距、垂線偏差等。而在多面函數(shù)擬合時(shí),首先需要確定中心點(diǎn),中心點(diǎn)選擇的不同,在很大程度上決定了最后的擬合精度[7]。人為選擇中心點(diǎn),會(huì)導(dǎo)致擬合的精度隨經(jīng)驗(yàn)的變化而不同,從而導(dǎo)致求解的高程異常值因人而異。聚類分析方法可以利用點(diǎn)與點(diǎn)之間的空間距離進(jìn)行分類,從而在分類結(jié)果中有效地選擇出中心點(diǎn),但利用該方法需首先確定分類的個(gè)數(shù),而分類個(gè)數(shù)有時(shí)又難以確定[8-9]。本文以地形熵作為一個(gè)參考量,首先確定分類個(gè)數(shù),然后以點(diǎn)與點(diǎn)之間的空間距離與地形熵的比值作為指標(biāo),從眾多高程異常點(diǎn)中選擇多面函數(shù)的中心點(diǎn),并利用多面函數(shù)進(jìn)行擬合,同時(shí)與其他方法進(jìn)行比較,以期得出一些有益的結(jié)論。
多面函數(shù)的理論依據(jù)為:任意數(shù)學(xué)表面與任意不規(guī)則的圓滑表面,總可以利用一系列有規(guī)則的數(shù)學(xué)表面總和,以任意精度逼近。因此,由多面函數(shù)表示的殘差高程異常為[4]
(1)
式中,aj為待定系數(shù);Q(x,y,xj,yj)為x和y的二次函數(shù),其中心點(diǎn)在(xj,yj)處;n為中心點(diǎn)的個(gè)數(shù);ζ可由二次式的和確定,故稱多面函數(shù)。
用一組簡(jiǎn)單的解析函數(shù)的線性組合對(duì)這個(gè)曲面進(jìn)行逼近,通常選擇多元二次函數(shù)作為解析函數(shù),其形式為[6]
(2)
將式(2)寫(xiě)成誤差方程,并用矩陣表示為
V=QA-ζ
(3)
待定系數(shù)A可根據(jù)已知GPS/水準(zhǔn)數(shù)據(jù)和地球重力場(chǎng)模型得到的殘差高程異常,按最小二乘法計(jì)算[10-11]
(4)
由此可根據(jù)系數(shù)A和式(1)求解其他點(diǎn)的殘差高程異常。
當(dāng)用多面函數(shù)表示殘差高程異常時(shí),由于選擇的中心點(diǎn)個(gè)數(shù)n要小于已知的高程異常值的個(gè)數(shù),因此,需要對(duì)所有的高程異常值進(jìn)行選取。人為選取高程異常值既耗時(shí)又費(fèi)力,且容易出錯(cuò)。利用聚類分析方法選擇中心點(diǎn)時(shí),需要首先確定分類個(gè)數(shù),而對(duì)于某一區(qū)域的高程異常而言,分類個(gè)數(shù)有時(shí)難以確定。作為一種表示地形復(fù)雜程度的指標(biāo),地形熵可以較準(zhǔn)確地表示局部區(qū)域高程值變化的劇烈程度[12-15]。地形熵定義為
(5)
式中,h(i,j)為高程,在本文中,以高程異常值代替高程。局部地形熵反映了地形所含有信息量的大小,因此,局部地形熵可以描述地形的性質(zhì)。局部區(qū)域高程值變化越急劇,起伏變化越大,地形越獨(dú)特,則計(jì)算出的局部地形熵越小,否則熵就越大。高程異常值變化越劇烈的位置,該點(diǎn)應(yīng)參與到曲面擬合中,即應(yīng)作為中心點(diǎn),擬合多面函數(shù)。基于地形熵聚類的多面函數(shù)擬合算法過(guò)程如下:
(1) 將相鄰兩個(gè)高程異常數(shù)據(jù)點(diǎn)組成新塊;
(2) 分別計(jì)算每塊區(qū)域的地形熵;
(3) 如某塊熵的相鄰兩塊區(qū)域的熵均大于該塊的熵,則該塊熵為極小熵;
(4) 極小熵的個(gè)數(shù)n即為聚類分析的分類數(shù),利用聚類分析算法對(duì)高程異常點(diǎn)進(jìn)行聚類;
(5) 聚類分析中各類別的距離與各塊區(qū)域地形熵的比值作為新的指標(biāo)量,進(jìn)行排序;
(6) 選擇指標(biāo)量最大的n個(gè)點(diǎn)作為多面函數(shù)的中心點(diǎn),其余點(diǎn)為檢核點(diǎn)。
某地區(qū)D級(jí)GPS控制網(wǎng)布設(shè)了18個(gè)觀測(cè)點(diǎn),對(duì)其進(jìn)行了GPS觀測(cè)和三等水準(zhǔn)測(cè)量,利用GPS獲得的大地高和水準(zhǔn)測(cè)量得到的正常高,得到18個(gè)GPS/水準(zhǔn)點(diǎn)的高程異常。各點(diǎn)的相對(duì)位置及高程異常值大小如圖1所示。
圖1 高程異常點(diǎn)分布情況
從圖1可以看出,這些點(diǎn)分布不均勻,在中間區(qū)域分布較少,在高程異常值較小的區(qū)域,點(diǎn)位個(gè)數(shù)也偏少。對(duì)這18個(gè)點(diǎn)的高程異常進(jìn)行分塊計(jì)算地形熵,如圖2所示。
從圖2可以看出,第2、6、9、12、15和17塊區(qū)域?yàn)闃O小熵,與極小熵相鄰較小的塊熵為第3、5、10、11和16,由此可以得到重合的點(diǎn)號(hào)分別為3、6、10、12、16和17號(hào)點(diǎn),共6個(gè)點(diǎn)。將聚類分析的分類個(gè)數(shù)取為6,進(jìn)行聚類分析,結(jié)果如圖3所示。
圖2 各塊區(qū)域地形熵
圖3 聚類分析結(jié)果
從分類結(jié)果可以看出,距離比較近的點(diǎn)被分為一類,如7和8號(hào)點(diǎn)。由于9和11號(hào)點(diǎn)距離其他點(diǎn)均較遠(yuǎn),因此也被分為一類。通過(guò)聚類分析,可以較好地將各點(diǎn)根據(jù)空間距離的遠(yuǎn)近分成不同的類。通過(guò)聚類分析,將距離最大的6個(gè)點(diǎn),即9、10、11、12、16、18作為聚類分析選擇的中心點(diǎn)。
無(wú)論是單獨(dú)采用地形熵還是聚類分析,兩者選擇的點(diǎn)是有差異的。本文將空間距離與地形熵的比值作為新的指標(biāo)量,既考慮了點(diǎn)與點(diǎn)之間的平面距離,又反映了高程異常值的變化情況,通過(guò)該指標(biāo),地形熵聚類法重新選擇了中心點(diǎn)。利用不同方法選擇的中心點(diǎn)進(jìn)行了多面函數(shù)的擬合,求得檢核點(diǎn)的高程異常,與檢核點(diǎn)的實(shí)際高程異常求差,結(jié)果如圖4所示。
圖4 多種方法選擇中心點(diǎn)后的擬合結(jié)果
從圖4可以看出,地形熵多面函數(shù)擬合的結(jié)果與實(shí)際高程異常值相比,在不同點(diǎn)差異較大,差異最小時(shí)接近0,而差異最大時(shí)超過(guò)0.06 m,說(shuō)明地形熵多面函數(shù)在局部區(qū)域可以很好地選擇中心點(diǎn),實(shí)現(xiàn)有效擬合,但在個(gè)別區(qū)域差值較大。而聚類分析多面函數(shù)比地形熵多面函數(shù)變化幅度小,個(gè)別點(diǎn)高程異常差大于0.04 m,說(shuō)明聚類分析多面函數(shù)在個(gè)別點(diǎn)與實(shí)際高程異常的差異也較大。而地形熵聚類的多面函數(shù)變化的幅度相對(duì)最小,最大差異值為0.03 m,為3種方法中最小的。3種方法的標(biāo)準(zhǔn)差和外符合精度見(jiàn)表1。
表1 擬合結(jié)果殘差比較
從表1可以看出,10、12和16號(hào)點(diǎn)在3種方法中都被選擇,說(shuō)明這3個(gè)點(diǎn)具有很強(qiáng)的代表性。而3種方法選擇的其他中心點(diǎn)卻有所不同,說(shuō)明采用不同的指標(biāo)量得到的結(jié)果具有差異性。計(jì)算不同中心點(diǎn)的多面函數(shù)所擬合的高程異常,然后求其與實(shí)際高程異常的差值見(jiàn)表1,由地形熵多面函數(shù)擬合的結(jié)果在3種方法中無(wú)論是標(biāo)準(zhǔn)差還是外符合精度都是最低的,說(shuō)明單獨(dú)采用地形熵選擇的中心點(diǎn)還不能很好地反映整個(gè)區(qū)域的高程異常變化,特別是隨坐標(biāo)的變化。而聚類分析得到精度較高,說(shuō)明在高程異常變化不大的情況下,以空間距離的大小作為指標(biāo)量,可以很好地獲取中心點(diǎn),從而提高擬合精度。當(dāng)將地形熵和聚類分析方法結(jié)合后,得到的標(biāo)準(zhǔn)差和外符合精度都是最小的,說(shuō)明同時(shí)考慮坐標(biāo)和高程異常的變化可以在一定程度上提高曲面擬合精度,在外符合精度上分別比聚類分析和地形熵提高了28%和48%,說(shuō)明了該方法的有效性。
利用地形熵可以較好地表征區(qū)域高程異常變化情況,從而為聚類分析提供分類個(gè)數(shù)。通過(guò)計(jì)算空間距離與地形熵的比值可以較好地反映整個(gè)區(qū)域的平面和高程異常變化整體情況。通過(guò)3種方法選擇了多面函數(shù)的中心點(diǎn),利用多面函數(shù)對(duì)整個(gè)區(qū)域的高程異常進(jìn)行擬合,擬合結(jié)果顯示距離與地形熵的比值是一個(gè)可以綜合反映高程異常隨空間位置變化的指標(biāo)量,利用其選擇的中心點(diǎn)并進(jìn)行多面函數(shù)擬合的精度也最高,然而這個(gè)指標(biāo)量對(duì)于一些特殊的區(qū)域是否適合還需進(jìn)一步研究。