張新長(zhǎng),陳家鴻,郭泰圣
(中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東 廣州 510275)
?
基于可逆映射的地形圖數(shù)據(jù)異構(gòu)融合研究與實(shí)現(xiàn)
張新長(zhǎng),陳家鴻,郭泰圣
(中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東 廣州 510275)
摘要:隨著數(shù)字城市的快速發(fā)展,基礎(chǔ)地理數(shù)據(jù)在測(cè)繪、國(guó)土、規(guī)劃、交通等國(guó)民經(jīng)濟(jì)重要部門及國(guó)防建設(shè)領(lǐng)域發(fā)揮著越來越重要的作用。但是當(dāng)前大多數(shù)城市的基礎(chǔ)地理數(shù)據(jù)存在CAD和GIS的多種數(shù)據(jù)格式并存的現(xiàn)狀,無法高效地進(jìn)行數(shù)據(jù)共享。針對(duì)上述問題,為充分利用已有的數(shù)據(jù)資源并提高地形圖數(shù)據(jù)的共享性,本文提出了一種基于可逆映射的地形圖數(shù)據(jù)異構(gòu)融合的技術(shù)方案,在此基礎(chǔ)上,編程實(shí)現(xiàn)了CAD數(shù)據(jù)與GIS數(shù)據(jù)的可逆轉(zhuǎn)換與融合。
關(guān)鍵詞:異構(gòu)融合;可逆映射;數(shù)據(jù)檢查;數(shù)據(jù)轉(zhuǎn)換
基礎(chǔ)地理數(shù)據(jù)是國(guó)家基礎(chǔ)設(shè)施建設(shè)和地球科學(xué)研究的支撐性成果,是國(guó)民經(jīng)濟(jì)、國(guó)防建設(shè)中不可缺少的重要資源,是“數(shù)字城市”“智慧城市”建設(shè)的基礎(chǔ),對(duì)社會(huì)可持續(xù)發(fā)展起著重要作用[1]。
地形圖數(shù)據(jù)作為基礎(chǔ)地理數(shù)據(jù)的重要組成部分,按照一定的分類,利用不同的圖式符號(hào)反映地球表面的空間地物,是國(guó)家建設(shè)、社會(huì)發(fā)展的基礎(chǔ)性資料[2]。但是,當(dāng)前我國(guó)大多數(shù)城市的地形圖數(shù)據(jù)存在CAD和GIS的多種數(shù)據(jù)格式并存的現(xiàn)狀,地形圖數(shù)據(jù)呈現(xiàn)出多源異構(gòu)性,這使得現(xiàn)有地形圖數(shù)據(jù)無法高效地進(jìn)行數(shù)據(jù)共享,數(shù)據(jù)孤島[3]的弊端已經(jīng)愈演愈烈。因此,如何高效地對(duì)多源異構(gòu)地形圖數(shù)據(jù)進(jìn)行融合,提高地形圖數(shù)據(jù)的共享性就成為當(dāng)前亟待解決的一個(gè)重要問題。
一、異構(gòu)融合的原理
1. 異構(gòu)融合的定義
異構(gòu)融合作為一種數(shù)據(jù)綜合處理技術(shù),實(shí)際上是許多傳統(tǒng)學(xué)科和新技術(shù)的集成和應(yīng)用,若從廣義的數(shù)據(jù)融合定義出發(fā),包括通信、模式識(shí)別、決策論、不確定性理論、信號(hào)處理、估計(jì)理論、最優(yōu)化技術(shù)、計(jì)算機(jī)科學(xué)、人工智能和神經(jīng)網(wǎng)絡(luò)等。異構(gòu)融合的目的是提高數(shù)據(jù)質(zhì)量、補(bǔ)充數(shù)據(jù)信息,并最終實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的共享。將其拓展到地形圖數(shù)據(jù)領(lǐng)域,郭黎給出了如下定義:地形圖數(shù)據(jù)融合是指將不同來源的地形圖數(shù)據(jù),采用不同的方法,重新組合專題屬性數(shù)據(jù),統(tǒng)一地物的分類分級(jí)和屬性,進(jìn)一步完善地物的信息,提高地形圖數(shù)據(jù)的質(zhì)量和可共享性[3]。
2. 異構(gòu)融合的基本框架
地形圖數(shù)據(jù)異構(gòu)融合一般包括4個(gè)基本內(nèi)容:規(guī)則建立、數(shù)據(jù)編碼、數(shù)據(jù)轉(zhuǎn)換和接邊融合。異構(gòu)融合的基本框架如圖1所示,可以采用八元組(M,R,I,C,E,X,B,D)表示。
圖1 異構(gòu)融合基本框架
1)M表示原始數(shù)據(jù)的集合。
2)R表示融合規(guī)則。
3)I表示融合規(guī)則的嵌入。
4)C表示待融合數(shù)據(jù)的檢查,包括編碼檢查、屬性檢查、拓?fù)錂z查。
5)E表示待融合數(shù)據(jù)的編輯,包括屬性編輯、符合編輯、拓?fù)渚庉嫛?/p>
6)X表示含有融合規(guī)則的數(shù)據(jù)。
7)B表示融合過程,包括數(shù)據(jù)轉(zhuǎn)換、接邊融合。
8)D表示融合后的數(shù)據(jù),其中Dr為融合結(jié)果數(shù)據(jù),Dm為待融合數(shù)據(jù)。
二、基于可逆映射的地形圖數(shù)據(jù)異構(gòu)融合
1. 技術(shù)路線
本文的異構(gòu)地形圖數(shù)據(jù)是指竣工測(cè)量CAD地形圖數(shù)據(jù)、未入庫GIS地形圖數(shù)據(jù)或已入庫的GIS地形圖數(shù)據(jù)。本文主要針對(duì)同級(jí)比例尺的異構(gòu)融合研究,融合數(shù)據(jù)預(yù)處理操作是指在融合前依據(jù)數(shù)據(jù)標(biāo)準(zhǔn),對(duì)數(shù)據(jù)進(jìn)行坐標(biāo)系、數(shù)據(jù)結(jié)構(gòu)及拓?fù)潢P(guān)系的檢查與修正處理[4],以產(chǎn)生符合融合標(biāo)準(zhǔn)的數(shù)據(jù)。異構(gòu)融合方法是對(duì)要素進(jìn)行編碼賦值、數(shù)據(jù)編輯、數(shù)據(jù)轉(zhuǎn)換,再利用要素的幾何距離與屬性相似度進(jìn)行對(duì)象匹配,之后進(jìn)行接邊融合。其技術(shù)路線如圖2所示。
圖2 技術(shù)路線
2. 可逆映射的建立
數(shù)據(jù)可逆映射關(guān)系是指兩個(gè)數(shù)據(jù)模型的數(shù)據(jù)元素之間的可逆對(duì)應(yīng)關(guān)系。首先根據(jù)地形圖數(shù)據(jù)的實(shí)際情況,可以按數(shù)據(jù)的不同層次將數(shù)據(jù)抽象為3種層次:數(shù)據(jù)集、數(shù)據(jù)層和數(shù)據(jù)對(duì)象。
假設(shè)原始數(shù)據(jù)為Ds,按照數(shù)據(jù)融合標(biāo)準(zhǔn)的目的數(shù)據(jù)為Dt,數(shù)據(jù)映射關(guān)系為F,則三者之間的關(guān)系為
F(Ds)=Dt
(1)
根據(jù)數(shù)據(jù)的層次關(guān)系,F(xiàn)由數(shù)據(jù)集間的映射關(guān)系GC、數(shù)據(jù)層間的映射關(guān)系GL和數(shù)據(jù)對(duì)象間的映射關(guān)系GO復(fù)合而成,即
F=GC·GL·GO
(2)
數(shù)據(jù)對(duì)象間的映射關(guān)系本質(zhì)上就是數(shù)據(jù)對(duì)象的屬性結(jié)構(gòu)或數(shù)據(jù)模式間的映射關(guān)系,它是數(shù)據(jù)映射中最為核心和復(fù)雜的部分。GC、GL、GO的定義分別如下[5]:
1) 數(shù)據(jù)集合間映射關(guān)系GC。假設(shè)原始數(shù)據(jù)集合為(S1,S2,S3,…),融合后的數(shù)據(jù)集合為(T1,T2,T3,…),則
GC(S1,S2,S3,…)=(T1,T2,T3,…)
(3)
2) 數(shù)據(jù)層之間的映射關(guān)系。數(shù)據(jù)層之間的映射關(guān)系是對(duì)數(shù)據(jù)集進(jìn)行解構(gòu)之后數(shù)據(jù)層之間的映射關(guān)系,即圖層間的映射關(guān)系GL。假設(shè)原始數(shù)據(jù)層為
(S1(x1,x2,x3,…),S2(x1,x2,x3,…),
S3(x1,x2,x3,…),…)
(4)
融合后的數(shù)據(jù)模式為
(D1(y1,y2,y3,…),D2(y1,y2,y3,…),
D3(y1,y2,y3,…),…)
(5)
則
GL(S1(x1,x2,x3,…),S2(x1,x2,x3,…),
S3(x1,x2,x3,…),…)=(D1(y1,y2,y3,…),
D2(y1,y2,y3,…),D3(y1,y2,y3,…),…)
(6)
3) 數(shù)據(jù)對(duì)象間映射關(guān)系。數(shù)據(jù)對(duì)象映射關(guān)系本質(zhì)上即數(shù)據(jù)模式間的映射關(guān)系。假設(shè)原數(shù)據(jù)模式為
(f1,f2,f3,…)
(7)
目標(biāo)數(shù)據(jù)模式為
(8)
由原數(shù)據(jù)到目標(biāo)數(shù)據(jù)間的映射關(guān)系為GO,則兩者之間的關(guān)系為
(9)
基于上述抽象映射關(guān)系,DWG格式的CAD數(shù)據(jù)和SHP格式的GIS數(shù)據(jù)在圖層級(jí)別[6]可以構(gòu)建如圖3所示的可逆映射關(guān)系。
圖3 圖層級(jí)別可逆映射
3. 數(shù)據(jù)轉(zhuǎn)換
由于地形圖數(shù)據(jù)由幾何圖形數(shù)據(jù)和屬性數(shù)據(jù)兩部分組成,因此在進(jìn)行數(shù)據(jù)轉(zhuǎn)換時(shí),需要對(duì)幾何圖形數(shù)據(jù)和屬性數(shù)據(jù)分別進(jìn)行轉(zhuǎn)換[7]。
(1) 圖形轉(zhuǎn)換
地形圖數(shù)據(jù)中的點(diǎn)要素是由坐標(biāo)信息構(gòu)成的,在進(jìn)行點(diǎn)轉(zhuǎn)換時(shí)對(duì)于BlockReference、DBPoint等點(diǎn)類型的實(shí)體,可以直接讀取坐標(biāo)信息,基于X、Y坐標(biāo)信息進(jìn)行構(gòu)點(diǎn)[8]。
線轉(zhuǎn)換涉及的圖形類型較多,其基本原理是讀取圖形的各個(gè)節(jié)點(diǎn)信息,然后以點(diǎn)構(gòu)線。對(duì)于簡(jiǎn)單類型(如Line),通過讀取起點(diǎn)和終點(diǎn)坐標(biāo)即可直接構(gòu)線;對(duì)于復(fù)雜類型(如Arc),需要通過讀取起點(diǎn)和終點(diǎn)坐標(biāo)、Arc的起始角度及總角度、弧長(zhǎng)等信息構(gòu)造弧上的點(diǎn),然后進(jìn)行構(gòu)線[9]。
面轉(zhuǎn)換主要涉及Polyline、Polyline2d、Circle3種類型的實(shí)體,其基本原理是通過讀取圖形的節(jié)點(diǎn)等相關(guān)信息,進(jìn)行構(gòu)面[10]。
(2) 屬性轉(zhuǎn)換
在DWG格式轉(zhuǎn)SHP格式過程中,圖形的屬性信息存儲(chǔ)在其擴(kuò)展字典下自定義字典的擴(kuò)展屬性中,因此在進(jìn)行數(shù)據(jù)轉(zhuǎn)換時(shí),先讀取存儲(chǔ)在實(shí)體中的屬性信息,然后與GIS中Feature的屬性字段進(jìn)行匹配,最后將屬性值寫入到GIS中Feature對(duì)象的對(duì)應(yīng)屬性中[10]。
在SHP轉(zhuǎn)DWG格式過程中,先通過程序讀取存儲(chǔ)在GIS中Feature的屬性字段,然后與CAD圖層中擴(kuò)展屬性進(jìn)行匹配,最后將屬性值寫入到AutoCAD圖層中對(duì)應(yīng)的擴(kuò)展屬性中。
4. 接邊融合
接邊融合關(guān)鍵技術(shù)包括確定接邊對(duì)象和接邊融合。目前常用的接邊方法是通過搜索鄰近要素及比較屬性來確定接邊對(duì)象[12-13]。在實(shí)際操作中,通常會(huì)根據(jù)要素類型分別進(jìn)行接邊融合操作。
(1) 線要素接邊
線要素常用的接邊方法有平均法、強(qiáng)制法、優(yōu)化法。其中,平均法是取圖形兩邊待接點(diǎn)的坐標(biāo)均值作為接邊后點(diǎn)的坐標(biāo)。強(qiáng)制法是把一條待接邊的待接點(diǎn)強(qiáng)制附和到另一條待接邊的待接點(diǎn)上,因其精度不高,很難確認(rèn)哪條邊是比較準(zhǔn)確的,故不常用。優(yōu)化法是將接邊產(chǎn)生的拐點(diǎn)消除,達(dá)到接邊后的圖邊兩端線段,既要共點(diǎn)又要共線[14]。
線要素接邊首先搜索融合范圍邊界處需要接邊的對(duì)象,具體搜索過程如下:
1) 通過屬性匹配,篩選出與待融合線要素屬性相似度最高的線要素集合A;
2) 給定一個(gè)閾值d,以d為半徑,以原要素與接邊線的交點(diǎn)為圓心生成緩沖區(qū);
3) 通過空間查詢得到A中與緩沖區(qū)相交的線要素,即接邊對(duì)象。
接邊對(duì)象確定之后即要對(duì)數(shù)據(jù)進(jìn)行接邊融合操作,線要素的接邊融合可以通過比較融合數(shù)據(jù)與原數(shù)據(jù)的精度來確定,接邊到精度較高的數(shù)據(jù)上。若數(shù)據(jù)間的精度相差不大,則可選用平均接邊法進(jìn)行接邊。
(2) 面要素接邊
面要素接邊首先搜索融合范圍邊界處需要接邊的對(duì)象,具體搜索過程如下:
1) 通過屬性匹配,篩選出與待融合面要素A屬性相似度最高的面要素集合M;
2) 給定一個(gè)閾值d,以d為半徑,對(duì)接邊邊界線兩側(cè)進(jìn)行緩沖,生成一個(gè)緩沖區(qū);
3) 通過空間查詢得到M中與緩沖區(qū)相交的面要素,即為接邊對(duì)象[15](如圖4所示)。
圖4 搜索參與接邊的面要素
面要素接邊采用精度平移的方式,精度低的數(shù)據(jù)平移至精度高的數(shù)據(jù),精度接近的數(shù)據(jù)則讓兩個(gè)對(duì)象分別平移坐標(biāo)偏移量的一半[16]。以居民地面對(duì)象為例:假設(shè)居民地面是具有4個(gè)節(jié)點(diǎn)的規(guī)則矩形,在待融合數(shù)據(jù)中居民地面是兩個(gè)獨(dú)立對(duì)象;比較鄰近的節(jié)點(diǎn)的坐標(biāo),計(jì)算出坐標(biāo)偏移量;同比例尺下對(duì)象精度相近,因此把節(jié)點(diǎn)分別平移坐標(biāo)偏移量的一半;最后利用4個(gè)新節(jié)點(diǎn)重新構(gòu)面,即可得到融合之后的居民地面對(duì)象。
(3) 屬性融合
在要素完成幾何接邊后,需要進(jìn)一步對(duì)要素的屬性信息進(jìn)行融合。在接邊融合操作中對(duì)象的屬性信息融合通常有3種方式:
1) 以融合要素的屬性信息作為融合后對(duì)象的屬性信息;
2) 以待融合要素的屬性信息作為融合后對(duì)象的屬性信息;
3) 綜合考慮融合要素和待融合要素,通過某種融合規(guī)則,如屬性疊加的方式來得到融合對(duì)象的屬性信息[16]。
三、試驗(yàn)分析
1. 試驗(yàn)數(shù)據(jù)概況
本文選取了1∶1000地形圖數(shù)據(jù),數(shù)據(jù)為DWG格式(如圖5(a)所示)和SHP格式(如圖5(b)所示)。
圖5 原始的試驗(yàn)地形圖數(shù)據(jù)
2. 試驗(yàn)結(jié)果
首先將DWG格式的CAD數(shù)據(jù)轉(zhuǎn)換為SHP格式的GIS數(shù)據(jù),如圖6所示。
圖6 DWG格式轉(zhuǎn)換為SHP格式
完成格式轉(zhuǎn)換后,數(shù)據(jù)的格式已經(jīng)統(tǒng)一,且都具備編碼信息,即可進(jìn)行接邊融合操作,將二者融合為一張圖,如圖7所示。
圖7 接邊融合
3. 精度評(píng)價(jià)
在異構(gòu)融合的過程中,考慮到保證數(shù)據(jù)的精度,專門設(shè)計(jì)了編碼檢查和拓?fù)錂z查的功能。編碼檢查可以檢查出是否有編碼缺失、編碼類別錯(cuò)誤的情況;拓?fù)錂z查可以檢查線相交、線重疊、線自相交、面重疊的拓?fù)溴e(cuò)誤。通過對(duì)多組不同數(shù)據(jù)量的數(shù)據(jù)進(jìn)行試驗(yàn),結(jié)果表明融合精度較高(見表1)。
表1 精度評(píng)價(jià) (%)
四、結(jié)束語
本文根據(jù)目前國(guó)土信息化的發(fā)展趨勢(shì),提出了基于可逆映射的地形圖數(shù)據(jù)異構(gòu)融合技術(shù)方案,選題來自實(shí)際生產(chǎn)部門的現(xiàn)實(shí)需要,通過與生產(chǎn)人員的詳細(xì)交流獲得非常重要的經(jīng)驗(yàn),并得出研究的總體框架。本研究圍繞地形圖數(shù)據(jù)的特點(diǎn)、地形圖數(shù)據(jù)異構(gòu)融合的建設(shè)需要、多源異構(gòu)地形圖數(shù)據(jù)的融合方法等方面展開研究,主要研究?jī)?nèi)容如下:
1) 根據(jù)地形圖數(shù)據(jù)生成應(yīng)用的總體需求,參考目前在多源異構(gòu)數(shù)據(jù)融合中使用最為廣泛的數(shù)據(jù)融合技術(shù),設(shè)計(jì)了基于可逆映射的地形圖數(shù)據(jù)融合技術(shù)方案。
2) 基于上述技術(shù)方案,構(gòu)架了DWG格式數(shù)據(jù)、異構(gòu)GIS格式數(shù)據(jù)間的數(shù)據(jù)映射模式,為實(shí)際的異構(gòu)地形圖數(shù)據(jù)融合提供了方法。
本研究構(gòu)建基于可逆映射的數(shù)據(jù)融合機(jī)制,從國(guó)土生產(chǎn)部門的主要情況和研究的工作量角度考慮,僅構(gòu)建DWG格式與SHP格式數(shù)據(jù)間的可逆映射關(guān)系;而國(guó)土生產(chǎn)部門可能還存在其他類型的數(shù)據(jù)。因此,總結(jié)國(guó)內(nèi)外更好的科研成果,考慮更多類型的異構(gòu)數(shù)據(jù)模型將是本文下一步的研究?jī)?nèi)容。
參考文獻(xiàn):
[1]焦煦,朱文英,黃瑞峰.基礎(chǔ)地理數(shù)據(jù)在智慧城市建設(shè)中的分析與應(yīng)用[J].信息技術(shù)2012(2):55-61.
[2]楊伯剛.城市基礎(chǔ)地形圖數(shù)據(jù)建庫技術(shù)方法研究[J].測(cè)繪通報(bào),2005(9):44-46.
[3]崔翰川.面向共享的矢量地理數(shù)據(jù)安全關(guān)鍵技術(shù)研究[D].南京:南京大學(xué),2013:3-10.
[4]郭黎.空間矢量數(shù)據(jù)融合問題的研究[D].鄭州:信息工程大學(xué),2003.
[5]齊立新, 基于映射關(guān)系的城鄉(xiāng)規(guī)劃數(shù)據(jù)集成與同步[D].廣州:中山大學(xué),2014.
[6]郭黎,崔鐵軍.空間數(shù)據(jù)融合方法的探討[C]∥中國(guó)地理信息系統(tǒng)協(xié)會(huì)論文集2002年會(huì)論文集.[S.l.]:[s.n.],2002.
[7]陳年松.基于FME的CAD與GIS數(shù)據(jù)共享研究[D].南京:南京師范大學(xué),2008.
[8]謝祖明.基于CAD數(shù)據(jù)生產(chǎn)ArcGIS制圖數(shù)據(jù)的研究與應(yīng)用[J].測(cè)繪與空間地理信息,2012,35(8): 121-126.
[9]劉志輝,肖海威,梁子震.淺析城市信息化地形圖的入庫數(shù)據(jù)質(zhì)量檢查[J].城市勘探,2012(5): 53-56.
[10]袁源林,張新長(zhǎng).CAD地形圖數(shù)據(jù)規(guī)整入庫的研究與應(yīng)用[J].測(cè)繪通報(bào),2013(5):44-48.
[11]陳家鴻,張新長(zhǎng),郭泰圣. AutoCAD與ArcGIS數(shù)據(jù)轉(zhuǎn)換研究與應(yīng)用[J].地理信息世界,2014(5):46-50.
[12]戴相喜,周衛(wèi),高磊.DLG數(shù)據(jù)任意范圍接邊算法及實(shí)現(xiàn)[J].測(cè)繪通報(bào),2008(7):32-35.
[13]曹鍵,李國(guó)忠,徐效波,等.基于ArcGIS Engine的多圖幅數(shù)字地形圖接邊算法研究[J].測(cè)繪與空間地理信息,2010,10(3):76-78.
[14]孫麗娜,李吉之,陳靜.基于AO的同比例尺地形圖無縫接邊技術(shù)及其實(shí)現(xiàn)方法[J].測(cè)繪工程, 2007(6):49-53.
[15]熊湘琛.城市基礎(chǔ)矢量地形數(shù)據(jù)建庫與增量更新研究[D].廣州:中山大學(xué), 2009.
[16]張新長(zhǎng),郭泰圣,唐鐵.一種自適應(yīng)的矢量數(shù)據(jù)增量更新方法研究[J].測(cè)繪學(xué)報(bào),2012,41(4):613-619.
Heterogeneous Integration Research and Implement for Topographic Map Data Based on Reversible Mapping
ZHANG Xinchang,CHEN Jiahong,GUO Taisheng
收稿日期:2015-06-02
基金項(xiàng)目:村鎮(zhèn)建設(shè)用地再開發(fā)技術(shù)應(yīng)用集成與示范研究(2013BAJ13B06);國(guó)家自然科學(xué)重點(diǎn)項(xiàng)目基金(41431178);高等學(xué)校博士點(diǎn)專項(xiàng)基金(20120171110030)。
作者簡(jiǎn)介:張新長(zhǎng)(1957—),男,教授,博士生導(dǎo)師,主要研究方向?yàn)閿?shù)字城市與智慧城市理論方法與技術(shù)應(yīng)用。E-mail:eeszxc@mail.sysu.edu.cn
中圖分類號(hào):P208
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):0494-0911(2016)06-0026-04
引文格式: 張新長(zhǎng),陳家鴻,郭泰圣. 基于可逆映射的地形圖數(shù)據(jù)異構(gòu)融合研究與實(shí)現(xiàn)[J].測(cè)繪通報(bào),2016(6):26-29.DOI:10.13474/j.cnki.11-2246.2016.0183.