丁小陸,黃炳耀,鮑曉娣
(1.寧??h規(guī)劃局,浙江 寧海 315600;2.寧海縣規(guī)劃設(shè)計院,浙江 寧海 315600)
基于GIS的地名地址管理系統(tǒng)構(gòu)建
丁小陸1,黃炳耀2,鮑曉娣2
(1.寧??h規(guī)劃局,浙江 寧海 315600;2.寧??h規(guī)劃設(shè)計院,浙江 寧海 315600)
地名地址作為GIS最基礎(chǔ)的數(shù)據(jù)組成部分,其命名和管理一直是各國、組織機構(gòu)需要解決完善的問題,也是數(shù)字城市地理空間框架建設(shè)中重要的一環(huán)。以此為背景提出基于二維GIS組件ArcGIS Engine和三維地理平臺TerraExplorer的地名地址管理系統(tǒng),實現(xiàn)了基于條件隨機場的地名地址要素識別、標(biāo)準(zhǔn)化入庫、二三維要素關(guān)聯(lián)和數(shù)據(jù)分析等功能,并簡要介紹了該系統(tǒng)的功能設(shè)計、關(guān)鍵技術(shù)等。
GIS;地名地址;系統(tǒng)設(shè)計;條件隨機場
我國于2010年推出的《數(shù)字城市地理信息公共平臺地名/地址編碼規(guī)則》,為地名地址數(shù)據(jù)的標(biāo)準(zhǔn)化和共享提供了系統(tǒng)、科學(xué)的體系[1-3]。依據(jù)規(guī)范,地名數(shù)據(jù)可分為3種形式:地名、地址和POI(point of interest,興趣點)[4]。地名是人們對各個地理實體賦予的專有名稱,屬于面狀空間形態(tài),空間指代性較模糊;地址是對地理實體位置的具體結(jié)構(gòu)化描述,屬于點狀空間形態(tài),空間指代性較具體;POI是人們對感興趣點位的信息描述,一般為地名或地址+實體名稱的形式。根據(jù)寧??h的實際情況進行補充和完善,本系統(tǒng)將地址要素分為9大類15小類,如表1所示。
表1 地址要素分類分級體系
2.1 系統(tǒng)總體設(shè)計
區(qū)別于傳統(tǒng)的地名地址管理系統(tǒng),本系統(tǒng)是一個融合測繪、規(guī)劃、民政、公安、工商等部門資源,包括地理信息技術(shù)和分布式數(shù)據(jù)庫技術(shù)的綜合性工程,涉及地名地址、空間數(shù)據(jù)、GIS、網(wǎng)絡(luò)分布式信息處理系統(tǒng)和大型數(shù)據(jù)庫等復(fù)雜要素。
系統(tǒng)設(shè)計在滿足計算機軟件工程的基本要求和原則外,還需要實現(xiàn)以下目標(biāo):
1)地名地址分類標(biāo)準(zhǔn)化。
2)民政、公安、工商、測繪等部門地名地址資源的整合。
3)系統(tǒng)應(yīng)結(jié)合目前主流的二維和三維開發(fā)平臺,實現(xiàn)地名地址要素與二維地理實體(房屋面)、三維地理實體(建筑模型)的一體化。
4)系統(tǒng)應(yīng)保證各類數(shù)據(jù)成果的安全高效存儲和管理,并方便地名地址數(shù)據(jù)的入庫、查詢、分析統(tǒng)計。
按照上述要求,為充分發(fā)揮GIS的服務(wù)功能,系統(tǒng)采用C/S模式進行開發(fā)。二維基礎(chǔ)地理平臺使用組件式GIS軟件——ArcGIS Engine,ArcGIS Engine封裝了大部分ArcGIS底層功能模塊和方法,具備強大的地理分析應(yīng)用功能[5]。三維基礎(chǔ)地理平臺使用目前與ArcGIS結(jié)合最好的Skyline公司的TerraExplorer軟件,TerraExplorer能夠?qū)崿F(xiàn)三維影像的交互式體驗,并實現(xiàn)對ArcGIS數(shù)據(jù)格式的良好支持。系統(tǒng)按照架構(gòu)分為硬件基礎(chǔ)層、數(shù)據(jù)層、應(yīng)用層和交互層,如圖1所示。
2.2 系統(tǒng)功能設(shè)計
地名地址管理系統(tǒng)集地名地址、二維系統(tǒng)和三維系統(tǒng)為一體,系統(tǒng)主要分為地名地址數(shù)據(jù)入庫與編輯、POI數(shù)據(jù)入庫與編輯、數(shù)據(jù)分析和系統(tǒng)管理4大組成部分。地名地址/POI數(shù)據(jù)入庫與編輯功能主要包括要素的新建、編輯、查詢和批量入庫,要素與三維建筑模型數(shù)據(jù)的關(guān)聯(lián)等;數(shù)據(jù)分析主要包括圖面和屬性查詢、數(shù)據(jù)審核、數(shù)據(jù)導(dǎo)出和書簽管理功能;系統(tǒng)管理主要包括用戶管理和角色管理,用以實現(xiàn)不同人員的系統(tǒng)操作權(quán)限,從而保障系統(tǒng)的安全性,明確各部分的責(zé)任人。系統(tǒng)的功能結(jié)構(gòu)如圖2所示。
圖1 地名地址管理系統(tǒng)整體架構(gòu)圖
圖2 地名地址管理系統(tǒng)功能結(jié)構(gòu)圖
2.3 數(shù)據(jù)管理發(fā)布
地名地址管理系統(tǒng)的數(shù)據(jù)種類多樣,主要包括二維影像地圖集、二維基礎(chǔ)地理底圖、三維地形文件、建筑模型、地名地址數(shù)據(jù)、POI數(shù)據(jù)等。按照數(shù)據(jù)的結(jié)構(gòu),可分為文件系統(tǒng)和數(shù)據(jù)庫系統(tǒng)。
文件系統(tǒng)主要存儲二、三維基礎(chǔ)地理要素。二維影像地圖和基礎(chǔ)地理底圖采用瓦片切圖的形式,利用ArcGIS Server發(fā)布。三維地形文件由航攝影像和DEM疊合而成,通過TerraGate發(fā)布;三維矢量建筑模型和三維場景文件由IIS發(fā)布。
數(shù)據(jù)庫系統(tǒng)采用ArcSDE for SQL Server數(shù)據(jù)庫,實現(xiàn)了關(guān)系數(shù)據(jù)庫和空間數(shù)據(jù)庫的一體化管理,主要存儲地名地址數(shù)據(jù)、POI數(shù)據(jù)、模型點位數(shù)據(jù)、用戶數(shù)據(jù)等。
3.1 基于條件隨機場的地名地址要素識別
地名地址數(shù)據(jù)管理中,如何整合已有的大量不同數(shù)據(jù)源和數(shù)據(jù)格式的地名地址數(shù)據(jù)是有待解決的一個重要問題。本系統(tǒng)通過地名地址分類標(biāo)準(zhǔn)化體系,實現(xiàn)了基于條件隨機場的地名地址要素識別。
條件隨機場是由Lafferty在研究序列化數(shù)據(jù)標(biāo)注的過程中提出的,它是對最大熵模型的改進,具備最大熵模型的一切優(yōu)點,是近年來應(yīng)用在自然語言處理和圖像處理等研究領(lǐng)域的一種新的數(shù)學(xué)模型工具[6]。條件隨機場模型建立的關(guān)鍵是參數(shù)估計和特征選取。參數(shù)估計是從訓(xùn)練數(shù)據(jù)中訓(xùn)練模型,求解每一個特征的權(quán)重參數(shù),即權(quán)重向量λ={λ1,λ2,…,λn}的過程;特征的選取是篩選出具有表征意義的特征,關(guān)鍵在于根據(jù)具體任務(wù)抽象出合適的特征模板集。
本系統(tǒng)中,為了能夠應(yīng)用基于字的標(biāo)注方法來識別中文地名要素,使用4詞位標(biāo)注集來表示地址要素類別。根據(jù)中文地名的平均詞長特征和于江德的語料測試,下文對識別性能的貢獻比上文的貢獻要高出6個百分點以上[7],系統(tǒng)選擇非對稱的地名要素上下文窗口,上文的寬度為3,下文的寬度為5,如圖3所示。
圖3 地址要素上下文窗口圖
基于中文字符特性,在選取特征時主要考慮單個字符的信息,從而抽象出3類特征:原子特征、復(fù)合特征和詞位轉(zhuǎn)移特征。
經(jīng)實驗,在20萬條訓(xùn)練語料規(guī)模下,基于條件隨機場的地名地址要素識別對各項分類字段的成功率達到84.39%以上,大大提高了地名地址分類的準(zhǔn)確性,降低了人工成本。
3.2 數(shù)據(jù)入庫
地名地址管理系統(tǒng)的核心是數(shù)據(jù)的入庫管理,按照數(shù)據(jù)的來源,可分為新建數(shù)據(jù)入庫和已有數(shù)據(jù)入庫兩種方式。
1) 新建數(shù)據(jù)入庫。新建數(shù)據(jù)入庫是指在系統(tǒng)內(nèi)通過新增地名地址/POI要素入庫的方法。按照系統(tǒng)設(shè)計原則,新建數(shù)據(jù)須嚴(yán)格執(zhí)行規(guī)范要求,依次進行位置信息匹配、完整性檢查、重復(fù)性檢查、鄰接關(guān)系檢查和管理員審核,審核通過后才能入庫。
2)批量數(shù)據(jù)入庫。批量數(shù)據(jù)入庫與新建數(shù)據(jù)入庫流程相同,首先執(zhí)行數(shù)據(jù)的完整性檢查,然后進行數(shù)據(jù)的各項拓撲關(guān)系檢查,最后由管理人員審核入庫。
3.3 二三維聯(lián)動
二三維聯(lián)動不僅包括二維與三維視圖顯示區(qū)域相一致,還表現(xiàn)在兩個場景屬性數(shù)據(jù)、分析結(jié)果的一致性[8]。二維和三維顯示區(qū)域聯(lián)動是基于兩者統(tǒng)一的坐標(biāo)系實現(xiàn)的。三維聯(lián)動二維可通過TerraExplorer的ScreenToTerrain方法獲取中心點坐標(biāo)和四至,再由ArcGIS Engine的Extent屬性實現(xiàn)三維到二維的聯(lián)動。二維聯(lián)動三維較復(fù)雜,可通過建立二維比例尺和三維視點高度的轉(zhuǎn)換系數(shù),再利用二分法實現(xiàn)坐標(biāo)轉(zhuǎn)換。
三維地名地址/POI圖層采用流方式加載,與二維圖層采用同一套數(shù)據(jù),確保了二三維屬性數(shù)據(jù)的一致性。同時,系統(tǒng)在查詢和分析等操作時也要保證顯示效果的一致性。系統(tǒng)的三維界面如圖4所示。
圖4 地名地址管理系統(tǒng)三維界面
本系統(tǒng)實現(xiàn)了地名地址要素信息的標(biāo)準(zhǔn)化入庫,從而減少數(shù)據(jù)后期的處理難度。同時,系統(tǒng)結(jié)合基于條件隨機場的地名地址要素識別,解決了原始地名數(shù)據(jù)的融合難題;并通過地名地址要素和二、三維建筑成果的關(guān)聯(lián),實現(xiàn)了地名地址數(shù)據(jù)與二三維數(shù)據(jù)的一體化。系統(tǒng)的成功建設(shè)和運行可為地名地址數(shù)據(jù)的標(biāo)準(zhǔn)化共享提供重要的基礎(chǔ)和保障。
[1] 高小萍,兀偉. 地理編碼技術(shù)探討[J]. 測繪標(biāo)準(zhǔn)化,2012, 28(4):1-3
[2] 周傲英,楊彬. 基于位置的服務(wù):架構(gòu)與進展[J]. 計算機學(xué)報,2011,34(7):1 155-1 171
[3] GB/T 23705-2009. 數(shù)字城市地理信息公共平臺地名/地址編碼規(guī)則[S].
[4] 秦學(xué)秀. 地名數(shù)據(jù)的3種形式及其質(zhì)量要求[J]. 測繪通報,2011(10):68-69
[5] 廉光偉,義崇政. 基于AE組件和OSG的二三維聯(lián)動GIS系統(tǒng)研究與實現(xiàn)[J]. 城市勘測,2012(6):17-20
[6] Lafferty J,Mccallum A,Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. In: Proceedings of the 18th International Conference on Machine Learning[C]. IEEE,San Francisco,USA, 2001
[7] 于江德,王希杰,樊孝忠. 字標(biāo)注漢語詞法分析中上文和下文孰重孰輕[J]. 計算機科學(xué),2012,39(11):201-203
[8] 萬幼,邊馥苓. 二三維聯(lián)動的GIS系統(tǒng)體系結(jié)構(gòu)構(gòu)建技術(shù)[J].地理信息世界,2008,6(2):48-52
本 刊 聲 明
為適應(yīng)我國信息化建設(shè),擴大本刊及作者知識信息交流渠道,本刊數(shù)據(jù)已被《中國核心期刊(遴選)數(shù)據(jù)庫》、《CNKI 中國期刊全文數(shù)據(jù)庫》和《中文科技期刊數(shù)據(jù)庫(全文版)》等收錄。在《地理空間信息》發(fā)表的論文均默認將其在著作權(quán)保護期內(nèi)的復(fù)制權(quán)、發(fā)行權(quán)、匯編權(quán)、翻譯權(quán)以及網(wǎng)絡(luò)傳播權(quán)授權(quán)給《地理空間信息》編輯部,編輯部可將上述權(quán)利轉(zhuǎn)授給第三方使用。作者不再許可他人以任何形式使用該篇論文,但可以在其后續(xù)作品中引用(或翻譯)該論文中部分內(nèi)容或?qū)⑵鋮R編在作者的非期刊類文集中。如不同意,請事先聲明,本刊另作處理。其文章的著作權(quán)使用費與本刊稿酬一次性給付(已在收取發(fā)表費時折減和換算為雜志贈閱)。
(本刊編輯部)
P208
B
1672-4623(2015)04-0072-03
10.3969/j.issn.1672-4623.2015.04.026
丁小陸,高級工程師,研究方向為地理信息系統(tǒng)開發(fā)和遙感影像數(shù)據(jù)處理。
2015-03-17。