薛 睿,郭 霄,張 萌,常曉瀅
(1.長安大學地質工程與測繪學院,陜西 西安 710061; 2.解放軍61363部隊,陜西 西安 710000)
建立地理數(shù)據(jù)庫的數(shù)據(jù)來源主要由紙質地圖、實測數(shù)據(jù)、已經(jīng)存儲的系統(tǒng)數(shù)據(jù)與遙感影像數(shù)據(jù)等組成[1],地理數(shù)據(jù)庫數(shù)據(jù)對于地圖制圖有十分重要的作用。隨著不同行業(yè)部門對于地圖制圖的需求,利用專業(yè)共享數(shù)據(jù)是地形圖更新中的一個重要環(huán)節(jié)[2],但現(xiàn)有的數(shù)據(jù)庫數(shù)據(jù)使用與制圖存在以下局限:(1)海量的數(shù)據(jù)共享不足使得數(shù)據(jù)得不到充分利用,同時導致部門之間數(shù)據(jù)使用存在藩籬。(2)原有紙質數(shù)據(jù)的矢量化耗時巨大,實測數(shù)據(jù)與遙感影像獲取耗費人力,現(xiàn)有的數(shù)據(jù)要素組成又難以滿足不同的制圖要求。在地圖需要更新或數(shù)據(jù)組成難以滿足新的制圖需求時,需測繪人員實地測量或使用遙感影像對地理數(shù)據(jù)庫中數(shù)據(jù)進行修改,不利于提高制圖的效率。(3)如何使用地理數(shù)據(jù)庫中數(shù)據(jù)進行制圖,還沒有統(tǒng)一的原則,使得制圖時數(shù)據(jù)使用混亂,不同部門之間交接困難進而阻礙了生產(chǎn)。
針對以上問題,研究使用MapStore平臺對轉換集模型進行了闡述,該模型旨在利用現(xiàn)有的地理數(shù)據(jù)庫中數(shù)據(jù),在不對數(shù)據(jù)更新的前提下滿足不同部門制圖的需求,實現(xiàn)數(shù)據(jù)再利用。同時在使用轉換集模型的基礎上,制定地理數(shù)據(jù)庫中數(shù)據(jù)改化的原則與改化的技術路線方便制圖的交接,為開展大規(guī)模數(shù)據(jù)之間的改化及聯(lián)動更新提供技術支持[3]。
在MapStore平臺中,模板是制圖的關鍵,而轉換集是模板重要的組成部分,模板是按照空間數(shù)據(jù)字典與符號數(shù)據(jù)字典對要素的信息化描述,是對空間要素的完整定義,可定義要素的空間部分(幾何類型和屬性)及地圖符號生成規(guī)則[4]。模板由數(shù)據(jù)要素集與轉換集組成,數(shù)據(jù)要素集用于定義成圖要素分類,其結構如圖1所示。
圖1 數(shù)據(jù)要素集結構Fig.1 Data elements set structure
實體模板組相當于成圖要素層,一般分為測量控制點、水系、居民地及設施、交通、管線、境界、地貌、植被與土質和注記九大要素類,每一類分為點線面3層,因此實體模板組大多由27個要素層組成[5]?;緦嶓w模板相當于一個存儲符號的容器,既可以用于存儲圖廓與表格,也可以存儲地圖要素符號。圖廓、表格與要素符號通過單元符號模板下標準符號模板組與輔助定義組共同定義。標準符號模板組下可以定義點狀、線狀、表格與自由標注符號模板,輔助定義組可通過定義標準符號模板組中使用到的值與線段起始輔助符號的制作[6],其結構如圖2所示。
圖2 數(shù)據(jù)要素集示例Fig.2 Example of a data elements set
每一個實體模板組都有自己的屬性值,模板提供屬性的自定義功能適用于不同項目的需求。模板組一旦建立,每一圖層地圖要素的幾何類型、屬性、符號表達、優(yōu)先級也就同時確定。
數(shù)據(jù)要素集建立完成后,點擊數(shù)據(jù)集創(chuàng)建轉換集。轉換集的作用在于規(guī)定不同數(shù)據(jù)之間的轉換規(guī)則,包括要素與屬性的對應。
地理數(shù)據(jù)庫經(jīng)過多年完善,已基本覆蓋全國,但由于各地采集地理數(shù)據(jù)格式不同,制圖方式差異使得不同省份與部門之間不能共享數(shù)據(jù),導致其他部門制圖時需專門的數(shù)據(jù)采集人員重新采集符合自己部門制圖的數(shù)據(jù),進而導致數(shù)據(jù)采集入庫的工作重復[7]。研究將現(xiàn)有的數(shù)據(jù)稱為國標數(shù)據(jù),成圖要素數(shù)據(jù)稱為目標數(shù)據(jù)[8]。
MapStore采用拓撲地圖模型[9],使得制圖入庫一體化,這里采用DLGM(數(shù)字線劃地圖)數(shù)據(jù)進行制圖,制圖員將現(xiàn)有的國標mdb數(shù)據(jù)導入軟件后,通過轉換集將國標中的DLG數(shù)據(jù)通過國標編碼與目標數(shù)據(jù)編碼相對應,通過轉換集形成國標數(shù)據(jù)的“進口”與“出口”。另外,國標數(shù)據(jù)與目標數(shù)據(jù)的屬性可以經(jīng)屬性表自定義轉換,顯然轉換集起到國標數(shù)據(jù)與目標數(shù)據(jù)的映射作用[10],而模板數(shù)據(jù)集起到對原始數(shù)據(jù)“印刷”的作用——即為原始的國標線劃數(shù)據(jù)“印刷”上對應的目標地圖符號,將原數(shù)據(jù)從一個模型轉換為另一個模型[11]。
通過轉換集對應后的數(shù)據(jù)形成了實體DLG,其中每一個線劃都對應著模板中的實體即目標數(shù)據(jù),通過目標數(shù)據(jù)編碼找到對應實體符號自動生成地圖符號,圖3為制圖的完整過程。
圖3 制圖過程Fig.3 Mapping process
不同格式數(shù)據(jù)本質上是對同一區(qū)域地理現(xiàn)象的不同方式的表達。在傳統(tǒng)的意義上地理現(xiàn)象可以分為除注記外的八大類,不同格式的數(shù)據(jù)在這一方面是有高度一致性的,這就為數(shù)據(jù)的改化提供了理論上的可行性。
但不同格式數(shù)據(jù)也存在應用目標的差異和對地理現(xiàn)象的建模上的差異,按照信息學的基本概念,信息是由描述現(xiàn)象的特征(語義)及一定表達方式(語法)構成[12]。因此國標與目標數(shù)據(jù)之間的改化可以從3個方面考慮其原則。
圖4展示的是國標要素與目標要素之間的關系,二者之間存在相同的要素與不同的要素。當某一要素在國標數(shù)據(jù)集中存在而目標數(shù)據(jù)中不存在,可以擴大模板中目標數(shù)據(jù)集。例如,國標數(shù)據(jù)中不存在人行天橋,可以添加人行天橋的基本實體模板。相反當某一要素在國標數(shù)據(jù)中存在而目標數(shù)據(jù)中不存在時,轉換集實體類型外碼(國標編碼)可不填寫。圖5為轉換集映射自定義表。
圖4 要素數(shù)據(jù)集問題Fig.4 Elements dataset relation
語義即語言所蘊含的意義,其具有領域性,地圖要素的名稱屬于地理語義的表達。不同格式數(shù)據(jù)的差異很大部分表現(xiàn)在語義異構,當國標數(shù)據(jù)與目標數(shù)據(jù)對同一地理實體采用不同的解釋方法時,就產(chǎn)生了數(shù)據(jù)改化的語義問題,研究將這種差異分為3類,見表1。
圖5 轉換集數(shù)據(jù)映射Fig.5 Transition set data mapping
表1 語義差異分類表
國標數(shù)據(jù)分火車隧道與汽車隧道,目標數(shù)據(jù)中只有隧道要素,這時要合并國標數(shù)據(jù)集中要素,形成多對一的情況。此外,桔與橡膠共同對應目標數(shù)據(jù)中的經(jīng)濟林,這就導致2個不同要素對應著相同的符號,此處借助桔=[SQL∶GB=="220125"],TYPE=桔/[SQL∶GB=="220125"],TYPE=橡膠,即導入的桔和橡膠按照GB碼都對應目標數(shù)據(jù)的經(jīng)濟林,成圖時也表現(xiàn)相同的符號,制圖時圖上通過標記文字“桔”、 “橡膠”來區(qū)分,效果如圖6所示。國標語義范疇大于目標數(shù)據(jù)語義范疇需要根據(jù)情況對國標數(shù)據(jù)進行拆分,例如國標數(shù)據(jù)中園林要素在目標數(shù)據(jù)中對應著森林、經(jīng)濟林、經(jīng)濟作物地、旱生作物地與水生作物地,通過Sql語句進行區(qū)分,例如區(qū)分森林通過森林=[SQL∶(GB=="810400"&&TYPE=="銀杏")||(GB=="810400"&&TYPE=="黃花梨")]即銀杏、黃花梨都按照GB碼810400森林導入,通過屬性值type區(qū)別類型。國標等于目標數(shù)據(jù)的情況可直接轉換。
圖6 多對一案例Fig.6 Many-for-one cases
我們將描述地理現(xiàn)象的各部分信息稱為構成語義的語法。語法包括描述特征的方式與表達信息的模型,描述特征的方式包括編碼、屬性、幾何類型等。在描述地理數(shù)據(jù)方式上不同格式數(shù)據(jù)基本采用點、線、面與屬性的組合模型。由描述方式異同可以總結出語法問題有:①編碼對應問題;②屬性的對應問題;③屬性值的對應問題。
編碼作為地理數(shù)據(jù)的唯一標識符,可以唯一確定國標中要素,通過編碼對應可以實現(xiàn)上述中語義的對應[13]。轉換集生成后每一實體模板組對應轉換集層屬性都會形成屬性對應表,其結構見表2。
表2 屬性對應
表2中外部字段名為國標中數(shù)據(jù)的屬性值,當前模板字段名為目標數(shù)據(jù)屬性,通過上表實現(xiàn)不同格式數(shù)據(jù)的屬性與屬性值對接。
當2種數(shù)據(jù)要素的語義相同時,同樣存在表達模型的差異。例如國標數(shù)據(jù)中等級道路的幾何類型模型是路面+中線+邊線。目標數(shù)據(jù)中可能表達模型為中線+邊線,所以面數(shù)據(jù)在這里不使用轉換集轉換。
由于地理數(shù)據(jù)庫涉及的數(shù)據(jù)量大,在使用轉換集模型對原有數(shù)據(jù)改化時需考慮研究中提到的語義對應、屬性對應、表達方式對應等很多問題。每一次數(shù)據(jù)改化開始前涉及到大量的文檔制作與原始數(shù)據(jù)的檢查修改。因此為提高效率提出了技術路線的幾個基本要點:
(1) 工作內(nèi)容上劃分板塊,根據(jù)區(qū)塊需求,自由組合,不影響整體工作不另起爐灶。
(2) 技術流程上,劃分環(huán)節(jié)性,各自負責,責任明確,分工明確,質量明確。便于各個單位責、權、利的明晰。
(3) 技術方法上,廣泛采用成熟的最先進的技術,提升數(shù)據(jù)轉化的自動化水平,以確保質量、時間及控制投入的人力物力。技術路線如圖7所示。
模塊1轉換改化技術控制是改化整體工作的一個技術重點,是質量控制的主要內(nèi)容,大致分為2項內(nèi)容。轉換參數(shù)確定:包括了要素轉換,屬性轉換,取值轉換的確立與制作模板。改化參數(shù)的確立:對轉換后的目標基礎數(shù)據(jù)到目標成果數(shù)據(jù)之間還有差距,涉及到大量專題項處理,如注記指針一對多的要素判定處理等。
圖7 技術路線Fig.7 Technical route
模塊2國標數(shù)據(jù)提供模塊國標基礎地理信息的產(chǎn)品生產(chǎn)年代規(guī)格在同一地區(qū)是存在差異的,在地圖制圖時常含有部分更新的要求。該模塊最終的數(shù)據(jù)是遵從一個標準的符合地方相關質量要求,資料完整(合格元數(shù)據(jù))的地圖數(shù)據(jù)。
模塊3轉換改化模塊是核心工作,它只接受按照技術設計要求的合格數(shù)據(jù)。經(jīng)過轉換、改化編制形成質量合格的目標數(shù)據(jù)。
通過MapStore平臺詳細闡述了基于轉換集模板實現(xiàn)現(xiàn)有數(shù)據(jù)再利用的原理,并制定了細致的改化原則與技術方案,將該模型與研究制定的原則方案成功運用于云南省數(shù)據(jù)改化,事實表明轉換集模型與研究制定原則方案顯著提高了地理數(shù)據(jù)庫數(shù)據(jù)資源的利用率,制圖速度明顯加快,制圖效果良好,對全國制圖領域的發(fā)展有重要的推動意義。