趙軍喜,華一新,張亞軍
(信息工程大學地理空間信息學院,河南鄭州450052)
我國邊界形勢十分復雜,陸地邊界總長達22 000多千米,與14個國家接壤。邊界工作是我國外交工作中一項長期而重要的任務,它直接影響到我國的主權和領土完整、民族團結以及邊境地區(qū)的經(jīng)濟建設、社會安定和人民生活[1-2]。新中國成立以來,在外交部領導下,國家測繪地理信息局陸續(xù)組織開展了邊界測圖,完成了大部分邊界帶狀1∶5萬地圖工作,形成了具有系統(tǒng)性的數(shù)據(jù)生產(chǎn)技術規(guī)范、邊界航空攝影作業(yè)技術規(guī)范、邊界信息數(shù)據(jù)處理規(guī)范、邊界測圖和制圖技術規(guī)范等一系列技術標準和規(guī)范。
在科技部基礎性工作項目的支持下,建立了全國陸地邊界地理框架數(shù)據(jù)庫,包括全國1∶100萬標準國界劃法數(shù)據(jù),全國陸地邊界地區(qū)1∶25萬、1∶5萬地理底圖DRG數(shù)據(jù),中朝、中緬、中越邊界議定書及附圖數(shù)據(jù),邊界地區(qū)1∶50萬土地利用數(shù)據(jù)等。同時,以邊界地理空間數(shù)據(jù)庫為基礎,建立了邊界劃界、勘界、聯(lián)檢和國界管理信息系統(tǒng),實現(xiàn)了我國陸地邊界海量數(shù)據(jù)的集成化管理。但這些系統(tǒng)只在某些特定工作中發(fā)揮了作用。由于缺乏統(tǒng)一的技術標準和規(guī)劃設計,不同系統(tǒng)間的數(shù)據(jù)資源難以共享,不能滿足對邊界信息管理和應用的需要。
“數(shù)字周邊”是要實現(xiàn)周邊地緣環(huán)境中各種信息的快速獲取和綜合管理,實現(xiàn)不同部門間邊界信息集成與信息共享,實現(xiàn)基于邊界信息應用的綜合分析和輔助決策,為周邊地緣環(huán)境信息的有效應用提供數(shù)據(jù)資源和信息系統(tǒng)的保障?!皵?shù)字周邊”的一個建設目標是要按照統(tǒng)一的技術規(guī)范和標準,采集和整合各種邊界信息資源,設計建立數(shù)字周邊數(shù)據(jù)庫,實現(xiàn)各種邊界資料的信息化管理與數(shù)據(jù)共享。為了實現(xiàn)這個目標,所需要的一項技術手段是地理空間元數(shù)據(jù)技術。元數(shù)據(jù)技術是數(shù)字地球的六大支撐技術之一,是數(shù)字地球建設能否走向成功和實用的關鍵[3]。同樣,地理空間元數(shù)據(jù)技術,也是“數(shù)字周邊”建設能否最終成功的關鍵。
依據(jù)“數(shù)字周邊”中地理空間數(shù)據(jù)的內容及其特點,設計地理空間元數(shù)據(jù)體系框架時遵循的原則包括:
1)體系框架要與“數(shù)字周邊”地理空間數(shù)據(jù)的體系框架總體上取得一致;
2)根據(jù)地理空間數(shù)據(jù)按界段進行組織的方式,地理空間元數(shù)據(jù)也按界段進行組織;
3)根據(jù)不同用戶使用元數(shù)據(jù)的目的,可以將地理空間元數(shù)據(jù)的體系分成不同的應用層次;
4)地理空間元數(shù)據(jù)體系框架將描述的重點放在數(shù)據(jù)集,即邊界圖幅數(shù)據(jù);
5)考慮應用的需求,元數(shù)據(jù)的具體內容重點是對“數(shù)據(jù)質量信息”、“數(shù)據(jù)表示信息”、“內容信息”等幾個元數(shù)據(jù)子集的內容選取和擴充;
6)各個地理空間元數(shù)據(jù)子集的內容選擇以滿足應用為前提,力求簡單,不要過于復雜;
7)在制定地理空間元數(shù)據(jù)標準的數(shù)據(jù)內容時,要遵循和參考現(xiàn)有的國家標準和領域行業(yè)標準,并針對“數(shù)字周邊”建設的特點進行修改和擴充。
按照以上設計原則,“數(shù)字周邊”地理空間元數(shù)據(jù)體系框架設計如圖1所示。體系框架是對“數(shù)字周邊”所有地理空間元數(shù)據(jù)的分類和分層的描述,各種類、各層次的元數(shù)據(jù)可以在框架下構成一個有機的整體[4]。
圖1 地理空間元數(shù)據(jù)體系框架
地理空間元數(shù)據(jù)體系框架的特點如下:
1)根據(jù)地理空間元數(shù)據(jù)描述對象的差異,分為三大類別:
a.數(shù)據(jù)庫元數(shù)據(jù):又可以稱為“數(shù)字周邊”全局元數(shù)據(jù),是對“數(shù)字周邊”地理空間數(shù)據(jù)庫的描述信息,包括數(shù)據(jù)庫的名稱、標識、內容描述、訪問方法、更新日期等。
b.數(shù)據(jù)集系列元數(shù)據(jù):又可以稱為界段元數(shù)據(jù),是對某條界段的描述信息,包括界段的名稱、標識、空間范圍、包含的圖幅個數(shù)等。
c.數(shù)據(jù)集元數(shù)據(jù):又可以稱為圖幅元數(shù)據(jù),是對具體某個圖幅的描述信息,包括數(shù)據(jù)集的標識、質量、表示、參照系、內容等。
2)體系框架中的重點是數(shù)據(jù)集元數(shù)據(jù)(即圖幅元數(shù)據(jù)),它是“數(shù)字周邊”地理空間元數(shù)據(jù)描述的重點內容。
3)從應用層次上考慮,“數(shù)字周邊”地理空間元數(shù)據(jù)分成兩個層次:
a.核心元數(shù)據(jù)(即一級元數(shù)據(jù)):是標識一個數(shù)據(jù)集所需要的最少的元數(shù)據(jù)實體和元素,核心元數(shù)據(jù)不再細分子集。它是面向應用的元數(shù)據(jù),主要用于數(shù)據(jù)編目和數(shù)據(jù)發(fā)現(xiàn)服務。
b.完全元數(shù)據(jù)(即二級元數(shù)據(jù)):是建立完整的數(shù)據(jù)集文檔所需要的全部元數(shù)據(jù)實體和元素,通常又細分為若干子集。它是面向內容的元數(shù)據(jù),主要用于數(shù)據(jù)的標識、評價、摘錄、使用和管理。
4)核心元數(shù)據(jù)是在完全元數(shù)據(jù)的基礎上,通過對完全元數(shù)據(jù)選取和裁剪而生成的。
5)完全元數(shù)據(jù)是在相應地理空間數(shù)據(jù)產(chǎn)品(如數(shù)字矢量地圖)的基礎上生成的。
6)與“數(shù)字周邊”地理空間數(shù)據(jù)的形式對應,元數(shù)據(jù)的形式包括:數(shù)字矢量地圖元數(shù)據(jù)、數(shù)字柵格地圖元數(shù)據(jù)、數(shù)字影像地圖元數(shù)據(jù)和數(shù)字高程模型元數(shù)據(jù)。這4種元數(shù)據(jù)形式的數(shù)據(jù)內容大體一致,包括標識信息、數(shù)據(jù)質量信息、空間數(shù)據(jù)表示信息、參照系統(tǒng)信息、發(fā)行信息等元數(shù)據(jù)子集。而且,對于同一空間范圍、同一比例尺的不同數(shù)據(jù)形式的圖幅而言,其元數(shù)據(jù)標準的數(shù)據(jù)內容有很多是相同的(例如空間范圍、空間坐標系、生產(chǎn)單位等)。
7)數(shù)字矢量地圖元數(shù)據(jù)、數(shù)字柵格地圖元數(shù)據(jù)、數(shù)字影像地圖元數(shù)據(jù)和數(shù)字高程模型元數(shù)據(jù),是數(shù)據(jù)集元數(shù)據(jù)(即圖幅元數(shù)據(jù))的主要內容形式。
8)數(shù)據(jù)集系列元數(shù)據(jù)(即界段元數(shù)據(jù)),是在數(shù)據(jù)集元數(shù)據(jù)的基礎上,通過選取、融合得到的,可以進一步細分成核心元數(shù)據(jù)和完全元數(shù)據(jù)。
9)數(shù)據(jù)庫元數(shù)據(jù)(即全局元數(shù)據(jù)),是在各界段元數(shù)據(jù)的基礎上,通過選取、融合得到的,也可以進一步細分成核心元數(shù)據(jù)和完全元數(shù)據(jù)。
元數(shù)據(jù)按層狀結構進行組織,分為3層:元數(shù)據(jù)子集、元數(shù)據(jù)實體和元數(shù)據(jù)元素[5](如圖2所示)。元數(shù)據(jù)元素是元數(shù)據(jù)的最基本單元,是邏輯上不可再分割的數(shù)據(jù)項;元數(shù)據(jù)實體是同類元數(shù)據(jù)元素的集合;元數(shù)據(jù)子集是相互關聯(lián)的元數(shù)據(jù)實體和元素的集合。元數(shù)據(jù)實體可以有兩類(簡單實體和復合實體),簡單實體只包含元素;復合實體既包含復合實體和簡單實體,又包括元素。
圖2 元數(shù)據(jù)的組織結構
復合實體、簡單實體及構成這兩種實體的元素之間具有繼承關系。復合實體的例子如圖3所示,復合實體“數(shù)據(jù)集范圍”由地理范圍、時間范圍和高程范圍等3個實體組成[6]。用圖形表示時,元數(shù)據(jù)元素為一個帶陰影的方框,框內填寫元素的名稱;實體及復合實體則表示為圍繞數(shù)據(jù)元素和(或)其他實體的方框。其中,“地理范圍”又是復合實體,它由4個元素和1個“地理區(qū)域”實體組成?!暗乩韰^(qū)域”實體又由兩個元素組成;“時間范圍”實體由3個元素組成;“高程范圍”實體則由兩個元素組成。
圖3 元數(shù)據(jù)元素、實體和復合實體
完全元數(shù)據(jù)的數(shù)據(jù)內容,可以采用UML圖和數(shù)據(jù)字典兩種方式進行描述。UML圖通過圖形方式準確地表達元數(shù)據(jù)元素、元數(shù)據(jù)實體和元數(shù)據(jù)子集之間的關系,便于將元數(shù)據(jù)內容轉換為XML編碼形式,并且具有語義嚴謹、無歧義的特點。完全元數(shù)據(jù)的數(shù)據(jù)內容根據(jù)其所描述方面的不同,將眾多元數(shù)據(jù)實體、元素、代碼表放置到不同的元數(shù)據(jù)子集中,以便于理解和管理。圖4所示為元數(shù)據(jù)子集框架,包括標識信息、數(shù)據(jù)質量信息、數(shù)據(jù)表示信息、參照系信息、內容信息、分發(fā)信息和元數(shù)據(jù)參考信息7個元數(shù)據(jù)主要子集;還包括引用信息和聯(lián)系信息兩個可重復使用的次要子集。每個子集(UML包)由若干個實體(UML類)和元素(UML屬性)構成??芍貜褪褂脤嶓w(引用信息實體、聯(lián)系信息實體)由其他子集調用,不單獨使用。
圖4 元數(shù)據(jù)子集的框架
由于數(shù)據(jù)集元數(shù)據(jù)的完全元數(shù)據(jù)內容復雜、元數(shù)據(jù)實體和元素眾多,實際應用(尤其是數(shù)據(jù)編目和數(shù)據(jù)發(fā)現(xiàn)應用)中通常僅使用它的一個子集,來回答諸如“特定專題的數(shù)據(jù)集是否存在(what)”、“是否覆蓋特定的地區(qū)(where)”、“數(shù)據(jù)集特定的日期或時段(when)”以及“了解更多情況或定購數(shù)據(jù)集的聯(lián)系方法(who)”等基本的問題[7]。對于這種標識一個數(shù)據(jù)集,特別是用于數(shù)據(jù)編目和發(fā)現(xiàn)所需要的最少量元素稱為“核心元數(shù)據(jù)”。“數(shù)字周邊”地理空間數(shù)據(jù)集元數(shù)據(jù)中核心元數(shù)據(jù)如表1所示。
“數(shù)字周邊”的地理空間元數(shù)據(jù),是針對具體工程項目和應用系統(tǒng)提出的“領域專用元數(shù)據(jù)”。為了確定它的各級元數(shù)據(jù)的數(shù)據(jù)內容,首先要確定地理空間元數(shù)據(jù)體系框架。本文設計了地理空間元數(shù)據(jù)的體系框架,重點對數(shù)據(jù)集元數(shù)據(jù)的數(shù)據(jù)內容進行了研究,確定了數(shù)據(jù)集元數(shù)據(jù)的組織結構,設計了完全元數(shù)據(jù)的子集框架,基于實際應用提出了核心元數(shù)據(jù)的數(shù)據(jù)元素。
表1 數(shù)據(jù)集核心元數(shù)據(jù)
[1]劉合輝,張毅,曹一冰.輔助邊界談判劃界子系統(tǒng)設計及關鍵技術[J].測繪與空間地理信息,2011,34(2):6-9.
[2]劉合輝,張毅,曹一冰.邊界談判劃界決策支持系統(tǒng)的設計與應用[J].地理空間信息,2011,9(2):49-51.
[3]GORE A.The Digital Earth:Understanding Our Planet in the 21st Century[R].Los Angeles:[s.n.],1998.
[4]趙軍喜.面向數(shù)字邊界的地理空間元數(shù)據(jù)研究[D].鄭州:信息工程大學地理空間信息學院,2008.
[5]劉若梅,蔣景曈,賈云鵬.中國可持續(xù)發(fā)展信息共享元數(shù)據(jù)標準實施,中國地理信息元數(shù)據(jù)標準研究[M].北京:科學出版社,1999:36-46.
[6]蔣景曈,劉若梅,賈云鵬.國際元數(shù)據(jù)標準的發(fā)展和現(xiàn)狀研究,中國地理信息元數(shù)據(jù)標準研究[M].北京:科學出版社,1999:1-15.
[7]畢建濤.面向網(wǎng)絡共享的地理信息服務研究[D].北京:中國科學院地理科學與資源研究所,2004.