宋鴻運,韓 茜
(1.國家基礎地理信息中心,北京 100048;2.國信司南(北京)地理信息技術有限公司,北京 100048)
隨著國際對中國海域的關注度提升,中國東海、南海及周邊國家在國際上的地位愈顯重要,尤其是各方熱議的釣魚島問題以及東南亞地區(qū)的海域爭議已成為主流問題。對《中國東海、南海及周邊歷史地圖資料整編》項目搜集到的各種歷史地圖及其他資料進行分析,并對其進行分類,按照全面性、準確性、科學性的原則獲取原始數據與元數據,對地圖資料進行掃描和圖片化處理,制定規(guī)范的數據采集分類準則與命名規(guī)則,為數據管理奠定基礎,并探討建立中國東海、南海及周邊國家歷史地圖資料數據庫,搭建數據庫管理系統(tǒng)與公眾服務系統(tǒng),如圖1所示,實現互聯(lián)網同步展現,最終實現地圖等基礎數據的對外有效利用,這些工作都能作為后續(xù)相關延伸課題研究的基礎保障。
圖1 服務系統(tǒng)界面圖Fig.1 Interface of the service system
根據專項歷史地圖、影像及其他資料數據的特征、分類及內容等關聯(lián)關系,結合數據管理與服務的業(yè)務流程設計數據組織模式,完成數據庫概念設計、邏輯設計、物理設計等,特別指出數據庫的邏輯設計是關鍵環(huán)節(jié),鑒于數據的管理和檢索利用的靈活度與展現的全面性,數據庫的設計要求能實現不同數據的主題詞、關鍵字、專題等內容的數據聯(lián)動;同時預留一定的接口,便于后續(xù)數據的持續(xù)管理。
數據庫管理系統(tǒng)主要用于數據的可持續(xù)、層次化管理,實現數據的錄入、元數據采集、數據檢索與下載等功能。專項歷史地圖數據庫公眾服務系統(tǒng)主要面向社會大眾,以地理信息系統(tǒng)為基礎,實現時空一體化展現歷史地圖和其他資料的空間分布情況,結合國內外成熟的圖書館檢索功能,實現歷史地圖資料數據的靈活多樣檢索功能,主要包括:時間序列的查詢,將數據從公元1499年之前分為一段,以后每百年為一段,形成完整的自古至今的各類資料,可以更好地發(fā)現對特定地區(qū)各歷史階段不同國家采取的表達方式,為各種需求提供幫助。另外,要考慮為后續(xù)的建設預留數據和服務的擴展接口,滿足社會公眾對數據的應用需求。
數據類別劃分清晰,定義明確,字段說明詳實,術語的采用、定義應符合國家或行業(yè)相關標準,滿足數據庫管理系統(tǒng)對各類數據的應用要求,同時預留數據接口,兼顧后續(xù)數據庫擴展建設需求。本項目所涉及的資料種類包括:單幅地圖掃描數據、地圖集掃描數據、島礁影像數據、文章類數據、專著類數據、視頻類數據,在數據的種類方面可以多樣化。
數據結構設計合理,能最大限度地減少數據冗余,保持數據的完整性、一致性。在發(fā)布數據格式方面明確為:單幅地圖為JPG格式,地圖集為PDF,影像數據為TIF,文章專著為PDF,視頻為MP4。
要防止對數據的非法使用,必須在數據庫設計時考慮用戶的權限管理和約束信息,并記錄關鍵數據操作的全過程,防止對數據進行有意無意的破壞,并能對造成的破壞進行恢復。
允許多用戶同時存取數據,數據庫設計應充分考慮并發(fā)操作的控制機制,保證存取數據的完整性和一致性。
綜合上述,可以看出,本系統(tǒng)的開發(fā)主要涉及的技術包括:數據空間化技術、漸進傳輸與數據壓縮技術、終端融合顯示技術、空間坐標提取技術、智能緩存與預取技術、數據不切片發(fā)布技術、數據多尺度表達問題研究、空間定位聚合技術、多源數據綜合管理技術、多語言編程技術、數據校驗技術 、多源數據分析、元數據標準、數據接入標準。框架的搭建如圖2所示。
圖2 系統(tǒng)技術流程圖Fig.2 System technical flow chart
專項歷史地圖數據庫及公眾服務系統(tǒng)建設工作開展主要圍繞需求調研分析、數據采集處理、數據庫建設、數據管理與服務4個環(huán)節(jié)展開。具體技術路線如圖3所示。
圖3 系統(tǒng)建設流程圖Fig.3 System construction flow chart
系統(tǒng)基于SOA理念設計系統(tǒng)的架構,依據信息資源規(guī)劃理論進行數據整合、數據入庫、數據管理、數據分析、業(yè)務梳理和模型建立,遵循統(tǒng)一的標準規(guī)范,實現系統(tǒng)的互聯(lián)互通和資源共享。
1)采用SOA總體架構
在總體框架層面,系統(tǒng)將統(tǒng)一標準、統(tǒng)籌規(guī)劃、頂層設計、分步實施,采用面向服務的架構(SOA)技術,實現面向服務、資源共享、統(tǒng)一注冊、分級授權的服務組織模式與運行管理機制。在服務層采用WEBSERVICE進行數據服務,實現系統(tǒng)松耦合集成,實現面向各類業(yè)務需求的應用編排和組裝。
2)技術選型
系統(tǒng)采用B/S模式開發(fā),開發(fā)語言:前臺采用JS+Html;后臺采用JAVA,地圖控件采用OpenLayer;數據庫采用Mysql。
3)采用GIS一張圖應用
基于GIS平臺進行展示和管理,充分發(fā)揮GIS的地理定位能力、采集、管理、分析和輸出多種地理空間信息展現以及各種空間分析的能力,在一張地圖上統(tǒng)一展示系統(tǒng)所管理的歷史地圖分布點位,形成歷史地圖分布圖,提供人機交互式的更直觀的空間決策輔助分析。
4)采用集群技術
在服務器、存儲等硬件設備方面,采用集群技術,其中存儲層面,采用存儲區(qū)域網絡(Storage Area Network,簡稱SAN)技術;服務器層面,采用集群技術,實現存儲設備、服務器設備的共享利用,同時又保障了數據庫服務器、應用服務器的運行安全,既節(jié)約了硬件投資,又最大限度地發(fā)揮了大容量存儲設備和高端服務器的效能。
為滿足總體需求以及業(yè)務設計的內容,數據庫建設與系統(tǒng)平臺總體架構采用面向服務的技術架構(SOA),總體架構采用六橫三豎結構,由下到上分為設備層、數據層、服務層、應用層、表示層以及用戶層,總體技術框架如圖4所示。
圖4 總體技術框架圖Fig.4 Technical framework diagram
設備層是基礎支撐硬件環(huán)境,包括服務器、存儲設備及網絡等。
數據層是基本業(yè)務數據模型的建設,建立各類數據模型以及模型基本結構,滿足業(yè)務封裝、基礎數據處理整合以及數據庫建設等。
服務層是整個平臺的重要內容,主要為應用層提供組件化、模塊化的功能支撐,包括基礎地理數據服務接口、地圖服務接口等相關公共服務接口。本平臺的總體技術架構采用SOA技術,服務是整個平臺基礎單元。
應用層主要由支撐應用軟件開發(fā)和運行的系統(tǒng)軟件構成,由專項歷史地圖資料數據庫建設系統(tǒng)前臺和建設系統(tǒng)后臺管理構成。前臺主要實現海域地圖一張圖展示,查詢檢索地圖分布與屬性的信息,實現根據條件查詢檢索數據,同時為后續(xù)的系統(tǒng)建設留有接口,同時可以導出數據,為后續(xù)科研提供數據支撐。后臺管理主要實現數據庫各類資料數據體和元數據的批量導入與運維管理。
表示層為數據庫系統(tǒng)及后臺管理系統(tǒng)所提供的各類業(yè)務功能,方便各類用戶在實際工作中使用。
用戶層即與本平臺相關的人員或組織,管理人員與數據錄入人員是本平臺的核心人員,管理人員主要是信息中心管理人員,負責數據庫與系統(tǒng)的管理與源數據采集,數據采集人員主要完成地圖元數據的采集導入。行政、科研人員是系統(tǒng)主要的服務對象,社會公眾是系統(tǒng)部分數據或目錄對外開放的使用人員。用戶權限根據用戶的角色進行劃分,不同的用戶具有不同的使用權限。
恰當的數據組織、合理的數據庫結構可以提高系統(tǒng)的運行效率,方便系統(tǒng)的使用,也是整個系統(tǒng)建設的關鍵。在數據庫設計過程中,必須嚴格遵循相關標準和原則。
1)規(guī)范、開放、易擴展原則
數據類別界定清晰,定義明確(無二義性),字段說明翔實,術語的采用、定義符合國家、部、省和行業(yè)有關標準,保證信息共享,滿足數據應用部門及其相關系統(tǒng)對數據的應用要求;同時兼顧后續(xù)數據庫建設需求,具備可擴展性。
2)結構合理原則
數據結構設計合理,能最大限度地減少數據冗余,保持數據的完整性、一致性。
3)并發(fā)控制原則
數據庫是一個共享資源,可以有多個用戶使用,應該允許多用戶程序并行存取數據,數據庫設計應充分考慮并發(fā)操作的控制機制,保證存取數據的完整性和一致性。
4)數據安全原則
要防止對數據的非法使用,必須在數據庫設計時考慮用戶的權限管理和約束信息,并記錄關鍵數據操作的全過程,防止對數據進行有意無意的破壞,并能對造成的破壞進行恢復。
數據庫邏輯模型是在對用戶的需求詳細調查之后,分析用戶的功能需求,從概念模型出發(fā),建立邏輯模型,如圖5所示。
圖5 地圖數據的邏輯模型Fig.5 The logical Model of Map Data
數據庫最終是要存儲在物理設備上。為給定的邏輯數據模型選取一個最適合應用環(huán)境的物理結構,建立一個具有較好性能的物理數據庫。建立數據庫主要解決數據庫在物理設備上的存儲結構和存取方法,它完全依賴于給定的硬件和數據庫平臺。
確定數據庫的物理結構包含以下內容:確定數據的存儲結構、設計數據的存取路徑、確定數據的存放位置。本項目是按照數據大類下再按時間和地域分級組織的模式,進行數據的物理存放。
1)建立索引
對于查詢中需要作為查詢條件的字段,如表示地區(qū)、時間、關鍵詞等建立索引。對于復合索引,索引字段順序比較關鍵,把查詢頻率比較高的字段排在索引組合的最前面,如表示地區(qū)和關鍵詞,在本項目中索引主要是在邏輯模型中的相互關聯(lián)來建立多個索引表。
2)建立視圖
視圖是虛擬的數據庫表,在使用時要遵循以下原則:
①從一個或多個庫表中查詢部分數據項。
②為簡化查詢,將復雜的檢索或子查詢通過視圖實現。
③視圖中如果嵌套使用視圖,級數不得超過3級。
④除特殊需要,避免類似Select*from[TableName]而沒有檢索條件的視圖。
⑤視圖中盡量避免出現數據排序的SQL語句。
可接受的停工時間、恢復時間、備份間隔和可接受的數據損失是影響備份方案的關鍵因素。專項歷史地圖資料數據庫具有以下特點:
①數據量中等。
②更新頻率中等、數據增長緩慢。
因此,可以利用數據庫管理系統(tǒng)自身的管理工具(輸出/輸入)實現數據的邏輯備份與恢復。備份策略包括:
①mysql安裝后立即對所有的物理文件和初始化文件進行備份,讓數據庫管理員有完整的數據能夠進行所有其他類型的恢復。
②重要更新操作前,對數據庫進行邏輯備份。
③重要更新操作完成后,對專項歷史地圖資料數據庫完全輸出,作為一個正式數據版本保存。
④數據庫運行過程中進行常規(guī)備份。
專項歷史地圖資料數據庫管理系統(tǒng)主要實現組成數據庫的各種數據的整合、審核、入庫及數據的管理與發(fā)布。為數據庫的建設提供入口和工具,并進行數據的審核發(fā)布,是專項歷史地圖公眾服務系統(tǒng)的數據支撐,界面如圖6所示。
圖6 數據庫后臺管理界面圖Fig.6 Interface of the database management backstage
專項歷史地圖資料數據庫管理系統(tǒng)主要用戶分為:數據搜集人員、數據審核發(fā)布人員和系統(tǒng)運維管理人員。數據搜集人員主要完成歷史地圖資料數據及其元數據的搜集與批量導入;數據審核發(fā)布人員主要完成入庫數據的數據審核、入庫和發(fā)布,由于系統(tǒng)所發(fā)布的內容存在敏感信息,在數據正式發(fā)布之前,必須要進行重點信息的瀏覽核實后才能發(fā)布,因此雖然系統(tǒng)是在BS結構下開發(fā),也設置了圖形瀏覽的功能;系統(tǒng)運維管理人員主要負責系統(tǒng)用戶信息管理與權限分配、日志信息的管理等。
包括數據搜集導入、數據編輯、數據審核、成果入庫、數據成果管理及數據發(fā)布。數據搜集的方式包括紙質地圖掃描后人工錄入和網絡爬蟲自動獲取。
1)數據搜集導入。數據搜集的方式包括紙質地圖掃描后人工錄入和網絡爬蟲自動獲取。對于人工錄入的方式,系統(tǒng)提供數據導入功能,支持多種數據格式,并實現批量導入。
網絡爬蟲自動獲取實現以任務方式進行數據抓取,數據搜集人員設定搜索關鍵詞、時間、數據源等,以完成所需數據的網絡搜索和自動下載。
2)數據編輯。對于人工錄入的數據,提供元數據編輯功能。元數據編輯實現導入數據的文件名稱、類別、采集時間、來源、地理位置等元數據信息的填寫和編輯。元數據信息分為必填項和選填項,對于必填項信息完整的數據,系統(tǒng)提供數據狀態(tài)標識。此外,元數據編輯保存時,需進行數據名稱查重,防止冗余數據錄入。
對于網絡爬蟲自動獲取的數據,系統(tǒng)提供數據查詢、刪除和元數據編輯功能。數據搜集人員對自動獲取的數據進行檢查,對重復抓取或抓取錯誤的數據進行刪除,對元數據不完整的數據進行元數據編輯。
元數據編輯功能與人工錄入的元數據編輯相同。編輯保存的數據方可提交。
3)數據審核入庫。數據搜集人員提交的數據由數據審核人員進行審核,審核通過后的數據自動入庫。系統(tǒng)提供數據的分類查詢、數據查看和批量審核功能,對數據正確、元數據完整的數據進行審核入庫;對數據錯誤或元數據缺失的數據返回給數據搜集人員進行編輯修改。
4)數據發(fā)布。數據入庫后即形成數據成果,數據審核發(fā)布人員需根據實際情況決定對外發(fā)布的數據范圍。系統(tǒng)提供數據批量發(fā)布與撤回功能,實現數據的發(fā)布管理。
5)組織目錄管理。系統(tǒng)提供數據組織目錄的增加、修改、刪除功能,實現對分類組織目錄的管理。
6)系統(tǒng)維護。包括用戶管理、權限管理和日志管理。
專項歷史地圖資料公眾服務系統(tǒng)是面向社會公眾的歷史地圖數據資源網站。為社會公眾提供專項歷史地圖資料的數據展示和資源下載。
地圖視圖模式下采用一張圖方式展示。根據地圖數據元數據中的地理位置信息,對地圖數據進行空間定位、并根據地圖分類信息進行聚合。
地圖視圖模式下,提供常見地圖功能,包括放大、縮小、漫游。以圖文列表形式進行數據組織,界面圖如圖7所示。每條數據包括地圖縮略圖及其文字簡介,點擊可查看數據詳情,同時提供關鍵字查詢和類別篩選功能。詳情頁面包括地圖數據、元數據信息、分類列表信息及其關聯(lián)數據信息。
圖7 地圖查詢界面圖Fig.7 Interface of the map query
按照地圖的類別、時間、關鍵詞、元數據內容組合(專題、日期、地點、作者、單位)等進行簡單查詢和高級查詢,檢索的信息可以以地圖視圖展示,也可以以時間、字母等順序排列的列表形式展示。以地圖展示能實現檢索結果的空間定位功能。
1)資料類別查詢
根據資料的類別屬性,如屬于地圖、影像、文章、專著、視頻等大類;或屬于哪個區(qū)域專題,東海、南海等進行檢索;或者多條件組合查詢。查詢結果可以列表顯示,同時可在地圖上進行空間定位。
2)時間查詢
根據地圖所示年代輸入某一時段年段進行模糊檢索,顯示效果同上。
3)關鍵詞查詢
根據歷史地圖的名稱范圍如東亞、釣魚島、南海、曾母暗沙、九段線等進行模糊檢索,查詢結果可以列表形式展現,也可進行跳轉定位,同時在地圖視圖展示對應歷史地圖的空間位置分布圖,并能顯示地圖數量。
4)元數據組合查詢
依據元數據字段,如專題、日期、地點、作者、出版單位組合進行查詢,查詢結果的展現形式也包括兩種形式,列表與地圖視圖。
根據權限控制,實現部分數據的下載導出功能,作為科研等方面的基礎數據。
1)數據訪問權限控制
考慮專項歷史地圖數據的保密性與安全性,在系統(tǒng)建設過程中設置數據庫使用安全密碼,防止密碼泄露,定期修改密碼,禁止不具有訪問權限的用戶直接操作數據庫。
2)系統(tǒng)權限控制
系統(tǒng)建設中,為各級用戶分配權限,確保具有使用權限的用戶接觸特定范圍的數據和功能。
3)系統(tǒng)監(jiān)控
同時在系統(tǒng)功能中增加系統(tǒng)操作日志記錄功能,確保全部登陸系統(tǒng)的用戶都在可控范圍內,操作具有可溯性,系統(tǒng)或數據發(fā)生問題后方便查找問題原因。
4)系統(tǒng)恢復
管理系統(tǒng)版本,并作部署文件異地備份,在系統(tǒng)異常無法啟動的情況下,對損壞的系統(tǒng)按照安裝部署手冊重新進行部署。
1)網絡環(huán)境
系統(tǒng)部署在互聯(lián)網環(huán)境下。
2)硬件環(huán)境
①對服務器硬件設備的最低要求:處理器2.4GHz、內存4G、硬盤600G以上。
②推薦配置:處理器2.66GHz、內存6G、硬盤1T以上。
3)軟件環(huán)境
①操作系統(tǒng):應用服務器為Windows Server 2008或以上版本。
②數據庫系統(tǒng):MYSQL。
③Web服務器環(huán)境:IIS7.0及以上版本。
④GIS環(huán)境:天地圖。
通過建設中國東海、南海及周邊歷史地圖專項歷史地圖資料數據庫及公眾服務系統(tǒng),極大地提高了用戶對歷史地圖的查詢、檢索,也提高了資料的使用效率。在該系統(tǒng)的基礎上,可以繼續(xù)將分散在世界各處的不成體系的,但又與某個比較重要的專題相關的歷史地圖資料有機地作為一個整體管理起來。另外也可以將地理信息空間技術與歷史上留存下來的珍貴地圖和檔案資料進行完美的結合,讓后者能夠快速地提供服務并煥發(fā)新的生命力。在后續(xù)的工作中還可以不斷地補充不同專題的歷史地圖資料,促進提高歷史地圖資料的管理水平,拓寬歷史地圖的使用面。