王良清,王玉齋,李愛勤
(1. 浙江省測繪資料檔案館,浙江 杭州 310012; 2. 浙江省測繪科學技術(shù)研究院,浙江 杭州 310012)
?
測繪地理信息成果檔案異地災備系統(tǒng)的研建
王良清1,王玉齋1,李愛勤2
(1. 浙江省測繪資料檔案館,浙江 杭州 310012; 2. 浙江省測繪科學技術(shù)研究院,浙江 杭州 310012)
通過浙江省測繪地理信息成果檔案異地災備系統(tǒng)建設(shè)實踐,在分析測繪地理信息成果檔案備份現(xiàn)狀、需求和容災級別的基礎(chǔ)上,對異地災備系統(tǒng)架構(gòu)、容災技術(shù)方法進行研究,提出在政務外網(wǎng)、涉密內(nèi)網(wǎng)兩種網(wǎng)絡(luò)環(huán)境中測繪地理信息成果檔案容災系統(tǒng)的設(shè)計模型,重點介紹了在線數(shù)據(jù)分別通過NexentaStor、DataGuard和分布式文件系統(tǒng)(DFS)實現(xiàn)同步或異步復制的技術(shù),以及離線數(shù)據(jù)異地備份的維護情況。這種在線容災和離線備份相結(jié)合的綜合災備方案可供測繪地理信息同行借鑒。
測繪;檔案;異地備份;容災
測繪是測量和地圖制圖的總稱,其專業(yè)特點十分明顯,科技含量多,技術(shù)要求高,地理覆蓋面廣,成果要求精密準確、細致[1]。測繪成果檔案除具有一般科技檔案的屬性外還有其自身的特點,如地域性、保密性、數(shù)據(jù)量大等。在數(shù)字測繪檔案館建設(shè)實踐中,實現(xiàn)“檔案資源數(shù)字化、增量檔案電子化”[2],管理網(wǎng)絡(luò)化,應用社會化,服務智能化的工作中,如何保持測繪地理信息業(yè)務的持續(xù)性和成果檔案數(shù)據(jù)的完整性、安全性,是信息化測繪體系建設(shè)需要優(yōu)先考慮的一個重要問題。按照《信息安全技術(shù)信息系統(tǒng)災難恢復規(guī)范》(GB/T 20988—2007)[3],采取本地和遠程相結(jié)合的數(shù)據(jù)存儲、備份與恢復手段,建設(shè)異地備份容災系統(tǒng),能夠?qū)崿F(xiàn)測繪地理信息成果檔案及其數(shù)字檔案館系統(tǒng)的高可靠性和安全性,能夠抵御病毒攻擊、人為破壞或自然災害等突發(fā)事件所造成的損失[4]。
信息系統(tǒng)容災可分為數(shù)據(jù)級、應用級和業(yè)務級3個容災級別。從對用戶整個業(yè)務連續(xù)性的保障程度來看,它們的高可用級別也在逐漸提高[5-6]。
1.1 數(shù)據(jù)容災
當災難來臨而應用系統(tǒng)數(shù)據(jù)受損時,人們希望至少使用異地保存的數(shù)據(jù)進行恢復。這是數(shù)據(jù)級容災的基本目標,顯然它首先需在異地建立一套數(shù)據(jù)系統(tǒng),如磁盤陣列、磁帶庫甚至是單獨的離線介質(zhì)等,以對本地系統(tǒng)的關(guān)鍵數(shù)據(jù)進行日常備份[7]。
1.2 應用容災
在數(shù)據(jù)容災的基礎(chǔ)上,應用級容災進一步要求,災難發(fā)生后遠程應用系統(tǒng)可接管本地應用系統(tǒng)的業(yè)務繼續(xù)運行,因此要有一套包括各種服務器和應用軟件系統(tǒng)的、與本地數(shù)據(jù)系統(tǒng)相當?shù)?、異地的完整系統(tǒng)來保障[7]。
1.3 業(yè)務容災
業(yè)務容災除了做到數(shù)據(jù)災備和應用災備以外,還應該保障包括辦公地點、環(huán)境、電話等非IT系統(tǒng)的連續(xù)性[7]。限于實際需求和經(jīng)費投入,目前測繪災備系統(tǒng)難以達到業(yè)務容災的級別。
2.1 國內(nèi)測繪地理信息成果檔案災備現(xiàn)狀
早在2008年國家基礎(chǔ)地理信息中心將涉密成果通過專線初步實現(xiàn)了基于數(shù)據(jù)的在線異地數(shù)據(jù)存儲備份方案(溫備份)[4],現(xiàn)在為運行于公網(wǎng)的天地圖系統(tǒng)建設(shè)了基于應用切換的災備系統(tǒng)(克拉瑪依數(shù)據(jù)中心,熱備份)。國內(nèi)測繪地理信息省級部門一般僅做到離線數(shù)據(jù)的異地備份(冷備份),如陜西測繪地理信息局、內(nèi)蒙古自治區(qū)測繪地理信息局、江蘇測繪地理信息局、北京市測繪設(shè)計研究院[8]等,在線的異地災備中心由于投入大,門檻高,在陜西[9]、廣西[10]等一些數(shù)字省區(qū)地理空間框架建設(shè)中雖有所研究,但要真正實現(xiàn)仍有待探索和努力。我國測繪地理信息成果檔案的異地容災能力普遍不強,可是從測繪地理信息成果檔案的現(xiàn)狀分析來看,在線異地災備需求已迫在眉睫。
2.2 成果檔案數(shù)據(jù)更新快、服務要求高
隨著數(shù)字城市建設(shè)、應急測繪保障等應用的深入開展,用戶對測繪地理信息成果的現(xiàn)勢性與內(nèi)容豐富性提出了更高的要求[11],測繪地理信息成果更新周期日益趨短,版本越來越多,由靜態(tài)更新變?yōu)閯討B(tài)更新,直至準實時更新,如2016年開始,浙江省級基礎(chǔ)測繪數(shù)據(jù)庫成果更新周期為“361”,即重大地理要素變化后3個月內(nèi)更新,重要要素6個月更新,一般要素1年內(nèi)更新。截至2015年底浙江已率先完成了省、市、縣3級全部數(shù)字城市地理空間框架建設(shè)任務,由此建成的各類地理信息公共服務平臺如天地圖省市縣節(jié)點、地理空間數(shù)據(jù)交換平臺等在線地理信息服務系統(tǒng),對測繪成果檔案數(shù)據(jù)備份工作提出了很高的恢復時間要求(RTO和RPO)。這些在線地理信息服務系統(tǒng)普遍實現(xiàn)了開放的服務聚合與互操作。其公共地理空間框架數(shù)據(jù)是基于經(jīng)濟社會發(fā)展對在線地理信息服務的普遍需求整合而成的[9],主要包括地理實體數(shù)據(jù)、地名地址POI數(shù)據(jù)、電子地圖數(shù)據(jù)、影像數(shù)據(jù)、高程數(shù)據(jù)、三維景觀數(shù)據(jù),還有經(jīng)空間化、規(guī)范化整合的各部門共享交換的專題數(shù)據(jù)等(浙江省地理空間數(shù)據(jù)交換和共享平臺、天地圖·浙江運行維護實施方案(2016年修訂稿))。這些在線數(shù)據(jù)極大方便和促進了用戶獲取和應用。
2.3 成果檔案數(shù)據(jù)種類劃分
現(xiàn)階段數(shù)字化形式的測繪地理信息成果檔案一般包括大量的文本、矢量數(shù)據(jù)和海量的航空航天遙感影像數(shù)據(jù),以及基礎(chǔ)地理信息資料和測繪歷史檔案資料等[9],可大致分為離線數(shù)據(jù)和在線數(shù)據(jù)兩大類。離線數(shù)據(jù)指可單獨存在,并可通過離線介質(zhì)獨立向用戶提供使用的各類文本、矢量及柵格地理信息數(shù)據(jù)拷貝或硬拷貝;在線數(shù)據(jù)是指在各種地理信息系統(tǒng)(GIS)中運行,并與相應GIS一起提供在線服務的各種地理信息數(shù)據(jù)[9]。離線數(shù)據(jù)RTO要求較低(從數(shù)天到數(shù)小時),可通過異地離線備份系統(tǒng)進行災難恢復。在線類數(shù)據(jù)現(xiàn)勢性較強,使用方便,既集基礎(chǔ)地理信息數(shù)據(jù)采集、編輯、存儲、顯示和分析于一體,一般又融合了共享交換的各專業(yè)部門的專題數(shù)據(jù),RTO要求高,數(shù)小時甚至分鐘級。在線類數(shù)據(jù)的出現(xiàn),使得測繪地理信息成果應用范圍不斷擴大,并日益被公眾所接受。同時在線類測繪成果檔案作為測繪地理信息行業(yè)服務社會、服務民生的重要窗口,以“互聯(lián)網(wǎng)+”的服務模式出現(xiàn),實現(xiàn)了“分布式存儲、邏輯式集中、一站式服務”,完全不同于離線數(shù)據(jù)物理集中管理、硬拷貝分發(fā)的模式,標志著測繪地理信息成果檔案面向社會服務方式的轉(zhuǎn)變[9]。
3.1 異地備份站點選擇
為了確保備份數(shù)據(jù)的安全,異地備份站點一般選在地理特征不同、距離較遠的城市。具體站點的選擇方案需要有關(guān)專家依據(jù)城市的綜合因素進行必要的評估。異地存儲備份應用的要求越高、異地存儲備份距離越遠,實現(xiàn)異地存儲備份方案的成本一般也就越高[5]。綜合考慮地質(zhì)、交通、電力、網(wǎng)絡(luò)等條件,按異地備份站點要求,在某縣選址規(guī)劃建設(shè)了一幢建筑面積2000 m2的災備大樓。
3.2 多種備份方式并存
測繪地理信息成果檔案既有地理信息服務系統(tǒng)等在線數(shù)據(jù),又有數(shù)字測繪標準產(chǎn)品、已數(shù)字化的歷史測繪成果和資料等離線數(shù)據(jù),尤其是每年增長50 TB以上的海量影像數(shù)據(jù),還有紙質(zhì)實體檔案,因此相應的災備中心必然同時存在在線備份(包括熱備份和溫備份)、離線備份(即冷備份)和紙質(zhì)實體檔案備份。另外,還有涉密數(shù)據(jù)備份和非涉密數(shù)據(jù)備份之分。由于涉密數(shù)據(jù)量巨大(超過300 TB),并考慮目前涉密測繪成果網(wǎng)的恢復時間(RTO)要求不高,可達1—2 d,從性價比考慮,涉密數(shù)據(jù)采取異地離線備份即可。離線備份介質(zhì)以高性價比的散裝硬盤為主,LTO磁帶為輔,以實現(xiàn)異地異質(zhì)備份。
3.3 在線數(shù)據(jù)容災方法
針對不同的網(wǎng)絡(luò)環(huán)境,如公網(wǎng)和涉密網(wǎng),在線備份的方法可以不同。
涉密成果網(wǎng)主要數(shù)據(jù)為文件級數(shù)據(jù),可通過微軟公司域控制器的分布式文件系統(tǒng)(DFS)功能完成數(shù)據(jù)同步。分布式文件系統(tǒng)是一個網(wǎng)絡(luò)服務器組件,能容易地在網(wǎng)絡(luò)上查詢和管理數(shù)據(jù)。分布式文件系統(tǒng)是將分布于不同電腦上的文件組合為單一的名稱空間,并使得在網(wǎng)絡(luò)上建立一個單一的、層次化多重文件服務器和服務器共享的工作變?yōu)榉奖愕耐緩絒12]。由于域控制體系的存在,DFS可以十分方便地實現(xiàn)不同站點間的數(shù)據(jù)復制。涉密網(wǎng)災備系統(tǒng)拓撲如圖1所示。
圖1 涉密網(wǎng)災備系統(tǒng)拓撲
外網(wǎng)一般包括公網(wǎng)和政務外網(wǎng)等網(wǎng)絡(luò)環(huán)境。通過向當?shù)卣暾?,可將災備中心接入省政務外網(wǎng),以節(jié)約線路租金。
政務外網(wǎng)的文件數(shù)據(jù)可采用NexentaStor進行數(shù)據(jù)復制,空間數(shù)據(jù)庫采用Oracle的DataGuard進行同步。拓撲如圖2所示。
3.3.1 NexentaStor
NexentaStor是一套統(tǒng)一的存儲解決方案,運行于創(chuàng)新的ZFS文件系統(tǒng)之上,可提供企業(yè)級NAS和SAN性能,提供簡化設(shè)置、擴展、備份、復制及存檔等功能[13]。
NexentaStor將無限的完整或增量快照功能與無限的克隆結(jié)合在一起。NexentaStor具有自動CDP(Auto-CDP,自動連續(xù)數(shù)據(jù)保護),它提供了基于塊的復制,優(yōu)化恢復點目標(RPO)、恢復時間目標(RTO)和備份。自動CDP促進了遠程鏡像功能(同步)。自動同步(Auto-Sync)在兩個不同的NexentaStor存儲之間復制文件(異步)。它在目的端重新創(chuàng)建源快照(數(shù)據(jù)和元數(shù)據(jù))。自動層(Auto-Tier)為復制文件夾創(chuàng)建目錄。
圖2 政務外網(wǎng)災備系統(tǒng)拓撲
文件數(shù)據(jù)采用NexentaStor作為NAS服務器,為應用服務器提供數(shù)據(jù)服務,當本地數(shù)據(jù)更新后,通過NexentaStor的數(shù)據(jù)復制功能,數(shù)據(jù)可被自動復制到異地機房,實現(xiàn)數(shù)據(jù)的同步或異步復制。執(zhí)行流程如下:首先在源系統(tǒng)上創(chuàng)建快照,然后對比源和目的快照得出變更的數(shù)據(jù)塊,最后復制增量更新到目的端。NexentaStor的Auto-Sync功能模塊能復制元數(shù)據(jù),支持反向復制(即從異地備份機房到本地的數(shù)據(jù)恢復)和帶寬限制。復制數(shù)據(jù)流支持壓縮和消重[13]。
3.3.2 Oracle DataGuard
DataGuard是Oracle公司推出的一種高可用性數(shù)據(jù)庫方案,它在主節(jié)點(Primary Database)與備用節(jié)點(Standby Database)間通過日志同步機制來保證數(shù)據(jù)的同步,可以實現(xiàn)數(shù)據(jù)庫快速切換與災難性恢復[14]。
Oracle數(shù)據(jù)庫通過Oracle DataGuard實現(xiàn)政務網(wǎng)數(shù)據(jù)庫本地節(jié)點(RAC Primary)到異地節(jié)點(Single Standby)的數(shù)據(jù)同步和恢復。如果因為異常原因?qū)е翽rimary Database不可用,可以把Standby Database強制切換為Primary Database繼續(xù)對外服務[14]。
3.3.3 容災系統(tǒng)性能
天地圖省市節(jié)點、地理空間數(shù)據(jù)交換和共享平臺等在線服務系統(tǒng)的總數(shù)據(jù)量可達幾十TB,大約每周批量數(shù)據(jù)更新一次,但平時更新一個行業(yè)專題圖層數(shù)據(jù)約2 GB(目前數(shù)十個省級部門之間已做到地理信息數(shù)據(jù)交換共享),矢量及標注相關(guān)的底圖瓦片數(shù)據(jù)全省范圍更新,約40 GB。政務外網(wǎng)100 Mb/s(即12.5 MB/s)帶寬在工作日實際測試異步復制速率為3.6 MB/s,40 GB數(shù)據(jù)需約3 h 10 min完成備份。為了不影響一般用戶訪問系統(tǒng),較大數(shù)據(jù)異地復制在8 h之外如晚上進行,但次數(shù)少,約一季度一次。Oracle數(shù)據(jù)庫存儲以矢量數(shù)據(jù)和元數(shù)據(jù)為主,更新數(shù)據(jù)量較小,采用DataGuard,也可以滿足表1傳輸時間的要求。
表1 不同類型數(shù)據(jù)的異地傳輸時間
理論上,Auto-CDP快照數(shù)據(jù)備份的RPO值幾乎接近0[13]。用戶可以訪問快照來恢復數(shù)據(jù)和單一文件,即RTO值也可以接近為0。但是限于經(jīng)費,本地與異地兩端存儲類型不同,現(xiàn)階段只利用Auto-Tier進行異步復制,平時小于10 GB的數(shù)據(jù)RTO值仍然需要1 h。
3.4 離線數(shù)據(jù)檔案保管與維護
離線備份介質(zhì)主要包括紙質(zhì)地形圖、散裝硬盤和磁帶等。根據(jù)基礎(chǔ)測繪生產(chǎn)各類成果的歸檔計劃,在每次歸檔任務完成后的1個月內(nèi)完成異地離線介質(zhì)備份工作。每月中更小周期如1周時間增量的離線介質(zhì)暫時存放在本地,等到大周期如每月通過汽車等交通工具將紙質(zhì)地圖、散裝硬盤、磁帶等新增的離線介質(zhì)(一般是涉密的)運到異地存放。在異地庫房,每年對20%離線介質(zhì)進行檢查,對硬盤進行讀盤測試,對磁帶進行數(shù)據(jù)恢復測試或健康性檢查。尤其是磁帶,主要放在防磁柜中,抽查時將待檢磁帶放在磁帶機中進行倒帶和恢復測試。全部檢查一次的周期為5—10年。一旦發(fā)現(xiàn)問題就要進行全部檢查,并更換有問題和到期的介質(zhì)。
測繪地理信息成果檔案異地災備系統(tǒng)(一期)已在浙江省初步建成,主要在不同網(wǎng)絡(luò)環(huán)境通過NexentaStor、DataGuard、分布式文件系統(tǒng)(DFS)等技術(shù)進行同步或異步復制,實現(xiàn)了在線容災和離線備份相結(jié)合的綜合方案,不僅為測繪地理信息成果檔案的應用安全增加了更可靠的保障,而且還在嘗試為有需求的市縣測繪地理信息部門提供異地災備方面的服務。后期建設(shè)將在涉密網(wǎng)絡(luò)、存儲、安全等設(shè)備擴充、性能提升,系統(tǒng)優(yōu)化完善,提高容災效率等方面加大投入和建設(shè),加強安全防護,規(guī)范運行管理。
[1] 劉瑩. 測繪成果資料檔案的特點及其管理原則[J].測繪技術(shù)裝備,2011,13(3):31-33.
[2] 國家檔案局.數(shù)字檔案館建設(shè)指南[Z].北京:國家檔案局,2010.
[3] 國家質(zhì)量監(jiān)督檢驗檢疫總局. GB/T 20988—2007 信息安全技術(shù)信息系統(tǒng)災難恢復規(guī)范[S].北京:中國標準出版社,2007.
[4] 翟永,劉磊.國家基礎(chǔ)地理信息中心數(shù)據(jù)成果異地存儲備份系統(tǒng)設(shè)計[J].測繪科學,2008(S2):98-100.
[5] 謝長生,韓德志,李懷陽,等.容災備份的等級和技術(shù)[J].中國計算機用戶,2003(18):30-33.
[6] 伍百發(fā).淺談基礎(chǔ)地理信息數(shù)據(jù)災備中心的建設(shè)[J].地理空間信息,2012,10(4):29-31.
[7] 趙釗.基于檔案信息管理系統(tǒng)災備技術(shù)的研究與應用[J].信息系統(tǒng)工程,2014,20(4):52-53.
[8] 趙春香,李鳴,曹純,等.淺析測繪地理信息業(yè)務檔案異地備份方案[J].測繪通報,2016(11):134-136.
[9] 焦驚眉,贠建明. 數(shù)字測繪成果檔案的容災方案構(gòu)想[J].測繪標準化,2015,31(1):10-21.
[10] 黃新軍.廣西省級基礎(chǔ)測繪成果數(shù)據(jù)異地備份研究[C]∥全國測繪科技信息網(wǎng)中南分網(wǎng)第二十五次學術(shù)信息交流會論文集.長沙:湖南地圖出版社,2011.
[11] 王東華,劉建軍.國家基礎(chǔ)地理信息數(shù)據(jù)庫動態(tài)更新總體技術(shù)[J].測繪學報,2015,44(7):822-825.
[12] 微軟公司.分布式文件系統(tǒng)[EB/OL]. (1999-04-19) [2017-2-20]. http:∥www.microsoft.com/china/windows2000/library/howitworks/fileandprint/dfsnew.mspx.
[13] Nexenta Systems. NexentaStor 版本3.1.x用戶指南[Z].北京:[s.n.],2011.
[14] 張曉明.大話Oracle RAC集群高可用性備份與恢復[M].北京:人民郵電出版社,2011.
Research on Zhejiang Offsite Disaster Recovery System for Surveying, Mapping and Geoinformation Archives
WANG Liangqing1,WANG Yuzhai1,LI Aiqin2
(1. Zhejiang Provincial Materials Archive of Surveying and Mapping, Hangzhou 310012, China; 2. Zhejiang Academy of Surveying and Mapping , Hangzhou 310012, China)
This paper examines the case for Zhejiang offsite disaster recovery center for surveying, mapping and geoinformation archives based on the status quo of its backups, requirements and the levels of disaster recovery. It also discusses the frameworks and techniques of the center and comes up with two design models for disaster recovery systems based on external and internal networks respectively. Much attention goes to how online data are replicated synchronously and asynchronously via NexentaStor, DataGuard and DFS, as well as the maintenance of offsite data remote backups. The combination of online disaster recovery and offsite data backup would provide a comprehensive plan for surveying, mapping and geoinformation professionals.
surveying and mapping; archives; offsite backup; disaster tolerant
王良清,王玉齋,李愛勤.測繪地理信息成果檔案異地災備系統(tǒng)的研建[J].測繪通報,2017(6):133-136.
10.13474/j.cnki.11-2246.2017.0207.
2017-02-08;
2017-04-02
浙江省重大科技創(chuàng)新平臺建設(shè)專項(2008C17004)
王良清(1966—),男,碩士,教授級高級工程師,主要從事計算機網(wǎng)絡(luò)系統(tǒng)集成、測繪地理信息業(yè)務檔案災備方面的研究工作。E-mail:877639604@qq.com
P208
A
0494-0911(2017)06-0133-04