黃傳輝
【摘 要】目前空管自研信息化系統(tǒng)在管制部門中得到了廣泛的應用,論文對空管自研信息化系統(tǒng)的運維現(xiàn)狀進行了介紹,結合空管業(yè)務的運行情況對空管自研信息化系統(tǒng)應急備份恢復架構進行了探討,分別分析了空管自研信息化系統(tǒng)應急備份恢復架構的異地容災和應急備份恢復能力,最后對空管自研信息化系統(tǒng)應急備份恢復性能進行了評測解釋。
【Abstract】At present, ATC self-developed information system has been widely used in the control department. This paper introduces the operation and maintenance status of ATC self-developed information system. Combined with the operation of ATC, the emergency backup recovery of ATC self-developed information system is discussed. Also the remote disaster-tolerant and emergency backup recovery capability of ATC self-developed information system are analyzed respectively. The performance of emergency backup recovery capability of ATC self-developed information system is evaluated and explained in the last chapter.
【關鍵詞】空管自研信息化系統(tǒng);應急備份;異地容災
【Keywords】ATC self-developed information system; emergency backup; remote disaster-tolerant
【中圖分類號】TP301 【文獻標志碼】A 【文章編號】1673-1069(2017)07-0142-02
1 引言
隨著中國民航業(yè)的飛速發(fā)展,對空中交通指揮的安全性與效率提出了更高的要求。根據(jù)管制部門的不同需求,通過空管自主研發(fā)各類專用性強的信息化系統(tǒng),能夠進一步提高管制部門的運行效率,為相關的管制業(yè)務提供了可靠高效的技術支持。但是管制員的工作與各空管自研信息化系統(tǒng)的耦合程度越來越高,對現(xiàn)有系統(tǒng)安全、可靠運行帶來了新的挑戰(zhàn)。本文結合空管自研信息化系統(tǒng)的現(xiàn)狀,探討應對系統(tǒng)級故障等重大故障時提供有效的應急備份和系統(tǒng)恢復手段,從而確保系統(tǒng)應急處置的及時有效,為管制用戶提供更優(yōu)質(zhì)的服務質(zhì)量。
2 空管自研信息化系統(tǒng)運維現(xiàn)狀
目前中南空管局已上線運行了多套空管自研信息化系統(tǒng),管制部門對這些空管自研信息化系統(tǒng)的中斷容忍時長較短,對空管自研信息化系統(tǒng)的運維保障提出了較高的要求。但目前各空管自研信息化系統(tǒng)之間的耦合程度較高,其系統(tǒng)內(nèi)某一部分故障會影響其承載的所有信息系統(tǒng)的運行,且短期內(nèi)也不具備配置完整獨立備份系統(tǒng)的技術條件。此外,空管研發(fā)部門經(jīng)常需要對某一在線的自研信息化系統(tǒng)進行軟硬件升級、功能試用等工作,從而造成了運維部門與研發(fā)部門共同在在線系統(tǒng)上操作的現(xiàn)象將在較長時間內(nèi)存在。在此背景下,迫切需要建立對各空管自研信息化系統(tǒng)的系統(tǒng)級、數(shù)據(jù)庫級別的應急備份恢復機制。
3 空管自研信息化系統(tǒng)應急備份恢復架構
根據(jù)空管自研信息化系統(tǒng)的系統(tǒng)狀況和業(yè)務承載情況,提出空管自研信息化系統(tǒng)應急備份恢復架構,如圖1所示
目前中南空管局的各空管自研信息化系統(tǒng)基本通過刀框服務器運算集群和高性能光存儲的硬件架構予以承載,在此硬件架構上通過虛擬化平臺為各空管自研信息化系統(tǒng)提供虛擬化運算環(huán)境,從而為空管自研信息化系統(tǒng)的虛擬化服務器提供運算資源的支撐,同時通過高性能光存儲為其數(shù)據(jù)存儲提供存儲能力的支撐。
各空管自研信息化系統(tǒng)的架構可以歸納為“3+2”結構,即3個數(shù)據(jù)庫服務器和2個應用服務器的結構。其中數(shù)據(jù)庫服務器通過微軟的AlwaysOn技術,實現(xiàn)了數(shù)據(jù)庫的高可用性[1]。此外,通過將主、備數(shù)據(jù)庫實例和主用應用服務器部署在航管樓的刀框服務器運算集群,應急數(shù)據(jù)庫實例和備用應用服務器部署在管制中心的刀框服務器運算集群中,實現(xiàn)了空管自研信息化系統(tǒng)的異地容災。再者,通過部署專用的獨立應急備份恢復服務器,并在高性能光存儲等存儲設備中設置虛擬化服務器和數(shù)據(jù)庫的實時數(shù)據(jù)備份節(jié)點,構建起既能應付單個地點全部硬件設備故障的數(shù)據(jù)庫級別的回滾應急架構,也能應對系統(tǒng)級故障的應急備份恢復架構。
4 空管自研信息化系統(tǒng)應急備份恢復性能評測
為了驗證空管自研信息化系統(tǒng)應急備份恢復架構的恢復能力,結合現(xiàn)有系統(tǒng)的運行環(huán)境和業(yè)務承載情況,進行了完備的性能評測,其評測項目如下:①備份與恢復設備獨立于生產(chǎn)系統(tǒng),在生產(chǎn)系統(tǒng)發(fā)生災難時能夠迅速恢復,支撐業(yè)務系統(tǒng)。②數(shù)據(jù)可通過同步或者異步的方式,采用連續(xù)數(shù)據(jù)保護技術,從生產(chǎn)端復制到容災端。③驗證容災端數(shù)據(jù)庫的完整一致性。④測試驗證目前空管自研信息化系統(tǒng)中采用的多種VMDK數(shù)據(jù),哪些類型是可以受到有效保護的。⑤驗證SQL Server、Oracle等數(shù)據(jù)庫的兼容性。
圖2所示為空管自研信息化系統(tǒng)應急備份恢復性能評測的拓撲,采用EMC的VxRail超融合一體機和RP4VM軟件搭配的解決方案。這一解決方案可以作為獨立于現(xiàn)有生產(chǎn)環(huán)境的一份容災與測試系統(tǒng)。對于使用Datastore的VMDK、非共享RDM的虛機,可以通過RP4VM實時同步或異步的方式,利用網(wǎng)絡復制到作為容災設備的VxRail超融合一體機上。其測試結果如下:①利用Test Copy方式,可以實現(xiàn)在容災端的實時數(shù)據(jù)驗證,也可將容災端的虛擬機作為培訓、測試等其它用途。②利用Fail Over方式,可以實現(xiàn)生產(chǎn)到容災的切換。③無論那種方式,應用及數(shù)據(jù)庫是與生產(chǎn)一致,并且保證數(shù)據(jù)的完整一致性。
經(jīng)過測試評估,空管自研信息化系統(tǒng)應急備份恢復架構對VMware虛擬機的備份功能有顯著優(yōu)勢,能對虛擬服務器的源文件進行消重后再進行備份,可顯著提升備份速度,降低存儲空間,單次備份其文件占用的存儲空間僅有其他同類型應急備份恢復架構的25%。數(shù)據(jù)越大,已備份的虛擬服務器越多,備份速度及存儲容量的相對優(yōu)勢就越明顯。自2016年以來,空管自研信息化系統(tǒng)應急備份恢復架構已承擔起各空管自研信息化系統(tǒng)的應急備份和系統(tǒng)恢復的角色,通過定期利用周期維護對各類在線虛擬機業(yè)務進行了備份配置和恢復測試,很好地證明了其有效性與可靠性。
5 結論
本文對空管自研信息化系統(tǒng)運維現(xiàn)狀進行了簡介,并以此為基礎結合系統(tǒng)狀況和業(yè)務承載情況,分析了空管自研信息化系統(tǒng)應急備份恢復架構,詳細解釋了其異地容災性能和應急備份恢復性能。最后結合現(xiàn)有的空管自研信息化系統(tǒng)的運行環(huán)境和業(yè)務承載情況,對空管自研信息化系統(tǒng)應急備份恢復架構進行了功能性和兼容性測試,并就測試結果進行了解釋說明,為今后進一步提升空管自研信息化系統(tǒng)的運維保障水平,提供了一定的探索方向和理論支持。
【參考文獻】
【1】Microsoft Crop. Overview of Always On Availability Groups (SQL Server) [EB/OL].2016-5-17. https://docs.microsoft.com/zh-cn/sql/database-engine/availability-groups/windows/overview-of-always-on-availability-groups-sql-server.