摘 要:目的:完善醫(yī)院容災(zāi)體系,提高醫(yī)院信息系統(tǒng)的可靠性。同時,根據(jù)醫(yī)院實際情況,統(tǒng)籌考慮整個機房建設(shè)需求,有效控制容災(zāi)建設(shè)成本。在容災(zāi)建設(shè)的探索中,實現(xiàn)“小成本,大保障”的要求。結(jié)果:在有限的信息化資金中,實現(xiàn)了核心數(shù)據(jù)庫、影像圖像和其他小型的應(yīng)用服務(wù)器的容災(zāi)建設(shè)。醫(yī)院信息化可靠性明顯提高,達到了醫(yī)院的預(yù)期目標(biāo)。結(jié)論:由于醫(yī)院規(guī)模大小、信息化建設(shè)的投入各有差異,需要通過對自身醫(yī)院情況的深入剖析,選擇適合醫(yī)院信息系統(tǒng)的容災(zāi)建設(shè)方案。
關(guān)鍵詞:醫(yī)院信息系統(tǒng);容災(zāi);建設(shè);成本
1 概述
隨著醫(yī)院信息化建設(shè)的不斷深入,醫(yī)院對于信息化的依賴程度日益增加。這就對醫(yī)院信息化建設(shè)的安全性和可靠性提出越來越高的要求。近幾年,時有信息系統(tǒng)故障造成醫(yī)院業(yè)務(wù)癱瘓的報道。有些是中斷數(shù)個小時,有些甚至中斷數(shù)天,對醫(yī)院造成了嚴(yán)重不良的社會影響。
究其原因,這些信息系統(tǒng)故障都是由于缺少信息系統(tǒng)的容災(zāi)或者容災(zāi)沒有正常啟動引起的。所以,在醫(yī)院對信息系統(tǒng)高度依賴下,容災(zāi)建設(shè)正成為信息系統(tǒng)建設(shè)的一項核心內(nèi)容。
目前各家醫(yī)院規(guī)模大小不一,信息系統(tǒng)容災(zāi)建設(shè)的程度也參差不齊。大型的醫(yī)院為了保障系統(tǒng)的高可靠性,會投入數(shù)百萬甚至上千萬去建設(shè)醫(yī)院的容災(zāi)系統(tǒng)。而小型的醫(yī)院則普遍存在著容災(zāi)建設(shè)程度低,甚至沒有容災(zāi)系統(tǒng)的情況。這和醫(yī)院的業(yè)務(wù)量及對信息化重視程度也有很大的關(guān)系。
2 現(xiàn)狀及問題
我院是一家市級的三等乙級綜合性醫(yī)院,開放床位650張,2015年業(yè)務(wù)量4.29億。醫(yī)院自2011年開始,每年業(yè)務(wù)量增長迅速,對信息系統(tǒng)的安全性和可靠性的要求也越來越高。醫(yī)院有HIS、LIS、PACS等信息系統(tǒng)40余個,服務(wù)器30余臺。HIS、PACS系統(tǒng)使用ORACLE數(shù)據(jù)庫,服務(wù)器均采用“一主一備”的群集+存儲的模式。同時,醫(yī)院也進行了部分的容災(zāi)建設(shè)。對于關(guān)鍵的數(shù)據(jù)庫服務(wù),如HIS、PACS、LIS,采用ORACLE自帶的Data Guard技術(shù)實現(xiàn)數(shù)據(jù)容災(zāi)。目前醫(yī)院的容災(zāi)建設(shè)主要存在以下幾個問題:
(1)服務(wù)器資源利用率低,存在單點故障風(fēng)險的數(shù)據(jù)庫和服務(wù)器多
由于醫(yī)院服務(wù)器是根據(jù)業(yè)務(wù)需要逐漸增加的,造成服務(wù)器數(shù)量多但硬件資源利用率低的問題。同時,周邊小型的應(yīng)用服務(wù)器,如各類前置機服務(wù)器、OA服務(wù)器、數(shù)據(jù)采集服務(wù)器等均是單點工作,沒有建立相應(yīng)的容災(zāi)系統(tǒng)。一旦這些服務(wù)器出現(xiàn)硬件或者軟件故障,對應(yīng)的應(yīng)用服務(wù)短時間內(nèi)無法恢復(fù)。
(2)影像存儲空間和容災(zāi)能力不足
PACS影像存儲于2010年上線使用,實際可用容量約12T。隨著近年影像數(shù)據(jù)的快速增長,影像存儲空間趨于飽和。所有的影像均存儲于一臺存儲設(shè)備上,沒有相應(yīng)的影像數(shù)據(jù)容災(zāi)。一旦該存儲出現(xiàn)問題,影像數(shù)據(jù)存在著丟失的風(fēng)險。
(3)HIS容災(zāi)服務(wù)器配置性能低
HIS服務(wù)器的容災(zāi)系統(tǒng)建于2008年,性能嚴(yán)重不足。隨著醫(yī)院的發(fā)展,容災(zāi)服務(wù)器的配置已經(jīng)不能承載目前的數(shù)據(jù)量。群集的兩臺主服務(wù)器或者存儲一旦出現(xiàn)故障,容災(zāi)服務(wù)器并不能保障醫(yī)院所有業(yè)務(wù)的運行。
3 方法及對策
經(jīng)過對容災(zāi)技術(shù)的調(diào)查和研究,雙活容災(zāi)數(shù)據(jù)中心的模式擁有絕對的優(yōu)勢。但是,雙活容災(zāi)對硬件的要求極高,至少需要雙存儲、雙存儲網(wǎng)關(guān)。這顯然需要大量的信息化資金投入,超出我院容災(zāi)建設(shè)的預(yù)算范圍。通過對我院實際情況的深入討論和分析,同時結(jié)合經(jīng)濟成本的因素,我們制定了以下完善容災(zāi)的建設(shè)方案(如圖1)。
硬件:IBM V7000存儲一套、光纖交換機兩臺、HP DL388P服務(wù)器三臺
軟件:VMware服務(wù)器虛擬化軟件、Data Guard
(1)構(gòu)建服務(wù)器虛擬化平臺,提升系統(tǒng)可靠性,減少物理服務(wù)器數(shù)量。在容災(zāi)機房,由三臺服務(wù)器、兩臺光交、一套新存儲和一臺老存儲搭建一套服務(wù)器虛擬化平臺。將HIS容災(zāi)、PACS容災(zāi)、LIS應(yīng)用、OA應(yīng)用、前置機應(yīng)用等服務(wù)遷移至虛擬化平臺。利用虛擬化本身的高冗余性,來提升之前單點應(yīng)用服務(wù)的可靠性和安全性。
(2)實現(xiàn)“一虛一實,一主一備”,排除單點故障隱患。利用Data Guard技術(shù),對所有ORACLE數(shù)據(jù)庫服務(wù)進行“一虛一實,一主一備”的部署。即為每個ORACLE數(shù)據(jù)庫在物理機上和虛擬化平臺上,分別搭建主應(yīng)用和容災(zāi)應(yīng)用。如圖1,OA、LIS、PACS等均分別有一臺物理機服務(wù)器和一臺虛擬平臺中的服務(wù)器實現(xiàn)一主一備。同時,升級所有ORACLE版本至10g以上,為保障主服務(wù)器的運行性能,Data Guard數(shù)據(jù)保護模式采用了最大性能模式,基本確保數(shù)據(jù)零丟失。
(3)合理架構(gòu),共享存儲,發(fā)揮設(shè)備最大性能,降低成本。新采購的IBM V7000存儲配置如下:雙NAS控制器、3T NL-SAS*12塊、900G SAS*12塊、200G SSD*2塊。PACS影像數(shù)據(jù)與服務(wù)器虛擬化平臺共享V7000存儲,12塊3T機械硬盤和雙NAS控制器向PACS提供新的影像存儲服務(wù)。12塊900G機械硬盤和2塊200G固態(tài)硬盤則向服務(wù)器虛擬化提供高可用的存儲服務(wù)。同時,PACS影像數(shù)據(jù)服務(wù)器同時向IBM V7000和原有的NETAPP存儲中寫入圖像數(shù)據(jù),解決了影像數(shù)據(jù)容災(zāi)問題。
4 不足
當(dāng)然,該方案對比其他方案,雖然成本得到降低但也存在以下不足:
(1)主備模式切換過程中仍需停機切換。經(jīng)測試,整個切換過程約需停機15分鐘左右,這處于我院可接受范圍內(nèi)。
(2)為確保主數(shù)據(jù)庫的性能,Data Guard保護模式選擇了最大性能模式,存在著理論極小部分?jǐn)?shù)據(jù)異步的可能。雖然在實際多次測試的環(huán)境下,該模式?jīng)]有任何數(shù)據(jù)丟失。數(shù)據(jù)的零丟失也是我院今后容災(zāi)建設(shè)的最終目標(biāo)。
5 結(jié)束語
在我院容災(zāi)建設(shè)的過程中,我們本著“小成本,大保障”的理念進行了容災(zāi)方案的優(yōu)化。根據(jù)醫(yī)院實際情況,最終選擇了最合適的容災(zāi)方案。容災(zāi)方案建設(shè)完成后,我們對系統(tǒng)進行了各項測試,包括主備數(shù)據(jù)庫切換、備用機性能實測等。各項測試結(jié)果均達到了我院的建設(shè)預(yù)期,進一步提升了我院信息系統(tǒng)容災(zāi)應(yīng)急能力。