洪懷江,馬晟杰
麗水市中心醫(yī)院 信息中心,浙江麗水 320000
醫(yī)院信息系統(tǒng)應(yīng)用級(jí)容災(zāi)體系的建設(shè)與實(shí)施
洪懷江,馬晟杰
麗水市中心醫(yī)院 信息中心,浙江麗水 320000
本文詳細(xì)介紹了醫(yī)院信息系統(tǒng)的應(yīng)用級(jí)容災(zāi)體系的建設(shè)和實(shí)施過(guò)程。 為確保我院醫(yī)院信息系統(tǒng)(HIS)業(yè)務(wù)正常運(yùn)行,并保證其在發(fā)生災(zāi)難時(shí)也能在短時(shí)間恢復(fù)業(yè)務(wù)正常,我院在計(jì)算機(jī)房進(jìn)行應(yīng)用級(jí)容災(zāi)系統(tǒng)建設(shè),系統(tǒng)部署包括3部分:業(yè)務(wù)系統(tǒng)端部署、容災(zāi)系統(tǒng)端部署和WEB管理端部署。
醫(yī)院信息系統(tǒng);容災(zāi)系統(tǒng);數(shù)據(jù)備份;網(wǎng)絡(luò)安全
20世紀(jì)90年代以來(lái),我國(guó)各大醫(yī)院紛紛建立了以醫(yī)院管理為核心的醫(yī)院信息系統(tǒng)(HIS)。2000年以后,我院先后建立了PACS(醫(yī)學(xué)影像存儲(chǔ)與傳輸系統(tǒng))、RIS(放射信息管理系統(tǒng))、LIS(實(shí)驗(yàn)室信息管理系統(tǒng))、EMR(電子病歷)系統(tǒng)等,使醫(yī)院業(yè)務(wù)量持續(xù)增長(zhǎng),數(shù)據(jù)信息量也在成倍地增長(zhǎng)。醫(yī)院業(yè)務(wù)對(duì)信息系統(tǒng)的依賴程度也在加強(qiáng),一旦信息系統(tǒng)發(fā)生災(zāi)難,將會(huì)導(dǎo)致病人無(wú)法就診,醫(yī)生無(wú)法看病,將會(huì)使醫(yī)院就診處于無(wú)序狀態(tài)。雖然國(guó)內(nèi)外很多醫(yī)療機(jī)構(gòu)早在大數(shù)據(jù)信息時(shí)代來(lái)臨之際就著手加強(qiáng)對(duì)業(yè)務(wù)連續(xù)性系統(tǒng)的建設(shè)工作。但是,直到2001年911事件發(fā)生之后,世貿(mào)大廈里的大量數(shù)據(jù)化為烏有,導(dǎo)致大廈里的許多公司由于數(shù)據(jù)丟失而倒閉,這時(shí)人們才真正認(rèn)識(shí)到災(zāi)備建設(shè)的必要性、重要性,并投入大量財(cái)力、物力保證業(yè)務(wù)系統(tǒng)的可靠性和連續(xù)性[1]。
如何確保醫(yī)院核心業(yè)務(wù)系統(tǒng)安全、可靠地運(yùn)行,以及在發(fā)生服務(wù)器、存儲(chǔ)器、數(shù)據(jù)庫(kù)故障時(shí)仍能確保整個(gè)業(yè)務(wù)信息系統(tǒng)穩(wěn)定運(yùn)行和數(shù)據(jù)安全是醫(yī)院IT人員重點(diǎn)思考的問(wèn)題[2-3]。其次為提高業(yè)務(wù)系統(tǒng)性能,降低外圍業(yè)務(wù)對(duì)業(yè)務(wù)系統(tǒng)的壓力,將部分分析數(shù)據(jù)與統(tǒng)計(jì)業(yè)務(wù)數(shù)據(jù)分離到容災(zāi)系統(tǒng),也是本文考慮解決的問(wèn)題。
目前,我院HIS數(shù)據(jù)庫(kù)總數(shù)據(jù)量為127 GB左右,EMR數(shù)據(jù)庫(kù)為278G左右。為避免數(shù)據(jù)丟失造成嚴(yán)重?fù)p失,我院對(duì)核心數(shù)據(jù)庫(kù)進(jìn)行了異地備份。采用IBMP720小機(jī)+SAN交換+IBM DS5020存儲(chǔ)以及Oracle 10g2數(shù)據(jù)庫(kù)和AIX6.1操作系統(tǒng)。利用OGG(數(shù)據(jù)復(fù)制技術(shù))將源數(shù)據(jù)庫(kù)的在線日志或歸檔日志獲得的數(shù)據(jù)增刪改變化應(yīng)用到目標(biāo)數(shù)據(jù)庫(kù),實(shí)現(xiàn)對(duì)核心數(shù)據(jù)庫(kù)的備份[4]。
HIS是醫(yī)院的核心業(yè)務(wù)系統(tǒng),醫(yī)院的業(yè)務(wù)基本上都是圍繞著HIS開(kāi)展,一旦HIS出現(xiàn)故障,病人無(wú)法正常就診、交費(fèi)、取藥,醫(yī)生開(kāi)不了處方、醫(yī)囑、檢驗(yàn)單、檢查單,相關(guān)檢查科室取不到病人的基本信息,造成病人情緒不穩(wěn)定,醫(yī)院處于全面癱瘓狀態(tài)[5]。我院目前用兩臺(tái)IBM P550小機(jī)+雙SAN交換+雙IBM DS4700存儲(chǔ),雖然避免了單點(diǎn)故障的風(fēng)險(xiǎn),但機(jī)房物理環(huán)境發(fā)生災(zāi)難性事故,還是存在著相當(dāng)大的風(fēng)險(xiǎn);雖然有異地備份機(jī)制,但數(shù)據(jù)從備份恢復(fù)到正常需用時(shí)間周期長(zhǎng),并需要對(duì)客戶端進(jìn)行相應(yīng)配置更改。如何在短時(shí)間內(nèi)恢復(fù)HIS的運(yùn)行,減少信息系統(tǒng)故障對(duì)病人、醫(yī)務(wù)人員、社會(huì)造成的影響仍是迫切需解決的問(wèn)題。
2.1 容災(zāi)系統(tǒng)拓?fù)浼軜?gòu)
為確保我院HIS業(yè)務(wù)正常運(yùn)行,并保證在發(fā)生災(zāi)難時(shí)也能在短時(shí)間恢復(fù)業(yè)務(wù)正常,我院在外科大樓6層計(jì)算機(jī)房進(jìn)行應(yīng)用級(jí)容災(zāi)建設(shè),利用原有的IBMP720小機(jī)+SAN交換+IBM DS5020存儲(chǔ)以及Oracle 10g2數(shù)據(jù)庫(kù)和AIX6.1操作系統(tǒng)進(jìn)行應(yīng)用級(jí)容災(zāi)部署。應(yīng)用級(jí)容災(zāi)部署后可以在業(yè)務(wù)系統(tǒng)和容災(zāi)系統(tǒng)之間形成相互切換、相互恢復(fù)的容災(zāi)關(guān)系。當(dāng)業(yè)務(wù)系統(tǒng)出現(xiàn)異?;蛴?jì)劃內(nèi)維護(hù)時(shí),業(yè)務(wù)系統(tǒng)可以簡(jiǎn)單地切換至容災(zāi)系統(tǒng),容災(zāi)系統(tǒng)替代業(yè)務(wù)系統(tǒng)提供服務(wù);業(yè)務(wù)系統(tǒng)硬件設(shè)備復(fù)原之后,容災(zāi)系統(tǒng)可以回切至業(yè)務(wù)系統(tǒng)運(yùn)行[6]。我院應(yīng)用級(jí)容災(zāi)的總體架構(gòu)圖設(shè)計(jì),見(jiàn)圖1。
圖1 應(yīng)用級(jí)容災(zāi)的總體架構(gòu)圖
2.2 容災(zāi)管理平臺(tái)的部署
Trust DBRA(災(zāi)難備份系統(tǒng))的部署分為3部分:業(yè)務(wù)系統(tǒng)端部署、容災(zāi)系統(tǒng)端部署和WEB管理端部署。
(1)業(yè)務(wù)系統(tǒng)端部署:Trust DBRA在業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫(kù)實(shí)例上安裝一個(gè)Trust Diaster Backup Client Agent for Oracle(Trust Log Capture Service和 Trust Log Transfer Service),用來(lái)獲取Online redo log數(shù)據(jù)和傳輸Redo log數(shù)據(jù)[7]。如果需要進(jìn)行應(yīng)用服務(wù)器和文件數(shù)據(jù)同步,則需要同時(shí)部署Trust Backup Client Agent for App。
(2)容災(zāi)系統(tǒng)端部署:Trust DBRA在容災(zāi)系統(tǒng)為每個(gè)對(duì)應(yīng)的Client Agent安裝Server模塊。多對(duì)一的部署方式,只需安裝一個(gè)Server模塊;一對(duì)一的部署方式,需要安裝多個(gè)Server模塊。
(3)WEB管理端部署:WEB管理端主要用來(lái)實(shí)現(xiàn)容災(zāi)系統(tǒng)的WEB管理,可以實(shí)現(xiàn)多項(xiàng)任務(wù)合一模式下的集中化管理,包括總體監(jiān)視、切換、容災(zāi)操作、作業(yè)信息檢查、活動(dòng)站點(diǎn)管理等功能。
3.1 數(shù)據(jù)庫(kù)復(fù)制技術(shù)
Oracle數(shù)據(jù)庫(kù)發(fā)出事務(wù)更新,日志寫(xiě)入進(jìn)程(LGWR),即完成Online Redo Log的寫(xiě)入過(guò)程。具體過(guò)程是Trust Log Capture Service 實(shí)時(shí)讀取生產(chǎn)端在線日志信息,由Trust Log Service同步到災(zāi)備中心端寫(xiě)日志數(shù)據(jù);在災(zāi)難備份中心,Trust 災(zāi)備Server進(jìn)程接收Trust Log Service傳送過(guò)來(lái)的數(shù)據(jù)并且生成對(duì)應(yīng)的災(zāi)備端的Online Redo Log數(shù)據(jù),在業(yè)務(wù)系統(tǒng)進(jìn)行Log switch的時(shí)候同步在災(zāi)難備份中心完成Log Switch,在災(zāi)備端Trust Apply Service通過(guò)Oracle Physical Recover機(jī)制把相關(guān)Online Redo Log日志內(nèi)容更新到災(zāi)備中心數(shù)據(jù)庫(kù)(實(shí)時(shí)更新模式)或者直接把歸檔內(nèi)容更新災(zāi)難備份中心數(shù)據(jù)庫(kù)(異步模式),實(shí)現(xiàn)容災(zāi)庫(kù)與生產(chǎn)庫(kù)的實(shí)時(shí)同步[8],見(jiàn)圖2。
圖2 數(shù)據(jù)庫(kù)復(fù)制技術(shù)示意圖
3.2 應(yīng)用復(fù)制技術(shù)
中間件(應(yīng)用)同步簡(jiǎn)稱APP同步,主要實(shí)現(xiàn)單個(gè)文件、多個(gè)文件、目錄、文件系統(tǒng)等內(nèi)容的數(shù)據(jù)同步。APP同步可以安裝在數(shù)據(jù)庫(kù)服務(wù)器上,也可以安裝在中間件服務(wù)器或文件服務(wù)器上。APP同步時(shí)間間隔以分鐘為單位計(jì)算,時(shí)間長(zhǎng)度可以按實(shí)際需要進(jìn)行調(diào)整,一般不建議間隔時(shí)間太短,如>5 min。APP同步缺省以首次全量同步,然后以增量同步的模式進(jìn)行;每次增量同步時(shí),自動(dòng)檢查同步內(nèi)容的文件時(shí)間和文件大小,若遇到文件時(shí)間和文件大小不一致時(shí),會(huì)自動(dòng)同步整個(gè)文件至容災(zāi)服務(wù)器。APP同步支持?jǐn)帱c(diǎn)續(xù)傳功能,若遇到文件傳輸過(guò)程中出現(xiàn)意外,導(dǎo)致文件內(nèi)容不完整等情形時(shí),APP同步在增量掃描中會(huì)自動(dòng)檢測(cè)到該文件,并實(shí)現(xiàn)斷點(diǎn)續(xù)傳功能。APP同步在遇到文件傳輸成功結(jié)束時(shí),會(huì)自動(dòng)校驗(yàn)文件,以確認(rèn)文件內(nèi)容和生產(chǎn)端文件內(nèi)容是否完全一致。
3.3 局部災(zāi)難切換方式
在生產(chǎn)中心發(fā)生局部災(zāi)難時(shí),比如HIS本身發(fā)生災(zāi)難(HIS服務(wù)器、存儲(chǔ)損壞等)致使HIS服務(wù)中斷,但HIS相關(guān)外圍接口系統(tǒng)及其他系統(tǒng)完好。此時(shí)可將HIS切換至災(zāi)備中心,其他系統(tǒng)在生產(chǎn)中心運(yùn)行。切換方法如下:
(1)通過(guò)Trust DBRA切換管理平臺(tái),進(jìn)行災(zāi)備切換操作:① 停止生產(chǎn)端應(yīng)用,停止生產(chǎn)端中間件數(shù)據(jù)庫(kù),停止生產(chǎn)端數(shù)據(jù)庫(kù)(這個(gè)步驟在實(shí)際發(fā)生時(shí),可能無(wú)需進(jìn)行);② 切換IP地址(要求在二層網(wǎng)絡(luò)下操作);③ 啟動(dòng)災(zāi)備端數(shù)據(jù)庫(kù)、災(zāi)備端中間件、災(zāi)備端應(yīng)用。
(2)由于生產(chǎn)中心其他應(yīng)用系統(tǒng)、網(wǎng)絡(luò)處于正常運(yùn)行狀態(tài),因此,網(wǎng)絡(luò)不需要切換至容災(zāi)匯聚點(diǎn),而是通過(guò)生產(chǎn)匯聚點(diǎn),訪問(wèn)災(zāi)備中心的HIS數(shù)據(jù)庫(kù)。
(3)根據(jù)備份策略,進(jìn)行HIS的系統(tǒng)數(shù)據(jù)備份。
3.4 整體性災(zāi)難切換方式
當(dāng)整個(gè)生產(chǎn)中心發(fā)生災(zāi)難或機(jī)房停電、火災(zāi)、地震等情況下,所有應(yīng)用系統(tǒng)不可用,將其切換到災(zāi)備中心運(yùn)行??赏ㄟ^(guò)如下方式和步驟來(lái)進(jìn)行切換:
(1)通過(guò)Trust DBRA容災(zāi)切換平臺(tái),根據(jù)預(yù)先制定的災(zāi)難應(yīng)急預(yù)案,進(jìn)行應(yīng)用級(jí)容災(zāi)切換:① 停止生產(chǎn)端應(yīng)用及數(shù)據(jù)庫(kù);② 啟動(dòng)災(zāi)備端數(shù)據(jù)庫(kù)、啟動(dòng)災(zāi)備端中間件、啟動(dòng)災(zāi)備端應(yīng)用;③ 啟動(dòng)各業(yè)務(wù)系統(tǒng)的災(zāi)備端數(shù)據(jù)庫(kù)、中間件和應(yīng)用程序。
(2)通過(guò)三層網(wǎng)絡(luò)容災(zāi)匯聚點(diǎn),訪問(wèn)災(zāi)備中心的業(yè)務(wù)系統(tǒng)。
(3)業(yè)務(wù)系統(tǒng)在災(zāi)備端運(yùn)行后,根據(jù)預(yù)先制定的備份策略,進(jìn)行應(yīng)用系統(tǒng)備份和數(shù)據(jù)庫(kù)數(shù)據(jù)的備份。
為了減輕生產(chǎn)端負(fù)載,以及充分利用現(xiàn)有設(shè)備資源提高經(jīng)濟(jì)效益,在容災(zāi)節(jié)點(diǎn)通過(guò)啟動(dòng)Trust DBRA站點(diǎn)來(lái)提供Oracle數(shù)據(jù)庫(kù)的活動(dòng)數(shù)據(jù)查詢能力,分流主數(shù)據(jù)庫(kù)的壓力。在相關(guān)查詢的客戶端的tnsnames.ora文件中配置相關(guān)容災(zāi)節(jié)點(diǎn)信息,這樣就能將相關(guān)的查詢和數(shù)據(jù)統(tǒng)計(jì)業(yè)務(wù)分擔(dān)給容災(zāi)端[9]。
(1)容災(zāi)端建設(shè)后,我院定期組織相關(guān)人員進(jìn)行信息系統(tǒng)故障應(yīng)急演練,提高臨床醫(yī)務(wù)人員處理信息系統(tǒng)故障能力,并在演練后形成書(shū)面總結(jié)報(bào)告,為以后系統(tǒng)維護(hù)提供應(yīng)急方案[10-11]。
(2)實(shí)現(xiàn)院內(nèi)異地災(zāi)備建設(shè),確保發(fā)生災(zāi)難時(shí)信息數(shù)據(jù)的安全性和完整性。
(3)保證了醫(yī)院業(yè)務(wù)的連續(xù)性。我院IBM P550小機(jī)+IBMDS4700已運(yùn)行多年,不時(shí)會(huì)出現(xiàn)一些硬件故障,在未建設(shè)容災(zāi)系統(tǒng)時(shí),進(jìn)行硬件更換時(shí)需要關(guān)閉Oracle數(shù)據(jù)庫(kù)并停機(jī),造成業(yè)務(wù)中斷。建了容災(zāi)系統(tǒng)后,當(dāng)業(yè)務(wù)系統(tǒng)出現(xiàn)異?;蛴?jì)劃內(nèi)維護(hù)時(shí),業(yè)務(wù)系統(tǒng)可以簡(jiǎn)單的切換至容災(zāi)系統(tǒng),容災(zāi)系統(tǒng)替代業(yè)務(wù)系統(tǒng)提供服務(wù);業(yè)務(wù)系統(tǒng)硬設(shè)備復(fù)原之后,容災(zāi)系統(tǒng)可以回切至業(yè)務(wù)系統(tǒng),并保持業(yè)務(wù)的連續(xù)性,數(shù)據(jù)的完整性。
(4)把相關(guān)數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)分析等業(yè)務(wù)的客戶端指向?yàn)?zāi)備端,提高了災(zāi)備端設(shè)備資源利用率,減輕了生產(chǎn)端的運(yùn)行壓力,已取得了良好的經(jīng)濟(jì)效益和社會(huì)效益。
[1]翁錦陽(yáng),何萍,朱鐵兵.大型醫(yī)院信息系統(tǒng)的容災(zāi)設(shè)計(jì)和應(yīng)用[J].醫(yī)院數(shù)字化,2011,(1):59-61.
[2]夏旭.無(wú)線網(wǎng)絡(luò)在醫(yī)院信化中的應(yīng)用優(yōu)勢(shì)及不足的探討[J].信息與電腦,2011,(6):124.
[3]劉傳高.淺談醫(yī)院信息系統(tǒng)的安全管理[J].中華全科醫(yī)學(xué),2012,(9):1474-1475.
[4]武冬春.基于GoldenGate技術(shù)實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)容災(zāi)的解決方案[J].信息通信,2013,(7):232-233.
[5]王晨光.醫(yī)院信息系統(tǒng)(HIS)安全維護(hù)措施探討[J].中國(guó)醫(yī)學(xué)創(chuàng)新,2013,(14):77-78.
[6]劉躍,宋兵.信息系統(tǒng)異地容災(zāi)技術(shù)探討[J].中國(guó)傳媒科技,2012,(12):74-77.
[7]鄒先霞,賈維嘉,潘久輝.基于數(shù)據(jù)庫(kù)日志的變化數(shù)據(jù)捕獲研究[J].小型微型計(jì)算機(jī)系統(tǒng),2012,(3):531-536.
[8]李民,曹陽(yáng).基于Oracle Data Guard構(gòu)建醫(yī)院信息系統(tǒng)的容災(zāi)備份方案[J].醫(yī)院數(shù)字化,2012,(8):45-47.
[9]江英琴.基于日志復(fù)制技術(shù)的容災(zāi)系統(tǒng)研究與應(yīng)用[J].電子技術(shù)與軟件工程,2014,(12):217-219.
[10]王玉珍,孫巍,郭建魁.醫(yī)院網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)聯(lián)動(dòng)策略的實(shí)施[J].中國(guó)醫(yī)療設(shè)備,2015,30(8):87-89.
[11]王栩,劉佳.大型醫(yī)院HIS系統(tǒng)應(yīng)急方案全流程[J].計(jì)算機(jī)軟件光盤(pán)與應(yīng)用,2012,(11):143-144.
Construction and Implementation of the Application-level Disaster Tolerant System in the Hospital Information System
This paper introduced in details the implementation process of the application-level disaster tolerant system in the hospital information system.To ensure the proper function of the hospital information system (HIS),as well as to ensure the recovery of the HIS within short period of time during disaster,our hospital constructed the application-level disaster tolerant system,which includes three parts: business system end deployment,disaster tolerant system end deployment,and WEB management end deployment.
hospital information system;disaster tolerant system;data backup;network security
HONG Huai-jiang,MA Sheng-jie
Information Center,Lishui Central Hospital,Lishui Zhejiang 323000,China
TP393.08
A
10.3969/j.issn.1674-1633.2016.04.025
1674-1633(2016)04-0100-03
2015-10-26
2016-02-23
本文作者:洪懷江,醫(yī)院信息中心負(fù)責(zé)人,工程師。
作者郵箱:382912859@qq.com