陳繼何
(福建省福州兒童醫(yī)院,福建 福州 350001)
醫(yī)療行業(yè)是我國(guó)較早數(shù)字化、信息化的行業(yè),每時(shí)每刻都在產(chǎn)生海量數(shù)據(jù)[1]。我院經(jīng)過(guò)十幾年的信息化建設(shè)發(fā)展,醫(yī)療業(yè)務(wù)系統(tǒng)、管理系統(tǒng)等越來(lái)越多,隨之積累了海量的醫(yī)療臨床數(shù)據(jù)。這些海量的醫(yī)療臨床數(shù)據(jù)的應(yīng)用及發(fā)掘,自然也就成為推動(dòng)醫(yī)院發(fā)展的主要?jiǎng)恿?。由于醫(yī)院信息系統(tǒng)由不同的廠商幫助建設(shè)、數(shù)據(jù)結(jié)構(gòu)存在較大差異,導(dǎo)致醫(yī)療數(shù)據(jù)價(jià)值利用率不高[2]。
我院數(shù)據(jù)中心整體架構(gòu)采用以Hadoop+Oracle+數(shù)據(jù)引擎的混合體系,其核心以Hbase為數(shù)據(jù)倉(cāng)庫(kù),結(jié)合關(guān)系型數(shù)據(jù)架構(gòu)與分布式數(shù)據(jù)架構(gòu)相結(jié)合技術(shù)體系,以主數(shù)據(jù)系統(tǒng)作為數(shù)據(jù)互聯(lián)標(biāo)準(zhǔn),以數(shù)據(jù)捕獲引擎、數(shù)據(jù)轉(zhuǎn)換引擎、非關(guān)系型數(shù)據(jù)接入引擎作為數(shù)據(jù)支持,大數(shù)據(jù)管理平臺(tái)集資產(chǎn)管理、運(yùn)維管理、數(shù)據(jù)服務(wù)平臺(tái)、安全監(jiān)控于一體,有效地保障數(shù)據(jù)的時(shí)效性、準(zhǔn)確性、安全性和易用性,整合數(shù)據(jù)互通標(biāo)準(zhǔn)、提升醫(yī)院信息化管理水平、服務(wù)水平、整體建設(shè)水平。如圖1所示。
圖1 我院數(shù)據(jù)中心整體架構(gòu)
將臨床業(yè)務(wù)數(shù)據(jù)、運(yùn)營(yíng)管理數(shù)據(jù)、財(cái)務(wù)管理數(shù)據(jù)、質(zhì)量控制數(shù)據(jù)、科研管理數(shù)據(jù)等醫(yī)院所有數(shù)據(jù),通過(guò)Oracle GoldenGate數(shù)據(jù)捕獲引擎將分別匯集到ODS數(shù)據(jù)庫(kù),將醫(yī)院現(xiàn)有的非關(guān)系型數(shù)據(jù)直接匯集至分布式數(shù)據(jù)中心。數(shù)據(jù)清洗與轉(zhuǎn)換引擎通過(guò)Oracle GoldenGate Application Adapters推送功能將實(shí)時(shí)變化數(shù)據(jù)庫(kù)推送到Kaf ka消息隊(duì)列,Kaf ka消息隊(duì)列接收到相關(guān)變化數(shù)據(jù)后,按事先定義好的數(shù)據(jù)轉(zhuǎn)換與洗清規(guī)則對(duì)推入的數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換,清洗轉(zhuǎn)換完成后,分成兩種數(shù)據(jù)格式,分別存入關(guān)系型數(shù)據(jù)中心與分布式數(shù)據(jù)中心。
利用Oracle GoldenGate與Kafka消息隊(duì)列工具實(shí)現(xiàn)生產(chǎn)庫(kù)到數(shù)據(jù)中心的實(shí)時(shí)同步模式??紤]到數(shù)據(jù)同步與處理對(duì)生產(chǎn)數(shù)據(jù)庫(kù)性能會(huì)產(chǎn)生一定的影響,所以需要在生產(chǎn)數(shù)據(jù)庫(kù)和平臺(tái)之前增加ODS服務(wù)器,實(shí)現(xiàn)數(shù)據(jù)先從生產(chǎn)數(shù)據(jù)庫(kù)到ODS庫(kù),再由Oracle GoldenGate Application Adapters與Kafka消息隊(duì)列完成數(shù)據(jù)實(shí)時(shí)同步到數(shù)據(jù)中心。
Oracle GoldenGate通過(guò)對(duì)源數(shù)據(jù)庫(kù)業(yè)務(wù)日志的解析,獲得數(shù)據(jù)的變化,完成數(shù)據(jù)同步,實(shí)現(xiàn)大量數(shù)據(jù)實(shí)時(shí)交互、源數(shù)據(jù)庫(kù)與目標(biāo)數(shù)據(jù)庫(kù)的數(shù)據(jù)實(shí)時(shí)同步。同時(shí)形成隔離層,降低影響業(yè)務(wù)庫(kù)的風(fēng)險(xiǎn),且數(shù)據(jù)集能夠滿足各應(yīng)用的數(shù)據(jù)需求等。
ETL的一般過(guò)程:從操作型的數(shù)據(jù)源,經(jīng)過(guò)數(shù)據(jù)中轉(zhuǎn)區(qū),最后到達(dá)數(shù)據(jù)倉(cāng)庫(kù)(ODS)的數(shù)據(jù)處理過(guò)程。底層是整個(gè)ETL過(guò)程中都涉及的數(shù)據(jù)抽取、加載、插入ODS數(shù)據(jù)庫(kù)。
我院數(shù)據(jù)中心推送工具采用Oracle GoldenGate Java Adapter,數(shù)據(jù)中心各個(gè)主題庫(kù)的數(shù)據(jù)是通過(guò)捕獲ODS數(shù)據(jù)庫(kù)中相關(guān)業(yè)務(wù)表的變化數(shù)據(jù),將實(shí)時(shí)變化數(shù)據(jù)通過(guò)Oracle GoldenGate Java Adapter推送到Kaf ka消息隊(duì)列,在Kaf ka消息隊(duì)列中將推送進(jìn)來(lái)的數(shù)據(jù)進(jìn)行拼裝與清洗,然后將拼裝與清洗完成后的數(shù)據(jù)寫(xiě)入按事先定義好的主題庫(kù)中。
將非結(jié)構(gòu)化文件、共享文檔、科研數(shù)據(jù)等加密保存,并支持不同環(huán)境下的數(shù)據(jù)調(diào)用,根據(jù)不同場(chǎng)景需要提供不同的底層技術(shù)訪問(wèn)數(shù)據(jù)。同時(shí)通過(guò)HDFS文件系統(tǒng)分布式存儲(chǔ)物理文件。
信息集成平臺(tái)集成了醫(yī)院業(yè)務(wù)系統(tǒng),該平臺(tái)是基于SOA消息協(xié)同的ESB總線組成的異構(gòu)、異步集成平臺(tái),可以消除系統(tǒng)間依賴和阻塞,輔以大數(shù)據(jù)中心,對(duì)醫(yī)院數(shù)據(jù)資產(chǎn)統(tǒng)一存儲(chǔ),統(tǒng)一管理,為后續(xù)運(yùn)維、決策、分析提供完整集中的數(shù)據(jù)支撐。按照國(guó)家標(biāo)準(zhǔn),通過(guò)對(duì)醫(yī)院的業(yè)務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)梳理和標(biāo)準(zhǔn)化流程改造,實(shí)現(xiàn)符合國(guó)家標(biāo)準(zhǔn)的安全體系。
平臺(tái)建設(shè)過(guò)程中,要求院內(nèi)所有需要接入的業(yè)務(wù)系統(tǒng)進(jìn)行標(biāo)準(zhǔn)化改造,形成統(tǒng)一的接口標(biāo)準(zhǔn)化交互體系。將醫(yī)院所有信息系統(tǒng)以標(biāo)準(zhǔn)化的方式進(jìn)行互聯(lián)互通,制定了廠商接入改造的專用技術(shù)指導(dǎo)手冊(cè),提供了代碼輔助審核和編程指導(dǎo),降低整體改造難度,實(shí)現(xiàn)院內(nèi)多源異構(gòu)系統(tǒng)之間以及與外部機(jī)構(gòu)之間的互聯(lián)互通;以推送業(yè)務(wù)為主,降低重復(fù)業(yè)務(wù)調(diào)用、增加消息補(bǔ)償接口分散查詢業(yè)務(wù)壓力等方式,提高平臺(tái)集成能力;建立主數(shù)據(jù)主索引管理,統(tǒng)一業(yè)務(wù)術(shù)語(yǔ)值域,在平臺(tái)內(nèi)建設(shè)業(yè)務(wù)值域和完整性驗(yàn)證,進(jìn)而保障業(yè)務(wù)一致性。最終整合各個(gè)業(yè)務(wù)系統(tǒng),實(shí)現(xiàn)醫(yī)院的信息集成平臺(tái)建設(shè)效果。
根據(jù)醫(yī)療業(yè)務(wù)管理的需要,主索引管理系統(tǒng)以病人的基本信息為基礎(chǔ),采用復(fù)雜的算法和原理,形成一套標(biāo)準(zhǔn)化數(shù)據(jù)匹配規(guī)則,有效提高主索引驗(yàn)證和判斷的準(zhǔn)確性。EMPI提供患者主索引合并、更新、人工判斷等多種功能。根據(jù)患者的基本資料生成主索引號(hào),以主索引號(hào)聯(lián)通所有業(yè)務(wù)系統(tǒng)?;颊咧魉饕芾砥脚_(tái)再通過(guò)患者主索引號(hào)關(guān)聯(lián)各個(gè)業(yè)務(wù)系統(tǒng)的歷史數(shù)據(jù),最終實(shí)現(xiàn)所有業(yè)務(wù)系統(tǒng)數(shù)據(jù)互聯(lián)互通,解決歷史數(shù)據(jù)的信息孤島問(wèn)題。
對(duì)全院的基礎(chǔ)數(shù)據(jù)字典如科室字典、職工字典、檢驗(yàn)項(xiàng)目字典、收費(fèi)項(xiàng)目字典、檢查項(xiàng)目字典等數(shù)據(jù)字典進(jìn)行標(biāo)準(zhǔn)化處理,建立統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)字典庫(kù)。同時(shí)收集國(guó)家標(biāo)準(zhǔn)術(shù)語(yǔ)集,與各個(gè)業(yè)務(wù)系統(tǒng)建立映射關(guān)系,構(gòu)建統(tǒng)一的主數(shù)據(jù)訂閱、發(fā)布和回收的接口服務(wù),基礎(chǔ)數(shù)據(jù)字典和標(biāo)準(zhǔn)術(shù)語(yǔ)的一致性,大大提高數(shù)據(jù)準(zhǔn)確性和數(shù)據(jù)質(zhì)量。
ODS是大數(shù)據(jù)中心體系結(jié)構(gòu)中的一個(gè)重要部分,該庫(kù)的數(shù)據(jù)為實(shí)時(shí)性數(shù)據(jù),并保證與源庫(kù)數(shù)據(jù)保持一致,能夠用于信息集成平臺(tái)服務(wù)開(kāi)放、查詢、統(tǒng)計(jì)等應(yīng)用。
將臨床各個(gè)業(yè)務(wù)系統(tǒng)的歷史業(yè)務(wù)數(shù)據(jù)經(jīng)過(guò)ETL抽取,可以快速的將海量歷史數(shù)據(jù)同步至ODS(數(shù)據(jù)庫(kù))中。歷史數(shù)據(jù)抽取完成后,再利用Oracle GoldenGate與Kaf ka消息隊(duì)列工具實(shí)現(xiàn)將生產(chǎn)端數(shù)據(jù)實(shí)時(shí)同步到ODS(數(shù)據(jù)庫(kù))中,這樣ODS數(shù)據(jù)倉(cāng)庫(kù)就搭建起來(lái)了。
在ODS搭建前,需要數(shù)據(jù)或者報(bào)表時(shí)由各個(gè)系統(tǒng)生成,但涉及跨系統(tǒng)關(guān)聯(lián)時(shí)數(shù)據(jù)難以關(guān)聯(lián)使用,并且直接從業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)對(duì)系統(tǒng)性能有一定影響。
在ODS搭建完成后,各個(gè)系統(tǒng)數(shù)據(jù)匯集到ODS,為各類應(yīng)用系統(tǒng)提供原始數(shù)據(jù)。消除系統(tǒng)間的隔閡和限制,可以從主題出發(fā),結(jié)合各個(gè)系統(tǒng)的ODS數(shù)據(jù)給出最全面準(zhǔn)確的信息。同時(shí)可以有效地減少生產(chǎn)環(huán)境的負(fù)擔(dān)。
臨床數(shù)據(jù)中心以患者為中心,在醫(yī)院就診過(guò)程中所產(chǎn)生的所有醫(yī)療數(shù)據(jù)信息都被送入臨床數(shù)據(jù)中心,實(shí)現(xiàn)患者臨床診療數(shù)據(jù)的集中展現(xiàn)。
臨床數(shù)據(jù)中心為了同時(shí)支持結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù),由大數(shù)據(jù)管理平臺(tái)進(jìn)行可視化管理、配置、監(jiān)控等,并將數(shù)據(jù)倉(cāng)庫(kù)實(shí)時(shí)變更的數(shù)據(jù)通過(guò)數(shù)據(jù)引擎及時(shí)推送到消息隊(duì)列對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后送到臨床數(shù)據(jù)中心更新。
醫(yī)院運(yùn)營(yíng)數(shù)據(jù)中心可對(duì)醫(yī)院臨床醫(yī)療、運(yùn)營(yíng)管理等多種數(shù)據(jù)的集中展現(xiàn)和分析,對(duì)醫(yī)院現(xiàn)有數(shù)據(jù)信息進(jìn)行整合應(yīng)用,以更大程度地發(fā)揮出所有數(shù)據(jù)的價(jià)值。運(yùn)營(yíng)數(shù)據(jù)中心以數(shù)據(jù)倉(cāng)庫(kù)實(shí)時(shí)變更的數(shù)據(jù)通過(guò)數(shù)據(jù)引擎及時(shí)推送到消息隊(duì)列對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后送到運(yùn)營(yíng)數(shù)據(jù)中心更新。
為了更好的展現(xiàn)數(shù)據(jù)中心實(shí)際運(yùn)行情況,方便醫(yī)院對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行管理,通過(guò)大數(shù)據(jù)中心管理平臺(tái)實(shí)現(xiàn)對(duì)存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、安全設(shè)備等基礎(chǔ)設(shè)備環(huán)境進(jìn)行綜合有效的管理,并實(shí)時(shí)推送業(yè)務(wù)系統(tǒng)運(yùn)行異常的告警和可視化問(wèn)題定位、性能檢測(cè)和預(yù)警分析。系統(tǒng)主要功能包括可視化數(shù)據(jù)集成、數(shù)據(jù)監(jiān)控平臺(tái)、統(tǒng)一的消息平臺(tái)。
在大數(shù)據(jù)中心建設(shè)工作中,中心的安全性至關(guān)重要,只有在安全的前提下,才能真正實(shí)現(xiàn)數(shù)據(jù)融合共享、開(kāi)放應(yīng)用。我院大數(shù)據(jù)中心利用VMWare的虛擬化技術(shù)和基于docker部署Oracle 19c,利用分布式存儲(chǔ)方式,有效保障數(shù)據(jù)中心的安全性。在網(wǎng)絡(luò)邊界部署了防火墻、網(wǎng)閘、入侵防御系統(tǒng)、態(tài)勢(shì)感知等安全設(shè)備來(lái)保障邊界安全。
360患者全息視圖是基于HL7數(shù)據(jù)規(guī)范,搭建的基于患者為中心的全息數(shù)據(jù)視圖,將患者歷次就診所產(chǎn)生的臨床數(shù)據(jù)匯總到Web應(yīng)用系統(tǒng),由Web應(yīng)用系統(tǒng)統(tǒng)一展現(xiàn)患者臨床數(shù)據(jù),解決醫(yī)院臨床數(shù)據(jù)不統(tǒng)一,不集中的現(xiàn)象?;谂R床數(shù)據(jù)中心(CDR),將多源異構(gòu)的數(shù)據(jù)進(jìn)行整合。基于患者患者主索引ID,查看患者當(dāng)前及其歷次所有就診信息,包括患者基本信息、診斷記錄、醫(yī)囑用藥、病歷文書(shū)、生命體征等臨床數(shù)據(jù),使分散在各個(gè)系統(tǒng)中的臨床診療數(shù)據(jù)的集中、直觀地展現(xiàn)給臨床醫(yī)護(hù)人員,實(shí)現(xiàn)醫(yī)療質(zhì)量效率雙提升。
醫(yī)院決策分析系統(tǒng)以醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ),通過(guò)對(duì)數(shù)據(jù)的標(biāo)準(zhǔn)化處理,采用可視化界面、簡(jiǎn)潔簡(jiǎn)便直觀操作,為醫(yī)院管理者提供一個(gè)多功能的智能決策分析平臺(tái)。對(duì)醫(yī)院各系統(tǒng)的業(yè)務(wù)數(shù)據(jù)進(jìn)行收集、整合、分析展示,加大全院范圍內(nèi)信息資產(chǎn)的利用率,提高信息分析的準(zhǔn)確性、一致性、時(shí)效性,不斷完善各個(gè)業(yè)務(wù)數(shù)據(jù)指標(biāo)和運(yùn)營(yíng)管理模式,為醫(yī)院管理提供科學(xué)的依據(jù),從而提升醫(yī)院的核心競(jìng)爭(zhēng)力。
醫(yī)院決策分析系統(tǒng)以移動(dòng)分析平臺(tái),運(yùn)營(yíng)決策與分析平臺(tái),實(shí)時(shí)監(jiān)控大屏為核心;其中移動(dòng)分析平臺(tái):從今日簡(jiǎn)報(bào)、昨日簡(jiǎn)報(bào)、門診業(yè)務(wù)、住院業(yè)務(wù)、等方面入手,為院領(lǐng)導(dǎo)提供全方位的運(yùn)營(yíng)相關(guān)的數(shù)據(jù)展示和預(yù)警分析,支持多個(gè)入口,例如微信、釘釘或醫(yī)院移動(dòng)OA端;運(yùn)營(yíng)決策與分析平臺(tái):主要面向醫(yī)院不同部門、不同角色,提供相對(duì)應(yīng)的主題和多維分析,通過(guò)分析國(guó)家和地方醫(yī)療政策,結(jié)合醫(yī)院管理決策所需,構(gòu)建了不同的多維主題包括門診主題、住院主題、醫(yī)務(wù)主題、醫(yī)保主題、手術(shù)主題、藥學(xué)主題、醫(yī)技主題、護(hù)理主題等;實(shí)時(shí)監(jiān)控大屏:從院長(zhǎng)大屏、醫(yī)務(wù)大屏、門診大屏、住院大屏、等業(yè)務(wù)主題入手,給醫(yī)院管理者一個(gè)全方位的實(shí)時(shí)運(yùn)營(yíng)數(shù)據(jù)展示和預(yù)警分析。同時(shí)在這三個(gè)核心基礎(chǔ)上擴(kuò)展出其他個(gè)應(yīng)用。
大數(shù)據(jù)中心的建設(shè),推動(dòng)醫(yī)院高質(zhì)量發(fā)展以及醫(yī)療服務(wù)由“信息化”向“數(shù)字化”的轉(zhuǎn)型。在其建設(shè)過(guò)程中首先要對(duì)醫(yī)院數(shù)據(jù)資產(chǎn)進(jìn)行全面掌握,對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行歸類、梳理和整合,其次再對(duì)數(shù)據(jù)進(jìn)行匯聚、標(biāo)準(zhǔn)體系建設(shè)、數(shù)據(jù)模型建設(shè)、指標(biāo)梳理、安全性建設(shè)等工作。一個(gè)高效、穩(wěn)定的大數(shù)據(jù)中心,在進(jìn)行系統(tǒng)的分析設(shè)計(jì)、開(kāi)發(fā)部署和管理運(yùn)維時(shí)必須遵循如下原則:一是數(shù)據(jù)的完整性原則;二是數(shù)據(jù)的標(biāo)準(zhǔn)化原則;三是數(shù)據(jù)的安全性原則;四是數(shù)據(jù)的可管理性原則;五是數(shù)據(jù)的可靠性原則;六是數(shù)據(jù)的服務(wù)開(kāi)放性與易用性原則;七是保護(hù)醫(yī)院現(xiàn)有系統(tǒng)的原則。