劉慶金 牛恒星 張寒彬
摘要:目的:為院長正確決策,醫(yī)療質(zhì)量評價,醫(yī)院等級評審,醫(yī)院管理流程優(yōu)化等提供數(shù)據(jù)支持。方法:通過ETL,CDC等多種技術(shù)抽取生產(chǎn)數(shù)據(jù)庫的數(shù)據(jù),構(gòu)建基于Oracle數(shù)據(jù)庫的數(shù)據(jù)倉庫。然后基于數(shù)據(jù)倉庫的數(shù)據(jù)進行分析,對生產(chǎn)數(shù)據(jù)庫和在線業(yè)務(wù)系統(tǒng)不產(chǎn)生影響。結(jié)果及結(jié)論:醫(yī)院決策支持系統(tǒng)的研究和實現(xiàn)將改變醫(yī)院管理現(xiàn)狀,提高醫(yī)院管理水平和效率,促進醫(yī)院健康發(fā)展。
關(guān)鍵詞:醫(yī)院管理;決策系統(tǒng);數(shù)據(jù)倉庫
中圖分類號:R-058 文獻標識碼:A
文章編號:1009-3044(2019)32-0011-03
1背景
隨著信息化不斷發(fā)展,對醫(yī)院信息化建設(shè)要求越來要高。多年來,醫(yī)院在信息化建設(shè)方面進行許多探索,實現(xiàn)不同程度的信息化。醫(yī)院信息化建設(shè)極大地提高醫(yī)院運行效率,為醫(yī)院能更好地服務(wù)病人提供保障。
現(xiàn)在,國內(nèi)大型醫(yī)院都有比較成熟的信息化系統(tǒng),醫(yī)院內(nèi)實施有HIS,LIS,PACS,EMR,OA,臨床路徑等系統(tǒng)。對系統(tǒng)進行集成,從業(yè)務(wù)系統(tǒng)查詢報表,進行統(tǒng)計,統(tǒng)計結(jié)果可以為醫(yī)院管理提供數(shù)據(jù)支持。但是從系統(tǒng)進行查詢報表存在許多問題,首先各個業(yè)務(wù)系統(tǒng)的統(tǒng)計口徑不一致,導(dǎo)致查詢出的報表結(jié)果存在很大的差別。其次,在業(yè)務(wù)系統(tǒng)中不能統(tǒng)計時間過長,否則,會影響業(yè)務(wù)系統(tǒng)的使用。最后,各個系統(tǒng)賬號和密碼不同,如果要進入不同的系統(tǒng),操作頻繁。因此,一套既能滿足業(yè)務(wù)部門的業(yè)務(wù)需求,又能為院長提供決策支持的系統(tǒng)顯得尤為重要。醫(yī)院決策支持系統(tǒng)可以查詢所有想要的信息,而不必登錄多個系統(tǒng)。醫(yī)院決策支持系統(tǒng)擁有集中,統(tǒng)一,宏觀的操作界面,更加簡潔,人性,滿足院長需求。
2系統(tǒng)設(shè)計
2.1系統(tǒng)架構(gòu)
醫(yī)院決策支持系統(tǒng)可以基于多層架構(gòu)實現(xiàn),在業(yè)務(wù)層,是醫(yī)院已經(jīng)應(yīng)用的各種業(yè)務(wù),包括HIS,ERM,LIS,RIS,PACS,手術(shù),麻醉,體檢,人事,財務(wù),人工管理以及其他業(yè)務(wù)系統(tǒng)。各個業(yè)務(wù)系統(tǒng)每天運行,運行過程當中,產(chǎn)生各種運行數(shù)據(jù),這些數(shù)據(jù)保存在各自系統(tǒng)的數(shù)據(jù)庫之中。每種業(yè)務(wù)系統(tǒng)使用的數(shù)據(jù)庫不盡相同,包括Oracle,SQLserver,DB2,My SQL,Sybase,Cache等多種數(shù)據(jù)庫。系統(tǒng)架構(gòu)如圖1所示。
醫(yī)院決策支持系統(tǒng)在后臺基于大型數(shù)據(jù)庫Oracle,構(gòu)建數(shù)據(jù)倉庫。利用ETL,CDC等多種技術(shù)從各個業(yè)務(wù)系統(tǒng)中,抽取各種數(shù)據(jù)庫中的源數(shù)據(jù)。通過這種方式,所有的數(shù)據(jù)查詢與檢索都基于構(gòu)建的數(shù)據(jù)倉庫,不占用各個業(yè)務(wù)子系統(tǒng)的生產(chǎn)數(shù)據(jù)庫資源,因此不會影響醫(yī)院業(yè)務(wù)系統(tǒng)的運行效率。
2.2數(shù)據(jù)倉庫
對醫(yī)院中已有的業(yè)務(wù)系統(tǒng)和信息系統(tǒng)中分散的數(shù)據(jù)庫,進行數(shù)據(jù)抽取,清理,經(jīng)過加工,匯總和整理,從而構(gòu)建醫(yī)院決策支持系統(tǒng)所需要的數(shù)據(jù)倉庫,利用這種方法消除源數(shù)據(jù)庫中數(shù)據(jù)的不一致性,從而保證數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的一致。通過數(shù)據(jù)倉庫,為前端查詢和分析作基礎(chǔ)。數(shù)據(jù)倉庫中的數(shù)據(jù)隨著時間變化,但同時大量數(shù)據(jù)保持相對穩(wěn)定。
醫(yī)院決策支持系統(tǒng)中數(shù)據(jù)倉庫的架構(gòu)已經(jīng)非常成熟,首先利用Flume進行數(shù)據(jù)采集,采集的數(shù)據(jù)經(jīng)過處理后被存儲下來,然后利用Hive,MR,SparkSQL等技術(shù)進行數(shù)據(jù)的分析和計算。分析和計算得到的有用的結(jié)果共享,為報表應(yīng)用提供數(shù)據(jù)。醫(yī)院決策支持系統(tǒng)中,主要對數(shù)據(jù)進行查詢操作,沒有數(shù)據(jù)庫的增加,刪除,修改操作。
數(shù)據(jù)倉庫設(shè)計中,首先要根據(jù)醫(yī)院的需求確定主題域的邊界,在醫(yī)院決策支持系統(tǒng)中需要提供的主題有:綜合運營主題,門診主題,住院主題,手術(shù)主題和臨床路徑主題。確定主題域后要確定各個主題的量度,綜合運營主題需要考慮的指標包括:門急診收入,住院收入,門診人均費用,住院人均費用,住院耗材,門診耗材等。門診主題需要考慮的指標包括:門診預(yù)約類型,門診量統(tǒng)計,門診病人來源,門診費用分類等。住院主題需要考慮的指標包括:床位資源,醫(yī)療組,平均住院費用,平均住院天數(shù),藥占比等。手術(shù)主題需要考慮的指標包括:手術(shù)例數(shù),出院手術(shù)占比,手術(shù)分級占比等。臨床路徑主題包括:使用率,入徑率,完成率,變異率等。
2.3ETL
ETL技術(shù)將數(shù)據(jù)從來源端經(jīng)過抽取,交互轉(zhuǎn)換,加載至目的端。醫(yī)院中各個業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)經(jīng)過抽取,清洗,轉(zhuǎn)換后加載到數(shù)據(jù)倉庫。形成標準統(tǒng)一的數(shù)據(jù)集合,為醫(yī)院決策提供分析依據(jù)。
在ETL設(shè)計中,主要分為三個部分。數(shù)據(jù)抽取,數(shù)據(jù)清洗轉(zhuǎn)換,和數(shù)據(jù)加載。ETL實現(xiàn)的方法很多,其中有ETL工具,SQL方式實現(xiàn)以及兩者結(jié)合的方式。當數(shù)據(jù)抽取的時候,對于與數(shù)據(jù)倉庫相同數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)源,抽取的方式采用兩者之間建立鏈接關(guān)系的方式即可。如果數(shù)據(jù)倉庫和數(shù)據(jù)源的數(shù)據(jù)庫系統(tǒng)不同,可以通過ODBC方式建立數(shù)據(jù)庫連接。對于文件類型數(shù)據(jù)庫,需要利用數(shù)據(jù)庫工具導(dǎo)入指定數(shù)據(jù)庫,然后從指定數(shù)據(jù)庫進行提取。對于數(shù)據(jù)量巨大的數(shù)據(jù)庫系統(tǒng),采用增量更新的方式進行抽取。
抽取后的數(shù)據(jù)需要進行沖洗和轉(zhuǎn)換,對于不完整的數(shù)據(jù),首先將其選擇出來,然后對缺失部分進行補充完整,然后再寫入數(shù)據(jù)庫。對于錯誤數(shù)據(jù),通過SQL語句查詢,交給醫(yī)院業(yè)務(wù)部門修改后,再進行抽取。對于重復(fù)數(shù)據(jù),刪除重復(fù)部分,然后進行抽取。有時候,對不一致數(shù)據(jù)還要進行數(shù)據(jù)轉(zhuǎn)換,這是一個不同業(yè)務(wù)系統(tǒng)數(shù)據(jù)整合的過程。有些業(yè)務(wù)系統(tǒng)的數(shù)據(jù)非常詳細,但是數(shù)據(jù)倉庫并不需要如此詳細的數(shù)據(jù),因此業(yè)務(wù)系統(tǒng)的數(shù)據(jù)需要按照數(shù)據(jù)倉庫粒度進行聚合。ETL需要記錄運行日志,日志包括執(zhí)行過程日志,錯誤日志和總體日志。如果ETL運行出錯,可以向系統(tǒng)管理員發(fā)送警告。
2.4CDC
CDCESJ是一種增量數(shù)據(jù)采集的解決方案,這種技術(shù)是在or-aele數(shù)據(jù)庫中使用的,這種技術(shù)可以識別上次提取后發(fā)生變化的數(shù)據(jù)。CDC技術(shù)結(jié)構(gòu)基于發(fā)布者和訂閱者模型,發(fā)布者可以捕捉系統(tǒng)中變化的數(shù)據(jù),訂閱者從發(fā)布者得到變化的數(shù)據(jù)。在Oracle系統(tǒng)中,CDC擁有一個發(fā)布者和多個訂閱者。