邊榮云
[摘 要] 醫(yī)院檔案管理信息化存在著海量信息數(shù)據(jù)無法有效利用的問題,對醫(yī)院醫(yī)療質量提高,管理水平提升的輔助決策支持功能不足。本文詳細探討了醫(yī)院決策支持系統(tǒng)中疾病轉歸統(tǒng)計分析數(shù)據(jù)倉庫(DW)的設計方法及過程,并在此基礎上構建聯(lián)機分析處理(OLAP)系統(tǒng),根據(jù)數(shù)據(jù)分析的需求選取OLAP主題,進行多維數(shù)據(jù)模型的設計,運用MDX多維查詢語言實現(xiàn)疾病轉歸統(tǒng)計數(shù)據(jù)分析,并應用決策樹對影響因素進行深度數(shù)據(jù)挖掘,實現(xiàn)高效管理和決策的支持作用。
[關鍵詞] 數(shù)據(jù)倉庫;疾病轉歸統(tǒng)計分析;決策支持
中圖分類號:R194 文獻標識碼:A 文章編號:2055-5200(2014)02-009-03
醫(yī)院檔案包括醫(yī)院診斷、治療、護理等醫(yī)療活動中形成的文字、圖表、影像等諸多材料,是醫(yī)院醫(yī)療業(yè)務信息的主要載體。經過系統(tǒng)歸納整理后可以為醫(yī)院醫(yī)療、教學、科研提供豐富基礎資料,通過病案分析和統(tǒng)計處理可以為醫(yī)院管理提供一手的詳實資料。
隨著信息技術的發(fā)展,圍繞著醫(yī)院信息系統(tǒng)(Hospital Information System, HIS)及配套接入開發(fā)的諸多系統(tǒng),醫(yī)院的管理模式實現(xiàn)了由經驗管理向信息管理的轉變。HIS系統(tǒng)以病人醫(yī)療信息、醫(yī)院經濟信息和醫(yī)院管理信息3條信息主線來提供技術支持平臺,使大量的醫(yī)院日常醫(yī)療、經濟和管理事務電子化,實現(xiàn)了高效的數(shù)據(jù)錄入、查詢、統(tǒng)計等功能,對提高醫(yī)院工作效率、質量和服務水平等方面起到重要作用[1]。檔案管理的信息化也在逐步完善,但是病案資料積累越多,信息化后的內容越豐富,信息流的作用越強,反饋出來的數(shù)據(jù)處理要求就越高,如果沒有一定的技術手段方法是實現(xiàn)不了這些要求的。
面對醫(yī)院信息數(shù)據(jù)量的迅速膨脹,傳統(tǒng)數(shù)據(jù)庫陷入“數(shù)據(jù)爆炸,知識貧乏”的境地。數(shù)據(jù)倉庫(Data Warehouse,DW)的出現(xiàn)有效地彌補了傳統(tǒng)數(shù)據(jù)庫在分析型應用上的缺陷。利用數(shù)據(jù)倉庫技術將傳統(tǒng)病案系統(tǒng)中所積累的海量數(shù)據(jù)背后隱藏的有價值的信息挖掘出來,從而獲取二次相關信息為醫(yī)院的決策管理、醫(yī)療、科研和教學服務提供了一種科學的解決方案[2]。本研究以患者疾病轉歸統(tǒng)計分析相關信息為數(shù)據(jù)源,建立了醫(yī)院醫(yī)療質量分析的多維數(shù)據(jù)模型及多維數(shù)據(jù)集的數(shù)據(jù)倉庫,通過聯(lián)機分析處理對疾病轉歸進行數(shù)據(jù)挖掘從而提供醫(yī)療決策的相關信息,將對醫(yī)院的管理產生積極作用。下文將對疾病轉歸統(tǒng)計分析決策支持系統(tǒng)的構建進行闡述。
1 數(shù)據(jù)倉庫的構建
1.1 疾病轉歸統(tǒng)計分析數(shù)據(jù)倉庫的設計
以住院病人療效為倉庫主題,建立星型倉庫模型,以一個事實表和4個維表為主要內容,其中維表分別為科室維,時間維,病種維和病人基本情況維,如圖所示。事實表包含聯(lián)機分析處理(OLAP)多維數(shù)據(jù)集中所有的度量值,包括住院天數(shù)、各項費用;維度表中的不同屬性應用文字,離散值等表示,如年齡段分為5段(0~20歲、21~30歲、30~50歲、50~60歲、60歲以上);疾病名稱以ICD-10主類、ICD-10亞類、ICD-10子類表示,維度關鍵字是與事實表關聯(lián)的橋梁,是用于查詢事實表數(shù)據(jù)的唯一標識符[3]。通過這種構架,可進行多維度查詢。
圖1 疾病轉歸統(tǒng)計分析數(shù)據(jù)倉庫星型模型
1.2 數(shù)據(jù)預處理
HIS系統(tǒng)中大量的數(shù)據(jù)信息中有一部分為空缺數(shù)據(jù)、不一致數(shù)據(jù)或包含有錯誤或存在偏倚的噪聲數(shù)據(jù),在進行數(shù)據(jù)挖掘前必須對數(shù)據(jù)進行預處理,清洗后的數(shù)據(jù)才能保證數(shù)據(jù)的一致性和有效性。數(shù)據(jù)預處理主要包括數(shù)據(jù)集成和數(shù)據(jù)清理兩部分,其中數(shù)據(jù)集成是將所有的病人的基本信息和醫(yī)療信息數(shù)據(jù)進行整合,將從病人主索引表中抽取的所有信息集成到統(tǒng)一的數(shù)據(jù)表中,對不一致的字段長度,不一致的賦值等進行數(shù)據(jù)轉換,整合為統(tǒng)一的格式,如日期形式2012-04-10轉換為時間為上定義的年,月,日格式:2012,4,10;數(shù)據(jù)清理是將缺陷數(shù)據(jù)且無法進行轉換的數(shù)據(jù)屏蔽,如篩查2012年的數(shù)據(jù)資料,經信息提取后發(fā)現(xiàn)存在部分2011年的數(shù)據(jù)資料時,可通過定義語句進行清洗。
1.3 數(shù)據(jù)倉庫的加載和轉換
在SQL Server 2000中使用Transact—SQL、數(shù)據(jù)轉換服務(DTS)和BSP將數(shù)據(jù)加載到數(shù)據(jù)倉庫中。DTS是以OLE DB或ODBC等接口技術連接數(shù)據(jù)源與數(shù)據(jù)目的[4],其驅動數(shù)據(jù)進行導入、導出等轉換操作,實現(xiàn)數(shù)據(jù)源與數(shù)據(jù)目的間的交換。轉換結構圖見圖2。通過上述操作過程,醫(yī)院數(shù)據(jù)倉庫建立完成,為后續(xù)多維數(shù)據(jù)的分析和數(shù)據(jù)挖掘進行了鋪墊。
圖2 DTS數(shù)據(jù)轉換流程圖
2 基于數(shù)據(jù)倉庫的疾病轉歸統(tǒng)計分析OLAP建模分析
多維數(shù)據(jù)集的構建完成后可進行以病人、疾病和費用等多個主題開展的OLAP分析。如通過醫(yī)療付款方式維度進行住院費用構成分析;通過月份或年份來分析總住院患者的變化趨勢,或在展現(xiàn)層上定義一些附加度量值,如“增減率”,以反映科室病種的變化趨勢。在進行OLAP分析中,可以運用切片、切塊,旋轉,鉆過和鉆透等操作程序,或通過編寫多維查詢語言MDX(Multi-Dimensional Expressions, 多維表達式)程序進行查詢,可以獲得不同匯總結果上的觀察數(shù)據(jù),也可以獲得住院患者相關因素間的關系,我們也可以選擇2個以上的維度的數(shù)據(jù)實現(xiàn)多維數(shù)據(jù)集的分析[5-6],如以“科室”和“費用類型”類型為關鍵詞。查詢各科室醫(yī)療費用占比的MDX代碼及結果如下圖3:
圖3 查詢結果示意圖
3 分析決策支持的實現(xiàn)
數(shù)據(jù)挖掘(Data Mining,DM)技術是決策分析的重要工具,目前應用比較廣泛的DM算法主要有基于規(guī)則系統(tǒng)的決策樹、聚類分析、神經網絡、支持向量機方法等[7]。在實際應用中,數(shù)據(jù)挖掘可為醫(yī)院管理決策提供多層面幫助。例如利用決策樹方法提取數(shù)據(jù)庫中的患者信息,包括性別、年齡、入院情況、藥品費用等各個屬性,構建相關性網絡,應用相應的運算方法分析患者信息,得到總醫(yī)療費用的強關聯(lián)項住院天數(shù)與藥品費,最終得到醫(yī)療費用的層決策樹,如圖4所示。決策樹由“Generate decision tree”給定的訓練數(shù)據(jù)產生,訓練樣本有表示住院費用的每個屬性以離散值的形式表示,運算過程中產生的各個節(jié)點為不同的分支點,顯示費用的不同影響屬性,而每一個節(jié)點內的所有樣本均為同一類別。從數(shù)據(jù)挖掘的最終結果看,藥品費用和住院天數(shù)是醫(yī)療費用的強影響點,與醫(yī)療費用呈正相關,住院天數(shù)越長,藥品費用越高則患者的總住院費越高。在模型判斷的基礎上進行有針對性的費用控制決策將是一種目的明確、針對性強,高效的決策支持方法[8-9]。
4 結論
針對醫(yī)院檔案利用效率低,海量數(shù)據(jù)對信息管理系統(tǒng)決策支持不足的現(xiàn)狀,嘗試應用數(shù)據(jù)倉庫和基于多維數(shù)據(jù)集的OLAP技術及數(shù)據(jù)挖掘技術,對醫(yī)學信息數(shù)據(jù)進行分析,挖掘出更多深層次的、有價值的信息,為醫(yī)院管理者提供了輔助決策的依據(jù)。同時,隨著醫(yī)院信息技術的不斷發(fā)展,還可以開發(fā)預算警示模塊等多個實用的,有針對性的模塊,建立面向醫(yī)院各級管理層的決策支持系統(tǒng),切實地、真正地實現(xiàn)醫(yī)院的精細化、循證化管理[10]。系統(tǒng)的開發(fā)使用為提高醫(yī)院管理水平提供了高效、可行的技術手段。
參 考 文 獻
[1] 馬剛, 劉天時,程國建. 基于數(shù)據(jù)倉庫技術的醫(yī)院信息系統(tǒng)應用研究[J]. 西安石油大學學報(自然科學版), 2010,25(4):99-102.
[2] 葉明全,宋念東.基于HIS的醫(yī)院數(shù)據(jù)倉庫設計與實現(xiàn)[J].計算機工程與設計,2008,29(3):779-781.
[3] 李慧宗,張學森. 面向主題的醫(yī)療費用分析數(shù)據(jù)倉庫建模[J]. 中小企業(yè)管理與科技, 2009(31):274.
[4] 周治宇,鄭昊. 基于醫(yī)院信息系統(tǒng)數(shù)據(jù)倉庫的設計[J]. 中國數(shù)字醫(yī)學, 2010,05(9):81-83.
[5] 鄭丹青. 基于OLAP技術的醫(yī)療信息多維數(shù)據(jù)集設計與分析[J]. 吉林師范大學學報:自然科學版, 2011,32(3):56-58.
[6] 孔琳. 基于HIS的數(shù)據(jù)倉庫構建及多維分析[J]. 醫(yī)學信息學雜志, 2011,32(11):6-9.
[7] 胡志東. 數(shù)據(jù)挖掘及數(shù)據(jù)倉庫綜述[J].黑龍江科技信息, 2010(26):100.
[8] 朱秋麗, 張濤, 丁云芳, 等. 呼吸道合胞病毒感染兒童住院費用影響因素的回歸樹分析[J]. 復旦學報(醫(yī)學版),2011,38(4):294-299.
[9] Lemon SC,Roy J,Clark MA,et a1.Classification and regression tree analysis in public health:methodological review and comparison with logistic regression[J].Ann Behav Met,2003,26(3):172-181.
[10] 唐熊,張巨發(fā),段昌奉,等.基于移動智能終端的醫(yī)院管理決策支持系統(tǒng)開發(fā)及應用[J].現(xiàn)代儀器與醫(yī)療,2013,19(1):47-49.
4 結論
針對醫(yī)院檔案利用效率低,海量數(shù)據(jù)對信息管理系統(tǒng)決策支持不足的現(xiàn)狀,嘗試應用數(shù)據(jù)倉庫和基于多維數(shù)據(jù)集的OLAP技術及數(shù)據(jù)挖掘技術,對醫(yī)學信息數(shù)據(jù)進行分析,挖掘出更多深層次的、有價值的信息,為醫(yī)院管理者提供了輔助決策的依據(jù)。同時,隨著醫(yī)院信息技術的不斷發(fā)展,還可以開發(fā)預算警示模塊等多個實用的,有針對性的模塊,建立面向醫(yī)院各級管理層的決策支持系統(tǒng),切實地、真正地實現(xiàn)醫(yī)院的精細化、循證化管理[10]。系統(tǒng)的開發(fā)使用為提高醫(yī)院管理水平提供了高效、可行的技術手段。
參 考 文 獻
[1] 馬剛, 劉天時,程國建. 基于數(shù)據(jù)倉庫技術的醫(yī)院信息系統(tǒng)應用研究[J]. 西安石油大學學報(自然科學版), 2010,25(4):99-102.
[2] 葉明全,宋念東.基于HIS的醫(yī)院數(shù)據(jù)倉庫設計與實現(xiàn)[J].計算機工程與設計,2008,29(3):779-781.
[3] 李慧宗,張學森. 面向主題的醫(yī)療費用分析數(shù)據(jù)倉庫建模[J]. 中小企業(yè)管理與科技, 2009(31):274.
[4] 周治宇,鄭昊. 基于醫(yī)院信息系統(tǒng)數(shù)據(jù)倉庫的設計[J]. 中國數(shù)字醫(yī)學, 2010,05(9):81-83.
[5] 鄭丹青. 基于OLAP技術的醫(yī)療信息多維數(shù)據(jù)集設計與分析[J]. 吉林師范大學學報:自然科學版, 2011,32(3):56-58.
[6] 孔琳. 基于HIS的數(shù)據(jù)倉庫構建及多維分析[J]. 醫(yī)學信息學雜志, 2011,32(11):6-9.
[7] 胡志東. 數(shù)據(jù)挖掘及數(shù)據(jù)倉庫綜述[J].黑龍江科技信息, 2010(26):100.
[8] 朱秋麗, 張濤, 丁云芳, 等. 呼吸道合胞病毒感染兒童住院費用影響因素的回歸樹分析[J]. 復旦學報(醫(yī)學版),2011,38(4):294-299.
[9] Lemon SC,Roy J,Clark MA,et a1.Classification and regression tree analysis in public health:methodological review and comparison with logistic regression[J].Ann Behav Met,2003,26(3):172-181.
[10] 唐熊,張巨發(fā),段昌奉,等.基于移動智能終端的醫(yī)院管理決策支持系統(tǒng)開發(fā)及應用[J].現(xiàn)代儀器與醫(yī)療,2013,19(1):47-49.
4 結論
針對醫(yī)院檔案利用效率低,海量數(shù)據(jù)對信息管理系統(tǒng)決策支持不足的現(xiàn)狀,嘗試應用數(shù)據(jù)倉庫和基于多維數(shù)據(jù)集的OLAP技術及數(shù)據(jù)挖掘技術,對醫(yī)學信息數(shù)據(jù)進行分析,挖掘出更多深層次的、有價值的信息,為醫(yī)院管理者提供了輔助決策的依據(jù)。同時,隨著醫(yī)院信息技術的不斷發(fā)展,還可以開發(fā)預算警示模塊等多個實用的,有針對性的模塊,建立面向醫(yī)院各級管理層的決策支持系統(tǒng),切實地、真正地實現(xiàn)醫(yī)院的精細化、循證化管理[10]。系統(tǒng)的開發(fā)使用為提高醫(yī)院管理水平提供了高效、可行的技術手段。
參 考 文 獻
[1] 馬剛, 劉天時,程國建. 基于數(shù)據(jù)倉庫技術的醫(yī)院信息系統(tǒng)應用研究[J]. 西安石油大學學報(自然科學版), 2010,25(4):99-102.
[2] 葉明全,宋念東.基于HIS的醫(yī)院數(shù)據(jù)倉庫設計與實現(xiàn)[J].計算機工程與設計,2008,29(3):779-781.
[3] 李慧宗,張學森. 面向主題的醫(yī)療費用分析數(shù)據(jù)倉庫建模[J]. 中小企業(yè)管理與科技, 2009(31):274.
[4] 周治宇,鄭昊. 基于醫(yī)院信息系統(tǒng)數(shù)據(jù)倉庫的設計[J]. 中國數(shù)字醫(yī)學, 2010,05(9):81-83.
[5] 鄭丹青. 基于OLAP技術的醫(yī)療信息多維數(shù)據(jù)集設計與分析[J]. 吉林師范大學學報:自然科學版, 2011,32(3):56-58.
[6] 孔琳. 基于HIS的數(shù)據(jù)倉庫構建及多維分析[J]. 醫(yī)學信息學雜志, 2011,32(11):6-9.
[7] 胡志東. 數(shù)據(jù)挖掘及數(shù)據(jù)倉庫綜述[J].黑龍江科技信息, 2010(26):100.
[8] 朱秋麗, 張濤, 丁云芳, 等. 呼吸道合胞病毒感染兒童住院費用影響因素的回歸樹分析[J]. 復旦學報(醫(yī)學版),2011,38(4):294-299.
[9] Lemon SC,Roy J,Clark MA,et a1.Classification and regression tree analysis in public health:methodological review and comparison with logistic regression[J].Ann Behav Met,2003,26(3):172-181.
[10] 唐熊,張巨發(fā),段昌奉,等.基于移動智能終端的醫(yī)院管理決策支持系統(tǒng)開發(fā)及應用[J].現(xiàn)代儀器與醫(yī)療,2013,19(1):47-49.