[摘要]本文從醫(yī)院的實(shí)際需求出發(fā)并結(jié)合當(dāng)前計(jì)算機(jī)信息技術(shù),簡(jiǎn)要介紹了醫(yī)院病案數(shù)據(jù)倉(cāng)庫(kù)的研究意義和方法。病案數(shù)據(jù)倉(cāng)庫(kù)不僅能處理報(bào)表,而且能夠提供數(shù)據(jù)分析,提供決策支持及醫(yī)療診斷支持,能夠幫助解決醫(yī)院高層管理及醫(yī)療診斷上的眾多非結(jié)構(gòu)化或半結(jié)構(gòu)化的問題,無疑是醫(yī)院病案管理的今后發(fā)展的方向。
[關(guān)鍵詞]醫(yī)院病案數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù) 病案管理
一、醫(yī)院病案數(shù)據(jù)倉(cāng)庫(kù)研究的意義
隨著醫(yī)療制度和社會(huì)醫(yī)療保險(xiǎn)體制的改革發(fā)展,“以病人為中心”的醫(yī)院全面質(zhì)量管理模式將突破過去傳統(tǒng)的經(jīng)驗(yàn)型管理模式。建立科學(xué)化決策的管理程序?qū)τ诩訌?qiáng)醫(yī)院的管理提高工作效率和醫(yī)療質(zhì)量,促進(jìn)醫(yī)院發(fā)展和保障人民身體健康是十分重要的。
內(nèi)蒙古醫(yī)學(xué)院第一附屬醫(yī)院是一所及醫(yī)療、科研、教學(xué)、預(yù)防為一體的大型“三級(jí)甲等”醫(yī)院,其醫(yī)療范圍主要覆蓋全區(qū)12盟市及周遍省市還有蒙古國(guó)部分地區(qū)。醫(yī)院在十多年的信息化建設(shè)中已經(jīng)建成了包括醫(yī)療、醫(yī)技、管理等部門的綜合性局域網(wǎng)絡(luò)。由于數(shù)據(jù)分散存儲(chǔ)和面向?qū)I(yè)操作,很難從業(yè)務(wù)數(shù)據(jù)中提取出分析性、決策性的信息。病案管理是醫(yī)院管理的重點(diǎn),目前在病案管理系統(tǒng)中已經(jīng)積累了大量的病人病案資料數(shù)據(jù),包括數(shù)據(jù)型、文字型以及靜態(tài)醫(yī)學(xué)圖像信息,記錄著病人病史、診斷、治療的全過程,尤其像病歷、化檢驗(yàn)、影像資料等歷史信息的保有價(jià)值相當(dāng)高。病案作為醫(yī)院診療信息的主要載體,體現(xiàn)著醫(yī)療護(hù)理的技術(shù)水平,也為醫(yī)療投訴和保險(xiǎn)部門理賠提供重要資料。
建立病案數(shù)據(jù)倉(cāng)庫(kù)就是要建立一種體系化的數(shù)據(jù)存貯環(huán)境,將分析決策所需的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,使分散的、不一致的操作數(shù)據(jù)轉(zhuǎn)換成集成的、統(tǒng)一的信息,通過運(yùn)用多維統(tǒng)計(jì)分析的方法,為醫(yī)生診斷、用藥提供指導(dǎo),如療效分析;還可以利用這些分析統(tǒng)計(jì)數(shù)據(jù)形成教學(xué)案例,通過趨勢(shì)分析提出某些職業(yè)病的防治措施,等等。病案數(shù)據(jù)倉(cāng)庫(kù)支持“以病人為中心”的全過程醫(yī)療服務(wù)和各醫(yī)療服務(wù)環(huán)節(jié)質(zhì)量?jī)?yōu)化和效率的提高,充分體現(xiàn)了現(xiàn)代醫(yī)院管理思想與計(jì)算機(jī)信息技術(shù)的完美結(jié)合,這對(duì)我國(guó)邊疆少數(shù)民族地區(qū)醫(yī)療資源相對(duì)不足的現(xiàn)狀而言,具有現(xiàn)實(shí)意義。
二、該領(lǐng)域目前國(guó)內(nèi)外研究概況
目前,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的發(fā)展將支持多媒體、支持結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),除了訪問傳統(tǒng)的RDBMS外,還可以從用戶所持有的Excel 數(shù)據(jù)和文本文件獲取數(shù)據(jù),即向通用數(shù)據(jù)庫(kù)發(fā)展,具有面向?qū)ο蟮哪芰?。高性能?shù)據(jù)庫(kù)服務(wù)器、并行數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)分析工具和人工智能代理工具的成熟和廣泛使用為數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用開辟了新思路。隨著Internet/Intranet技術(shù)的廣泛應(yīng)用和發(fā)展,數(shù)據(jù)倉(cāng)庫(kù)將與Internet/Intranet進(jìn)行很好的集成。
從國(guó)際發(fā)展趨勢(shì)看,醫(yī)院信息系統(tǒng)已從重在費(fèi)用信息管理的階段發(fā)展逐漸發(fā)展到面向臨床醫(yī)療信息管理的CIS(Clinic Information System)階段,包括電子病歷 (computer-based Patient Records CPR)系統(tǒng)、醫(yī)學(xué)影象系統(tǒng)(Picture Achieving and Communication System, PACS)、實(shí)驗(yàn)室檢查系統(tǒng)和遠(yuǎn)程醫(yī)療等交互式網(wǎng)絡(luò)信息服務(wù)功能的開發(fā)和應(yīng)用。目前國(guó)內(nèi)多數(shù)大、中型醫(yī)院都紛紛建成了醫(yī)院信息系統(tǒng)(HIS),但應(yīng)用的層次深度亦各不相同。有的停留在計(jì)算機(jī)網(wǎng)絡(luò)的物理連接,還做不到數(shù)據(jù)共享,多數(shù)停留在業(yè)務(wù)處理層,利用信息提高操作效率階段上。盡管借助電子病案,醫(yī)生可隨時(shí)查詢病人歷次就醫(yī)的處方信息、醫(yī)囑信息、檢查/檢驗(yàn)結(jié)果、診療過程、醫(yī)學(xué)影像等各種參照信息,利用這些信息后,醫(yī)生可以較快地做出診療方案并形成醫(yī)療文書,提高了工作效率,但作為數(shù)據(jù)分析、輔助高層決策并不是很好的解決方法。
三、研究?jī)?nèi)容及實(shí)現(xiàn)方案
1.本課題研究的重點(diǎn)內(nèi)容
本課題將以“病案” 為主題進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)。從病案管理系統(tǒng)等數(shù)據(jù)庫(kù)中,通過數(shù)據(jù)轉(zhuǎn)換服務(wù),包括數(shù)據(jù)驗(yàn)證、數(shù)據(jù)合并、數(shù)據(jù)清理等過程來匯集用于分析的原始數(shù)據(jù)。
通過確立不同的維度、粒度來構(gòu)建多維數(shù)據(jù)倉(cāng)庫(kù),并存儲(chǔ)在SQL Server聯(lián)機(jī)分析處理服務(wù)的多維數(shù)據(jù)集中。
前端采用應(yīng)用工具Visual Basic 6.0,使用ADOMD數(shù)據(jù)對(duì)象接口(DataObject Interface)以及 MDX (Multi-Dimension extension 多維擴(kuò)展)語(yǔ)法,通過OLE DB for OLAP Server來讀取多維數(shù)據(jù)集的數(shù)據(jù),最后形成多種形式的分析展示結(jié)果。
2.實(shí)現(xiàn)方案的選擇
病案數(shù)據(jù)常常由多個(gè)分散的、獨(dú)立的業(yè)務(wù)處理部門來錄入和使用,一般存入的只是近期的細(xì)節(jié)數(shù)據(jù)。對(duì)于這些大量細(xì)節(jié)數(shù)據(jù)的統(tǒng)計(jì)分析,一是嚴(yán)重影響分析效率,二是不利于對(duì)數(shù)據(jù)進(jìn)行長(zhǎng)期趨勢(shì)預(yù)測(cè)型的綜合、聚集。為了提高數(shù)據(jù)分析和決策的有效性,將適合分析的數(shù)據(jù)從事務(wù)處理環(huán)境中提取出來,建立數(shù)據(jù)倉(cāng)庫(kù)這一分析型數(shù)據(jù)平臺(tái),充分利用各種歷史數(shù)據(jù)、統(tǒng)計(jì)信息以便作出及時(shí)和準(zhǔn)確的決策。
醫(yī)院管理涉及人、財(cái)、物的科學(xué)化管理,數(shù)據(jù)倉(cāng)庫(kù)的使用必須保證能夠接收并重新組織醫(yī)療、人事和財(cái)務(wù)信息的各類數(shù)據(jù),完成綜合查詢與輔助決策。從醫(yī)院目前的實(shí)際情況出發(fā),建立一個(gè)龐大的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)不大現(xiàn)實(shí),而建立面向臨床醫(yī)療護(hù)理部門的小型數(shù)據(jù)倉(cāng)庫(kù)——數(shù)據(jù)集市具有現(xiàn)實(shí)意義。在數(shù)據(jù)倉(cāng)庫(kù)建立的初期就應(yīng)考慮系統(tǒng)的集成和擴(kuò)展性問題。
臨床醫(yī)療部門的各種聯(lián)機(jī)事務(wù)處理(OLTP)系統(tǒng)均采用MicrosoftSQL Server 2000數(shù)據(jù)庫(kù)系統(tǒng),為保持系統(tǒng)的兼容性,本數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)也采用Microsoft SQL Server 2000數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),利用DTS(Data Transformation Service,數(shù)據(jù)轉(zhuǎn)換服務(wù)),結(jié)合Analysis Service 的分析服務(wù)進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的建立。
(1)對(duì)適合病案分析的多種數(shù)據(jù)源進(jìn)行抽取和凈化
為保證進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)的一致性和完整性,需要對(duì)來自不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)行數(shù)據(jù)集成,它不是原有數(shù)據(jù)的簡(jiǎn)單拷貝,而是經(jīng)過統(tǒng)一、綜合、計(jì)算。 病案數(shù)據(jù)已經(jīng)有較為規(guī)范的數(shù)據(jù)格式和分類標(biāo)準(zhǔn)。
(2)確定數(shù)據(jù)倉(cāng)庫(kù)模型
以“病案”為主題建立數(shù)據(jù)倉(cāng)庫(kù),按時(shí)間、年齡、職業(yè)、疾病類型等劃分不同的維。在維的層次上可以進(jìn)一步按時(shí)間(年、月、日)劃分層次。維的層次越多,粒度層次越豐富,可以得到不同綜合層次的數(shù)據(jù)視圖。
(3)數(shù)據(jù)管理系統(tǒng)采用多維數(shù)據(jù)庫(kù)
多維數(shù)據(jù)庫(kù)為面向主題的分析決策提供了更大的靈活性。根據(jù)主題確定維的數(shù)目和內(nèi)容,在每個(gè)維中根據(jù)不同的匯總路徑和綜合方式建立不同的層次結(jié)構(gòu),支持?jǐn)?shù)據(jù)的鉆取分析以及數(shù)據(jù)的切片和切塊。
(4)采用Microsoft SQL Server 2000 中的數(shù)據(jù)倉(cāng)庫(kù)工具OLE DB數(shù)據(jù)庫(kù)引擎、數(shù)據(jù)轉(zhuǎn)換服務(wù)、數(shù)據(jù)更新、聯(lián)機(jī)分析處理工具,提供對(duì)多數(shù)據(jù)庫(kù)的訪問支持以及數(shù)據(jù)管理。
四、主要關(guān)鍵技術(shù)
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向數(shù)據(jù)分析型處理的數(shù)據(jù)環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)具有四個(gè)基本特征:面向主題的、集成的、不可更新的、隨時(shí)間不斷變化的。本課題主要關(guān)鍵技術(shù)如下:
1.面向主題進(jìn)行數(shù)據(jù)組織 2.多數(shù)據(jù)源的數(shù)據(jù)集成
3.元數(shù)據(jù)的管理 4.OLAP技術(shù) 5.?dāng)?shù)據(jù)更新
抽取的數(shù)據(jù)一旦進(jìn)入DW不再修改,DW的數(shù)據(jù)操作只有載入和提取,無需修改,數(shù)據(jù)相對(duì)穩(wěn)定。但不是說數(shù)據(jù)永遠(yuǎn)不變。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)必須不斷捕捉OLTP數(shù)據(jù)庫(kù)中變化的數(shù)據(jù),并追加到數(shù)據(jù)倉(cāng)庫(kù)中去,才能提供準(zhǔn)確及時(shí)地分析報(bào)告。數(shù)據(jù)更新應(yīng)保證新增或修改的數(shù)據(jù)的完整性,保持與多維數(shù)據(jù)集同步。
五、展望
對(duì)于有效的知識(shí)獲取需要在數(shù)據(jù)來源和方法上得到保障,今后應(yīng)該將數(shù)據(jù)倉(cāng)庫(kù)技術(shù)充分應(yīng)用于住院部份的信息存儲(chǔ)上,實(shí)現(xiàn)患者病例信息電子化,并使病例信息規(guī)范,為數(shù)據(jù)挖掘分析的實(shí)現(xiàn),提供良好的數(shù)據(jù)源保證。
參考文獻(xiàn):
[1]陳京民編著.據(jù)倉(cāng)庫(kù)原理、設(shè)計(jì)與應(yīng)用[M].國(guó)水利水電出版社.
[2]張世紅,徐國(guó)桓等.數(shù)據(jù)挖掘在醫(yī)學(xué)上的應(yīng)用[J].學(xué)情報(bào)工作2004,6.
[3]羅運(yùn)模等編著.QL Server 2000數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用于開發(fā)[M].民郵電出版社,2001,7 .
[4]孫微微,劉才興.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2005,1.
(作者單位:內(nèi)蒙古醫(yī)學(xué)院)