廖 亮
?
數(shù)據(jù)挖掘技術在醫(yī)療信息管理中的應用
廖 亮
本文闡述了數(shù)據(jù)挖掘技術的基本概念,結合醫(yī)院信息數(shù)據(jù)的特點,探討數(shù)據(jù)挖掘技術在醫(yī)療信息管理中的應用。
隨著計算機技術的發(fā)展及其在醫(yī)療行業(yè)應用的深入,各級醫(yī)院都建設了醫(yī)院信息系統(tǒng),特別是大型醫(yī)院,隨著建設數(shù)字化醫(yī)院和無紙化辦公概念的引入,醫(yī)院對醫(yī)療信息系統(tǒng)依賴程度越來越高,建設的系統(tǒng)越來越多,也越來越復雜。就目前而言,簡單的對數(shù)據(jù)的查詢已經(jīng)逐漸無法滿足醫(yī)院管理者的需求,如何從大量的醫(yī)療數(shù)據(jù)中提取有助服務臨床和領導管理決策的數(shù)據(jù)顯得越來越重要,醫(yī)療數(shù)據(jù)挖掘由此應運而生。
數(shù)據(jù)挖掘(Data mining),是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、事先未知的、潛在有用的信息和知識的過程,其主要特點是對數(shù)據(jù)庫中的大量數(shù)據(jù)進行抽取、轉換、分析和其他模型化處理,并從中提取輔助決策的關鍵性數(shù)據(jù)。數(shù)據(jù)挖掘是數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge-Discovery in Databases,簡稱:KDD)中的重要技術,它不是用規(guī)范的數(shù)據(jù)庫查詢語音(如SQL)進行查詢,而是對查詢的內(nèi)容進行模式的總結和內(nèi)在規(guī)律的搜索。
醫(yī)療數(shù)據(jù)挖掘和其他領域的挖掘有所不同,其數(shù)據(jù)主要來源與病人診療過程中獲得的,包括了與病人的談話記錄,各種儀器的圖片或影像數(shù)據(jù),檢驗檢查數(shù)據(jù)等。具體特征歸納如下:
種類多 醫(yī)療數(shù)據(jù)主要來源于醫(yī)院日常經(jīng)營,包括有醫(yī)院管理中的人財物數(shù)據(jù),也有來自臨床的診療過程中如出入院、檢查、診療、醫(yī)囑等信息,數(shù)據(jù)類型包含有文字的、圖片的、語音的、數(shù)值的、動態(tài)影像等。
數(shù)量大 隨著國家全民醫(yī)保時代的來臨及人們對醫(yī)療保健的重視,到醫(yī)院就診人數(shù)與日俱增,加上越來越多的醫(yī)院高科技大型醫(yī)療設備(如MRI,PET,大C臂等)的投入使用,而這些大型設備每天都會產(chǎn)生上千兆字節(jié)的數(shù)據(jù)。
非完整性 病案登記信息不完整可能導致病例信息的不完整性,以及不同醫(yī)生在診療過程對醫(yī)學信息的表達和記錄具有不確定性和模糊性,有一定的主觀性。
冗余性 醫(yī)學數(shù)據(jù)庫有成型的數(shù)據(jù)模板,有大量的醫(yī)學數(shù)據(jù)倉庫,每天都有大量相同或相近的數(shù)據(jù)產(chǎn)生,造成了醫(yī)療數(shù)據(jù)的大量冗余。
隱私性 醫(yī)學信息包含大量的病人隱私信息,在數(shù)據(jù)挖掘過程總,既要對醫(yī)療數(shù)據(jù)進行合理挖掘應用,又要注重保護數(shù)據(jù)的安全性和機密性。
通過將海量的、模糊的、不完整的、冗余的原始醫(yī)療數(shù)據(jù)進行清理和過濾,轉換為合適挖掘的形式,然后根據(jù)數(shù)據(jù)挖掘的目標和數(shù)據(jù)特征,采用合適的技術和工具,建立合適的數(shù)據(jù)模型,運用于實際問題。
在臨床醫(yī)療活動中的應用
隨著醫(yī)療信息化的發(fā)展,各大醫(yī)院都逐步建立了自己的電子病歷(EMR)系統(tǒng),通過建立合適的數(shù)據(jù)挖掘模型,分析電子病歷里的數(shù)據(jù),將不同病種的各種檢驗檢查結果及各種病癥情況對應,形成一個龐大的醫(yī)療診斷知識倉庫,醫(yī)生在診斷病人時可以根據(jù)病人所做檢驗檢查結果及病癥情況,結合醫(yī)療知識庫快速進行診斷,提高醫(yī)生診斷效率。同時,還能記錄不同病種不同年齡段病人數(shù),方便醫(yī)生以后進行統(tǒng)計分析。
在醫(yī)保系統(tǒng)中的應用
國家對醫(yī)保投入逐年加大,可以說迎來了全民醫(yī)保時代,住院病人中各類醫(yī)保病人比例越來越高,醫(yī)保收入在醫(yī)院營業(yè)收入比重也越來越大。然現(xiàn)在醫(yī)保種類繁多,各種醫(yī)保政策也不盡相同,如何幫助醫(yī)生控制各類醫(yī)保病人費用總數(shù)及自費比例,已成為醫(yī)院管理一項重要工作。
利用數(shù)據(jù)挖掘技術建立醫(yī)院HIS與各類醫(yī)保的數(shù)據(jù)接口,建立藥品、材料、診療項目等的對照表,制作醫(yī)囑、費用傳輸模塊,實現(xiàn)HIS與醫(yī)保系統(tǒng)之間數(shù)據(jù)上傳與下載,便于醫(yī)保中心跟醫(yī)院對醫(yī)保病人進行實時審核、監(jiān)管等;通過數(shù)據(jù)挖掘技術在醫(yī)生站開醫(yī)囑時,根據(jù)病人醫(yī)保類型、醫(yī)生級別等,提示或限制藥品、診療等的使用;制作醫(yī)保病人費用查詢報表,使各科室能實時了解本科室醫(yī)保病人費用情況,合理控制醫(yī)療費用,同時,醫(yī)院醫(yī)保部門能實時了解各科室醫(yī)保病人自費藥品、材料等指標情況,便于對科室的監(jiān)督管理、醫(yī)保政策的把握。
在醫(yī)院管理中的應用
通過對各類醫(yī)療數(shù)據(jù)進行挖掘,可形成功能完整的數(shù)據(jù)報表系統(tǒng),為管理者們提供高可信的醫(yī)療數(shù)據(jù),對醫(yī)院管理決策、控制醫(yī)療費用、控制醫(yī)療成本、分析經(jīng)濟效益、規(guī)范醫(yī)生醫(yī)療行為提高醫(yī)療服務質(zhì)量等起到重要的作用;
通過對門急診病人就診時間、排隊等候時間、就診情況進行分析,制定合理的政策提高醫(yī)療服務質(zhì)量,合理優(yōu)化門診就醫(yī)流程;根據(jù)挖掘得出的結論,對全院醫(yī)護人員配置進行相應調(diào)整,合理安排人力資源,杜絕人力資源浪費和短缺。
在醫(yī)院市場分析中的應用
對病人來源、年齡、病種等信息進行挖掘統(tǒng)計,分析病人的區(qū)域特性、疾病特性、年齡特性等特征,制定合理的市場開拓政策,拓展醫(yī)療市場。
在科研活動中的應用
數(shù)據(jù)挖掘技術在醫(yī)療科研中應用也比較廣泛,如分析歷史病例資料輔助科研論文的撰寫,在基因研究中對基因序列功能構成的預測和分類預測,新藥研發(fā)過程中采用數(shù)據(jù)挖掘技術進行系統(tǒng)設計,以及腫瘤學、肝病學等??祁I域研究。
隨著醫(yī)療信息化的不斷發(fā)展,醫(yī)院數(shù)據(jù)量日益龐大,如何提取各類型數(shù)據(jù)間的關聯(lián),發(fā)現(xiàn)其規(guī)律,從繁雜的數(shù)據(jù)中提供對決策者有用的數(shù)據(jù),是當今醫(yī)療信息發(fā)展的一個重要研究方向。隨著醫(yī)療數(shù)據(jù)挖掘技術不斷深入,在醫(yī)院醫(yī)療活動中的應用越將來越廣泛,對醫(yī)院管理者做出明智決策,對醫(yī)生的診斷和治療,臨床、藥品、信息等合理化管理,對人類疾病和健康研究都起著極為重要的作用。
廖 亮
南華大學附屬南華醫(yī)院信息科廖亮,本科,工程師。
10.3969/j.issn.1001-8972.2016.11.017