任月榮
隨著病案信息化的不斷發(fā)展,醫(yī)院借助信息技術(shù)手段從病案實體管理已逐步轉(zhuǎn)向?qū)Σ“感畔⒐芾砗蛿?shù)據(jù)挖掘與綜合利用上。大數(shù)據(jù)發(fā)展經(jīng)歷了由“感知、傳遞、反應”到“模仿、記憶、判斷、反應”,再到“感知、記錄、傳輸、存儲、處理、挖掘”的變化過程[1]。大數(shù)據(jù)技術(shù)的不斷發(fā)展,已漸漸滲透到各個領(lǐng)域,醫(yī)療行業(yè)病案大數(shù)據(jù)是醫(yī)、教、研、管的重要數(shù)據(jù)支撐。病案信息向智能化評價體系轉(zhuǎn)換,是實現(xiàn)病案信息價值的綜合利用,將病案信息轉(zhuǎn)化為標準信息服務的關(guān)鍵。從而在未來趨勢預測的基礎(chǔ)上,提高病案的管理水平,提高醫(yī)療服務質(zhì)量,為臨床和管理者提供決策支持。
從數(shù)據(jù)表現(xiàn)形式看,通常用“4V”來概括大數(shù)據(jù)的特征[2]。(1)Volume(大量):數(shù)據(jù)體量巨大。容量由TB量級到EB量級。(2)Variety(多樣):數(shù)據(jù)類型繁多。分為結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。(3)Velocity(高速):處理速度快。這是區(qū)分傳統(tǒng)數(shù)據(jù)挖掘的最本質(zhì)特征。(4)Value(價值):價值密度低。通過強大的算法,合理利用低密度價值數(shù)據(jù)對其進行正確分析,迅速完成數(shù)據(jù)“提純”成為急下待解決的難題。上述特征描述了大數(shù)據(jù)的普遍特征,然而“運用”才是大數(shù)據(jù)最終的價值體現(xiàn)。
病案信息是指有關(guān)患者健康情況的文件資料[3]。從病案信息的特殊性看,其具有“4C”的特征。(1)Continuity(連續(xù)):隨患者就診次數(shù)增加而增加。(2)Confidentiality(保密):涉及患者基本信息和病情描述,沒有授權(quán)不得隨意公開。(3)Catholicity(普遍):普遍存在于國內(nèi)外各等級醫(yī)療機構(gòu)。(4)Copy(復制):個體病案信息是可以復制、影印。
習近平在實施國家大數(shù)據(jù)戰(zhàn)略加快建設(shè)數(shù)字中國中強調(diào):推動實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源整合和開放共享;并指出:善于獲取數(shù)據(jù)、分析數(shù)據(jù)、運用數(shù)據(jù)使大數(shù)據(jù)在各項工作中發(fā)揮更大作用[4]。
大數(shù)據(jù)挖掘的本質(zhì)就是通過海量歷史數(shù)據(jù),分析和發(fā)現(xiàn)一些潛在的規(guī)律。他的意義就是利用潛在的規(guī)律預測未來可能發(fā)生的事。大數(shù)據(jù)挖掘就是智能統(tǒng)計分析的最終體現(xiàn),是統(tǒng)計學的升級。
在病案建設(shè)發(fā)展過程中,信息累積是構(gòu)建大數(shù)據(jù)挖掘與決策支持的基礎(chǔ)。在完善和優(yōu)化信息化功能,建設(shè)以患者服務為目標的同時,要突破未來病案管理的瓶頸,亦要“統(tǒng)籌規(guī)劃病案信息資源”“建立完善病案信息管理體系”“加快建立病案信息技術(shù)體系”和“實現(xiàn)衛(wèi)生事業(yè)的科學化智能化的管理與決策”。
在頂層設(shè)計上,統(tǒng)籌建設(shè)避免重復;充分利用現(xiàn)有病案資源和基礎(chǔ)設(shè)施,統(tǒng)籌醫(yī)療數(shù)據(jù)資源,加強數(shù)據(jù)的匯聚整合和關(guān)聯(lián)分析。
推動病案信息資源共享。明確病案信息共享范圍、使用權(quán)利和義務,以及使用方式等;建立統(tǒng)一使用接口和交換標準,推動醫(yī)療機構(gòu)間信息資源共享[5]。
建立健全一套完整全面的病案信息管理體系[6],充分發(fā)揮病案信息的價值,促進病案管理日趨完善。嚴格執(zhí)行《醫(yī)療機構(gòu)病案管理規(guī)定》和《病歷書寫基本規(guī)范》等制度,同時依照相關(guān)法律法規(guī),結(jié)合本院實際制定一系列具體程序和可行性規(guī)章制度,做到有章可循、有法可依。
完善病案信息標準體系。一是病案信息標準化的完善,國際疾病分類標準編碼的擴展與完善和醫(yī)學數(shù)字成像和通訊標準的完善,打造更加完善的醫(yī)療共享標準。二是醫(yī)療信息交換格式的標準化,結(jié)合衛(wèi)生信息交換標準的設(shè)計思想,選擇制定適合我國實際和當前技術(shù)水平的衛(wèi)生信息標準。
在病案大數(shù)據(jù)全生命周期管理中,加快建立科學可行的病案信息技術(shù)體系。在病案信息管理、挖掘分析以及信息應用等方面,通過研發(fā)非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),重點攻關(guān)病案信息數(shù)據(jù)管理(數(shù)據(jù)采集、數(shù)據(jù)處理、大數(shù)據(jù)存儲)、智能分析、挖掘算法和可視化應用,以及建模方法等關(guān)鍵技術(shù),利用病案大數(shù)據(jù)的價值分析,提升病案管理和輔助決策支持能力。
病案數(shù)據(jù)挖掘與決策支持體系的建立,對醫(yī)療衛(wèi)生管理者意義在于:一是輔助醫(yī)療資源的合理分配;二是輔助醫(yī)療政策的制定和實施;三是輔助醫(yī)療費用的合理制定。在衛(wèi)生事業(yè)管理的關(guān)鍵環(huán)節(jié)萃取病案信息之精華,其價值有助于管理者科學化智能化的管理與決策,有助于醫(yī)療政策的制定優(yōu)化和落實,有助于醫(yī)療資源的合理分配,使政策更具活力。
病案數(shù)據(jù)挖掘與決策支持體系的構(gòu)建離不開數(shù)據(jù)中心的建設(shè)[7-10],其架構(gòu)主要包括云平臺環(huán)境、病案信息采集與預處理平臺、病案大數(shù)據(jù)存儲與交換平臺、病案信息挖掘與分析平臺和可視化智能決策支持平臺(BI)五大平臺。通過統(tǒng)一部署云平臺環(huán)境,經(jīng)過數(shù)據(jù)采集清洗形成標準數(shù)據(jù)進行存儲,構(gòu)建數(shù)據(jù)分析模型用可視化的方法提供給管理者,實現(xiàn)價值數(shù)據(jù)的共享利用。
云平臺環(huán)境:主要包括硬件平臺、網(wǎng)絡(luò)環(huán)境、操作系統(tǒng)、數(shù)據(jù)存儲等。
病案信息采集與預處理平臺:包括內(nèi)部系統(tǒng)數(shù)據(jù)、醫(yī)聯(lián)體數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)三方面,尤其依賴于內(nèi)部系統(tǒng)病案數(shù)據(jù)的積累。經(jīng)過數(shù)據(jù)采集過濾,使分散存在的不同規(guī)模不同結(jié)構(gòu)的數(shù)據(jù)經(jīng)過過濾清洗、關(guān)聯(lián)、分析、加工后提供給數(shù)據(jù)存儲與交換平臺。
病案大數(shù)據(jù)存儲與交換平臺:構(gòu)建基于Hadoop技術(shù)[11]的大數(shù)據(jù)存儲與交換平臺是病案大數(shù)據(jù)的核心,通過構(gòu)建不同醫(yī)療機構(gòu)間的編碼規(guī)范、接口標準、協(xié)作標準,共享公共數(shù)據(jù)、數(shù)據(jù)字典及分布式數(shù)據(jù)存儲,實現(xiàn)病案信息結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的集中存儲和交換。
病案信息挖掘與分析平臺:用決策樹、聚類算法、人工智能、神經(jīng)網(wǎng)絡(luò)和統(tǒng)計分析等模型,對病案信息挖掘和分析。
可視化智能決策支持平臺(BI):通過數(shù)據(jù)挖掘分析技術(shù)建立多維分析模型、專題分析模型,將價值數(shù)據(jù)以動態(tài)直觀的圖表形式展現(xiàn)給管理者,為其提供依據(jù)和輔助決策建議。
基于疾病診斷相關(guān)分組的預定額付費方式是指基于疾病診斷相關(guān)分組為基礎(chǔ)的預定額付費方式[3]。構(gòu)建病案信息大數(shù)據(jù)挖掘與決策分析體系的價值在于提供給管理者相對客觀準確的分析數(shù)據(jù)和輔助決策,實現(xiàn)多家醫(yī)療機構(gòu)的長期跟蹤建模形成臨床信息數(shù)據(jù)集。
從廣義上講,醫(yī)療衛(wèi)生資源是人類開展醫(yī)療衛(wèi)生保健活動所使用的社會資源[12]。通過統(tǒng)籌規(guī)劃病案信息資源,實現(xiàn)醫(yī)院間、省市間、甚至全國范圍內(nèi)的醫(yī)療信息數(shù)據(jù)共享,從而獲得各種流行病分布情況,達到合理分配醫(yī)療資源的目的。
隊列研究方法可直接計算測量疾病危險強度的指標,故在流行病學病因研究中被廣泛應用。利用病案大數(shù)據(jù)可以獲得隊列研究的大數(shù)據(jù)源,避免了數(shù)據(jù)錄入、查閱和隨訪造成的信息偏倚。
大數(shù)據(jù)技術(shù)應用于病案信息管理,對醫(yī)療決策和服務發(fā)揮巨大的支撐作用?;诓“复髷?shù)據(jù)挖掘與決策支持體系建成后,病案大數(shù)據(jù)的研究與應用將進入新的階段。通過多渠道對病案信息采集過濾后形成集中存儲的標準數(shù)據(jù),經(jīng)過數(shù)據(jù)挖掘提取潛在的信息價值,為管理者提供決策支持,為衛(wèi)生事業(yè)的蓬勃發(fā)展奠定堅實的基礎(chǔ)。