文 | 廣州醫(yī)科大學(xué)信息中心 黃勁榮
患者主索引(Enterprise Master Patient Index,EMPI)是指在特定區(qū)域范圍內(nèi),用以標(biāo)識每個(gè)患者實(shí)體并保持其唯一性的編碼。使用EMPI可將來自多個(gè)系統(tǒng)的患者標(biāo)識進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)同一患者多業(yè)務(wù)的關(guān)聯(lián)和患者信息的統(tǒng)一或關(guān)聯(lián),能有效解決多系統(tǒng)中識別患者身份的問題,是醫(yī)療大數(shù)據(jù)可以共享的基礎(chǔ)。2020年7月,有關(guān)部門發(fā)布《關(guān)于印發(fā)醫(yī)院信息互聯(lián)互通標(biāo)準(zhǔn)化成熟度測評方案(2020年版)的通知》確定醫(yī)院信息互聯(lián)互通測評7個(gè)等級,2021年12月,《“十四五”國家信息化規(guī)劃》中明確加快推動(dòng)各級醫(yī)療衛(wèi)生機(jī)構(gòu)信息系統(tǒng)數(shù)據(jù)共享及業(yè)務(wù)協(xié)同,建設(shè)互通互聯(lián)的各級全民健康信息平臺?;颊呱矸葑R別是互聯(lián)互通產(chǎn)生價(jià)值必須要解決的問題,尤其是同一個(gè)患者在不同醫(yī)療機(jī)構(gòu)、不同醫(yī)療信息系統(tǒng)里的標(biāo)識如何關(guān)聯(lián)的問題,更是進(jìn)行現(xiàn)代醫(yī)療大數(shù)據(jù)治理的基礎(chǔ)性工作。只有通過正確的身份識別,才有可能保證患者在不同場所、不同時(shí)間就醫(yī)信息的連續(xù)性和完整性,從而形成全面的患者信息數(shù)據(jù)。
通過構(gòu)建患者主索引(EMPI)來識別、匹配、合并、取消重復(fù)的數(shù)據(jù),凈化病人記錄,利用主索引可獲得完整而單一的病人視圖。EMPI為每個(gè)患者創(chuàng)建一個(gè)唯一標(biāo)識符,作為各業(yè)務(wù)系統(tǒng)進(jìn)行信息傳遞時(shí)的標(biāo)志;與相關(guān)系統(tǒng)的醫(yī)療記錄的標(biāo)識之間建立映射,以確保同一患者分散在不同系統(tǒng)中的醫(yī)療信息可以完整和準(zhǔn)確地關(guān)聯(lián)、整合在一起。EMPI構(gòu)建成功的關(guān)鍵是“匹配引擎”。匹配引擎可以是確定的或基于概率的,匹配引擎必須是可以配置和調(diào)整的,匹配引擎的準(zhǔn)確性和性能是決定EMPI解決方案價(jià)值的關(guān)鍵因素。匹配引擎配置的屬性應(yīng)遵循國家衛(wèi)計(jì)委2009年《電子病歷基本架構(gòu)與數(shù)據(jù)標(biāo)準(zhǔn)》的規(guī)定,包括該標(biāo)準(zhǔn)的H.02服務(wù)對象標(biāo)識、H.03人口學(xué)、H.04聯(lián)系人、H.05地址、H.06通信等數(shù)據(jù)組成,具體包括姓名、性別、出生日期、證件類型、證件號碼、聯(lián)系電話、聯(lián)系人、通信地址等。本文構(gòu)建的EMPI匹配引擎是將基于確定性匹配和基于概率性匹配相結(jié)合的方案,具體流程如圖1所示。
圖1 EMPI匹配引擎主要流程
交叉索引表是記錄匹配前初始化EMPI和最終生成EMPI的關(guān)系映射表,含有匹配的過程數(shù)據(jù),可用于實(shí)際匹配過程和后續(xù)的匹配結(jié)果質(zhì)控。
組合匹配是以患者任意的基本信息項(xiàng)進(jìn)行組合后匹配,屬于確定性匹配,如證件類型和證件號碼形成一個(gè)組合進(jìn)行匹配,不同組合可以按照設(shè)定優(yōu)先級,優(yōu)先級高的完全匹配后,后續(xù)組合不再匹配,自動(dòng)終止。組合匹配通常由身份辨識度高的患者基本信息項(xiàng)構(gòu)成,匹配的準(zhǔn)確率接近100%,如姓名、出生日期和聯(lián)系方式組合,社??ㄌ柦M合等。
通過給患者不同的基本信息項(xiàng)進(jìn)行權(quán)重設(shè)置和加權(quán)結(jié)果閾值設(shè)定,在實(shí)際匹配過程中,每一項(xiàng)基本信息可以選擇模糊匹配或者完全匹配獲得對應(yīng)的權(quán)重得分,并根據(jù)權(quán)重得分的加權(quán)結(jié)果與預(yù)設(shè)定閾值的關(guān)系,決定匹配的結(jié)果,通常有三種結(jié)果,即匹配上進(jìn)行合并處理,匹配不上進(jìn)行拆分處理,匹配疑似同一患者進(jìn)行人工判斷處理,權(quán)重匹配屬于基于概率的匹配,閾值設(shè)定需要綜合考慮匹配的效率和匹配的質(zhì)量。
根據(jù)以上EMPI構(gòu)建方法,進(jìn)行系統(tǒng)架構(gòu)設(shè)計(jì)如圖2所示。
圖2 EMPI系統(tǒng)架構(gòu)圖
系統(tǒng)主要包括以下模塊:
EMPI集成服務(wù):業(yè)務(wù)系統(tǒng)通過接口調(diào)用,進(jìn)行EMPI生成。
EMPI數(shù)據(jù)存儲:將EMPI映射的各類數(shù)據(jù)進(jìn)行集中存儲和記錄。
EMPI數(shù)據(jù)質(zhì)控:以EMPI為監(jiān)測主線,將EMPI疑似患者數(shù)據(jù)進(jìn)行人工處理,與此同時(shí),對按照匹配規(guī)則進(jìn)行自動(dòng)合并或者拆分的患者EMPI進(jìn)行隨機(jī)抽樣核查,以動(dòng)態(tài)調(diào)整匹配模式和匹配規(guī)則。
EMPI數(shù)據(jù)應(yīng)用:根據(jù)EMPI數(shù)據(jù)存儲中的交叉映射表對醫(yī)療大數(shù)據(jù)平臺中的所有患者數(shù)據(jù)進(jìn)行身份識別和處理,形成獨(dú)立的患者全病程的視圖,為臨床應(yīng)用和科學(xué)研究提供完整的數(shù)據(jù)支撐。
系統(tǒng)主要功能包括EMPI查詢、疑似待處理、歷史記錄查詢、組合配置管理和權(quán)重配置管理。
EMPI查詢功能:根據(jù)檢索條件查詢生成EMPI的患者明細(xì)數(shù)據(jù),并支持不同患者數(shù)據(jù)的對比分析,一旦發(fā)現(xiàn)EMPI生成錯(cuò)誤,還可以執(zhí)行合并或者拆分操作。
疑似待處理功能:將權(quán)重匹配過程中滿足疑似同一身份患者閾值范圍要求的患者通過人工判斷后執(zhí)行合并或者拆分操作。
歷史記錄查詢:用于查詢所有生成EMPI的過程記錄,便于追溯和審計(jì)核查。
組合配置管理:用于配置患者不同屬性組合并進(jìn)行優(yōu)先級排序。
權(quán)重配置管理:用于配置患者不同屬性的權(quán)重并進(jìn)行閾值設(shè)定。
構(gòu)建EMPI是醫(yī)療信息系統(tǒng)互聯(lián)互通產(chǎn)生價(jià)值的前提條件,通過EMPI實(shí)現(xiàn)患者不同時(shí)空下數(shù)據(jù)的關(guān)聯(lián),才能釋放數(shù)據(jù)的價(jià)值。EMPI主要應(yīng)用場景如下:
在構(gòu)建院級數(shù)據(jù)集成平臺過程中,通過EMPI的構(gòu)建,實(shí)現(xiàn)院內(nèi)不同業(yè)務(wù)系統(tǒng)的患者數(shù)據(jù)的關(guān)聯(lián),完成對患者在不同時(shí)間和不同系統(tǒng)產(chǎn)生的診療數(shù)據(jù)的整合,為患者診療和醫(yī)生的臨床科研提供高價(jià)值和便捷的數(shù)據(jù)支持。
在構(gòu)建區(qū)域患者健康信息檔案的過程,通過EMPI的構(gòu)建,實(shí)現(xiàn)患者在不同醫(yī)療機(jī)構(gòu)的診療數(shù)據(jù)的關(guān)聯(lián),完成患者健康信息檔案的建設(shè),一方面便于患者對于個(gè)人健康的管理,另一方面,也有利于醫(yī)療結(jié)構(gòu)對患者的病情診治。
在構(gòu)建國家級、省級、市級、區(qū)域級??茢?shù)據(jù)中心過程中,通過構(gòu)建不同??苹颊叩腅MPI,將指定區(qū)域的患者的所有診療數(shù)據(jù)進(jìn)行整合,能有效擴(kuò)展患者的數(shù)據(jù)樣本維度,能極大提升科研效率的同時(shí),增強(qiáng)科研數(shù)據(jù)分析的廣度及深度。
本文以國內(nèi)某高校的智慧醫(yī)療平臺建設(shè)為例,該平臺旨在實(shí)現(xiàn)大學(xué)的6家附屬醫(yī)院數(shù)據(jù)的互聯(lián)互通,形成校級3大數(shù)據(jù)中心——臨床數(shù)據(jù)中心、科研數(shù)據(jù)中心和運(yùn)營數(shù)據(jù)中心。將本文的EMPI構(gòu)建方法和系統(tǒng)設(shè)計(jì)應(yīng)用于智慧醫(yī)療平臺建設(shè)中,截至2023年6月底,累計(jì)識別出患者實(shí)體數(shù)約1064萬人,完成合并患者實(shí)體數(shù)約658萬人,去重率61.84%,通過抽查EMPI的合并結(jié)果,合并準(zhǔn)確率達(dá)到98.63%.
本文從實(shí)際問題出發(fā),提出了一種患者主索引(EMPI)的構(gòu)建方法,并通過系統(tǒng)架構(gòu)設(shè)計(jì)和功能設(shè)計(jì)在國內(nèi)某高校的智慧醫(yī)療平臺上進(jìn)行驗(yàn)證,取得了良好的驗(yàn)證效果,并對EMPI的應(yīng)用前景進(jìn)行分析總結(jié)。相信在數(shù)據(jù)已經(jīng)成為生產(chǎn)要素的時(shí)代大背景下,醫(yī)療數(shù)據(jù)互聯(lián)互通是大勢所趨,EMPI的構(gòu)建對于數(shù)據(jù)價(jià)值的持續(xù)釋放是不可或缺的,一定會(huì)得到更加廣泛的應(yīng)用。