王興強(qiáng) 孟 娜*
隨著醫(yī)療信息化技術(shù)的發(fā)展,醫(yī)院信息系統(tǒng)(hospital information system,HIS)中患者診療數(shù)據(jù)的質(zhì)量和完整性越來越重要。患者主索引數(shù)據(jù)的大量冗余,導(dǎo)致以患者主索引數(shù)據(jù)為索引的診療數(shù)據(jù)的低可用性。目前,患者主索引數(shù)據(jù)的管理主要有患者主索引指數(shù)(enterprise master patient index,EMPI)系統(tǒng)[1-4]和醫(yī)院信息集成平臺(tái)[5]兩種解決方案,其均為獨(dú)立的系統(tǒng),主索引數(shù)據(jù)能夠在HIS、實(shí)驗(yàn)室信息系統(tǒng)(laboratory information system,LIS)以及影像歸檔及傳輸系統(tǒng)(picture archiving and communication systems,PACS)等多系統(tǒng)間交互,但實(shí)現(xiàn)復(fù)雜,且成本高。而指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別及靜脈識(shí)別等方式均可確定身份的唯一性,可以與患者主索引進(jìn)行綁定用于識(shí)別和支付,但難以對(duì)當(dāng)前大量患者主索引數(shù)據(jù)進(jìn)行有效管理。為此,本研究提出了一種基于HIS本身的患者主索引數(shù)據(jù)的管理方法。
患者主索引數(shù)據(jù)產(chǎn)生于住院和門診就診兩個(gè)環(huán)節(jié)。住院需要登記患者的姓名、性別、出生日期、身份證號(hào)、地址、聯(lián)系人及電話等信息,要求信息完整而準(zhǔn)確。住院登記患者信息通過患者手工登記或者從門診醫(yī)生站開具的住院單中提取。長期以來門診患者信息登記都是采用手工登記的方式進(jìn)行登記錄入,其錯(cuò)誤率和信息不完整率較高,在當(dāng)前的HIS中已保存了大量的患者主索引數(shù)據(jù)[6-7]。
近年來,隨著信息化技術(shù)的發(fā)展出現(xiàn)了讀取患者身份證、社保卡及銀行卡等身份憑證在自助機(jī)或人工窗口辦理的方式,其準(zhǔn)確率較高,但重復(fù)登記辦理的情況比較多,尤其是很多醫(yī)院都采用了門診醫(yī)卡通系統(tǒng),患者若將就診卡丟失或遺忘時(shí)會(huì)重新辦理,從而造成患者信息重復(fù)登記的情況[8-9]。
患者主索引信息中含有身份證號(hào)、社??ㄌ?hào)及護(hù)照號(hào)等唯一身份識(shí)別(identification card,ID)確認(rèn)其身份,但HIS中存在大量一個(gè)ID信息多條主索引的情況;而對(duì)于主索引信息中不含有效ID信息的則很難確認(rèn)其身份的唯一性,尤其是歷史數(shù)據(jù)中的患者主索引信息不完整,直接導(dǎo)致了以不完整主索引數(shù)據(jù)為索引的診療數(shù)據(jù)的低利用率,在很大程度上造成醫(yī)療資源的浪費(fèi)并延誤患者的診療進(jìn)程。
患者主索引關(guān)鍵詞數(shù)據(jù)包括姓名、性別、出生日期、民族、身份證號(hào)、地址及聯(lián)系人等,按其不同屬性,可分為3類:①具有ID唯一性屬性的身份證號(hào)、社??ㄌ?hào)及護(hù)照號(hào)等關(guān)鍵詞, 患者主索引數(shù)據(jù)一般來源為住院患者登記或門診患者通過讀取有效身份憑證的方式登記,通過有效的ID可確定患者本人;②具有排他性屬性的性別、民族及姓氏等關(guān)鍵詞,患者信息只會(huì)出現(xiàn)信息登記的對(duì)或錯(cuò),而不會(huì)出現(xiàn)相似等不確定的情況;③具有強(qiáng)相似性屬性的名字、出生日期、地址及聯(lián)系人等關(guān)鍵詞,在進(jìn)行患者信息登記時(shí),患者姓名通過口述或患者手工登記人工錄入時(shí),存在錄入成形似的字或者諧音字等情況,患者出生日期,存在只登記錄入到年份或月份信息的情況,患者聯(lián)系地址登記不全,存在只登記錄入到區(qū)縣,沒有到街道門牌的情況。這些關(guān)鍵詞對(duì)于判定多條患者主索引記錄是否屬于同一患者時(shí)具有不確定性。
在患者主索引數(shù)據(jù)中,患者ID是確定患者唯一性的標(biāo)識(shí),多條患者主索引記錄即多個(gè)患者ID標(biāo)識(shí)多位患者,但目前大量存在同一患者有多條患者主索引、多個(gè)患者ID的情況[10-13]。為解決上述問題,采用一種患者主索引數(shù)據(jù)管理方法,通過創(chuàng)建患者身份主索引表,計(jì)算主索引相似度來實(shí)現(xiàn)。
患者身份主索引表,是指能夠確立患者身份唯一性的索引表,是患者主索引數(shù)據(jù)的索引表,由身份ID和患者ID為主鍵,從而確定患者身份的唯一性,將患者主索引中的患者ID數(shù)據(jù)存入該表中。通過ID信息查詢該表,可以得出該患者曾經(jīng)使用過的患者ID,從而得出該患者的歷史診療數(shù)據(jù)。ID信息可以是身份證號(hào)、社??ㄌ?hào)和護(hù)照號(hào),也可生成一個(gè)系統(tǒng)中唯一序號(hào)作為ID信息。
患者主索引相似度計(jì)算,是指將當(dāng)前主索引數(shù)據(jù)中的關(guān)鍵詞數(shù)據(jù)與其他主索引數(shù)據(jù)中的相應(yīng)關(guān)鍵詞數(shù)據(jù)進(jìn)行相似性計(jì)算。第一類具有身份唯一性屬性的關(guān)鍵詞不參與計(jì)算,第二類具有排他性屬性的關(guān)鍵詞和第3類具有強(qiáng)相似性屬性的關(guān)鍵詞參與計(jì)算。
第二類具有排他性屬性的關(guān)鍵詞wi相似性系數(shù)計(jì)算為公式1:
式中Ek,i為第k條主索引數(shù)據(jù)中第二類具有排他性屬性的關(guān)鍵詞wi的相似性系數(shù),w0,i為當(dāng)前主索引數(shù)據(jù)中的關(guān)鍵詞wi的值,wk,i為第k條主索引數(shù)據(jù)中的關(guān)鍵詞wi的值;i的取值范圍為0<i<m,m為第二類具有排他性屬性的關(guān)鍵詞的數(shù)量(見表1)。
表1 患者排他性關(guān)鍵詞相似性計(jì)算
第三類具有強(qiáng)相似性屬性的關(guān)鍵詞wj相似性系數(shù)計(jì)算,采用關(guān)鍵詞字符串匹配后長度比加權(quán)的方式,其計(jì)算為公式2:
式中Sk,j為第k條主索引數(shù)據(jù)中第三類具有強(qiáng)相似性屬性的關(guān)鍵詞wj的相似性系數(shù),w0,j為當(dāng)前主索引數(shù)據(jù)中的關(guān)鍵詞wj的值,wk,j為第k條主索引數(shù)據(jù)中的關(guān)鍵詞wj的值,match()為字符串匹配函數(shù),len()為取字符串長度函數(shù),cj為第三類具有強(qiáng)相似性屬性的關(guān)鍵詞wj的加權(quán)系數(shù);j的取值范圍為0<j<n,n為第三類具有強(qiáng)相似性屬性的關(guān)鍵詞的數(shù)量。
當(dāng)前主索引數(shù)據(jù)與第k條主索引數(shù)據(jù)相似度Vk的計(jì)算為公式3:
對(duì)患者主索引數(shù)據(jù)進(jìn)行唯一性管理,需要以患者來院就診為觸發(fā)點(diǎn),通過患者信息與HIS數(shù)據(jù)庫中患者主索引表的數(shù)據(jù)進(jìn)行相似性計(jì)算實(shí)現(xiàn),并經(jīng)患者確認(rèn)為本人數(shù)據(jù),患者主索引數(shù)據(jù)清洗流程如圖1所示。
圖1 患者主索引數(shù)據(jù)清洗流程圖
患者主索引數(shù)據(jù)的管理步驟為:①患者就診,獲取患者ID;②根據(jù)患者ID,檢索HIS數(shù)據(jù)庫的患者主索引表中當(dāng)前患者主索引信息,患者ID為患者主索引表中的主鍵,具有唯一性,檢索結(jié)果不為空;③判斷當(dāng)前患者主索引信息中是否具有唯一ID,如果沒有則跳到步驟“⑦”,否則如果唯一ID不為身份證號(hào)則跳到步驟“⑤”,否則如果唯一ID為有效的一代或二代身份證,則跳到步驟“④”進(jìn)行分析處理;④如當(dāng)前患者身份證號(hào)為15位一代身份證號(hào)碼,則轉(zhuǎn)換成18位二代身份證號(hào)碼,如當(dāng)前患者身份證號(hào)為18位二代身份證號(hào)碼,則轉(zhuǎn)換成15位一代身份證號(hào)碼。將患者一、二代身份證號(hào)互轉(zhuǎn),便于獲取該患者的歷史主索引信息;⑤按照當(dāng)前獲取的所有唯一ID檢索患者主索引表中的患者ID;⑥將當(dāng)前患者唯一ID和檢索的患者ID,添加保存至患者身份主索引表中,該表是能夠確立患者身份唯一性的索引表,是患者主索引數(shù)據(jù)的索引表,主鍵由唯一ID和患者ID共同構(gòu)成主鍵;⑦檢索患者主索引表中的第二類具有排他性屬性的關(guān)鍵詞和第三類具有強(qiáng)相似性屬性的關(guān)鍵詞;⑧根據(jù)相似度計(jì)算公式計(jì)算當(dāng)前患者主索引數(shù)據(jù)與其他主索引數(shù)據(jù)相似度V,剔除相似度小于預(yù)定閥值V0的數(shù)據(jù),并按照相似度V由大到小的順序?qū)χ魉饕斜砼判?;⑨就診患者確認(rèn)排序的主索引列表中本人的信息;⑩將經(jīng)過就診患者確認(rèn)過的患者ID添加保存至患者身份主索引表中,結(jié)束?;颊呱矸葜魉饕斫Y(jié)構(gòu)見表2。
表2 患者身份主索引表結(jié)構(gòu)
在HIS中,可根據(jù)患者身份主索引數(shù)據(jù),在門診或住院的醫(yī)生站、護(hù)士站或其他程序中,通過患者當(dāng)前使用的患者ID檢索患者身份主索引表,獲取該患者的唯一身份ID,再通過唯一身份ID檢索獲取該患者所有使用過的患者ID,從而得到該患者任意時(shí)間軸上的歷史診療數(shù)據(jù)。
在患者正常就診的過程中,根據(jù)患者當(dāng)前主索引信息中的關(guān)鍵詞,自動(dòng)計(jì)算并過濾出與患者當(dāng)前主索引信息高相似度的患者主索引列表,經(jīng)過患者確認(rèn)保存至患者身份主索引表中,實(shí)現(xiàn)患者主索引歷史數(shù)據(jù)的有效管理?;颊呔驮\過程中根據(jù)患者唯一身份ID,可得出該患者曾經(jīng)使用過的患者ID,從而得到該患者的歷史診療數(shù)據(jù),提高患者歷史診療數(shù)據(jù)的可用性,為醫(yī)生提供更加完善的患者歷史診療數(shù)據(jù),提高患者就診效率,縮短患者就診流程。