摘 要 近年來,真實世界研究作為重要的臨床研究類型逐漸引起廣大醫(yī)務(wù)人員的關(guān)注。醫(yī)院健康信息系統(tǒng)(health information system, HIS)/實驗室信息系統(tǒng)(laboratory information system, LIS)中儲存著海量的患者真實診療數(shù)據(jù)信息記錄,因此如何基于HIS/LIS中的臨床診療和實驗室檢查數(shù)據(jù)開展規(guī)范的臨床研究是一個熱門話題。本文從真實世界研究的概念入手,重點闡述醫(yī)院HIS/LIS數(shù)據(jù)的特點,以及基于其開展真實世界臨床研究關(guān)鍵環(huán)節(jié)和注意要點,以期為臨床工作者和研究人員提供參考依據(jù)。
關(guān)鍵詞 醫(yī)院健康信息系統(tǒng)/實驗室信息系統(tǒng) 真實世界研究 數(shù)據(jù)架構(gòu) 核心環(huán)節(jié)
中圖分類號:R-3 文獻(xiàn)標(biāo)志碼:C 文章編號:1006-1533(2024)09-0019-04
引用本文 王瑞平, 李斌. 基于醫(yī)院HIS/LIS開展臨床研究的關(guān)鍵環(huán)節(jié)和要點[J]. 上海醫(yī)藥, 2024, 45(9): 19-22; 36.
基金項目:上海市衛(wèi)生健康委員會衛(wèi)生行業(yè)臨床研究專項(202240371);上海申康醫(yī)院發(fā)展中心第二輪促進市級醫(yī)院臨床技能與臨床創(chuàng)新三年行動計劃——研究型醫(yī)師創(chuàng)新轉(zhuǎn)化能力培訓(xùn)項目(SHDC2022CRS053);上海市皮膚病醫(yī)院引進人才科研基金項目(2021KYQD01);上海人才發(fā)展基金資助項目(2021SHRCFZ01);上海市醫(yī)院協(xié)會醫(yī)院管理研究基金項目(X2022117);上海市皮膚病醫(yī)院IIT基金項目(LCIIT-2023-14)
Key aspects and points for conducting clinical research based on HIS/LIS
ABSTRACT In recent years, real world study as an important type of clinical research has gradually attracted the attention of medical professionals. Hospital health information system (HIS)/laboratory information system (LIS) stores a huge amount of real patient diagnosis and treatment data, therefore, how to conduct standardized clinical research based on these data from HIS/ LIS is a hot topic. Starting from the concept of real world research, this article focuses on the characteristics of hospital HIS/ LIS data, as well as the key aspects and points of real world clinical research so as to provide a reference basis for clinicians and researchers.
KEY WORDS health information system/laboratory information system; real world study; data architecture; core segments
真實世界研究(real world study, RWS)是運用流行病學(xué)方法,在真實無偏倚或偏倚較少的人群中,對某種或某些干預(yù)措施(包括診斷、治療、預(yù)后)的實際情況進行臨床研究。作為臨床試驗和藥品上市后藥物療效再評價的一種醫(yī)學(xué)研究新方法,RWS逐漸引起廣大醫(yī)務(wù)人員的關(guān)注和認(rèn)可。醫(yī)院的健康信息系統(tǒng)(health information system, HIS)和實驗室信息系統(tǒng)(laboratory information system, LIS)中分別記錄了每一位就診患者的真實診療和實驗室檢查數(shù)據(jù)信息,是開展真實世界臨床研究的重要數(shù)據(jù)來源[1]。因此,如何基于醫(yī)院的HIS/ LIS開展規(guī)范的臨床研究是一個熱門話題。本文闡述醫(yī)院HIS/LIS數(shù)據(jù)的特點,重點介紹基于其開展真實世界臨床研究的關(guān)鍵環(huán)節(jié)和注意要點,以期為臨床工作者和研究人員提供參考依據(jù)。
1 醫(yī)院HIS/LIS數(shù)據(jù)特點
醫(yī)院的HIS和LIS分別記錄了來院就診患者的真實診療信息和實驗室檢查數(shù)據(jù)。近年來,隨著信息技術(shù)的迅猛發(fā)展,醫(yī)院HIS/LIS記錄數(shù)據(jù)的結(jié)構(gòu)化越來越好,數(shù)據(jù)的完整度和數(shù)據(jù)質(zhì)量也得到了大幅度提升,這為開展臨床研究奠定了良好的基礎(chǔ)。醫(yī)院HIS/LIS的數(shù)據(jù)具有能夠反映臨床診療客觀實際、獲取數(shù)據(jù)快速便捷、數(shù)據(jù)量大、開展臨床研究成本低等優(yōu)勢,但也存在一定的局限性。其中包括:①因數(shù)據(jù)來源于真實的臨床診療環(huán)境,數(shù)據(jù)采集以滿足臨床診療需要為主,開展臨床研究時存在核心研究變量未采集或記錄不完整的風(fēng)險;②HIS記錄了大量文本信息,如患者的臨床表現(xiàn)、既往病史、臨床診斷、治療方案等內(nèi)容;③如果醫(yī)院未開展數(shù)據(jù)治理和質(zhì)量控制,那么HIS/LIS數(shù)據(jù)質(zhì)量一般較差,會存在非核心字段變量缺失、數(shù)據(jù)異常值等問題;④開展多中心研究時,如果各家醫(yī)院的HIS/LIS數(shù)據(jù)庫未進行統(tǒng)一的結(jié)構(gòu)化處理和設(shè)置時,數(shù)據(jù)庫將不能進行拼接整合,數(shù)據(jù)治理和清洗便需要花費較多的時間精力。因此,臨床醫(yī)務(wù)人員在應(yīng)用HIS/LIS數(shù)據(jù)開展臨床研究前應(yīng)知曉醫(yī)院HIS/LIS系統(tǒng)中數(shù)據(jù)的優(yōu)點和可能存在的缺陷,并在此基礎(chǔ)上進行合理應(yīng)用,才能提升基于HIS/LIS數(shù)據(jù)開展臨床研究的質(zhì)量。
2 基于醫(yī)院HIS/LIS數(shù)據(jù)開展臨床研究的關(guān)鍵環(huán)節(jié)
如前所述,醫(yī)院HIS/LIS數(shù)據(jù)能反映臨床診療客觀實際,具有數(shù)據(jù)量大,獲取數(shù)據(jù)便捷、開展研究成本低等優(yōu)勢;但同時也存在核心變量未采集、記錄不完整、文本信息需結(jié)構(gòu)化處理、數(shù)據(jù)異常值等問題。因此,臨床醫(yī)務(wù)工作者或研究人員基于醫(yī)院HIS/LIS數(shù)據(jù)開展真實世界臨床研究時需提前規(guī)劃和設(shè)計,注意此類研究的關(guān)鍵環(huán)節(jié),可以提升HIS/LIS數(shù)據(jù)規(guī)范,提高研究數(shù)據(jù)質(zhì)量。
2.1 醫(yī)院HIS/LIS的結(jié)構(gòu)化治理
盡管醫(yī)院HIS/LIS記錄了海量的臨床診療信息和實驗室檢查數(shù)據(jù),但要將這些數(shù)據(jù)用于臨床研究,須提前對HIS/LIS進行規(guī)劃和設(shè)計。首先,研究團隊?wèi)?yīng)開展長期研究規(guī)劃,明確研究病種,同時確定需采集數(shù)據(jù)的變量集和采集時間節(jié)點,變量名及對應(yīng)選項的設(shè)定要遵照國際臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(Clinical Data Interchange Standards Consortium, CDISC)編碼規(guī)范,以提高今后多中心研究數(shù)據(jù)庫的可比性和可合并性[2]。然后,在此基礎(chǔ)上,將確定好的數(shù)據(jù)變量集與HIS/LIS中的變量進行比對,在醫(yī)院信息部門協(xié)助下對不符合CDISC編碼規(guī)范的變量進行修改;同時根據(jù)編碼規(guī)范添加HIS/LIS中缺少的變量。須注意的是,研究人員不可過多地增加HIS/LIS中的變量,以防止影響臨床診療速度,增加門診醫(yī)生的負(fù)擔(dān)。最后,根據(jù)制定的變量集合,建立“文本數(shù)據(jù)”治理規(guī)則,將HIS/LIS中“文本信息”數(shù)據(jù)結(jié)構(gòu)化為“數(shù)值型”數(shù)據(jù),提高數(shù)據(jù)的可利用度。例如,對于銀屑病的臨床特征分型,可以建立治理規(guī)則“‘尋常型銀屑病’=1;‘關(guān)節(jié)病型銀屑病’=2;‘膿皰型銀屑病’=3,‘紅皮病型銀屑病’=4”。當(dāng)臨床醫(yī)師在HIS中給出“尋常型銀屑病”文本格式診斷時,系統(tǒng)將依據(jù)事先制定的結(jié)構(gòu)化規(guī)則,將該病例的銀屑病臨床分型變量設(shè)定為“1”;同理,當(dāng)臨床醫(yī)師在HIS中給出“膿皰型銀屑病”文本格式診斷時,系統(tǒng)將依據(jù)事先制定的數(shù)據(jù)結(jié)構(gòu)化規(guī)則,將該病例的銀屑病臨床分型變量設(shè)定為“3”。通過上述的結(jié)構(gòu)化數(shù)據(jù)治理,可以提高HIS/ LIS數(shù)據(jù)架構(gòu)的規(guī)范性,增強數(shù)據(jù)的可利用度,為真實世界臨床研究奠定基礎(chǔ)。
2.2 HIS/LIS診療數(shù)據(jù)完整度
在完成醫(yī)院HIS/LIS數(shù)據(jù)結(jié)構(gòu)化治理的基礎(chǔ)上,醫(yī)院應(yīng)采用結(jié)構(gòu)化改造后的HIS/LIS采集臨床診療數(shù)據(jù)。為保證臨床數(shù)據(jù)采集的完整度,醫(yī)院應(yīng)將HIS/LIS中的核心字段變量設(shè)置為“必填項”,并在醫(yī)院全體醫(yī)務(wù)人員中開展培訓(xùn),強調(diào)數(shù)據(jù)采集的原則和要求,提高一線醫(yī)生填寫數(shù)據(jù)的完整度。此外,醫(yī)院臨床研究中心須聯(lián)合信息科定期開展HIS/LIS數(shù)據(jù)完整度的質(zhì)量控制工作,發(fā)現(xiàn)問題應(yīng)及時解決,以提高醫(yī)院HIS/LIS整體數(shù)據(jù)的質(zhì)量和完整度。
2.3 HIS/LIS診療數(shù)據(jù)的縱向拼接
醫(yī)院HIS/LIS的結(jié)構(gòu)化治理和數(shù)據(jù)完整度保障了開展真實世界臨床研究的數(shù)據(jù)質(zhì)量。但是醫(yī)院HIS/LIS對臨床診療數(shù)據(jù)和實驗室檢查數(shù)據(jù)的存儲形式是“單次個案式”記錄。如圖1所示,每個患者的就診信息在HIS/ LIS中為一條記錄,占據(jù)數(shù)據(jù)庫中的一行。如果同一名患者存在多次就診(復(fù)診)記錄,那么該患者的就診信息在HIS/LIS中記錄為平行的多條記錄,圖中的“白力強”“鮑沈歡”和“蔡曉琦”3位患者,分別在2023年度就診了2次,4次和5次,因此在醫(yī)院HIS/LIS的原始數(shù)據(jù)庫中便分別有2條、4條和5條記錄。這些原始數(shù)據(jù)是無法進行直接分析的,需要將同一個患者不同時間點的就診記錄按照就診的時間先后順序縱向拼接起來,建立一個類似前瞻性“隊列”數(shù)據(jù)庫,才能為后續(xù)的統(tǒng)計分析奠定基礎(chǔ)。
醫(yī)院HIS/LIS數(shù)據(jù)的縱向拼接方法和過程如圖2所示。首先,研究者需將目標(biāo)數(shù)據(jù)庫(原始數(shù)據(jù)庫)按照“患者姓名”為主要排序字段和“就診時間”為次要排序字段進行排序,排序后以“身份證號碼”為關(guān)鍵唯一字段變量,標(biāo)注出可能存在重名的患者,防止在后續(xù)數(shù)據(jù)庫信息縱向合并時出現(xiàn)錯誤。其次,在目標(biāo)數(shù)據(jù)庫中找出非重復(fù)變量名,如上述銀屑病示例數(shù)據(jù)庫中的“就診時間”“PASI”和“BSA”評分。再次,將上述確定的非重復(fù)變量名按照患者中的“最多就診次數(shù)”進行必要的變量名擴展。如上述數(shù)據(jù)庫中,“白力強”“鮑沈歡”和“蔡曉琦”3位患者在2023年度分別有2次,4次和5次就診次數(shù),因此將“最多就診次數(shù)”確定為“5”,隨后將“就診時間”“PASI”和“BSA”3個變量擴展為“就診時間”“PASI”和“BSA”;“就診時間2”“PASI2”“BSA2”;“就診時間3”“PASI3”“BSA3”;“就診時間4”“PASI4”“BSA4”和“就診時間5”“PASI5”“BSA5”5組新的變量名。最后,將存在多次就診的患者相關(guān)信息按照就診時間先后順序縱向“騰挪”到相應(yīng)的新變量名下面,同時刪除其他重復(fù)的記錄信息。如圖2所示,“白力強”患者有2次就診記錄,按照時間順序,將第2次的就診信息縱向合并到“就診時間2”“PASI2”“BSA2”3個新變量名下?!磅U沈歡”患者共有4次就診記錄,按照就診的先后順序,將“鮑沈歡”的第2次就診信息縱向合并到“就診時間2”“PASI2”“BSA2”3個新變量名下;第3次就診信息縱向合并到“就診時間3”“PASI3”“BSA3”3個新變量名下;第4次就診信息縱向合并到“就診時間4”“PASI4”“BSA4”3個新變量名下,以此類推。
2.4 HIS/LIS診療數(shù)據(jù)的邏輯核查
醫(yī)院HIS/LIS中患者的診療信息和實驗室檢查結(jié)果按照就診順序縱向拼接后,還須開展數(shù)據(jù)庫變量之間的邏輯性核查。重點核查數(shù)據(jù)間的邏輯關(guān)聯(lián)是否正確,例如男性患者不應(yīng)出現(xiàn)“月經(jīng)”“孕產(chǎn)史”等信息內(nèi)容;女性患者不應(yīng)該有“睪丸癌”“前列腺炎”等類似的內(nèi)容出現(xiàn);不吸煙的患者不應(yīng)該填寫“每日吸煙量”“吸煙持續(xù)年限”“開始吸煙年齡”等信息,這些可以通過計算機軟件建立邏輯核查程序來實現(xiàn)。此外,研究者在使用HIS/ LIS數(shù)據(jù)前,還應(yīng)核查身高、體質(zhì)量、年齡等一般人口學(xué)特征是否存在不符合邏輯的異常數(shù)據(jù)(比如:新生兒體質(zhì)量3 500 kg,成年男性身高1.70 cm,孕婦年齡6歲等),以及時間數(shù)據(jù)間的邏輯性(比如:就診時間“2023年5月12日”早于發(fā)病時間“2023年4月29日”,煙齡大于年齡)等。數(shù)據(jù)邏輯核查可以直接在HIS/LIS系統(tǒng)中設(shè)置邏輯核查程序完成,也可以在數(shù)據(jù)導(dǎo)出后由人工完成。
3 基于醫(yī)院HIS/LIS數(shù)據(jù)開展臨床研究的實施要點
盡管開展基于醫(yī)院HIS/LIS數(shù)據(jù)的真實世界臨床研究是對患者臨床診療數(shù)據(jù)和實驗室檢查數(shù)據(jù)的二次利用,但仍需要符合臨床研究的基本原則和實施規(guī)范。
首先,研究團隊?wèi)?yīng)撰寫一份臨床研究方案,在研究方案中明確本研究如何基于HIS/LIS獲取研究數(shù)據(jù),同時在研究設(shè)計時遵從循證醫(yī)學(xué)的PICO原則,明確研究中的研究對象(participants)、干預(yù)措施(intervention)、對照(comparisons)和結(jié)果/結(jié)局(outcomes)[3];同時在研究方案的研究設(shè)計部分,應(yīng)同時參考隨機對照試驗報告統(tǒng)一標(biāo)準(zhǔn)(consolidated standards of reporting trials, CONSORT)聲明,在方案下細(xì)化臨床研究的“研究對象”“納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)”“樣本量估算”“研究對象分組”“干預(yù)措施”“療效指標(biāo)評價”“數(shù)據(jù)質(zhì)量控制”“數(shù)據(jù)集”和“統(tǒng)計學(xué)分析”等內(nèi)容,保障研究方案的規(guī)范性[4]。
其次,研究方案需要遞交醫(yī)院的“臨床研究學(xué)術(shù)委員會”進行學(xué)術(shù)評審,請專家審議基于醫(yī)院HIS/LIS數(shù)據(jù)開展的真實世界臨床研究是否具有科學(xué)價值和臨床應(yīng)用價值。當(dāng)研究方案獲得醫(yī)院學(xué)術(shù)評審立項后,該研究方案及相關(guān)材料還須進一步遞交醫(yī)院“倫理委員會”進行倫理審查,獲取倫理委員會的“免知情同意”或“泛知情同意”支持意見(圖3)。
最后,研究團隊將經(jīng)過學(xué)術(shù)評審和倫理審批的研究方案在中國臨床試驗注冊中心進行注冊登記,獲得注冊碼和批號后,方可導(dǎo)出數(shù)據(jù)進行數(shù)據(jù)統(tǒng)計分析、圖表制作和文章撰寫的臨床研究工作(圖3)。
參考文獻(xiàn)
[1] 王瑞平, 李斌. 臨床研究理論規(guī)范和實踐[M]. 上海: 上??茖W(xué)技術(shù)出版社, 2023.
[2] 王瑞平, 李斌. 臨床醫(yī)學(xué)研究數(shù)據(jù)庫的創(chuàng)建和質(zhì)量控制要點[J]. 上海醫(yī)藥, 2022, 43(1): 10-14.
[3] 王瑞平. 臨床研究規(guī)范設(shè)計PICO原則[J]. 上海醫(yī)藥, 2022, 43(3): 67-72.
[4] 王瑞平, 李斌. 隨機對照臨床試驗CONSORT聲明解讀[J].上海醫(yī)藥, 2022, 43(5): 58-62.