摘 要 目的:以兒童過(guò)敏性疾病臨床診療數(shù)據(jù)為基礎(chǔ)建立專病數(shù)據(jù)庫(kù),為開展多學(xué)科診療提供數(shù)據(jù)支撐,更大程度地發(fā)揮信息技術(shù)在推動(dòng)臨床診療水平提升、醫(yī)學(xué)科研進(jìn)步等方面的作用。方法:基于2013年1月—2018年7月在上海市兒童醫(yī)院就診的過(guò)敏性疾病患兒臨床診療數(shù)據(jù),通過(guò)提取—轉(zhuǎn)化—加載技術(shù),統(tǒng)一清洗后存儲(chǔ)為臨床業(yè)務(wù)數(shù)據(jù)。將原業(yè)務(wù)系統(tǒng)中的結(jié)構(gòu)化指標(biāo)進(jìn)行映射和歸一化處理,人工標(biāo)注非結(jié)構(gòu)化內(nèi)容,并利用自然語(yǔ)言處理技術(shù)進(jìn)行后續(xù)結(jié)構(gòu)化數(shù)據(jù)處理,最終建立數(shù)據(jù)模型,構(gòu)建兒童過(guò)敏性疾病專病數(shù)據(jù)庫(kù)。結(jié)果與結(jié)論:該專病數(shù)據(jù)庫(kù)包含16個(gè)條目、60個(gè)字段共6個(gè)主題數(shù)據(jù)模塊,完成了對(duì)333 029例過(guò)敏性疾病患兒臨床診療數(shù)據(jù)的采集和標(biāo)準(zhǔn)化,可為后續(xù)以數(shù)據(jù)庫(kù)為基礎(chǔ)的??乒芾砗洼o助決策提供支撐,實(shí)現(xiàn)海量臨床數(shù)據(jù)的存儲(chǔ)、挖掘和分析。
關(guān)鍵詞 兒童 過(guò)敏性疾病 專病數(shù)據(jù)庫(kù) 大數(shù)據(jù) 信息化
中圖分類號(hào):TP392; R195.4 文獻(xiàn)標(biāo)志碼:C 文章編號(hào):1006-1533(2024)09-0014-05
引用本文 紀(jì)和雨, 于廣軍. 兒童過(guò)敏性疾病專病數(shù)據(jù)庫(kù)的建設(shè)與展望[J]. 上海醫(yī)藥, 2024, 45(9): 14-18.
基金項(xiàng)目:上海市科委“科技創(chuàng)新行動(dòng)計(jì)劃”(22511101600)
Construction and prospects of a special disease database for allergic diseases of children
JI Heyu1, YU Guangjun2,3
(1. Ruijin Hospital, Shanghai Jiao Tong University School of Medicine, Shanghai 200025, China;
2. the Second Affiliated Hospital, The Chinese University of Hong Kong, Shenzhen, Shenzhen 518172, China; 3. Shanghai Children’s Hospital, School of Medicine, Shanghai Jiao Tong University, Shanghai 200062, China)
ABSTRACT Objective: To establish a special disease database based on clinical diagnosis and treatment data of pediatric allergic diseases so as to provide data support for multidisciplinary diagnosis and treatment and maximize the role of information technology in promoting the improvement of clinical diagnosis and treatment level and medical research progress. Methods: Based on the clinical diagnosis and treatment data of children with allergic diseases in Shanghai Children’s Hospital from January 2013 to July 2018, the clinical data was uniformly cleaned and stored using the extract-transform-load technology. The structured indicators in the original business system were mapped and standardized, while the unstructured content was manually labelled. Natural language processing technology was then applied for post-structured governance to create a specialized disease data model, which was used to build a dedicated pediatric allergic disease database. Results Conclusion: The special disease database consists of 6 thematic data modules, including 16 items and 60 fields. We have achieved the collection and standardization of clinical diagnosis and treatment data for 333 029 children with allergic diseases, and further explored the distribution of diseases. The establishment of a special database for pediatric allergic diseases has enabled the storage, mining, and analysis of massive clinical data in the real world, providing support for the subsequent expansion of database based specialized management and decision-making assistance.
KEY WORDS children; allergic diseases; special disease database; big data; informatization
過(guò)敏性疾病是由于變應(yīng)原對(duì)機(jī)體的刺激作用,進(jìn)而產(chǎn)生免疫異常反應(yīng)而引起的。我國(guó)的過(guò)敏性疾病患病率高達(dá)40%左右,且仍呈上升趨勢(shì)[1-2]。過(guò)敏性疾病可能是終身性的,但其發(fā)生與發(fā)展具有一定規(guī)律,稱為“過(guò)敏進(jìn)程”[3-4]。兒童常見(jiàn)的過(guò)敏性疾病有哮喘(幼兒時(shí)期稱為喘息)、過(guò)敏性鼻炎、過(guò)敏性結(jié)膜炎、濕疹、食物過(guò)敏等,涉及呼吸科、耳鼻喉頭頸外科、皮膚科、眼科、變態(tài)反應(yīng)科等多個(gè)臨床學(xué)科[5]。
1 建設(shè)兒童過(guò)敏性疾病專病數(shù)據(jù)庫(kù)的臨床需求
兒童過(guò)敏性疾病往往不是單獨(dú)存在,而是多種過(guò)敏性疾病同時(shí)出現(xiàn)在同一患兒身上,故常導(dǎo)致多臟器和多系統(tǒng)受累[6-7]。多學(xué)科診療如何應(yīng)用于疑難疾病的診斷與治療是近年來(lái)醫(yī)學(xué)界討論的熱點(diǎn)之一[8-9]。將多學(xué)科診療應(yīng)用于過(guò)敏性疾病的診療,對(duì)于提升醫(yī)院整體臨床診療水平、改善患兒生活質(zhì)量具有重要意義。因此,在信息化、互聯(lián)網(wǎng)、人工智能等新技術(shù)的幫助下,多學(xué)科診療這一新型臨床診療模式便成為提升過(guò)敏性疾病診療水平的重要突破點(diǎn)之一。
隨著醫(yī)院信息化建設(shè)的不斷深入,大量重要的臨床數(shù)據(jù)都積累在醫(yī)院信息化系統(tǒng)中,如何利用這些數(shù)據(jù)服務(wù)于循證醫(yī)學(xué)和臨床科研是各級(jí)醫(yī)療機(jī)構(gòu)面臨的挑戰(zhàn)和重要的研究方向。醫(yī)療信息化的傳統(tǒng)建設(shè)模式是以醫(yī)院信息系統(tǒng)(hospital information system, HIS)為核心,以科室為單位構(gòu)建信息系統(tǒng),其缺乏統(tǒng)一的數(shù)據(jù)采集標(biāo)準(zhǔn),也沒(méi)有相應(yīng)的數(shù)據(jù)存儲(chǔ)規(guī)范或指南,導(dǎo)致大部分?jǐn)?shù)據(jù)以非結(jié)構(gòu)化方式呈現(xiàn),數(shù)據(jù)質(zhì)量低下,臨床資料搜集和整理工作仍主要依靠人工,效率不高,數(shù)據(jù)難以再利用,不能在臨床和科研工作中發(fā)揮應(yīng)有的作用。上海市兒童醫(yī)院在梳理過(guò)敏性疾病業(yè)務(wù)流程的基礎(chǔ)上,通過(guò)挖掘、分析海量病歷數(shù)據(jù),以信息化手段為依托,構(gòu)建了過(guò)敏性疾病專病數(shù)據(jù)庫(kù)[10-11],以期為開展多學(xué)科診療提供數(shù)據(jù)支撐,更大程度地發(fā)揮信息技術(shù)在促進(jìn)臨床診療水平提升、醫(yī)療科研進(jìn)步等方面的作用。
2 兒童過(guò)敏性疾病專病數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)
2.1 數(shù)據(jù)處理
篩選上海市兒童醫(yī)院2013年1月—2018年7月的病歷數(shù)據(jù),納入標(biāo)準(zhǔn)為臨床診斷為哮喘(喘息)、過(guò)敏性鼻炎、濕疹的門診及住院患兒。數(shù)據(jù)來(lái)源包括醫(yī)院的電子病歷(electronic medical record, EMR)、HIS、實(shí)驗(yàn)室信息管理系統(tǒng)(laboratory information management system, LIMS)、影像存檔與通信系統(tǒng)(picture archiving and communication system, PACS)、護(hù)理系統(tǒng)等,結(jié)果共納入333 029例患兒的數(shù)據(jù)。通過(guò)提取—轉(zhuǎn)化—加載技術(shù)對(duì)醫(yī)院各子信息管理系統(tǒng)中的異構(gòu)數(shù)據(jù)進(jìn)行預(yù)處理,完成數(shù)據(jù)匯集。然后再經(jīng)過(guò)映射、清洗等過(guò)程,對(duì)數(shù)據(jù)進(jìn)行再審核、再校驗(yàn),以提高數(shù)據(jù)的準(zhǔn)確性和一致性。通過(guò)自然語(yǔ)言處理技術(shù),對(duì)非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。最后,對(duì)患者相關(guān)信息、醫(yī)生相關(guān)信息等隱私信息進(jìn)行脫敏處理,完成專病數(shù)據(jù)庫(kù)的數(shù)據(jù)處理。
2.2 數(shù)據(jù)集建立
數(shù)據(jù)集是專病數(shù)據(jù)庫(kù)信息模型的頂層設(shè)計(jì),代表了數(shù)據(jù)庫(kù)中數(shù)據(jù)的精度和廣度,決定了專病數(shù)據(jù)庫(kù)建成后的可用性、可擴(kuò)展性和未來(lái)潛在應(yīng)用價(jià)值。本專病數(shù)據(jù)庫(kù)經(jīng)對(duì)多種來(lái)源數(shù)據(jù)進(jìn)行整合,以患者為中心,建立了人口學(xué)信息、就診信息、診療過(guò)程信息、實(shí)驗(yàn)室檢查信息、臨床輔助檢查信息、隨訪信息6個(gè)主題數(shù)據(jù)模塊,共包括16個(gè)條目及各條目記錄的60個(gè)字段內(nèi)容(表1)。
2.3 數(shù)據(jù)生產(chǎn)
本專病數(shù)據(jù)庫(kù)數(shù)據(jù)來(lái)源HIS、EMR、LIMS、PACS等中除結(jié)構(gòu)化數(shù)據(jù)外,還有大量的文本信息。為此,利用自然語(yǔ)言處理技術(shù),結(jié)合醫(yī)學(xué)人工標(biāo)注、醫(yī)學(xué)圖譜等,建立適用于本專病數(shù)據(jù)庫(kù)的自然語(yǔ)言處理模型,對(duì)檢查檢驗(yàn)報(bào)告和病歷文本進(jìn)行結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換。表2列出了部分字段如癥狀及體征、實(shí)驗(yàn)室檢查、用藥情況、其他輔助治療等對(duì)應(yīng)的數(shù)據(jù)項(xiàng)。本專病數(shù)據(jù)庫(kù)嚴(yán)格按照該數(shù)據(jù)項(xiàng)的內(nèi)容對(duì)文本信息進(jìn)行標(biāo)注和提取,從而實(shí)現(xiàn)數(shù)據(jù)的規(guī)范化、結(jié)構(gòu)化。
2.4 數(shù)據(jù)庫(kù)建立
如上所述,通過(guò)利用提取—轉(zhuǎn)化—加載技術(shù)對(duì)數(shù)據(jù)進(jìn)行采集、映射、清洗和脫敏處理,并將它們存儲(chǔ)到SQL Server數(shù)據(jù)庫(kù)中,然后再利用自然語(yǔ)言處理技術(shù)和其他方法實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化,最終建立了過(guò)敏性疾病專病數(shù)據(jù)庫(kù),其整體架構(gòu)見(jiàn)圖1。
3 專病數(shù)據(jù)庫(kù)中患兒分布情況
本專病數(shù)據(jù)庫(kù)共納入333 029例患兒數(shù)據(jù),患兒的平均年齡為3.04歲,男性占59.3%。全部患兒中,濕疹196 080例,占58.9%;哮喘/喘息92 937例,占27.9%;過(guò)敏性鼻炎21 661例,占6.5%。有22 351例(6.7%)患兒罹患≥2種過(guò)敏性疾病,其中1 294例(5.8%)患兒罹患3種過(guò)敏性疾病。在罹患多種過(guò)敏性疾病患兒中,哮喘/喘息伴濕疹最為常見(jiàn)(13 711例,61.3%),其次是哮喘/喘息伴過(guò)敏性鼻炎(3 797例,17.0%)和過(guò)敏性鼻炎伴濕疹(3 549例,15.9%)。在0~1歲患兒中,濕疹是最常見(jiàn)的過(guò)敏性疾病類型;在2~5歲患兒中,過(guò)敏性鼻炎是最常見(jiàn)的過(guò)敏性疾病類型(表3)。
4 小結(jié)與展望
隨著健康醫(yī)療大數(shù)據(jù)時(shí)代的加速到來(lái),基于大數(shù)據(jù)技術(shù)的專病數(shù)據(jù)庫(kù)將成為臨床數(shù)據(jù)資源開發(fā)與利用的重要形式,成為醫(yī)務(wù)人員開展真實(shí)世界研究的有力工具。上海市兒童醫(yī)院以數(shù)據(jù)治理理論為指導(dǎo),通過(guò)數(shù)據(jù)處理、清洗、結(jié)構(gòu)化處理等技術(shù)實(shí)踐,建立了兒童過(guò)敏性疾病專病數(shù)據(jù)庫(kù),其中包含大量的真實(shí)世界數(shù)據(jù),既可為基礎(chǔ)研究和臨床科研提供思路和素材,同時(shí)又是數(shù)據(jù)挖掘、人工智能與機(jī)器學(xué)習(xí)的基礎(chǔ)。
未來(lái),對(duì)于本兒童過(guò)敏性疾病專病數(shù)據(jù)庫(kù),一方面可以根據(jù)臨床需要擴(kuò)大數(shù)據(jù)項(xiàng)覆蓋范圍,通過(guò)在醫(yī)聯(lián)體內(nèi)推廣專病數(shù)據(jù)庫(kù)建設(shè),將分散在不同醫(yī)聯(lián)體單位、不同醫(yī)療信息系統(tǒng)中的海量臨床信息規(guī)范集成起來(lái),形成可深度挖掘、綜合利用的兒童過(guò)敏性疾病診療大數(shù)據(jù),為開展相關(guān)多中心臨床研究提供強(qiáng)大保障;另一方面可以借助人工智能分析方法,如決策樹分類、深度神經(jīng)網(wǎng)絡(luò)等,對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行相關(guān)分析,建立起能輔助臨床決策、完善治療方案的智能型疾病管理模型,為患者提供更為優(yōu)質(zhì)、高質(zhì)的診療服務(wù)。
參考文獻(xiàn)
[1] 劉書楠, 陳宏翔, 熊鷹, 等. 常見(jiàn)過(guò)敏性疾病的健康促進(jìn)措施[J]. 重慶醫(yī)學(xué), 2024, 53(1): 149-154.
[2] 黎軍, 李芳, 劉書楠, 等. 社區(qū)及區(qū)縣婦幼保健院過(guò)敏性疾病防治重慶共識(shí)[J]. 重慶醫(yī)學(xué), 2022, 51(24): 4141-4148; 4154.
[3] 姜楠楠, 向莉. 濕疹→食物過(guò)敏→哮喘?“過(guò)敏進(jìn)程”面臨挑戰(zhàn)[J]. 中華臨床免疫和變態(tài)反應(yīng)雜志, 2022, 16(1): 106-107.
[4] 楊雨怡, 曾琳, 周薇, 等. 生命早期影響過(guò)敏進(jìn)程的因素[J]. 中華臨床免疫和變態(tài)反應(yīng)雜志, 2022, 16(1): 84-89.
[5] 紀(jì)和雨, 沈力, 王淼, 等. 基于上海市某兒童醫(yī)院過(guò)敏性疾病患兒照顧者對(duì)多學(xué)科診療的認(rèn)知和需求的調(diào)查與分析[J]. 中國(guó)醫(yī)院, 2020, 24(1): 32-34.
[6] Vassilopoulou E, Skypala I, Feketea G, et al. A multi- disciplinary approach to the diagnosis and management of allergic diseases: an EAACI Task Force [J]. Pediatr Allergy Immunol, 2022, 33(1): e13692.
[7] 李榮, 陳儀婷, 呂佳駿, 等. 上海市學(xué)齡兒童過(guò)敏性疾病流行現(xiàn)狀及相關(guān)因素分析[J]. 中國(guó)學(xué)校衛(wèi)生, 2021, 42(8): 1251-1256; 1260.
[8] 圣孟飛, 周姜平, 宋寶香, 等. 腫瘤多學(xué)科診療工作管理體系構(gòu)建的實(shí)踐與探索[J]. 中國(guó)醫(yī)院管理, 2021, 41(11): 48-50.
[9] 姜立, 文政偉, 高國(guó)棟, 等. 公立醫(yī)院實(shí)施多學(xué)科診療模式的SWOT分析[J]. 中國(guó)醫(yī)院管理, 2017, 37(8): 30-31.
[10] 崔陶, 陳悅悅, 梅玲, 等. 盆底功能障礙性疾病專病數(shù)據(jù)庫(kù)的建設(shè)與應(yīng)用[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2022, 17(9): 66-72; 99.
[11] 徐金銘, 陳浩宇, 楊斌, 等. 尿路結(jié)石專病數(shù)據(jù)庫(kù)建設(shè)及應(yīng)用[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2023, 18(6): 102-106; 113.