林毅,渠田田,錢碧云,3,呂文文,俞章盛,4,馮鐵男
區(qū)域性臨床研究整合平臺(tái)的建設(shè)探討
林毅1,渠田田2,錢碧云2,3,呂文文2,俞章盛2,4,馮鐵男2
1.上海港訊電子科技有限公司,上海 200023;2.上海交通大學(xué)醫(yī)學(xué)院臨床研究中心,上海 200025;3.臨床研究促進(jìn)發(fā)展中心 上海申康醫(yī)院發(fā)展中心,上海 200041;4.上海交通大學(xué)數(shù)學(xué)科學(xué)學(xué)院,上海 201100
探討國內(nèi)建立區(qū)域性臨床研究整合平臺(tái)的可行方案,為研究者發(fā)起的臨床研究(investigator initiated trial,IIT)提供數(shù)據(jù)支持??偨Y(jié)國內(nèi)外各類臨床研究平臺(tái)建設(shè)現(xiàn)狀,以此為改進(jìn)依據(jù)介紹上海交通大學(xué)醫(yī)學(xué)院人工智能臨床研究平臺(tái)建設(shè)情況。人工智能臨床研究平臺(tái)涵蓋醫(yī)學(xué)院附屬醫(yī)院的業(yè)務(wù)庫文字及影像專病數(shù)據(jù),支持回顧性與前瞻性臨床研究,但在數(shù)據(jù)使用的倫理考量與共享機(jī)制等管理方面仍需要實(shí)踐探索。合規(guī)的區(qū)域性臨床研究整合平臺(tái)可支持科研人員發(fā)現(xiàn)臨床問題、探索或驗(yàn)證臨床假設(shè),為開展多中心、大規(guī)模的IIT打下良好的數(shù)據(jù)基礎(chǔ)。
研究者發(fā)起的臨床研究;臨床研究平臺(tái);專病數(shù)據(jù)庫;管理機(jī)制
研究者發(fā)起的臨床研究(investigator initiated trial,IIT)來自于一線臨床工作,研究成果能夠更好地服務(wù)臨床,沒有一定數(shù)據(jù)支撐的研究設(shè)想很難進(jìn)一步形成高證據(jù)等級(jí)的研究設(shè)計(jì)。國家衛(wèi)生健康委員會(huì)印發(fā)了《關(guān)于印發(fā)國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)的通知》,號(hào)召醫(yī)療數(shù)據(jù)安全與共享,同時(shí)《醫(yī)療衛(wèi)生機(jī)構(gòu)開展研究者發(fā)起的臨床研究管理辦法(試行)》也鼓勵(lì)醫(yī)療機(jī)構(gòu)積極開展規(guī)范化的IIT,為臨床科研數(shù)據(jù)庫的建設(shè)發(fā)展提出了更高的要求。
國內(nèi)專病醫(yī)療水平較高的三甲醫(yī)院嘗試建立供院內(nèi)臨床科研使用的專病數(shù)據(jù)庫,涵蓋呼吸、消化、內(nèi)分泌、腫瘤、精神疾病等眾多疾病領(lǐng)域[1-9]。此類專病庫力求將院內(nèi)醫(yī)院信息系統(tǒng)(hospital informationsystem,HIS)、實(shí)驗(yàn)室信息系統(tǒng)(laboratory information system,LIS)、影像存儲(chǔ)與傳輸系統(tǒng)(picture archiving and communication system,PACS)等多個(gè)臨床業(yè)務(wù)系統(tǒng)數(shù)據(jù)集成整合,提取業(yè)務(wù)數(shù)據(jù)表,普遍能使用脫敏算法剔除受試者隱私數(shù)據(jù),可進(jìn)行復(fù)雜條件、遞進(jìn)式的多病種科研病例查詢篩選,部分?jǐn)?shù)據(jù)庫還可以對(duì)病例報(bào)告表(case report form,CRF)進(jìn)行個(gè)性化定制與模板化管理,并將研究數(shù)據(jù)導(dǎo)出為常用統(tǒng)計(jì)分析軟件兼容的格式,為臨床輔助決策與科研提供數(shù)據(jù)支撐。也有嘗試促進(jìn)多中心臨床研究開展的專病庫,如上海交通大學(xué)醫(yī)學(xué)院附屬第九人民醫(yī)院集團(tuán)血管外科專病數(shù)據(jù)庫通過云端訪問技術(shù)可在醫(yī)聯(lián)體中共同使用,山東第一醫(yī)科大學(xué)附屬省立醫(yī)院阿爾茨海默病臨床數(shù)據(jù)庫在聯(lián)盟醫(yī)院內(nèi)可數(shù)據(jù)共享等[5,7]。
但目前記錄診療信息的業(yè)務(wù)系統(tǒng)普遍存在遺失病種關(guān)鍵信息的風(fēng)險(xiǎn),導(dǎo)致專病庫的信息提取不完整,為回顧性研究質(zhì)量帶來隱患。前瞻性研究的開展可以指導(dǎo)完善診療信息的記錄,防止科研信息缺失,為開展回顧性研究打好基礎(chǔ)。
與基于三甲醫(yī)院業(yè)務(wù)庫建立的專病庫不同,國內(nèi)外公共科研數(shù)據(jù)庫共享程度更高,為全世界研究人員提供了良好的數(shù)據(jù)支持,例如中國人群基因組多態(tài)數(shù)據(jù)庫、美國腫瘤基因組圖譜計(jì)劃等基因組學(xué)數(shù)據(jù)庫,重癥監(jiān)護(hù)醫(yī)學(xué)信息集市(Medical Information Mart for Intensive Care,MIMIC)重癥系列、中國以及其他國家的健康與營養(yǎng)調(diào)查、美國監(jiān)測(cè)、流行病學(xué)和結(jié)果(Surveillance,Epidemiology,and End Results,SEER)數(shù)據(jù)庫等基于診療或調(diào)查的免費(fèi)醫(yī)療數(shù)據(jù)庫,還有地方政府、期刊平臺(tái)等建立的公共科研數(shù)據(jù)庫,為流行病學(xué)研究、罕見病臨床科研試驗(yàn)等提供數(shù)據(jù)支持等[10-17]。
此類科研使用公共數(shù)據(jù)庫并不局限于單病種,數(shù)據(jù)采集類型更多、范圍更廣,且共享程度高,但多數(shù)需要科研工作者使用一定的編程語言輔助才能整理、分析數(shù)據(jù),有的數(shù)據(jù)庫下載使用數(shù)據(jù)包需要提供研究方案、倫理批件、提交眾多申請(qǐng)表格等,申請(qǐng)周期較長。
由于國內(nèi)外醫(yī)療、科研機(jī)構(gòu)正在使用的科研數(shù)據(jù)庫存在以上諸多問題,且國內(nèi)臨床研究平臺(tái)的建設(shè)范圍通常局限在三甲醫(yī)院或其他醫(yī)療機(jī)構(gòu)內(nèi)部,缺乏將數(shù)據(jù)按一定標(biāo)準(zhǔn)脫敏并結(jié)構(gòu)化后進(jìn)行共享的區(qū)域性臨床研究整合平臺(tái)的建設(shè),因此上海交通大學(xué)醫(yī)學(xué)院在校內(nèi)原有的電子數(shù)據(jù)采集系統(tǒng)(electronic data capture system,EDC)基礎(chǔ)上進(jìn)一步擴(kuò)展,建設(shè)成了一個(gè)溝通多家附屬醫(yī)院、可全面支撐前瞻性與回顧性臨床科研的數(shù)據(jù)平臺(tái)——人工智能臨床研究平臺(tái),旨在為臨床醫(yī)生收集整理病例數(shù)據(jù)、總結(jié)過往診療規(guī)律、進(jìn)行數(shù)據(jù)深度挖掘、發(fā)表高質(zhì)量臨床研究文章提供助力。
隨著臨床研究工作者對(duì)提升科研效率、挖掘診療信息的需求增加,上海交通大學(xué)醫(yī)學(xué)院立足大學(xué)與附屬醫(yī)院兩層級(jí)臨床研究架構(gòu),在附屬醫(yī)院區(qū)域內(nèi)探索建立臨床研究整合平臺(tái),參照相關(guān)法規(guī)政策,在原有EDC基礎(chǔ)上自主設(shè)計(jì)并建設(shè)了人工智能臨床研究平臺(tái)。該平臺(tái)包含了分布式語義檢索系統(tǒng)、項(xiàng)目全流程管理平臺(tái)、數(shù)據(jù)質(zhì)量管理系統(tǒng)、臨床數(shù)據(jù)采集系統(tǒng)、物聯(lián)網(wǎng)數(shù)據(jù)采集系統(tǒng)、醫(yī)學(xué)影像數(shù)據(jù)平臺(tái)、臨床研究單病種系統(tǒng)七大模塊(圖1),以期更好地服務(wù)IIT。
2.1.1 分布式語義檢索系統(tǒng) 該系統(tǒng)通過自然語言處理、知識(shí)圖譜、機(jī)器學(xué)習(xí)等人工智能引擎,對(duì)來自于醫(yī)院的HIS/RIS/PACS/LIS等可對(duì)接的業(yè)務(wù)系統(tǒng)中半結(jié)構(gòu)化描述語句進(jìn)行處理、識(shí)別,為回顧性研究提供臨床電子病歷的精準(zhǔn)、高效檢索能力,實(shí)現(xiàn)數(shù)據(jù)的結(jié)構(gòu)化、標(biāo)準(zhǔn)化和歸一化。
圖1 人工智能臨床研究平臺(tái)七大模塊關(guān)系圖
2.1.2 項(xiàng)目全流程管理平臺(tái) 該平臺(tái)將為前瞻性IIT的設(shè)計(jì)與開展提供全局化、規(guī)范化的流程管理,包括但不限于研究設(shè)計(jì)與執(zhí)行等方面的標(biāo)準(zhǔn)化管理與操作流程,從而達(dá)到高質(zhì)量IIT所要求的精細(xì)化管理水平。
2.1.3 數(shù)據(jù)質(zhì)量管理系統(tǒng) 該系統(tǒng)是針對(duì)臨床數(shù)據(jù)采集系統(tǒng)進(jìn)行數(shù)據(jù)質(zhì)控的一套質(zhì)控系統(tǒng),例如:可監(jiān)控關(guān)鍵指標(biāo)的缺失率、隨訪的超窗率以及不良事件的發(fā)生率,當(dāng)接近不可接受的頻率時(shí)及時(shí)預(yù)警,從而達(dá)到研究全過程的智能化數(shù)據(jù)質(zhì)控。還可進(jìn)行源文件上傳,支持臨床監(jiān)查員遠(yuǎn)程溯源質(zhì)控。
2.1.4 EDC 該系統(tǒng)將為前瞻性多中心設(shè)計(jì)的臨床研究提供數(shù)據(jù)采集服務(wù),可滿足IIT個(gè)性化模塊的構(gòu)建需求,實(shí)現(xiàn)數(shù)據(jù)自動(dòng)核查、質(zhì)疑管理、稽查軌跡、數(shù)據(jù)導(dǎo)出等多項(xiàng)功能。
2.1.5 物聯(lián)網(wǎng)數(shù)據(jù)采集系統(tǒng) 該系統(tǒng)將提供面向醫(yī)療智能穿戴設(shè)備的信息采集與管理能力,可前瞻性采集患者的實(shí)時(shí)健康狀態(tài)信息,或回顧性采集已有物聯(lián)網(wǎng)相關(guān)數(shù)據(jù)進(jìn)行分析。
2.1.6 醫(yī)學(xué)影像數(shù)據(jù)平臺(tái) 該平臺(tái)整合醫(yī)院相關(guān)業(yè)務(wù)系統(tǒng)的影像數(shù)據(jù)資料并進(jìn)行分類、治理、標(biāo)注,從而為影像數(shù)據(jù)的便捷、高效利用奠定基礎(chǔ),可前瞻性或回顧性采集分析影像數(shù)據(jù)。
2.1.7 臨床研究單病種系統(tǒng) 基于以上六大模塊進(jìn)一步整合形成多項(xiàng)單病種專病數(shù)據(jù)庫,以患者為中心構(gòu)建形成標(biāo)準(zhǔn)統(tǒng)一的臨床研究單病種系統(tǒng),為面向單病種的深層次研究與應(yīng)用奠定基礎(chǔ)。
平衡數(shù)據(jù)共享聯(lián)盟單位內(nèi)部的各項(xiàng)政策與利益需要由非盈利性質(zhì)的權(quán)威機(jī)構(gòu)牽頭協(xié)調(diào),數(shù)據(jù)庫需要專業(yè)的人力維護(hù)并耗費(fèi)高額的維護(hù)費(fèi)用,因此聯(lián)通多家中心的規(guī)范化、安全穩(wěn)定的臨床研究整合平臺(tái)需要由政府或高校等機(jī)構(gòu)承擔(dān);該人工智能臨床研究平臺(tái)篩選、整合上海交通大學(xué)醫(yī)學(xué)院附屬13家醫(yī)院中的專病數(shù)據(jù),針對(duì)立項(xiàng)的專病類型,在聯(lián)盟醫(yī)院內(nèi)部推廣由牽頭主要研究者(principal investigator,PI)組織該疾病領(lǐng)域?qū)<艺淼膶2£P(guān)鍵指標(biāo)集合,逐步規(guī)范醫(yī)院HIS等業(yè)務(wù)庫中的常規(guī)診療記錄要點(diǎn),力爭(zhēng)控制回顧性研究關(guān)鍵信息的缺失率;該平臺(tái)數(shù)據(jù)檢索、整合、分析等基本操作無需代碼輔助,只需關(guān)鍵詞檢索與拖拽等操作即可完成,大幅提升電子病歷、實(shí)驗(yàn)室檢查、影像等數(shù)據(jù)的分析利用能力。
人工智能臨床研究平臺(tái)匯集多個(gè)專病數(shù)據(jù)庫,是一個(gè)大型的資源交換與整合數(shù)據(jù)集合。該平臺(tái)技術(shù)上足夠保障患者個(gè)人信息不泄露,但患者醫(yī)療數(shù)據(jù)被用于各項(xiàng)科研探索,如何從倫理層面保護(hù)受試者需要嚴(yán)格的倫理論證;每個(gè)病種需要根據(jù)研究者貢獻(xiàn)程度探討訪問權(quán)限,發(fā)表文章或進(jìn)行其他科研轉(zhuǎn)化后,與提供數(shù)據(jù)的各方如何分配成果尚需實(shí)踐,只有解決了數(shù)據(jù)申請(qǐng)與共享機(jī)制、平衡數(shù)據(jù)貢獻(xiàn)各方利益,才能完全實(shí)現(xiàn)跨中心數(shù)據(jù)綜合利用。
醫(yī)學(xué)院人工智能臨床研究平臺(tái)涵蓋多項(xiàng)數(shù)據(jù)采集與處理模塊,可為前瞻性與回顧性的研究提供全方位的數(shù)據(jù)支撐,且平臺(tái)數(shù)據(jù)由醫(yī)學(xué)院臨床研究中心專業(yè)數(shù)據(jù)管理團(tuán)隊(duì)運(yùn)維,力求改善傳統(tǒng)專病數(shù)據(jù)庫重建設(shè)輕維護(hù)的弊端,避免一般課題組在課題結(jié)束后不再二次使用的資源浪費(fèi)[18]。
未來IIT研究的數(shù)量與質(zhì)量還會(huì)繼續(xù)保持增長趨勢(shì),數(shù)據(jù)采集與處理信息平臺(tái)將為臨床科研提供有力的數(shù)據(jù)支撐。醫(yī)學(xué)院人工智能臨床研究平臺(tái)將在數(shù)據(jù)安全與數(shù)據(jù)共享機(jī)制方面繼續(xù)加強(qiáng)建設(shè),借助長期與附屬醫(yī)院研究者合作的業(yè)務(wù)優(yōu)勢(shì),在項(xiàng)目實(shí)踐中不斷完善功能,持續(xù)優(yōu)化界面,為其他嘗試建設(shè)數(shù)據(jù)安全、信息深度共享的區(qū)域性臨床科研整合平臺(tái)提供一定參考。
[1] 袁駿毅, 潘常青, 李榕, 等. 基于臨床數(shù)據(jù)中心的冠心病專病數(shù)據(jù)庫的構(gòu)建與實(shí)現(xiàn)[J]. 中國衛(wèi)生信息管理雜志, 2022, 19(5): 707–712.
[2] 陳可, 王俊. 中晚期非小細(xì)胞肺癌專病數(shù)據(jù)庫的構(gòu)建及應(yīng)用探討[J]. 中國數(shù)字醫(yī)學(xué), 2022, 17(6): 109–113.
[3] 屈媛圓, 高琳娜, 宋歡. 結(jié)直腸癌專病數(shù)據(jù)庫的發(fā)展與展望[J]. 中國普外基礎(chǔ)與臨床雜志, 2021, 28(12): 1543–1545.
[4] 孫穎, 李超峰, 林麗, 等. 鼻咽癌專病科研數(shù)據(jù)庫建設(shè)與應(yīng)用[J].中國數(shù)字醫(yī)學(xué), 2021, 16(1): 7–12.
[5] 惠美蓉, 仇鵬, 王世鵬, 等. 研究型下肢動(dòng)脈硬化閉塞癥專病數(shù)據(jù)庫的建立及應(yīng)用[J]. 中國血管外科雜志(電子版), 2020, 12(3): 248–251.
[6] 榮雯雯, 汪剛, 朱其立. 基于人工智能的病歷后結(jié)構(gòu)化專病數(shù)據(jù)庫在臨床研究中的價(jià)值探討[J]. 上海交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版), 2020, 40(7): 996–1000, 995.
[7] 李慧杰, 張晴晴, 劉瑞紅, 等. 大數(shù)據(jù)背景下臨床專病數(shù)據(jù)庫建設(shè)實(shí)踐與思考[J]. 中國衛(wèi)生事業(yè)管理, 2020, 37(8): 574–576, 591.
[8] 羅輝, 薛萬國, 喬屾. 大數(shù)據(jù)環(huán)境下醫(yī)院科研專病數(shù)據(jù)庫建設(shè)[J]. 解放軍醫(yī)學(xué)院學(xué)報(bào), 2019, 40(8): 713–718.
[9] 王淑, 陳敏, 凌琦鳴, 等. 基于臨床數(shù)據(jù)中心的專病研究系統(tǒng)建設(shè)與實(shí)踐[J]. 中國醫(yī)院, 2017, 21(8): 16–18.
[10] 陳煒, 張戈, 張思仲. 人類基因組多態(tài)數(shù)據(jù)庫Go!Poly及其應(yīng)用[J]. 中華醫(yī)學(xué)遺傳學(xué)雜志, 2001, 18(6): 71–74.
[11] 陰常欣, 馬文麗, 鄭文嶺. GEO-基因表達(dá)綜合數(shù)據(jù)庫的應(yīng)用與數(shù)據(jù)挖掘[J]. 醫(yī)學(xué)分子生物學(xué)雜志, 2009, 6(2): 161–166.
[12] Medical information mart for intensive care [EB/OL]. [2022-10-25]. https://mimic.mit.edu/.
[13] 涂吉, 何慧婧, 胡耀達(dá), 等. 美國國家健康與營養(yǎng)調(diào)查中的信息化系統(tǒng)應(yīng)用及啟示[J]. 中華流行病學(xué)雜志, 2022, 43(7): 1127–1133.
[14] 王超, 張曉宇, 張磊, 等. 中國成人居民正常體溫:基于2015年中國健康與營養(yǎng)調(diào)查[J]. 中華內(nèi)分泌代謝雜志, 2022, 38(3): 201–207.
[15] SEER incidence data, 1975-2019 [EB/OL]. [2022-10-26]. https://seer.cancer.gov/data/.
[16] 鮑萍萍, 鄭瑩, 王春芳, 等. 上海市腫瘤病人數(shù)據(jù)庫的管理和應(yīng)用[J]. 中國腫瘤, 2005, 14(8): 514–516.
[17] 徐敏, 朱俊民, 密一愷, 等. 罕見病數(shù)據(jù)庫建設(shè)的探索與實(shí)踐[J]. 中國數(shù)字醫(yī)學(xué), 2017, 12(5): 77–80.
[18] 顧穎. ??撇±龜?shù)據(jù)庫建設(shè)現(xiàn)狀與對(duì)策[J]. 中華醫(yī)學(xué)圖書情報(bào)雜志, 2011, 20(11): 20–22.
Exploring the construction of regional clinical research integration platform
LIN Yi, QU Tiantian, QIAN Biyun, LYU Wenwen, YU Zhangsheng, FENG Tienan
1.Shanghai Gaintion Electronic Technology Co., Shanghai 200023, China; 2.Clinical Research Institute, Shanghai Jiao Tong University School of Medicine, Shanghai 200025, China; 3.Shanghai Clinical Research Promotion and Development Center, Shanghai Shenkang Hospital Development Center, Shanghai 200041, China; 4.School of Mathematical Sciences, Shanghai Jiao Tong University, Shanghai 201100, China
To explore a feasible solution for establishing a regional clinical research integration platform in China to provide data support for investigator initiated trials (IIT).To summarize the current situation of the construction of various clinical research platforms at home and abroad, and introduce the construction of the Artificial Intelligence Clinical Research Platform of Shanghai Jiao Tong University School of Medicine based on this improvement.The artificial intelligence clinical research platform covers business repository text and imaging-specific data of the medical school hospitals and supports retrospective and prospective clinical research, but still needs practical exploration in the management of ethical considerations and sharing mechanism of data use.A compliant regional clinical research integration platform can support researchers in identifying clinical questions, exploring or validating clinical hypotheses, and laying a good data foundation for conducting multi-center and large-scale IIT.
Investigator initiated trial; Clinical research platform; Specialized disease database; Management Mechanism
R12
A
10.3969/j.issn.1673-9701.2023.29.023
馮鐵男,電子信箱:tienan@sjtu.edu.cn
(2022–11–29)
(2023–09–13)