張冬 張俊華 孫鳳 田金徽 龐穩(wěn)泰 楊豐文 金鑫瑤 劉智 鄭文科
摘要?數(shù)據(jù)引領決策成為醫(yī)藥衛(wèi)生領域的特征,健康醫(yī)療大數(shù)據(jù)逐漸成為熱點?;诖髷?shù)據(jù)的真實世界研究也成為醫(yī)療衛(wèi)生行業(yè)關注的焦點,因其涉及到藥品注冊審批、醫(yī)保支付及健康促進等衛(wèi)生政策制定。大數(shù)據(jù)技術與真實世界研究相輔相成、相互促進?;诖髷?shù)據(jù)的真實世界研究為中醫(yī)藥臨床評價提供了新的思路和方法,然而還處于起步和探索階段,需要深化對真實世界研究和大數(shù)據(jù)的認識。本文系統(tǒng)總結了基于大數(shù)據(jù)技術的真實世界研究進展以及存在問題,提出了相應的建議與應對策略,為推動基于大數(shù)據(jù)的真實世界研究提供參考。
關鍵詞?中醫(yī)藥;真實世界研究;真實世界數(shù)據(jù);真實世界證據(jù);大數(shù)據(jù);數(shù)據(jù)庫;問題與對策;循證醫(yī)學
Real-World Study and Big Data of Traditional Chinese Medicine
Zhang Dong1, Zhang Junhua1, Sun Feng2, Tian Jinhui3, Pang Wentai1, Yang Fengwen1, Jin Xinyao1, Liu Zhi1, Zheng Wenke1
(1 Evidence-based Medicine Center, Tianjin University of Traditional Chinese Medicine, Tianjin 301617, China; 2 Evidence-based Medicine Center, Peking University, Beijing 100191, China; 3 Evidence-based Medicine Center, Lanzhou University, Lanzhou 730000, China)
Abstract?Data leading decision-making has become a feature of the field of medicine and health, and big data of health care has gradually become a hot topic.Real-world study based on big data has also become a focus of attention in the medical and health industry, because it involves the formulation of health policies such as drug registration approval, medical insurance payments, and health promotion.Big data technology and real-world study are complementary and mutually reinforcing.Real-world study based on big data provides new ideas and methods for clinical evaluation of traditional Chinese medicine.However, it is still in its infancy and exploration stage, and deeper understanding of real-world study and big data is needed.In this paper, we systematically summarized the real-world study progress and existing problems based on big data technology, and proposed corresponding suggestions and coping strategies to provide a reference for promoting real-world study based on big data.
Key Words?Traditional Chinese medicine; Real-world study; Real-world data; Real-world evidence; Big data; Database; Problem and solution; Evidence-based medicine
中圖分類號:R2-03文獻標識碼:Adoi:10.3969/j.issn.1673-7202.2019.12.005
信息技術和產(chǎn)品的快速發(fā)展,深刻影響著社會生產(chǎn)和生活的方方面面,也影響著醫(yī)學模式和決策思路的轉(zhuǎn)變。大數(shù)據(jù)具有容量大、來源廣、增速快、價值密度低等特點[1],支持從大規(guī)模數(shù)據(jù)中挖掘知識,尋找規(guī)律[2]。當前大數(shù)據(jù)技術發(fā)展應用方興未艾,對醫(yī)療大數(shù)據(jù)價值的認識逐漸深化,學術界、產(chǎn)業(yè)界、管理部門都已展開相應的研究和推進工作。如何把醫(yī)療大數(shù)據(jù)轉(zhuǎn)變?yōu)榭晒┽t(yī)療相關決策可用的證據(jù),需要開展基于大數(shù)據(jù)的研究,這是真實世界研究的重要內(nèi)容。本文圍繞真實世界研究的特征,探討中醫(yī)藥大數(shù)據(jù)研究的現(xiàn)狀和問題,并提出建議。
1?真實世界研究與大數(shù)據(jù)的關系
真實世界研究與傳統(tǒng)臨床試驗的差異根本在于研究環(huán)境是否符合臨床和生活的實際情形[3]。真實世界研究包括多樣的設計類型,既有臨床試驗,也有觀察性研究。真實世界研究之所以被廣泛重視,是因為醫(yī)療大數(shù)據(jù)的積累為從中發(fā)現(xiàn)知識,形成證據(jù),指導決策提供了可能。因此,對真實世界研究的重視,重點是基于大數(shù)據(jù)技術的發(fā)展,為臨床評價和健康研究提供了新的路徑。
真實世界醫(yī)療大數(shù)據(jù)由于來源多種多樣,動態(tài)實時變化、且沒有標準限制,因此真實世界研究不可避免的遇到了海量數(shù)據(jù)和非結構化數(shù)據(jù)無法有效分析的挑戰(zhàn)[4-5]。大數(shù)據(jù)技術的實際應用,從數(shù)據(jù)存儲、數(shù)據(jù)處理、數(shù)據(jù)分析等多個方面為真實世界研究提供了技術支持。同時,隨著真實世界研究的不斷發(fā)展,對大數(shù)據(jù)技術提出了新的需求,促進了大數(shù)據(jù)技術的發(fā)展與應用。因此,真實世界研究需要以大數(shù)據(jù)技術為工具,得以高效地從數(shù)據(jù)中發(fā)現(xiàn)問題、總結規(guī)律,而大數(shù)據(jù)技術則以真實世界研究為應用場景,不斷豐富技術積累、更新算法框架、推動研究深入。
2?真實世界大數(shù)據(jù)的來源
醫(yī)療領域大數(shù)據(jù)的來源途徑非常廣泛、數(shù)據(jù)類型多樣,與過去傳統(tǒng)的數(shù)據(jù)有著很大的區(qū)別,涵蓋的內(nèi)容豐富而繁雜。圖1以真實世界研究大數(shù)據(jù)來源單位為例,主要包含醫(yī)療從業(yè)者提供的電子病歷檔案、臨床評估記錄、臨床檢查結果、個人健康檔案等;患者在社交網(wǎng)絡的行為數(shù)據(jù)、可穿戴設備產(chǎn)生的結果數(shù)據(jù)以及健康體檢數(shù)據(jù)等;醫(yī)藥企業(yè)提供的藥品研發(fā)、營銷、流通等各個環(huán)節(jié)的數(shù)據(jù);政府管理機關持有的報銷數(shù)據(jù)以及制定的相關政策等;基因組數(shù)據(jù)包括個人基因測序數(shù)據(jù)等[6-7]。這些復雜、海量的數(shù)據(jù)并不是相互獨立、難以分析的,開展基于大數(shù)據(jù)的真實世界研究,能夠很好的挖掘其中隱藏的價值信息,為臨床醫(yī)療管理、醫(yī)保支付決策以及政府衛(wèi)生政策制定提供證據(jù)支持,促進決策機制向科學化轉(zhuǎn)變。
3?中醫(yī)藥大數(shù)據(jù)平臺建設進展
2015年國務院發(fā)布了《關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》,并在“中醫(yī)藥信息化建設‘十三五規(guī)劃’”中明確提出要建立國家中醫(yī)藥智慧云服務平臺,對中醫(yī)藥大數(shù)據(jù)的發(fā)展指出了方向[8]。
目前,基于大數(shù)據(jù)的中醫(yī)藥安全性、有效性和系統(tǒng)評價研究在全國科研機構、院校與相關企業(yè)開展。中國中醫(yī)科學院中醫(yī)藥信息研究所進行了中醫(yī)藥數(shù)據(jù)庫的開發(fā),完成了包括中醫(yī)藥期刊文獻、疾病診療、中藥、方劑等在內(nèi)的48個子數(shù)據(jù)庫,共120余萬條數(shù)據(jù),為中醫(yī)藥研究提供了基礎數(shù)據(jù)[9]。中國中醫(yī)科學院中醫(yī)臨床基礎醫(yī)學研究所建成了國內(nèi)首個科研用醫(yī)療電子數(shù)據(jù)倉庫,其中收集了400余萬份電子病歷,并對臨床用藥的安全性和有效性進行了研究,開展了真實世界用藥特征的分析[10]。中國中醫(yī)科學院大數(shù)據(jù)中心組織建設了中醫(yī)藥大數(shù)據(jù)中心,建立了中醫(yī)藥臨床數(shù)據(jù)共享系統(tǒng),完成了6 000余種臨床疾病模板庫,形成了中醫(yī)藥數(shù)據(jù)標準和共享管理,搭建了具有中醫(yī)特色的健康云平臺[11]。北京大數(shù)據(jù)研究院成立了中醫(yī)大數(shù)據(jù)中心,建設包括中醫(yī)人工智能、中西藥臨床服務以及中西藥臨床科研一體化大數(shù)據(jù)庫及分析平臺[12]。中國中醫(yī)科學院中藥研究所成立了中國中藥研究中心,搭建中藥數(shù)據(jù)庫和中藥基因組對中藥各相關領域進行數(shù)據(jù)挖掘[13]。國家人口健康科學數(shù)據(jù)中心依托中國醫(yī)學科學院醫(yī)學信息研究所研發(fā)建設了人口健康科學數(shù)據(jù)倉儲系統(tǒng),實現(xiàn)了對人口健康領域科學數(shù)據(jù)的采集、加工、管理等功能,促進了科學數(shù)據(jù)的開放共享[14]。天津中醫(yī)藥大學循證醫(yī)學中心建立了中醫(yī)藥臨床循證評價數(shù)據(jù)庫,其中包含近數(shù)十萬例基于主動報告的中藥安全性集中檢測數(shù)據(jù)與中醫(yī)藥臨床試驗數(shù)據(jù),基于此開展了中藥安全性和有效性研究,并發(fā)布了中藥注射劑有效性證據(jù)指數(shù)[15]。
4?存在問題
隨著信息化與數(shù)字化的快速發(fā)展,醫(yī)療信息數(shù)據(jù)逐漸從線下轉(zhuǎn)為線上、簡單轉(zhuǎn)為復雜、獨立轉(zhuǎn)為共享,使醫(yī)療領域大數(shù)據(jù)研究成為必然。由此所帶來的不僅僅是醫(yī)療數(shù)據(jù)量的急速膨脹,數(shù)據(jù)的維度、標準化、結構化等都帶來了巨大挑戰(zhàn)。雖然當前基于大數(shù)據(jù)的真實世界研究取得了一系列的成果,但是仍然存在著一些問題。
4.1?缺乏多源信息整合平臺?“數(shù)據(jù)孤島”是指組織中與組織的其他部分隔離且無法訪問的信息集合。在當前的真實世界研究中,我國的臨床數(shù)據(jù)極為豐富,但是由于規(guī)則和政策機制約束導致數(shù)據(jù)難以形成共享,出現(xiàn)了“數(shù)據(jù)孤島”,乃至存在“不愿共享”“不敢共享”“不能共享”的難題[16]。由于“數(shù)據(jù)孤島”的存在,“各個孤島”之間的醫(yī)療大數(shù)據(jù)存儲結構不一致、存儲標準不統(tǒng)一,無疑又增加了數(shù)據(jù)合并與整合的難度。同時由于不同“數(shù)據(jù)孤島”存在地區(qū)與政策的差異,極大地影響了真實世界數(shù)據(jù)的收集質(zhì)量,高質(zhì)量數(shù)據(jù)不能得到保障[17]。因此打破“數(shù)據(jù)孤島”的一個重要前提就是建立真實世界醫(yī)療大數(shù)據(jù)的信息標準,同一信息記錄標準的制定有助于數(shù)據(jù)之間的流動與共享。
4.2?數(shù)據(jù)規(guī)范化程度不高?隨著計算機的普及,電子病歷系統(tǒng)、臨床診療系統(tǒng)、醫(yī)保系統(tǒng)等醫(yī)療電子系統(tǒng)廣泛得到應用與推廣,使得醫(yī)療系統(tǒng)大數(shù)據(jù)完成了初步的數(shù)字化存儲。然而,不同的數(shù)據(jù)存儲于與不同軟件開發(fā)的系統(tǒng)之中,字段類型不同、數(shù)據(jù)編碼不一致導致數(shù)據(jù)規(guī)范化程度不高,數(shù)據(jù)難以聯(lián)通。還有數(shù)據(jù)沒有完全做到數(shù)字,僅僅是圖片形式存儲。因此數(shù)據(jù)化程度不高導致大數(shù)據(jù)可能出現(xiàn)“名不符實”的情況,缺失的部分電子數(shù)據(jù)可能會對分析結果有重要的影響[18]。
4.3?復雜數(shù)據(jù)分析缺乏有效方法?相對于結構化的數(shù)據(jù),大數(shù)據(jù)中充斥了非結構化數(shù)據(jù)與半結構化數(shù)據(jù),結構化數(shù)據(jù)只占其中很小的一部分。聚焦到真實世界研究中,由于患者個體條件、醫(yī)療衛(wèi)生環(huán)境等等因素的影響,導致真實世界研究中的大數(shù)據(jù)復雜度極大的增加,但是當前在真實世界研究中的大數(shù)據(jù)技術都是基于已有成熟的框架與算法,例如Hadoop和Map Reduce,缺乏結合醫(yī)藥本身特點進行大數(shù)據(jù)分析算法的二次開發(fā),沒有形成具有醫(yī)藥特色的大數(shù)據(jù)分析技術,在借用的框架上分析的結果,其信息挖掘的深度與完整性不能得到保障[19]。
4.4?安全性與隱私性保障問題?在信息化與網(wǎng)絡化時代,以互聯(lián)網(wǎng)為依托的大數(shù)據(jù)在存儲、傳輸、處理等過程中都會面臨著諸多的安全風險[20]。醫(yī)療領域大數(shù)據(jù)信息多,價值大,并且包含著大量個人隱私數(shù)據(jù),因此對安全性與隱私性保障的需求較高,一旦出現(xiàn)數(shù)據(jù)泄露等安全問題,就會導致巨大的損失或安全威脅[21-22]。
5?應對策略
中醫(yī)藥的有效性和安全性需要證據(jù)支持,這種需求變得越來越旺盛,逐漸成為中醫(yī)藥行業(yè)需要突破的瓶頸?;诖髷?shù)據(jù)的真實世界研究為中醫(yī)藥臨床評價提供了新的思路和方法,有利于應對中醫(yī)藥快速增長的多樣化證據(jù)需求的挑戰(zhàn)[23]。針對上述存在的問題,我們提出了相應的建議與應對策略。
5.1?政府部門加快政策制定?基于大數(shù)據(jù)的真實世界研究為政府部門藥品注冊審批、醫(yī)保支付及健康促進等衛(wèi)生政策制定提供依據(jù)。針對當前研究中出現(xiàn)的“數(shù)據(jù)孤島”、缺乏多源信息整合平臺等問題,政府應當加以重視并加快制定相關政策,包括但不限于數(shù)據(jù)質(zhì)量保證、多源數(shù)據(jù)倉庫建設、個人隱私數(shù)據(jù)保障等等,逐步引導與促進數(shù)據(jù)的流動與共享,降低重復信息的獲取、存儲、解析成本,形成大數(shù)據(jù)驅(qū)動下的決策機制。
5.2?加大專項研究投入?政府部門以及相關科研院所應當重視當前中醫(yī)藥大數(shù)據(jù)及真實世界研究中面臨的難題,設立研究專項、加大研究投入、加強學科交叉融合,培育真實世界大數(shù)據(jù)研究團隊,形成基于中醫(yī)藥大數(shù)據(jù)的真實世界研究體系和規(guī)范,推動真實世界研究的不斷發(fā)展。
5.3?重視人才培養(yǎng)?真實世界大數(shù)據(jù)即使經(jīng)過處理之后,其中蘊含的信息與變量也是非常多的,想從浩繁的數(shù)據(jù)中快速總結規(guī)律、挖掘特征、發(fā)現(xiàn)問題,需要跨學科的專業(yè)人才,需要培養(yǎng)一批具備真實世界研究、大數(shù)據(jù)分析、數(shù)據(jù)統(tǒng)計等交叉學科知識的復合型人才??梢酝ㄟ^院校合作、交叉培養(yǎng)等方法,在真實世界研究與大數(shù)據(jù)研究過程中,加強能力鍛煉和知識運用。
真實世界研究概念在引入我國之后得到了快速的發(fā)展,為衛(wèi)生政策制定、臨床評價提供了新的思路和方法。隨著中醫(yī)藥大數(shù)據(jù)的不斷積累,中醫(yī)藥真實世界研究也在增加,但還處于初級階段,也面臨多種問題。隨著政府的大力支持、技術方法的不斷進步,基于中醫(yī)藥大數(shù)據(jù)的真實世界研究也將不斷發(fā)展完善,成為真實世界證據(jù)的重要來源。
參考文獻
[1]金昌曉,計虹,席韓旭,等.大數(shù)據(jù)科研分析平臺在臨床醫(yī)學研究中的應用探討[J].中國數(shù)字醫(yī)學,2019,14(2):37-39.
[2]楊薇,崔英子,楊海淼,等.醫(yī)療大數(shù)據(jù)在中醫(yī)藥研究領域的應用與思考[J].長春中醫(yī)藥大學學報,2016,32(3):625-627.
[3]Sherman RE,Anderson SA,Dal Pan GJ,et al.Real-World Evidence-What Is It and What Can It Tell Us?[J].N Engl J Med,2016,375(23):2293-2297.
[4]馬金輝,王志飛,王永炎,等.真實世界大數(shù)據(jù)30034例高血壓病住院患者中西醫(yī)診療規(guī)律初探[J].中國中藥雜志,2014,39(18):3435-3441.
[5]李金根,姜眾會,高鑄燁,等.真實世界研究在中醫(yī)藥臨床研究中的應用[J].世界科學技術-中醫(yī)藥現(xiàn)代化,2017,19(1):78-82.
[6]Makady A.,de Boer A.,Hillege JL.,Klungel O.,Goettsch W.What is real-world data? a review of definitions based on literature and stakeholder interviews[J].Value Health 2017,20:858-65.
[7]Berger ML.,Dreyer N.,Anderson F.,et al.Prospective Observational Studies to Assess Comparative Effectiveness:The ISPOR Good Research Practices Task Force Report[J].Value Health,2012,15(2):217-230.
[8]中國大數(shù)據(jù)產(chǎn)業(yè)觀察[EB/OL].(2018-11-15)[2019-10-15].http://www.cbdio.com/BigData/2018-11/15/content_5918101.htm.
[9]中國中醫(yī)藥數(shù)據(jù)庫[EB/OL].(2019-7-9)[2019-10-15].http://cintmed.cintcm.com/cintmed/main.html.
[10]蓋國忠.大數(shù)據(jù)是中醫(yī)藥真實世界研究的重大機遇——推薦《中醫(yī)藥大數(shù)據(jù)與真實世界》[J].世界中醫(yī)藥,2019,14(2):319.
[11]劉保延.真實世界的中醫(yī)臨床科研范式[J].中醫(yī)雜志,2013,54(6):451-455.
[12]中醫(yī)大數(shù)據(jù)中心[EB/OL].(2018-2-18)[2019-10-15].http://www.tcmbigdata.cn/index.html.
[13]中國中藥數(shù)據(jù)中心[EB/OL].(2015-5-12)[2019-10-15].http://www.ndctcm.org/.
[14]人口健康科學數(shù)據(jù)倉儲[EB/OL].(2019-7-4)[2019-10-15].http://www.ncmi.cn.
[15]中藥注射劑臨床有效性證據(jù)指數(shù)首次發(fā)布[EB/OL].(2018-10-15)[2019-10-15].http://scitech.people.com.cn/n1/2018/1015/c1057-30341108.html.
[16]梁文娜,林雪娟,俞潔,等.真實世界的大數(shù)據(jù)助推中醫(yī)健康管理進入人工智能時代[J].中華中醫(yī)藥雜志,2018,33(4):1213-1215.
[17]Real-world evidence: From activity to impact in healthcare decision making[EB/OL].(2019-9-1)[2019-10-15].https://www.mckinsey.com/industries/pharmaceuticals-and-medical-products/our-insights/real-world-evidence-from-activity-to-impact-in-healthcare-decision-making#.
[18]布優(yōu)祥,陳吉,孫月,等.真實世界研究主題與研究能力的可視化分析[J].中國中藥雜志,2019,44(8):1674-1681.
[19]Benedikt E.Maissenhaelter.Real-world evidence research based on big data[J].Der Onkologe,2018,24:91-98.
[20]王曉麗,萬生芳,魏昭暉,等.真實世界大數(shù)據(jù)下中醫(yī)臨床研究特點探析[J].世界最新醫(yī)學信息文摘,2019,19(6):244+246.
[21]郭杰,劉善榮.檢驗醫(yī)學真實世界研究的策略與展望[J].中華檢驗醫(yī)學雜志,2019,42(8):618-622.
[22]宣建偉,程江,薛雄峰,等.真實世界醫(yī)療大數(shù)據(jù)庫的建立及其在醫(yī)院管理、臨床診療、合理用藥、醫(yī)保精細化管理中的應用[J].中國藥物經(jīng)濟學,2019,14(5):10-17.
[23]杜春霖,李曉松,劉元元.真實世界研究及國內(nèi)文獻綜述[J].中國衛(wèi)生信息管理雜志,2018,15(5):597-601.
(2019-11-10收稿?責任編輯:徐穎)