范美玉
大數(shù)據(jù)及相關(guān)技術(shù)在健康醫(yī)療領(lǐng)域的深度融合[1],不僅讓健康醫(yī)療大數(shù)據(jù)的價(jià)值凸顯,同時(shí)也為數(shù)據(jù)治理及挖掘分析帶來(lái)了難題。健康醫(yī)療大數(shù)據(jù)涉及醫(yī)學(xué)研究、統(tǒng)計(jì)學(xué)、健康信息學(xué)、衛(wèi)生信息管理、數(shù)據(jù)科學(xué)、人工智能和神經(jīng)網(wǎng)絡(luò)等多個(gè)領(lǐng)域,需要一種科學(xué)的方法來(lái)研究與利用。結(jié)合健康醫(yī)療領(lǐng)域背景知識(shí),以數(shù)據(jù)科學(xué)方法為工具,研究健康醫(yī)療大數(shù)據(jù)的應(yīng)用與分析,正是打開(kāi)數(shù)據(jù)“礦藏”的鑰匙。
21世紀(jì)以來(lái),大數(shù)據(jù)浪潮席卷全球,數(shù)據(jù)密集的健康醫(yī)療行業(yè)成為大數(shù)據(jù)應(yīng)用的重要領(lǐng)域。人類(lèi)生命全周期所產(chǎn)生的生理、心理、疾病預(yù)防診療和健康管理等多領(lǐng)域數(shù)據(jù)的聚合形成了健康醫(yī)療大數(shù)據(jù)[2]。臨床醫(yī)生不僅是數(shù)據(jù)的生產(chǎn)者、使用者,還是數(shù)字化產(chǎn)品的評(píng)價(jià)者。然而,大部分臨床醫(yī)生卻不懂得如何科學(xué)利用數(shù)據(jù)資源和技術(shù)手段來(lái)提升臨床診療和科學(xué)研究[3],健康醫(yī)療大數(shù)據(jù)的應(yīng)用也存在數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)利用不足、醫(yī)學(xué)倫理等問(wèn)題[4]。人們開(kāi)始意識(shí)到需要一門(mén)圍繞著如何利用健康醫(yī)療大數(shù)據(jù)開(kāi)展研究及臨床應(yīng)用的新學(xué)科,因此,健康數(shù)據(jù)科學(xué)由此應(yīng)運(yùn)而生。
有學(xué)者認(rèn)為,健康數(shù)據(jù)科學(xué)是一項(xiàng)以改善生命健康為目標(biāo),致力于提高個(gè)人或群體醫(yī)療數(shù)據(jù)收集、管理和分析能力的科學(xué)工作,主要聚焦于生物醫(yī)學(xué)與健康領(lǐng)域的信息技術(shù)、數(shù)據(jù)分析及因果關(guān)系哲學(xué)等內(nèi)容[5]。也有學(xué)者認(rèn)為,健康數(shù)據(jù)科學(xué)將計(jì)算機(jī)科學(xué)、生物統(tǒng)計(jì)學(xué)、流行病學(xué)和臨床醫(yī)學(xué)等作為主要知識(shí)體系內(nèi)容,采用跨學(xué)科的思路和方法挖掘健康醫(yī)療數(shù)據(jù)的價(jià)值,結(jié)合領(lǐng)域知識(shí)形成洞察力,最終賦能健康醫(yī)療實(shí)踐[6]。綜合各家觀點(diǎn)來(lái)看,健康數(shù)據(jù)科學(xué)(health data science)是一門(mén)新興的交叉性學(xué)科,可以從以下4個(gè)角度理解其內(nèi)涵:①研究對(duì)象為健康醫(yī)療大數(shù)據(jù);②理論基礎(chǔ)涵蓋數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、生物信息學(xué)、衛(wèi)生信息管理、醫(yī)學(xué)等多學(xué)科;③研究?jī)?nèi)容涉及數(shù)據(jù)收集、存儲(chǔ)、分析與可視化等全生命周期管理與數(shù)據(jù)產(chǎn)品開(kāi)發(fā);④研究工具為數(shù)據(jù)科學(xué)方法,如醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法、大數(shù)據(jù)分析處理方法、深度學(xué)習(xí)方法等[7-9]。
2014年,英國(guó)斯旺西大學(xué)最早開(kāi)設(shè)健康數(shù)據(jù)科學(xué)學(xué)科。隨后,國(guó)際上比較知名的學(xué)府都設(shè)立了健康數(shù)據(jù)科學(xué)專(zhuān)業(yè)的不同研修課程項(xiàng)目,如斯旺西大學(xué)醫(yī)學(xué)院、哈佛大學(xué)陳曾熙公共衛(wèi)生學(xué)院、杜克大學(xué)文理學(xué)院等開(kāi)設(shè)了健康數(shù)據(jù)科學(xué)碩士課程,牛津大學(xué)大數(shù)據(jù)研究所牛津EPSRC健康數(shù)據(jù)科學(xué)博士培訓(xùn)中心、蘇黎世聯(lián)邦理工學(xué)院開(kāi)設(shè)了健康數(shù)據(jù)科學(xué)博士或博士后課程。還有一些科研院校在交叉學(xué)科專(zhuān)業(yè)下設(shè)健康數(shù)據(jù)科學(xué)研究項(xiàng)目與科研團(tuán)隊(duì),如關(guān)注精準(zhǔn)癌癥早期檢測(cè)、治療和預(yù)防的耶魯大學(xué)醫(yī)學(xué)院放射治療系Deng教授團(tuán)隊(duì),以及專(zhuān)注于數(shù)據(jù)科學(xué)理念、方法與臨床工作流程融合的康奈爾大學(xué)維爾醫(yī)學(xué)院公眾健康科學(xué)系健康信息學(xué)部王飛副教授團(tuán)隊(duì)。
2018年,北京大學(xué)健康醫(yī)療大數(shù)據(jù)國(guó)家研究院最早在“醫(yī)學(xué)技術(shù)”一級(jí)學(xué)科下設(shè)“健康數(shù)據(jù)科學(xué)”二級(jí)學(xué)科,并于2020年開(kāi)始“健康數(shù)據(jù)科學(xué)”專(zhuān)業(yè)的研究生培養(yǎng)工作,陸續(xù)開(kāi)設(shè)“健康數(shù)據(jù)科學(xué)概論”“開(kāi)放數(shù)據(jù)獲取與醫(yī)學(xué)知識(shí)發(fā)現(xiàn)”“健康數(shù)據(jù)可視化”等課程,以“Data for Better Health”為理念協(xié)辦國(guó)際英文期刊Health Data Science,舉辦“北大醫(yī)學(xué)健康數(shù)據(jù)科學(xué)學(xué)科發(fā)展研討會(huì)”,同時(shí)與英國(guó)曼徹斯特大學(xué)(生物、醫(yī)學(xué)與健康學(xué)院)開(kāi)展健康數(shù)據(jù)科學(xué)學(xué)科共建合作。得益于良好的生態(tài)環(huán)境,涵蓋衛(wèi)生健康政策與技術(shù)、流行病學(xué)數(shù)據(jù)共享、全球健康大數(shù)據(jù)等多個(gè)領(lǐng)域的17個(gè)研究中心已落戶于北京大學(xué)健康醫(yī)療大數(shù)據(jù)國(guó)家研究院,產(chǎn)出了多項(xiàng)成果。北京大學(xué)健康數(shù)據(jù)科學(xué)的學(xué)科建設(shè)與發(fā)展也帶動(dòng)了國(guó)內(nèi)其他高校,如東南大學(xué)蘇州聯(lián)合研究生院開(kāi)展了電子信息專(zhuān)業(yè)健康數(shù)據(jù)科學(xué)方向的專(zhuān)碩培養(yǎng)工作,廈門(mén)大學(xué)成立健康醫(yī)療大數(shù)據(jù)國(guó)家研究院創(chuàng)新團(tuán)隊(duì)、經(jīng)濟(jì)學(xué)院數(shù)據(jù)科學(xué)與健康醫(yī)療大數(shù)據(jù)團(tuán)隊(duì)。
隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等新一代信息技術(shù)的發(fā)展,數(shù)據(jù)驅(qū)動(dòng)的衛(wèi)生健康政策制定模式變得越來(lái)越重要。一方面,借助先進(jìn)的信息技術(shù),醫(yī)療衛(wèi)生行業(yè)政府管理部門(mén)在決策前可以掌握更多更精準(zhǔn)的信息,如基于大數(shù)據(jù)與人工智能技術(shù)的全球權(quán)威新冠病毒疫情預(yù)測(cè)模型、定量評(píng)估不同公共防控政策對(duì)新冠疫情控制效果的研究都成為政府疫情政策制定的數(shù)據(jù)智囊?guī)?另一方面,在政策實(shí)施過(guò)程中,應(yīng)用大數(shù)據(jù)和人工智能等技術(shù),醫(yī)療衛(wèi)生行業(yè)政府管理部門(mén)能夠?qū)崟r(shí)收集分析用戶意見(jiàn)數(shù)據(jù)、政策實(shí)施數(shù)據(jù),識(shí)別出潛在的關(guān)聯(lián)關(guān)系,并建立預(yù)測(cè)模型,用于政策實(shí)施后的效應(yīng)仿真模擬與優(yōu)化[10],如利用區(qū)域醫(yī)療大數(shù)據(jù)或?qū)哟谓Y(jié)構(gòu)數(shù)據(jù)評(píng)價(jià)醫(yī)療政策實(shí)施效果[11]。
醫(yī)學(xué)影像智能診斷、疾病風(fēng)險(xiǎn)預(yù)測(cè)、臨床決策支持等都是目前健康數(shù)據(jù)科學(xué)在臨床醫(yī)學(xué)中的應(yīng)用體現(xiàn)。在放射腫瘤學(xué)中,臨床醫(yī)生可以借助數(shù)據(jù)科學(xué)方法獲取高維生物標(biāo)志物數(shù)據(jù),并將其與臨床結(jié)果、領(lǐng)域知識(shí)融合在一起挖掘分析,最終獲得有價(jià)值的信息用來(lái)改善癌癥患者的治療[12]。在疾病風(fēng)險(xiǎn)預(yù)測(cè)與診療中,健康數(shù)據(jù)科學(xué)知識(shí)與方法的應(yīng)用可以使已有的多模態(tài)數(shù)字化數(shù)據(jù)得到最大化利用,提升整體疾病診療效率和質(zhì)量,如鐘南山團(tuán)隊(duì)?wèi)?yīng)用人工智能等健康數(shù)據(jù)科學(xué)方法構(gòu)建的新冠病毒感染危重預(yù)測(cè)模型的準(zhǔn)確率達(dá)到88%,可以快速分流就診患者,有效提高ICU病房和呼吸機(jī)等醫(yī)療資源的分配效率,也能為臨床醫(yī)生提供快速診療和護(hù)理建議。健康數(shù)據(jù)科學(xué)在疾病監(jiān)測(cè)方面也發(fā)揮了極大的作用,以腎臟疾病為例,美國(guó)、加拿大等大數(shù)據(jù)發(fā)展較早的國(guó)家最早建立全國(guó)性的CKD監(jiān)測(cè)網(wǎng)絡(luò)用于實(shí)時(shí)監(jiān)測(cè)腎臟疾病數(shù)據(jù),近年來(lái)建設(shè)的“中國(guó)腎臟疾病數(shù)據(jù)網(wǎng)絡(luò)”推動(dòng)了適合我國(guó)國(guó)情的、基于臨床專(zhuān)科優(yōu)勢(shì)資源的跨學(xué)科大數(shù)據(jù)應(yīng)用模式發(fā)展[13]。臨床試驗(yàn)也迎來(lái)了數(shù)字化、智能化發(fā)展的大趨勢(shì),出現(xiàn)了諸如可實(shí)現(xiàn)一體化智能化整合管理的臨床試驗(yàn)平臺(tái),支持同時(shí)開(kāi)展隊(duì)列研究、病例-對(duì)照研究和橫斷面研究等多種類(lèi)型臨床試驗(yàn),涵蓋方案設(shè)計(jì)、招募入組、隨訪、數(shù)據(jù)分析、質(zhì)量控制全過(guò)程[14]。
在醫(yī)院精細(xì)化管理方面,依托醫(yī)療大數(shù)據(jù)中心,基于深度學(xué)習(xí)算法、大數(shù)據(jù)分析、知識(shí)可視化等技術(shù),醫(yī)療機(jī)構(gòu)能夠整合管理數(shù)據(jù)、實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)、發(fā)現(xiàn)知識(shí)、可視化展現(xiàn),進(jìn)而及時(shí)發(fā)現(xiàn)醫(yī)院管理疏漏,科學(xué)精準(zhǔn)改進(jìn),把臨床服務(wù)者的焦點(diǎn)專(zhuān)注到滿足患者診療和健康管理需求上,以獲得更高效率、效益和更強(qiáng)競(jìng)爭(zhēng)力。在醫(yī)患關(guān)系方面,基于健康數(shù)據(jù)科學(xué)的智能化醫(yī)療應(yīng)用不僅可以影響人們的健康信息行為,縮小醫(yī)患之間的信息鴻溝,也可以減輕醫(yī)生的診斷壓力,提升患者參與度,從而獲取更多有價(jià)值的信息,減少誤診率,最終提高患者滿意度,有利于創(chuàng)建良好的醫(yī)患關(guān)系[15]。
傳感器網(wǎng)絡(luò)、移動(dòng)通信技術(shù)、可穿戴設(shè)備、大數(shù)據(jù)技術(shù)等新型信息技術(shù),可有效幫助個(gè)人健康管理。通過(guò)不同渠道實(shí)時(shí)采集的運(yùn)動(dòng)、心率、睡眠、血壓、心電、脂肪率等健康指標(biāo)加上個(gè)體數(shù)據(jù)形成個(gè)人健康檔案庫(kù),結(jié)合人工智能算法,提出并及時(shí)調(diào)整個(gè)性化健康管理方案,實(shí)現(xiàn)智能的個(gè)體健康管理?;跀?shù)據(jù)的預(yù)測(cè),可輸出患者發(fā)病風(fēng)險(xiǎn)評(píng)估、預(yù)測(cè)、預(yù)警,為疾病進(jìn)行有效的預(yù)防控制提供建議。
借助數(shù)據(jù)科學(xué)的方法和信息化工具,健康數(shù)據(jù)科學(xué)能夠有效獲取、處理和分析健康醫(yī)療大數(shù)據(jù),在衛(wèi)生健康政策與衛(wèi)生管理、醫(yī)療服務(wù)、醫(yī)院管理、個(gè)體化健康管理等方面發(fā)揮積極作用。國(guó)內(nèi)外在健康數(shù)據(jù)科學(xué)學(xué)科建設(shè)、人才培養(yǎng)、真實(shí)世界醫(yī)療場(chǎng)景應(yīng)用研究等方面取得了一定的成效。目前,我國(guó)恰逢醫(yī)院高質(zhì)量發(fā)展的時(shí)代機(jī)遇,信息化支撐作用將得到進(jìn)一步強(qiáng)化,新一代信息技術(shù)與醫(yī)療服務(wù)融合將更加深入,數(shù)據(jù)的采集、存儲(chǔ)、管理與利用將更加科學(xué)合理,健康數(shù)據(jù)科學(xué)的發(fā)展方向必將得到拓展,以臨床醫(yī)護(hù)人員等為主的健康數(shù)據(jù)科學(xué)家更應(yīng)積極主動(dòng)參與其中,以更好地推動(dòng)健康數(shù)據(jù)科學(xué)的可持續(xù)發(fā)展,營(yíng)造良好的健康醫(yī)療數(shù)據(jù)生態(tài)。