鞏永強 ,王 超,許海云,方 曙
1中國科學(xué)院成都文獻情報中心,四川成都,610041;
2中國科學(xué)院大學(xué)經(jīng)濟與管理學(xué)院圖書情報與檔案管理系,北京,100190;
3濟寧醫(yī)學(xué)院醫(yī)學(xué)信息工程學(xué)院,山東日照,276826;
4山東省科學(xué)院情報所,山東濟南,250014;5山東理工大學(xué)管理學(xué)院,山東淄博,255000
隨著信息技術(shù)發(fā)展及智能設(shè)備的廣泛應(yīng)用,行業(yè)與個體產(chǎn)生的大量復(fù)雜數(shù)據(jù)以多種形式得以保存,社會數(shù)據(jù)量產(chǎn)出呈明顯指數(shù)增長趨勢,人類社會從以信息技術(shù)(information technology, IT)為主的信息時代進入以數(shù)據(jù)技術(shù)(data technology, DT)為主的大數(shù)據(jù)時代,數(shù)據(jù)成為行業(yè)新資源。全球知識平臺網(wǎng)絡(luò)互聯(lián)背景下醫(yī)學(xué)知識的融合、病情事實的分析及診療方案的制定所需的知識由傳統(tǒng)的熟記硬背轉(zhuǎn)為對相關(guān)信息的定位[1],醫(yī)療質(zhì)量的維持和提高從完全依賴人力評估轉(zhuǎn)向結(jié)合人力判斷的醫(yī)學(xué)數(shù)據(jù)。慢性病大數(shù)據(jù)、組學(xué)數(shù)據(jù)和高通量數(shù)據(jù)在臨床醫(yī)學(xué)中的應(yīng)用使得與疾病有關(guān)的全方位大數(shù)據(jù)的獲取與分析成為可能,醫(yī)生對疾病分析實現(xiàn)了從個體到群體再到個體的轉(zhuǎn)變,醫(yī)療模式由以通用既定方案為中心的治療模式轉(zhuǎn)向以促進健康、疾病預(yù)測和個體化診療為中心的預(yù)防模式。數(shù)據(jù)技術(shù)的臨床應(yīng)用從根本上推動了醫(yī)療體系的數(shù)字化轉(zhuǎn)型,醫(yī)療數(shù)據(jù)帶來的挑戰(zhàn)和影響持續(xù)擴大,數(shù)據(jù)意識(data awareness)和數(shù)據(jù)素養(yǎng)(data literacy)成為當(dāng)前及未來醫(yī)療人才需具備的標(biāo)準(zhǔn)配置[2],特殊時代背景促使醫(yī)學(xué)教育領(lǐng)域開始重視醫(yī)學(xué)生的數(shù)據(jù)思維及數(shù)據(jù)搜集和分析能力的培養(yǎng),使其能夠基于專業(yè)知識分析相關(guān)醫(yī)療數(shù)據(jù)得出最適合病患的個體化診療方案。1910年發(fā)布的《Flexner報告》將當(dāng)代科學(xué)引入醫(yī)學(xué)教育,面對數(shù)據(jù)技術(shù)對醫(yī)療領(lǐng)域的沖擊,現(xiàn)代醫(yī)學(xué)教育體系有必要納入數(shù)據(jù)素養(yǎng)教育實現(xiàn)學(xué)科的重新建構(gòu)和可持續(xù)發(fā)展[3]。基于此,本文針對醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的內(nèi)涵和教育實施路徑進行探討,以期為后續(xù)相關(guān)的理論與實踐研究提供借鑒和參考。
國內(nèi)外已有大量文獻針對數(shù)據(jù)素養(yǎng)概念進行了研討,研究角度不同致使研究結(jié)論各異,概括起來可分為以下4種類型:①信息素養(yǎng)觀。美國大學(xué)與研究圖書館協(xié)會發(fā)布的《高等教育信息素質(zhì)框架》新增數(shù)據(jù)素養(yǎng)描述,從信息素養(yǎng)教育角度認(rèn)可了數(shù)據(jù)價值[4],部分學(xué)者認(rèn)為數(shù)據(jù)素養(yǎng)是信息素養(yǎng)在大數(shù)據(jù)時代的延續(xù)和擴展[5],然而嚴(yán)格來講數(shù)據(jù)的外延大于信息,數(shù)據(jù)素養(yǎng)所需要的知識技能是數(shù)據(jù)層面進一步的具體化和復(fù)雜化,因此數(shù)據(jù)素養(yǎng)并非信息素養(yǎng)的單純提高和深化。②統(tǒng)計素養(yǎng)觀。另有研究認(rèn)為數(shù)據(jù)素養(yǎng)是對統(tǒng)計數(shù)據(jù)進行批判性思考并將其作為證據(jù)的能力[6],有學(xué)者直接將數(shù)據(jù)素養(yǎng)等同于統(tǒng)計素養(yǎng)[7],但是數(shù)據(jù)科學(xué)領(lǐng)域中數(shù)據(jù)分析側(cè)重數(shù)據(jù)背后知識規(guī)律的挖掘,其所要求的數(shù)據(jù)處理技能多在統(tǒng)計能力范疇之外,二者雖有相同之處但各為獨立概念。③科學(xué)素養(yǎng)觀。多數(shù)文獻強調(diào)數(shù)據(jù)素養(yǎng)是處理科學(xué)研究數(shù)據(jù)集所需的知識與能力[8],認(rèn)為數(shù)據(jù)素養(yǎng)是具備數(shù)據(jù)知識和技能并能利用數(shù)據(jù)資源發(fā)現(xiàn)問題、分析問題及解決問題的能力[9],但是數(shù)據(jù)素養(yǎng)的概念覆蓋多種數(shù)據(jù)類型,科學(xué)數(shù)據(jù)素養(yǎng)的研究對象主要為高度系統(tǒng)性的科研數(shù)據(jù),所以側(cè)重論述科研數(shù)據(jù)的定義較為偏頗。④數(shù)據(jù)管理觀。更多研究認(rèn)為數(shù)據(jù)素養(yǎng)是數(shù)據(jù)收集、管理、評估、共享、應(yīng)用等一系列關(guān)鍵能力的組合[10],是數(shù)據(jù)道德規(guī)范下發(fā)現(xiàn)和獲取、選擇和評估、管理和處理、利用和共享數(shù)據(jù),基于數(shù)據(jù)解決問題的意識和能力[11]。數(shù)據(jù)管理觀定義高度概括了數(shù)據(jù)素養(yǎng)所需知識能力,但其基于群體角度分析適用于大眾的數(shù)據(jù)技能,未考慮學(xué)科和專業(yè)等因素,代表性存在不足。綜上可知,學(xué)界對于數(shù)據(jù)素養(yǎng)尚無統(tǒng)一定義,學(xué)科化的醫(yī)學(xué)數(shù)據(jù)素養(yǎng)概念更是少有探討,醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的概念和內(nèi)涵有待深入研究。
探究醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的概念首先應(yīng)了解醫(yī)學(xué)數(shù)據(jù)的特殊性和復(fù)雜性,因為除具備常規(guī)數(shù)據(jù)的共性屬性以外,醫(yī)療數(shù)據(jù)還擁有諸多獨有特征:①大規(guī)模和實時性。醫(yī)院信息化建設(shè)促成了患者數(shù)據(jù)的產(chǎn)出和保存,精準(zhǔn)醫(yī)學(xué)發(fā)展也導(dǎo)致個體病理數(shù)據(jù)的急速膨脹,基因組、影像診斷、實驗室圖譜等高速增長的診療數(shù)據(jù)呈現(xiàn)海量規(guī)模,傳統(tǒng)醫(yī)療業(yè)務(wù)的數(shù)字化產(chǎn)生更多實時監(jiān)控數(shù)據(jù),如遠(yuǎn)程醫(yī)療、麻醉監(jiān)控和ICU監(jiān)測系統(tǒng)等,因此醫(yī)療數(shù)據(jù)具備大規(guī)模和實時增長的特點。②價值性和隱私性。大數(shù)據(jù)時代個人健康數(shù)據(jù)應(yīng)用于新藥研制、疾病診斷和干預(yù)措施研究等商業(yè)行為會產(chǎn)生重大效益[12],納入系統(tǒng)研究則有助于疾病診療規(guī)則的建立和疾病攻克?;颊哚t(yī)療信息包含其身份信息、生物特征、疾病信息等個人敏感數(shù)據(jù),所以相較于普通數(shù)據(jù),醫(yī)療數(shù)據(jù)的價值性和隱私性更高。③不完整性和不準(zhǔn)確性。診療措施的多樣性致使醫(yī)療數(shù)據(jù)大多為多維縱向數(shù)據(jù),患者多病種以及診療中斷、人工記錄主觀化、數(shù)據(jù)迭代更新等原因易造成數(shù)據(jù)項出現(xiàn)偏差和殘缺等問題,同時表述方式不同(如疾病的名稱和病案編碼)等語義信息差異也導(dǎo)致原始醫(yī)療數(shù)據(jù)存在多種不確定性,因此醫(yī)療數(shù)據(jù)的不完全性和不準(zhǔn)確性較為明顯。④多源異構(gòu)性和多態(tài)性。醫(yī)療信息領(lǐng)域多種數(shù)據(jù)標(biāo)準(zhǔn)、協(xié)議和規(guī)范致使數(shù)據(jù)來源和格式呈明顯的多樣化和異質(zhì)性[13],不同終端產(chǎn)生的醫(yī)療數(shù)據(jù)除結(jié)構(gòu)化數(shù)據(jù)外還包括文字、信號和圖像等在內(nèi)的多種形態(tài)數(shù)據(jù),呈典型非結(jié)構(gòu)化或半結(jié)構(gòu)化特征且在數(shù)據(jù)總體中占較大比例,導(dǎo)致醫(yī)療數(shù)據(jù)的分散和割裂程度比較嚴(yán)重。臨床實際中的數(shù)據(jù)規(guī)模和類型超出醫(yī)務(wù)人員的認(rèn)知和解讀能力,其面臨復(fù)雜數(shù)據(jù)亂象問題常常束手無策,因此醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的提升迫在眉睫。
結(jié)合已有定義和醫(yī)學(xué)數(shù)據(jù)特點本研究認(rèn)為醫(yī)學(xué)數(shù)據(jù)素養(yǎng)為在道德倫理范疇和法律允許范圍內(nèi),能夠敏銳地意識到臨床常規(guī)或突發(fā)數(shù)據(jù)的潛在價值和意義,并可基于醫(yī)療知識對數(shù)據(jù)進行獲取、處理和分析得出結(jié)論應(yīng)用于實際診療中的知識和技能的集合,其內(nèi)涵包括醫(yī)學(xué)數(shù)據(jù)意識、醫(yī)學(xué)數(shù)據(jù)知識、醫(yī)學(xué)數(shù)據(jù)技能和數(shù)據(jù)臨床應(yīng)用4個部分。見圖1。
圖1 醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的內(nèi)涵
醫(yī)療數(shù)據(jù)包含個人隱私和疾病信息,其泄漏會對個人甚至整個社會造成危害,因此數(shù)據(jù)安全是所有基于數(shù)據(jù)的醫(yī)療活動的基礎(chǔ),涵蓋了數(shù)據(jù)需求意識、數(shù)據(jù)倫理意識和數(shù)據(jù)法律意識的醫(yī)學(xué)數(shù)據(jù)意識是數(shù)據(jù)素養(yǎng)的核心因素。醫(yī)療決策是高度數(shù)據(jù)驅(qū)動的,依據(jù)患者相關(guān)數(shù)據(jù)不僅能制定個性化診療方案,還可基于疾病的歷史和實時監(jiān)控數(shù)據(jù)建立預(yù)測模型實現(xiàn)精準(zhǔn)預(yù)防[14],醫(yī)務(wù)人員對疾病數(shù)據(jù)的敏感性有助于疾病診療,尤其是基于專業(yè)知識對傳染性疾病暴發(fā)初期相關(guān)數(shù)據(jù)的感知,因此醫(yī)療數(shù)據(jù)活動首先需要具備數(shù)據(jù)需求意識,即在臨床診療中具備數(shù)據(jù)敏感性以及能具體描述所需原始數(shù)據(jù)的特征、意義并可實現(xiàn)定位、獲取和跟蹤。
醫(yī)學(xué)數(shù)據(jù)倫理意識是指數(shù)據(jù)的使用、引用、共享等都需獲取數(shù)據(jù)提供方(如患者)的知情同意并在倫理道德允許范圍內(nèi)限定公開傳播的時間和范圍,避免出現(xiàn)數(shù)據(jù)的不當(dāng)使用。醫(yī)務(wù)人員常處理禁止自由共享的包含個人可識別信息的臨床數(shù)據(jù)[15],醫(yī)療數(shù)據(jù)除常規(guī)科研引用外,還有通過分享或二次利用等途徑實現(xiàn)數(shù)據(jù)價值的最大化,上述行為均涉及到倫理道德審查,因此倫理意識養(yǎng)成是醫(yī)學(xué)數(shù)據(jù)意識的重中之重。
數(shù)據(jù)法律意識是指了解患者數(shù)據(jù)泄露的不良后果及潛在法律風(fēng)險并能夠進行隱私影響評估(privacy impact assessment, PIA),在認(rèn)知層面對數(shù)據(jù)的產(chǎn)權(quán)和收益歸屬及可否關(guān)聯(lián)具備一定的判斷力,在法律法規(guī)規(guī)定范圍內(nèi)限定醫(yī)療數(shù)據(jù)訪問權(quán)限,處理數(shù)據(jù)時能依照安全性原則對不同保密等級的數(shù)據(jù)進行保留或銷毀?;颊唠m是診療數(shù)據(jù)的產(chǎn)出者卻并非數(shù)據(jù)提供者,醫(yī)療機構(gòu)也不具備數(shù)據(jù)所有權(quán),醫(yī)療數(shù)據(jù)利益相關(guān)方的多樣性和復(fù)雜性成為數(shù)據(jù)利用障礙之一,然而相關(guān)法律界定卻趨于模糊和抽象,因此法律意識的具備和強化是醫(yī)學(xué)數(shù)據(jù)意識的必須補充。
作為典型的數(shù)據(jù)密集型和數(shù)據(jù)驅(qū)動型學(xué)科,醫(yī)學(xué)領(lǐng)域包含海量復(fù)雜數(shù)據(jù),即使記錄不完善的數(shù)據(jù)都可能隱藏了有待發(fā)掘和利用的重要醫(yī)學(xué)信息[16],再者數(shù)據(jù)的認(rèn)知和特征提取是數(shù)據(jù)利用的首要前提[17]。因此醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的關(guān)鍵是醫(yī)學(xué)數(shù)據(jù)知識的理解和掌握,內(nèi)容包括數(shù)據(jù)科學(xué)基本概念、元數(shù)據(jù)描述規(guī)范和著錄標(biāo)準(zhǔn),常見醫(yī)療數(shù)據(jù)特征、結(jié)構(gòu)、格式和變量類型,不同類型數(shù)據(jù)存儲注意事項和數(shù)據(jù)之間交互關(guān)系,常用數(shù)據(jù)分析算法和模型的原理,醫(yī)學(xué)信息的數(shù)據(jù)描述及異常值所表征的真實臨床意義等。
從數(shù)據(jù)產(chǎn)生經(jīng)加工處理到實現(xiàn)再利用的過程中,數(shù)據(jù)價值隨時間推移發(fā)生的演化規(guī)律稱為數(shù)據(jù)生命周期。為使培養(yǎng)對象具備數(shù)據(jù)價值循環(huán)可再生的整體性思維,數(shù)據(jù)技能的培養(yǎng)應(yīng)基于數(shù)據(jù)生命周期理論展開。結(jié)合醫(yī)療數(shù)據(jù)特點,本文依據(jù)DataONE數(shù)據(jù)生命周期模型,將醫(yī)學(xué)數(shù)據(jù)技能劃分為醫(yī)療數(shù)據(jù)獲取、醫(yī)療數(shù)據(jù)評估、醫(yī)療數(shù)據(jù)處理、醫(yī)療數(shù)據(jù)分析和臨床數(shù)據(jù)解析5個模塊。醫(yī)療數(shù)據(jù)獲取是進行所有數(shù)據(jù)操作的前提和保證,能力要求除基本的醫(yī)療信息資源檢索外還包括不同等級開放數(shù)據(jù)(如公共衛(wèi)生數(shù)據(jù))、共享數(shù)據(jù)(如不同級別衛(wèi)生機構(gòu)間)的獲取以及目標(biāo)數(shù)據(jù)(如非公開患者健康數(shù)據(jù))在數(shù)據(jù)倉儲中的準(zhǔn)確定位,能夠結(jié)合分析和應(yīng)用需求設(shè)計數(shù)據(jù)篩選標(biāo)準(zhǔn),記錄特定疾病(新生兒疾病、傳染性疾病等)真實來源并在獲取和保存的過程中保證數(shù)據(jù)的準(zhǔn)確性和可溯源性。
醫(yī)療數(shù)據(jù)生成和來源途徑的多樣致使數(shù)據(jù)可信度不一,數(shù)據(jù)結(jié)構(gòu)偏差、輸入失誤和數(shù)據(jù)標(biāo)簽?zāi):鶗绊懪R床研究結(jié)果價值,因此對數(shù)據(jù)質(zhì)量需開展數(shù)據(jù)評估。在完整性方面,查看必填字段有無缺失遺漏;準(zhǔn)確性方面,檢查數(shù)據(jù)字段數(shù)值是否滿足既定范圍要求、指標(biāo)數(shù)值與總體分布的符合度、數(shù)值單位標(biāo)引是否符合邏輯;一致性方面,按照數(shù)據(jù)數(shù)值與格式標(biāo)準(zhǔn)規(guī)范統(tǒng)一等原則對醫(yī)療數(shù)據(jù)進行判斷,鑒別和估測數(shù)據(jù)的真實性、局限性及其價值,識別虛假數(shù)據(jù)和誤差,對醫(yī)療過程中的異常數(shù)據(jù)及離群值所表征的特殊信息高度敏感并能預(yù)見其臨床效應(yīng)。高質(zhì)量診療決策需多種來源和類型的醫(yī)療數(shù)據(jù)支持,醫(yī)療數(shù)據(jù)處理指能夠基于專業(yè)知識按照臨床和科研的前瞻性或回顧性需要,將多種不同數(shù)據(jù)按照同一標(biāo)準(zhǔn)進行格式轉(zhuǎn)換以實現(xiàn)跨組織數(shù)據(jù)集成和匹配的過程,并能在數(shù)據(jù)聚合之前完成去標(biāo)識化、潛在偏差識別及組織加工、歸檔存儲等規(guī)范化操作,理解常用處理算法和過濾規(guī)則并可根據(jù)數(shù)據(jù)類型和分析任務(wù)設(shè)計清洗方案,對于電子病歷中的缺失數(shù)據(jù)能夠進行敏感性分析并可使用將誤差控制在合理范圍內(nèi)的估算值進行插補以消除不確定性。
醫(yī)療數(shù)據(jù)分析是指采用定量方法,尤其是以可分析非結(jié)構(gòu)化醫(yī)療數(shù)據(jù)的機器學(xué)習(xí)為代表的分析模型處理數(shù)據(jù)和支持決策制定的過程,要求能理解數(shù)據(jù)分析原理并掌握適用于醫(yī)學(xué)數(shù)據(jù)的數(shù)據(jù)挖掘算法和模式識別方法,可結(jié)合疾病數(shù)據(jù)集的變量數(shù)量和特征選擇合適的工具與模型實現(xiàn)疾病的監(jiān)測、關(guān)聯(lián)和預(yù)測分析。醫(yī)療數(shù)據(jù)解析是對數(shù)據(jù)分析結(jié)果的解讀和表達,數(shù)據(jù)解讀是指個體能結(jié)合上下文根據(jù)數(shù)據(jù)分析結(jié)果對原始病患進行分型分類,識別數(shù)據(jù)所表征的病因、病情和趨勢,從數(shù)據(jù)科學(xué)角度解釋數(shù)據(jù)指標(biāo)的臨床意義,數(shù)據(jù)表達則為對分析結(jié)果的展示。醫(yī)學(xué)數(shù)據(jù)往往牽涉多個變量和維度,二維表達無法揭示全部相關(guān)因素,可視化便成為探索巨量醫(yī)療數(shù)據(jù)的優(yōu)選工具。雖然幾乎所有層次的醫(yī)學(xué)生在圖表的構(gòu)建和解析方面都存在一定困難[18],但對診療數(shù)據(jù)分析結(jié)果提取的知識進行驗證并應(yīng)用于診療實踐是醫(yī)學(xué)科研和臨床工作中不可缺少的一環(huán),因此利用數(shù)據(jù)作為證據(jù)增強所需佐證對象的合理性時,能夠依托專業(yè)知識和數(shù)據(jù)屬性選擇合適的可視化形式對分析結(jié)果進行呈現(xiàn)、解析甚至否定,并以患者和專業(yè)人士等受眾所能理解和接受的方式進行溝通是數(shù)據(jù)解析能力的基本要求。
醫(yī)學(xué)數(shù)據(jù)臨床利用是所有醫(yī)療數(shù)據(jù)活動的終極歸宿,其中臨床診療應(yīng)用是指在分析方法和工具科學(xué)合理的前提下,醫(yī)技人員能夠從專業(yè)角度整合多個數(shù)據(jù)源并根據(jù)其來源和級別準(zhǔn)確評估數(shù)據(jù)應(yīng)用代價和價值,實現(xiàn)分析結(jié)果在診療方案制定、病因和風(fēng)險識別、并發(fā)癥和術(shù)后感染預(yù)防、疾病預(yù)后等業(yè)務(wù)領(lǐng)域中的無斷點、無異常的個體化臨床應(yīng)用。單個醫(yī)療站點的數(shù)據(jù)分析結(jié)果往往質(zhì)量堪憂,多個醫(yī)療站點數(shù)據(jù)共享則可增大數(shù)據(jù)集量,提高分析結(jié)果精準(zhǔn)度,因此數(shù)據(jù)共享是數(shù)據(jù)價值發(fā)揮的重要保證[19]。醫(yī)療數(shù)據(jù)牽涉多方利益,共享活動的發(fā)生應(yīng)明確數(shù)據(jù)所有權(quán)、訪問權(quán)及權(quán)利轉(zhuǎn)讓,了解共享法規(guī)和安全數(shù)據(jù)傳輸機制并能制訂共享協(xié)議,在限定的時間和范圍內(nèi)按照最低必要標(biāo)準(zhǔn)(minimum necessary standard)、模糊度最小化和利益透明三原則共享數(shù)據(jù)集,在不影響數(shù)據(jù)效用的前提下使用醫(yī)療數(shù)據(jù)匿名化和假名化處理技術(shù)消除歧義和可以反推隱私的標(biāo)識符以降低風(fēng)險。原始目的以外使用數(shù)據(jù)的廣義行為統(tǒng)稱為數(shù)據(jù)二次利用或數(shù)據(jù)重用。醫(yī)療數(shù)據(jù)二次利用可實現(xiàn)從經(jīng)驗中學(xué)習(xí)(learning from experience),臨床研究、醫(yī)學(xué)教育等利益相關(guān)群體均可從中獲益[20]。領(lǐng)域內(nèi)二次利用多為提升單個病種的診療質(zhì)量,領(lǐng)域外則是為學(xué)術(shù)研究、新藥研發(fā)或保險賠付,其中最大紛爭在于隱私保護和利益劃歸,所以醫(yī)療數(shù)據(jù)重用的首要事項是獲得數(shù)據(jù)所有方同意,同時二次利用領(lǐng)域需區(qū)別于初始領(lǐng)域以保護原始權(quán)益和隱私。
國外醫(yī)療機構(gòu)或院校較早意識到醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的重要性并開展相關(guān)教育活動,2011年美國國立衛(wèi)生研究院資助馬薩諸塞大學(xué)醫(yī)學(xué)院Lamar Soutter圖書館的新英格蘭數(shù)據(jù)管理協(xié)作課程項目開展數(shù)據(jù)素養(yǎng)教育[21],弗萊堡大學(xué)醫(yī)學(xué)院為提升耳鼻喉科專業(yè)本科生數(shù)據(jù)素養(yǎng)舉辦了耳鼻喉科數(shù)字化項目課程[22],紐約大學(xué)醫(yī)學(xué)院面向醫(yī)學(xué)中心研究團隊開設(shè)臨床研究數(shù)據(jù)管理 (clinical research data management, CRDM) 培訓(xùn)以加強臨床研究人員項目數(shù)據(jù)管理技能[23],華盛頓大學(xué)醫(yī)學(xué)院面向本科生實施了交叉學(xué)科實驗性數(shù)據(jù)科學(xué)(experiential data science for undergraduate cross-disciplinary education, EDUCE)方案以提高生命科學(xué)專業(yè)本科生的數(shù)據(jù)科學(xué)核心能力[24],德國漢諾威醫(yī)學(xué)院面向醫(yī)學(xué)專業(yè)本科生開設(shè)數(shù)據(jù)素養(yǎng)選修課以促進數(shù)據(jù)醫(yī)學(xué)相關(guān)內(nèi)容學(xué)習(xí)[25]。國內(nèi)部分院校開展了醫(yī)學(xué)數(shù)據(jù)素養(yǎng)相關(guān)教學(xué),南方醫(yī)科大學(xué)面向研究生群體增設(shè)《醫(yī)學(xué)研究數(shù)據(jù)的管理與分析》課程,中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所針對情報學(xué)專業(yè)研究生開設(shè)了面向數(shù)據(jù)科學(xué)家(data scientist)的數(shù)據(jù)挖掘方法和工具介紹課程,其他醫(yī)學(xué)院校多開辦了數(shù)據(jù)科學(xué)相關(guān)講座或?qū)W術(shù)沙龍講解數(shù)據(jù)管理工具或方法。
綜上可知,國外醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教育較為側(cè)重本科生數(shù)據(jù)管理技能教學(xué),國內(nèi)院校雖也開展了包含數(shù)據(jù)素養(yǎng)內(nèi)容的教學(xué)工作,但其起步較晚,教學(xué)內(nèi)容和模式基本上是對國外同行的借鑒和模仿,存在教學(xué)方式滯后、學(xué)科特色缺乏、教學(xué)對象未覆蓋本科生等一系列問題。
無論是數(shù)據(jù)意識的具備還是數(shù)據(jù)知識技能的掌握,目的都是個體能通過醫(yī)療數(shù)據(jù)分析挖掘出可用于臨床實踐的知識規(guī)律。作為長期教育工程,醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教學(xué)目標(biāo)應(yīng)按照漸進性原則分階段設(shè)置。通識教育結(jié)束后個體在認(rèn)知層面初步具備數(shù)據(jù)倫理觀、法律觀、價值觀和數(shù)據(jù)科學(xué)基礎(chǔ)知識,專業(yè)教育完成后個體能夠掌握專業(yè)學(xué)科領(lǐng)域所要求的數(shù)據(jù)科學(xué)通用技能和專業(yè)的知識技能,實踐教育期間及之后醫(yī)務(wù)人員能在臨床和科研中通過對數(shù)據(jù)的標(biāo)準(zhǔn)分析提取數(shù)據(jù)證據(jù)應(yīng)用于診療實踐,從而利用數(shù)據(jù)技能養(yǎng)成終生學(xué)習(xí)的能力。醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教育層次化目標(biāo)體系由低級到高級,由簡單到復(fù)雜,由理論到實踐,不僅符合臨床經(jīng)驗生成模式而且也對應(yīng)了數(shù)據(jù)科研范式下循證醫(yī)學(xué)領(lǐng)域數(shù)據(jù)-信息-證據(jù)-知識(data-information-evidence-knowledge, DIEK)的轉(zhuǎn)化規(guī)律所表征的路徑[26]。見圖2。
圖2 契合DIEK路徑的醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教學(xué)目標(biāo)體系
學(xué)科數(shù)據(jù)素養(yǎng)所需的知識和能力需要階段化培養(yǎng),醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教育也應(yīng)結(jié)合專業(yè)培養(yǎng)進度分塊進行。醫(yī)學(xué)數(shù)據(jù)意識和醫(yī)學(xué)數(shù)據(jù)知識部分宜在醫(yī)學(xué)專業(yè)教育初期借助通識教育實現(xiàn)相關(guān)內(nèi)容的理論教學(xué),教學(xué)任務(wù)通過以教室為場地的課堂教學(xué)完成,由于本階段以教師理論講授為主,故為典型的基于理論的學(xué)習(xí)。醫(yī)學(xué)學(xué)科體系龐雜,即使細(xì)分領(lǐng)域之間也存在一定學(xué)科壁壘,不同年級和專業(yè)學(xué)生的知識結(jié)構(gòu)和研究內(nèi)容分歧明顯,數(shù)據(jù)認(rèn)知與數(shù)據(jù)需求存在顯著性差異[27],然而精細(xì)化和專業(yè)化的數(shù)據(jù)知識能力是醫(yī)務(wù)人員從事臨床和科研工作的必備技能,所以醫(yī)學(xué)數(shù)據(jù)技能教育應(yīng)為通識教育基礎(chǔ)上的學(xué)科專業(yè)教育,教學(xué)內(nèi)容根據(jù)學(xué)科專業(yè)和教學(xué)對象特點進行模塊化設(shè)計,教學(xué)模式為數(shù)據(jù)技能知識課堂理論講解輔以數(shù)據(jù)通用技能和專業(yè)技能的強化訓(xùn)練實驗課程,針對性設(shè)計的模塊化教學(xué)內(nèi)容循序漸進,理論與實踐并舉實現(xiàn)數(shù)據(jù)知識和技能的遞進式融會貫通。數(shù)據(jù)臨床應(yīng)用則為對真實數(shù)據(jù)集進行處理后應(yīng)用于具體臨床案例的活動,培養(yǎng)對象在項目實際操作過程中能夠進行數(shù)據(jù)分析成果的現(xiàn)實場景應(yīng)用、臨床數(shù)據(jù)共享或二次利用等操作,積累數(shù)據(jù)分析結(jié)果臨床應(yīng)用經(jīng)驗。以上數(shù)據(jù)知識和能力強化過程同以系統(tǒng)為中心的醫(yī)學(xué)學(xué)習(xí)的授予式學(xué)習(xí)、形成式學(xué)習(xí)和轉(zhuǎn)化式學(xué)習(xí)三層次正相吻合,因此醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的漸進式培養(yǎng)完全符合醫(yī)學(xué)學(xué)科專業(yè)學(xué)習(xí)規(guī)律。見圖3。
圖3 以系統(tǒng)為中心的醫(yī)學(xué)數(shù)據(jù)素養(yǎng)漸進式教育模式
數(shù)據(jù)素養(yǎng)的全面具備離不開專業(yè)性系統(tǒng)課程的開設(shè),為實現(xiàn)數(shù)據(jù)素養(yǎng)教育目標(biāo)有必要圍繞數(shù)據(jù)生命周期開發(fā)專業(yè)性系統(tǒng)課程,課程內(nèi)容設(shè)計與教學(xué)目標(biāo)體系和醫(yī)學(xué)學(xué)習(xí)層次相匹配,按照難度梯度進行階段性和模塊化設(shè)置。課程初期培養(yǎng)數(shù)據(jù)意識和學(xué)習(xí)數(shù)據(jù)知識,屬基礎(chǔ)階段;課程中期是對數(shù)據(jù)技能的講解和訓(xùn)練,在理解數(shù)據(jù)處理原理基礎(chǔ)上能根據(jù)數(shù)據(jù)特征選擇合適的方法和工具進行操作;后期則是醫(yī)療數(shù)據(jù)應(yīng)用項目演練,練習(xí)將醫(yī)療數(shù)據(jù)分析結(jié)果應(yīng)用于臨床診療實踐,基于數(shù)據(jù)支撐結(jié)合病患實況制定診療方案。數(shù)據(jù)素養(yǎng)課程全過程基于真實數(shù)據(jù)集的專業(yè)案例講解,梯度式課程設(shè)計將不同階段所需數(shù)據(jù)素養(yǎng)知識和技能完美銜接,促進數(shù)據(jù)科學(xué)知識傳授的同時增強了專業(yè)知識與現(xiàn)實世界之間的聯(lián)系,實現(xiàn)了數(shù)據(jù)科學(xué)和專業(yè)知識的融合教學(xué)。
以淺層培訓(xùn)或突擊式講座形式的數(shù)據(jù)素養(yǎng)教學(xué)僅為補充性的強化手段,無法達到系統(tǒng)性課程教學(xué)帶來的數(shù)據(jù)知識和技能積累,雖然當(dāng)前在線教學(xué)得到了大規(guī)模應(yīng)用,但該類基于網(wǎng)絡(luò)的自主學(xué)習(xí)模式缺少課堂監(jiān)督、交流和教學(xué)考察等環(huán)節(jié),教學(xué)質(zhì)量和效果無法得到有效保證。當(dāng)然線下培訓(xùn)和線上學(xué)習(xí)的教學(xué)方式及相應(yīng)效果不可完全否定,作為課堂教學(xué)的輔助,其有利于數(shù)據(jù)科學(xué)新興工具與方法的掌握,授課教師可將課程資源進行在線教學(xué)模塊建設(shè)或推薦相關(guān)教學(xué)內(nèi)容以作為學(xué)有余力和數(shù)據(jù)需求較高者補充或強化數(shù)據(jù)素養(yǎng)的重要手段和途徑,為學(xué)生提供從入門到高階的學(xué)習(xí)資源,因此以傳統(tǒng)教學(xué)方式為主的課堂教學(xué)和以可調(diào)動學(xué)生興趣并豐富學(xué)習(xí)形式的新型教學(xué)方式為輔的多樣化教學(xué)形式可以加快數(shù)據(jù)素養(yǎng)教育模式的建立和完善。
學(xué)習(xí)本身是與感官體驗?zāi)嫦虻?,在自身未意識到利益的前提下較少有學(xué)生能主動學(xué)習(xí)一門新學(xué)科,尤其是專業(yè)課程繁多的醫(yī)學(xué)生更不會自覺將時間和精力投入非醫(yī)學(xué)專業(yè)課程的學(xué)習(xí),鑒于此醫(yī)學(xué)數(shù)據(jù)素養(yǎng)知識能力學(xué)習(xí)狀況考核也需采用學(xué)分制形式半強制性要求學(xué)生掌握課程內(nèi)容。數(shù)據(jù)素養(yǎng)知識能力的考核與評價并無絕對固定的知識點和標(biāo)準(zhǔn)答案,已有的數(shù)據(jù)素養(yǎng)評價體系多是根據(jù)既定指標(biāo)進行主觀打分,評價方式的準(zhǔn)確度不能保證。目前考試系統(tǒng)可明確列出題目的分?jǐn)?shù)得失明細(xì)并給出知識點掌握詳情,因此由于數(shù)據(jù)意識及數(shù)據(jù)知識和技能部分的多數(shù)知識內(nèi)容屬于顯性知識,其可通過客觀題考試的形式進行客觀考核,無法量化評價的數(shù)據(jù)技能模塊及實踐應(yīng)用部分的內(nèi)容多為隱形知識,可在實驗項目或?qū)嵙?xí)學(xué)習(xí)結(jié)束時以基于項目數(shù)據(jù)的研究報告借助主觀考核的方式進行主觀評價,主客觀兼顧實現(xiàn)知識與能力掌握情況的綜合考察并通過定量與定性方法給出最終考核成績。
師資質(zhì)量是任何教育成功開展的關(guān)鍵,醫(yī)學(xué)數(shù)據(jù)素養(yǎng)具備交叉學(xué)科背景,課程授課教師在教學(xué)科研工作中應(yīng)不斷擴充醫(yī)學(xué)和數(shù)據(jù)科學(xué)知識儲備、增強數(shù)據(jù)技能,在理論和實踐層面提高自身以勝任數(shù)據(jù)素養(yǎng)教學(xué)工作。教學(xué)過程中應(yīng)積極主動了解教學(xué)對象的醫(yī)學(xué)數(shù)據(jù)知識和技能需求,選擇最具代表性的真實臨床實例進行案例教學(xué),采用適合個體認(rèn)知習(xí)慣的教學(xué)方式培養(yǎng)其數(shù)據(jù)意識,根據(jù)專業(yè)背景和學(xué)習(xí)階段籌備不同類型的數(shù)據(jù)資源作為訓(xùn)練數(shù)據(jù)集供重復(fù)練習(xí)使用以強化特定數(shù)據(jù)技能,引導(dǎo)學(xué)生在分析和解決專業(yè)問題過程中基于數(shù)據(jù)進行表達和交流,在學(xué)與習(xí)中實現(xiàn)數(shù)據(jù)素養(yǎng)和專業(yè)知識的共同提升。
本文基于數(shù)據(jù)素養(yǎng)相關(guān)研究和醫(yī)學(xué)數(shù)據(jù)特點探討了醫(yī)學(xué)數(shù)據(jù)素養(yǎng)的概念和內(nèi)涵,根據(jù)國內(nèi)外醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教育現(xiàn)狀和醫(yī)學(xué)學(xué)科及專業(yè)特點提出教育模式的實施策略。不過作為跨學(xué)科教育,醫(yī)學(xué)數(shù)據(jù)素養(yǎng)教育工作的開展離不開高校和圖書館兩位主體的重視、參與和支持,圖書館應(yīng)依據(jù)資源優(yōu)勢將核心職能參考咨詢服務(wù)數(shù)據(jù)科學(xué)化,積極組織數(shù)據(jù)素養(yǎng)相關(guān)講座或競賽輔助教學(xué),高校也應(yīng)依托行政力量協(xié)調(diào)各二級學(xué)院共同整合數(shù)據(jù)資源創(chuàng)建用于數(shù)據(jù)共享、引用和存檔的Dataverse項目助力數(shù)據(jù)素養(yǎng)教育工程。醫(yī)學(xué)數(shù)據(jù)素養(yǎng)屬新興概念,局限于研究主題相關(guān)文獻的缺乏,無法通過充分的調(diào)研和參考進行詳實的統(tǒng)計分析和論證,故研究尚停留于理論層面的探討,再者臨床實際中醫(yī)學(xué)數(shù)據(jù)大多屬于多源異構(gòu)數(shù)據(jù),體量龐大格式復(fù)雜,所需數(shù)據(jù)知識和技能更為具體專深,本文對其進行統(tǒng)一論述缺少一定的針對性和專業(yè)性,因此研究仍存在諸多不足之處,期待在今后的實踐中能夠得到進一步優(yōu)化,探索出更為符合醫(yī)學(xué)教育和數(shù)據(jù)素養(yǎng)特性的教育模式。