王路漫 齊惠穎 王 靜 王 晨
(北京大學(xué)醫(yī)學(xué)人文學(xué)院 北京 100191)
隨著大數(shù)據(jù)時(shí)代的到來(lái),世界各國(guó)都把大數(shù)據(jù)看作一種重要的戰(zhàn)略資源,大數(shù)據(jù)建設(shè)和發(fā)展的核心競(jìng)爭(zhēng)力是人才培養(yǎng),培養(yǎng)數(shù)據(jù)獲取、分析和利用等能力的數(shù)據(jù)素養(yǎng)教育成為世界各國(guó)關(guān)注的焦點(diǎn)。早在 2012 年,美國(guó)總統(tǒng)奧巴馬就發(fā)布了“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,從國(guó)家層面呼吁各個(gè)行業(yè)領(lǐng)域充分利用大數(shù)據(jù)技術(shù)進(jìn)行革命創(chuàng)新,重點(diǎn)強(qiáng)調(diào)數(shù)據(jù)素養(yǎng)教育的重要性,提出大力開(kāi)展數(shù)據(jù)素養(yǎng)類課程,培養(yǎng)新一代具有數(shù)據(jù)科學(xué)素養(yǎng)的研究型人才[1]。隨后,世界各國(guó)相繼將開(kāi)展數(shù)據(jù)素養(yǎng)教育提上日程。我國(guó)也于2015 年由國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,該綱要提出要加強(qiáng)專業(yè)人才培養(yǎng),建立健全多層次、多類型的大數(shù)據(jù)人才培養(yǎng)體系[2]。
大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,深入推動(dòng)了各個(gè)行業(yè)的創(chuàng)新與變革,各個(gè)領(lǐng)域都急需具有數(shù)據(jù)素養(yǎng)的專業(yè)人員,醫(yī)療領(lǐng)域因?yàn)槠洫?dú)特的行業(yè)價(jià)值而受到各個(gè)層面的關(guān)注。2016年國(guó)務(wù)院辦公廳印發(fā)《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見(jiàn)》,將醫(yī)學(xué)大數(shù)據(jù)納入國(guó)家大數(shù)據(jù)戰(zhàn)略布局之中[3];《“健康中國(guó)2030”規(guī)劃綱要》中也指出要加強(qiáng)醫(yī)學(xué)大數(shù)據(jù)體系的建設(shè);十九大報(bào)告提出的“實(shí)施健康中國(guó)戰(zhàn)略”總體規(guī)劃中也包括醫(yī)學(xué)大數(shù)據(jù)的相關(guān)規(guī)劃及設(shè)計(jì)[4]。醫(yī)學(xué)大數(shù)據(jù)內(nèi)容涵蓋居民的整個(gè)醫(yī)療健康過(guò)程,利用大數(shù)據(jù)發(fā)掘數(shù)據(jù)中的潛在價(jià)值對(duì)于推動(dòng)醫(yī)學(xué)研究的進(jìn)步、全面實(shí)施健康中國(guó)戰(zhàn)略、滿足人民群眾健康醫(yī)療需求都具有重要促進(jìn)作用。大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)的獲取、分析和利用能力已經(jīng)成為醫(yī)學(xué)生的必備素養(yǎng)。
面對(duì)新時(shí)代的發(fā)展需求,為培養(yǎng)醫(yī)學(xué)生應(yīng)對(duì)時(shí)代變革所需的能力,北京大學(xué)醫(yī)學(xué)部于2016 年推出了一門研究生通識(shí)課程——《醫(yī)學(xué)大數(shù)據(jù)分析》。本文將總結(jié)該通識(shí)課程建設(shè)過(guò)程中的教學(xué)實(shí)踐經(jīng)驗(yàn),為面向?qū)iT領(lǐng)域的數(shù)據(jù)素養(yǎng)教育提供參考。
數(shù)據(jù)素養(yǎng)的概念最早出現(xiàn)在2004 年,隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)素養(yǎng)的概念也在不斷完善。目前對(duì)數(shù)據(jù)素養(yǎng)較為統(tǒng)一的定義為:具備數(shù)據(jù)意識(shí)和數(shù)據(jù)敏感性,能夠有效且恰當(dāng)?shù)孬@取、分析、處理、利用和展現(xiàn)數(shù)據(jù),并具有對(duì)數(shù)據(jù)的批判性思維能力。該定義是對(duì)統(tǒng)計(jì)素養(yǎng)和信息素養(yǎng)的延伸和擴(kuò)展[5-7],也是本文研究工作的前提基礎(chǔ)。我們通過(guò)對(duì)國(guó)內(nèi)外數(shù)據(jù)素養(yǎng)教育相關(guān)文獻(xiàn)進(jìn)行梳理,從數(shù)據(jù)素養(yǎng)教育研究和教學(xué)實(shí)踐兩個(gè)方面來(lái)闡述相關(guān)研究的進(jìn)展。
圍繞數(shù)據(jù)素養(yǎng)教育,國(guó)外學(xué)者已經(jīng)開(kāi)展了較為深入的研究。在課程教學(xué)設(shè)計(jì)層面,對(duì)課程數(shù)據(jù)使用、教學(xué)內(nèi)容、教學(xué)周期等多個(gè)方面綜合分析,進(jìn)行詳細(xì)的數(shù)據(jù)素養(yǎng)教學(xué)框架的研究[8];設(shè)置iSchool 院校數(shù)據(jù)素養(yǎng)課程[9];探討在數(shù)據(jù)素養(yǎng)課程中使用真實(shí)數(shù)據(jù)進(jìn)行教學(xué)實(shí)踐,激發(fā)學(xué)生的學(xué)習(xí)興趣,增強(qiáng)學(xué)習(xí)體驗(yàn)[10];開(kāi)發(fā)評(píng)價(jià)數(shù)據(jù)素養(yǎng)能力的測(cè)量工具,用于數(shù)據(jù)素養(yǎng)類課程的教學(xué)效果評(píng)價(jià)[11]。雖然國(guó)內(nèi)院校對(duì)數(shù)據(jù)素養(yǎng)的教育研究起步較晚,但已達(dá)成了普遍的共識(shí),即數(shù)據(jù)素養(yǎng)是大學(xué)生需要具備的核心能力之一。針對(duì)國(guó)內(nèi)外有代表性的高校,開(kāi)展了數(shù)據(jù)素養(yǎng)類課程的教育研究。例如研究生數(shù)據(jù)素養(yǎng)課程設(shè)置[12],數(shù)據(jù)素養(yǎng)課程群的構(gòu)建等[13],包括構(gòu)建面向不同培養(yǎng)對(duì)象的多維數(shù)據(jù)素養(yǎng)體系、注重課程內(nèi)容的層次遞進(jìn)性、重視教學(xué)方式的有效性與普適性等[14]。這些對(duì)高校數(shù)據(jù)素養(yǎng)類課程的教學(xué)研究更多集中在數(shù)據(jù)素養(yǎng)現(xiàn)狀介紹、典型案例分析、數(shù)據(jù)科學(xué)專業(yè)教育等方面。不同領(lǐng)域的數(shù)據(jù)素養(yǎng)教育有著不同的特點(diǎn),但從專門領(lǐng)域的角度探討數(shù)據(jù)素養(yǎng)教育的研究較少涉及。
培養(yǎng)數(shù)據(jù)素養(yǎng)最重要的途徑是設(shè)計(jì)合理有效的課程及培訓(xùn)項(xiàng)目[15-16],目前國(guó)內(nèi)外已經(jīng)開(kāi)展了一些相關(guān)的教學(xué)實(shí)踐活動(dòng),開(kāi)設(shè)針對(duì)不同專業(yè)學(xué)生的數(shù)據(jù)素養(yǎng)課程,部分高校開(kāi)設(shè)的具體課程內(nèi)容如表1 所示。例如:美國(guó)比較有代表性的普渡大學(xué)、哈佛大學(xué)為了滿足學(xué)生的數(shù)據(jù)素養(yǎng)提升需求,開(kāi)展相應(yīng)的教學(xué)項(xiàng)目及培訓(xùn)。美國(guó)約翰·霍普金斯大學(xué)醫(yī)學(xué)院、哈佛醫(yī)學(xué)院通過(guò)開(kāi)設(shè)數(shù)據(jù)素養(yǎng)類課程,幫助醫(yī)學(xué)專業(yè)學(xué)生提高利用大數(shù)據(jù)技術(shù)從紛繁復(fù)雜的數(shù)據(jù)中提取關(guān)鍵信息、得出科學(xué)結(jié)論的能力[17]。國(guó)內(nèi)有很多高校通過(guò)借鑒國(guó)外的數(shù)據(jù)素養(yǎng)類課程也開(kāi)展了相關(guān)的教學(xué)實(shí)踐。部分院校如武漢大學(xué)利用圖書(shū)館文獻(xiàn)數(shù)據(jù)資源開(kāi)展數(shù)據(jù)分析軟件、文獻(xiàn)數(shù)據(jù)庫(kù)利用等實(shí)踐教育方面的培訓(xùn)[18]。南京大學(xué)借助R、Python 等程序設(shè)計(jì)語(yǔ)言,從計(jì)算機(jī)技術(shù)的角度來(lái)構(gòu)建數(shù)據(jù)素養(yǎng)教育的知識(shí)體系。復(fù)旦大學(xué)將數(shù)據(jù)素養(yǎng)類課程加入本科生“科學(xué)探索與技術(shù)創(chuàng)新”課程體系模塊中,形成課程之間的交叉與融合。國(guó)內(nèi)大部分院校開(kāi)設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”等相關(guān)課程,大多基于數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫(kù)等計(jì)算機(jī)知識(shí)體系來(lái)進(jìn)行教學(xué)內(nèi)容的設(shè)置,主要面向相關(guān)專業(yè)的學(xué)生,不適合沒(méi)有相關(guān)知識(shí)儲(chǔ)備的學(xué)生學(xué)習(xí)[19],而圖書(shū)館開(kāi)設(shè)的數(shù)據(jù)素養(yǎng)類課程主要針對(duì)文獻(xiàn)數(shù)據(jù)庫(kù)的利用和相關(guān)軟件的使用。目前針對(duì)專門領(lǐng)域構(gòu)建數(shù)據(jù)素養(yǎng)類通識(shí)課程的實(shí)踐比較缺乏[20]。因此,本文通過(guò)《醫(yī)學(xué)大數(shù)據(jù)分析》課程建設(shè),探索一種面向醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)素養(yǎng)通識(shí)教育教學(xué)實(shí)踐,為開(kāi)展面向?qū)iT領(lǐng)域的數(shù)據(jù)素養(yǎng)教育研究提供參考。
表1 國(guó)內(nèi)外數(shù)據(jù)素養(yǎng)課程及項(xiàng)目簡(jiǎn)介
文章基于2016—2020 學(xué)年《醫(yī)學(xué)大數(shù)據(jù)分析》課程的建設(shè)和教學(xué)實(shí)踐情況,從教學(xué)目標(biāo)、教學(xué)內(nèi)容以及教學(xué)效果三個(gè)維度進(jìn)行介紹,并在此基礎(chǔ)上總結(jié)其經(jīng)驗(yàn)和策略。
為了設(shè)定課程的教學(xué)目標(biāo),我們分析了國(guó)內(nèi)外數(shù)據(jù)素養(yǎng)類課程,使用“問(wèn)卷星”平臺(tái)以問(wèn)卷調(diào)查的形式對(duì)所有選修該課程的醫(yī)學(xué)生進(jìn)行課前數(shù)據(jù)素養(yǎng)能力摸底,在此基礎(chǔ)上,對(duì)標(biāo)“新時(shí)代”醫(yī)學(xué)教學(xué)改革要求,以培養(yǎng)醫(yī)學(xué)生的數(shù)據(jù)素養(yǎng)為目標(biāo),采用數(shù)據(jù)分析方法和醫(yī)學(xué)應(yīng)用實(shí)踐相結(jié)合的方式講解醫(yī)學(xué)大數(shù)據(jù)分析課程。
根據(jù)課程教學(xué)目標(biāo)和學(xué)生的實(shí)際情況,制定了為期12周36 個(gè)學(xué)時(shí)的教學(xué)計(jì)劃,主要教學(xué)內(nèi)容包含以下四個(gè)方面:
3.2.1 醫(yī)學(xué)大數(shù)據(jù)概述
醫(yī)學(xué)大數(shù)據(jù)是大數(shù)據(jù)在醫(yī)學(xué)領(lǐng)域的一個(gè)分支,泛指所有與生命健康和醫(yī)療相關(guān)的數(shù)字化數(shù)據(jù)。本部分既要介紹醫(yī)學(xué)數(shù)據(jù)的來(lái)源和特征,也要涵蓋與醫(yī)學(xué)大數(shù)據(jù)特征緊密聯(lián)系的數(shù)據(jù)主體(包括個(gè)人和群體)的相關(guān)權(quán)益等內(nèi)容。例如,數(shù)據(jù)的收集是否基于個(gè)人自愿?數(shù)據(jù)主體是否知曉并允許這些數(shù)據(jù)基于特定的目的被收集和使用?他們是否同意將數(shù)據(jù)保存起來(lái)進(jìn)行二次利用?基于哪些目的可以使用醫(yī)學(xué)數(shù)據(jù)?如何才能合法合規(guī)地利用醫(yī)學(xué)數(shù)據(jù)等。這些都是醫(yī)學(xué)數(shù)據(jù)收集、使用過(guò)程中必須要面對(duì)的倫理問(wèn)題,也是大數(shù)據(jù)課程的重要內(nèi)容。
3.2.2 醫(yī)學(xué)大數(shù)據(jù)的獲取
獲取醫(yī)學(xué)大數(shù)據(jù)的渠道很多,面對(duì)來(lái)源不同的醫(yī)學(xué)數(shù)據(jù),將根據(jù)數(shù)據(jù)的種類及特征講授獲取方法。例如,對(duì)于醫(yī)院及社區(qū)等醫(yī)療衛(wèi)生部門的電子病歷、健康檔案等傳統(tǒng)的醫(yī)學(xué)數(shù)據(jù)來(lái)源采用信息系統(tǒng)提供的導(dǎo)出功能、API 接口等方式;對(duì)于互聯(lián)網(wǎng)等平臺(tái)的數(shù)據(jù),采用網(wǎng)絡(luò)爬蟲(chóng)、API 接口等方式進(jìn)行醫(yī)學(xué)大數(shù)據(jù)的獲取。
3.2.3 醫(yī)學(xué)大數(shù)據(jù)預(yù)處理
醫(yī)學(xué)大數(shù)據(jù)最大的優(yōu)點(diǎn)是可靠性高,因此非常適合進(jìn)行數(shù)據(jù)分析。但其也存在一些缺陷,如:數(shù)據(jù)結(jié)構(gòu)復(fù)雜、維度高、含有噪聲、非規(guī)范數(shù)據(jù)多、時(shí)效性強(qiáng)等。因此針對(duì)醫(yī)學(xué)數(shù)據(jù)的特點(diǎn)及數(shù)據(jù)分析的目標(biāo),需要講授如何選擇數(shù)據(jù)預(yù)處理的方法,從而提高數(shù)據(jù)分析的質(zhì)量和效率。
3.2.4 醫(yī)學(xué)大數(shù)據(jù)分析、評(píng)估和應(yīng)用
該部分是課程的核心內(nèi)容,課程設(shè)置為24 學(xué)時(shí),講授內(nèi)容包括:描述性分析方法,講授代表性算法關(guān)聯(lián)規(guī)則、聚類;診斷性分析方法,講授典型算法回歸分析和分類算法;預(yù)測(cè)性分析方法,主要講授神經(jīng)網(wǎng)絡(luò)和馬爾科夫預(yù)測(cè)算法。
通過(guò)課程評(píng)估可以了解教學(xué)效果,判斷使用的教學(xué)方式是否有效,學(xué)生的收獲是否達(dá)到預(yù)期,學(xué)生數(shù)據(jù)素養(yǎng)能力是否提高等。表2 是2016—2020 年學(xué)生對(duì)醫(yī)學(xué)大數(shù)據(jù)分析課程的評(píng)教結(jié)果,該表可以較為真實(shí)地反映學(xué)生對(duì)該課程的學(xué)習(xí)感受,總體來(lái)說(shuō)獲得了較為積極的反饋。
表2 學(xué)生對(duì)課程的教學(xué)情況反饋
由表2 可以看出,五年總的評(píng)教平均分為95.8 分,高于全校所有課程年平均評(píng)估分?jǐn)?shù)89 分,這反映了學(xué)生對(duì)該課程的認(rèn)可。表格中16 項(xiàng)評(píng)價(jià)指標(biāo),可全面衡量該課程的教學(xué)質(zhì)量。課程在第1、8、12、13、16 條指標(biāo)中得到較高的分?jǐn)?shù),而第3、6、10 條指標(biāo)得分較低。即學(xué)生認(rèn)為該課程教學(xué)目標(biāo)清晰,內(nèi)容設(shè)計(jì)合理,采用的教學(xué)方法能有效調(diào)動(dòng)學(xué)習(xí)的積極性,使他們收獲很大。同時(shí)該課程也存在一些缺陷,例如:雖然該課程講授了醫(yī)學(xué)領(lǐng)域的相關(guān)案例,但沒(méi)有面面俱到地講授學(xué)生感興趣的所有方向;同時(shí),較少設(shè)計(jì)課堂討論環(huán)節(jié),主要是以老師講授為主。今后可以在課堂上針對(duì)學(xué)生感興趣的話題展開(kāi)深入的討論,激發(fā)學(xué)生的學(xué)習(xí)熱情。
北京大學(xué)醫(yī)學(xué)部的《醫(yī)學(xué)大數(shù)據(jù)分析》課程于2016 年3 月首次面向全校研究生開(kāi)設(shè),為保證教學(xué)效果,課程限定選課人數(shù)為30 人,近五年來(lái)選課學(xué)生總計(jì)133 人,其所屬院系及專業(yè)分布如圖1 和圖2 所示。其中附屬醫(yī)院(44%)、公共衛(wèi)生學(xué)院(32%)、基礎(chǔ)學(xué)院(17%)三個(gè)院系的選課人數(shù)占比最多。在選課學(xué)生的專業(yè)人數(shù)分布中,公共衛(wèi)生(14人)、內(nèi)科學(xué)(14 人)、系統(tǒng)生物醫(yī)學(xué)(13 人)、流行病與衛(wèi)生統(tǒng)計(jì)學(xué)(12 人)專業(yè)選課人數(shù)占比較高。選課學(xué)生覆蓋了醫(yī)學(xué)部的所有學(xué)院、附屬醫(yī)院的各個(gè)專業(yè),這在一定程度上體現(xiàn)了學(xué)生對(duì)于數(shù)據(jù)素養(yǎng)類課程的普遍需求,也體現(xiàn)了課程的通識(shí)特點(diǎn)。
圖1 選課學(xué)生的院系分布
圖2 選課學(xué)生的專業(yè)分布
由于疾病及其并發(fā)疾病的多樣性,治療和效果的異質(zhì)性,不同類型的患者具有不同特征等特點(diǎn),因此用于分析、評(píng)估和解釋醫(yī)療數(shù)據(jù)的研究設(shè)計(jì)和分析方法也較為復(fù)雜。課程根據(jù)醫(yī)學(xué)大數(shù)據(jù)鮮明的領(lǐng)域特征,分層次設(shè)計(jì)教學(xué)內(nèi)容,課程框架如圖3 所示。
圖3 課程教學(xué)內(nèi)容框架
課程分析方法主要有四種類型:①描述性分析是醫(yī)療領(lǐng)域中最普遍的一類數(shù)據(jù)分析方法,它可以回答“發(fā)生了什么”這一問(wèn)題。它是通過(guò)調(diào)查數(shù)據(jù)并分析過(guò)去發(fā)生的事件,了解過(guò)去的行為如何影響未來(lái)的結(jié)果,從而獲取有助于未來(lái)發(fā)展的知識(shí)。②診斷性分析方法是回答“為什么會(huì)發(fā)生”這一問(wèn)題。若使用描述性分析了解了已經(jīng)發(fā)生的事件,并且想知道造成該事件發(fā)生的根本原因,診斷性分析可以深入數(shù)據(jù)內(nèi)部找到答案。在診斷性分析中,要深入理解相關(guān)領(lǐng)域的知識(shí)和影響因素。典型的應(yīng)用有使用多個(gè)因素對(duì)患者進(jìn)行不同類型的劃分,衡量住院風(fēng)險(xiǎn)。③預(yù)測(cè)性分析方法可以回答“什么可能會(huì)發(fā)生”這一問(wèn)題。預(yù)測(cè)性分析方法使用數(shù)據(jù)來(lái)確定事件未來(lái)可能的結(jié)果或發(fā)生的可能性。④指導(dǎo)性分析方法可以回答“該做些什么”這一問(wèn)題。它是基于已有數(shù)據(jù)綜合分析已發(fā)生的事件,發(fā)生的原因以及預(yù)測(cè)的各種情況,提出一種或幾種方案,并說(shuō)明每種方案可能的結(jié)果。
這四種類型的分析方法是醫(yī)學(xué)領(lǐng)域廣泛使用的數(shù)據(jù)分析方法,它們之間相輔相成,并在某些情況下相互疊加,即必須先使用簡(jiǎn)單基礎(chǔ)的分析才能使用更復(fù)雜的分析,因此課程內(nèi)容也遵循其規(guī)律由簡(jiǎn)到繁設(shè)置。
基于《醫(yī)學(xué)大數(shù)據(jù)分析》課程的教學(xué)實(shí)踐,筆者總結(jié)出如下幾個(gè)方面的建設(shè)經(jīng)驗(yàn)及策略。
在對(duì)數(shù)據(jù)素養(yǎng)教學(xué)內(nèi)容進(jìn)行設(shè)計(jì)的時(shí)候,需要有明確的教學(xué)目標(biāo)。一方面教學(xué)目標(biāo)的設(shè)定要和學(xué)科領(lǐng)域的需求緊密結(jié)合,如《醫(yī)學(xué)大數(shù)據(jù)分析》教學(xué)目標(biāo)的設(shè)定首先以面向醫(yī)學(xué)領(lǐng)域研究問(wèn)題需求的數(shù)據(jù)分析方法為主線。另一方面,教學(xué)目標(biāo)的設(shè)定和教學(xué)對(duì)象也有緊密的聯(lián)系,本研究中的課程設(shè)置是針對(duì)研究生的,因此我們使用問(wèn)卷調(diào)查的形式對(duì)研究生數(shù)據(jù)素養(yǎng)情況進(jìn)行摸底,共進(jìn)行了3 次問(wèn)卷,每次的合格問(wèn)卷數(shù)為48、51、30,設(shè)計(jì)多個(gè)數(shù)據(jù)素養(yǎng)類問(wèn)題,針對(duì)每個(gè)問(wèn)題,提供掌握、熟悉、了解、聽(tīng)說(shuō)過(guò)、沒(méi)有聽(tīng)說(shuō)過(guò)5 個(gè)選項(xiàng)。利用SPSS 對(duì)有效問(wèn)卷進(jìn)行了信效度評(píng)估,結(jié)果表明,3 次問(wèn)卷的平均克朗巴哈系數(shù)(Cronbach's alpha)為0.867,平均KMO 值為0.785,并且Bartlett 樣本球形檢驗(yàn)(P<0.005)達(dá)標(biāo),表明問(wèn)卷結(jié)果可靠。結(jié)果發(fā)現(xiàn),雖然絕大部分醫(yī)學(xué)生都接觸過(guò)數(shù)據(jù),也有利用數(shù)據(jù)的經(jīng)歷,但學(xué)生普遍缺乏實(shí)際數(shù)據(jù)處理及分析的能力。因此本課程在上述調(diào)研結(jié)果的基礎(chǔ)上,以大數(shù)據(jù)研究的生命周期為主線,重點(diǎn)培養(yǎng)醫(yī)學(xué)研究生的數(shù)據(jù)搜集、處理和分析能力,基于這些前提設(shè)定教學(xué)目標(biāo),學(xué)生在學(xué)習(xí)了課程知識(shí)以后可以提高數(shù)據(jù)素養(yǎng)水平,為開(kāi)展科研工作奠定堅(jiān)實(shí)的基礎(chǔ)。
面向領(lǐng)域的課程設(shè)置以大數(shù)據(jù)的理論方法與領(lǐng)域應(yīng)用相結(jié)合,使學(xué)生在掌握數(shù)據(jù)分析理論的基礎(chǔ)上,獲得實(shí)際的操作能力。例如:本課程內(nèi)容設(shè)置將醫(yī)學(xué)案例貫穿于理論講解,如表3 所示。對(duì)于描述性分析方法的講解,采用關(guān)聯(lián)規(guī)則算法識(shí)別基因作為藥物反應(yīng)的候選驅(qū)動(dòng)因素,分析抗癌藥物的臨床反應(yīng)。對(duì)于診斷性分析方法的講解,利用回歸方法分析65 歲以上急診患者摔倒和多種危險(xiǎn)因素(平衡、步態(tài)、肌肉骨骼系統(tǒng)、視力、心血管狀況、神經(jīng)功能)之間的關(guān)系,篩查并識(shí)別住院時(shí)有跌倒危險(xiǎn)的患者。對(duì)于預(yù)測(cè)性分析方法的講解,采用神經(jīng)網(wǎng)絡(luò)和馬爾科夫預(yù)測(cè)等算法分析年齡、BMI、膽固醇、疾病史、治療史等可變數(shù)據(jù),預(yù)測(cè)其是否易患心臟病。對(duì)于指導(dǎo)性分析方法的講解,采用乳腺癌患者的數(shù)據(jù)進(jìn)行分析,開(kāi)展不同算法的比較與評(píng)估,判斷病情是否復(fù)發(fā),以確定最佳的解決方案,用于臨床決策支持。從課程評(píng)估的結(jié)果可以看出,有針對(duì)性地將大數(shù)據(jù)理論知識(shí)與實(shí)際應(yīng)用領(lǐng)域相結(jié)合,有利于學(xué)生更加透徹地理解知識(shí)。
表3 《醫(yī)學(xué)大數(shù)據(jù)分析》課程內(nèi)容
由于大數(shù)據(jù)科學(xué)是一門快速發(fā)展的學(xué)科,相關(guān)的方法及技術(shù)層出不窮,教學(xué)過(guò)程不僅要教授學(xué)生數(shù)據(jù)分析的知識(shí),還要發(fā)掘?qū)W生的學(xué)習(xí)潛能,使學(xué)生具有自主學(xué)習(xí)能力及動(dòng)力。為了激發(fā)學(xué)生對(duì)數(shù)據(jù)科學(xué)課程的興趣,可以使用研究性學(xué)習(xí)和探索性學(xué)習(xí)的方法綜合培養(yǎng)學(xué)生的學(xué)習(xí)能力。研究性學(xué)習(xí)主要是通過(guò)讓學(xué)生自主選擇領(lǐng)域數(shù)據(jù)分析的相關(guān)文獻(xiàn),進(jìn)行文獻(xiàn)綜述報(bào)告,鍛煉學(xué)生通過(guò)最新文獻(xiàn)閱讀進(jìn)行自主學(xué)習(xí),進(jìn)而培養(yǎng)學(xué)生發(fā)現(xiàn)問(wèn)題和解決問(wèn)題的能力。探索性學(xué)習(xí)是學(xué)生根據(jù)自己的專業(yè)或者感興趣的方向,收集醫(yī)學(xué)相關(guān)數(shù)據(jù)并對(duì)該數(shù)據(jù)進(jìn)行分析,最終進(jìn)行分析結(jié)果的匯報(bào),從而將理論知識(shí)與實(shí)踐聯(lián)系起來(lái),深刻體會(huì)數(shù)據(jù)分析的整個(gè)流程,培養(yǎng)學(xué)生的動(dòng)手實(shí)踐能力。
我們從2020 年學(xué)生提交的作業(yè)中分別提取了10 份研究性學(xué)習(xí)匯報(bào)作業(yè)和10 份探索性學(xué)習(xí)項(xiàng)目展示作業(yè)來(lái)了解學(xué)生的學(xué)習(xí)成果,具體研究題目及報(bào)告內(nèi)容如表4 和表5 所示。
表4 10 份研究性學(xué)習(xí)匯報(bào)作業(yè)
研究性學(xué)習(xí)匯報(bào)注重理論與實(shí)踐相結(jié)合,培養(yǎng)學(xué)生用課程學(xué)習(xí)知識(shí)解決領(lǐng)域研究問(wèn)題的能力。從表4 中可以看出,這些報(bào)告內(nèi)容和題目大部分是圍繞對(duì)患者數(shù)據(jù)的分析。學(xué)生通過(guò)該研究性學(xué)習(xí)過(guò)程,學(xué)習(xí)了如何針對(duì)本領(lǐng)域的研究問(wèn)題,采用相應(yīng)的大數(shù)據(jù)分析方法解決問(wèn)題,大大拓展了知識(shí)掌握的深度和廣度。
探索性學(xué)習(xí)項(xiàng)目培養(yǎng)學(xué)生利用所學(xué)知識(shí)完成自主選擇的研究項(xiàng)目,可以反映學(xué)生數(shù)據(jù)分析技能的掌握情況。表5中顯示了探索性學(xué)習(xí)項(xiàng)目展示作業(yè)的研究對(duì)象、研究目的、研究方法。從該表中可以看出,學(xué)生收集了不同來(lái)源的醫(yī)學(xué)數(shù)據(jù),包括公開(kāi)數(shù)據(jù)庫(kù)、北京大學(xué)公共數(shù)據(jù)庫(kù)、個(gè)人調(diào)查數(shù)據(jù)等。學(xué)生根據(jù)自主設(shè)定的研究目標(biāo),使用課程講授的大數(shù)據(jù)算法實(shí)現(xiàn)數(shù)據(jù)分析。該作業(yè)體現(xiàn)了學(xué)生數(shù)據(jù)分析的實(shí)踐能力,促進(jìn)學(xué)生進(jìn)行深度思考,完成提出問(wèn)題、分析問(wèn)題、解決問(wèn)題的整個(gè)流程,有利于提升其數(shù)據(jù)素養(yǎng)的綜合實(shí)力。
表5 10 份探索性學(xué)習(xí)項(xiàng)目展示
數(shù)據(jù)素養(yǎng)能力由特定的知識(shí)和技能組成,對(duì)醫(yī)學(xué)領(lǐng)域而言,這些知識(shí)和技能包括對(duì)醫(yī)學(xué)大數(shù)據(jù)的認(rèn)識(shí)和倫理問(wèn)題、根據(jù)大數(shù)據(jù)來(lái)源和類型獲取數(shù)據(jù)、數(shù)據(jù)預(yù)處理、基于不同的目的選擇不同的數(shù)據(jù)分析方法、評(píng)估數(shù)據(jù)分析算法的效果,并將結(jié)果應(yīng)用于醫(yī)學(xué)決策。面向?qū)iT領(lǐng)域的數(shù)據(jù)素養(yǎng)教育的核心是培養(yǎng)該領(lǐng)域數(shù)據(jù)素養(yǎng)能力突出的人才。醫(yī)學(xué)領(lǐng)域數(shù)據(jù)素養(yǎng)通識(shí)課程的教學(xué)實(shí)踐表明,數(shù)據(jù)認(rèn)知、數(shù)據(jù)獲取以及數(shù)據(jù)分析能力是被普遍重視的,這些能力也是在具體研究與學(xué)習(xí)中最容易接觸和經(jīng)常使用到的。
由于數(shù)據(jù)素養(yǎng)教育具有學(xué)科化、應(yīng)用情景化的特征,因而數(shù)據(jù)素養(yǎng)教育需要與具體學(xué)科深入交叉融合,在教育實(shí)踐環(huán)節(jié)也要結(jié)合領(lǐng)域問(wèn)題需求,體現(xiàn)領(lǐng)域差異。如本研究在面向醫(yī)學(xué)領(lǐng)域開(kāi)展數(shù)據(jù)素養(yǎng)課程建設(shè)時(shí),根據(jù)醫(yī)學(xué)領(lǐng)域不同類型的問(wèn)題,將課程內(nèi)容中涉及的數(shù)據(jù)分析方法劃分為描述性分析、診斷性分析、預(yù)測(cè)性分析和指導(dǎo)性分析四種,并基于這四類問(wèn)題設(shè)計(jì)教學(xué)內(nèi)容。在教育實(shí)踐環(huán)節(jié)通過(guò)研究性學(xué)習(xí)和探索性學(xué)習(xí)實(shí)踐,讓學(xué)生發(fā)現(xiàn)醫(yī)學(xué)領(lǐng)域大數(shù)據(jù)需要解決的問(wèn)題,學(xué)會(huì)基于問(wèn)題收集數(shù)據(jù),并利用所學(xué)知識(shí)解決問(wèn)題。
不同領(lǐng)域的數(shù)據(jù)有著不同的特征和應(yīng)用,例如:醫(yī)療行業(yè)利用大數(shù)據(jù)可以更好地理解和預(yù)測(cè)疾病,跟蹤流行病的傳播;銀行證券行業(yè)依賴大數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)分析;交通領(lǐng)域使用大數(shù)據(jù)進(jìn)行交通管制、出行路線規(guī)劃、智能交通管理等。正是由于各個(gè)領(lǐng)域處理的大數(shù)據(jù)問(wèn)題不同,相應(yīng)的解決方案也有所區(qū)別,因此數(shù)據(jù)素養(yǎng)教育具有領(lǐng)域多樣性的特點(diǎn),開(kāi)展面向不同專門領(lǐng)域的數(shù)據(jù)素養(yǎng)教育實(shí)踐顯得越發(fā)重要?;诓煌I(lǐng)域需求,開(kāi)展面向不同教育對(duì)象、教育內(nèi)容、教育方式的教學(xué)實(shí)踐可以推動(dòng)面向不同專門領(lǐng)域的個(gè)性化數(shù)據(jù)素養(yǎng)教育的有序開(kāi)展。
由于數(shù)據(jù)素養(yǎng)教育具有領(lǐng)域差異性的特點(diǎn),因此開(kāi)展面向不同領(lǐng)域的數(shù)據(jù)素養(yǎng)教育探索非常必要。本研究面向醫(yī)學(xué)領(lǐng)域開(kāi)展數(shù)據(jù)素養(yǎng)教學(xué)研究和實(shí)踐,從教學(xué)目標(biāo)、教學(xué)內(nèi)容以及教學(xué)效果幾個(gè)方面論述教育實(shí)踐開(kāi)展情況,并總結(jié)經(jīng)驗(yàn)和策略,得出具體的思考和啟示,以期能夠豐富數(shù)據(jù)素養(yǎng)教育體系,為相關(guān)研究提供借鑒。
(來(lái)稿時(shí)間:2022 年 4 月)