張 靖,何靖怡,肖 鵬
隨著e-Science 和開放數(shù)據(jù)計劃(Open Data Initiatives)的發(fā)展,以“數(shù)據(jù)”為中心的教育日益迫切,數(shù)據(jù)素養(yǎng)教育(Data Literacy Education)應(yīng)運而生,其目的在于培養(yǎng)兩類人才:一是具備科研數(shù)據(jù)管理專業(yè)技能的數(shù)據(jù)專家,二是具備基本數(shù)據(jù)知識的科學(xué)工作者。從目前的實踐和研究來看,關(guān)于數(shù)據(jù)素養(yǎng)教育的思路和內(nèi)容眾說紛紜,既有關(guān)注科研訓(xùn)練的,也有以數(shù)據(jù)管理為主軸的,還有人認(rèn)為要考慮到公共事務(wù)和決策所需的數(shù)據(jù)分析訴求。然而,不管是何種思路何種內(nèi)容的數(shù)據(jù)素養(yǎng)教育,其中心都應(yīng)有一個數(shù)據(jù)素養(yǎng)能力模型。這些模型一般由一系列的指標(biāo)體系組成(因此又稱“數(shù)據(jù)素養(yǎng)能力指標(biāo)體系”),體現(xiàn)了相關(guān)教育項目的設(shè)計和實施者對數(shù)據(jù)素養(yǎng)教育系列問題的觀點:如何理解數(shù)據(jù)、數(shù)據(jù)素養(yǎng)與數(shù)據(jù)素養(yǎng)教育?受眾是誰?目標(biāo)是什么?如何建構(gòu)相應(yīng)的教育體系?教學(xué)計劃設(shè)計和效果評估的焦點是什么?應(yīng)當(dāng)如何展開?基于此,本文對國內(nèi)外數(shù)據(jù)素養(yǎng)能力模型進行梳理、比較和分析,結(jié)合教育實踐項目,探討數(shù)據(jù)素養(yǎng)教育系列問題。
通過數(shù)據(jù)庫(EBSCOHost;CNKI)、專業(yè)組織(ACRL;IASSIST①;ICPSR②)及研究社區(qū)(Data Information Literacy Symposium;e-Science Community Blog)等收集資料,以數(shù)據(jù)素養(yǎng)教育實踐項目為中心、輔以相關(guān)文獻,筆者梳理出14 個數(shù)據(jù)素養(yǎng)能力模型。參考相關(guān)文獻[1],建構(gòu)數(shù)據(jù)素養(yǎng)能力模型分析框架,見表1。
表1 數(shù)據(jù)素養(yǎng)能力模型分析框架及說明
綜合分析各模型的特點,以是否嚴(yán)格界定能力為標(biāo)準(zhǔn),這些模型可劃分為兩類:(1)能力導(dǎo)向模型,是嚴(yán)格意義上的數(shù)據(jù)素養(yǎng)能力模型,該類模型以“數(shù)據(jù)”為核心明確了數(shù)據(jù)素養(yǎng)能力指標(biāo),甚至建立了多級能力指標(biāo)體系;(2)目標(biāo)導(dǎo)向模型,是廣義上的數(shù)據(jù)素養(yǎng)能力模型,主要由筆者從具體教育實踐的教學(xué)目標(biāo)和教學(xué)模塊中提煉總結(jié)而出。與能力導(dǎo)向模型相比,目標(biāo)導(dǎo)向模型的特征是它通常結(jié)合實際教學(xué)需要而設(shè)定,不一定從整個數(shù)據(jù)生命周期進行考慮。這兩種模式代表了開展數(shù)據(jù)素養(yǎng)教育的兩種思路,即將數(shù)據(jù)素養(yǎng)視作相對獨立且整體實施的專門的教育項目,或是將數(shù)據(jù)素養(yǎng)視作其他能力的組成而在相關(guān)的教育項目中設(shè)置數(shù)據(jù)素養(yǎng)教育模塊。筆者按照表1的數(shù)據(jù)素養(yǎng)能力模型分析框架,對14 個數(shù)據(jù)素養(yǎng)能力模型進行分類梳理③。本部分主要呈現(xiàn)各模型的提出背景、指標(biāo)層級及基本內(nèi)容。關(guān)于適用情境、建構(gòu)方式、對應(yīng)的數(shù)據(jù)生命周期等的討論放在第三部分。
圍繞數(shù)據(jù)生命周期進行設(shè)計是能力導(dǎo)向模型的基本特征。一般而言,該類模型中的數(shù)據(jù)素養(yǎng)能力指標(biāo)較易被識別,常常直接以多級指標(biāo)的形式呈現(xiàn)。筆者梳理了8 個這類模型。其中,5 個模型已有與之對應(yīng)的數(shù)據(jù)素養(yǎng)教育實踐項目:美國地球數(shù)據(jù)觀測網(wǎng)絡(luò)(Data ONE)模型、英國愛丁堡大學(xué)MANTRA 模型、美國雪城大學(xué)Qin&D’Ignazio 模型、美國普渡大學(xué)Carlson 模型、美國新英格蘭協(xié)作數(shù)據(jù)管理課程(NECDMC)模型;另外3 個模型為純理論性質(zhì)的數(shù)據(jù)素養(yǎng)能力模型:西班牙學(xué)者Prado &Marzal 模型、瑞典學(xué)者Schneider 模型以及澳大利亞統(tǒng)計局(ABS)模型。
(1)Data ONE 模型(2009)[2]。地球數(shù)據(jù)觀測網(wǎng)絡(luò)(Data Observation Network for Earth,Data ONE)是一個環(huán)境科學(xué)領(lǐng)域面向科研需求的網(wǎng)絡(luò)平臺,是眾多個人和科研機構(gòu)合作的成果。2009年該平臺在美國國家科學(xué)基金會(National Science Foundation,NSF)的資助下建立,用戶可以通過這一平臺持續(xù)而安全地獲取地球觀測數(shù)據(jù)。為了幫助科研人員在研究過程中,尤其是在研究起始階段,做好數(shù)據(jù)管理計劃,并有效地建立、組織、管理、描述、保存和共享數(shù)據(jù),并使得數(shù)據(jù)能夠為其他科研人員重用,Data ONE 制作了《數(shù)據(jù)管理初級讀本:你一直想知道的》 (Primer on Data Management:What You Always Wanted to Know),并在官網(wǎng)上提供以數(shù)據(jù)生命周期為線索的教學(xué)課程,以及數(shù)據(jù)管理的最佳實踐、相關(guān)軟件工具等學(xué)習(xí)材料。該模型從Data ONE 教學(xué)課程中梳理得出,由模塊和學(xué)習(xí)效果兩級指標(biāo)組成。
(2)MANTRA 模型(2010)[3]。英國愛丁堡大學(xué)(University of Edinburgh)根據(jù)該校地球科學(xué)、社會與政治學(xué)和臨床心理學(xué)研究生的培訓(xùn)需求,與英國學(xué)術(shù)發(fā)展研究所(Institute for Academic Development)合作,2010-2011年開發(fā)了面向英國研究生、初級職業(yè)研究員、信息專業(yè)人員的在線數(shù)據(jù)管理課程(Research Data Management Training,MANTRA)④,現(xiàn)由愛丁堡大學(xué)數(shù)據(jù)圖書館進行維護[4]。MANTRA 通過一系列在線課程,講授科研數(shù)據(jù)管理的專業(yè)術(shù)語、核心概念和最佳實踐。MANTRA 模型由知識模塊和學(xué)習(xí)內(nèi)容兩級指標(biāo)組成。
(3)Qin&D’Ignazio 模型(2010)[5]。美國雪城大學(xué)(Syracuse University)的Jian Qin 和John D’Ignazio 面向STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))領(lǐng)域本科生開設(shè)“科學(xué)數(shù)據(jù)管理”課程,以培訓(xùn)他們在e-Science 環(huán)境下所需的數(shù)據(jù)素養(yǎng)。課程以“數(shù)據(jù)”為中心展開,列舉了數(shù)據(jù)素養(yǎng)的5 個主要技能,即基于科學(xué)需求的數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)管理、數(shù)據(jù)評估和數(shù)據(jù)使用能力。
(4)Carlson 模型(2011)[6]。一方面,技術(shù)導(dǎo)向型研究的復(fù)雜性及其規(guī)模挑戰(zhàn)著學(xué)術(shù)交流、圖書館服務(wù)和圖書館員的許多傳統(tǒng)角色,另一方面,NSF 要求所有申請項目必須提交數(shù)據(jù)管理計劃,這些都給大學(xué)圖書館提出了新的命題,需要其在大學(xué)的科研過程中尋找并扮演新的角色。美國普渡大學(xué)(Purdue University)圖書館的Jacob Carlson 等認(rèn)為,大學(xué)圖書館應(yīng)該為大學(xué)科研人員提供數(shù)據(jù)素養(yǎng)培訓(xùn),他們建構(gòu)了這一數(shù)據(jù)素養(yǎng)模型,并將之運用于數(shù)據(jù)信息素養(yǎng)(Data Information Literacy,DIL)項目⑤。該模型由能力和學(xué)習(xí)要求兩級指標(biāo)組成。
(5)NECDMC 模型(2013)[7]。由美國新英格蘭地區(qū)多個大學(xué)圖書館的數(shù)據(jù)管理教育模塊匯聚而成的新英格蘭協(xié)作數(shù)據(jù)管理課程(New England Collaborative Data Management Curriculum,NECDMC)是一個面向健康科學(xué)、自然科學(xué)與工程專業(yè)背景本科生和研究生的數(shù)據(jù)管理教育項目⑥。該課程基于伍斯特理工學(xué)院(Worcester Polytechnic Institute)圖書館(包括Lamar Soutter Library 和George C.Gordon Library)的數(shù)據(jù)管理課程框架,現(xiàn)有7 個教學(xué)模塊,各模塊下設(shè)具體的學(xué)習(xí)目標(biāo),形成二級指標(biāo)體系。各教學(xué)模塊由不同的機構(gòu)負責(zé):塔夫斯大學(xué)圖書館(Tisch Library at Tufts University)負責(zé)模塊1、2、3,海洋生物實驗室和伍茲霍爾海洋研究所(Marine Biological Laboratory and Woods Hole Oceano graphic Institute)負責(zé)模塊3、6,馬薩諸塞大學(xué)阿默斯特分校(University of Massachusetts at Amherst)負責(zé)模塊4、6,馬薩諸塞大學(xué)醫(yī)學(xué)院(University of Massachusetts Medical School)負責(zé)模塊5、6,伍斯特理工學(xué)院(Worcester Polytechnic Institute)負責(zé)模塊5,康涅狄格大學(xué)(University of Connecticut)和康特韋醫(yī)學(xué)圖書館(Countway Library of Medicine)負責(zé)模塊7。
(6)Prado & Marzal 模型(2013)[8]。Javier Calzada Prado 和來自西班牙馬德里卡洛斯三世大學(xué)圖書與情報學(xué)系,他們認(rèn)為數(shù)據(jù)在當(dāng)今社會和科學(xué)領(lǐng)域日益重要,而開放數(shù)據(jù)計劃和e-Science 更是給各種類型的圖書館提出了培養(yǎng)用戶數(shù)據(jù)和信息素養(yǎng)的要求;現(xiàn)有的只針對特定背景、只涉及部分?jǐn)?shù)據(jù)素養(yǎng)的模型不能很好地滿足這一要求。于是在其他模型的基礎(chǔ)之上,參照傳統(tǒng)的信息素養(yǎng)框架,設(shè)計了這一全面適用于公共圖書館、學(xué)術(shù)圖書館和學(xué)校圖書館用戶的數(shù)據(jù)素養(yǎng)模型。該模型分三層逐層細劃數(shù)據(jù)素養(yǎng)能力,并為第三層能力指標(biāo)對應(yīng)了具體的學(xué)習(xí)內(nèi)容。
(7)Schneider 模型(2013)[9]。瑞典學(xué)者René Schneider 認(rèn)為科學(xué)研究中的不同角色對數(shù)據(jù)有著不同深度和廣度的使用需求,因此她試圖設(shè)計一個適用于各類科研工作者的數(shù)據(jù)素養(yǎng)教育課程。在她預(yù)想的課程中,不同的課程開展方式所對應(yīng)的教學(xué)內(nèi)容有所側(cè)重和遞進,針對不同身份的學(xué)習(xí)者也有不同的課程開展方式。參考信息素養(yǎng)的六大技能⑦和英國國家和大學(xué)圖書館協(xié)會(The Society of College,National and University Libraries,SCONUL)的七項指標(biāo)⑧,以及美國國會圖書館的數(shù)字保存推廣與教育項目(Digital Preservation Outreach & Education,DPOE),綜合信息素養(yǎng)標(biāo)準(zhǔn)框架及數(shù)據(jù)管理框架,她提出了由兩級指標(biāo)界定的科研數(shù)據(jù)素養(yǎng)核心能力。
(8)ABS 模型(2015)[10]。澳大利亞統(tǒng)計局(Australian Bureau of Statistics,ABS)認(rèn)為當(dāng)下的勞動力需要具備更強的統(tǒng)計能力,應(yīng)該有一個能夠用于理解不同情境下勞動力所需的統(tǒng)計能力,并以一種共同話語對這些能力作具體描述的框架。ABS 設(shè)計了統(tǒng)計能力框架草案,定義了使用者和生產(chǎn)者面對統(tǒng)計工作時所需的全部能力。該模型由三級指標(biāo)組成,其中第一級屬于統(tǒng)計情境維度,第二級屬于各統(tǒng)計情境相對應(yīng)的統(tǒng)計過程維度,第三級則說明統(tǒng)計過程中所需的具體能力。
目標(biāo)導(dǎo)向模型大多與數(shù)據(jù)素養(yǎng)教育實踐相結(jié)合,該類模型并未嚴(yán)格界定數(shù)據(jù)素養(yǎng)能力,但在教學(xué)模塊及教學(xué)目標(biāo)中反映了教育者對于數(shù)據(jù)素養(yǎng)能力的理解。英國數(shù)據(jù)檔案(UKDA)模型、美國加州大學(xué)洛杉磯分校Stephenson&Caravello 模型、香港大學(xué)科技圖書館(HKUST)模型、加拿大卡爾加里大學(xué)生物學(xué)課程MacMillan 模型、英國劍橋大學(xué)圖書館Data Train 模型以及武漢大學(xué)Si模型等6 個模型屬于這一類型。
(1)UKDA 模型(2004)[11]。該模型根據(jù)英國埃塞克斯大學(xué)(University of Essex)英國數(shù)據(jù)檔案(UK Data Archive,UKDA)項目中的“教學(xué)活動中的調(diào)查數(shù)據(jù)”(Survey Data in Teaching Project,SDiT;該項目受JISC 資助)的學(xué)習(xí)目標(biāo)總結(jié)得出。針對英國高校在講授科學(xué)研究(如實證分析、數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析、數(shù)字計算能力、批判性思維)時很少利用數(shù)據(jù),導(dǎo)致學(xué)生缺乏數(shù)據(jù)素養(yǎng)的問題,SDiT 強調(diào)真實數(shù)據(jù)在教學(xué)活動中的使用,以提高社會科學(xué)學(xué)生的數(shù)據(jù)素養(yǎng)。該模型可以歸納出5 個一級指標(biāo):①能夠?qū)ι鐣茖W(xué)數(shù)據(jù)應(yīng)用于實際生活問題有更好的理解;②加強操作數(shù)值數(shù)據(jù)(課本、報紙、報告和數(shù)據(jù)庫)的能力;③對定量數(shù)據(jù)的特征進行概念化,以使其能夠支持實體的論證;④建立生產(chǎn)和交流數(shù)據(jù)的能力和自信;⑤成為批判性的數(shù)據(jù)消費者。
(2)Stephenson & Caravello 模型(2007)[12]。美國加州大學(xué)洛杉磯分校(University of California,Los Angeles,UCLA)圖書館員Elizabeth Stephenson 和Patti Schifter Caravello 指出,對修讀社會學(xué)的學(xué)生而言,能夠理解數(shù)據(jù)并用圖表呈現(xiàn)數(shù)據(jù)十分重要,因此,有必要對他們進行數(shù)據(jù)素養(yǎng)能力教育。這一模型根據(jù)他們在UCLA 社會學(xué)系面向大三和大四學(xué)生開設(shè)的“社會學(xué)信息素養(yǎng)實驗室”課程總結(jié)而出。主要包括4 個一級指標(biāo):①學(xué)會閱讀和批判性評估簡單的表格;②為數(shù)據(jù)表格制作精確的書目引文;③使用American Factfinder 制作表格,使表格被正確地描述和引用;④閱讀包含以圖示方式呈現(xiàn)數(shù)據(jù)的文章,并討論該表格與文章內(nèi)容的關(guān)系。
(3)HKUST 模型(2010)[13]。信息素養(yǎng)教育是大學(xué)圖書館的傳統(tǒng)職能之一,然而隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展,信息環(huán)境日趨復(fù)雜,信息素養(yǎng)教育需求也發(fā)生變化,概念性理解和批判性思維日益重要。香港大學(xué)科技圖書館(Hong Kong University of Science and Technology Library,HKUST)在該校科學(xué)院、工程學(xué)院、商學(xué)院開設(shè)信息素養(yǎng)通識選修課程,絕大部分選修該課程的學(xué)生在科技方面的學(xué)術(shù)涉獵比在人文社科方面的涉獵要多。該課程以智力發(fā)展階段(Stages of Intellectual Development)和認(rèn)知技能(Cognitive Skills)為理論依據(jù),旨在通過社會經(jīng)濟學(xué)數(shù)據(jù)的使用提高學(xué)生的信息素養(yǎng)。通過學(xué)習(xí),學(xué)生應(yīng)能夠描述什么是社會經(jīng)濟學(xué)數(shù)據(jù),能夠區(qū)分社會經(jīng)濟學(xué)數(shù)據(jù)與科學(xué)數(shù)據(jù),能夠制作獲取多種社會經(jīng)濟數(shù)據(jù)的可行策略以及基于可靠性和權(quán)威性的評估數(shù)據(jù)質(zhì)量。根據(jù)該課程的學(xué)習(xí)目標(biāo)、形式和內(nèi)容,筆者總結(jié)這一模型由9 個一級指標(biāo)組成:①理解社會經(jīng)濟學(xué)數(shù)據(jù)(授課形式為講座);②見識社會經(jīng)濟學(xué)數(shù)據(jù)(活動);③社會經(jīng)濟學(xué)數(shù)據(jù)的特征(講座);④數(shù)據(jù)的定義(活動);⑤收集數(shù)據(jù)與中介機構(gòu)(講座);⑥收集、可靠性與權(quán)威性(活動);⑦評估與使用(活動);⑧定位社會科學(xué)數(shù)據(jù)(講座);⑨學(xué)習(xí)經(jīng)驗的反思(活動)。
(4)MacMillan 模型(2010)[14-15]。加拿大卡爾加里大學(xué)(University of Calgary)在面向生命科學(xué)管理本科生開設(shè)的兩門生物學(xué)課程——“遺傳學(xué)原理”和“生物化學(xué)概論”中引入這一數(shù)據(jù)素養(yǎng)模型,由實驗室負責(zé)人、聯(lián)絡(luò)館員Don MacMillan及1-2 名圖書館館員合作,將數(shù)據(jù)素養(yǎng)教育融入專業(yè)課程教學(xué),起到了很好的效果。“遺傳學(xué)原理”的學(xué)習(xí)要求包括:①在一個特定的基因遺傳疾病主題上使用Pub Med查找同行評審的文章;②定位一個與被認(rèn)為是導(dǎo)致一種天生疾病的基因或突變有關(guān)的專利;③使用OMIM 數(shù)據(jù)庫決定天生遺傳疾病的遺傳模式,以及致病的基因和突變;④使用NCBI 的基因數(shù)據(jù)庫來獲取基因結(jié)構(gòu)上的數(shù)據(jù),包括mRNA 和蛋白質(zhì)長度?!吧锘瘜W(xué)概論”的學(xué)習(xí)要求包括:(a)使用蛋白質(zhì)數(shù)據(jù)銀行以定位該蛋白質(zhì)的三位坐標(biāo);(b)使用ProtParam 以計算該蛋白質(zhì)的等電點;(c)運行一個源序列搜索以識別同源的或相似的蛋白質(zhì),并使用ClustalW 來匹配它們;(d)使用PyMOL 來調(diào)查在蛋白質(zhì)的結(jié)構(gòu)和功能上突變的影響。
(4)Data Train 模型(2011)[16]。在科研成果在線出版和存檔與日俱增的時代,英國劍橋大學(xué)(University of Cambridge)圖書館將考古數(shù)據(jù)的長期保存視為己任。為了培養(yǎng)該??脊艑W(xué)學(xué)生良好的數(shù)字?jǐn)?shù)據(jù)管理計劃,盡早著手畢業(yè)論文的數(shù)字?jǐn)?shù)據(jù)管理,該館申請到了JISC 資助項目“Data Train”。該項目由劍橋大學(xué)圖書館主導(dǎo),來自劍橋大學(xué)考古系的教職員工和約克大學(xué)(University of York)考古數(shù)據(jù)服務(wù)中心(Archaeology Data Service)的專家為項目提供建議。Data Train 為考古學(xué)專業(yè)“核心研究技能培訓(xùn)”的任課教師提供了科研數(shù)據(jù)管理教學(xué)資料。該教學(xué)資料中主要包含四個教學(xué)模塊:創(chuàng)建和管理考古學(xué)科研數(shù)據(jù)、處理數(shù)字?jǐn)?shù)據(jù)、科研項目與專業(yè)數(shù)據(jù)、數(shù)據(jù)的存檔與重用,模塊下設(shè)有具體的學(xué)習(xí)內(nèi)容。這,四個教學(xué)模塊作為該??脊艑W(xué)系2011年的研究生課程“論文與出版物的數(shù)字技巧(Digital Skills for Dissertation and Publication)”中的一部分,于2011年以實驗課程的方式開展。
(5)Si 模型(2013)[17]。司莉等認(rèn)為,圖書情報教育應(yīng)該因應(yīng)e-Science 對科學(xué)數(shù)據(jù)管理人才的需求,培養(yǎng)實踐型科學(xué)數(shù)據(jù)管理專家。他們考查了國際范圍內(nèi)的科學(xué)數(shù)據(jù)專家招聘要求,進而結(jié)合圖書情報教育在科學(xué)數(shù)據(jù)管理人才方面的培養(yǎng)現(xiàn)狀,梳理出基本的教育內(nèi)容:研究方法;數(shù)據(jù)科學(xué),數(shù)據(jù)管理,數(shù)據(jù)服務(wù);數(shù)據(jù)統(tǒng)計與分析;數(shù)據(jù)倉庫;信息研究與技術(shù)。
能力導(dǎo)向模型和目標(biāo)導(dǎo)向模型之間的一個顯著區(qū)別是:前者反映了需要讓學(xué)習(xí)者對整個數(shù)據(jù)生命周期有總體了解的教育思路,后者著重某一或某些與數(shù)據(jù)處理或管理相關(guān)的技能,并將之融入特定的教育體系,亦即:能力導(dǎo)向模型體現(xiàn)了一種更為系統(tǒng)化的數(shù)據(jù)素養(yǎng)教育思路,而目標(biāo)導(dǎo)向模型反映了一種更為專門化的教育思路。下文分析兩種教育思路下所對應(yīng)的教育內(nèi)容、適用情境與建構(gòu)方式、提出背景與應(yīng)用效果的異同。
表2 基于數(shù)據(jù)生命周期環(huán)節(jié)的數(shù)據(jù)素養(yǎng)能力模型分析
為了更加清晰地觀察各模型內(nèi)容所涉及的數(shù)據(jù)生命周期環(huán)節(jié),筆者將前述數(shù)據(jù)素養(yǎng)能力模型的基本內(nèi)容與UKDA 數(shù)據(jù)生命周期[18]的各環(huán)節(jié)進行匹配,見表2。
3.1.1 能力導(dǎo)向模型與系統(tǒng)化數(shù)據(jù)素養(yǎng)教育思路
能力導(dǎo)向模型將“數(shù)據(jù)素養(yǎng)”視作一個獨立的對象,內(nèi)容往往以數(shù)據(jù)生命周期為線索,由淺入深、循序漸進地引導(dǎo)學(xué)生,一方面宏觀了解數(shù)據(jù)生命周期,另一方面分步掌握各環(huán)節(jié)的內(nèi)容。
表2顯示,能力導(dǎo)向各模型對于數(shù)據(jù)生命周期中的數(shù)據(jù)創(chuàng)建(述及8 次)、數(shù)據(jù)處理(7 次)、數(shù)據(jù)保存(7 次)、提供數(shù)據(jù)入口(7 次)等環(huán)節(jié)較為關(guān)注。其中,數(shù)據(jù)創(chuàng)建強調(diào)制定數(shù)據(jù)管理計劃和數(shù)據(jù)收集,數(shù)據(jù)處理強調(diào)數(shù)據(jù)命名、格式轉(zhuǎn)換及標(biāo)準(zhǔn)化,數(shù)據(jù)保存強調(diào)數(shù)據(jù)著錄、元數(shù)據(jù)、備份與安全,提供數(shù)據(jù)入口強調(diào)數(shù)據(jù)共享以及倫理問題。由各模型所關(guān)注的重點來看,系統(tǒng)化的數(shù)據(jù)素養(yǎng)教育的最終目的是使數(shù)據(jù)能夠得到良好的保存和高效的共享,而這兩方面都有賴于數(shù)據(jù)創(chuàng)建和數(shù)據(jù)處理環(huán)節(jié)對數(shù)據(jù)操作的規(guī)范化和標(biāo)準(zhǔn)化。
雖然部分能力導(dǎo)向模型,如Data ONE、MANTRA,并沒有太多涉及數(shù)據(jù)分析、數(shù)據(jù)重用環(huán)節(jié)的內(nèi)容,但筆者認(rèn)為,這并不影響學(xué)習(xí)者對數(shù)據(jù)生命周期的整體認(rèn)知,因為這些模型在數(shù)據(jù)創(chuàng)建環(huán)節(jié)中已著重強調(diào)了制定數(shù)據(jù)管理計劃的重要性。而在制定數(shù)據(jù)管理計劃時,學(xué)習(xí)者需要在腦海中模擬一個完整研究的實施過程,進而制定從數(shù)據(jù)收集到數(shù)據(jù)存儲、共享以及相關(guān)倫理問題的完整解決方案。能力導(dǎo)向各模型對于數(shù)據(jù)生命周期中的數(shù)據(jù)分析(5 次)和數(shù)據(jù)重用(5 次)環(huán)節(jié),較少關(guān)注。對這兩個環(huán)節(jié)的“有意”減弱,有助于將數(shù)據(jù)素養(yǎng)教育與其他教育進行明確區(qū)分。
就數(shù)據(jù)分析能力而言,面向不同專業(yè)不同人群的數(shù)據(jù)分析能力要求不同,較難用統(tǒng)一的能力指標(biāo)界定,如Carlson 模型在描述數(shù)據(jù)分析要求提及的是“熟悉學(xué)科內(nèi)基本的分析工具”,說明數(shù)據(jù)分析需要與學(xué)科背景結(jié)合。其他述及數(shù)據(jù)分析的能力導(dǎo)向模型均有類似的反映:在系統(tǒng)化的數(shù)據(jù)素養(yǎng)教育中,著重培養(yǎng)學(xué)習(xí)者解讀數(shù)據(jù)、評估數(shù)據(jù)等數(shù)據(jù)思維模式,一般不會涉及太多專業(yè)背景,對學(xué)習(xí)者的數(shù)據(jù)分析能力要求不高。
對數(shù)據(jù)重用環(huán)節(jié)較少關(guān)注,對e-Science科研環(huán)境而言是一種不足。在e-Science 環(huán)境下,越來越多的研究建立在對已有數(shù)據(jù)的重用之上。因此,數(shù)據(jù)重用環(huán)節(jié)中的跟蹤研究、實施研究綜述等行為應(yīng)該得到重視,并在數(shù)據(jù)素養(yǎng)能力模型中加以體現(xiàn)。Carlson 模型在這方面可視作典范,其在“數(shù)據(jù)管理與組織”中強調(diào)“跟蹤數(shù)據(jù)子集或已加工的數(shù)據(jù)與原始數(shù)據(jù)集的關(guān)系”,在“數(shù)據(jù)監(jiān)護與再利用”部分提出“認(rèn)識到數(shù)據(jù)在證實研究或供他人使用方面,有可能有超越初衷的價值”的學(xué)習(xí)要求[6]。
總體而言,能力導(dǎo)向模型能較好地覆蓋數(shù)據(jù)生命周期,對應(yīng)的數(shù)據(jù)素養(yǎng)教育實踐多采用在線形式。Carlson 模型是一個特例,其對應(yīng)的數(shù)據(jù)素養(yǎng)教育項目采用了多種課程開展方式,如嵌入到學(xué)生項目中進行指導(dǎo)、研討會、專業(yè)課。
3.1.2 目標(biāo)導(dǎo)向模型與專門化數(shù)據(jù)素養(yǎng)教育思路
目標(biāo)導(dǎo)向模型反映的是將數(shù)據(jù)素養(yǎng)教育融入特定背景教育體系中進行的專門化教育思路。在這種思路下,數(shù)據(jù)素養(yǎng)的培養(yǎng)意味著某一項或某幾項數(shù)據(jù)處理或管理能力的深入學(xué)習(xí)。例如,UKDA 模型關(guān)注數(shù)據(jù)分析和提供數(shù)據(jù)入口環(huán)節(jié)的能力培養(yǎng),Stephenson&Caravello 模型關(guān)注理解數(shù)據(jù)并用圖表呈現(xiàn)數(shù)據(jù)的能力,HKUST模型關(guān)注數(shù)據(jù)收集環(huán)節(jié),MacMillan 模型關(guān)注與生命科學(xué)專業(yè)相關(guān)的數(shù)據(jù)創(chuàng)建和分析,Si 模型則融入了圖書情報領(lǐng)域數(shù)據(jù)管理人才培養(yǎng)的考慮。而Data Train 模型在一定程度上體現(xiàn)了專門化教育思路和前述系統(tǒng)化教育思路的融合。一方面,它專注考古學(xué)背景下的數(shù)據(jù)長期保存,另一方面,在課程中涉及到研究生數(shù)據(jù)管理計劃的知識,因此,學(xué)習(xí)者能夠?qū)?shù)據(jù)生命周期有較系統(tǒng)的認(rèn)知。
目標(biāo)導(dǎo)向模型對應(yīng)的數(shù)據(jù)素養(yǎng)教育實踐主要以線下方式開展。由于教學(xué)時間有限,如一次研討會、一學(xué)期或一學(xué)年,教學(xué)目標(biāo)和內(nèi)容必須有所側(cè)重,因此在能力目標(biāo)設(shè)置上有所取舍。這點在Stephenson &Caravello、HKUST 和MacMillan模型中表現(xiàn)得尤為突出。
建構(gòu)者在提出模型之前,往往需要確定其適用群體,并通過一定的建構(gòu)方式,設(shè)計出貼近目標(biāo)群體的數(shù)據(jù)素養(yǎng)能力模型。因此,建構(gòu)方式的選擇與模型的適用情境密切相關(guān)。各模型的適用情境和建構(gòu)方式如表3所示。
表3顯示,在系統(tǒng)化的教育思路下,能力導(dǎo)向模型適用的學(xué)科領(lǐng)域和教育對象范圍非常廣泛。當(dāng)然,正是因為需要面向大規(guī)模的科研工作者或科研后備人員(本科生和研究生),甚至一般公眾開展數(shù)據(jù)素養(yǎng)教育,才需要選擇這一受專業(yè)限制較少的系統(tǒng)化教育思路。目前面向大范圍群體建構(gòu)的數(shù)據(jù)素養(yǎng)能力模型,大多出現(xiàn)在自然科學(xué)領(lǐng)域,部分模型有更廣泛的適用性,但暫時未見有專門面向人文社科領(lǐng)域建構(gòu)的數(shù)據(jù)素養(yǎng)能力模型。在建構(gòu)能力模型、設(shè)計教育體系時,建構(gòu)者或設(shè)計者需要確定目標(biāo)人群,進而采取相應(yīng)的建構(gòu)和設(shè)計方式。然而,表2和表3顯示,無論是采取案例研究方法還是采取對照傳統(tǒng)信息素養(yǎng)能力標(biāo)準(zhǔn)方法,得出的數(shù)據(jù)素養(yǎng)能力要求并沒有顯著差異。比如,Prado&Marzal 模型通過對照傳統(tǒng)的信息素養(yǎng)能力標(biāo)準(zhǔn),得出面向各類圖書館用戶的數(shù)據(jù)素養(yǎng)能力模型,其中所設(shè)定的能力以及學(xué)習(xí)的內(nèi)容與專門指向高校本科生、研究生或科研工作者的能力模型(如MANTRA、Carlson等模型)并沒有太大差別。在某種程度上,這一情況反映了不同學(xué)歷、不同學(xué)科背景對于數(shù)據(jù)素養(yǎng)能力的要求具有一致性。
表3 各模型的適用情境和建構(gòu)方式分析
與能力導(dǎo)向模型相比,目標(biāo)導(dǎo)向模型更多涉及人文社科領(lǐng)域,如UKDA模型、Stephenson&Caravello 模型、Data Train 模型和Si 模型?;蛘呖梢哉J(rèn)為,與自然科學(xué)領(lǐng)域相比,人文社科領(lǐng)域更偏向于采取專門化的數(shù)據(jù)素養(yǎng)教育思路。這一情況說明人文社科領(lǐng)域的教育者已經(jīng)察覺到提高學(xué)生數(shù)據(jù)素養(yǎng)的重要性。較之自然科學(xué)領(lǐng)域強調(diào)定量研究方法,人文社科研究更常使用訪談法、田野調(diào)查法、觀察法等質(zhì)性研究方法。雖然定量研究方法,如仿真實驗、真實實驗法、社會調(diào)查法,在人文社科研究中日益重要,但教育者可能只察覺到數(shù)據(jù)生命周期某個(些)環(huán)節(jié)相關(guān)技能對其所屬學(xué)科的重要性,并因此建構(gòu)了對應(yīng)需求的目標(biāo)導(dǎo)向數(shù)據(jù)素養(yǎng)能力模型。
表4分析了各模型的提出背景和應(yīng)用效果。模型的提出與付諸實踐需要多方的努力和支持,而模型提出者自身的知識儲備和資源往往影響著模型的應(yīng)用效果。
由表4可知,建構(gòu)模型的主體主要有大學(xué)圖書館(4 個)、大學(xué)圖情院系(3 個)、大學(xué)圖書館與大學(xué)院系(3 個)、大學(xué)院系(2 個)、其他(統(tǒng)計局1個,學(xué)者群體1 個)。從數(shù)量看,大學(xué)圖書館是建構(gòu)數(shù)據(jù)素養(yǎng)能力模型的主要主體。在14 個模型中,3 個能力導(dǎo)向、1 個目標(biāo)導(dǎo)向模型由大學(xué)圖書館建構(gòu)。一方面,部分大學(xué)圖書館關(guān)注到e-Science 對科研環(huán)境所帶來的轉(zhuǎn)變,著手建構(gòu)能夠系統(tǒng)提高科研人員和本碩學(xué)生數(shù)據(jù)素養(yǎng)的模型及課程,如MANTRA 模型、Carlson 模型和NECDMC 模型。學(xué)科館員和數(shù)據(jù)館員在其中起到了關(guān)鍵作用。比如,Carlson 模型對應(yīng)DIL 項目,該項目團隊通常由一位學(xué)科館員和一位數(shù)據(jù)館員組成;學(xué)科館員是圖書館與具體院系之間的橋梁,起到協(xié)調(diào)統(tǒng)籌作用,也承擔(dān)部分教學(xué)任務(wù);數(shù)據(jù)館員具備數(shù)據(jù)管理專門知識,主要負責(zé)項目教育需求分析、教育方案制定以及大部分的教學(xué)任務(wù);兩者均對數(shù)據(jù)信息素養(yǎng)項目的開展起到重要作用。正是由于大學(xué)圖書館同時擁有這兩類專業(yè)人才,方能根據(jù)學(xué)科專業(yè)數(shù)據(jù)處理和管理需求,提供特定的數(shù)據(jù)素養(yǎng)教育項目。另一方面,部分大學(xué)圖書館在其原有信息素養(yǎng)教育的基礎(chǔ)上,加入數(shù)據(jù)處理相關(guān)模塊,以適應(yīng)學(xué)科和科研環(huán)境的變化。例如,Stephenson&Caravello模型,其信息素養(yǎng)線下課程重點關(guān)注數(shù)據(jù)處理與分析模塊,雖然沒有形成完整的數(shù)據(jù)素養(yǎng)教育體系,但能夠基本滿足社會學(xué)本科生的學(xué)習(xí)需求??傮w而言,由大學(xué)圖書館建構(gòu)數(shù)據(jù)素養(yǎng)模型,并由其主導(dǎo)數(shù)據(jù)素養(yǎng)教育,能夠取得不錯的效果。
表4 各模型的背景和應(yīng)用效果
有3個模型由大學(xué)圖書館和大學(xué)院系聯(lián)合建構(gòu),大學(xué)圖書館仍是主導(dǎo)。HKUST模型和MacMillan模型以學(xué)科館員為中介;Data Train 模型由大學(xué)圖書館結(jié)合院系教職員工的模型建構(gòu)意見,提出面向特定學(xué)科的數(shù)據(jù)素養(yǎng)能力要求。
大學(xué)圖情院系是另外一個較常提出數(shù)據(jù)素養(yǎng)能力模型的主體。圖情院系素來關(guān)注信息組織、信息處理、信息分析和信息共享等主題的教育。進入21 世紀(jì)后,圖情教育發(fā)生了很大的變化。一方面,2005年iSchools 聯(lián)盟成立,強調(diào)人、信息與技術(shù)三者之間的緊密關(guān)聯(lián),另一方面,e-Science 的興起、大數(shù)據(jù)等概念的提出和升溫,吸引不少圖情專家將教育興趣轉(zhuǎn)向數(shù)據(jù)挖掘和數(shù)據(jù)管理。總體而言,大學(xué)圖情院系的數(shù)據(jù)素養(yǎng)能力模型能夠較全面地覆蓋數(shù)據(jù)生命周期。
模型的應(yīng)用效果能夠反映出該教育思路的可行性。從應(yīng)用效果、教學(xué)資料、基本內(nèi)容和建構(gòu)方式綜合觀之,Carlson 模型是能力導(dǎo)向模型中較為成熟的一個。首先,它受IMLS 資助,通過較為科學(xué)的建構(gòu)方式建立了涵蓋整個數(shù)據(jù)生命周期的數(shù)據(jù)素養(yǎng)指標(biāo)體系。其次,該模型已應(yīng)用到多個高校圖書館不同類型的數(shù)據(jù)素養(yǎng)教育實踐項目中,發(fā)表了一系列研究成果,還在官網(wǎng)上提供了較詳盡的開展數(shù)據(jù)素養(yǎng)教育項目的操作指南。目標(biāo)導(dǎo)向模型中,Data Train 模型較為成熟,具有參考價值。
本文通過梳理和綜合分析國內(nèi)外14 個數(shù)據(jù)素養(yǎng)能力模型及相關(guān)教育實踐,提出數(shù)據(jù)素養(yǎng)教育的兩種思路,即能夠較全面地讓學(xué)習(xí)者認(rèn)識數(shù)據(jù)生命周期的系統(tǒng)化教育思路,以及能夠讓學(xué)習(xí)者快速掌握某些數(shù)據(jù)處理和管理技能的專門化教育思路。對應(yīng)這兩種思路,數(shù)據(jù)素養(yǎng)能力模型劃分為能力導(dǎo)向和目標(biāo)導(dǎo)向兩種類型。
系統(tǒng)化數(shù)據(jù)素養(yǎng)教育的最終目的是,使數(shù)據(jù)能夠得到良好的保存和高效的共享,而這兩方面都有賴于數(shù)據(jù)創(chuàng)建和數(shù)據(jù)處理環(huán)節(jié)對數(shù)據(jù)操作的規(guī)范化和標(biāo)準(zhǔn)化。對數(shù)據(jù)分析和數(shù)據(jù)重用環(huán)節(jié)的“有意”減弱,有助于將數(shù)據(jù)素養(yǎng)教育與其他教育進行明確區(qū)分。而對數(shù)據(jù)重用環(huán)節(jié)的較少關(guān)注,對e-Science 科研環(huán)境而言則是一種不足。在系統(tǒng)化教育思路下,能力導(dǎo)向模型適用的學(xué)科領(lǐng)域和教育對象非常廣泛。目前面向大范圍群體建構(gòu)的數(shù)據(jù)素養(yǎng)能力模型大多出現(xiàn)在自然科學(xué)領(lǐng)域,部分模型有更廣泛的適用性,但暫時未見專門面向人文社科領(lǐng)域建構(gòu)的數(shù)據(jù)素養(yǎng)能力模型。
就專門化的教育思路及對應(yīng)的目標(biāo)導(dǎo)向模型而言,數(shù)據(jù)素養(yǎng)的培養(yǎng)意味著某一項或幾項數(shù)據(jù)處理或管理能力的深入學(xué)習(xí)。由于教學(xué)時間有限,在專門化教育思路下,數(shù)據(jù)素養(yǎng)的教學(xué)目標(biāo)和內(nèi)容必須有所側(cè)重,因此在能力目標(biāo)設(shè)置上自然也有所取舍。目標(biāo)導(dǎo)向模型更多地涉及人文社科領(lǐng)域,或者可以認(rèn)為,與自然科學(xué)領(lǐng)域相比,人文社科領(lǐng)域更偏向于采取專門化的數(shù)據(jù)素養(yǎng)教育思路。由此表明,教育者已經(jīng)察覺到數(shù)據(jù)生命周期某個(些)環(huán)節(jié)的相關(guān)技能對所在人文學(xué)科的重要性。然而,數(shù)據(jù)于人文社科領(lǐng)域的地位越來越重要,人文社科的學(xué)生和科研人員或許也需要系統(tǒng)化地提升其數(shù)據(jù)素養(yǎng)。
而在建構(gòu)模型的主體上,主要有大學(xué)圖書館、大學(xué)圖情院系、大學(xué)圖書館與大學(xué)院系。其中,有大學(xué)圖書館介入的情況下,學(xué)科館員和數(shù)據(jù)館員發(fā)揮著重要作用。
伴隨著研究范式、路徑和方法的轉(zhuǎn)變,在大學(xué)中為研究生和本科生——未來的科研工作者開設(shè)數(shù)據(jù)素養(yǎng)教育課程顯得尤為必要和緊迫。目前自然科學(xué)領(lǐng)域已有不少較為完善的數(shù)據(jù)素養(yǎng)能力模型及對應(yīng)的教育實踐課程,而人文社科領(lǐng)域的數(shù)據(jù)素養(yǎng)教育仍處于起步階段。在設(shè)計數(shù)據(jù)素養(yǎng)教育課程的過程中,一方面,根據(jù)教育原理,需依據(jù)具體情境建構(gòu)面向不同群體的數(shù)據(jù)素養(yǎng)能力模型,才能突出后續(xù)課程的針對性和實用性。另一方面,在大學(xué)圖書館沒有學(xué)科館員和數(shù)據(jù)館員等專業(yè)人員的情況下,可以圖情院系為主導(dǎo),由圖書館和其他人文社科院系協(xié)助的方式,開展相關(guān)的數(shù)據(jù)素養(yǎng)教育實踐,以全面提高人文社科科研工作者及后備人員的數(shù)據(jù)素養(yǎng)。
注釋
①International Association for Social Science Information Service&Technology,社會科學(xué)信息服務(wù)與技術(shù)國際協(xié)會。
②Inter-university Consortium for Political and Social Research,政治和社會研究校際聯(lián)盟。
③每類模型建構(gòu)以時間先后為序,每個模型以建構(gòu)者及建構(gòu)時間命名。
④該項目2010-2011年受英國聯(lián)合信息系統(tǒng)委員會(Joint Information System Committee,JISC)資助,2013年至今受愛丁堡大學(xué)“科研數(shù)據(jù)管理計劃”資助(http://datalib.edina.ac.uk/mantra/acknowledgements.html)。
⑤該項目受美國博物館與圖書館服務(wù)協(xié)會(Institution of Museum and Library Service,IMLS)資助,由普渡大學(xué)、明尼蘇達州大學(xué)、俄勒岡大學(xué)、康奈爾大學(xué)合作建設(shè)。
⑥該課程受美國國家醫(yī)學(xué)圖書館和馬薩諸塞大學(xué)醫(yī)學(xué)院聯(lián)合資助。
⑦信息素養(yǎng)六大技能(Big6 Skills,The Big 6TM)由邁克·艾森伯格(Mike Eisenberg)和鮑勃·伯科威茨(Bob Berkowitz)建立,包括任務(wù)界定、信息檢索策略、定位與獲取、使用信息、合成、評價等六大能力(http://www.big6.com/pages/about/big6-skills-overview.php)。
⑧SCONUL 信息素養(yǎng)七大指標(biāo)(The SCONUL Seven Pillars of Information Literacy:Core Model)由SCONUL信息素養(yǎng)工作小組建構(gòu),包括信息需求識別、信息需求研究、檢索策略規(guī)劃、信息獲取、信息評價、知識管理和知識展示與創(chuàng)新(http://www.sconul.ac.uk/sites/default/files/documents/coremodel.pdf)。