亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)研究及啟示

        2020-02-15 10:09:46劉淑君
        開放教育研究 2020年1期
        關(guān)鍵詞:工具技能測(cè)試

        李 艷 劉淑君

        (浙江大學(xué) 教育學(xué)院,浙江杭州 310028)

        一、引 言

        隨著人工智能和大數(shù)據(jù)技術(shù)教育應(yīng)用的日益普及,一線教師可獲得的教育數(shù)據(jù)呈幾何指數(shù)增長(zhǎng),這些數(shù)據(jù)只有被科學(xué)地處理和分析后才能對(duì)教育教學(xué)產(chǎn)生積極影響 (Means et al.,2010;何克抗,2014)。教育部門和相關(guān)專家倡導(dǎo)教師要從基于經(jīng)驗(yàn)的決策轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)的決策,并堅(jiān)信這種轉(zhuǎn)變會(huì)提高教育教學(xué)質(zhì)量(Ingram et al.,2004)。在這一背景下,教師數(shù)據(jù)素養(yǎng)的議題受到教育界的廣泛關(guān)注。

        教育研究關(guān)注的“數(shù)據(jù)”指“系統(tǒng)地收集起來的有關(guān)學(xué)校某方面的信息”,既包括教學(xué)測(cè)評(píng)定量數(shù)據(jù),也包括課堂觀察、訪談、人口統(tǒng)計(jì)學(xué)等類型的定性或定量數(shù)據(jù)(Mandinach & Gummer,2016a;Schildkamp et al.,2017)。管理者、學(xué)生、家長(zhǎng)和教師等角色不同,數(shù)據(jù)素養(yǎng)的內(nèi)涵也不同。本研究關(guān)注的是教師群體的數(shù)據(jù)素養(yǎng)。從廣義上講,“數(shù)據(jù)素養(yǎng)”指“使用數(shù)據(jù)指導(dǎo)決策的能力”(Data Quality Campaign,2014;Kippers et al.,2018;Mandinach & Gummer,2013)。不過,在很長(zhǎng)時(shí)間內(nèi),學(xué)術(shù)界對(duì)教師數(shù)據(jù)素養(yǎng)的概念并沒有達(dá)成共識(shí),也沒有形成明確的定義。2016年,美國學(xué)者曼迪那契(Mandinach)提出了教師數(shù)據(jù)素養(yǎng)(Data Literacy for Teachers/Teaching,簡(jiǎn)稱DLFT)的概念,并將其界定為“教師通過收集、分析和解釋所有類型的數(shù)據(jù)(包括測(cè)評(píng)、學(xué)校環(huán)境、行為、縱向等數(shù)據(jù)類型)幫助確定教學(xué)步驟,從而將信息轉(zhuǎn)化為可操作的教學(xué)知識(shí)及實(shí)踐的能力”(Mandinach & Gummer,2016a)。

        隨著智能教學(xué)系統(tǒng)在各級(jí)各類學(xué)校的廣泛應(yīng)用,我國一線教師已日漸熟悉教學(xué)場(chǎng)景出現(xiàn)的不同來源、不同類型的教育數(shù)據(jù)。不過,如何有效挖掘和利用教學(xué)場(chǎng)景出現(xiàn)的教育數(shù)據(jù)對(duì)大多數(shù)中國教師而言還是巨大的挑戰(zhàn)(祝智庭等,2017)。教師數(shù)據(jù)素養(yǎng)亟待提升,否則將無法充分挖掘教育數(shù)據(jù)的價(jià)值并應(yīng)用于教育教學(xué)決策。地區(qū)和學(xué)校亟需借助科學(xué)測(cè)評(píng)工具了解教師的數(shù)據(jù)素養(yǎng)狀況,探索多樣化的培養(yǎng)路徑,這也對(duì)該領(lǐng)域的學(xué)術(shù)研究提出了新要求。

        國內(nèi)文獻(xiàn)調(diào)研顯示,截至2019年11月,中國知網(wǎng)上以“教師數(shù)據(jù)素養(yǎng)”為主題的論文有五十余篇,研究?jī)?nèi)容集中在以下三方面:1)對(duì)教師數(shù)據(jù)素養(yǎng)內(nèi)涵和能力結(jié)構(gòu)的理論探討(劉雅馨等,2018;阮士桂等,2016;張進(jìn)良等,2015)。這類研究既是我國在該領(lǐng)域研究的起點(diǎn),也是引用率較高的熱點(diǎn)。2)對(duì)國外相關(guān)研究成果的引介。我國研究者近年比較重視借鑒國外教師數(shù)據(jù)素養(yǎng)的研究成果,但相關(guān)介紹比較籠統(tǒng),缺乏對(duì)具體的測(cè)評(píng)形式與內(nèi)容的細(xì)致梳理(李青等,2016;王萍等,2016;王正青等,2018;李新等,2019)。3)對(duì)師生數(shù)據(jù)素養(yǎng)的調(diào)研。有研究者設(shè)計(jì)了數(shù)據(jù)素養(yǎng)問卷調(diào)查,還在高校范圍內(nèi)開展調(diào)研并對(duì)結(jié)果進(jìn)行統(tǒng)計(jì)分析(郝媛玲等,2016;李青等,2018;隆茜,2015)。然而,此類問卷多是師生通用的,沒有強(qiáng)調(diào)“教師”的數(shù)據(jù)使用特點(diǎn),問卷對(duì)象的模糊化必然影響調(diào)研結(jié)果的可靠性。

        迄今為止,我國還沒有研發(fā)出被廣泛認(rèn)可、信效度較高的測(cè)評(píng)教師數(shù)據(jù)素養(yǎng)的工具。國內(nèi)教師數(shù)據(jù)素養(yǎng)研究剛剛興起,測(cè)評(píng)方面的研究還不夠成熟。在此背景下,本研究擬系統(tǒng)介紹國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)的研究成果與實(shí)踐案例,以期對(duì)國內(nèi)該領(lǐng)域的研究和實(shí)踐提供借鑒和啟示。

        二、文獻(xiàn)概述

        本研究以Web of Science核心合集為樣本數(shù)據(jù)庫,以“teacher data literacy”“data literacy + teacher education”“data based decision making + teacher professional development”“teacher data use + survey”等為主題詞搜索,截至2019年11月,通過瀏覽文獻(xiàn)標(biāo)題、摘要和正文內(nèi)容篩選到相關(guān)度高的 49篇文獻(xiàn),然后采用滾雪球方法追蹤所選文獻(xiàn)的參考文獻(xiàn),獲得期刊論文41篇,調(diào)研報(bào)告8篇,專著2本。總計(jì)獲取的外文文獻(xiàn)的100篇。

        圖1 “教師數(shù)據(jù)素養(yǎng)”文獻(xiàn)國別分布

        從國別分布看,教師數(shù)據(jù)素養(yǎng)的研究者集中在歐美發(fā)達(dá)國家,其中美國超過百分之六十,占比最高,荷蘭緊隨其后,超過百分之二十。相對(duì)而言,比利時(shí)、加拿大、新西蘭等國家在該領(lǐng)域的研究還剛起步,研究成果比較分散;亞洲、非洲國家在該領(lǐng)域的研究還有待突破(見圖1)。通過深入分析文獻(xiàn),我們發(fā)現(xiàn)國外教師數(shù)據(jù)素養(yǎng)研究聚焦在以下三方面:

        (一)對(duì)教師數(shù)據(jù)素養(yǎng)的能力框架、培養(yǎng)方式及價(jià)值意義的理論探討

        經(jīng)過十余年發(fā)展,美國曼迪那契等人將教師、數(shù)據(jù)、教學(xué)等關(guān)鍵點(diǎn)結(jié)合起來,建立了教師數(shù)據(jù)素養(yǎng)能力評(píng)價(jià)體系,其中包含了確定問題、使用數(shù)據(jù)、將數(shù)據(jù)轉(zhuǎn)換為信息、將信息轉(zhuǎn)換為決策和評(píng)估結(jié)果等五個(gè)維度,每個(gè)維度都可分解為具體技能,共53種。比如,“確定問題”維度包含闡明教育的某個(gè)問題、理解學(xué)生隱私等五項(xiàng)技能;“使用數(shù)據(jù)”維度囊括了使用多種數(shù)據(jù)來源、了解如何生成數(shù)據(jù)、使用形成性和終結(jié)性評(píng)估等27種技能,是該能力框架的主體部分。從“確定問題”到“評(píng)估結(jié)果”,五個(gè)維度之間有邏輯關(guān)系,構(gòu)成一個(gè)數(shù)據(jù)探究程序(Gummer & Mandinach,2015;Mandinach & Gummer,2016a)。這一能力評(píng)價(jià)框架是該領(lǐng)域的研究成果,得到廣泛認(rèn)可。另外,研究者還深入研討教師數(shù)據(jù)素養(yǎng)教育的路徑,充分肯定了崗前教育和在職培訓(xùn)對(duì)提升教師數(shù)據(jù)素養(yǎng)的意義(Mandinach & Gummer,2016b;Mandinach et al.,2011;Mandinach & Jimerson,2016)。

        (二)對(duì)教師數(shù)據(jù)使用實(shí)踐的調(diào)研分析

        有學(xué)者通過問卷、訪談、測(cè)試等方式評(píng)估教師數(shù)據(jù)使用能力、態(tài)度、信念等;也有學(xué)者關(guān)注影響教師數(shù)據(jù)使用的因素,調(diào)查教師數(shù)據(jù)探究行為,歸納影響教師數(shù)據(jù)使用的因子模型(Schildkamp & Poortman,2015;Schildkamp et al.,2017);還有學(xué)者關(guān)注教師數(shù)據(jù)決策實(shí)踐與學(xué)生成績(jī)之間的關(guān)系,通過實(shí)驗(yàn)研究數(shù)據(jù)驅(qū)動(dòng)的教學(xué)決策與學(xué)生數(shù)學(xué)、閱讀成績(jī)之間的關(guān)系(Van der Scheer & Visscher,2018;Van Geel et al.,2016)。

        (三)有關(guān)教師數(shù)據(jù)素養(yǎng)培養(yǎng)的實(shí)證研究

        國外學(xué)者圍繞師范生和在職教師數(shù)據(jù)素養(yǎng)培養(yǎng)策略開展了多項(xiàng)實(shí)證研究。荷蘭學(xué)者研發(fā)的教師數(shù)據(jù)探究小組(Bolhuis et al.,2019;Ebbeler et al.2017)、美國里夫斯(Reeves)等人提出的數(shù)據(jù)素養(yǎng)教育與師范課程整合、實(shí)施在線課程等策略都呈現(xiàn)了較好的效果,也為之后的研究奠定了基礎(chǔ)(Reeves & Chiang,2018,2019;Reeves & Honig,2015)。

        概括而言,篩選出的100種文獻(xiàn)中有30篇涉及測(cè)評(píng)工具,其中探討教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具的文獻(xiàn)2篇,分別是美國韋曼(Wayman)等學(xué)者編撰的教師數(shù)據(jù)使用問卷調(diào)查和美國“西部教育”(WestEd)公司編纂的情境訪談工具(Wayman et al.,2016;WestEd,2018);其余28篇文獻(xiàn)屬于教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)及培養(yǎng)實(shí)證研究。教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具的開發(fā)和應(yīng)用是為了滿足研究實(shí)踐的需要,是研究課題的有機(jī)組成部分(Ebbeler et al.,2016;Ebbeler et al.,2017;McNaughton et al.,2012)。本文接下來將詳細(xì)介紹有代表性的教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具及研究案例,以期對(duì)我國該領(lǐng)域研究及實(shí)踐有所啟示。

        三、國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具及研究案例

        國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具主要有問卷調(diào)查、知識(shí)測(cè)試、情境訪談三種類型。

        借助問卷調(diào)查開展的相關(guān)研究中,大多數(shù)研究者沿用或修訂已有問卷以保證足夠的信效度,只有少數(shù)研究者獨(dú)立開發(fā)問卷工具(O’Brien et al.,2019;Piro et al.,2014;Van Geel et al.,2017)。盡管學(xué)術(shù)界還沒有在調(diào)查工具上達(dá)成共識(shí),但通過文獻(xiàn)追蹤可以發(fā)現(xiàn),一些引用率較高的調(diào)查問卷,如多項(xiàng)研究的調(diào)查工具都建立在美國學(xué)者韋曼(Wayman)等人開發(fā)的教師數(shù)據(jù)使用調(diào)查基礎(chǔ)上(Reeves & Honig,2015;Wayman et al.,2012;Wayman et al.,2017;Wayman et al.,2009;Wayman et al.,2016)。另外,美國學(xué)者杜恩(Dunn)等針對(duì)教師數(shù)據(jù)決策觀念、知識(shí)和效能等設(shè)計(jì)了三位一體的調(diào)查工具,被廣泛地應(yīng)用在相關(guān)研究中(Dunn et al.,2013;Reeves & Chiang,2018;Reeves et al.,2016)。

        最早的知識(shí)測(cè)試工具由荷蘭學(xué)者艾波拉(Ebbeler)等人開發(fā),主要由開放式問題組成,目前只在荷蘭應(yīng)用(Bolhuis et al.,2019;Ebbeler et al.,2017;Kippers et al.,2018)。

        情境訪談的測(cè)評(píng)形式起源于美國,最早由米恩斯(Means)等人開發(fā),并將其應(yīng)用到教師數(shù)據(jù)素養(yǎng)的調(diào)研中(Means et al.,2009;Means et al.,2011)。曼迪那契團(tuán)隊(duì)也曾致力于情境訪談的工具研發(fā)(WestEd,2018)。下文將介紹這三種類型的測(cè)評(píng)工具及相關(guān)研究案例。

        (一)問卷調(diào)查

        在已有研究中,問卷調(diào)查是較常見的數(shù)據(jù)素養(yǎng)測(cè)評(píng)方式。值得注意的是,教師數(shù)據(jù)素養(yǎng)評(píng)估的內(nèi)容往往作為教師數(shù)據(jù)使用調(diào)查的子量表出現(xiàn)。研究者常借此對(duì)教師數(shù)據(jù)使用的行為、信念或技能進(jìn)行一般性了解(Ebbeler et al.,2017;Moore & Shaw,2017;Wayman et al.,2017;Wayman et al.,2016)。

        韋曼等人于2009年開發(fā)的教師數(shù)據(jù)使用調(diào)查問卷被應(yīng)用在多項(xiàng)研究中,信效度已得到較好的驗(yàn)證(Moore & Shaw,2017;Wayman et al.,2012;Wayman et al.,2009)。該調(diào)查問卷沒有公開發(fā)表,最初主要用在韋曼及其同事的研究中。為了支持學(xué)校向數(shù)據(jù)決策文化轉(zhuǎn)型,美國教育部、教育科學(xué)委員會(huì)等機(jī)構(gòu)2016年組織專家研發(fā)教師數(shù)據(jù)使用問卷調(diào)查工具。韋曼等學(xué)者在2009版調(diào)查問卷的基礎(chǔ)上,借鑒最新研究成果,開發(fā)了教師數(shù)據(jù)使用量表并公開發(fā)表,美國區(qū)域教育實(shí)驗(yàn)室網(wǎng)站可免費(fèi)下載該問卷及其使用手冊(cè)(Wayman et al.,2016)。教師數(shù)據(jù)使用行為模型是該量表研發(fā)的理論基礎(chǔ)。在這一模型中,教師數(shù)據(jù)使用行為處于中心地位,既反映教師個(gè)體知識(shí)和實(shí)踐的發(fā)展變化,又可以促進(jìn)學(xué)生學(xué)習(xí)。數(shù)據(jù)使用能力、數(shù)據(jù)態(tài)度、合作狀況以及組織支持等都能影響教師的數(shù)據(jù)使用行為(見圖2)。

        圖2 教師數(shù)據(jù)使用行為模型(Wayman et al.,2016)

        與這一理論模型相照應(yīng),該調(diào)查問卷包括五份子量表,分別調(diào)查教師數(shù)據(jù)使用行為和其他四種影響因素。其中,“數(shù)據(jù)使用能力”和“數(shù)據(jù)態(tài)度”子量表可反映教師數(shù)據(jù)素養(yǎng)狀況(見表一)。該問卷依據(jù)李克特四點(diǎn)量表設(shè)計(jì),教師從“非常反對(duì)”“反對(duì)”“同意”“非常同意”中選擇。該問卷設(shè)計(jì)了針對(duì)教師、管理者、教輔人員等角色版本。不過,除題干的稱呼和問法略有差異,各版本調(diào)查內(nèi)容基本相同。

        表一 數(shù)據(jù)使用調(diào)查量表中的子量表樣例 (Wayman et al.,2016)

        研究者曾用該量表調(diào)研了美國納什維爾市五所公立中學(xué), 70名教師、5名管理者和12名教學(xué)輔助人員完成了三個(gè)版本的調(diào)查表。調(diào)查結(jié)果顯示,在教師數(shù)據(jù)能力自我評(píng)價(jià)上,教師平均得分稍高于管理者和教輔人員。同時(shí),在數(shù)據(jù)態(tài)度上,教師的平均得分略低于管理人員和教輔人員。這表明,盡管教師對(duì)自身數(shù)據(jù)技能自信,但管理者和教輔人員態(tài)度更積極。該研究的目的是利用調(diào)查結(jié)果支持學(xué)校發(fā)展,因此學(xué)校代表和地區(qū)教育管理者根據(jù)調(diào)查結(jié)果,提出了后續(xù)的行動(dòng)計(jì)劃(Wayman et al.,2017)。

        為方便統(tǒng)計(jì),每個(gè)選項(xiàng)被賦予1到4的分值。子量表平均得分可以用來評(píng)估教師群體數(shù)據(jù)使用的表現(xiàn);研究者還可以比較調(diào)研結(jié)果,既能比較各子量表均值,也可以比較教師、管理者和教輔人員的量表均值,還可以依據(jù)人口統(tǒng)計(jì)學(xué)變量進(jìn)行比較(Wayman et al.,2016)。

        另外,美國學(xué)者杜恩等人為了調(diào)查教師的數(shù)據(jù)素養(yǎng),針對(duì)數(shù)據(jù)決策關(guān)注度、知識(shí)和效能感維度設(shè)計(jì)了調(diào)查工具(Dunn et al.,2013)。數(shù)據(jù)決策關(guān)注度反映教師對(duì)數(shù)據(jù)決策的態(tài)度和滿意度等,數(shù)據(jù)決策知識(shí)反映教師的數(shù)據(jù)技能,數(shù)據(jù)決策效能指教師對(duì)自己成功參與數(shù)據(jù)決策的信念。三個(gè)維度互相影響、互相作用,三位一體,能綜合反映教師數(shù)據(jù)素養(yǎng)狀況。以杜恩教師數(shù)據(jù)素養(yǎng)問卷“知識(shí)”維度測(cè)試題為例,它包括“數(shù)據(jù)解釋和評(píng)價(jià)能力”和“教學(xué)決策能力”兩部分(見表二),三位專家檢驗(yàn)問卷并對(duì)內(nèi)容效度達(dá)成共識(shí)。研究者用這套調(diào)查問卷評(píng)估美國西北部某州1500多名教師的數(shù)據(jù)素養(yǎng)。結(jié)果表明,教師數(shù)據(jù)知識(shí)在兩個(gè)維度上分別達(dá)到25%和30%的得分率,處于較低水平;從關(guān)注度上看,教師對(duì)數(shù)據(jù)決策有抵觸心理,興趣不高,但在實(shí)踐中從事有關(guān)數(shù)據(jù)決策的具體工作,也關(guān)心數(shù)據(jù)決策對(duì)學(xué)生產(chǎn)生的影響(Dunn et al.,2013)。

        值得注意的是,問卷調(diào)查評(píng)測(cè)也存在局限,比如,問卷調(diào)查收集的多是教師的感知類數(shù)據(jù),被調(diào)查者能否實(shí)事求是地回答問題、是否會(huì)揣測(cè)調(diào)查者的意圖從而違心地回答問題等都會(huì)影響調(diào)查結(jié)果的有效性。這些問題或許會(huì)通過溝通和管理程序最小化,但不能徹底消除。

        表二 “知識(shí)”維度測(cè)試題樣例(Dunn et al.,2013)

        (二)知識(shí)測(cè)試

        研究表明,要深入調(diào)查教師數(shù)據(jù)素養(yǎng),只收集教師的感知或態(tài)度數(shù)據(jù)是不夠的(Marsh,2012)。為了增強(qiáng)調(diào)查結(jié)果的科學(xué)性,荷蘭學(xué)者開發(fā)了針對(duì)教師數(shù)據(jù)素養(yǎng)的知識(shí)測(cè)試,且被應(yīng)用在多項(xiàng)教師數(shù)據(jù)素養(yǎng)研究中。

        艾波拉等(2017)開展了旨在提升中學(xué)教師數(shù)據(jù)素養(yǎng)的準(zhǔn)實(shí)驗(yàn)研究,實(shí)驗(yàn)組是9所中學(xué)的教師,對(duì)照組是另外42所中學(xué)的教師。課題組指導(dǎo)教師小組遵循數(shù)據(jù)決策八步驟模型對(duì)教育問題進(jìn)行合作探究。為了檢驗(yàn)實(shí)驗(yàn)效果,艾波拉及同事以數(shù)據(jù)決策八步驟模型(見圖3)為參照框架設(shè)計(jì)了知識(shí)測(cè)試。該測(cè)試為紙筆測(cè)試,包括12道開放題,每道題都與教師數(shù)據(jù)素養(yǎng)的能力結(jié)構(gòu)、數(shù)據(jù)決策的八個(gè)步驟對(duì)應(yīng),作答時(shí)間限30分鐘(Ebbeler et al.,2017)。

        在數(shù)據(jù)決策模型中,學(xué)校的數(shù)據(jù)決策過程被歸納為由八個(gè)步驟構(gòu)成的探究循環(huán),從“界定問題”開始到“評(píng)價(jià)”結(jié)束,然后繼續(xù)下一輪探究。不過,這不是單線循環(huán)(見圖3),如果教育者在第6步的“解釋和結(jié)論”發(fā)現(xiàn)最初的假設(shè)不正確,就需要返回第2步重新“形成假設(shè)”。另外,如果第8步“評(píng)價(jià)”發(fā)現(xiàn)問題沒有得到解決,還需返回到第7步,再次“實(shí)施改進(jìn)措施”。

        圖3 數(shù)據(jù)決策的八步驟模型(Schildkamp & Ehren,2013)

        該模型是數(shù)據(jù)使用的探究循環(huán),與該團(tuán)隊(duì)界定的教師數(shù)據(jù)素養(yǎng)的能力結(jié)構(gòu)相對(duì)應(yīng)。該課題組認(rèn)為,教師數(shù)據(jù)素養(yǎng)由設(shè)定目標(biāo)、收集數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù)和采取教學(xué)行動(dòng)等五個(gè)維度的能力組成,數(shù)據(jù)決策模型的每個(gè)步驟都可以體現(xiàn)某一維度的能力。比如,“界定問題”和“形成假設(shè)”兩個(gè)步驟體現(xiàn)的是“設(shè)定目標(biāo)”維度的能力,“界定問題”“收集數(shù)據(jù)”和“評(píng)價(jià)”體現(xiàn)的是“收集數(shù)據(jù)”維度的能力。值得注意的是,數(shù)據(jù)決策步驟和數(shù)據(jù)素養(yǎng)之間屬于多點(diǎn)對(duì)應(yīng)關(guān)系。如“界定問題”步驟既能體現(xiàn)“設(shè)定目標(biāo)”能力,也可體現(xiàn)“收集數(shù)據(jù)”能力;“評(píng)價(jià)”步驟既可以體現(xiàn)“收集數(shù)據(jù)”能力,也可體現(xiàn)“分析數(shù)據(jù)”和“解釋”數(shù)據(jù)能力(見表三)。也就是說,完成數(shù)據(jù)決策的八個(gè)步驟,需要綜合運(yùn)用五個(gè)維度的數(shù)據(jù)能力。表三列舉了這套知識(shí)測(cè)試的綱要,每一行都標(biāo)明了題項(xiàng)與數(shù)據(jù)決策步驟及能力維度間的對(duì)應(yīng)關(guān)系。為了檢驗(yàn)這套知識(shí)測(cè)試的可靠性,兩位研究人員對(duì)相同的測(cè)試卷進(jìn)行編碼評(píng)分,二者的一致性系數(shù)達(dá)到92%。前后測(cè)數(shù)據(jù)分析顯示,教師數(shù)據(jù)素養(yǎng)培訓(xùn)實(shí)驗(yàn)項(xiàng)目效果一般(Ebbeler et al.,2017)。

        表三 數(shù)據(jù)素養(yǎng)、數(shù)據(jù)決策步驟和知識(shí)測(cè)試題的關(guān)系 (Ebbeler et al.,2017)

        荷蘭庫伊伯斯(Kippers)等人對(duì)由教師、校領(lǐng)導(dǎo)、數(shù)據(jù)教練組成的數(shù)據(jù)探究小組進(jìn)行了長(zhǎng)達(dá)一年的培訓(xùn),并使用這套知識(shí)測(cè)試對(duì)參與教師數(shù)據(jù)素養(yǎng)進(jìn)行前后測(cè)。數(shù)據(jù)分析結(jié)果呈現(xiàn)中到大的效應(yīng)值,但是后測(cè)均值11.2分,還沒有達(dá)到滿分25分的一半,提升空間還很大。該研究進(jìn)一步分析了教師數(shù)據(jù)素養(yǎng)的各項(xiàng)能力(設(shè)定目的、收集數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù)和采取教學(xué)行動(dòng))分別發(fā)展到何種程度,并總結(jié)參與者的收獲和困惑(Kippers et al.,2018)。

        該工具不僅可以用于教師數(shù)據(jù)素養(yǎng)集體測(cè)試,還可以用于個(gè)案研究。荷蘭博爾赫斯(Bolhuis)等學(xué)者在某師范學(xué)院實(shí)施一項(xiàng)案例研究。該學(xué)院的五名教師組成數(shù)據(jù)探究小組,合作研究學(xué)生輟學(xué)問題。課題組成員對(duì)數(shù)據(jù)小組參與者進(jìn)行跟蹤,著力研究參加數(shù)據(jù)探究小組活動(dòng)如何影響教師的數(shù)據(jù)素養(yǎng)??紤]到研究對(duì)象是大學(xué)老師,研究者對(duì)這套知識(shí)測(cè)試進(jìn)行了必要修訂后才將其應(yīng)用于測(cè)評(píng)。在參加數(shù)據(jù)探究小組活動(dòng)后,教師數(shù)據(jù)素養(yǎng)成績(jī)均值從8.7上升到14.3,提高較明顯。然而,五名教師數(shù)據(jù)素養(yǎng)發(fā)展不平衡。結(jié)合調(diào)查、訪談數(shù)據(jù)分析發(fā)現(xiàn),教師在“解釋數(shù)據(jù)”“將結(jié)論轉(zhuǎn)化為改進(jìn)措施”和“評(píng)價(jià)”方面收獲最大,在“界定問題”和“收集數(shù)據(jù)”方面收獲較少。另外,參與者數(shù)據(jù)素養(yǎng)的提升狀況和他們的起始水平密切相關(guān)(Bolhuis et al.,2019)。

        知識(shí)測(cè)試類工具的優(yōu)勢(shì)在于,研究者可以對(duì)教師的數(shù)據(jù)素養(yǎng)進(jìn)行量化測(cè)評(píng),便于比較和等級(jí)評(píng)定。相對(duì)于問卷調(diào)查,此類工具的評(píng)測(cè)結(jié)果更客觀和可靠。然而,就該套知識(shí)測(cè)試而言,盡管研究者在題目中努力設(shè)置情境,讓題目?jī)?nèi)容和學(xué)科、年段緊密結(jié)合,但沒有一個(gè)整體情境統(tǒng)帥所有題項(xiàng),問題與問題之間相互獨(dú)立,缺乏關(guān)聯(lián)。其測(cè)試任務(wù)離真實(shí)工作情境還有一定距離,能否準(zhǔn)確反映教師真實(shí)的數(shù)據(jù)素養(yǎng)有待商榷。

        (三)情境訪談

        除了問卷調(diào)查和知識(shí)測(cè)試外,國外研究者還開發(fā)了針對(duì)教師數(shù)據(jù)素養(yǎng)的另一種測(cè)評(píng)工具——情境訪談(Means et al.,2011;WestEd,2018)。情境訪談工具包括模擬情境、一套數(shù)據(jù)文件和一組問題。訪談人員依據(jù)情境訪談內(nèi)容展開調(diào)查。通過對(duì)訪談結(jié)果進(jìn)行數(shù)據(jù)分析,研究者綜合評(píng)估教師數(shù)據(jù)素養(yǎng)。為全方位調(diào)查教師的數(shù)據(jù)素養(yǎng),研究者通常會(huì)設(shè)計(jì)多個(gè)情境,以便覆蓋足夠多的數(shù)據(jù)知識(shí)和技能。就對(duì)評(píng)估結(jié)果分析方法而言,有的情境訪談工具支持對(duì)訪談結(jié)果進(jìn)行編碼評(píng)分和量化分析;有的沒有評(píng)分量表,研究者只能大致評(píng)估和了解教師的數(shù)據(jù)素養(yǎng)。下面我們對(duì)兩種情境訪談工具分別舉例說明。

        米恩斯等人曾開發(fā)了一套情境訪談工具,并將其應(yīng)用在教師數(shù)據(jù)素養(yǎng)調(diào)查中。該課題組邀請(qǐng)了包括曼迪那契在內(nèi)的專家組參與研發(fā)。專家組首先確定了使用數(shù)據(jù)決策的基本程序:?jiǎn)栴}提出、數(shù)據(jù)定位、數(shù)據(jù)理解、數(shù)據(jù)解釋和數(shù)據(jù)使用;接著明確了教師執(zhí)行這些程序所需要的技能;最后對(duì)涉及這些技能的工作情景和問題設(shè)計(jì)進(jìn)行頭腦風(fēng)暴。在此基礎(chǔ)上,課題組開發(fā)了一套包括7種情境在內(nèi)的訪談工具(見表四),每種情境訪談都包括模擬情境、一套數(shù)據(jù)文件和一組問題。相關(guān)評(píng)估專家和數(shù)學(xué)教育專家審查了該工具的可信度、準(zhǔn)確性以及與數(shù)據(jù)素養(yǎng)能力指標(biāo)的一致性(Means et al.,2009;Means et al.,2011)。

        分析訪談數(shù)據(jù)時(shí),研究者要對(duì)客觀題和訪談文本分別進(jìn)行量化評(píng)分和質(zhì)性編碼,以便全面呈現(xiàn)教師與學(xué)生數(shù)據(jù)交互方式,進(jìn)而評(píng)估教師數(shù)據(jù)素養(yǎng)。

        課題組用該情境訪談工具對(duì)美國10個(gè)地區(qū)30所中小學(xué)教師實(shí)施數(shù)據(jù)素養(yǎng)調(diào)查,共52名教師和72個(gè)小組(每個(gè)小組包括2名教師和1名校領(lǐng)導(dǎo))參與訪談,230余人參與了這項(xiàng)探索性研究。為了控制訪談時(shí)間,7種訪談情境被組合成兩種訪談方案,第一種方案由前4種情境組成,第二種方案由后3種情境組成,兩個(gè)方案涉及的數(shù)據(jù)技能和概念基本平衡。研究結(jié)果顯示,大多數(shù)教師在數(shù)據(jù)定位、數(shù)據(jù)使用等任務(wù)中表現(xiàn)較好,但在數(shù)據(jù)理解、數(shù)據(jù)解釋等挑戰(zhàn)性任務(wù)中表現(xiàn)欠佳。與個(gè)人訪談相比,小組訪談的平均成績(jī)更高,受訪者更容易對(duì)數(shù)據(jù)作出合理解釋,并呈現(xiàn)出多元數(shù)據(jù)技能(Means et al.,2011)。

        美國“西部教育”(WestEd)公司2018年依托數(shù)據(jù)素養(yǎng)評(píng)估項(xiàng)目也開發(fā)了一套情境訪談工具?!拔鞑拷逃笔桥f金山的一家非盈利性組織,它將“促進(jìn)卓越、實(shí)現(xiàn)公平和改善兒童、青少年和成人的學(xué)習(xí)”作為自身使命,在學(xué)術(shù)界影響較大。作為數(shù)據(jù)決策領(lǐng)域的先鋒,曼迪那契教授在西部教育擔(dān)任數(shù)據(jù)決策倡議主任。她的團(tuán)隊(duì)界定了教師數(shù)據(jù)素養(yǎng)涵蓋的53項(xiàng)具體技能及5種情感傾向特征,這些具體技能分別歸屬于五個(gè)技能維度,即確定問題、使用數(shù)據(jù)、將數(shù)據(jù)轉(zhuǎn)換為信息、將信息轉(zhuǎn)換為決策以及評(píng)估結(jié)果等,這五個(gè)技能維度又構(gòu)成數(shù)據(jù)探究循環(huán)(Mandinach & Gummer,2016a)。

        曼迪那契教授以這些理論研究成果為基礎(chǔ),帶領(lǐng)課題組成員開發(fā)了形成性評(píng)估、終結(jié)性評(píng)估、早期預(yù)警指標(biāo)和工作場(chǎng)所決策等四種情境。形成性評(píng)估情境關(guān)注日常短期數(shù)據(jù);終結(jié)性評(píng)估圍繞期末測(cè)評(píng)數(shù)據(jù)構(gòu)建;早期預(yù)警情境針對(duì)學(xué)生畢業(yè)風(fēng)險(xiǎn)指標(biāo)建立數(shù)據(jù)文件和問題,以便對(duì)畢業(yè)困難生及早定位并采取措施;工作場(chǎng)所決策則要求教師借助各種教育數(shù)據(jù)選擇未來的任職場(chǎng)所(見表五)。

        表四 美國教育部組織研發(fā)的情境訪談工具及其考查的技能和概念(Means et al.,2011)

        表五 美國“西部教育”開發(fā)的情境訪談工具(WestEd,2018)

        表五呈現(xiàn)了四個(gè)情境的內(nèi)容概要及所包含的考察目標(biāo)。當(dāng)然,每種情境都考查數(shù)據(jù)素養(yǎng)的部分技能(見表六),比如,表六的第2行列舉了各種情境對(duì)“確定問題”維度技能的考查情況。根據(jù)曼迪那契的能力評(píng)價(jià)體系,“確定問題”維度包括5項(xiàng)技能。四種數(shù)據(jù)情境分別考查了其中的2項(xiàng)、5項(xiàng)、4項(xiàng)、2項(xiàng)技能,這一維度的技能在四種情境中共考查了13次。

        該情境訪談工具提供了每個(gè)問題的最佳反應(yīng)范式,但是沒有提供量規(guī),也沒有將題目和具體技能精準(zhǔn)對(duì)應(yīng)起來,因而研究者不能對(duì)訪談結(jié)果進(jìn)行量化評(píng)分,只能依據(jù)情境訪談工具中的技能列表和參考答案,粗略評(píng)估教師的數(shù)據(jù)技能和態(tài)度表現(xiàn)。與2011版的情境訪談工具相比,這套工具不僅覆蓋學(xué)生的各種測(cè)評(píng)數(shù)據(jù),還包括人口統(tǒng)計(jì)學(xué)、教育政策等數(shù)據(jù),數(shù)據(jù)類型更廣泛。該套情境訪談工具也反映了教師數(shù)據(jù)素養(yǎng)的最新研究成果。遺憾的是,在可獲取的文獻(xiàn)中還沒有見到這套工具的應(yīng)用情況。

        情境訪談可以提供一個(gè)模擬工作情境,讓教師呈現(xiàn)比較真實(shí)的數(shù)據(jù)使用能力和態(tài)度。相對(duì)于問卷調(diào)查和知識(shí)測(cè)試,這種測(cè)評(píng)方式需花費(fèi)較多的人力和時(shí)間,調(diào)研成本較高。

        表六 美國“西部教育”情境訪談工具對(duì)數(shù)據(jù)素養(yǎng)技能的考查(WestEd,2018)

        四、總結(jié)與比較

        綜上所述,問卷調(diào)查、知識(shí)測(cè)試與情景訪談等測(cè)評(píng)工具盡管形式各異,但都在著力尋求教師具備數(shù)據(jù)素養(yǎng)的表現(xiàn)證據(jù),以此推斷和評(píng)估教師的數(shù)據(jù)素養(yǎng)水平,基本上遵循了證據(jù)中心的測(cè)評(píng)設(shè)計(jì)模式。證據(jù)中心設(shè)計(jì)模式將評(píng)估視為基于證據(jù)的推理,即通過觀察被試在特定情境中所說、所做等表現(xiàn),來推斷他們的認(rèn)知和能力層次(Mislevy et al.,2003)。該測(cè)試設(shè)計(jì)模式不僅被廣泛應(yīng)用在測(cè)評(píng)設(shè)計(jì)中,還常用來檢驗(yàn)測(cè)評(píng)工具的有效性。證據(jù)中心測(cè)試的設(shè)計(jì)框架包括學(xué)生、證據(jù)、任務(wù)、組合和呈現(xiàn)等五個(gè)模型,也可以理解為測(cè)試設(shè)計(jì)的五個(gè)要素。學(xué)生模型,指測(cè)評(píng)設(shè)計(jì)者希望測(cè)量的知識(shí)、技能和態(tài)度;證據(jù)模型包括證據(jù)規(guī)則和測(cè)量模型,前者指導(dǎo)評(píng)分過程,后者指導(dǎo)對(duì)分?jǐn)?shù)的解讀;任務(wù)模型規(guī)定了學(xué)生的表現(xiàn)形式,比如選擇題、論文寫作等;組合模型是解釋學(xué)生、證據(jù)和任務(wù)三個(gè)要素如何有機(jī)組合形成測(cè)試的;呈現(xiàn)模型主要用來描述任務(wù)的呈現(xiàn)方式,比如紙筆測(cè)試、計(jì)算機(jī)輔助測(cè)試等(Mislevy & Haertel,2006)。圖4呈現(xiàn)了五個(gè)要素之間的相互作用及關(guān)系??梢钥吹?,這一設(shè)計(jì)框架的核心是學(xué)生、證據(jù)和任務(wù),它們之間相互影響,共同組成測(cè)試的主體部分。為了更深入地理解教師素養(yǎng)測(cè)評(píng)工具的特點(diǎn),下文借助證據(jù)中心設(shè)計(jì)框架,從開發(fā)過程、測(cè)評(píng)效度、應(yīng)用程度等方面對(duì)不同種類的測(cè)評(píng)工具進(jìn)行總結(jié)和比較。

        圖4 證據(jù)中心測(cè)試模式的設(shè)計(jì)框架 (Mislevy & Haertel,2006)

        (一)從開發(fā)過程看,建構(gòu)教師數(shù)據(jù)素養(yǎng)能力評(píng)價(jià)體系是關(guān)鍵環(huán)節(jié)

        從證據(jù)中心測(cè)試設(shè)計(jì)框架的視角看,測(cè)評(píng)工具的客觀選擇題、開放問答題、情境分析題都屬于任務(wù)設(shè)計(jì),筆試、訪談、網(wǎng)絡(luò)調(diào)查等是呈現(xiàn)模式規(guī)定的內(nèi)容,它們的形式和內(nèi)容取決于學(xué)生模型和證據(jù)模型,即可測(cè)量的教師數(shù)據(jù)素養(yǎng)包括哪些知識(shí)、能力和態(tài)度以及如何擬定評(píng)分和解釋規(guī)則,這都與教師數(shù)據(jù)素養(yǎng)能力評(píng)價(jià)體系的建構(gòu)有關(guān)。我們可以理解為,建構(gòu)教師數(shù)據(jù)素養(yǎng)能力評(píng)價(jià)體系是測(cè)評(píng)的中心環(huán)節(jié),直接決定測(cè)試的有效性。

        文獻(xiàn)調(diào)研發(fā)現(xiàn),現(xiàn)有的各種測(cè)評(píng)工具沒有遵循統(tǒng)一的教師數(shù)據(jù)素養(yǎng)評(píng)價(jià)指標(biāo)。比如,艾波拉等人編制的知識(shí)測(cè)試以設(shè)定目標(biāo)、收集數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù)、采取教學(xué)行動(dòng)等五個(gè)維度的數(shù)據(jù)能力為基礎(chǔ)(Ebbeler et al.,2017);曼迪那契等人則依托該課題組的教師數(shù)據(jù)素養(yǎng)的能力評(píng)價(jià)體系編制訪談問題(WestEd,2018);韋曼等人(2016)編制的調(diào)查問卷宣稱以教師數(shù)據(jù)使用行為模型為理論基礎(chǔ),但沒有為教師數(shù)據(jù)知識(shí)、技能部分確定評(píng)價(jià)指標(biāo)、解釋規(guī)則。這反映出,學(xué)術(shù)界在教師數(shù)據(jù)素養(yǎng)的概念和能力結(jié)構(gòu)方面還沒有完全達(dá)成共識(shí),各種測(cè)評(píng)工具依據(jù)的學(xué)生模型和證據(jù)模型各不相同,這就導(dǎo)致不同的測(cè)評(píng)結(jié)果很難進(jìn)行比較和對(duì)話。因此,確定教師數(shù)據(jù)素養(yǎng)的能力評(píng)價(jià)體系是開發(fā)測(cè)評(píng)工具的前提和關(guān)鍵環(huán)節(jié),能力評(píng)價(jià)體系的成熟度也影響著測(cè)評(píng)工具和調(diào)查研究的有效性。

        (二)從測(cè)評(píng)效度看,知識(shí)測(cè)試和情境訪談優(yōu)于問卷調(diào)查

        測(cè)評(píng)效度指測(cè)評(píng)工具可測(cè)得教師數(shù)據(jù)素養(yǎng)的程度。證據(jù)中心的測(cè)評(píng)設(shè)計(jì)模式重在收集關(guān)于學(xué)生能力的證據(jù)(表現(xiàn)或作品),借此推斷和評(píng)估學(xué)生能力。從這一角度看,測(cè)評(píng)過程可收集和使用的學(xué)生證據(jù)是否可靠和豐富,直接影響測(cè)評(píng)工具的效度(Mislevy & Haertel,2006)。

        問卷調(diào)查需要被調(diào)查者對(duì)數(shù)據(jù)素養(yǎng)技能或態(tài)度進(jìn)行自我評(píng)價(jià),比如美國韋曼等(2016)開發(fā)的問卷需要教師評(píng)價(jià)自己“利用數(shù)據(jù)診斷學(xué)生學(xué)習(xí)需求”“根據(jù)數(shù)據(jù)調(diào)整教學(xué)”“利用數(shù)據(jù)設(shè)定學(xué)習(xí)目標(biāo)”等的能力。然而,脫離工作情境的自我評(píng)價(jià)很多時(shí)候是模糊的、帶有主觀色彩的,很難觀察或收集到被調(diào)查者的知識(shí)、能力或態(tài)度的證據(jù)。問卷調(diào)查的統(tǒng)計(jì)結(jié)果可以體現(xiàn)教師數(shù)據(jù)使用傾向、能力概況,但很難準(zhǔn)確測(cè)評(píng)教師在真實(shí)工作情境中的數(shù)據(jù)決策能力。

        荷蘭學(xué)者艾波拉開發(fā)的知識(shí)測(cè)試題目都是開放題,且與設(shè)定目標(biāo)、收集數(shù)據(jù)、解釋數(shù)據(jù)、分析數(shù)據(jù)、采取教學(xué)行動(dòng)等數(shù)據(jù)素養(yǎng)的能力維度精準(zhǔn)對(duì)應(yīng),研究者還嘗試設(shè)置簡(jiǎn)單的工作情境,比如讓教師分析某校近三年各學(xué)科不合格率的圖表,借此測(cè)評(píng)教師的數(shù)據(jù)解釋能力(Ebbeler et al.,2017)。教師必須分析、判斷數(shù)據(jù),并以書面回應(yīng)的形式展現(xiàn)自己的數(shù)據(jù)素養(yǎng)。曼迪那契等人開發(fā)的情境訪談工具覆蓋了教師數(shù)據(jù)素養(yǎng)的53項(xiàng)具體技能及5種情感傾向,還列出每種情境所測(cè)評(píng)的具體技能及最佳反應(yīng)范式。與知識(shí)測(cè)試不同,研究者設(shè)置了整體的工作場(chǎng)景,比如在形成性評(píng)估場(chǎng)景中(見表五),研究者設(shè)置了“教師拿到閱讀成績(jī)報(bào)告后如何分析成績(jī)并調(diào)整教學(xué)”的工作場(chǎng)景,在其中嵌入成績(jī)分析、目標(biāo)制定、教學(xué)調(diào)整等問題。教師需要將數(shù)據(jù)使用能力與教學(xué)法、學(xué)科內(nèi)容知識(shí)結(jié)合起來,才能完成這些題目。另外,面對(duì)面訪談也讓研究者觀察到教師的思考過程、技能熟練程度及態(tài)度價(jià)值觀,從而更科學(xué)地測(cè)評(píng)教師的技能水平。綜上所述,知識(shí)測(cè)試和情境訪談能提供被試知識(shí)技能更可靠和豐富的證據(jù),在測(cè)評(píng)效度上優(yōu)于問卷調(diào)查。

        (三)從應(yīng)用程度看,問卷調(diào)查的使用頻次和應(yīng)用范圍占絕對(duì)優(yōu)勢(shì)

        在以往研究中,問卷調(diào)查的使用頻率和范圍都占絕對(duì)優(yōu)勢(shì)。圖5表明,幾乎每個(gè)國家的研究都會(huì)采用問卷調(diào)查,只有特定國家的個(gè)別研究會(huì)應(yīng)用知識(shí)測(cè)試和情境訪談。美國“西部教育”公司開發(fā)的情境訪談工具,目前在學(xué)術(shù)界沒有發(fā)現(xiàn)其應(yīng)用證據(jù),還有待更多的研究驗(yàn)證其信效度(WestEd,2018)。問卷調(diào)查的應(yīng)用程度占優(yōu)勢(shì),原因有二:首先,從研究積累看,已有調(diào)查問卷種類繁多,可以給研究者提供較多的借鑒。研究者沿用或修訂已有問卷工具,能在與前人研究結(jié)果的對(duì)比中進(jìn)行自我評(píng)價(jià)和反思。相對(duì)來說,知識(shí)測(cè)試和情境訪談工具還處于萌芽階段,可供借鑒的成果不多。其次,從任務(wù)設(shè)計(jì)和呈現(xiàn)方面看,問卷調(diào)查基本以選擇題出現(xiàn),且多是單一任務(wù),便于測(cè)評(píng)管理和統(tǒng)計(jì)分析。問卷調(diào)查還可以借助計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),實(shí)施大規(guī)模的數(shù)據(jù)采集。比如,加拿大學(xué)者安德森等(Anderson et al.,2010)為了研究教育者的數(shù)據(jù)使用情況及其影響因素,通過電子郵件對(duì)某地區(qū)4491名教師與280名校長(zhǎng)開展問卷調(diào)查。知識(shí)測(cè)試往往面向特定教師群體,并安排在特定時(shí)間和空間;情境訪談不管采用面對(duì)面,還是語音、視頻的形式,一次只能訪談一位教師或一組教師。這兩種測(cè)評(píng)工具很難完成大樣本的數(shù)據(jù)采集任務(wù)。

        圖5 測(cè)評(píng)工具的國別使用分布

        三種測(cè)評(píng)工具各有千秋,研究者應(yīng)根據(jù)研究需要選擇合適。有研究者將問卷調(diào)查、訪談法和知識(shí)測(cè)試等工具結(jié)合使用,以增強(qiáng)教師數(shù)據(jù)素養(yǎng)調(diào)查的客觀性和可靠性(Bolhuis et al.,2019;Ebbeler et al.,2017)。同時(shí),國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)的研究和實(shí)踐也處在動(dòng)態(tài)發(fā)展中。測(cè)評(píng)工具不是固定不變的,會(huì)隨該領(lǐng)域理論研究的深入而不斷迭代更新。

        五、思考與啟示

        智能時(shí)代的標(biāo)志是人工智能、大數(shù)據(jù)等新興技術(shù)的廣泛應(yīng)用,教育也不例外。隨著各種智能教學(xué)系統(tǒng)和APP進(jìn)入課堂,后臺(tái)生成的海量數(shù)據(jù)如果得到合理的收集、清洗和利用,可以幫助教師開展更精準(zhǔn)和科學(xué)的教育教學(xué)決策。因此,教師數(shù)據(jù)素養(yǎng)話題日益受到國內(nèi)研究者和實(shí)踐者的關(guān)注。中國知網(wǎng)中以“教師數(shù)據(jù)素養(yǎng)”為主題的文獻(xiàn)2016年后迅速增長(zhǎng),然而,截至2019年10月,涉及教師數(shù)據(jù)素養(yǎng)調(diào)研工具的文獻(xiàn)不多,已有研究雖然有涉及調(diào)研工具開發(fā),但其評(píng)價(jià)指標(biāo)的科學(xué)性還有待驗(yàn)證(盧詩華,2018;郝媛玲等,2016;李青等,2018;隆茜,2015)。我國教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)的研究和實(shí)踐尚處起步階段。如前文所言,證據(jù)中心的測(cè)評(píng)設(shè)計(jì)框架可以為我們提供操作藍(lán)圖,其中,學(xué)生模型、證據(jù)模型、任務(wù)模型和呈現(xiàn)模型等構(gòu)成了教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)研究的基本環(huán)節(jié),每個(gè)環(huán)節(jié)的推進(jìn)都是一項(xiàng)系統(tǒng)工程,需要各個(gè)利益相關(guān)者的配合和努力。該框架以及國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)的研究成果可以給我國該領(lǐng)域研究和實(shí)踐提供啟示。下文從評(píng)價(jià)體系建構(gòu)、測(cè)評(píng)任務(wù)設(shè)計(jì)和測(cè)評(píng)實(shí)施等三方面闡釋。

        (一)評(píng)價(jià)體系建構(gòu):要發(fā)揮教師專業(yè)標(biāo)準(zhǔn)和研究課題的助推作用

        評(píng)價(jià)體系的建構(gòu)是測(cè)評(píng)工具開發(fā)的前提和基礎(chǔ),也是證據(jù)中心測(cè)評(píng)設(shè)計(jì)模式的中心環(huán)節(jié),建議國內(nèi)研究從以下兩方面入手,推動(dòng)教師數(shù)據(jù)素養(yǎng)評(píng)價(jià)體系的建構(gòu)。

        首先,將數(shù)據(jù)素養(yǎng)要求納入《教師專業(yè)標(biāo)準(zhǔn)》?!督處煂I(yè)標(biāo)準(zhǔn)》是教師隊(duì)伍建設(shè)的基本依據(jù),具有引領(lǐng)和導(dǎo)向作用。美國利用教師資格認(rèn)證標(biāo)準(zhǔn)促進(jìn)數(shù)據(jù)素養(yǎng)發(fā)展的工作已進(jìn)入實(shí)踐層面(王萍等,2016)。國內(nèi)2012年頒布的中小幼等階段的《教師專業(yè)標(biāo)準(zhǔn)》盡管提到了評(píng)估素養(yǎng)的內(nèi)容,但都沒有明確對(duì)數(shù)據(jù)素養(yǎng)的要求(中華人民共和國教育部,2012)。將教師數(shù)據(jù)素養(yǎng)納入《教師專業(yè)標(biāo)準(zhǔn)》,可以推動(dòng)教師招聘考試、職稱評(píng)定考核對(duì)教師數(shù)據(jù)素養(yǎng)的關(guān)注,引發(fā)教師數(shù)據(jù)素養(yǎng)評(píng)價(jià)指標(biāo)及測(cè)評(píng)工具研究。這一倡議也將研究領(lǐng)域的挑戰(zhàn)推向政策層面,期待借助社會(huì)力量共同建構(gòu)教師數(shù)據(jù)素養(yǎng)的能力結(jié)構(gòu)和評(píng)價(jià)指標(biāo),促進(jìn)教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)設(shè)計(jì)中的“學(xué)生模型”逐漸形成穩(wěn)定的結(jié)構(gòu),盡快在學(xué)術(shù)界達(dá)成共識(shí)。

        其次,發(fā)揮研究課題引領(lǐng)作用。目前國內(nèi)已有學(xué)者嘗試建構(gòu)本土教師數(shù)據(jù)素養(yǎng)能力結(jié)構(gòu)及評(píng)價(jià)指標(biāo)(李青,趙歡歡,2018;劉雅馨等,2018;阮士桂,鄭燕林,2016),但這些評(píng)價(jià)指標(biāo)體系的建構(gòu)基本上依賴于個(gè)別學(xué)者的思考和推斷,能否囊括教師在真實(shí)教學(xué)場(chǎng)景中所需要的數(shù)據(jù)知識(shí)、技能乃至情感態(tài)度有待驗(yàn)證,因此很難被學(xué)術(shù)界廣泛認(rèn)可并應(yīng)用于實(shí)踐。國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)研究往往依托國家和區(qū)域?qū)用娴闹匾n題,因此研究的系統(tǒng)性和權(quán)威性得到保證。我們建議,相關(guān)科研管理部門應(yīng)啟動(dòng)教師數(shù)據(jù)素養(yǎng)重大課題研究,鼓勵(lì)更多的科研單位和研究者投入該領(lǐng)域的研究工作。我們可以借鑒美國曼迪納契課題組建構(gòu)教師數(shù)據(jù)素養(yǎng)能力評(píng)價(jià)體系的過程,組織國內(nèi)數(shù)據(jù)素養(yǎng)與教學(xué)評(píng)價(jià)專家協(xié)作研討,在回顧已有文獻(xiàn)、國家政策文件、標(biāo)準(zhǔn)中對(duì)教師數(shù)據(jù)素養(yǎng)的能力描述或要求的基礎(chǔ)上,擬定能力指標(biāo),最后邀請(qǐng)一線教育者審閱修訂(Mandinach & Gummer,2016a)。這樣的建構(gòu)過程將超越個(gè)體思維,吸納集體智慧,更容易在業(yè)內(nèi)達(dá)成共識(shí),得到認(rèn)可。

        (二)測(cè)評(píng)任務(wù)設(shè)計(jì):要強(qiáng)調(diào)任務(wù)的真實(shí)性和多樣性

        證據(jù)中心的測(cè)試設(shè)計(jì)理論認(rèn)為,任務(wù)設(shè)計(jì)應(yīng)“引發(fā)能形成各種證據(jù)的學(xué)生行為”(Mislevy & Haertel,2006;Mislevy et al.,2003)。從國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具發(fā)展歷程看,任務(wù)設(shè)計(jì)經(jīng)歷了從良構(gòu)到劣構(gòu)、從單一任務(wù)到綜合任務(wù)的演進(jìn)過程,并越來越強(qiáng)調(diào)任務(wù)的真實(shí)性。我國在測(cè)評(píng)任務(wù)設(shè)計(jì)方面可以得到兩點(diǎn)啟發(fā)。

        首先,關(guān)注真實(shí)性任務(wù)的設(shè)計(jì)。教師數(shù)據(jù)素養(yǎng)是在真實(shí)的教育實(shí)踐中形成、發(fā)展起來的,因此只有在真實(shí)的任務(wù)中,教師才能呈現(xiàn)出自己的數(shù)據(jù)知識(shí)、技能和態(tài)度。舉個(gè)反例,杜恩的知識(shí)測(cè)試要考查“測(cè)驗(yàn)效度”概念,讓教師從四個(gè)選項(xiàng)中選擇最符合的一項(xiàng)(見表二)。這道題缺少具體情境,不能算真實(shí)的任務(wù),只能測(cè)得教師的識(shí)記或理解力,離真實(shí)情境中的技能還有距離。真實(shí)性任務(wù)的設(shè)計(jì)可以采用兩種形式:一,從真實(shí)的生活中提取情境和任務(wù),對(duì)測(cè)試進(jìn)行仿真情境創(chuàng)設(shè)和任務(wù)設(shè)計(jì);二,讓教師或教師團(tuán)隊(duì)在真實(shí)情境中完成相關(guān)任務(wù),解決真實(shí)問題。這兩種設(shè)計(jì)形式都要求研究人員走出象牙塔,在對(duì)學(xué)校教育的觀察、與教師的交流及共同生活中去提取、設(shè)計(jì)和更新測(cè)評(píng)的真實(shí)性任務(wù)。

        其次,注重測(cè)評(píng)任務(wù)的多樣性。單一任務(wù)的測(cè)評(píng)很難有效測(cè)評(píng)教師數(shù)據(jù)素養(yǎng),未來研究可以采用選擇題、問答、綜合情境任務(wù)等多樣化測(cè)評(píng)任務(wù),以適應(yīng)不同環(huán)境和群體的教師數(shù)據(jù)素養(yǎng)測(cè)評(píng),或者對(duì)不同的數(shù)據(jù)源進(jìn)行互相驗(yàn)證。值得注意的是,我們也可以設(shè)置計(jì)算機(jī)支持的復(fù)雜性協(xié)作任務(wù),以便對(duì)教師數(shù)據(jù)素養(yǎng)提供綜合性評(píng)估。另外,在借鑒國外評(píng)測(cè)研究成果時(shí),要考慮我國教師數(shù)據(jù)使用的工作情境、可用數(shù)據(jù)庫、可獲得的數(shù)據(jù)類型等,進(jìn)而研發(fā)具有本土適應(yīng)性的多元化測(cè)評(píng)工具。

        (三)測(cè)評(píng)實(shí)施:要尋求測(cè)評(píng)對(duì)象、測(cè)評(píng)目的和測(cè)評(píng)工具的最佳匹配

        在教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工作中,測(cè)評(píng)實(shí)施是聯(lián)系理論和實(shí)踐的重要一環(huán),涉及任務(wù)呈現(xiàn)、測(cè)評(píng)管理等內(nèi)容,我們要努力尋求測(cè)評(píng)對(duì)象、測(cè)評(píng)目的和測(cè)評(píng)工具的最佳匹配,實(shí)現(xiàn)測(cè)評(píng)效果和效率的最大化。

        首先,針對(duì)不同的測(cè)評(píng)對(duì)象和目的,我們要選擇最匹配的測(cè)評(píng)工具。調(diào)查問卷、知識(shí)測(cè)試、情境訪談等測(cè)評(píng)形式各有特點(diǎn),評(píng)估者需要根據(jù)人力、物力等客觀條件及測(cè)評(píng)目的靈活選用。比如,在師范教育中,與數(shù)據(jù)素養(yǎng)相關(guān)的課程考核更適合使用知識(shí)測(cè)試的形式;如果要了解教師工作坊成員的數(shù)據(jù)素養(yǎng)狀況,可以采用情境訪談式測(cè)評(píng)。如果要調(diào)研多個(gè)地區(qū)若干所學(xué)校的教師數(shù)據(jù)素養(yǎng)狀況,問卷調(diào)查比較合適。當(dāng)然,在多數(shù)情形下,不同種類的測(cè)評(píng)任務(wù)也可以綜合運(yùn)用,不僅增加測(cè)評(píng)結(jié)果的可靠性,還可以從不同角度了解教師數(shù)據(jù)使用的知識(shí)、技能、態(tài)度、情感傾向等。測(cè)評(píng)工具的選擇取決于測(cè)評(píng)目的、課題計(jì)劃等,需要我們慎重決定。

        其次,測(cè)評(píng)實(shí)施者也需要接受專業(yè)培訓(xùn)。教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)實(shí)施的某些環(huán)節(jié)需要較高的專業(yè)素養(yǎng),比如知識(shí)測(cè)試的評(píng)分、開展情境訪談等。如果測(cè)評(píng)實(shí)施者不是課題組成員或相關(guān)專家,那么測(cè)試員最好接受專業(yè)訓(xùn)練,以保證調(diào)研結(jié)果的可靠性。為了促進(jìn)測(cè)評(píng)工具從實(shí)驗(yàn)室向?qū)嵺`推廣,我們建議,相關(guān)部門在完成測(cè)評(píng)工具的研發(fā)和信效度驗(yàn)證后,還要以工作坊或在線課程的形式培訓(xùn)一批測(cè)評(píng)管理員,以便測(cè)評(píng)工具和結(jié)果得到科學(xué)的應(yīng)用及分析。

        最后,教師數(shù)據(jù)素養(yǎng)的測(cè)評(píng)應(yīng)與教師專業(yè)發(fā)展緊密結(jié)合。國外教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具的開發(fā)大多是教師素養(yǎng)培養(yǎng)項(xiàng)目的一部分,其目的往往是驗(yàn)證教師數(shù)據(jù)素養(yǎng)培養(yǎng)項(xiàng)目的有效性(Ebbeler et al.,2016;Ebbeler et al.,2017;McNaughton et al.,2012),有的情境訪談工具本身就可以作為教師專業(yè)培訓(xùn)的資源加以使用(Means et al.,2011;WestEd,2018)。我國的教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)研究與實(shí)踐也不應(yīng)是終極目的,其測(cè)評(píng)結(jié)果應(yīng)服務(wù)于教師數(shù)據(jù)素養(yǎng)教育方案和培訓(xùn)課程開發(fā),是達(dá)成教師數(shù)據(jù)素養(yǎng)提升的必要手段。

        21世紀(jì)的教學(xué)挑戰(zhàn)之一就是不斷變化的數(shù)據(jù)環(huán)境。作為數(shù)據(jù)決策的重要實(shí)施者,教師的數(shù)據(jù)素養(yǎng)測(cè)評(píng)與培養(yǎng)工作迫在眉睫(Dunlap & Piro,2016)。學(xué)校的海量教育數(shù)據(jù)只有得到有效的處理和分析才能發(fā)揮其獨(dú)特的教育價(jià)值,促進(jìn)科學(xué)決策的形成。教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)應(yīng)積極借鑒國外研究成果,立足本國國情,選擇適合自己的研究和實(shí)踐道路,才能研發(fā)出具有本土特色的教師數(shù)據(jù)素養(yǎng)測(cè)評(píng)工具,探索符合教師成長(zhǎng)規(guī)律的培養(yǎng)路徑,讓本領(lǐng)域的理論研究和實(shí)踐探索真正地服務(wù)于教和學(xué),促進(jìn)師生共同成長(zhǎng)。

        猜你喜歡
        工具技能測(cè)試
        高級(jí)技能
        波比的工具
        幽默大測(cè)試
        幽默大師(2020年11期)2020-11-26 06:12:12
        波比的工具
        “攝問”測(cè)試
        “攝問”測(cè)試
        “攝問”測(cè)試
        秣馬厲兵強(qiáng)技能
        中國公路(2017年19期)2018-01-23 03:06:33
        “巧用”工具
        讀者(2017年18期)2017-08-29 21:22:03
        拼技能,享豐收
        国产高清精品一区二区| 无码不卡免费一级毛片视频 | 国产成人无码一二三区视频| 亚洲国产字幕| 亚洲国产日韩一区二区三区四区| 亚洲一区二区三区尿失禁| 午夜亚洲av永久无码精品| 国产精品亚洲片夜色在线| av是男人的天堂免费| 国产精品视频亚洲二区| 国产乱子伦视频一区二区三区| 饥渴少妇一区二区三区| 日韩精品亚洲一区二区| 熟妇丰满多毛的大隂户| 人妻丰满熟妇AV无码片| 日本熟妇裸体视频在线| 少妇性l交大片7724com| 五月天激情婷婷婷久久| 探花国产精品三级在线播放| 国产三区三区三区看三区| 又爽又黄又无遮挡网站| 日本黄页网站免费大全| 久青青草视频手机在线免费观看| 五月婷婷六月丁香久久综合| 国产又a又黄又潮娇喘视频| 国产精选免在线观看| 蜜桃av福利精品小视频| www国产亚洲精品| 日本大尺度吃奶呻吟视频| 无码高潮久久一级一级喷水| 亚洲综合视频一区二区| 国模无码一区二区三区| 国产精品亚洲欧美天海翼| 夜鲁很鲁在线视频| 国产99久久无码精品| 国产精品黑丝美女av| 刺激一区仑乱| 婷婷开心深爱五月天播播| 免费美女黄网站久久久| 亚洲中文久久精品字幕| 国产97在线 | 免费|