亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價機(jī)制與方法

        2021-02-26 01:51:21黃濤趙媛耿晶王涵張浩楊華利
        關(guān)鍵詞:評價方法

        黃濤 趙媛 耿晶 王涵 張浩 楊華利

        摘要:綜合素質(zhì)評價是深化教育改革、落實立德樹人根本任務(wù)的必然要求。信息技術(shù)賦能教育教學(xué)過程,使得傳統(tǒng)教育評價機(jī)制向數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價方向邁進(jìn)。數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價是一種不斷獲取、整合、分析學(xué)習(xí)過程中的多模態(tài)數(shù)據(jù),對教學(xué)和學(xué)習(xí)活動的信息流與運(yùn)行軌跡作出觀測、解釋和反饋,以發(fā)現(xiàn)教育中存在的問題,輔助課堂教學(xué)干預(yù)的評價方法,包含多場景數(shù)據(jù)采集、多空間數(shù)據(jù)融合、精準(zhǔn)分析模型構(gòu)建、分析結(jié)果可視化四個關(guān)鍵組成部分。多場景數(shù)據(jù)采集為學(xué)習(xí)評價提供數(shù)據(jù)來源和量化手段支撐,多空間數(shù)據(jù)融合為學(xué)習(xí)評價提供統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),精準(zhǔn)分析模型為學(xué)習(xí)評價提供數(shù)據(jù)驅(qū)動的學(xué)習(xí)分析與評價方法,分析結(jié)果可視化為學(xué)習(xí)評價提供反饋和應(yīng)用服務(wù)。數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價框架,應(yīng)以區(qū)塊鏈技術(shù)為基礎(chǔ),融合人工智能、云計算、學(xué)習(xí)分析、情境感知等新興技術(shù),在多維時空尺度上全面采集學(xué)習(xí)過程中的多元海量數(shù)據(jù),通過全面、系統(tǒng)的統(tǒng)計分析和數(shù)據(jù)挖掘,從學(xué)習(xí)者的內(nèi)在動機(jī)到認(rèn)知發(fā)展、情感表現(xiàn),再到社會綜合交互能力,多維度、及時、準(zhǔn)確地評估學(xué)生的學(xué)習(xí)狀況。當(dāng)前,探索數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價,可從構(gòu)建符合多空間數(shù)據(jù)特征的綜合素質(zhì)評價框架,完善過程性數(shù)據(jù)的采集與共享機(jī)制,突破情感、認(rèn)知、動機(jī)與社交評價的關(guān)鍵技術(shù),以及研制數(shù)據(jù)驅(qū)動的學(xué)習(xí)評價平臺等方面入手。

        關(guān)鍵詞:數(shù)據(jù)驅(qū)動;精準(zhǔn)化;學(xué)習(xí)評價;評價機(jī)制;評價方法

        中圖分類號:G434? ?文獻(xiàn)標(biāo)識碼:A? ? 文章編號:1009-5195(2021)01-0003-10? doi10.3969/j.issn.1009-5195.2021.01.001

        基金項目:國家自然科學(xué)基金面上項目“面向時空融合的學(xué)習(xí)者認(rèn)知診斷理論及關(guān)鍵技術(shù)研究”(619770332);中國科學(xué)院院士咨詢項目“我國科學(xué)教育發(fā)展戰(zhàn)略研究”(2018-Z10-A-025)。

        作者簡介:黃濤,博士,教授,博士生導(dǎo)師,華中師范大學(xué)人工智能教育學(xué)部、教育大數(shù)據(jù)應(yīng)用技術(shù)國家工程實驗室(湖北武漢 430079)。趙媛,博士研究生,華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心(湖北武漢 430079);講師,九江學(xué)院(江西九江 332005)。耿晶(通訊作者),博士研究生,華中師范大學(xué)教育大數(shù)據(jù)應(yīng)用技術(shù)國家工程實驗室(湖北武漢 430079)。王涵,博士研究生,華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心(湖北武漢 430079)。張浩,博士,副教授,碩士生導(dǎo)師,華中師范大學(xué)教育大數(shù)據(jù)應(yīng)用技術(shù)國家工程實驗室(湖北武漢 430079)。楊華利,博士研究生,華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心(湖北武漢 430079)。

        2019年7月,中共中央、國務(wù)院印發(fā)《關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見》,提出要 “構(gòu)建以發(fā)展素質(zhì)教育為導(dǎo)向的科學(xué)評價體系,強(qiáng)化過程性和發(fā)展性評價”(新華網(wǎng),2019)。2020年10月,中共中央、國務(wù)院發(fā)布《深化新時代教育評價改革總體方案》,將“改革學(xué)生評價,促進(jìn)德智體美勞全面發(fā)展”列為重點(diǎn)內(nèi)容,提出“促進(jìn)學(xué)生全面發(fā)展的評價辦法更加多元”的改革目標(biāo)(新華網(wǎng),2020)。構(gòu)建多元、全過程、全要素的學(xué)生綜合評價,需要改革傳統(tǒng)的以紙筆測試為主的學(xué)業(yè)評價,充分利用信息技術(shù),探究以多種教學(xué)場景為背景,基于學(xué)生學(xué)習(xí)行為、認(rèn)知建構(gòu)、情感體驗、思維變化、學(xué)業(yè)表現(xiàn)等多模態(tài)數(shù)據(jù),實現(xiàn)教學(xué)相長的精準(zhǔn)化學(xué)習(xí)評價方式。

        一、信息時代的學(xué)習(xí)評價現(xiàn)狀

        學(xué)習(xí)評價經(jīng)歷測量、描述、價值判斷時代,逐步向意義建構(gòu)發(fā)展。傳統(tǒng)以紙筆測試為主的學(xué)業(yè)評價,往往側(cè)重測試學(xué)生認(rèn)知方面的知識記憶與理解程度,對學(xué)生高階認(rèn)知能力如創(chuàng)造力的重視不夠,效果也不佳(田愛麗,2020)。對非認(rèn)知能力如學(xué)生的盡責(zé)表現(xiàn)、情緒調(diào)節(jié)、合作能力、思想開放、社會交往等(OECD,2019)的發(fā)展情況,傳統(tǒng)的紙筆測試更是顯得無能為力。而且囿于數(shù)據(jù)和技術(shù)的雙重缺失,傳統(tǒng)學(xué)習(xí)評價與反饋結(jié)果呈現(xiàn)出模糊性和延時性等特征,這制約了其價值實現(xiàn)。隨著信息技術(shù)與教育的深度融合,學(xué)習(xí)環(huán)境、學(xué)習(xí)內(nèi)容、學(xué)習(xí)交互方式發(fā)生翻天覆地的變化,學(xué)習(xí)評價也隨之發(fā)生變化。依據(jù)教學(xué)評價場景的不同,本文從大規(guī)模學(xué)習(xí)評價、課堂學(xué)習(xí)評價和在線學(xué)習(xí)評價三個方面,對信息時代學(xué)習(xí)評價的規(guī)模化、過程化和精準(zhǔn)化等特征進(jìn)行闡述。

        1.大規(guī)模學(xué)習(xí)評價

        大規(guī)模學(xué)習(xí)評價(Large-Scale Assessment)是一種通過對特定數(shù)量學(xué)生群體的整體成就水平和教育相關(guān)性因素進(jìn)行價值判斷,來監(jiān)測學(xué)生學(xué)習(xí)效果和判斷教育政策績效的評價方式(郭元祥等,2014)。與傳統(tǒng)教育評價使用經(jīng)典測量理論模型對學(xué)習(xí)者個體進(jìn)行比較和評估不同,大規(guī)模學(xué)習(xí)評價更注重對不同學(xué)習(xí)者群體的能力評價。

        國外大規(guī)模學(xué)習(xí)評價中最有影響力的當(dāng)屬國際教育成就評價協(xié)會發(fā)起的國際數(shù)學(xué)教育比較研究項目(The Trends in International Mathematics and Science Study,TIMSS)與聯(lián)合國經(jīng)濟(jì)合作與發(fā)展組織發(fā)起的國際學(xué)生評估項目(Program for International Student Assessment,PISA)。 TIMSS測評從1995年開始以4年為一個周期,通過測試和問卷,測量不同國家學(xué)生數(shù)學(xué)和科學(xué)學(xué)習(xí)狀況,以此了解各國課程目標(biāo)的實現(xiàn)程度。其最初的目標(biāo)分析框架由課程內(nèi)容、表現(xiàn)期望和觀點(diǎn)三個方面構(gòu)成,其中觀點(diǎn)涉及學(xué)生的態(tài)度、興趣等;自2003年開始,知識和認(rèn)知維度成為其測評的主要維度(Mullis et al., 2014)。PISA測評自2000年起每3年為一個周期,測評不同國家15歲在校生的科學(xué)、數(shù)學(xué)、閱讀等核心素養(yǎng)及相關(guān)影響因素,以科學(xué)反映學(xué)生參與未來社會生活的能力,是對基礎(chǔ)教育進(jìn)行跨國家(地區(qū))、跨文化的評價,為教育教學(xué)改進(jìn)提供有效證據(jù)。其測評框架由情景、能力、知識、態(tài)度四個指標(biāo)構(gòu)成,重點(diǎn)評估學(xué)生在知識掌握與運(yùn)用、認(rèn)知與思維發(fā)展、價值觀念與個人能力等方面的發(fā)展?fàn)顩r,同時研究影響學(xué)生學(xué)業(yè)成就的因素(OECD, 2014)。

        我國近年來也非常重視對學(xué)生的大規(guī)模學(xué)習(xí)評價。2007年,我國連續(xù)8年開展了義務(wù)教育階段6個學(xué)科領(lǐng)域的試點(diǎn)測試,其中5次為全國范圍的大規(guī)模測試,檢測樣本包括全國31個?。ㄖ陛犑?自治區(qū))和新疆生產(chǎn)建設(shè)兵團(tuán),695個樣本縣(市/區(qū))的46萬余名學(xué)生、11萬余名教師和校長。監(jiān)測結(jié)果除了呈現(xiàn)全國學(xué)生相關(guān)學(xué)科領(lǐng)域的總體表現(xiàn)、測查學(xué)生綜合運(yùn)用知識能力和解決問題能力外,還關(guān)注學(xué)生的綜合素質(zhì)和健康成長,對學(xué)生的情感態(tài)度、課業(yè)負(fù)擔(dān)、學(xué)校間和區(qū)域間的均衡狀況進(jìn)行調(diào)查,體現(xiàn)了促進(jìn)學(xué)生全面發(fā)展的素質(zhì)教育理念(中國政府網(wǎng),2015)。2015年4月,國務(wù)院教育督導(dǎo)委員會辦公室印發(fā)《國家義務(wù)教育質(zhì)量監(jiān)測方案》,依據(jù)我國義務(wù)教育課程設(shè)置的基本要求,以義務(wù)教育階段四年級和八年級學(xué)生為監(jiān)測對象,利用紙筆測試工具(學(xué)科測試卷和調(diào)查問卷)和現(xiàn)場測試工具(現(xiàn)場演示和項目參與),監(jiān)測義務(wù)教育階段學(xué)生語文、數(shù)學(xué)、科學(xué)、體育、藝術(shù)、德育等學(xué)科學(xué)業(yè)質(zhì)量、身心健康及變化情況,深入分析影響義務(wù)教育質(zhì)量的主要原因(柴葳等,2015)。

        2.課堂學(xué)習(xí)評價

        學(xué)習(xí)評價最重要的目的不是為了證明,而是為了“改進(jìn)”(Stufflebeam,1998)。課堂學(xué)習(xí)評價的最終目的是改進(jìn)教學(xué)和促進(jìn)學(xué)生學(xué)習(xí)。傳統(tǒng)的課堂學(xué)習(xí)評價是在教師個人經(jīng)驗的基礎(chǔ)上,對學(xué)生課堂學(xué)習(xí)情況做出的主觀判斷。這種基于個人經(jīng)驗的分析,結(jié)果難免受觀察人的主觀意識的影響。Yamtim等(2014)通過研究發(fā)現(xiàn),課堂學(xué)習(xí)評價的現(xiàn)狀并不樂觀,課堂學(xué)習(xí)評價受到各種因素的限制,其可操作性差。一些研究者提出了操作性改進(jìn)策略,如日本學(xué)者提出在教學(xué)中實踐“一頁紙檔案袋評價”(田中耕治等,2012),即鼓勵學(xué)生將學(xué)習(xí)經(jīng)歷記錄在一頁紙上,借此讓學(xué)生了解個人的學(xué)習(xí)歷程,同時也讓教師可以給予適當(dāng)?shù)闹笇?dǎo)來幫助學(xué)生改進(jìn)。荷蘭的研究者和教師通過緊密合作,共同開發(fā)了課堂形成性評價模型(Classroom Formative Assessment,CFA),用于幫助教師判斷學(xué)生是否達(dá)到學(xué)習(xí)目標(biāo)并提供及時的反饋(Van den Berg et al., 2016)。還有一些學(xué)者旨在開發(fā)評價工具來優(yōu)化課堂評價過程。如瑞士學(xué)者Smit等(2017)開發(fā)了一款叫Rubies的工具,該工具能夠記錄課堂師生的互動信息,智能分析與診斷學(xué)生的技能狀態(tài)和能力水平,以此來提升教師對學(xué)生學(xué)習(xí)的感知和診斷能力,同時完善學(xué)生自我評價和課堂形成性評價。

        隨著人工智能等新技術(shù)在課堂教學(xué)中的廣泛應(yīng)用,學(xué)習(xí)行為數(shù)據(jù)呈現(xiàn)出全時段、全方位、多模態(tài)的特征,基于過程性數(shù)據(jù)的學(xué)習(xí)評價引起了廣泛關(guān)注,越來越多的研究開始關(guān)注學(xué)習(xí)情緒、學(xué)習(xí)態(tài)度、學(xué)習(xí)習(xí)慣等多元特征(Fredricks et al.,2004)。一些研究者提出通過對視頻中學(xué)生面部、眼部等特征進(jìn)行分析,以此來判斷學(xué)生學(xué)習(xí)專注程度,進(jìn)而評估課堂學(xué)習(xí)效果。如Whitehill等(2014)根據(jù)面部表情,進(jìn)行學(xué)生專注度的自動識別;Psaltis等(2017)提出從頭部運(yùn)動、眼睛運(yùn)動模式中獲取線索,推斷電子學(xué)習(xí)環(huán)境中的學(xué)生學(xué)習(xí)專注度;Kamath等(2016)使用開源工具庫 OpenFace和 OpenPose提取包括眼睛注視、頭部姿勢和身體姿勢在內(nèi)的多模態(tài)特征,進(jìn)行學(xué)生專注度預(yù)測。還有一些學(xué)者關(guān)注學(xué)生學(xué)習(xí)情緒與成績的關(guān)系,如有研究發(fā)現(xiàn)學(xué)業(yè)情緒與學(xué)生的認(rèn)知和行為密切相關(guān),是影響智力投入、行為持久性以及學(xué)習(xí)成績的重要因素(藥文靜等,2020)。Hsieh等(2019)探討了在任務(wù)轉(zhuǎn)換范式下不同情緒如何調(diào)節(jié)認(rèn)知靈活性的問題,發(fā)現(xiàn)積極情緒并不能調(diào)節(jié)短期或長期認(rèn)知的靈活性,而消極情緒有助于認(rèn)知的瞬間轉(zhuǎn)換,并導(dǎo)致較小的轉(zhuǎn)換成本。劉君玲等(2019)強(qiáng)調(diào)了學(xué)業(yè)情緒在在線協(xié)作問題解決中的重要性,并從環(huán)境、活動設(shè)計、學(xué)習(xí)者等方面提出了提高學(xué)生協(xié)作問題解決能力的策略。Eilam(2019)為檢驗情緒氛圍在課堂中的作用和功能提出了新的分析框架。Ashwin等(2020)通過識別學(xué)生的面部表情、手勢和身體姿勢來分析教室中學(xué)生的情感狀態(tài)。Deniz等(2019)開發(fā)了可以通過學(xué)生的面部表情監(jiān)測學(xué)生情緒,并進(jìn)行情緒預(yù)警的工具。

        3.在線學(xué)習(xí)評價

        信息時代,在線學(xué)習(xí)已成為人們學(xué)習(xí)的重要方式。關(guān)于在線學(xué)習(xí)評價,國內(nèi)外也已展開廣泛的研究。虛擬現(xiàn)實技術(shù)(Johnson-Glenberg,2019)、腦波監(jiān)測(Liu et al.,2016)和眼動(Lambert et al.,2007)等智能感知技術(shù)為多模態(tài)數(shù)據(jù)的采集提供了可能。伴隨深度學(xué)習(xí)等人工智能技術(shù)快速發(fā)展,基于多模態(tài)數(shù)據(jù)的統(tǒng)一表征來開展精準(zhǔn)化學(xué)習(xí)評價已成為在線學(xué)習(xí)評價的一大趨勢。當(dāng)前在線學(xué)習(xí)評價的內(nèi)容,主要包含以下幾方面:

        學(xué)習(xí)者認(rèn)知診斷。隨著心理測量學(xué)和認(rèn)知心理學(xué)的進(jìn)一步發(fā)展和現(xiàn)代教育技術(shù)水平的不斷進(jìn)步,診斷測試的價值和意義不再僅僅是提供分?jǐn)?shù),而是對學(xué)習(xí)者認(rèn)知結(jié)構(gòu)的測量與評估。基于傳統(tǒng)概率圖模型的認(rèn)知診斷技術(shù),可以對學(xué)生知識結(jié)構(gòu)進(jìn)行深入分析。如美國教育巨頭McGraw Hill基于人工智能技術(shù)開發(fā)的學(xué)習(xí)評估系統(tǒng)(Assessment and Learning in Knowledge Spaces,ALEKS)。該系統(tǒng)基于知識空間理論,使用人工智能引擎為每位學(xué)生繪制個人知識圖譜,以此來幫助學(xué)習(xí)者開展適應(yīng)性學(xué)習(xí)(Canfield, 2001)。而基于深度學(xué)習(xí)方法的知識跟蹤技術(shù),還可以獲取學(xué)生的知識掌握動態(tài),從而分析其學(xué)業(yè)發(fā)展情況。

        情感態(tài)度分析。學(xué)習(xí)者的認(rèn)知加工過程是非常復(fù)雜的,存在諸多顯性與隱性的相關(guān)因素,已有的認(rèn)知診斷只能診斷顯性認(rèn)知屬性(認(rèn)知行為),即學(xué)習(xí)者對知識、技能的掌握情況;而對于隱性的相關(guān)因素,如心理、情感等,并未加以考慮。然而這些隱性因素也是影響診斷結(jié)果的重要因素,忽略了這些因素就容易造成診斷模型和真實認(rèn)知加工過程之間的不匹配,從而導(dǎo)致結(jié)論片面化、經(jīng)驗化。傳統(tǒng)教育情境下對學(xué)習(xí)者情感態(tài)度的分析,通常是通過問卷、對話、觀察等方式進(jìn)行,教師難以有效獲得學(xué)生的真實情緒狀態(tài)。計算機(jī)視覺技術(shù)的發(fā)展,使得課堂學(xué)習(xí)者的情緒監(jiān)測成為可能。孟菲斯大學(xué)研發(fā)的AutoTutor智能助手系統(tǒng),能夠感知學(xué)習(xí)者的情感和注意狀態(tài)變化(Craig et al., 2013),并根據(jù)這些變化對學(xué)習(xí)者展開情感和注意力評價,進(jìn)而調(diào)整對學(xué)習(xí)者學(xué)習(xí)的輔導(dǎo)。

        數(shù)據(jù)驅(qū)動的學(xué)習(xí)預(yù)測。利用學(xué)生數(shù)據(jù)來預(yù)測學(xué)生學(xué)習(xí)行為和成績已成為近年來教育領(lǐng)域的一個重要層面(Lodge et al.,2017)。大數(shù)據(jù)技術(shù)可以幫助教師、學(xué)生和其他利益相關(guān)者洞察學(xué)習(xí)過程(Jacqueleen,2015)。如賓夕法尼亞州立大學(xué)基于2005-2016年850萬條學(xué)生數(shù)據(jù)的分析,構(gòu)建了數(shù)據(jù)驅(qū)動的高校學(xué)生學(xué)業(yè)表現(xiàn)預(yù)測模型,通過綜合評估,識別可能面臨風(fēng)險的學(xué)生,幫助學(xué)校管理部門提前制定干預(yù)策略(陳新亞等,2020)。

        綜上所述,在信息技術(shù)的支持下,學(xué)習(xí)評價的規(guī)?;⑦^程化、精準(zhǔn)化等都已取得較大進(jìn)步,但是也還面臨一些問題。如在大規(guī)模學(xué)習(xí)評價方面,由于評價對象數(shù)量大、覆蓋范圍廣,使得數(shù)據(jù)的采集與分析呈現(xiàn)一定的難度。而且,大規(guī)模學(xué)習(xí)評價多以學(xué)習(xí)者的知識技能、課業(yè)負(fù)擔(dān)等顯性內(nèi)容為主,對學(xué)習(xí)者的綜合素養(yǎng)以及學(xué)習(xí)能力的評價稍顯不足。又如在課堂學(xué)習(xí)評價方面,雖然信息技術(shù)嵌入課堂,使得學(xué)習(xí)評價從單一的結(jié)果性評價向關(guān)注過程性評價轉(zhuǎn)變,但還存在非認(rèn)知行為判斷標(biāo)準(zhǔn)缺失、學(xué)習(xí)分析手段和工具還有待進(jìn)一步多樣化等問題。而在在線學(xué)習(xí)評價方面,雖然深度學(xué)習(xí)等人工智能方法在學(xué)習(xí)評價中得到應(yīng)用,但其評價結(jié)果的解釋性問題還需與多元評價方法相結(jié)合。

        二、數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價機(jī)制

        數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價是對多空間、多場景、多時段、多過程的數(shù)據(jù)進(jìn)行記錄、采集、加工、處理,使得數(shù)據(jù)在平臺間流轉(zhuǎn)累加,實現(xiàn)“1+1>2”的能效的一種評價方法。它由多場景數(shù)據(jù)采集、多空間數(shù)據(jù)融合、精準(zhǔn)分析模型構(gòu)建、分析結(jié)果可視化等要素組成。多場景數(shù)據(jù)采集為學(xué)習(xí)評價提供數(shù)據(jù)來源和量化手段支撐,多空間數(shù)據(jù)融合為學(xué)習(xí)評價提供統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),精準(zhǔn)分析模型為學(xué)習(xí)評價提供數(shù)據(jù)驅(qū)動的學(xué)習(xí)分析與評價方法,分析結(jié)果可視化表達(dá)為學(xué)習(xí)評價提供反饋和應(yīng)用服務(wù)(如圖1所示)。

        1.多場景數(shù)據(jù)采集

        學(xué)習(xí)空間是開展學(xué)習(xí)活動的基礎(chǔ)環(huán)境,也是教育數(shù)據(jù)產(chǎn)生、應(yīng)用與迭代流轉(zhuǎn)的重要場所。由于信息技術(shù)的介入,學(xué)習(xí)空間從傳統(tǒng)單一的教室實體學(xué)習(xí)空間向物理空間和網(wǎng)絡(luò)空間高度融合的融合式學(xué)習(xí)空間變遷。學(xué)習(xí)者無論在何種學(xué)習(xí)空間開展學(xué)習(xí)活動,都會產(chǎn)生相應(yīng)的教育場景數(shù)據(jù)(McAfee et al.,2012)。相較于單維學(xué)習(xí)空間,融合式學(xué)習(xí)空間場景較為多元,不僅包括圖書館、教室、閱覽室等物理環(huán)境,同時也包括角色分配的社會環(huán)境以及思維意識介入的認(rèn)知情境(楊現(xiàn)民等,2020)。由于傳統(tǒng)教學(xué)場景如學(xué)校、圖書館的數(shù)字化與智能化水平相對滯后,教學(xué)場景中的學(xué)習(xí)數(shù)據(jù)采集,主要依賴于人工觀察和用戶自報告等手段,采集到的數(shù)據(jù)往往不夠全面,且具有一定的主觀性(劉智等,2019)。隨著可穿戴技術(shù)、物聯(lián)網(wǎng)與人工智能技術(shù)的興起,傳統(tǒng)教學(xué)場景中的多元化數(shù)據(jù)得以采集。研究者可以利用數(shù)據(jù)感知技術(shù)、一卡通、視頻監(jiān)控、智能移動終端、穿戴設(shè)備、二維碼、無線網(wǎng)網(wǎng)絡(luò)設(shè)施等,隨時感知與測量學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù)、生理數(shù)據(jù)、行為數(shù)據(jù)、管理數(shù)據(jù)等并對其進(jìn)行記錄和存儲。

        2.多空間數(shù)據(jù)融合

        在評價中,已獲取的教育數(shù)據(jù)并非在同一時刻被分析處理,而是依據(jù)評價目標(biāo)、評價對象,選擇不同場景、不同時間節(jié)點(diǎn)、不同頻次、不同時長、不同維度的數(shù)據(jù)進(jìn)行綜合分析,因此數(shù)據(jù)的采集可能會出現(xiàn)數(shù)據(jù)不統(tǒng)一、噪聲干擾、數(shù)值缺失等問題。為了將獲取的數(shù)據(jù)轉(zhuǎn)變?yōu)橛嬎銠C(jī)能夠識別并處理的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),為下一步數(shù)據(jù)建模做準(zhǔn)備,需要對已獲取的數(shù)據(jù)進(jìn)行規(guī)范,涉及的關(guān)鍵步驟包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約和數(shù)據(jù)變換(劉明吉等,2000)。值得注意的是,一些數(shù)據(jù)既可以用于建模,也可以用于分析,如學(xué)習(xí)投入度的評價可采集學(xué)習(xí)者觀看視頻時回答問題的頻次與中斷視頻的頻次,也可以依據(jù)學(xué)習(xí)者面部表情與坐姿進(jìn)行分析(Ashwin et al., 2018);而面部表情同樣也可作為學(xué)習(xí)興趣的分析方法(孫發(fā)勤等,2019)。

        3.精準(zhǔn)分析模型構(gòu)建

        分析建模是精準(zhǔn)化學(xué)習(xí)評價過程中至關(guān)重要的一步。其實質(zhì)是首先依據(jù)評價目標(biāo)的不同,構(gòu)建相應(yīng)的評價指標(biāo)體系;然后對評價指標(biāo)體系中的評價維度進(jìn)行數(shù)據(jù)化表征,采集多源數(shù)據(jù);最后基于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、數(shù)據(jù)挖掘、計算機(jī)視覺等技術(shù),對所獲取的規(guī)范化數(shù)據(jù)進(jìn)行建模,最終獲得分析結(jié)果。分析建模主要包括學(xué)習(xí)者畫像、預(yù)測模型與預(yù)警模型三類。學(xué)習(xí)者畫像通過采集到的基礎(chǔ)信息、學(xué)業(yè)數(shù)據(jù)、學(xué)習(xí)資源等實時數(shù)據(jù),基于文本挖掘、自然語言處理等方法,對學(xué)習(xí)者的學(xué)習(xí)特征與個性特征進(jìn)行描述, 幫助教學(xué)利益相關(guān)者了解學(xué)習(xí)者學(xué)習(xí)情況。預(yù)測模型是基于學(xué)習(xí)者持續(xù)變化的學(xué)業(yè)數(shù)據(jù)、心理數(shù)據(jù)與生理數(shù)據(jù),通過語義關(guān)聯(lián)及相關(guān)性分析方法,診斷學(xué)習(xí)狀態(tài)并預(yù)測未來變化趨勢。預(yù)警模式建立在預(yù)測模型的基礎(chǔ)之上,是預(yù)測的下一個階段,對預(yù)測的結(jié)果進(jìn)行預(yù)警。構(gòu)建預(yù)警模型的主要方法是關(guān)聯(lián)規(guī)則、K-means算法等。

        4.分析結(jié)果可視化

        計算機(jī)構(gòu)建的分析模型較為抽象,不易理解。如果計算機(jī)內(nèi)部自動分析與判別,然后為教師或?qū)W習(xí)者提供相關(guān)學(xué)習(xí)資源,其分析結(jié)果則不需要進(jìn)行可視化呈現(xiàn)。然而,人在教育中的作用是無法取代的。無論空間如何融合,最終學(xué)習(xí)數(shù)據(jù)及學(xué)習(xí)分析結(jié)果都需要方便教師使用。因此精準(zhǔn)分析建模后需將分析結(jié)果轉(zhuǎn)變?yōu)槿藗円子诶斫獾膱D形、圖像,即將分析結(jié)果可視化??梢暬治龉ぞ叩脑O(shè)計是“數(shù)據(jù)驅(qū)動教學(xué)”的核心。當(dāng)前應(yīng)用較多的學(xué)習(xí)儀表盤,被定義為“為了支撐和改進(jìn)學(xué)習(xí)和表現(xiàn),對學(xué)習(xí)分析結(jié)果進(jìn)行可視化和直觀顯示的學(xué)習(xí)分析工具”(Yoo et al.,2015)。它能夠直觀地呈現(xiàn)學(xué)習(xí)者學(xué)習(xí)的相關(guān)信息,如學(xué)習(xí)者對知識點(diǎn)的掌握程度、學(xué)習(xí)進(jìn)展情況、登錄次數(shù)等。知識圖譜(Knowledge Graph)是另一個可視化工具,用于繪制、分析和顯示學(xué)科或?qū)W術(shù)研究主體之間的相互聯(lián)系,是揭示科學(xué)知識發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的可視化工具。還有社會網(wǎng)絡(luò),能夠?qū)W(xué)習(xí)者群體中溝通與交流的路徑可視化,找出意見領(lǐng)袖、邊緣人物等。

        三、數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價方法

        改進(jìn)教學(xué)和學(xué)習(xí)的目的,對學(xué)習(xí)評價的及時性和精準(zhǔn)性提出了很高的要求。為了滿足新型教育情境下精準(zhǔn)評價需求,需要對現(xiàn)有的教育評價理論以及關(guān)鍵技術(shù)進(jìn)行深度剖析,構(gòu)建數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價新模式。

        針對傳統(tǒng)的教學(xué)場景,新課標(biāo)提出了“知識與技能、過程與方法、情感與價值觀”的三維教學(xué)目標(biāo)。針對在線教學(xué)場景,F(xiàn)redricks等(2004)提出了行為、認(rèn)知、情感三維學(xué)習(xí)評價指標(biāo)體系;王敏娟構(gòu)建了以學(xué)習(xí)者參與為核心的Cybergogy模型,提出學(xué)生在線學(xué)習(xí)效果應(yīng)涉及認(rèn)知、情感和社會三個領(lǐng)域的因素。然而,以上評價框架都忽略了學(xué)習(xí)動機(jī)對學(xué)習(xí)成就的影響。學(xué)習(xí)動機(jī)是推動學(xué)習(xí)者學(xué)習(xí)的直接原因和內(nèi)部動力,是激發(fā)、指引和維持學(xué)習(xí)行為的心理過程(張雪蓮等,2009),因此,學(xué)習(xí)評價首先需要對學(xué)習(xí)者學(xué)習(xí)動機(jī)進(jìn)行評價。其次,無論是在傳統(tǒng)的物理學(xué)習(xí)空間,還是在線的云學(xué)習(xí)空間,學(xué)習(xí)者的學(xué)習(xí)情況主要是通過認(rèn)知與情感變化來體現(xiàn)的,故二者是學(xué)習(xí)評價必須關(guān)注的重要指標(biāo)。最后,傳統(tǒng)的行為指標(biāo)在云學(xué)習(xí)空間中顯得過于籠統(tǒng),在物理空間與云空間相融合的學(xué)習(xí)空間中,學(xué)習(xí)者的社會交互行為等社會因素對學(xué)習(xí)者的學(xué)習(xí)成就有非常重要的影響,因此,社會因素分析也是學(xué)習(xí)評價的重要方面。基于以上分析,本研究建構(gòu)了內(nèi)外部因素共同驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價框架,即從“動機(jī)、認(rèn)知、情感與社會”四個方面來對學(xué)習(xí)者進(jìn)行全面的分析與評價,其框架如圖2所示。

        圖2 數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價框架

        由圖2可知,數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價框架,以區(qū)塊鏈技術(shù)為基礎(chǔ),融合人工智能、云計算、學(xué)習(xí)分析、情境感知等新興技術(shù),在多維時空尺度上全面采集學(xué)習(xí)過程中的多元海量數(shù)據(jù),通過全面、系統(tǒng)的統(tǒng)計分析和數(shù)據(jù)挖掘,從學(xué)習(xí)者的內(nèi)在動機(jī)到認(rèn)知發(fā)展、情感表現(xiàn),再到社會綜合交互能力,多維度、及時、準(zhǔn)確地評估學(xué)生的學(xué)習(xí)真實狀況。在這個過程中,區(qū)塊鏈技術(shù)作為核心,可以對學(xué)習(xí)者數(shù)據(jù)進(jìn)行安全存儲和隱私保護(hù),使評價結(jié)果可信、可靠、安全且一致,為促進(jìn)學(xué)生全面發(fā)展提供了支持。

        1.學(xué)習(xí)動機(jī)與精準(zhǔn)化學(xué)習(xí)評價

        學(xué)習(xí)動機(jī)是引發(fā)與維持學(xué)生學(xué)習(xí)行為,并使之指向一定學(xué)業(yè)目標(biāo)的一種動力傾向。傳統(tǒng)的學(xué)習(xí)動機(jī)評價主要通過自我知覺、歸因或教師對學(xué)生面部表情等的觀察來判斷。但自我知覺或歸因受主觀意識影響較大,而教師觀察也易受經(jīng)驗和視覺范圍等限制。智能感知技術(shù)及設(shè)備的發(fā)展為學(xué)習(xí)動機(jī)的評價提供了便利。如Psaltis等(2017)通過眼動儀采集學(xué)生課堂學(xué)習(xí)的眼動數(shù)據(jù),并進(jìn)行量化和聚類分析,以此來判斷學(xué)生的注意力焦點(diǎn),進(jìn)而獲得學(xué)習(xí)者在學(xué)習(xí)過程中的專注度情況。Li等(2020)利用神經(jīng)網(wǎng)絡(luò)對采集到的學(xué)生課堂學(xué)習(xí)圖像數(shù)據(jù)和學(xué)習(xí)軌跡進(jìn)行分析,以判斷學(xué)生在學(xué)習(xí)過程中的參與度。Chan等 (2020)利用深度學(xué)習(xí)技術(shù)分析學(xué)習(xí)過程中產(chǎn)生的多模態(tài)數(shù)據(jù),對學(xué)生的情感態(tài)度、學(xué)業(yè)投入、課堂專注等進(jìn)行量化評價,進(jìn)而分析學(xué)習(xí)者的學(xué)習(xí)動機(jī)。

        2.認(rèn)知計算與精準(zhǔn)化學(xué)習(xí)評價

        數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價模型強(qiáng)調(diào)在大數(shù)據(jù)時代通過“讓數(shù)據(jù)發(fā)聲”,對學(xué)習(xí)者進(jìn)行多維度多層次的精準(zhǔn)評價,以充分發(fā)揮學(xué)習(xí)評價的診斷、調(diào)節(jié)、反饋、激勵等作用?;诎驳律↙orin W. Anderson)的認(rèn)知目標(biāo)分類,學(xué)習(xí)者的認(rèn)知由低到高可分為“記憶、理解、應(yīng)用、分析、評價和創(chuàng)造”等6個層次。數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價模型不僅要關(guān)注學(xué)習(xí)者的知識掌握情況,還需關(guān)注高層次的認(rèn)知技能;不僅要關(guān)注學(xué)生的行為表現(xiàn),還需關(guān)注學(xué)習(xí)者的認(rèn)知心理建構(gòu)過程。認(rèn)知診斷模型是一種基于認(rèn)知心理學(xué)與統(tǒng)計學(xué)相結(jié)合的認(rèn)知計算模型(涂冬波等,2012),可以通過對學(xué)習(xí)者的認(rèn)知心理過程進(jìn)行建模,挖掘?qū)W生的技能掌握狀態(tài)。然而,傳統(tǒng)的認(rèn)知診斷模型僅僅是對單次測評的診斷,診斷結(jié)果不夠穩(wěn)定。動態(tài)認(rèn)知診斷評價方法對學(xué)習(xí)者的認(rèn)知加工過程進(jìn)行建模,既注重對高階認(rèn)知能力的診斷評價,又結(jié)合學(xué)習(xí)者在學(xué)習(xí)過程中學(xué)習(xí)與遺忘等認(rèn)知規(guī)律,可以動態(tài)跟蹤學(xué)習(xí)者的認(rèn)知狀態(tài)變化,通過及時反饋和干預(yù)來影響學(xué)習(xí)者的學(xué)習(xí)表現(xiàn)。將認(rèn)知計算與精準(zhǔn)化學(xué)習(xí)評價相結(jié)合,可以提高學(xué)習(xí)評價的動態(tài)性、全面性與科學(xué)性,為培養(yǎng)學(xué)生的高階思維能力提供幫助。

        3.情感計算與精準(zhǔn)化學(xué)習(xí)評價

        情感影響著人的認(rèn)知過程與行為,情感評價是學(xué)習(xí)評價的重要組成部分。傳統(tǒng)的情感評價方法主要為觀察法、訪談法和問卷法,費(fèi)時費(fèi)力,且以總結(jié)性評價為主,脫離課堂情境,主觀性較強(qiáng)。人工智能技術(shù)、視頻捕捉技術(shù)、視頻分析技術(shù)的出現(xiàn)為學(xué)習(xí)過程中的情感評價提供了有力的技術(shù)支撐。情感計算是人工智能發(fā)展的重要方向之一,主要包括情感識別、情感建模和情感反應(yīng)三大部分。將情感計算與精準(zhǔn)化學(xué)習(xí)評價結(jié)合,可以對學(xué)習(xí)者在學(xué)習(xí)過程中產(chǎn)生的多元數(shù)據(jù)進(jìn)行捕捉與采集,整合多模態(tài)數(shù)據(jù),實現(xiàn)對學(xué)習(xí)者情感狀態(tài)及變化趨勢的實時評價。與音頻技術(shù)相比,視頻分析技術(shù)在實時性與持續(xù)性捕捉方面具有得天獨(dú)厚的優(yōu)勢,能夠?qū)W(xué)習(xí)者在學(xué)習(xí)過程中的面部表情、身體姿態(tài)、坐姿等圖像進(jìn)行實時捕捉,結(jié)合其他模態(tài)數(shù)據(jù)如腦電波、血壓等數(shù)據(jù),通過神經(jīng)網(wǎng)絡(luò)等技術(shù)進(jìn)行建模與分類,可以追蹤學(xué)習(xí)者學(xué)習(xí)過程中情緒的變化,精準(zhǔn)判斷學(xué)生的情緒。多模態(tài)數(shù)據(jù)驅(qū)動的視頻情感評價方法,利用圖像識別、語義識別和深度學(xué)習(xí)技術(shù)來量化表征教學(xué)視頻并構(gòu)建情感識別模型,自動分析學(xué)生在學(xué)習(xí)過程中的情緒態(tài)度,進(jìn)而推斷學(xué)生的學(xué)習(xí)興趣、學(xué)習(xí)意志與學(xué)習(xí)投入度。目前,已開展的相關(guān)研究包括通過靜態(tài)圖像對學(xué)習(xí)者情緒的識別(韓麗等,2017);通過視頻分析技術(shù),對傳統(tǒng)課堂中學(xué)習(xí)者的面部表情與姿勢進(jìn)行采集與評價,判斷學(xué)習(xí)者在學(xué)習(xí)過程中的學(xué)習(xí)情緒及其變化過程(郭雯雯等,2019)等。還有研究將視頻中的表情圖片與腦電波的多模態(tài)數(shù)據(jù)集合,構(gòu)建了多模態(tài)融合的深度學(xué)習(xí)模型,判斷學(xué)習(xí)者的學(xué)習(xí)參與度(曹曉明等,2019);或是對視頻中的人臉及表情進(jìn)行識別,評價班級和個人的情感,包括學(xué)習(xí)興趣和學(xué)習(xí)態(tài)度、學(xué)業(yè)價值觀、學(xué)習(xí)動機(jī)、學(xué)習(xí)信念與學(xué)習(xí)意志(孫發(fā)勤等, 2019)。

        4.社會計算與精準(zhǔn)化學(xué)習(xí)評價

        思維的根本在于對話,對話可以利用社會建構(gòu)的語境賦予思想以意義(Hudson,2002)。社會互動是教育過程的關(guān)鍵組成部分,學(xué)習(xí)中的互動是學(xué)習(xí)者獲取知識和發(fā)展認(rèn)知技能的必要條件(Barker,1994)。社會計算是信息技術(shù)在社會活動中的應(yīng)用。從計算技術(shù)到社會活動這一角度出發(fā),社會計算就是利用先進(jìn)的信息技術(shù)達(dá)到高度有效的交流?;趯W(xué)習(xí)者社交特性的學(xué)習(xí)者群體評價方法,可以通過分析群體聯(lián)系的緊密程度和活躍程度來了解群體特性,通過測量群體內(nèi)部的聯(lián)結(jié)度來分析知識和情感傳遞的有效性,還可以利用群體權(quán)力分析量化學(xué)習(xí)者個體在群體中所處的位置。社會計算和精準(zhǔn)化學(xué)習(xí)評價的結(jié)合,可以通過對群體層次結(jié)構(gòu)的分析,幫助我們了解群體內(nèi)部凝聚力的高低;比較不同學(xué)習(xí)者群體的互動內(nèi)容和深度,發(fā)現(xiàn)學(xué)習(xí)者群體之間互動模式的差異(Shu et al.,2018)。

        5.學(xué)習(xí)者數(shù)據(jù)的可信存儲及隱私保護(hù)方法

        研究數(shù)據(jù)的可信存儲方法是確保評價真實可靠的基礎(chǔ)。采用區(qū)塊鏈技術(shù),構(gòu)建學(xué)習(xí)者行為鏈,用以記錄學(xué)習(xí)者過程數(shù)據(jù),為精準(zhǔn)化學(xué)習(xí)評價提供可信數(shù)據(jù)支撐;同時,研究基于區(qū)塊鏈的學(xué)生評價數(shù)據(jù)安全與隱私保護(hù)技術(shù),以便為多主體評價信息提供可靠的保障,這些都是學(xué)習(xí)評價參與主體重點(diǎn)關(guān)注的問題。面向區(qū)塊鏈的訪問控制、安全多方計算、同態(tài)加密等信息安全手段越來越受研究者青睞。在區(qū)塊鏈+教育場景中,參與計算的各方能夠保證在不向驗證者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的,因而能夠有效避免引入第三方造成對數(shù)據(jù)的竊取或者窺視,進(jìn)一步保護(hù)教育數(shù)據(jù)的安全性和隱私性,實現(xiàn)在完全不透露任何隱私信息的同時維持信息的一致性。

        四、發(fā)展展望與政策建議

        目前,數(shù)據(jù)驅(qū)動的學(xué)習(xí)評價研究在我國仍處于起步階段。但隨著教育與信息技術(shù)的深度融合,大數(shù)據(jù)背景下的學(xué)習(xí)評價研究呈快速發(fā)展趨勢。未來,在政策的指引及技術(shù)的支持下,探索數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價大有可為。

        1.構(gòu)建符合多空間數(shù)據(jù)特征的綜合素質(zhì)評價框架

        智能教育時代,智能感知技術(shù)為多空間、多場景和全過程的學(xué)習(xí)數(shù)據(jù)采集提供了有效的工具,使得學(xué)習(xí)過程數(shù)據(jù)的全面采集成為可能。從數(shù)據(jù)空間來看,通過智能感知設(shè)備,我們不僅可以獲得在教室等物理空間學(xué)習(xí)時的課堂交互數(shù)據(jù),同時也可獲得在網(wǎng)絡(luò)學(xué)習(xí)空間中的在線學(xué)習(xí)數(shù)據(jù)。這些數(shù)據(jù)覆蓋課程、作業(yè)、生活、社交等多個學(xué)習(xí)場景, 各個場景有各自的評價標(biāo)準(zhǔn)。同時這些學(xué)習(xí)數(shù)據(jù)具有多模態(tài)特性,包括視頻、語音、文本和圖片等,亟需歸一化標(biāo)準(zhǔn)和通用的評價框架。因此,精準(zhǔn)化學(xué)習(xí)評價亟需建立符合多空間全數(shù)據(jù)的綜合評價框架和指標(biāo)體系,用于匯聚來自不同場景、不同模態(tài)的學(xué)習(xí)評價數(shù)據(jù),為后續(xù)大數(shù)據(jù)精準(zhǔn)分析做好準(zhǔn)備。

        2.完善過程性數(shù)據(jù)的采集與共享機(jī)制

        學(xué)生綜合素質(zhì)的評價需要全面采集學(xué)生德育、智育、體育、美育、勞動教育等多維過程性數(shù)據(jù),數(shù)據(jù)來源場景多樣、涉及的信息維度多、模態(tài)不一。因此,完善國家、區(qū)域、學(xué)校和班級等多級資源與數(shù)據(jù)的采集與共享機(jī)制,是實施數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價的前提。人工智能技術(shù)與感知設(shè)備的快速發(fā)展為完善過程性數(shù)據(jù)的采集奠定了技術(shù)基礎(chǔ)。研究者可以通過多種傳感器設(shè)備實時記錄學(xué)生行為數(shù)據(jù),同時,結(jié)合觀察、訪談、資料分析等不同方法,多維度、多層次地采集學(xué)習(xí)者的學(xué)習(xí)結(jié)果數(shù)據(jù)和學(xué)習(xí)過程數(shù)據(jù)。如可以通過手環(huán)等傳感器設(shè)備來實時感知學(xué)生的運(yùn)動、位置、睡眠狀態(tài)等生理數(shù)據(jù),通過攝像機(jī)等設(shè)備自動采集學(xué)生課堂學(xué)習(xí)行為數(shù)據(jù),通過個人檔案、問卷調(diào)查等方式記錄學(xué)生綜合發(fā)展數(shù)據(jù),通過階段性測評與診斷性測評采集學(xué)生學(xué)業(yè)數(shù)據(jù)等等。同時,研究者還要注意完善真實的情景化任務(wù)、成果、行為等多源、異構(gòu)、多模態(tài)、不連貫語義的海量數(shù)據(jù)的共享。不同教育機(jī)構(gòu)的數(shù)據(jù)與資源共享機(jī)制是保證學(xué)習(xí)評價大數(shù)據(jù)的完整性與全面性的基礎(chǔ)。

        3.突破學(xué)習(xí)評價中情感、認(rèn)知、動機(jī)和社交評價方面的關(guān)鍵技術(shù)

        當(dāng)前學(xué)生的綜合素質(zhì)評價大多采用填報與統(tǒng)計方式,其評價的效度和真實性受到質(zhì)疑。而傳統(tǒng)的評價模型側(cè)重學(xué)習(xí)者的知識掌握情況,忽略了更高層次的知識遷移能力、學(xué)習(xí)方法、情感態(tài)度和社會交往能力的發(fā)展情況。這既是重結(jié)果、輕過程的評價理念所致,同時也受到評價技術(shù)的制約。要實現(xiàn)精準(zhǔn)化的學(xué)習(xí)評價,必須在情感、認(rèn)知、動機(jī)和社交評價的關(guān)鍵技術(shù)方面有所突破,通過采集文字、語音、圖像、視頻等包含認(rèn)知、情感、注意力等的多模態(tài)數(shù)據(jù),利用自然語言處理、圖像識別、情感、計算等深度學(xué)習(xí)技術(shù)和統(tǒng)計建模方法,分析學(xué)習(xí)者的學(xué)習(xí)過程、學(xué)習(xí)內(nèi)容、知識遷移、情感獲得、交流互動等,以此對學(xué)生綜合素質(zhì)進(jìn)行全面、精準(zhǔn)、多維度的評價與反饋。

        4.研制數(shù)據(jù)驅(qū)動的學(xué)習(xí)評價平臺,加快學(xué)習(xí)評價在教育教學(xué)中的應(yīng)用

        數(shù)據(jù)驅(qū)動的學(xué)習(xí)評價平臺需要云計算、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術(shù)和應(yīng)用的配合,實現(xiàn)低成本的大規(guī)模分布式存儲、及時響應(yīng)的用戶體驗,以及更加綠色節(jié)能的新一代數(shù)據(jù)中心。即在有效面對大數(shù)據(jù)處理需求的同時,實現(xiàn)最大化資源利用率、最小化系統(tǒng)能耗的目標(biāo)。為此,數(shù)據(jù)驅(qū)動的學(xué)習(xí)評價平臺需要為教育大數(shù)據(jù)的匯集融合、海量存儲、高效計算、深入分析挖掘以及教育應(yīng)用的開發(fā)與運(yùn)行提供基礎(chǔ)支撐?;谶@個原理搭建教學(xué)、管理與學(xué)習(xí)的全生態(tài)應(yīng)用平臺,構(gòu)建不同業(yè)務(wù)系統(tǒng)共享數(shù)據(jù)中心的數(shù)據(jù)聚合型平臺。在規(guī)范化的數(shù)據(jù)基礎(chǔ)之上構(gòu)建特色型分析模型滿足分析需要,為管理者、教師、學(xué)生、家長以及合作學(xué)校提供智能服務(wù)。學(xué)校需將校內(nèi)與校外、課內(nèi)與課外、線上與線下、網(wǎng)絡(luò)空間與物理空間產(chǎn)生的數(shù)據(jù)匯集到學(xué)習(xí)評價平臺中,通過數(shù)據(jù)不斷的流轉(zhuǎn)迭代,幫助管理部門、教師、學(xué)生、家長等利益相關(guān)者了解學(xué)生的學(xué)習(xí)情況,開展精準(zhǔn)的教育干預(yù)與輔助。教師應(yīng)不斷提升信息化教學(xué)能力與數(shù)據(jù)素養(yǎng),能夠?qū)W(xué)習(xí)者不同學(xué)習(xí)時段產(chǎn)生的數(shù)據(jù)進(jìn)行分析,基于相關(guān)數(shù)據(jù)開展精準(zhǔn)化教學(xué)及互動;家長應(yīng)努力提升育兒專業(yè)知識,學(xué)會客觀看待學(xué)習(xí)者產(chǎn)生的相關(guān)數(shù)據(jù)并提供個性化的輔助;學(xué)校管理者應(yīng)提升信息化領(lǐng)導(dǎo)力,能夠依據(jù)年級數(shù)據(jù)或全校性數(shù)據(jù)進(jìn)行科學(xué)歸因與精準(zhǔn)決策,促進(jìn)學(xué)校教學(xué)資源的均衡配置與教學(xué)效能的提升。

        五、結(jié)語

        大數(shù)據(jù)時代,學(xué)習(xí)評價作為教育生態(tài)中的一環(huán),對實現(xiàn)人的德智體美勞全面發(fā)展起著非常重要的作用。數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價,通過不斷獲取、整合、分析學(xué)習(xí)過程中的文字、聲音、圖像、視頻與人體感知等多模態(tài)數(shù)據(jù),對教學(xué)和學(xué)習(xí)活動的信息流與運(yùn)行軌跡作出觀測、解釋和反饋,幫助教育相關(guān)者發(fā)現(xiàn)教育中存在的問題,輔助課堂學(xué)習(xí)中個性化干預(yù)的實現(xiàn)(朱曉玲,2019)。本文基于對信息時代學(xué)習(xí)評價現(xiàn)狀的分析,構(gòu)建了包含多場景數(shù)據(jù)采集、多空間數(shù)據(jù)融合、精準(zhǔn)分析模型構(gòu)建、分析結(jié)果可視化的精準(zhǔn)化學(xué)習(xí)評價機(jī)制,并提出以區(qū)塊鏈技術(shù)為核心,從認(rèn)知、情感、動機(jī)和社會四個方面進(jìn)行學(xué)習(xí)綜合素質(zhì)評價的方法,為促進(jìn)教育教學(xué)的改進(jìn)與學(xué)業(yè)質(zhì)量的提升提供了借鑒。

        總之,相對于傳統(tǒng)結(jié)果性教育評價,數(shù)據(jù)驅(qū)動的精準(zhǔn)化學(xué)習(xí)評價從多維度關(guān)注學(xué)習(xí)者的學(xué)習(xí)過程,能夠促進(jìn)教育管理者和教師對學(xué)習(xí)者的理解,為實施精準(zhǔn)化的教學(xué)干預(yù)提供輔助。不過,要建立一個全面、可靠、真正對學(xué)習(xí)者有效的學(xué)習(xí)評價機(jī)制需要教育教學(xué)論專家、學(xué)校管理者和技術(shù)專家等多方協(xié)作。

        參考文獻(xiàn):

        [1][日]田中耕治(2012).日本形成性評價發(fā)展的回顧與展望[J].項純.全球教育展望,41(3):3-6,18.

        [2]曹曉明,張永和,潘萌等(2019).人工智能視域下的學(xué)習(xí)參與度識別方法研究——基于一項多模態(tài)數(shù)據(jù)融合的深度學(xué)習(xí)實驗分析[J].遠(yuǎn)程教育雜志,37(1):32-44.

        [3]柴葳,向倩蕓(2015). 我國建立義務(wù)教育質(zhì)量監(jiān)測制度,今年起開展監(jiān)測工作——中國特色“PISA”揭開面紗[EB/OL].[2020-11-07].http://www.moe.gov.cn/jyb_xwfb/xw_fbh/moe_

        2069/xwfbh_2015n/xwfb_150415/150415_mtbd/201504/t20150

        416_187197.html.

        [4]陳新亞,李艷(2020).《2020地平線報告: 教與學(xué)版》的解讀及思考——疫情之下高等教育面臨的挑戰(zhàn)與變革[J].遠(yuǎn)程教育雜志,38(2):3-16.

        [5]郭雯雯,楊鳳梅(2019).課堂環(huán)境雙模態(tài)情感評價系統(tǒng)設(shè)計與效果分析[J].教學(xué)研究, 42(3):27-33.

        [6]郭元祥,劉曉慶(2014).大規(guī)模學(xué)業(yè)評價的發(fā)展歷程、新趨勢及啟示[J].教育研究與實驗,(1):27-32.

        [7]韓麗,李洋,周子佳等(2017).課堂環(huán)境中基于面部表情的教學(xué)效果分析[J].現(xiàn)代遠(yuǎn)程教育研究,(4):97-103,112.

        [8]劉君玲,劉斌,張文蘭(2019).學(xué)業(yè)情緒對在線協(xié)作問題解決的影響研究[J].中國電化教育,(7):82-90.

        [9]劉明吉,王秀峰,黃亞樓(2000).數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[J].計算機(jī)科學(xué),27(4):54-57.

        [10]劉智,方常麗,劉三等(2019).物理學(xué)習(xí)空間中學(xué)習(xí)者情緒感知研究綜述[J].遠(yuǎn)程教育雜志,37(2):33-44.

        [11]孫發(fā)勤,鄧雯心(2019).基于人工智能的課堂學(xué)習(xí)情感評價研究[J].中國教育信息化,(23):58-62.

        [12]田愛麗(2020).綜合素質(zhì)評價: 智能化時代學(xué)習(xí)評價的變革與實施[J].中國電化教育,(1):109-113,121.

        [13]涂冬波,蔡艷,丁樹良(2012).認(rèn)知診斷理論、方法與應(yīng)用[M].北京:北京師范大學(xué)出版社.

        [14]新華網(wǎng)(2019). 中共中央 國務(wù)院關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見[EB/OL].[2020-11-07].http://www.xinhuanet.com/politics/2019-07/08/c_1124725254.htm.

        [15]新華網(wǎng)(2020). 中共中央 國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》[EB/OL].[2020-11-07].http://www.xinhuanet.com/2020-10/13/c_1126601551.htm.

        [16]楊現(xiàn)民,李怡斐,王東麗等(2020).智能時代學(xué)習(xí)空間的融合樣態(tài)與融合路徑[J].中國遠(yuǎn)程教育,(1):46-53,72,77.

        [17]藥文靜,姜強(qiáng),李月等(2020).眾包知識建構(gòu)下學(xué)業(yè)情緒影響因素及喚醒機(jī)制的科學(xué)學(xué)研究——面向深度學(xué)習(xí)的課堂教學(xué)結(jié)構(gòu)化變革研究之五[J].現(xiàn)代遠(yuǎn)距離教育,(5):33-42.

        [18]張雪蓮,高玲(2009).學(xué)習(xí)動機(jī)及其相關(guān)研究[J].教育理論與實踐,29(18):32-34.

        [19]中國政府網(wǎng)(2015).教育部督導(dǎo)辦負(fù)責(zé)人就《國家義務(wù)教育質(zhì)量監(jiān)測方案》答記者問[EB/OL].[2020-08-11].http://www.gov.cn/xinwen/2015-04/15/content_2847308.htm.

        [20]朱曉玲(2019).小學(xué)數(shù)學(xué)課堂學(xué)習(xí)評價的現(xiàn)狀及改進(jìn)策略研究[D].南京:南京師范大學(xué).

        [21]Ashwin, T. S., & Guddeti, R. M. R. (2018). Unobtrusive StudentsEngagement Analysis in Computer Science Laboratory Using Deep Learning Techniques[C]// Proceedings of 2018 IEEE 18th International Conference on Advanced Learning Technologies (ICALT). IEEE: 436-440.

        [22]Ashwin, T. S., & Guddeti, R. M. R. (2020). Automatic Detection of StudentsAffective States in Classroom Environment Using Hybrid Convolutional Neural Networks[J]. Education and Information Technologies, 25(2): 1387-1415.

        [23]Barker, P. (1994). Designing Interactive Learning[M]. Dordrecht: Springer: 1-30.

        [24]Canfield, W. (2001). ALEKS: A Web-Based Intelligent Tutoring System[J]. Mathematics and Computer Education, 35(2): 152-158.

        [25]Chan, M. C. E., Ochoa, X., & Clarke, D. (2020). Multimodal Learning Analytics in a Laboratory Classroom[M]. Cham: Springer: 131-156.

        [26]Craig, S. D., Hu, X., & Graesser, A. C. et al. (2013). The Impact of a Technology-Based Mathematics After-School Program Using ALEKS on Students Knowledge and Behaviors[J]. Computers & Education, 68: 495-504.

        [27]Deniz, S., Lee, D., & Kurian, G. et al. (2019). Computer Vision for Attendance and Emotion Analysis in School Settings[C]// 2019 IEEE 9th Annual Computing and Communication Workshop and Conference (CCWC). IEEE: 134-139.

        [28]Eilam, E. (2019). Synchronization: A Framework for Examining Emotional Climate in Classes[J].Palgrave Communications,5(1):1-11.

        [29]Fredricks, J. A., & Paris, B. A. H. (2004). School Engagement: Potential of the Concept, State of the Evidence[J]. Review of Educational Research, 74(1): 59-109.

        [30]Hsieh, S., & Lin, S. J. (2019). The Dissociable Effects of Induced Positive and Negative Moods on Cognitive Flexibility[J].Scientific reports,9(1):1-10

        [31]Hudson, B. (2002). Critical Dialogue Online: Personas, Covenants, and Candlepower[M]. London: Sage: 53-90.

        [32]Jacqueleen, A. R. (2015). The Skinny on Big Data in Education: Learning analytics Simplified[J]. TechTrends, 59(2): 75-79.

        [33]Johnson-Glenberg, M. C. (2019). The Necessary Nine: Design Principles for Embodied VR and Active Stem Education[M]. Singapore: Springer: 83-112.

        [34]Kamath, A., Biswas, A., & Balasubramanian, V. (2016). A Crowdsourced Approach to Student Engagement Recognition in E-Learning Environments[C]// Proceedings of 2016 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE: 1-9.

        [35]Lambert, A. D., Terenzini, P. T., & Lattuca, L. R. (2007). More Than Meets the Eye: Curricular and Programmatic Effects on Student Learning[J]. Research in Higher Education, 48(2): 141-168.

        [36]Li, Z., & Zhan, Z. (2020). Integrated Infrared Imaging Techniques and Multi-Model Information via Convolution Neural Network for Learning Engagement Evaluation[J]. Infrared Physics & Technology, 109: 103430.

        [37]Liu, C. J., & Huang, C. F. (2016). Innovative Science Educational Neuroscience: Strategies for Engaging Brain Waves in Science Education Research[M]. Singapore: Springer: 233-247.

        [38]Lodge, J. M., & Corrin, L. (2017). What Data and Analytics Can and Do Say About Effective Learning [J/OL]. NPJ Science of Learning. https://www.nature.com/articles/s41539-017-

        0006-5.

        [39]McAfee, A., Brynjolfsson, E., & Davenport, T. H. et al. (2012). Big Data: The Management Revolution[J]. Harvard Business Review, 90(10): 60-68.

        [40]Mullis, I. V., & Martin, M. O. (2014). TIMMS Advanced 2015 Assessment Frameworks[DB/OL]. [2020-12-05]. https://files.eric.ed.gov/fulltext/ED559364.pdf.

        [41]OECD (2014). PISA 2012 Results: Creative Problem Solving: StudentsSkills in Tackling Real-Life Problems (Volume V)[DB/OL]. [2020-08-01]. http://www.oecd.org/pisa/keyfindings/PISA-2012-results-volume-V.pdf.

        [42]OECD (2019). Social and Emotional Skills Well-Being, Connectedness and Success[EB/OL]. [2020-08-01]. https://www.oecd.org/edu/school/UPDATED%20Social%20and%20

        Emotional%20Skills%20-%20Well-being,%20connectedness%20and%20success.pdf%20(website).pdf.

        [43]Psaltis, A., Apostolakis, K. C., & Dimitropoulos, K. et al. (2017). Multimodal Student Engagement Recognition in Prosocial Games[J]. IEEE Transactions on Games, 10(3): 292-303.

        [44]Shu, H., & Gu, X. (2018). Determining the Differences Between Online and Face-to-Face Student–Group Interactions in a Blended Learning Course[J]. The Internet and Higher Education, 39:13-21.

        [45]Smit, R., Bachmann, P., & Blum, V. et al. (2017). Effects of a Rubric for Mathematical Reasoning on Teaching and Learning in Primary School[J]. Instructional Science, 45(5): 603-622.

        [46]Stufflebeam, D. L. (1998). Conflicts Between Standards-Based and Postmodernist Evaluations: Toward Rapprochement[J]. Journal of Personnel Evaluation in Education, 12(3): 287-296.

        [47]Van den Berg, M., Harskamp, E. G., & Suhre, C. J. M. (2016). Developing Classroom Formative Assessment in Dutch Primary Mathematics Education[J]. Educational Studies, 42(4): 305-322.

        [48]Whitehill, J., Serpell, Z., & Lin, Y. C. et al. (2014). The Faces of Engagement: Automatic Recognition of Student Engagementfrom Facial Expressions[J]. IEEE Transactions on Affective Computing, 5(1): 86-98.

        [49]Yamtim, V., & Wongwanich, S. (2014). A Study of Classroom Assessment Literacy of Primary School Teachers[J]. Procedia-Social and Behavioral Sciences, 116: 2998-3004.

        [50]Yoo, Y., Lee, H., & Jo, I. H. et al. (2015). Educational Dashboards for Smart Learning: Review of Case Studies[M]// Emerging Issues in Smart Learning. Springer, Berlin, Heidelberg: 145-155.

        收稿日期 2021-01-05 責(zé)任編輯 汪燕

        Evaluation Mechanism and Method for Data-Driven Precision Learning

        HUANG Tao, ZHAO Yuan, GENG JING, WANG Han, ZHANG Hao, YANG Huali

        Abstract: Comprehensive quality evaluation is an inevitable requirement for implementing the fundamental task of deepening education reform and cultivating talents. Information technology promotes the process of education and teaching, which makes the traditional education evaluation mechanism move towards the direction of data-driven learning evaluation. Data-driven precision learning evaluation is an evaluation method that observes, explains and feedbacks on the information flow and running track of teaching and learning activities by continuously obtaining, integrating and analyzing multi-modal data in the learning process, so as to find problems existed in education and assist the intervention of classroom teaching. It contains multi-scene data collection, multi-spatial data fusion, accurate analysis model construction, and analysis result visualization. Multi-scene data collection provides data sources and quantitative means for learning evaluation;multi-spatial data fusion provides unified data standards for learning evaluation;accurate analysis model provides data-driven learning analysis and evaluation methods for learning evaluation and analysis results visualization provides feedback and application services for learning evaluation. The data-driven precision learning evaluation framework should integrate technologies such as artificial intelligence, cloud computing, learning analysis and context awareness based on the block chain technology. It can comprehensively collect multiple massive data in the learning process on multi-dimensional spatial-temporal scale. Through comprehensive and systematic statistical analysis and data mining, it can evaluate students learning status from their intrinsic motivation, cognitive development, emotional performance, to comprehensive social interaction ability in a multi-dimensional, timely and accurate way. At present, to explore data-driven accurate learning evaluation, we can carry out research on building a comprehensive quality evaluation framework in line with the characteristics of multi-spatial data, improving the collection and sharing mechanism of process data, breaking through the key technologies of emotion, cognition, motivation and social evaluation, and developing a data-driven learning evaluation platform.

        Keywords: Data Driven; Precision; Learning Evaluation; Evaluation Mechanism; Evaluation Method

        猜你喜歡
        評價方法
        淺析我國森林健康評價體系的研究現(xiàn)狀
        初中音樂教學(xué)優(yōu)化評價方法之探討
        未來英才(2016年2期)2016-12-26 09:57:17
        淺析水資源利用效率的評價方法
        運(yùn)用“小組合作”,打造高效課堂
        國內(nèi)外區(qū)域主導(dǎo)產(chǎn)業(yè)選擇理論研究綜述
        商情(2016年43期)2016-12-23 14:31:42
        程序設(shè)計類課程多維評價方法探索
        商用車動力性、經(jīng)濟(jì)性評價方法研究
        汽車科技(2016年6期)2016-12-19 20:28:28
        信息技術(shù)支撐下的課堂應(yīng)如何評價
        現(xiàn)代教育技術(shù)在數(shù)學(xué)教學(xué)中的作用
        企業(yè)業(yè)績評價方法研究
        在线看片免费人成视频久网下载| 偷窥偷拍一区二区三区| 狠色人妻丝袜中文字幕| 永久免费人禽av在线观看 | 欧美成人免费全部| 伊人网在线视频观看| 国产女主播在线免费观看| 国内自拍色第一页第二页| 久久99精品久久久久久9蜜桃| 国产免费破外女真实出血视频| 欧美巨大xxxx做受中文字幕| 久久精品一区二区熟女| 麻豆婷婷狠狠色18禁久久| 精品人体无码一区二区三区| 欧美综合自拍亚洲综合百度| 久久国产亚洲精品一区二区三区| 久久国产免费观看精品3| 国产一区日韩二区欧美三区| 久久综合一本中文字幕| 亚洲丰满熟女一区二亚洲亚洲| 国产午夜成人av在线播放| 欧美一片二片午夜福利在线快| 国产高跟丝袜在线诱惑| 国产精品美女久久久网站三级| 亚洲码国产精品高潮在线| 亚洲国产美女在线观看| 熟妇人妻丰满少妇一区| 久久精品第九区免费观看| 色婷婷综合久久久久中文| 人妻无码人妻有码不卡| 蜜臀av一区二区三区| 国产精品无码一区二区三区| 男女扒开双腿猛进入免费看污| 日本福利视频免费久久久| 精品亚洲一区二区区别在线观看| 久久综合国产乱子伦精品免费| 国产美女一级做a爱视频| 日本在线一区二区免费| 欧美牲交videossexeso欧美| 免费一级毛片在线播放不收费| 精品亚洲视频免费观看网站|