王紅
摘要:隨著網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)采集技術(shù)的快速發(fā)展,以及大數(shù)據(jù)的不斷崛起,大量的教育大數(shù)據(jù)以各種方式得到收集。使用恰當(dāng)?shù)臄?shù)據(jù)表征學(xué)習(xí)過程,利用數(shù)據(jù)分析技術(shù)發(fā)現(xiàn)學(xué)習(xí)者學(xué)習(xí)過程中的問題,對(duì)學(xué)習(xí)者、教學(xué)者和管理者具有及其重要的意義。本文基于當(dāng)前學(xué)習(xí)分析現(xiàn)狀,發(fā)現(xiàn)當(dāng)前學(xué)習(xí)分析的相關(guān)研究中數(shù)據(jù)采集方面存在的不足,從不同角度體現(xiàn)數(shù)據(jù)表征內(nèi)容和數(shù)據(jù)表征結(jié)果,對(duì)教育領(lǐng)域?qū)W習(xí)分析平臺(tái)的開發(fā)及學(xué)習(xí)活動(dòng)分析有一定的意義。
關(guān)鍵詞:學(xué)習(xí)分析;教育大數(shù)據(jù);數(shù)據(jù)表征
中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)19-0027-02
學(xué)習(xí)分析和教育數(shù)據(jù)挖掘,是教育大數(shù)據(jù)的兩個(gè)主要應(yīng)用領(lǐng)域。[1]美國(guó)新媒體聯(lián)盟(NMC)在地平線報(bào)告中連續(xù)四年把學(xué)習(xí)分析作為影響教育發(fā)展的趨勢(shì)和關(guān)鍵技術(shù)[2][3][4],而學(xué)習(xí)分析在許多方面指的是應(yīng)用于教育領(lǐng)域的“大數(shù)據(jù)”分析。[5]目前絕大多數(shù)的學(xué)習(xí)者的數(shù)據(jù)來(lái)源于固有的平臺(tái)數(shù)據(jù),平臺(tái)開發(fā)者根據(jù)平臺(tái)不同的應(yīng)用開發(fā)出相應(yīng)功能的平臺(tái)采集學(xué)習(xí)者的數(shù)據(jù)。然而學(xué)習(xí)者的學(xué)習(xí)狀態(tài)受到很多其他因素的影響,而這對(duì)采集數(shù)據(jù)的完備性具有極大的挑戰(zhàn),通過多樣的數(shù)據(jù)表征還原教學(xué)活動(dòng)的真實(shí)狀態(tài)具有現(xiàn)實(shí)的研究意義。
1 教育大數(shù)據(jù)與學(xué)習(xí)分析
1.1 教育大數(shù)據(jù)
大數(shù)據(jù)從產(chǎn)生之初一個(gè)特定領(lǐng)域的詞匯到目前各行各業(yè)都在不斷挖掘與探索的熱詞,大數(shù)據(jù)的核心特征常被概括為“4V”,即數(shù)據(jù)量大(Volume)、輸入和處理速度快(Velocity)、數(shù)據(jù)多樣(Variety)和精確性(Ve-racity)[6]。教育大數(shù)據(jù)是大數(shù)據(jù)的一個(gè)子集,特指教育領(lǐng)域的大數(shù)據(jù),是指整個(gè)教育活動(dòng)過程中所產(chǎn)生的以及根據(jù)教育需要采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合。[7]教育大數(shù)據(jù)簡(jiǎn)而言之就是教育活動(dòng)中的對(duì)象在教育活動(dòng)或?qū)W習(xí)環(huán)境中一切行為數(shù)據(jù)的集合。教育活動(dòng)的對(duì)象即教師、學(xué)生、教學(xué)活動(dòng)管理者;教育活動(dòng)對(duì)象所處的教育活動(dòng)或?qū)W習(xí)環(huán)境分別是教學(xué)過程、學(xué)習(xí)過程、教育管理過程;教育大數(shù)據(jù)采集的數(shù)據(jù)即為教育對(duì)象在教育活動(dòng)中做了什么以及如何做所產(chǎn)生的巨大的數(shù)據(jù)集。
1.2 學(xué)習(xí)分析
學(xué)習(xí)分析的定義源于美國(guó)高等教育信息化協(xié)會(huì)的“下一代的挑戰(zhàn)”,即使用數(shù)據(jù)和模型預(yù)測(cè)學(xué)生收獲和行為具備處理這些信息的能力[8]。第一屆“學(xué)習(xí)分析和知識(shí)國(guó)際會(huì)議”提出學(xué)習(xí)分析是用于對(duì)學(xué)習(xí)者及其學(xué)習(xí)環(huán)境數(shù)據(jù)進(jìn)行測(cè)量、收集、分析和報(bào)告,以理解和優(yōu)化學(xué)習(xí)和學(xué)習(xí)環(huán)境的技術(shù)。[9]學(xué)習(xí)分析的定義自源起到后來(lái)的不斷發(fā)展,其對(duì)象主要是學(xué)習(xí)者及學(xué)習(xí)者所處的環(huán)境,主要目的是通過多樣化的數(shù)據(jù)預(yù)測(cè)學(xué)習(xí)者的學(xué)習(xí)行為,指導(dǎo)學(xué)習(xí)者的學(xué)習(xí)行為,調(diào)整或修正學(xué)習(xí)者的學(xué)習(xí)行為,促進(jìn)學(xué)習(xí)者的發(fā)展。學(xué)習(xí)分析是根據(jù)學(xué)生活動(dòng),基于活動(dòng)數(shù)據(jù),依托技術(shù)背景,通過不同視角,分析學(xué)生行為,以修正學(xué)生活動(dòng),優(yōu)化學(xué)習(xí)環(huán)境從而促進(jìn)學(xué)生發(fā)展為主要目的的過程。
1.3 教育大數(shù)據(jù)與學(xué)習(xí)分析
學(xué)習(xí)分析是基于學(xué)習(xí)者在學(xué)習(xí)過程及學(xué)習(xí)環(huán)境中的一系列行為產(chǎn)生的數(shù)據(jù)進(jìn)行的,學(xué)習(xí)者在學(xué)習(xí)過程及學(xué)習(xí)環(huán)境中的一系列行為數(shù)據(jù)是教育大數(shù)據(jù)的一個(gè)子集。
2 現(xiàn)階段學(xué)習(xí)分析中的數(shù)據(jù)表征不足
2.1 現(xiàn)階段學(xué)習(xí)分析中的數(shù)據(jù)
學(xué)習(xí)者、教學(xué)者在學(xué)習(xí)環(huán)境中的一舉一動(dòng)、一言一行都可以轉(zhuǎn)化為數(shù)據(jù)。學(xué)習(xí)者通過學(xué)習(xí)平臺(tái)完成各種學(xué)習(xí)任務(wù)所產(chǎn)的行為與活動(dòng)都可以作為大數(shù)據(jù)的來(lái)源。何克抗指出目前學(xué)習(xí)分析技術(shù)所需數(shù)據(jù)的主要來(lái)源有:數(shù)據(jù)倉(cāng)庫(kù)中的基本信息數(shù)據(jù);用戶在網(wǎng)絡(luò)中的瀏覽記錄;學(xué)習(xí)平臺(tái)和各類學(xué)習(xí)系統(tǒng)中通過數(shù)據(jù)庫(kù)采集的數(shù)據(jù)。[10]張艷霞,孫洪濤指出網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)、情境數(shù)據(jù)和注意元數(shù)據(jù)是現(xiàn)有學(xué)習(xí)分析研究數(shù)據(jù)集的主要來(lái)源。[11]布朗(Brown,2012)從數(shù)據(jù)內(nèi)容表征的角度將學(xué)習(xí)分析研究對(duì)象劃分為個(gè)性特征指標(biāo)(dispositional indicators)和行為表現(xiàn)指標(biāo)(activity and performance indicators)。[12]前者主要是值與學(xué)習(xí)者自身相關(guān)的數(shù)據(jù),這些數(shù)據(jù)具有較高的客觀性,后者主要是指學(xué)習(xí)者在學(xué)習(xí)過程的各種學(xué)習(xí)行為產(chǎn)生的數(shù)據(jù)。
2.2 數(shù)據(jù)表征存在的不足
盡管當(dāng)前對(duì)于學(xué)習(xí)分析過程中的數(shù)據(jù)進(jìn)行了相關(guān)研究,對(duì)由于數(shù)據(jù)來(lái)源的廣泛性,數(shù)據(jù)完備性更備受關(guān)注和考驗(yàn)?,F(xiàn)有的學(xué)習(xí)分析對(duì)數(shù)據(jù)采集及數(shù)據(jù)表征存在不足,主要體現(xiàn)在以下幾個(gè)方面。
(1) 對(duì)學(xué)習(xí)者產(chǎn)生的文本數(shù)據(jù)的采集與分析不夠完善
當(dāng)前大多數(shù)學(xué)習(xí)平臺(tái)將學(xué)習(xí)者參與討論、測(cè)評(píng)等通過文本的形式存儲(chǔ)下來(lái),對(duì)數(shù)據(jù)的處理大多數(shù)停留在對(duì)學(xué)習(xí)者參與的積極性,但對(duì)學(xué)習(xí)者對(duì)學(xué)習(xí)內(nèi)容的具體掌握情況的分析及判斷存在片面性。同時(shí),對(duì)文本數(shù)據(jù)的采集絕大多數(shù)通過讓學(xué)習(xí)者寫的方式,但是對(duì)于特定的學(xué)習(xí)內(nèi)容,學(xué)習(xí)者直接表達(dá)出來(lái)會(huì)對(duì)學(xué)習(xí)者的學(xué)習(xí)狀態(tài)有更好的預(yù)測(cè)和指導(dǎo)作用,有聲思維相關(guān)研究在語(yǔ)義編碼方面也存在較大難度,因此將有聲思維相關(guān)技術(shù)結(jié)合到平臺(tái)中的研究較少。
(2) 對(duì)學(xué)習(xí)者生理數(shù)據(jù)的采集具有一定的局限性
通過學(xué)習(xí)平臺(tái)對(duì)學(xué)習(xí)者在線活動(dòng)數(shù)據(jù)進(jìn)行采集,但是對(duì)學(xué)習(xí)者的生理表征,相關(guān)數(shù)據(jù)的采集有一定的困難。盡管學(xué)習(xí)者的生理數(shù)據(jù)可以通過各種可穿戴設(shè)備的得到采集,但是由于網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)使得學(xué)習(xí)者與教學(xué)者、管理者處于時(shí)空分離的狀態(tài),對(duì)于遠(yuǎn)程學(xué)習(xí)者通過可穿戴設(shè)備體現(xiàn)學(xué)習(xí)者生理變化受到學(xué)習(xí)環(huán)境的限制。通過可穿戴設(shè)備采集學(xué)習(xí)者生理數(shù)據(jù)就目前大多數(shù)學(xué)習(xí)平臺(tái),比較適合于管理者、教學(xué)者與學(xué)習(xí)者能夠處在同一現(xiàn)實(shí)學(xué)習(xí)環(huán)境中。
(3) 采集數(shù)據(jù)的連續(xù)性不足
開發(fā)者進(jìn)行平臺(tái)開發(fā)時(shí)大多數(shù)考慮到平臺(tái)特定的學(xué)習(xí)對(duì)象以及其對(duì)學(xué)習(xí)內(nèi)容的階段性需求,但是對(duì)學(xué)習(xí)者學(xué)習(xí)前狀態(tài)了解的較少。對(duì)學(xué)習(xí)者各種數(shù)據(jù)的采集僅是對(duì)學(xué)習(xí)者當(dāng)前階段的數(shù)據(jù)的統(tǒng)計(jì)。信息化時(shí)代,數(shù)字土著越來(lái)越多,如果可以通過特定的平臺(tái)形成學(xué)習(xí)者特有的電子檔案,跟蹤學(xué)習(xí)者不同階段學(xué)習(xí)狀態(tài)的變化,對(duì)學(xué)習(xí)者、教學(xué)者、管理者都將是一筆財(cái)富。
(4) 線上-線下結(jié)合不足
大部分的學(xué)習(xí)平臺(tái)僅通過線上方式采集學(xué)習(xí)者在線學(xué)習(xí)行為產(chǎn)生的相關(guān)數(shù)據(jù),線上-線下相結(jié)合的方式,更能夠反應(yīng)學(xué)習(xí)者最真實(shí)的學(xué)習(xí)狀態(tài)。通過線下訪談,觀察,問卷等方式對(duì)學(xué)習(xí)者產(chǎn)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行采集統(tǒng)計(jì)。但是,線下的大多數(shù)方式要求學(xué)習(xí)者與教學(xué)者,管理者能夠處于同一現(xiàn)實(shí)學(xué)習(xí)環(huán)境中,對(duì)于遠(yuǎn)程學(xué)習(xí)者的效果或許不佳。
3 學(xué)習(xí)分析中的數(shù)據(jù)表征內(nèi)容與表征結(jié)果
3.1 從數(shù)據(jù)類型上體現(xiàn)數(shù)據(jù)表征內(nèi)容
基于當(dāng)前各類學(xué)習(xí)分析平臺(tái)和學(xué)習(xí)分析工具,將數(shù)據(jù)按照數(shù)據(jù)的不同特征進(jìn)行劃分。教育大數(shù)據(jù)也具有大數(shù)據(jù)的“4V”特性,從不同的角度對(duì)采集到的數(shù)據(jù)可進(jìn)行不同類型數(shù)據(jù)的劃分。
(1) 從數(shù)據(jù)事實(shí)性的角度
從數(shù)據(jù)事實(shí)性的角度,將數(shù)據(jù)類型分為靜態(tài)數(shù)據(jù)(如年齡、身份、學(xué)歷等)和動(dòng)態(tài)數(shù)據(jù)(如瀏覽時(shí)長(zhǎng)、腦電變化數(shù)據(jù)等),所謂靜態(tài)數(shù)據(jù)即與學(xué)習(xí)者直接相關(guān)的事實(shí)性數(shù)據(jù),動(dòng)態(tài)數(shù)據(jù)集由于學(xué)習(xí)者一系列學(xué)習(xí)行為所產(chǎn)生的數(shù)據(jù)。
(2) 從資源類型的角度
從資源類型的角度,將數(shù)據(jù)類型分為文本(如參與討論的內(nèi)容、搜索的關(guān)鍵詞等)、圖片(圖片關(guān)注時(shí)間、關(guān)注次數(shù)等)、視音頻(如瀏覽視頻次數(shù)、點(diǎn)擊視頻次數(shù)等)、動(dòng)畫及其他數(shù)據(jù)(如學(xué)習(xí)者心跳速率、情緒狀態(tài)等),對(duì)于不同的數(shù)據(jù)表現(xiàn)形式,進(jìn)行相應(yīng)的文本分析、圖文分析、視頻分析、音頻轉(zhuǎn)換分析、生理分析。
(3) 從數(shù)據(jù)的獲取設(shè)備要求的角度
從數(shù)據(jù)的獲取設(shè)備要求的角度,將數(shù)據(jù)類型分為行為數(shù)據(jù)(如下載文件、拖動(dòng)滾動(dòng)條次數(shù)等)和生理數(shù)據(jù)(表情特征、腦認(rèn)知活動(dòng)、注意力水平等),行為數(shù)據(jù)即學(xué)習(xí)者外顯能夠直接通過學(xué)習(xí)平臺(tái)表現(xiàn)出來(lái)的以及能夠直接記錄下來(lái)的數(shù)據(jù),生理數(shù)據(jù)即需要依托多種可穿戴設(shè)備(如,視覺跟蹤器、腦電儀器、心臟速率監(jiān)視器等)反應(yīng)出來(lái)的學(xué)習(xí)者學(xué)習(xí)過程中內(nèi)隱的數(shù)據(jù)。
3.2 從用戶的出發(fā)體現(xiàn)數(shù)據(jù)表征結(jié)果
教育大數(shù)據(jù)視野下,數(shù)據(jù)的表征可以依據(jù)不同的目的分別從學(xué)習(xí)者、教學(xué)者、管理者的角度出發(fā)(即“Who”),考察不同的用戶在不同的情境下(即“Where”),所發(fā)生的不同的行為(即“What”),從而分別對(duì)不同用戶產(chǎn)生了什么樣的影響(即“How”),從而進(jìn)行綜合考察。例如,通過學(xué)習(xí)者在課堂(學(xué)習(xí)過程)中抬頭和低頭次數(shù)和時(shí)長(zhǎng)的統(tǒng)計(jì)了解學(xué)生課堂關(guān)注度;通過教師在(教學(xué)過程)中提問時(shí)學(xué)生舉手次數(shù)了解知識(shí)的難易程度;通過管理者在學(xué)習(xí)平臺(tái)上發(fā)布資源后學(xué)習(xí)者的點(diǎn)擊及閱讀數(shù)量確定發(fā)布該類型資源的情況。
4 結(jié)束語(yǔ)
本文對(duì)教育大數(shù)據(jù)視角下學(xué)習(xí)分析中有關(guān)數(shù)據(jù)表征進(jìn)行了一定的研究,教育大數(shù)據(jù)的大量涌現(xiàn),信息技術(shù)的不斷發(fā)展,二者相結(jié)合的教學(xué)模式中,對(duì)數(shù)據(jù)表征的要求會(huì)越來(lái)越高。如何才能夠提高數(shù)據(jù)表征有效性,對(duì)學(xué)習(xí)者學(xué)習(xí)預(yù)測(cè)與評(píng)估、教學(xué)者教學(xué)效能改進(jìn)以及管理者資源配置提供相對(duì)準(zhǔn)確的服務(wù)與建議在未來(lái)的發(fā)展中也具有極高的意義與價(jià)值。
參考文獻(xiàn):
[1] 王良周,于衛(wèi)紅.大數(shù)據(jù)視角下的學(xué)習(xí)分析綜述[J].中國(guó)遠(yuǎn)程教育,2015(03):31-37.
[2] JOHNSON L, ADAMS BECKER S, WITCHEY H, et al. The NMC Horizon Report: 2011 Museum Edition[J]. Austin, Texas: The New Media Consortium, 2011.
[3] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition[J]. 2013.
[4] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2012 higher education edition, Austin [J].http://www.nmc org/publications/2013-horizon-report-higher-ed, 2013.
[5] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition[J]. 2013.
[6] 劉雍潛,楊現(xiàn)民.大數(shù)據(jù)時(shí)代區(qū)域教育均衡發(fā)展新思路[J].電化教育研究,2014(5):11-14.
[7] 楊現(xiàn)民,唐斯斯,李冀紅.發(fā)展教育大數(shù)據(jù):內(nèi)涵、價(jià)值和挑戰(zhàn)[J].現(xiàn)代遠(yuǎn)程教育研究,2016(01):50-61.
[8] 吳永和,陳丹,馬曉玲,等. 學(xué)習(xí)分析:教育信息化的新浪潮[J]. 遠(yuǎn)程教育雜志,2013,31(4):11-19.
[9]? Siemens G. Learning and knowledge analytics-knewton-thefuture of education? [EB/OL].[2017-01-17].http://www.learning -analytics.net/?p=126.
[10]? 何克抗.學(xué)習(xí)分析技術(shù)在我國(guó)的新發(fā)展[J].電化教育研究,2016,37(07):5-13.
[11] 張艷霞,孫洪濤,李爽,等.數(shù)據(jù)表征學(xué)習(xí)過程及其應(yīng)用——學(xué)習(xí)分析數(shù)據(jù)集國(guó)際研究綜述[J].中國(guó)電化教育,2015(09):85-93.
[12] 吳青,羅儒國(guó).學(xué)習(xí)分析:從源起到實(shí)踐與研究[J].開放教育研究,2015,21(01):71-79.
【通聯(lián)編輯:光文玲】