張艷霞 孫洪濤 李爽 陳麗
摘要:教育信息系統(tǒng)中存儲著大量不同格式和不同粒度級別的學(xué)生數(shù)據(jù),這些數(shù)據(jù)為利用學(xué)習(xí)分析技術(shù)發(fā)現(xiàn)和解決學(xué)生學(xué)習(xí)過程中的問題提供了可能。然而,如何使用恰當(dāng)?shù)臄?shù)據(jù)表征學(xué)生的學(xué)習(xí)過程,對研究者來說仍存在很大挑戰(zhàn)。本文首先從數(shù)據(jù)來源、具體數(shù)據(jù)項、數(shù)據(jù)項收集方法、在學(xué)習(xí)分析中的應(yīng)用四個方面對現(xiàn)有學(xué)習(xí)分析研究中使用的數(shù)據(jù)集進(jìn)行了整理和歸納,然后對現(xiàn)有數(shù)據(jù)集的研究現(xiàn)狀、未來發(fā)展趨勢進(jìn)行了討論和分析。以期呈現(xiàn)現(xiàn)有學(xué)習(xí)分析領(lǐng)域數(shù)據(jù)集應(yīng)用的概貌,為后續(xù)學(xué)習(xí)分析中數(shù)據(jù)集的研究奠定基礎(chǔ)。
關(guān)鍵詞:學(xué)習(xí)分析;數(shù)據(jù)集;學(xué)習(xí)過程
中圖分類號:G434
文獻(xiàn)標(biāo)識碼:A
一、引言
學(xué)習(xí)分析源于商業(yè)智能和網(wǎng)站分析,是用戶數(shù)據(jù)分析在教育領(lǐng)域的應(yīng)用,指的是對教育領(lǐng)域的“大數(shù)據(jù)”處理和分析[l]。在各種教育媒體大量出現(xiàn),學(xué)習(xí)資源網(wǎng)絡(luò)化、網(wǎng)絡(luò)學(xué)習(xí)方式普及化,學(xué)習(xí)行為、學(xué)習(xí)情境和學(xué)習(xí)結(jié)果數(shù)據(jù)豐富化和可獲得化的背景下產(chǎn)生。在2011年舉行的首屆學(xué)習(xí)分析技術(shù)與知識國際會議(International Conference on LearningAnalytics and Knowledge.LAK)上提出了學(xué)習(xí)分析的定義,指出學(xué)習(xí)分析是測量、收集、分析和報告有關(guān)學(xué)生的學(xué)習(xí)行為以及學(xué)習(xí)環(huán)境的數(shù)據(jù),用以理解和優(yōu)化學(xué)習(xí)及其產(chǎn)生的環(huán)境的技術(shù)的總稱[2]。即學(xué)習(xí)分析是對學(xué)習(xí)者在學(xué)習(xí)平臺中隨機產(chǎn)生的各種零散的數(shù)據(jù)進(jìn)行存儲、收集、篩選、提取,并在對獲取的數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上對學(xué)習(xí)者的學(xué)習(xí)效果和狀態(tài)進(jìn)行評估和預(yù)測[3]。
從其定義可知,數(shù)據(jù)是學(xué)習(xí)分析的關(guān)鍵前提。Greller等人提出了確保學(xué)習(xí)分析向有效改善教育或?qū)W習(xí)效果方向發(fā)展的六個要素:受益者、目標(biāo)、數(shù)據(jù)、設(shè)備、內(nèi)部限制、外部限制[4]。學(xué)習(xí)分析從根本上是收集和分析學(xué)生學(xué)習(xí)過程中生成的各種數(shù)據(jù)[5]。這也進(jìn)一步說明數(shù)據(jù)是學(xué)習(xí)分析的重要基礎(chǔ)。Siemens指出學(xué)習(xí)分析產(chǎn)生的最主要原因是現(xiàn)在可獲得大量的數(shù)據(jù),如學(xué)生上傳下載資源的頻率、在測試上花費的時間、點擊觀看視頻的次數(shù)、參與學(xué)習(xí)活動的類型等?;谶@些數(shù)據(jù),我們可以構(gòu)建學(xué)生模型,預(yù)測學(xué)生輟學(xué)的可能性;對學(xué)生已有的知識結(jié)構(gòu)進(jìn)行評估,幫助學(xué)生知道自己所處的學(xué)習(xí)狀態(tài)及下一步應(yīng)該學(xué)習(xí)什么;呈現(xiàn)學(xué)生的學(xué)習(xí)軌跡,為學(xué)生提供個性化的學(xué)習(xí)支持[6]。
最近幾年,各類教育教學(xué)軟件和網(wǎng)絡(luò)學(xué)習(xí)資源在教育中的普遍應(yīng)用、大量課程管理數(shù)據(jù)庫和學(xué)生信息數(shù)據(jù)庫的建立為學(xué)生學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)提供了大容量的存儲空間。各類在線學(xué)習(xí)平臺、教育信息系統(tǒng)和在線學(xué)習(xí)APP中存儲著大量的數(shù)據(jù)。這些數(shù)據(jù)記載著學(xué)生的學(xué)習(xí)狀態(tài)和學(xué)習(xí)過程[7]。它們?yōu)檠芯空咛峁┝诉M(jìn)行廣泛研究嘗試的潛在數(shù)據(jù)源。學(xué)習(xí)分析的開展有賴于高質(zhì)量的數(shù)據(jù)。理想情況下,研究者希望捕捉到能夠準(zhǔn)確反映學(xué)生真實學(xué)習(xí)過程或狀態(tài)的數(shù)據(jù)。然而,這些數(shù)據(jù)通常是以不同的格式和粒度級別被存儲,并且存儲的位置由學(xué)生信息管理系統(tǒng)和課程管理系統(tǒng)向分布式的個人學(xué)習(xí)空間擴展,這給研究者從大量雜亂的數(shù)據(jù)源中挑選出能夠反映特定學(xué)習(xí)過程或狀態(tài)的數(shù)據(jù)帶來了一定的難度。在學(xué)習(xí)分析中采用哪些數(shù)據(jù)才能更加深入全面地描述和解析學(xué)生的學(xué)習(xí)過程及狀態(tài)是學(xué)習(xí)分析技術(shù)應(yīng)用者比較關(guān)注的問題,并且該問題一直沒有得到很好的解決。如何選擇適當(dāng)?shù)臄?shù)據(jù)集合(Dataset),從而開展存儲、收集、提取、分析和報告是學(xué)習(xí)分析研究中的一個重要前提[8]。
學(xué)習(xí)分析中的數(shù)據(jù)集特指與學(xué)生學(xué)習(xí)屬性和學(xué)習(xí)環(huán)境相關(guān)的原始數(shù)據(jù)項或者用于表征學(xué)習(xí)行為或?qū)W習(xí)環(huán)境的聚合數(shù)據(jù)項的集合。數(shù)據(jù)集是學(xué)習(xí)分析和教育數(shù)據(jù)挖掘領(lǐng)域各種數(shù)據(jù)模型建立的基礎(chǔ)。另外,學(xué)習(xí)分析中各種學(xué)習(xí)結(jié)果和學(xué)習(xí)行為的預(yù)測、學(xué)習(xí)工具的開發(fā)以及學(xué)習(xí)資源的推薦都是通過對各類數(shù)據(jù)集中具體數(shù)據(jù)項的分析來實現(xiàn)。數(shù)據(jù)集是學(xué)習(xí)分析技術(shù)得以發(fā)展的前提和基礎(chǔ)。因此,對學(xué)習(xí)分析中使用的數(shù)據(jù)集進(jìn)行概述和分析,將為研究者從大量雜亂的數(shù)據(jù)源中挑選出能夠反映特定學(xué)習(xí)過程或狀態(tài)的數(shù)據(jù)提供參照。另外,對學(xué)習(xí)分析中數(shù)據(jù)集的整理和分類也可能為學(xué)生動態(tài)模型的建立、學(xué)習(xí)分析T具的開發(fā)等提供更準(zhǔn)確的數(shù)據(jù)選擇依據(jù)。
二、文獻(xiàn)來源與分析框架
筆者在Google Scholar中以“LearningAnalytics” “Learning Analytics Research” “LearningAnalysis為關(guān)鍵詞,對2011-2014年學(xué)習(xí)分析領(lǐng)域的相關(guān)論文進(jìn)行了檢索,檢索結(jié)果包括學(xué)習(xí)分析技術(shù)與知識國際會議(LAK)及其他涉及學(xué)習(xí)分析主題的會議(AIED、ECTEL、RecSys等)中的文獻(xiàn)。通過篩選,學(xué)習(xí)分析中數(shù)據(jù)集相關(guān)的文獻(xiàn)最終獲得了133篇文獻(xiàn)。
學(xué)習(xí)分析領(lǐng)域關(guān)于數(shù)據(jù)集的研究處于起步階段,國外有研究者開始進(jìn)行初步的嘗試。Drachsler等人對技術(shù)增強學(xué)習(xí)領(lǐng)域中來自不同學(xué)習(xí)推薦系統(tǒng)(MovieLens,BookCrossing,EachMovie)中的公開數(shù)據(jù)集從數(shù)據(jù)能夠表征學(xué)習(xí)情景的程度、可重復(fù)性、用途等方面進(jìn)行了整理和分析,并在此基礎(chǔ)上提出了三條幫助研究者根據(jù)特定的情景選擇合適的數(shù)據(jù)集的指導(dǎo)建議[9]。2012年,Verbert等人在Dracbsler研究的基礎(chǔ)上進(jìn)行了擴展,提出了一個教育數(shù)據(jù)集的分析框架,并且對教育數(shù)據(jù)集在共享和重用中存在的挑戰(zhàn)和未來發(fā)展趨勢進(jìn)行了討論和分析。Verbert等人提出的數(shù)據(jù)集分析框架由數(shù)據(jù)集屬性、數(shù)據(jù)屬性、學(xué)習(xí)分析的目標(biāo)三個部分[10]。數(shù)據(jù)集屬性是對數(shù)據(jù)集的整體描述,主要是指數(shù)據(jù)集的來源;數(shù)據(jù)屬性是在一個更精細(xì)的粒度水平上對數(shù)據(jù)集進(jìn)行描述,主要包括組成數(shù)據(jù)集的各個數(shù)據(jù)元素,即數(shù)據(jù)項有哪些;學(xué)習(xí)分析的目標(biāo)用來映射數(shù)據(jù)集及其所包含的數(shù)據(jù)項在學(xué)習(xí)分析中的潛在有用性。同時,他們還指出通常不同的數(shù)據(jù)集在收集方法上存在一定的差異性。借助該數(shù)據(jù)集分析框架,研究者能夠較為直觀地、清晰地發(fā)現(xiàn)學(xué)習(xí)分析中數(shù)據(jù)集的特點。
本研究在Verbert等人提出的數(shù)據(jù)集分析框架基礎(chǔ)上,提出了數(shù)據(jù)來源、數(shù)據(jù)項、數(shù)據(jù)收集方法以及在學(xué)習(xí)分析中的應(yīng)用這四個方面,作為對學(xué)習(xí)分析中的數(shù)據(jù)集研究進(jìn)行分析的框架。主要回答以下四個問題:
(1)數(shù)據(jù)集中的數(shù)據(jù)主要來源于哪些數(shù)據(jù)系統(tǒng)?
(2)數(shù)據(jù)包含哪些數(shù)據(jù)項,可以歸為哪個類別?
(3)如何收集這些數(shù)據(jù)?
(4)可用于學(xué)習(xí)分析中的哪些問題情景?
三、文獻(xiàn)分析結(jié)果
依照前述分析框架,筆者對篩選出的133篇文獻(xiàn)進(jìn)行了分析。
通過圖1可以發(fā)現(xiàn),現(xiàn)有研究中學(xué)習(xí)分析的大部分?jǐn)?shù)據(jù)來自學(xué)習(xí)管理系統(tǒng)和網(wǎng)絡(luò)課程。
MOOC雖然屬于網(wǎng)絡(luò)課程的范疇,但由于其大規(guī)模性和開放性引起了研究者的關(guān)注,MOOC開始出現(xiàn)在學(xué)習(xí)分析領(lǐng)域,有研究者開始研究如何利用學(xué)習(xí)分析技術(shù)來促進(jìn)MOOC中學(xué)習(xí)的有效發(fā)生。隨著社會媒體在學(xué)習(xí)中的廣泛應(yīng)用,越來越多的研究者開始關(guān)注各類社交媒體中學(xué)生產(chǎn)生的各類數(shù)據(jù)。
研究中一般不會明確指出采用了哪種類型的數(shù)據(jù)集,但會對收集的數(shù)據(jù)項進(jìn)行描述。根據(jù)其描述進(jìn)行整理和歸類,發(fā)現(xiàn)現(xiàn)有學(xué)習(xí)分析相關(guān)研究中使用的數(shù)據(jù)集主要可以分為網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)集、情境數(shù)據(jù)集、注意元數(shù)據(jù)集,如下頁圖2所示。
互聯(lián)網(wǎng)大數(shù)據(jù)時代,學(xué)生的很多學(xué)習(xí)行為都發(fā)生在網(wǎng)絡(luò)環(huán)境中。這些學(xué)習(xí)行為數(shù)據(jù)通常在學(xué)生察覺或者不察覺、主動或者被動的情況下被記錄在學(xué)習(xí)平臺或系統(tǒng)中[11]。學(xué)習(xí)分析通過對學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)的分析,以倒溯方式考察影響行為產(chǎn)生動機和需求等因素,以及行為背后所隱藏的學(xué)習(xí)目的、學(xué)生個性特征、學(xué)習(xí)環(huán)境等元素,最終目的是優(yōu)化學(xué)生的學(xué)習(xí)過程以及學(xué)習(xí)行為發(fā)生的環(huán)境[12]。學(xué)習(xí)行為時學(xué)習(xí)分析關(guān)注的重心,網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)在全部學(xué)習(xí)分析數(shù)據(jù)集中占很大的比重。
此外,情境數(shù)據(jù)能夠表征學(xué)生學(xué)習(xí)行為發(fā)生的環(huán)境特點。移動互聯(lián)網(wǎng)的發(fā)展,使得利用情境數(shù)據(jù)提高個性化服務(wù)的精確性和學(xué)生的滿意度成為個性化服務(wù)領(lǐng)域的研究熱點之一。越來越多的在線教育機構(gòu)開始關(guān)注如何通過對學(xué)生學(xué)習(xí)情境數(shù)據(jù)的分析,為不同情境下的學(xué)生精確推薦符合其實際需求的學(xué)習(xí)資源或服務(wù)。情境數(shù)據(jù)集成為學(xué)習(xí)分析領(lǐng)域關(guān)注的另一類數(shù)據(jù)集。
注意元數(shù)據(jù)主要用來表征學(xué)生注意力分配方面的特點。通過抓取學(xué)生的注意元數(shù)據(jù)(如:眼睛移動的范圍,鼠標(biāo)點擊的頻率等),形成學(xué)生注意力數(shù)據(jù)流,進(jìn)而捕獲學(xué)生對學(xué)習(xí)資源、軟件應(yīng)用等的偏好,及其交互方式[13]。學(xué)習(xí)分析領(lǐng)域通過收集和分析學(xué)生的注意元數(shù)據(jù),了解學(xué)生學(xué)習(xí)過程中的資源偏好及其與學(xué)習(xí)內(nèi)容之間的交互方式。目前,注意元數(shù)據(jù)集在學(xué)習(xí)分析中應(yīng)用比較廣泛。學(xué)習(xí)分析中的數(shù)據(jù)主要通過基于代理服務(wù)器和基于Weh日志挖掘的方法獲取,如圖3所示。在學(xué)習(xí)分析中應(yīng)用體現(xiàn)在預(yù)測學(xué)生表現(xiàn)、構(gòu)建學(xué)生模型、促進(jìn)學(xué)生反思和保持注意力等六個方面,如圖4所示。
通過以上分析可以發(fā)現(xiàn)學(xué)習(xí)分析數(shù)據(jù)集的總體狀況。其中,網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)、情境數(shù)據(jù)和注意元數(shù)據(jù)是現(xiàn)有學(xué)習(xí)分析研究數(shù)據(jù)集的主要來源。這三類數(shù)據(jù)集在數(shù)據(jù)來源、數(shù)據(jù)項構(gòu)成、數(shù)據(jù)收集方法和學(xué)習(xí)分析應(yīng)用方面有著較大的差異,對各個數(shù)據(jù)集的深入分析有助于進(jìn)一步了解現(xiàn)有數(shù)據(jù)集研究現(xiàn)狀,為應(yīng)用數(shù)據(jù)集開展實驗研究和工具設(shè)計奠定基礎(chǔ)。
四、對三大類數(shù)據(jù)集的分析
(一)網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)集
網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)集是指用于描述學(xué)生學(xué)習(xí)過程中產(chǎn)生的各種行為的要素及其屬性的數(shù)據(jù)集。
1.數(shù)據(jù)來源
現(xiàn)有研究中網(wǎng)絡(luò)學(xué)習(xí)行為的數(shù)據(jù)集主要來源于傳統(tǒng)學(xué)習(xí)管理系統(tǒng)、智能導(dǎo)師系統(tǒng)和白適應(yīng)超媒體系統(tǒng)、個人學(xué)習(xí)環(huán)境。
基于傳統(tǒng)學(xué)習(xí)管理系統(tǒng)中的數(shù)據(jù)對網(wǎng)絡(luò)學(xué)習(xí)行為進(jìn)行分析、描述和可視化是學(xué)習(xí)分析中的研究焦點[14]。這主要與傳統(tǒng)學(xué)習(xí)管理系統(tǒng)中數(shù)據(jù)的易獲性、封閉性和連續(xù)性有關(guān)。
智能導(dǎo)師系統(tǒng)和白適應(yīng)超媒體系統(tǒng)其本質(zhì)是個性化的學(xué)習(xí)支持服務(wù)系統(tǒng),能夠更有效地支持學(xué)生個性化的學(xué)習(xí)。部分研究者通過對這些個別化學(xué)習(xí)支持系統(tǒng)中數(shù)據(jù)的分析來形成能夠體現(xiàn)學(xué)生個性化學(xué)習(xí)過程與策略特征的用戶視圖。
隨著各類移動設(shè)備和社會性軟件在學(xué)習(xí)中的應(yīng)用,學(xué)生的學(xué)習(xí)不再局限于單一、封閉的學(xué)習(xí)系統(tǒng),學(xué)習(xí)開始跨平臺、跨系統(tǒng)。部分研究者開始關(guān)注學(xué)生個人學(xué)習(xí)環(huán)境中產(chǎn)生的數(shù)據(jù)集,希望通過對個人學(xué)習(xí)環(huán)境中學(xué)生行為數(shù)據(jù)的分析,挖掘?qū)W生的學(xué)習(xí)興趣,進(jìn)行資源推薦,可視化學(xué)生的學(xué)習(xí)路徑[15]。
2.數(shù)據(jù)項
Verbert等人提出了一個用于描述學(xué)生行為特征的數(shù)據(jù)集,見圖5。該數(shù)據(jù)集中包含五大類數(shù)據(jù)項:(1)描述行為主體(Learner/Teacher)特征的數(shù)據(jù)項;(2)描述行為客體(Resource)特征的數(shù)據(jù)項;(3)描述行為類別(Type)的數(shù)據(jù)項;(4)描述行為結(jié)果(Result)特征的數(shù)據(jù)項;(5)描述行為發(fā)生情境(Context)特征的數(shù)據(jù)項。
上述學(xué)生行為數(shù)據(jù)集中不僅包含了用于描述行為本身屬性的數(shù)據(jù)項,而且包含了用于描述行為發(fā)出者、行為對象、發(fā)生的情境以及產(chǎn)生的結(jié)果特征的一系列數(shù)據(jù)項。研究者可以根據(jù)研究的目的以及學(xué)習(xí)系統(tǒng)存儲數(shù)據(jù)的特點對上述數(shù)據(jù)模型中的數(shù)據(jù)項進(jìn)行篩選。
3.數(shù)據(jù)收集方法
基于計算機和網(wǎng)絡(luò)平臺的網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)項采集的常用方法主要有三類,基于服務(wù)器端的采集、基于客戶端的采集以及服務(wù)器端與客戶端相結(jié)合的采集。
基于服務(wù)器端的數(shù)據(jù)采集在現(xiàn)有學(xué)習(xí)分析研究中應(yīng)用較多。服務(wù)器端的數(shù)據(jù)采集主要包括Web日志挖掘和通過代理服務(wù)器進(jìn)行采集。這兩種方法都存在一定的局限性?;赪eb日志挖掘的局限首先在于Web日志的不易獲得性,即使得到了,也和Web安全的相關(guān)原則有沖突,而且只能獲取學(xué)生通過該Web服務(wù)器時留下的日志數(shù)據(jù)?;诖矸?wù)器的采集只能得到在該網(wǎng)站進(jìn)行學(xué)習(xí)的注冊學(xué)生的學(xué)習(xí)行為數(shù)據(jù),這在一定程度上會導(dǎo)致未注冊學(xué)生的學(xué)習(xí)行為數(shù)據(jù)的流失。這樣的數(shù)據(jù)系統(tǒng)開發(fā)要與網(wǎng)站程序的設(shè)計以及數(shù)據(jù)庫設(shè)計同步進(jìn)行,才能做到無縫集成,專用性強,靈活性較差[17]。
基于客戶端的采集主要包括客戶端JavaScript采集和瀏覽器插件采集。使用開源軟件進(jìn)行數(shù)據(jù)流捕
獲,然后處理并輸出為文本,最后使用文本挖掘的成熟算法進(jìn)行處理[18]。這種獲取基于隨機樣本,樣本容量可以取的很大,即使出現(xiàn)丟包
情況,也能接近實際情況[19]。
為了獲取能夠描述學(xué)生多種學(xué)習(xí)行為的數(shù)
據(jù),少量研究開始采用服務(wù)器端與客戶端相結(jié)
合的方法進(jìn)行數(shù)據(jù)收集。一方面通過服務(wù)器端
獲取學(xué)生在正規(guī)學(xué)習(xí)系統(tǒng)中產(chǎn)生的數(shù)據(jù),同時
通過開源的JaveScript或瀏覽器插件跟蹤獲取學(xué)
生在自己客戶端進(jìn)行的各項操作行為。
4.在學(xué)習(xí)分析中的應(yīng)用
網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)集在學(xué)習(xí)分析中的應(yīng)用主要表現(xiàn)在:(1)通過對學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)
集中各個數(shù)據(jù)項的提取、整合、分析后挖掘出
學(xué)生在線學(xué)習(xí)的學(xué)習(xí)興趣、學(xué)習(xí)方式和學(xué)習(xí)習(xí)
慣等方面的模式規(guī)律,針對挖掘出的模式規(guī)律
有針對性地為學(xué)生提供個性化、智能化的學(xué)習(xí)
資源和服務(wù)。(2)提取分析學(xué)生學(xué)習(xí)過程中與
教師、學(xué)生、資源、工具應(yīng)用進(jìn)行交互產(chǎn)生的
行為數(shù)據(jù),形成學(xué)生交互過程的可視化數(shù)據(jù)圖
表,對學(xué)生交互水平進(jìn)行評估。(3)監(jiān)測學(xué)生學(xué)習(xí)過程中的不良學(xué)習(xí)行為,開發(fā)遠(yuǎn)程學(xué)生輟學(xué)預(yù)警系統(tǒng),幫助遠(yuǎn)程教育機構(gòu)及時發(fā)現(xiàn)潛在輟學(xué)者,并提供及時干預(yù)。(4)根據(jù)對學(xué)習(xí)系統(tǒng)中大量學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)的分析,預(yù)測相同情景中具有相似行為數(shù)據(jù)的學(xué)生的學(xué)習(xí)表現(xiàn),包括學(xué)生的知識水平、行為表現(xiàn)等。
(二)情境數(shù)據(jù)集
情境數(shù)據(jù)集是指用來描述學(xué)生學(xué)習(xí)情境特征的數(shù)據(jù)集,其學(xué)習(xí)情境中可以包括是人、位置,或者與學(xué)生和應(yīng)用交互相關(guān)的真實或虛擬的對象,包括學(xué)生和應(yīng)用本身[20]。
1.數(shù)據(jù)來源
用于刻畫學(xué)生學(xué)習(xí)情境特征的數(shù)據(jù)集主要來源于各類移動終端設(shè)備、泛在智能學(xué)習(xí)環(huán)境。隨著網(wǎng)絡(luò)的普及、虛擬環(huán)境、仿真技術(shù)和人機交互的迅速發(fā)展,人們可以不受時間和空間的限制,在移動環(huán)境中隨時獲取自己所需要的信息和服務(wù),進(jìn)行移動學(xué)習(xí)。研究者開始關(guān)注移動學(xué)習(xí)所具有的特點,希望通過對各類移動終端設(shè)備和泛在智能學(xué)習(xí)環(huán)境中與學(xué)習(xí)相關(guān)的數(shù)據(jù)進(jìn)行分析,判斷學(xué)生與各種學(xué)習(xí)應(yīng)用之間的關(guān)系以及學(xué)生之間的關(guān)系[21]。 2.數(shù)據(jù)項 情境描述為人機交流的環(huán)境中所包含的各種信息,包括個人基本信息、計算機運行的平臺和網(wǎng)絡(luò)信息以及人所處的環(huán)境信息[22]。情境數(shù)據(jù)集中所包含的數(shù)據(jù)項應(yīng)該分為描述個人基本信息的數(shù)據(jù)項,描述計算機系統(tǒng)或運行平臺和網(wǎng)絡(luò)特征的數(shù)據(jù)項以及用于描述個人所處環(huán)境特征的數(shù)據(jù)項。情境數(shù)據(jù)集中所包含的數(shù)據(jù)項范圍廣泛,具有復(fù)雜性、多變性和豐富性等特點。對情境數(shù)據(jù)集中的數(shù)據(jù)項進(jìn)行合理的整合和分析能夠為特定情形中的情境主體提供完整的特征描述。
3.數(shù)據(jù)收集方法
情境數(shù)據(jù)集中各類數(shù)據(jù)項的收集主要通過將傳感器置人移動終端中白動獲取學(xué)生的情境數(shù)據(jù)日志。在當(dāng)今移動設(shè)備越來越普遍的環(huán)境下,通過各種傳感器獲取底層的情境數(shù)據(jù)變得越來越容易,這為更好地基于學(xué)生特定的學(xué)習(xí)情境為其提供個性化的學(xué)習(xí)資源提供了數(shù)據(jù)支撐。
4.在學(xué)習(xí)分析中的應(yīng)用
情境數(shù)據(jù)集在學(xué)習(xí)分析中的應(yīng)用主要表現(xiàn)為:(1)在對移動環(huán)境中學(xué)生學(xué)習(xí)相關(guān)情境數(shù)據(jù)的采集、分析和利用為學(xué)生構(gòu)建一個穩(wěn)定并且可擴展的智能學(xué)習(xí)空間,如白適應(yīng)性超媒體系統(tǒng)、智能導(dǎo)師系統(tǒng)等。(2)基于情境數(shù)據(jù)集的學(xué)生個性化需求推送。通過對學(xué)生問題及問題情境數(shù)據(jù)的析取和重組形成學(xué)生所需知識產(chǎn)品動態(tài)信息,并以不同的表現(xiàn)形式推介給學(xué)生。
(三)注意元數(shù)據(jù)集
注意元數(shù)據(jù)集是用于描述學(xué)生某個特定情景下發(fā)生的一系列行為的數(shù)據(jù)項的集合[23]。
1.數(shù)據(jù)來源
注意元數(shù)據(jù)集中的數(shù)據(jù)項大多來自各類與學(xué)生學(xué)習(xí)相關(guān)的數(shù)據(jù)系統(tǒng)。這些系統(tǒng)可以是個人信息管理系統(tǒng)、學(xué)習(xí)對象保存系統(tǒng)、知識管理系統(tǒng)、工作流系統(tǒng)、學(xué)習(xí)管理系統(tǒng)、網(wǎng)絡(luò)瀏覽器、制作工具(如OpenOffice、PowerPoint等用于制作新資源、修改新資源的行為)、視頻會議系統(tǒng)。 2.數(shù)據(jù)項 Wolper等人提出了一個用于捕獲學(xué)生在不同應(yīng)用中的注意元數(shù)據(jù)的集合,并以圖的形式形象化表示模型中所包含的數(shù)據(jù)項,如上頁圖6所示。
上述數(shù)據(jù)集中不僅包含了用于描述學(xué)生行為本身的數(shù)據(jù)項,也包含了描述行為處理的對象及發(fā)生的情景特征等方面的數(shù)據(jù)項。這一數(shù)據(jù)集為研究學(xué)生多種類型的觀察注意焦點提供了可能。
2011年,Maren Schffeel等人在上述數(shù)據(jù)集基礎(chǔ)上進(jìn)行了修改,提出了以事件為起始點的情景化注意元數(shù)據(jù)集,如圖7所示,更適用于分析和評估學(xué)生觀察注意力水平。
3.數(shù)據(jù)收集方法
Claudia Roda等人將注意元數(shù)據(jù)項的收集方法歸納為:心理生理學(xué)觀察(通過腦電圖、心電圖獲得心跳、心律變化等獲得)、物理觀察(通過鼠標(biāo)移動、眼球移動跟蹤、觀察擊鍵、聲音檢測等獲得)、應(yīng)用程序收集(利用Attention Recorder等收集并利用APML描述應(yīng)用程序與環(huán)境的交互信息)、用戶的輸入(為用戶提供輸入自己的興趣愛好、學(xué)習(xí)需求、改進(jìn)建議等)4大類[26]。
由于利用應(yīng)用程序進(jìn)行注意力元數(shù)據(jù)項的自動收集具有簡化用戶任務(wù),保持檢查統(tǒng)一性等優(yōu)勢,而在學(xué)習(xí)分析中被廣泛使用。但現(xiàn)有研究中還主要停留在通過開源代碼應(yīng)用程序?qū)W(xué)習(xí)管理系統(tǒng)或個人信息管理系統(tǒng)的日志文件進(jìn)行自動獲取。另外,有少量研究者采用LinuxKernel的核心部件Inotify,通過Java編程實現(xiàn)jNotify的事件監(jiān)聽器來跟蹤學(xué)生計算機桌面系統(tǒng)中的文件變化,或者利用JavaMail的應(yīng)用程序接口來跟蹤電子郵件客戶端用戶對電子郵件的處理順序和動作[2]。
物理觀察和心理生理學(xué)觀察兩種方法需要比較精密的儀器,數(shù)據(jù)收集相對耗時較長,在學(xué)習(xí)分析領(lǐng)域應(yīng)用較少。由于學(xué)生通常具有一定的保密心理,通常不太愿意主動向系統(tǒng)輸入自己的需求、愛好等個人信息,通過用戶輸入收集數(shù)據(jù)項的方法在學(xué)習(xí)分析相關(guān)研究中也很少現(xiàn)。
4.在學(xué)習(xí)分析中的應(yīng)用
注意元數(shù)據(jù)捕獲學(xué)生行為發(fā)生的時間、地點(在哪些學(xué)習(xí)應(yīng)用程序中發(fā)生)、主要行為(如下載/上傳資源、發(fā)帖或回復(fù)等)等方面的細(xì)節(jié),這類被采集到的數(shù)據(jù)能夠更加真實地還原學(xué)生的學(xué)習(xí)過程或?qū)W習(xí)軌跡。
注意元數(shù)據(jù)集在學(xué)習(xí)分析中的應(yīng)用
主要表現(xiàn)在:(1)對學(xué)生的學(xué)習(xí)興趣和目
標(biāo)進(jìn)行分析,進(jìn)而向?qū)W生推薦滿足其個
性化需求的學(xué)習(xí)資源;(2)通過對多個學(xué)
生相關(guān)的注意元數(shù)據(jù)的獲取和分析,構(gòu)
建更加真實反映學(xué)生行為的學(xué)生模型,
突破傳統(tǒng)靜態(tài)的學(xué)生行為模型;(3)學(xué)習(xí)
平臺性能和資源應(yīng)用效果測試;(4)虛擬據(jù)
社區(qū)可以以注意元數(shù)據(jù)為依據(jù)進(jìn)行虛擬興趣小組的劃分,實現(xiàn)組內(nèi)資源共享;(5)根據(jù)收集到的注意元數(shù)據(jù)判斷學(xué)生的注意力分配特點及存在的問題,并對其注意行為進(jìn)行干預(yù)。
五、數(shù)據(jù)集整體應(yīng)用現(xiàn)狀
目前,各類數(shù)據(jù)集被廣泛應(yīng)用到學(xué)習(xí)分析中,為回答“誰在學(xué)” “學(xué)什么” “怎樣學(xué)” “學(xué)的結(jié)果如何”等問題提供了新的途徑。在數(shù)據(jù)來源、數(shù)據(jù)項、收集方法和學(xué)習(xí)分析應(yīng)用四個方面體現(xiàn)出了各自的特點和趨勢。
(一)數(shù)據(jù)來源由集中式教育信息系統(tǒng)走向分布式學(xué)習(xí)環(huán)境
學(xué)習(xí)分析通過對教育數(shù)據(jù)集進(jìn)行分析來支持學(xué)習(xí)過程。學(xué)習(xí)分析中使用到的教育數(shù)據(jù)集其來源主要有7類:學(xué)生信息系統(tǒng)(SIS)、傳統(tǒng)學(xué)習(xí)管理系統(tǒng)(LMS)、網(wǎng)絡(luò)課程、社交媒體、自適應(yīng)智能教育系統(tǒng)(包括智能導(dǎo)師系統(tǒng)、白適應(yīng)超媒體系統(tǒng))、個人學(xué)習(xí)環(huán)境、公共數(shù)據(jù)系統(tǒng)。Chatti等人對學(xué)習(xí)分析中的數(shù)據(jù)來源進(jìn)行了分類,指出教育數(shù)據(jù)集的來源主要可以分為集中式的教育系統(tǒng)和分布式的學(xué)習(xí)環(huán)境[28]。
集中式的教育系統(tǒng)主要以學(xué)生信息系統(tǒng)、傳統(tǒng)學(xué)習(xí)管理系統(tǒng)、白適應(yīng)智能教育系統(tǒng)為代表,如Moodle,Blackboard。集中式的教育系統(tǒng)中存儲著大量的學(xué)生活動和交互的日志數(shù)據(jù)。例如登錄或退出平臺、閱讀、下載或上傳學(xué)習(xí)材料、參與測試、添加評論等。這類教育系統(tǒng)中的數(shù)據(jù)集通常用于發(fā)現(xiàn)和分析正規(guī)學(xué)習(xí)環(huán)境中學(xué)生的學(xué)習(xí)特點,以此來對學(xué)生的學(xué)習(xí)結(jié)果或?qū)W習(xí)行為進(jìn)行評價、預(yù)測或干預(yù)。
各種開源、社會性軟件的出現(xiàn)讓學(xué)生進(jìn)行跨平臺、跨系統(tǒng)的學(xué)習(xí)成為可能,教師開始注重學(xué)生之間思想內(nèi)容的碰撞,各種生成性內(nèi)容大量產(chǎn)生。隨著用戶生成性內(nèi)容的大量產(chǎn)生,基于分布式學(xué)習(xí)環(huán)境中的教育數(shù)據(jù)集的學(xué)習(xí)分析變得越來越重要,并逐漸受到關(guān)注。社交媒體和個人學(xué)習(xí)環(huán)境是分布式學(xué)習(xí)環(huán)境的最好體現(xiàn)。社交媒體和個人學(xué)習(xí)環(huán)境中的數(shù)據(jù)來源于正式和非正式學(xué)習(xí)過程中,它們以不同的形式存在不同的空間、時間和媒介中。學(xué)習(xí)和知識的創(chuàng)造往往是分布在不同的媒介和網(wǎng)絡(luò)環(huán)境中的[29]。因此,通過對分布式學(xué)習(xí)環(huán)境中的教育數(shù)據(jù)集進(jìn)行分析了解學(xué)生學(xué)習(xí)和知識創(chuàng)造的過程是非常有必要的。
另外,云技術(shù)的發(fā)展為學(xué)生學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)提供了無限存儲空間,Dietze等人開始關(guān)注相互鏈接的數(shù)據(jù)云,希望通過探究不同數(shù)據(jù)集之前的聯(lián)系來實現(xiàn)資源的推薦poJ。目前這方面的研究還處于起步階段,但未來這應(yīng)該會成為學(xué)習(xí)分析中數(shù)據(jù)集的一個重要來源。
(二)各類數(shù)據(jù)集所含數(shù)據(jù)項之間存在重合,但側(cè)重點有所不同
數(shù)據(jù)項是數(shù)據(jù)集中具有更好粒度水平的可用數(shù)據(jù)元素,包括與學(xué)生行為有關(guān)的數(shù)據(jù)信息、學(xué)生/教師人口統(tǒng)計學(xué)信息、學(xué)習(xí)資源相關(guān)信息、學(xué)習(xí)情境數(shù)據(jù)、表示學(xué)習(xí)結(jié)果的數(shù)據(jù)信息五大類。
各類數(shù)據(jù)集在數(shù)據(jù)項上存在一定的重合,但側(cè)重點有所不同。網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)集中更多關(guān)注行為類型特征數(shù)據(jù)項,情境數(shù)據(jù)集中主要關(guān)注表征學(xué)生網(wǎng)絡(luò)或平臺特征方面的數(shù)據(jù)項,注意元數(shù)據(jù)集主要關(guān)注學(xué)生注意力分配特點方面的數(shù)據(jù)項。學(xué)習(xí)分析所解讀的數(shù)據(jù)通常不局限來源于單一數(shù)據(jù)集,需要根據(jù)學(xué)習(xí)分析的目標(biāo)整合多種類型數(shù)據(jù)集中的數(shù)據(jù)項。
(三)自動獲取將逐漸成為主要的數(shù)據(jù)收集方法
現(xiàn)有學(xué)習(xí)分析中數(shù)據(jù)的收集方法由基于代理服務(wù)器和Web日志挖掘的方法逐漸向基于服務(wù)器和客戶端相結(jié)合的方法轉(zhuǎn)變,利用開源軟件或程序進(jìn)行數(shù)據(jù)的自動獲取,但目前自動獲取的數(shù)據(jù)大部分來源于集中式的教育系統(tǒng),分布式學(xué)習(xí)環(huán)境中相關(guān)數(shù)據(jù)集的獲取還存在一定的難度。
(四)推薦與構(gòu)建動態(tài)學(xué)生模型是數(shù)據(jù)集在學(xué)習(xí)分析中的主要應(yīng)用體現(xiàn),智能化學(xué)習(xí)環(huán)境的構(gòu)建逐漸引起關(guān)注
數(shù)據(jù)集在學(xué)習(xí)分析中的應(yīng)用總結(jié)為六個方面:(1)預(yù)測學(xué)生的表現(xiàn)和建構(gòu)學(xué)生動態(tài)模型;(2)推薦相關(guān)的學(xué)習(xí)資源,包括學(xué)習(xí)材料、學(xué)習(xí)工具、學(xué)習(xí)群體等;(3)促進(jìn)學(xué)生的反思和注意力;(4)監(jiān)測學(xué)生的不良學(xué)習(xí)行為;(5)評估學(xué)生之間的交互效果;(6)構(gòu)建持續(xù)、動態(tài)、可擴展的智能個性化學(xué)習(xí)空間。
各類數(shù)據(jù)集都可以應(yīng)用于推薦和構(gòu)建動態(tài)學(xué)生模型。網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)集在交互效果預(yù)測、監(jiān)測不良學(xué)習(xí)效果方面應(yīng)用廣泛,情境數(shù)據(jù)集在構(gòu)建智能學(xué)習(xí)空間中應(yīng)用廣泛,注意元數(shù)據(jù)集更多的應(yīng)用于對學(xué)生注意力分配特點和干預(yù)效果的預(yù)測。
整體來說,學(xué)習(xí)分析中的數(shù)據(jù)集的類別在不斷地擴充,出現(xiàn)了學(xué)生知識領(lǐng)域數(shù)據(jù)集、學(xué)習(xí)資源推薦系統(tǒng)數(shù)據(jù)集,但這些數(shù)據(jù)集都是以上面三種數(shù)據(jù)集為基礎(chǔ),根據(jù)研究目的,從上面三種數(shù)據(jù)集中的數(shù)據(jù)項進(jìn)行重新篩選和整合而成。
六、數(shù)據(jù)集應(yīng)用面臨的挑戰(zhàn)
各類數(shù)據(jù)集在學(xué)習(xí)分析中得到廣泛應(yīng)用,并且數(shù)據(jù)集的種類在不斷地擴展,但在應(yīng)用的過程中依然面臨著大量的挑戰(zhàn)。
(一)缺乏利用數(shù)據(jù)來描述學(xué)習(xí)的標(biāo)準(zhǔn)
各個教育機構(gòu)或教育者對學(xué)習(xí)描述存在很大的差異,缺乏描述學(xué)習(xí)的通用數(shù)據(jù)模型。這導(dǎo)致他們對學(xué)習(xí)行為的拆分標(biāo)準(zhǔn)存在很大的差異,進(jìn)而導(dǎo)致學(xué)生學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)大部分是以不同的形式存儲在不同的學(xué)習(xí)系統(tǒng)、工具和應(yīng)用中。通常相同類型的數(shù)據(jù)項在不同的學(xué)習(xí)系統(tǒng)或平臺中有著不同的表達(dá)形式,不同系統(tǒng)或平臺上的交互數(shù)據(jù)缺乏統(tǒng)一的描述和存儲標(biāo)準(zhǔn),從而阻止了不同的系統(tǒng)或平臺中數(shù)據(jù)之間的共享和重復(fù)使用。為了確保數(shù)據(jù)能夠在不同系統(tǒng)或平臺中實現(xiàn)共享和互操作,學(xué)習(xí)分析領(lǐng)域需要研究通用的數(shù)據(jù)模型來對學(xué)習(xí)者的學(xué)習(xí)進(jìn)行描述。未來數(shù)據(jù)集中數(shù)據(jù)項的共享和重用在學(xué)習(xí)分析領(lǐng)域需要進(jìn)一步的探索和研究。
(二)學(xué)生學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)沒有被全部記錄
數(shù)據(jù)集來源在不斷擴展,但具體實踐中,學(xué)習(xí)分析相關(guān)研究的數(shù)據(jù)集主要還是來源于單一的集中式教育系統(tǒng)。這些教育系統(tǒng)具有固定的功能,一般只能記錄某幾類學(xué)習(xí)數(shù)據(jù)。學(xué)生在學(xué)習(xí)過程中產(chǎn)生的有些能夠反映其特定學(xué)習(xí)習(xí)慣的數(shù)據(jù)并沒有得到記錄。這可能會導(dǎo)致具體學(xué)習(xí)分析中獲得的數(shù)據(jù)并不是學(xué)生在學(xué)習(xí)過程中產(chǎn)生的全部數(shù)據(jù),進(jìn)而導(dǎo)致在此基礎(chǔ)上通過學(xué)習(xí)分析獲得的學(xué)生學(xué)習(xí)規(guī)律或產(chǎn)生的預(yù)測結(jié)果并不能真實、正確地表征學(xué)生的學(xué)習(xí)過程。未來,綜合單一數(shù)據(jù)系統(tǒng)中的數(shù)據(jù)項,構(gòu)建聚合數(shù)據(jù)項的數(shù)據(jù)模型,獲取能夠正確反映學(xué)習(xí)過程的數(shù)據(jù)應(yīng)該是未來數(shù)據(jù)集在學(xué)習(xí)分析中的一個應(yīng)用方向。
(三)數(shù)據(jù)收集和處理技術(shù)有待進(jìn)一步提高
數(shù)據(jù)集的來源由集中式教育系統(tǒng)向分布式學(xué)習(xí)環(huán)境擴展,學(xué)習(xí)分析領(lǐng)域希望能夠自動獲取學(xué)生的全量數(shù)據(jù),現(xiàn)有的數(shù)據(jù)收集方法雖然已經(jīng)開始向自動獲取轉(zhuǎn)變,但這種方法獲取的數(shù)據(jù)還局限于單一的學(xué)習(xí)系統(tǒng)或平臺,獲取的數(shù)據(jù)并不能映射學(xué)生的全部學(xué)習(xí)過程。未來需要開發(fā)出能夠?qū)崟r自動抓取學(xué)生在不同學(xué)習(xí)系統(tǒng)或平臺上產(chǎn)生的全部數(shù)據(jù)的數(shù)據(jù)收集T具。
(四)數(shù)據(jù)收集使用隱私性問題
在數(shù)據(jù)收集和使用的過程中通常會涉及到學(xué)生隱私權(quán)和機構(gòu)、組織對數(shù)據(jù)收集使用的許可問題。在對學(xué)生數(shù)據(jù)進(jìn)行收集和分析前,研究者通常需要告知學(xué)生,并且需要得到本人的許可后才能收集和分析他們的個人信息。同時,還需要得到這些數(shù)據(jù)的組織或提供者的同意和批準(zhǔn)。但學(xué)生一般不希望透露自己的個人信息,并且大部分組織或機構(gòu)不愿意提供自己系統(tǒng)或平臺上的數(shù)據(jù)。學(xué)習(xí)分析實踐中存在著學(xué)生在學(xué)習(xí)中產(chǎn)生了“大數(shù)據(jù)”,但研究者卻苦于無法獲得這些“大數(shù)據(jù)”的現(xiàn)象。學(xué)習(xí)分析領(lǐng)域還需要制定相應(yīng)的制度來擴大數(shù)據(jù)的公開性。同時,組織或機構(gòu)之間應(yīng)該建立比較友好的數(shù)據(jù)共享關(guān)系。
參考文獻(xiàn):
[1]殷丙山學(xué)習(xí)分析技術(shù)將成未來關(guān)注重點-2012年和2013年《新媒體聯(lián)盟地平線報告(高等教育版)》比較解讀…中國教育網(wǎng)絡(luò),2013(10):35-36.
[2][8]Siemens,G.,&Gasevic,D.Proreedings of the lst conference onLearning Analytics and Knowledge[M].New York,NY:ACM, 2011.1-185
[3]高鍵,張海,王以寧.教育中的大數(shù)據(jù)如何改變學(xué)習(xí)?——極具潛力的學(xué)習(xí)分析技術(shù)領(lǐng)域新進(jìn)展j忡國信息技術(shù)教育2013,(8):195-197.
[4] Greller,W.,&Drachsler,H.'l'ranslating learning into numbers:AgenPric framework for learning analytics[J]. Lducational Technologyand SoCIety,2012,19(3), 42-57.
[5][6]魏雪峰,宋靈青.學(xué)習(xí)分析:更好地理解學(xué)生個性化學(xué)習(xí)過程——訪談學(xué)習(xí)分析研究專家George Siemens教授[J]中國電化教育,2013,(9):1-4.
[7]孫洪濤.學(xué)習(xí)分析視角下的遠(yuǎn)程教學(xué)交互分析案例研究[J]中國電化教育,2012,(11):40-46.
[9] H.Drachsler,T.BogPrs,R.Vuorikari,K.Verhert,E. Duval,N.Manouselis,G.Beham,S. Lindstaedt,H. Stern,M.Friedrich, and M.Wolpers. Issues and considerations regarding sharable data sets forrecommender svstems in technology enhanced learning[J]. ProcediaComputer Science, 2010,1(2):2849-2858.
[10] Verbert, K., Manouselis,N.,Drachsler, H.,&Duval,E.Dataset-Driven Research to Support Learning and Knowledge Analytics[J].Lducational Technology&Society, 2012,15 (3), 133-148.
[11][12]郁曉華,顧小清.學(xué)習(xí)活動流——一個學(xué)習(xí)分析的行為模型[J].遠(yuǎn)程教育雜志,2013,(4):20-28.
[13] Valentin Butoianu, Philippe Vidal, Katrien VerVbert, Erik Duval,Julien Broisin. User Context and PPrsonalized Learning:a Federationof Contextualized Attention Metadata[J]. Joumal of Universal ComputerScience, 2010?16(16), 2252-2271.
[14] ll-Hyun Jo,Dongho Kim,MPPhyun Yoon. Analyzing the Log Patternsof Adult LearnPrs in LMS Using Learning Analytics[DB/OL].http://dx.doi.org/10.1145/2567574.2567616,2015-06-16.
[15] Koulocheri E,Soumplis A,Xenos M.Applying Learning Analyticsin an Open Personal Learning Lnvironment:A QuantitativeApproach[DB/OL].https://www.infona.pl/resource/bwmeta l.element.ieee-art-000006377407, 2015 -02-12.
[16] Verhert, K., Manouselis,N.,Drachsler, H.,&Duval,E.Dataset-Driven Research to Support Learning and Knowledge Analytics[J].Lducational Technology&Society, 2012,15 (3), 133-148.
[17][19]廖競,張暉.一種靈活的網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)采集與分析系統(tǒng)[J]信息與電腦(理論版),2011,(1):85-86.
[18] Lyndon Walker. Twitter Learning Analytics in R. ascilite Conference,http://www.ascilite.org/conferences/Wellington12/2012/images/ustom/walker,- lyndon一- twitter learning.pdf,2015-05-15.
[20] Dey A K,Abowd G D,Salber D.A Conceptual Framework and a Toolkitfor Supporting the Rapid Prototyping of Contex- aware Applications[J].Joumal of Hunan Computer Interar,tion,2001,16(2):97-166.
[21] Simon Knight, Simon Buckingham Shum ,Karen Littleton. Epistemology,Pedagogy, Assessment and Leaming Analytics[DB/OL]. http://oro.open.ac.uk/3663 5/1/LAK13 0/c20Fmalo/c20paper.pdf,2015 -04-16.
[22]喬哲峰.自適應(yīng)情景感知中間件的情景數(shù)據(jù)預(yù)處理模型研究與實現(xiàn)[D].上海:華東師范大學(xué),2011.
[23] Chair's Message of CAMA 2006[EB/OL]. http://portalparts. acm.org /1190000 /1183604/fm/front matter.pdf,2015-4-18
[24] MarinWolpers, Jehad Najjar, Katrien Verhert, et a.l. ContextualizedAttention Metadata Across System Boundaries[LB/OL]. http://ariadne. cs. kuleuven. ac. be/cam a2007/slides /Wolpers.ppt, 2015-4-18.
[25] Maren Scheel, Katja Niemann, Abelardo Pardo,Derick Leony, MartinFriedrich, Kerstin Schmidt,Martin Wolpers, and Carlos Delgado Kloos.Lsage Pattern Recognition in Student Activities[J]. Towards UbiquitousLeaming Lecture Notes in Computer Science,2011,(6954):341-355.
[26] Claudia Roda, 'l'hierry Nabeth. Supporting Attention in LearningEnvironments: Attention Support Services and InformationManagement[EB/OL].http: / /www. ac. aup. fr/croda /publications /Ecte107.Pdf, 2015-4-18.
[27] Belizki J, Costache S, Nejdl W. Application independent nwtadatageneration[DB/OL]. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.86.2212&rep=repl&type=pdf, 2006.
[28] Chatti M A, Dyckhoff A L, Schroeder U, et al. A reference,e model forLearning analytics[J]. International Journal of Technology EnhanedLearning, 2012, 4(5-6): 318-331.
[29] Suthers D. & Rosen D. A unified framework for multi-level analysisof distrihutecl learning[DB/OL]. http://lilt.ics.hawaii.edu/papers/2011/Suthers-Rosen-LAK-201 l-Final.pdf, 2011.
[30] Dietze S, Drachsler H, Ciordano D. A SurVP.y on Linked Data andthe Social Web as facilitators for TEL recommender systems[M]. NewYork: Springer, 2014.47-75.
作者簡介:
張艷霞:在讀碩士,研究方向為教師網(wǎng)絡(luò)研修(zhangyanxia16@163.com).
孫洪濤:高級工程師,研究方向為遠(yuǎn)程教學(xué)交互、學(xué)習(xí)分析和教師專業(yè)發(fā)展(sunhtao@gnlail.com)。
李爽:副教授,碩士生導(dǎo)師,研究方向為遠(yuǎn)程教育基本理論、遠(yuǎn)程學(xué)習(xí)支持、學(xué)習(xí)分析(lilybnu@bnu.edu.cn)。
陳麗:教授,博士生導(dǎo)師,北京師范大學(xué)遠(yuǎn)程教育研究中心主任、交互媒體與遠(yuǎn)程學(xué)習(xí)實驗室主任,研究方向為遠(yuǎn)程教育的理論與實踐(lchen@bnu.edu.cn)。
How to Use the Data to Describe the Learning Process
-A Review of Data Sets Used in Learning Analytics
Zhang Yanxial.2, Sun Hongta03,Li Shuangl.2, Chen Li4 (l.Research Centre of Distance Education, Beijing Normal University, Beijing 100875; 2.Interactive Media and Distance Learning, Beijing Normal University, Beijing 100875;3.Education Technology Center, Minzu University of China, Beijing 100081; 4.Capital Institute for the Learning Society, Beijing Normal University, Beijing 100875) Abstract: Huge amount oflearners' dataset is stored in education information systems with different formats and different granularity levels. These data provide the possibility to find and solve the problems of students in the learning process using learning analytics. However, how to use the appropriate data to describe the learning process of learners is still a great challenge for researchers. The data set is one of the core issues of Learning Analytics research. This article firstly provides a review of the typical data sets of learning analytics. Then we analyze and compare the objectives of analysis, the categories of models, the sources of data, the specific data items and the methods of analysis of the typical data sets. Finally, this paper presents the summary and analysis of the current situation and trend of research on data models of learning analytics. Tlus article shows a general picture of data sets in the field of learning analytics and lays the foundation for subsequent research in the future. Keywords: Leanung Analytics; Data Sets; Learning Process
收稿日期: 2015年6月22日
責(zé)任編輯:趙興龍