摘"要:當(dāng)前,利用大數(shù)據(jù)分析技術(shù)對在線學(xué)習(xí)者進(jìn)行行為數(shù)據(jù)分析,探索蘊含在數(shù)據(jù)中的規(guī)律,探討學(xué)習(xí)行為特征對學(xué)習(xí)成效的影響,這方面的工作具有重要的理論和實際意義。利用大數(shù)據(jù)分析結(jié)果,一方面,可以反饋、干預(yù)和預(yù)測學(xué)習(xí)者的學(xué)習(xí)行為及成效,幫助學(xué)習(xí)者更好地掌握學(xué)習(xí)過程、提高學(xué)習(xí)效率;另一方面,也有助于教師和平臺運營人員針對不同的用戶群體提供個性化的環(huán)境和學(xué)習(xí)指導(dǎo),促進(jìn)在線學(xué)習(xí)的可持續(xù)發(fā)展和教育教學(xué)領(lǐng)域的創(chuàng)新與變革。
關(guān)鍵詞:線上學(xué)習(xí);數(shù)據(jù)挖掘;學(xué)習(xí)行為;學(xué)習(xí)成效
一、概述
當(dāng)前線上學(xué)習(xí)蓬勃發(fā)展,廣泛的學(xué)習(xí)人群、豐富的在線課程資源以及多樣化的交互手段產(chǎn)生了大量的學(xué)習(xí)行為數(shù)據(jù)。如何利用大數(shù)據(jù)分析技術(shù)對在線學(xué)習(xí)者進(jìn)行行為數(shù)據(jù)分析,探索蘊含在數(shù)據(jù)中的規(guī)律,探討學(xué)習(xí)行為特征對學(xué)習(xí)成效的影響,這方面的工作具有重要的理論和實際意義。
近年來,國內(nèi)外不少專家學(xué)者在MOOC學(xué)習(xí)者行為分析領(lǐng)域進(jìn)行了實驗和探索,例如,參考文獻(xiàn)[1]中的學(xué)者提出了一種以神經(jīng)網(wǎng)絡(luò)作為分類器的預(yù)測方法對MOOC課程的輟課率進(jìn)行預(yù)測;參考文獻(xiàn)[2]中的學(xué)者根據(jù)行為分析將MOOC學(xué)習(xí)者分為主動者、被動者和旁觀者,并且分析了不同學(xué)習(xí)者的課程完成率。賈積有等人[3]基于北京大學(xué)6門MOOC課程的平臺數(shù)據(jù)對學(xué)習(xí)者的學(xué)習(xí)行為進(jìn)行了統(tǒng)計分析;陳蘭嵐等人[4]基于Canvas"Network提供的MOOC開放數(shù)據(jù)對學(xué)習(xí)者的類型與行為進(jìn)行了分析;林麒麟等人[5]利用KMean聚類的方法對不同人群學(xué)習(xí)行為進(jìn)行聚類,探討了學(xué)習(xí)行為與學(xué)習(xí)成效的關(guān)系。
以上工作豐富了在線學(xué)習(xí)者行為分析領(lǐng)域的研究成果,為本課題的相關(guān)研究提供了堅實的理論基礎(chǔ)。本項目以某大學(xué)網(wǎng)絡(luò)教學(xué)平臺中的慕課數(shù)據(jù)作為基礎(chǔ),收集了同一時期上課的學(xué)生的學(xué)習(xí)行為和學(xué)習(xí)成效數(shù)據(jù),對學(xué)生的學(xué)習(xí)行為特征及其對學(xué)習(xí)成效的影響進(jìn)行了探究分析,以期為在線學(xué)習(xí)和發(fā)展提供有益參考。
二、基于KMEAN聚類的學(xué)習(xí)者類型劃分
本文收集的數(shù)據(jù)信息包括:(1)學(xué)習(xí)者的基本信息(姓名、性別、學(xué)號、專業(yè)、年級);(2)課程信息(課程名稱、學(xué)科類別、課程章節(jié)數(shù)、課程起止時間);(3)學(xué)習(xí)者的學(xué)習(xí)行為信息(簽到次數(shù)、章節(jié)學(xué)習(xí)次數(shù)、作業(yè)次數(shù)、作業(yè)平均分、討論發(fā)帖數(shù)、討論回帖數(shù));(4)學(xué)習(xí)者的學(xué)習(xí)效果信息(學(xué)習(xí)成績)。
對于每名學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù),選取章節(jié)學(xué)習(xí)次數(shù)(Chapter"Learning"Number,CLN)、簽到次數(shù)(Sign"In"Number,SIN)、討論回帖數(shù)(Discussion"Reply"Number,DRN)、作業(yè)平均分(Average"Homework"Scores,AHS)四個特征,利用KMEAN算法進(jìn)行聚類分析,聚類結(jié)果見圖1。此外,根據(jù)聚類結(jié)果,我們計算了每類學(xué)習(xí)者的學(xué)習(xí)特征及學(xué)習(xí)成績均值,分析結(jié)果見表1。
由聚類分析結(jié)果可知,根據(jù)CLN、SIN、DRN、AHS四個特征,把學(xué)習(xí)人群大概分為Cluster1—Cluster4,共四類。其中,Cluster2和Cluster4:章節(jié)學(xué)習(xí)次數(shù)、簽到次數(shù)、討論回帖數(shù)和作業(yè)平均分處于較高水平,屬于在線學(xué)習(xí)學(xué)霸用戶。Cluster2的學(xué)習(xí)章節(jié)次數(shù)明顯高于Cluster4,而且Cluster2熱心幫助同學(xué),討論回帖次數(shù)在四類中也是最高,對應(yīng)的學(xué)習(xí)成效也是最佳。Cluster1和Cluster3:章節(jié)學(xué)習(xí)次數(shù)、簽到次數(shù)、討論回帖數(shù)和作業(yè)平均分處于較低水平,學(xué)習(xí)成效較好。此外,雖然Cluster3的學(xué)習(xí)成效低于Cluster1,但是該類學(xué)習(xí)者屬于積極參與討論型,其討論回帖數(shù)高于后者。不同類間的學(xué)習(xí)成效情況見圖2。
三、基于多元線性回歸的學(xué)習(xí)成效預(yù)測模型
本節(jié)將章節(jié)學(xué)習(xí)次數(shù)、簽到次數(shù)、討論回帖數(shù)、作業(yè)平均分四個特征作為模型自變量,將學(xué)生學(xué)習(xí)成績(Students'"Academic"Performance,SAP)作為因變量,進(jìn)行多元線性回歸分析。表2展示了評價模型所使用的檢驗統(tǒng)計量。從該表可以觀察到R、R2、調(diào)整后的R2、標(biāo)準(zhǔn)估計誤差以及DW統(tǒng)計量(DurbinWatson)。在本研究中,回歸模型調(diào)整后的R2值為0719,表明該模型具有較高的擬合度。此外,DW統(tǒng)計量為1.640,說明模型的殘差存在正自相關(guān)性。
方差分析的結(jié)果顯示,回歸部分的F值為92.332,其相應(yīng)的P值為0,這一數(shù)值小于顯著性水平0.05,由此可以得出章節(jié)學(xué)習(xí)次數(shù)、簽到次數(shù)、討論回帖數(shù)以及作業(yè)平均分對學(xué)生成績的解釋能力非常顯著。表3展示了線性回歸模型的回歸系數(shù)及其他相關(guān)統(tǒng)計量。從該表中可以看出,線性回歸模型的截距項為-6.53,章節(jié)學(xué)習(xí)次數(shù)的回歸系數(shù)為0.005,簽到次數(shù)的回歸系數(shù)為1.668,回帖數(shù)的回歸系數(shù)為0.222,作業(yè)均分的回歸系數(shù)為0.638。值得注意的是,簽到次數(shù)、回帖數(shù)和作業(yè)均分的顯著性水平分別為0.001、0.000和0.000,這表明它們的系數(shù)在統(tǒng)計上非常顯著。由此,我們可以構(gòu)建出以下回歸方程:
表4列出了若干重要的殘差統(tǒng)計量。從該表中可以提取出預(yù)測值、殘差、標(biāo)準(zhǔn)預(yù)測值以及標(biāo)準(zhǔn)殘差的最小值和最大值等關(guān)鍵統(tǒng)計信息。具體來說,殘差的最大值為15.143,而最小值為-45.809,平均值則為0。圖3展示了標(biāo)準(zhǔn)化殘差的直方圖,這幅圖呈現(xiàn)了標(biāo)準(zhǔn)化殘差的頻率分布情況,清晰地表明標(biāo)準(zhǔn)化后的殘差基本符合正態(tài)分布特征。而圖4則呈現(xiàn)了標(biāo)準(zhǔn)化殘差的正態(tài)PP圖。該圖的橫軸代表實際觀察值的累積概率,縱軸則為理論預(yù)期的累積概率。如果樣本數(shù)據(jù)遵循正態(tài)分布類型,那么所有散點應(yīng)當(dāng)大致聚集在對角線附近。根據(jù)圖4的展示結(jié)果,可以確認(rèn)該分布確實如此,進(jìn)一步表明標(biāo)準(zhǔn)化殘差近似遵循正態(tài)分布,這與直方圖所示的結(jié)果一致。
結(jié)語
本文對MOOC學(xué)習(xí)者的學(xué)習(xí)行為和學(xué)習(xí)成效進(jìn)行了探究分析。根據(jù)學(xué)習(xí)者的章節(jié)學(xué)習(xí)次數(shù)、簽到次數(shù)、討論回帖數(shù)及作業(yè)平均分四個特征,利用KMEAN算法對其進(jìn)行聚類,并探討了不同類學(xué)習(xí)者的學(xué)習(xí)特征與學(xué)習(xí)成效之間的區(qū)別。進(jìn)一步地,本文構(gòu)建了學(xué)習(xí)者的學(xué)習(xí)成效與學(xué)習(xí)行為特征之間的多元線性回歸方程,分析結(jié)果表明,學(xué)生的學(xué)習(xí)成績主要受出勤次數(shù)、參與討論次數(shù)和歷次作業(yè)表現(xiàn)的影響。本項目運用數(shù)據(jù)挖掘技術(shù)及統(tǒng)計分析方法,對在線學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行了深入分析,旨在探索學(xué)習(xí)行為數(shù)據(jù)中變量之間潛在的關(guān)系,并研究學(xué)習(xí)行為特征如何影響學(xué)習(xí)成效。通過對大數(shù)據(jù)分析結(jié)果的應(yīng)用,可以為構(gòu)建個性化學(xué)習(xí)模式和優(yōu)化課程教學(xué)設(shè)計提供重要依據(jù),從而增強教學(xué)改革的效果。
參考文獻(xiàn):
[1]Chaplot"D"S,Rhim"E,Kimnbsp;J.Predicting"Student"Attrition"in"MOOCs"using"Sentiment"Analysis"and"Neural"Networks[C].CEUR"Workshop"Proceedings"1432,2015(3):712.
[2]TSENG"S"F,TSAO"Y"W,YU"L"C,et"al.Who"will"pass?Analyzing"learner"behaviors"in"MOOCs[J].Research"and"Practice"in"Technology"Enhanced"Learning,2016,11(1):111.
[3]賈積有,繆靜敏,汪瓊.MOOC學(xué)習(xí)行為及效果的大數(shù)據(jù)分析:以北大6門MOOC為例[J].工業(yè)和信息化教育,2014(9):2329.
[4]陳蘭嵐,宋海虹.基于MOOC數(shù)據(jù)挖掘的學(xué)習(xí)行為和學(xué)習(xí)成效分析[J].教育教學(xué)論壇,2019(21):5051.
[5]林麒麟,李川,俸世洲.基于MOOC數(shù)據(jù)挖掘的學(xué)習(xí)行為與成效研究[J].科技風(fēng),2019(25):246247.
基金項目:中央民族大學(xué)一流本科課程建設(shè)項目“高等數(shù)學(xué)(經(jīng)管類)”(2024—2026)
作者簡介:馮杰(1982—"),女,漢族,山東濰坊人,博士研究生,講師,研究方向:數(shù)據(jù)挖掘、生物信息處理。