楊杉
摘要:為深入了解高校學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為特征,以四川省某高校網(wǎng)絡(luò)學(xué)習(xí)平臺的數(shù)據(jù)為研究對象,對學(xué)生學(xué)習(xí)行為進(jìn)行了深入分析和研究,利用多維度的網(wǎng)絡(luò)測評數(shù)據(jù)對學(xué)生的學(xué)習(xí)狀況進(jìn)行了聚類分析,利用任務(wù)點(diǎn)完成情況的數(shù)據(jù)學(xué)生測驗(yàn)分?jǐn)?shù)的影響進(jìn)行了聚類挖掘,并對不同學(xué)習(xí)狀況下學(xué)生作業(yè)成績是否及格進(jìn)行了決策樹挖掘。通過以上分析來判定各類學(xué)生的在線學(xué)習(xí)特征和學(xué)習(xí)效果,從而為學(xué)生分類培養(yǎng)及個性化教育提供信息支撐,也為高校在線教育質(zhì)量的改進(jìn)提供借鑒。
關(guān)鍵詞:聚類算法;決策樹;網(wǎng)絡(luò)學(xué)習(xí);數(shù)據(jù)挖掘;行為研究
中圖分類號:TP311.13? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)10-0213-04
Abstract: Taking the data of a university's online learning platform in Sichuan Province as the research object, we conducted in-depth analysis and research on students' learning behavior, using multi-dimensional network evaluation data to cluster the students' learning status, and using data on the completion of task points Cluster mining is carried out on the influence of students' test scores, and decision tree mining is carried out on whether students pass or not under different learning conditions. Through the above analysis, the online learning characteristics and learning effects of various types of students are determined, so as to provide information support for student classification and personalized education, and also provide a reference for improving the quality of online education in universities.
Keywords: clustering algorithm; decision tree; network learning; data mining;behavioral research
隨著互聯(lián)網(wǎng)教育的發(fā)展,各種網(wǎng)絡(luò)媒體也日新月異。新時(shí)代、新技術(shù)、新趨勢使在線教育形式也越來越豐富,同時(shí)也成為未來教育的重要組成部分[1]。尤其是2020年疫情以來,網(wǎng)絡(luò)教學(xué)成為各大高校疫情期間教學(xué)的主要形式[2],在特殊時(shí)期發(fā)揮了不可忽視的作用,同時(shí)也累積了大量的學(xué)生在線學(xué)習(xí)數(shù)據(jù),為研究學(xué)生的在線學(xué)習(xí)行為提供了豐富的素材[3]。通過對學(xué)生在線學(xué)習(xí)數(shù)據(jù)的分析和挖掘[5],可以了解學(xué)生的在線學(xué)習(xí)完成情況、影響因素和完成效果,評判在線學(xué)習(xí)與線下學(xué)習(xí)的優(yōu)劣等[6],并依據(jù)分析結(jié)論對高校的教學(xué)改革提出意見與建議[7]。此外,還可以通過對學(xué)生的聚類[8],來判定各類學(xué)生的在線學(xué)習(xí)特征,為學(xué)生分類培養(yǎng)及個性化教育提供信息支撐。
1研究思路
以四川省某高校的網(wǎng)絡(luò)教學(xué)平臺為研究對象,對該平臺于2020.3.1-2020.6.30的學(xué)生在線學(xué)習(xí)數(shù)據(jù)進(jìn)行聚類分析、決策樹分析,其中包括對大學(xué)生學(xué)習(xí)的課程中的在線任務(wù)點(diǎn)、視頻學(xué)習(xí)時(shí)長、作業(yè)分?jǐn)?shù)、考試分?jǐn)?shù)和在線互動進(jìn)行分析統(tǒng)計(jì)。通過分析得到學(xué)生在線學(xué)習(xí)行為判斷,為教師改進(jìn)教學(xué)、學(xué)校改進(jìn)管理提供有價(jià)值的信息,從而做出相應(yīng)的改進(jìn)。依據(jù)樣本數(shù)據(jù)各個字段,主要以SPSS為工具,進(jìn)行數(shù)據(jù)挖掘,主要運(yùn)用聚類分析、決策樹對樣本數(shù)據(jù)中的字段進(jìn)行挖掘;最后給出建議,為學(xué)校提供更多的借鑒與參考。
2數(shù)據(jù)說明
2.1 數(shù)據(jù)來源
樣本數(shù)據(jù)來源于四川省某高校網(wǎng)絡(luò)教學(xué)平臺,包含2020.3.1-2020.6.30各個學(xué)院的學(xué)生在線學(xué)習(xí)數(shù)據(jù)。
2.2數(shù)據(jù)清洗
刪除無效字段:該字段列值為空或字段值一樣或?qū)Ψ治鰩椭陀绊懖淮蟆?/p>
刪除異常記錄:作業(yè)完成數(shù)數(shù)量極少,但平均分過高的異常值。
3數(shù)據(jù)挖掘
3.1基于網(wǎng)絡(luò)測評數(shù)據(jù)對學(xué)生學(xué)習(xí)狀況的聚類挖掘
使用聚類的方法]將學(xué)生網(wǎng)絡(luò)測評數(shù)據(jù)(章節(jié)測驗(yàn)平均分、作業(yè)平均分、考試平均分)聚類分析,從而得出網(wǎng)絡(luò)學(xué)習(xí)效果好和網(wǎng)絡(luò)學(xué)習(xí)效果差的類別。
將聚類種類分為兩類,共有三個輸入變量,可以看出其模型效果好,達(dá)到了0.8,如圖1所示;聚類的大小分別為55.2%和44.8%,兩者大小比較相近,如圖2所示。從預(yù)測變量的重要性來看可以看出輸入的三個變量對聚類來說都是比較重要的變量,其重要性系數(shù)都達(dá)到了1,如圖3所示。
從聚類結(jié)果(圖4)來看:
聚類2占比55.2%,該類學(xué)生屬于網(wǎng)絡(luò)學(xué)習(xí)效果較差的學(xué)生,其考試平均成績幾乎為0,且大部分?jǐn)?shù)據(jù)較低水平,在章節(jié)測驗(yàn)成績上平均分?jǐn)?shù)為18分,其數(shù)據(jù)大部分屬于低分,少部分高分,而在作業(yè)平均分上則是50分左右,且數(shù)值偏高。
聚類1占比44.8%,該類學(xué)生屬于網(wǎng)絡(luò)學(xué)習(xí)效果較好的學(xué)生,其考試平均成績?yōu)?7,且大部分?jǐn)?shù)據(jù)較高水平,在章節(jié)測驗(yàn)成績上平均分?jǐn)?shù)為45.5分,其數(shù)據(jù)大部分屬于中等,而在作業(yè)平均分上則是69.9分左右,且數(shù)值偏低。
各項(xiàng)網(wǎng)絡(luò)測驗(yàn)偏高的學(xué)生比各項(xiàng)網(wǎng)絡(luò)測驗(yàn)偏低的學(xué)生其網(wǎng)絡(luò)學(xué)習(xí)效果更好,當(dāng)然不排除部分課程幾乎不會布置網(wǎng)絡(luò)測驗(yàn)等情況。
從網(wǎng)絡(luò)學(xué)習(xí)效果好壞對比來看,網(wǎng)絡(luò)學(xué)習(xí)效果不好的學(xué)生其考試平均分趨近于0,而網(wǎng)絡(luò)學(xué)習(xí)效果較好的同學(xué)其考試平均分更高,大部分屬于80、90分上下。學(xué)習(xí)效果不好的0分居多的情況中不排除其課程較少采用網(wǎng)絡(luò)考試的方式進(jìn)行測驗(yàn)。
從章節(jié)測驗(yàn)成績來看,其網(wǎng)絡(luò)學(xué)習(xí)效果較差的成績0分較多而少部分?jǐn)?shù)據(jù)較好成績,而相比較于前者,網(wǎng)絡(luò)學(xué)習(xí)較好的類別章節(jié)測驗(yàn)成績特點(diǎn)為0分的較少,而成績在80-100分的居多。
從作業(yè)平均成績上比較來看,可以看出網(wǎng)絡(luò)學(xué)習(xí)效果較差的同學(xué)的數(shù)據(jù)更偏向于0,而效果較好的同學(xué)成績比較來看則更向高分的部分偏。
與總體相比較,其網(wǎng)絡(luò)學(xué)習(xí)效果差的學(xué)生其考試平均分、章節(jié)測驗(yàn)平均分的中位數(shù)與總體中位數(shù)相比都屬于非常低,而作業(yè)平均分與總體相比略低于總體的中位數(shù)。
網(wǎng)絡(luò)學(xué)習(xí)好的學(xué)生的網(wǎng)絡(luò)測驗(yàn)成績與總體相比較,其考試平均分明顯高于總體水平,章節(jié)測驗(yàn)平均分與總體相比其差距更大且中位數(shù)高于總體,其作業(yè)的平均分中位數(shù)與總體中位數(shù)相比,略高于總體且數(shù)據(jù)更向高分集中。
從其聚類結(jié)果來看各項(xiàng)網(wǎng)絡(luò)測驗(yàn)偏高的學(xué)生比各項(xiàng)網(wǎng)絡(luò)測驗(yàn)偏低的學(xué)生其網(wǎng)絡(luò)學(xué)習(xí)效果更好,當(dāng)然不排除部分課程幾乎不會布置網(wǎng)絡(luò)測驗(yàn)等情況。
3.2基于任務(wù)點(diǎn)完成情況對章節(jié)測試平均分影響的聚類挖掘
使用SPSS Statistics對章節(jié)測試平均分進(jìn)行排序,數(shù)據(jù)過濾(選擇任務(wù)點(diǎn)完成數(shù)、視頻任務(wù)點(diǎn)完成數(shù)、視頻任務(wù)點(diǎn)觀看時(shí)長、作業(yè)平均分與章節(jié)測驗(yàn)平均分),建立聚類模型。聚類數(shù)為4,凝聚和分離的輪廓測量值為0.7,聚類效果較好,如圖5所示。聚類1的大小占比為81.3%;聚類2的大小占比為0%,聚類3的占比大小為0;聚類4的占比大小為18.6%,如圖6所示。作業(yè)平均分、視頻任務(wù)點(diǎn)觀看時(shí)長、視頻任務(wù)點(diǎn)完成數(shù)以及任務(wù)點(diǎn)完成數(shù),對聚類來說都是比較重要的,變量重要性都為1,如圖7所示。
由聚類結(jié)果可知(圖8):
聚類1是特點(diǎn)為任務(wù)點(diǎn)(視頻)完成質(zhì)量較差、作業(yè)平均分較低、章節(jié)測驗(yàn)平均分低的學(xué)生。
聚類2是特點(diǎn)為任務(wù)點(diǎn)(視頻)完成質(zhì)量較差、作業(yè)平均分高、章節(jié)測驗(yàn)平均分低的學(xué)生。聚類2這類學(xué)生雖然平時(shí)的任務(wù)點(diǎn)完成比較差,章節(jié)測驗(yàn)的平均分比較低,但是作業(yè)平均分卻比較高,說明可能存在平時(shí)作業(yè)抄襲或者使用同組的作業(yè)上交的情況,學(xué)校需要對這類學(xué)生進(jìn)行一個監(jiān)督,管理。
聚類3是任務(wù)點(diǎn)(視頻)完成質(zhì)量較好、作業(yè)平均分較高、章節(jié)測驗(yàn)平均分高的學(xué)生。聚類3這類學(xué)生是平時(shí)上課的任務(wù)點(diǎn)完成的比較認(rèn)真,作業(yè)完成質(zhì)量比較好,章節(jié)測驗(yàn)成績也比較高的三好學(xué)生,但是人數(shù)很少只有一個,則學(xué)校需要注重這類學(xué)生的培養(yǎng)。
聚類4是任務(wù)點(diǎn)(視頻)完成質(zhì)量較好、作業(yè)平均分低、章節(jié)測驗(yàn)平均分較高的學(xué)生。
這說明,學(xué)生任務(wù)點(diǎn)、視頻任務(wù)點(diǎn)完成情況對章節(jié)測試平均分的影響程度較大;作業(yè)平均分的影響程度較小。因此需要督促學(xué)生對于任務(wù)點(diǎn)的學(xué)習(xí)和完成,保證其他學(xué)習(xí)指標(biāo)的完成及質(zhì)量。
3.3不同學(xué)習(xí)狀況下學(xué)生作業(yè)成績是否及格的決策樹挖掘
采用決策樹的方法,在不同的網(wǎng)絡(luò)學(xué)習(xí)狀況下(主要包含:任務(wù)點(diǎn)完成數(shù)、視頻觀看時(shí)長、章節(jié)學(xué)習(xí)次數(shù)、課程專題閱讀時(shí)長、討論總數(shù)、發(fā)帖總數(shù)以及回帖總數(shù))對學(xué)生作業(yè)是否及格進(jìn)行分析。
將作業(yè)是否及格作為目標(biāo)變量可以看出預(yù)測變量中最重要的是章節(jié)學(xué)習(xí)次數(shù)(0.18),其次任務(wù)點(diǎn)完成數(shù)(0.17),再次是課程專題閱讀時(shí)長(0.14),如圖9所示。
從生成的部分規(guī)則集(圖10)可以看出任務(wù)點(diǎn)完成數(shù)大于107小于等于145且任務(wù)點(diǎn)觀看時(shí)長大于125分鐘,沒有回帖則為沒有及格;任務(wù)點(diǎn)完成數(shù)大于107且視頻觀看時(shí)長大于334分鐘,沒有回帖則為沒有及格;而任務(wù)點(diǎn)完成數(shù)大于107且章節(jié)學(xué)習(xí)次數(shù)小于等于68也為不及格。
在結(jié)果為作業(yè)成績及格的部分規(guī)則中可以看出:任務(wù)點(diǎn)完成數(shù)大于89小于等于107、視頻觀看時(shí)長小于等于364、章節(jié)學(xué)習(xí)次數(shù)大于34且發(fā)帖總數(shù)為0的則作業(yè)成績及格;任務(wù)點(diǎn)完成數(shù)大于102小于等于105且章節(jié)學(xué)習(xí)次數(shù)大于136的則作業(yè)成績及格。從圖11中可以看出模型的正確率達(dá)到了90.5%,錯誤率為9.5%,模型的正確率較高,模型效果較好。
從而得出結(jié)論:從其生成的規(guī)則中我們可以明顯看出作業(yè)成績是否及格與其網(wǎng)絡(luò)學(xué)習(xí)的狀況沒有明顯的關(guān)系,其中可以看到,任務(wù)點(diǎn)完成數(shù)大于107且章節(jié)學(xué)習(xí)次數(shù)小于等于68的這類學(xué)生,其作業(yè)成績?yōu)椴患案?任務(wù)點(diǎn)完成數(shù)大于102小于等于105且章節(jié)學(xué)習(xí)次數(shù)大于136的這類學(xué)生,其作業(yè)成績?yōu)榧案?。這充分說明,章節(jié)學(xué)習(xí)次數(shù)不是過大就是過小的狀態(tài)是一種常態(tài),任務(wù)點(diǎn)完成數(shù)為中等程度的學(xué)生,普遍作業(yè)成績?yōu)榧案?,除此而外的其他情況均為不及格。這也間接說明該高校網(wǎng)絡(luò)在線學(xué)習(xí)平臺上,學(xué)生對于老師設(shè)置的任務(wù)點(diǎn)可能存在掛機(jī)的現(xiàn)象,或該門課程老師不太習(xí)慣于使用網(wǎng)絡(luò)在線學(xué)習(xí)平臺來布置學(xué)習(xí)任務(wù)。
4結(jié)論及建議
網(wǎng)絡(luò)學(xué)習(xí)情況對學(xué)生的考試成績具有顯著性影響,網(wǎng)上學(xué)習(xí)情況良好的學(xué)生的考試成績比網(wǎng)上學(xué)習(xí)情況較差的學(xué)生好。
建議老師在網(wǎng)上布置任務(wù)時(shí)系統(tǒng)能夠及時(shí)通知學(xué)生結(jié)束時(shí)間;認(rèn)真批改學(xué)生網(wǎng)上作業(yè)與考試,避免統(tǒng)一批改造成的數(shù)據(jù)不真實(shí)。目前網(wǎng)絡(luò)在線學(xué)習(xí)平臺利用率參差不齊,大部分課程要提高其利用率,并完善網(wǎng)絡(luò)測評的環(huán)境以便能夠更好地進(jìn)行網(wǎng)絡(luò)測驗(yàn)。此外還應(yīng)加強(qiáng)對學(xué)生平時(shí)任務(wù)點(diǎn)完成質(zhì)量的監(jiān)督與管理。
參考文獻(xiàn):
[1] 蔣雯音,張穎,童亞琴.數(shù)據(jù)挖掘方法在網(wǎng)絡(luò)學(xué)習(xí)行為研究中的應(yīng)用[J].電腦知識與技術(shù),2020(6):17-21.
[2] 白雪.基于網(wǎng)絡(luò)學(xué)習(xí)行為聚類分析的在線課堂優(yōu)化策略研究[J].吉林化工學(xué)院學(xué)報(bào),2020(8):44-48.
[3] 肖自乾,陳經(jīng)優(yōu).基于數(shù)據(jù)挖掘聚類算法的網(wǎng)絡(luò)學(xué)習(xí)平臺學(xué)生成績分析[J].電腦知識與技術(shù),2020(7):28-29.
[4] 王堅(jiān),張媛媛,柴艷妹.基于因子分析和聚類分析的學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為研究[J].中國教育技術(shù)裝備,2019(11):3-5.
[5] 趙建偉,彭成圓.教育大數(shù)據(jù)背景下大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為實(shí)證研究[J].當(dāng)代教育實(shí)踐與教學(xué)研究,2019(8):34-35.
[6] 程澤凱,佘星星,謝寧宇.網(wǎng)絡(luò)教學(xué)平臺學(xué)生學(xué)習(xí)數(shù)據(jù)分析[J].常州工學(xué)院學(xué)報(bào),2019(4):77-80.
[7] 王川芳,姚苗苗.基于知識圖譜的網(wǎng)絡(luò)學(xué)習(xí)評價(jià)研究綜述[J].軟件導(dǎo)刊,2019(3):9-12.
[8] 吳林靜,勞傳媛,劉清堂,等.網(wǎng)絡(luò)學(xué)習(xí)空間中的在線學(xué)習(xí)行為分析模型及應(yīng)用研究[J].現(xiàn)代教育技術(shù),2018(6):46-53.
【通聯(lián)編輯:王力】