杜 宇
(云南交通職業(yè)技術(shù)學(xué)院 交通信息工程學(xué)院,云南 昆明 650500)
全面了解學(xué)生學(xué)習(xí)過程的影響因素,關(guān)注每一個學(xué)生個體的差異表現(xiàn),根據(jù)學(xué)生的個性學(xué)習(xí)特點,對學(xué)生個體的學(xué)業(yè)情況重新數(shù)字畫像,是教育大數(shù)據(jù)的重要應(yīng)用.對學(xué)生學(xué)習(xí)行為進行評價并不僅僅是為學(xué)生的學(xué)習(xí)結(jié)果劃分等級,而是使用大數(shù)據(jù)分析方法對學(xué)生學(xué)習(xí)行為進行數(shù)字畫像,并全面地評價學(xué)生學(xué)習(xí)過程質(zhì)量.其主要應(yīng)用包括:①數(shù)字畫像.基于大數(shù)據(jù)分析的學(xué)習(xí)行為數(shù)字畫像,能清晰地看到學(xué)生各階段學(xué)習(xí)行為帶來的不同影響和結(jié)果,能準(zhǔn)確刻畫出不同學(xué)生個體的學(xué)習(xí)特征.②風(fēng)險預(yù)測.風(fēng)險預(yù)測可以幫助教師根據(jù)學(xué)生的階段性學(xué)習(xí)情況,預(yù)測后面學(xué)習(xí)中將可能出現(xiàn)的不好的結(jié)果,及時發(fā)現(xiàn)學(xué)生在學(xué)習(xí)過程、教師在教學(xué)過程中出現(xiàn)的問題,找出解決方案,反饋教學(xué)過程,讓教師提前對這部分學(xué)生提出警示,調(diào)整學(xué)習(xí)路線,改進教學(xué)策略.③激勵.科學(xué)合理的學(xué)習(xí)評價可以激發(fā)學(xué)生學(xué)習(xí)的內(nèi)在動力.學(xué)生可以在學(xué)習(xí)評價數(shù)據(jù)中清晰地了解到自己在學(xué)習(xí)中成績的進步及付出的努力,同時也能通過學(xué)習(xí)中出現(xiàn)的問題和不足轉(zhuǎn)化為努力學(xué)習(xí)的動力,激勵自己不斷地前進.④學(xué)習(xí)導(dǎo)向.學(xué)習(xí)評價具有很重要的導(dǎo)向作用,評價的結(jié)果可以幫助教師了解教學(xué)的不同階段,學(xué)生的不同學(xué)習(xí)情況,為教學(xué)者調(diào)整教學(xué)目標(biāo)和教學(xué)內(nèi)容起到重要的指導(dǎo)作用.
不同的網(wǎng)絡(luò)學(xué)習(xí)平臺對學(xué)習(xí)數(shù)據(jù)的歸類方法不同,但所反映的行為含義是一致的.本文的研究數(shù)據(jù)全部來源于“超星”學(xué)習(xí)通網(wǎng)絡(luò)學(xué)習(xí)平臺記錄的學(xué)生學(xué)習(xí)行為數(shù)據(jù).根據(jù)對學(xué)習(xí)通平臺的調(diào)研,以及學(xué)生實際使用情況,平臺主要自動記錄了教與學(xué)過程中的三類數(shù)據(jù):學(xué)生上課活動量,主要是學(xué)生課中的活動軌跡.包括簽到數(shù)、投票數(shù)、選人數(shù)、搶答數(shù)、評分?jǐn)?shù)、測驗數(shù)(課中測)、問卷數(shù)、分組任務(wù)數(shù)、在線課堂(參與率)數(shù);學(xué)生課程完成情況,主要是統(tǒng)計學(xué)生完成各種學(xué)習(xí)任務(wù)的數(shù)量.包括任務(wù)點完成數(shù)(教師發(fā)布的各項學(xué)習(xí)任務(wù)完成情況)、視頻點完成數(shù)(微課視頻、操作演示視頻的觀看情況)、作業(yè)完成數(shù)(課后作業(yè)完成情況)、章節(jié)測驗(章節(jié)測驗情況)、考試完成數(shù)(期中、期末考試次數(shù));學(xué)生學(xué)習(xí)訪問量趨勢,主要是從學(xué)生、班級、課程3個角度記錄學(xué)生使用學(xué)習(xí)通平臺訪問課程資源的次數(shù),包括本學(xué)生訪問量、所在班級訪問量、課程整體訪問量.
本文的模型實際運用場景為課程學(xué)習(xí)學(xué)期中,學(xué)生未進行期末考試前,給學(xué)生進行學(xué)習(xí)總體情況數(shù)字畫像,并對綜合成績進行風(fēng)險評價.教師根據(jù)預(yù)測的評價結(jié)果對學(xué)生進行個性化學(xué)習(xí)指導(dǎo),目的是讓學(xué)生對自己上半學(xué)期的學(xué)習(xí)有清晰的自我認(rèn)知,并及時發(fā)現(xiàn)學(xué)習(xí)出現(xiàn)偏差的學(xué)生,使這部分學(xué)生盡快調(diào)整學(xué)習(xí)路線,最終能夠通過課程考核.
基于目前云交院使用的學(xué)習(xí)通網(wǎng)絡(luò)學(xué)習(xí)平臺的數(shù)據(jù)統(tǒng)計,結(jié)合學(xué)生學(xué)習(xí)行為特征的分析內(nèi)容,本文選取的屬性值見表1.
自主學(xué)習(xí)測評表現(xiàn)定義為:學(xué)生在一門課程的學(xué)習(xí)中,除了上述學(xué)習(xí)行為數(shù)據(jù)能夠明確地被學(xué)習(xí)平臺記錄之外,還會存在一些線下自主學(xué)習(xí)行為沒有被平臺記錄到平時成績中,把這些學(xué)習(xí)環(huán)節(jié)也考慮到特征數(shù)據(jù)中,歸結(jié)為自主學(xué)習(xí)表現(xiàn).但實際情況是線下的學(xué)習(xí)行為目前確實很難全面、有效地采集到,因此缺失率較大,在后面的研究中只能予以丟棄.
表1 數(shù)據(jù)特征選取
1.2.1 任務(wù)點完成率
表2 各分?jǐn)?shù)段任務(wù)點完成率
其中各分?jǐn)?shù)段的學(xué)生中沒有完成課程任務(wù)點的占比為0百分比占比.
將成績分布細(xì)化到5分1個組,每組學(xué)生的任務(wù)點完成率均值分布,見下圖1.
從上面的圖表分析可以看出,90分以上的學(xué)生,0任務(wù)點完成率占比幾乎為0;60分?jǐn)?shù)段以下的學(xué)生0任務(wù)點完成率占比和60分?jǐn)?shù)段以上的學(xué)生有顯著差異,為14%;把學(xué)習(xí)成績分組細(xì)化后的數(shù)據(jù)表明,高分?jǐn)?shù)段的學(xué)生任務(wù)點完成率明顯高于低分?jǐn)?shù)段的學(xué)生,其中90分?jǐn)?shù)段以上的學(xué)生平均一門課程任務(wù)點完成率比80~89分?jǐn)?shù)段的學(xué)生高,大約是7%.而60分?jǐn)?shù)段以下的學(xué)生平均一門課程的任務(wù)點完成率不到60分?jǐn)?shù)段以上學(xué)生的一半.上面數(shù)據(jù)分析表明學(xué)生登錄平臺完成教師發(fā)布的各項課程任務(wù)點情況在各分?jǐn)?shù)段上是有顯著變化的,從不同分?jǐn)?shù)段的平均任務(wù)點完成率得出,學(xué)習(xí)效果好的學(xué)生普遍愿意積極配合教師完成所布置的學(xué)習(xí)任務(wù),而學(xué)習(xí)效果差的學(xué)生,特別是不及格的學(xué)生,普遍對課程的各項任務(wù)采取消極、不學(xué)的態(tài)度.研究結(jié)果認(rèn)為學(xué)生登錄平臺的任務(wù)點完成率對學(xué)生學(xué)習(xí)效果會產(chǎn)生較大影響.
1.2.2 在線學(xué)習(xí)時長
學(xué)生學(xué)習(xí)過程中另一個重要的因素還有在線學(xué)習(xí)時長,主要包括課前、課后完成教師發(fā)放的各類在線課程資源的學(xué)習(xí)時間,及有效停留時間的情況統(tǒng)計.反映的是學(xué)生能否主動、認(rèn)真參與到預(yù)習(xí)和復(fù)習(xí)的學(xué)習(xí)環(huán)節(jié).同樣對1 022個樣本進行分析,將不同學(xué)習(xí)時長的學(xué)生按照成績分組: 90~100、80~89、70~79、60~69、60分以下.分別對不同學(xué)習(xí)時長各個分?jǐn)?shù)段的學(xué)生進行統(tǒng)計,計算出各個分?jǐn)?shù)段的學(xué)生人數(shù)占該在線學(xué)習(xí)時長總?cè)藬?shù)的百分比.實驗數(shù)據(jù)見表3.
表3 各分?jǐn)?shù)段不同在線學(xué)習(xí)時長占比
從表中可以明顯看出,在線學(xué)習(xí)時間在100分鐘以下的學(xué)生隨著分?jǐn)?shù)的降低而呈上升的趨勢,絕大部分分布在70分以下分?jǐn)?shù)段;而在線學(xué)習(xí)時間達到150 min以上的學(xué)生隨著分?jǐn)?shù)的降低明顯快速下降,在 80~89分?jǐn)?shù)段間占比較多;200 min以上在線學(xué)習(xí)時間的學(xué)生沒有60分以下,在90~100分?jǐn)?shù)段間明顯占比較大.顯而易見,能較好執(zhí)行教師布置的課前、課后預(yù)習(xí)、復(fù)習(xí)任務(wù)的學(xué)生,更愿意花時間完成各項課程資源的學(xué)習(xí),獲得的學(xué)習(xí)效果與所花時間成正比,而較少花時間在預(yù)習(xí)、復(fù)習(xí)環(huán)節(jié)上的學(xué)生或者是學(xué)習(xí)習(xí)慣較差,或者是學(xué)習(xí)意志較薄弱,學(xué)習(xí)目標(biāo)不明確,不能堅持完成教師布置的學(xué)習(xí)任務(wù).能否配合教師的學(xué)習(xí)要求是將知識技能內(nèi)化于心,掌握學(xué)習(xí)技能的重要標(biāo)志之一,因此認(rèn)為在線學(xué)習(xí)時長對學(xué)生學(xué)習(xí)效果會產(chǎn)生較大影響.
另外,用訪問數(shù)、章節(jié)測驗得分、課程視頻得分、討論數(shù),進行相關(guān)系數(shù)求解,相關(guān)系數(shù)見下表4.
2018年將是國際大石油公司的投資拐點年,連續(xù)3年的投資下降趨勢將正式結(jié)束。根據(jù)近期各公司公布的年度預(yù)算,5家公司2018年合計投資約為1000億美元,同比小幅增長。漲幅受限的主要原因是這些公司仍要確保優(yōu)先分紅,同時投資者對公司的決策制約較大。
表4 綜合成績與其它變量的相關(guān)系數(shù)
明確問題和需求后,根據(jù)問題的分類,選擇模型和算法.選擇模型和算法考慮的因素包括:數(shù)據(jù)訓(xùn)練集的大小、特征的維度、所要解決的問題是否是線性可分、特征是否獨立、對性能有哪些要求等.
分類問題是找出數(shù)據(jù)集中的一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)集中的數(shù)據(jù)項映射到給定的類別中[1-4].回歸分析反映了數(shù)據(jù)集中數(shù)據(jù)的屬性值特性,通過函數(shù)表達數(shù)據(jù)映射的關(guān)系來發(fā)現(xiàn)屬性值之間的依賴關(guān)系.本文嘗試使用分類——回歸的算法生成決策樹模型.模型程序基于scikit-learn python機器學(xué)習(xí)庫實現(xiàn),使用scikit-learn中的DecisionTreeClassifier庫函數(shù)進行分類.決策樹算法采用CART樹算法.
研究實驗當(dāng)中使用了如下2種方法進行預(yù)測,即分類和回歸.
分類:給定某個學(xué)生學(xué)習(xí)行為特征為‘優(yōu)’、‘良’、‘中’、‘低’四類
回歸:給定某個學(xué)生學(xué)習(xí)行為特征量化為分值.
首先按0~19分為低等級;20~39分為中等級;40~50分為良等級;51~60分為優(yōu)等級規(guī)則,對連續(xù)的學(xué)生成績離散化處理.
對所有特征歸一化處理.將數(shù)據(jù)集按8∶2比列劃分訓(xùn)練集和測試集.
建立決策樹模型,得出分類正確率,見下表5.
對分類樹模型進行參數(shù)調(diào)優(yōu).用GridSearchCv尋找決策樹分類模型的最好參數(shù).當(dāng)采用Gini系數(shù)計算不純度,最大樹深度為28,且平衡樣本分類權(quán)重時,模型效果提升最明顯, 也是目前的最佳模型,正確率達到了0.914 729.
測試模型在訓(xùn)練集的正確率為1,在測試集的正確率為0.941 7.
利用Graphviz庫模型可視化.
表5 分類正確率
首先畫數(shù)據(jù)相關(guān)性圖,觀察各數(shù)據(jù)之間的關(guān)系.
對數(shù)據(jù)進行歸一化處理.
用GridSearchCv尋找決策樹回歸模型的最好的參數(shù).Max-depth 樹的最大深度,防止模型過擬合.Max_featurs 最大利用幾種特征進行決策.
測試模型在測試集上的表現(xiàn):訓(xùn)練集上的誤差 0.195 063 689 179 375 44,測試集上的誤差 3.298 117 475 728 157 3.見圖2.
利用Graphviz庫模型可視化.
輸出預(yù)測變量特征重要性:
表6 輸出預(yù)測變量特征重要性
可以看到對綜合成績的高低影響中上面5個特征值影響最大.其中在線學(xué)習(xí)時長的影響性最高,其次是任務(wù)點完成率和章節(jié)測驗得分,課程視頻得分、討論數(shù)也有一定的影響.總體來說,大部分因素對綜合成績的高低都會產(chǎn)生影響,即學(xué)習(xí)結(jié)果是受到多個因素共同影響的,過去單獨以一兩個結(jié)果性數(shù)據(jù)來評價學(xué)業(yè)質(zhì)量的方式是不全面和客觀的.
利用一組測試數(shù)據(jù)對實驗?zāi)P瓦M行五折交叉驗證平均值評估模型性能.不重復(fù)的將訓(xùn)練集劃分為5份,其中4份用于模型的訓(xùn)練,剩下一份用于測試.利用一組測試數(shù)據(jù)對實驗?zāi)P瓦M行性能測量,測試數(shù)據(jù)中總共包括257個學(xué)生的學(xué)習(xí)信息數(shù)據(jù),其中有69個學(xué)生為有風(fēng)險的,188個學(xué)生為沒有風(fēng)險,總體正確率為91.7%,符合預(yù)期.見表7.
表7 五折交叉驗證評估模型性能
基于學(xué)習(xí)效果影響因素的重要性排序關(guān)系,對網(wǎng)絡(luò)學(xué)習(xí)平臺的學(xué)習(xí)行為進行權(quán)重設(shè)置.
通過上述學(xué)習(xí)行為數(shù)據(jù)的實驗分析可知,對學(xué)生期末綜合成績影響最大的5個特征因素,分別是學(xué)生在線學(xué)習(xí)時長,任務(wù)點完成率,章節(jié)測驗得分,課程視頻得分及討論數(shù).因此,教師利用網(wǎng)絡(luò)學(xué)習(xí)平臺進行課程建設(shè)時,可先將反映這5個特征的權(quán)重設(shè)置為:學(xué)生在線學(xué)習(xí)時長(包括課程訪問數(shù)、課程資源閱讀數(shù)及課后作業(yè))共占40%;任務(wù)點完成率(包括各項課堂互動活動、簽到)共占25%;章節(jié)測驗得分占15%;課程視頻得分(主要是課前慕課學(xué)習(xí))占10%;討論數(shù)(包括對討論話題的回復(fù)、討論區(qū)對課程內(nèi)容的發(fā)帖)共占10%.其次,在課程開始一段時間之后,可以以一月時間為數(shù)據(jù)采集周期,在綜合成績風(fēng)險評價模型輸入包含學(xué)生5項主要學(xué)習(xí)特征的行為數(shù)據(jù),模型輸出學(xué)生綜合成績所屬“優(yōu)”、“良”、“中”、“低”的類別,從而對每個學(xué)生的階段性學(xué)習(xí)進行一次風(fēng)險評價.對處于“中”、“低”類別的學(xué)生,還應(yīng)給出該生當(dāng)月學(xué)習(xí)評價報告.報告具體內(nèi)容包括“學(xué)生上課活動量情況”、“學(xué)生課程完成情況”和“學(xué)生上課訪問量趨勢”,依據(jù)這3個維度的統(tǒng)計數(shù)據(jù)形成學(xué)生學(xué)習(xí)畫像,并從前面分析的五個主要學(xué)習(xí)特征值給出分析說明,最終得出學(xué)生的個性化學(xué)習(xí)指導(dǎo)意見.
從階段性的學(xué)習(xí)風(fēng)險評價結(jié)果中,教師對學(xué)生當(dāng)前的學(xué)習(xí)狀況能有一個較為客觀的了解,并觀察到學(xué)生在學(xué)習(xí)過程中是否偏離了正確的學(xué)習(xí)軌道,是否存在期末綜合成績不及格的風(fēng)險.對于有不及格風(fēng)險的學(xué)生,教師對照“學(xué)習(xí)評價報告”中存在風(fēng)險的特征指標(biāo),對學(xué)生進行談話、了解,幫助學(xué)生分析產(chǎn)生風(fēng)險的原因,并對這類學(xué)生的學(xué)習(xí)過程進行及時干預(yù),有針對性地改善學(xué)生學(xué)習(xí)效率.
利用大數(shù)據(jù)分析方法的學(xué)業(yè)診斷評價不是最終評價,而是學(xué)生在學(xué)習(xí)過程中的階段性評價.教師同時可以在教學(xué)的各個階段利用學(xué)習(xí)評價模型對學(xué)生進行評價.所得出的評價結(jié)果可以讓教師清晰地了解到教學(xué)的各個階段學(xué)生的學(xué)習(xí)情況,對學(xué)生進行個性化的學(xué)習(xí)指導(dǎo),并且根據(jù)預(yù)測風(fēng)險學(xué)生人數(shù)的多少及時了解教學(xué)中出現(xiàn)的問題,改善教學(xué)策略.
隨著教育大數(shù)據(jù)研究應(yīng)用的深入,研究者和教育者都嘗試?yán)么髷?shù)據(jù)的方式優(yōu)化教學(xué),并應(yīng)用到教學(xué)的各個環(huán)節(jié)[5-9].智慧網(wǎng)絡(luò)學(xué)習(xí)平臺的推廣應(yīng)用為記錄學(xué)生學(xué)習(xí)行為提供了數(shù)據(jù)基礎(chǔ),但如果對記錄的數(shù)據(jù)不做進一步的深入計算,教育者仍然觀察不到學(xué)生的學(xué)習(xí)過程,不能了解每個學(xué)生的學(xué)習(xí)情況,也無法對他們進行針對性指導(dǎo),提高學(xué)生的學(xué)習(xí)效率,改善教師教學(xué)策略.因此,本文嘗試使用機器學(xué)習(xí)算法中的CART分類算法,針對學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)展開詳細(xì)的分析、計算,以期建立學(xué)生成績風(fēng)險評價模型.模型可應(yīng)用于針對學(xué)生的階段性學(xué)習(xí)結(jié)果,反饋學(xué)生的學(xué)習(xí)狀況以及教師教學(xué)情況,預(yù)警學(xué)習(xí)效果有風(fēng)險的學(xué)生及時調(diào)整學(xué)習(xí)路線,教師調(diào)整教學(xué)策略.同時學(xué)生也可以及時、客觀地了解目前的學(xué)習(xí)狀況,引導(dǎo)、促進學(xué)習(xí)者的學(xué)習(xí).該研究也可以為其它課程的學(xué)習(xí)監(jiān)控和指導(dǎo)個性化學(xué)習(xí)提供機器學(xué)習(xí)模型,并為后續(xù)個性化學(xué)習(xí)服務(wù)方案提供了大數(shù)據(jù)實踐應(yīng)用的借鑒經(jīng)驗.
當(dāng)然,目前的研究中還存在許多局限性,比如數(shù)據(jù)質(zhì)量問題.筆者所在學(xué)校推廣使用的學(xué)習(xí)通網(wǎng)絡(luò)教學(xué)平臺所記錄的學(xué)習(xí)行為數(shù)據(jù)與教師實際教學(xué)過程中呈現(xiàn)的數(shù)據(jù)還存在一定的偏差,學(xué)習(xí)行為指標(biāo)還不能完全貼合實際.其次,學(xué)校信息化建設(shè)的程度還有待進一步提高,各個部門的業(yè)務(wù)數(shù)據(jù)還未實現(xiàn)共享,比如學(xué)工處數(shù)據(jù)目前還不能與學(xué)習(xí)行為數(shù)據(jù)互通互訪.最后,現(xiàn)階段教學(xué)者信息化教學(xué)意識不強,普遍習(xí)慣于傳統(tǒng)的教學(xué)模式,教學(xué)過程中沒有把反映學(xué)生學(xué)習(xí)行為的指標(biāo)設(shè)計到教學(xué)方案中,致使許多學(xué)習(xí)行為指標(biāo)沒有得到留存,數(shù)據(jù)記錄較少,或是數(shù)據(jù)統(tǒng)計特征值不規(guī)范,缺失率較高.因此數(shù)據(jù)與理想中預(yù)期差別較大,導(dǎo)致研究產(chǎn)生局限性.今后,可以繼續(xù)對學(xué)習(xí)資源數(shù)據(jù)特征數(shù)字化,進一步挖掘個性化學(xué)習(xí)的另外2個維度:個性化學(xué)習(xí)內(nèi)容和個性化學(xué)習(xí)方式,實現(xiàn)更進一步的個性化學(xué)習(xí)服務(wù),即個性化內(nèi)容的推送,和個性化學(xué)習(xí)空間的劃分.