郭長東, 尹永學
(延邊大學 理學院,吉林 延吉 133000)
通過網絡平臺進行學習,具有學習資源豐富、學生主體性強、交互獨特及學習時空靈活的特點[1]。與傳統(tǒng)師生面對面的教學方式相比,網絡平臺學習具有許多獨特的優(yōu)點。首先,網絡學習資源的豐富使學生學習更加方便,學生能夠學習的課程將不限于本校、不限于本學科、不限于本校教師,打破了傳統(tǒng)教學過程中的學校邊界、學科邊界以及教師邊界;其次,網絡學習過程中,學生的主體性變強,學生更多地會基于自身的興趣去選擇喜歡的課程及喜歡的老師,也會更加自由地安排自己的學習時間;再次,網絡學習交互獨特,教師與學生在云端進行交流溝通,大大提升了學生與教師之間的互動積極性。然而,任何事物都有其兩面性。網絡學習給我們帶來諸多便利的同時,也產生了許多弊端,比如,學生由于缺乏教師的監(jiān)管學習態(tài)度變得消極被動、教師難以掌握學生的近期學習狀況等。因此,對學生的網絡學習行為進行分析,并根據(jù)分析結果采取合理化的措施將變得十分必要。
學習分析是近年來教育技術領域迅速崛起的熱點問題,它的出現(xiàn)也推動了教育信息化的浪潮[2]。它通過網絡得到學習的過程數(shù)據(jù),特別是學生的行為數(shù)據(jù),采用先進的分析方法和分析工具,如數(shù)據(jù)挖掘和可視化方法等,對學生在學習過程中遇到的問題進行診斷,并對學習結果做出預測,從而有針對性地優(yōu)化和增強教學效果[3-4]。王堅等通過因子分析提取出能夠客觀反映學習特征的兩個公共因子,并依據(jù)不同學生的因子得分進行聚類分析,發(fā)現(xiàn)學生網絡學習具有群體性的特征[5]。黃丹霞等對比了不同貝葉斯知識跟蹤模型預測的準確率,發(fā)現(xiàn)當采用邏輯回歸算法作為學生態(tài)度積極性分類算法時,可較準確地預測學習態(tài)度[6]。
研究表明,學生的學習態(tài)度對于學習效果至關重要[7],積極主動型的學生在考試中能夠取得較好的成績,而消極被動型學習者的成績往往不理想。本文針對網絡課程教學中教師難以了解學生的學習態(tài)度問題,通過對學生的網絡學習行為分析,構建學習態(tài)度跟蹤模型,以期實現(xiàn)教師對學生學習態(tài)度的精準把握。
本文數(shù)據(jù)主要來源于超星學習通,課程涉及延邊大學數(shù)學系開設的運籌學和應用隨機過程,學生涉及本校2017級統(tǒng)計學和應用數(shù)學專業(yè)全體學生。指標選取方面,本文選取與學生學習態(tài)度相關性較高的8個指標,分別為課程簽到率、課程積分、課程討論回復數(shù)、章節(jié)學習次數(shù)、作業(yè)提交次數(shù)、作業(yè)平均分數(shù)、期中考試分數(shù)、考前測驗分數(shù)。計算指標間相關系數(shù)矩陣,按照指標間相關性強弱可以將上述8個指標大致分為3大類,如表1所示。對于學生的學習態(tài)度標簽數(shù)據(jù),本文運用調查法獲取,通過尋訪任課教師,和教師溝通交流學生的學習態(tài)度情況,并由老師對學生的態(tài)度進行打分(10分制),將獲取的態(tài)度標簽數(shù)據(jù)進行分類匯總,轉化為二分類變量:一類是積極主動型的學習態(tài)度,另一類是消極被動型的學習態(tài)度。
表1 學生網絡學習行為觀測指標Tab.1 Observation index of students’ online learning behavior
由于數(shù)據(jù)量較小,為了防止模型產生過擬合現(xiàn)象,所以本文采用K折交叉驗證方式。K折交叉驗證思想如下:首先將數(shù)據(jù)分成K份,其中一份作為測試集,另外K-1份作為訓練集,以此類推,這樣使得每一份都有作為測試集進行預測的機會,最終將所有結果進行投票,選取票數(shù)最多的結果作為最終預測結果[8-9]。實驗中發(fā)現(xiàn)K取5時預測效果較好,故本文中采用的是五折交叉驗證方式。
本文數(shù)據(jù)在范圍和量綱方面存在較大差異,為提升模型的預測效果,在模型訓練前,需要對數(shù)據(jù)進行標準化處理,本文采用均值方差歸一化方法對數(shù)據(jù)進行標準化處理。
分類是機器學習領域的一種重要的有監(jiān)督學習方法[10],本文對學生的學習態(tài)度進行分類,將學生的學習態(tài)度分為兩類——積極主動型和消極被動型。積極主動型學生通常會表現(xiàn)出如下特點:日常簽到率較高,作業(yè)完成度較高,課程積分較高,課堂討論的回復數(shù)較多,消極被動型學生相反。本文的模型設計包括獲取數(shù)據(jù)、數(shù)據(jù)預處理、特征選擇、模型構建、模型評價,模型設計的基本原理如圖1所示。算法方面,本文選取支持向量機、隨機森林和AdaBoost自適應提升算法完成分類任務,通過對比不用算法的訓練結果,選取分類準確率最高的算法作為態(tài)度跟蹤模型的分類算法。模型評價方面,本文選取分類算法常用的準確率、精準率、召回率和F1值度量。
圖1 分類器訓練的基本原理Fig.1 The basic principle of classifier training
本文選用Python作為建模工具,實驗平臺為Windows10下的JupyterNotebook,使用不同分類算法分別對學生的態(tài)度進行預測,將預測結果與調查結果進行對比得到的預測準確率如表2所示。從結果中可以看出,AdaBoost算法的分類準確率最高。
表2 不同分類算法準確率比較Tab.2 Accuracy comparison of different classification algorithms
實驗以學習者態(tài)度積極為正類,消極為負類,對比分析了不同分類算法的精準率、召回率和F值度量,結果如表3所示,其中AdaBoost取得100%的好分數(shù),意味著在預測過程中學習態(tài)度積極的同學被誤判為不積極的概率和學習態(tài)度不積極的同學被誤判為積極的概率幾乎為零。
表3 不同分類算法各類指標比較Tab.3 Comparison of various indexes of different classification algorithms
綜合表2和表3的結果,AdaBoost算法通過集成弱分類器形成強分類器,對學習態(tài)度進行預測可以得到較好的訓練效果,故本文選用AdaBoost算法作為學生態(tài)度跟蹤模型的分類算法。
本文基于超星學習通課程的網絡學習行為數(shù)據(jù)和調查法得到的學習態(tài)度標簽數(shù)據(jù),構建基于分類算法的學習態(tài)度跟蹤模型,對學生學習態(tài)度進行預測。實驗結果表明,本文構建的模型具備對學習態(tài)度進行預測的能力,能夠幫助教師及時了解學生的學習態(tài)度,亦能夠對學生的學習過程起到監(jiān)督作用。