楊珊珊
(三峽大學 理學院,湖北 宜昌 443002)
《教育部辦公廳關(guān)于推薦新工科研究與實踐項目的通知》《教育部高等教育司關(guān)于開展新工科研究與實踐的通知》一經(jīng)發(fā)布,加快了新工科建設(shè)的步伐。數(shù)據(jù)挖掘技術(shù)結(jié)合了人工智能、數(shù)據(jù)庫、統(tǒng)計學、機器學習等多個領(lǐng)域的理論和技術(shù)。在國外,采用判別式分析的方法,佐治亞州立大學學者分析了高中學習者在線課程的學習情況。在國內(nèi),大部分學者將研究主要集中在學生在線學習的數(shù)據(jù)采集、監(jiān)控和數(shù)據(jù)分析等方面。胡運安等人采用機器學習的方法,在規(guī)范的網(wǎng)絡教學平臺上采集學生在線學習的數(shù)據(jù),并對此數(shù)據(jù)進行分析和評估;趙慧瓊等人采用數(shù)據(jù)挖掘技術(shù)對學生的學習過程進行適當干預,挖掘?qū)W生在線學習的潛在問題并提出合適的、有特色的解決方案,進而提高學習效率和教學質(zhì)量。
通過人工智能的算法對數(shù)據(jù)庫中的信息進行搜索并獲取隱藏信息的過程被稱為數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘的實現(xiàn)和計算機技術(shù)有關(guān),需要對數(shù)據(jù)庫中的大量數(shù)據(jù)進行統(tǒng)計,利用數(shù)據(jù)分析技術(shù)在線分析相關(guān)數(shù)據(jù),采用情報檢索的方法進行數(shù)據(jù)檢索,可結(jié)合機器學習的算法、過去的相關(guān)經(jīng)驗規(guī)則及模式識別等多種途徑進行實現(xiàn)。要從大量模糊的、有噪聲的、不完全的數(shù)據(jù)中挖掘出有用的信息通常需要經(jīng)過以下步驟:數(shù)據(jù)清理、集成、篩選、變換、挖掘、模式評估和知識表示。
學習分析是指采用數(shù)據(jù)建立模型預測學習者的學習成效和學習行為。2011年,學習分析被定義為通過對學生學習情況相關(guān)數(shù)據(jù)的檢測、整理和分析來對學生的學習效率進行優(yōu)化。學習分析模型主要包含了收集學生發(fā)布的數(shù)據(jù)形成特征庫(數(shù)據(jù)層)、分析行為特征庫中各個因素之間的關(guān)系和內(nèi)涵并進行預測和反饋(機制層),將分析得到的結(jié)果提供給教師、學生和家長(結(jié)果層)。
結(jié)合三峽大學理學院的辦學特色和教學條件,利用數(shù)據(jù)挖掘技術(shù)探討學習分析在工科研究生教學中的應用,研究對象和主要內(nèi)容如下:(1)獲取學生在線學習的相關(guān)數(shù)據(jù),如學生一學期登錄教學平臺的次數(shù)、單次登錄教學平臺的在線時長、一學期在線時長總和、在線操作頻率、每次作業(yè)的完成時間和提交時間、是否和教師在線進行互動等內(nèi)容;(2)將各網(wǎng)絡教育平臺收集的數(shù)據(jù)進行比較分析,歸納總結(jié)學生學習相關(guān)數(shù)據(jù)的處理方式,將整理之后的數(shù)據(jù)以合適的方式優(yōu)化,最終確定項目需要研究的數(shù)據(jù)。通過數(shù)據(jù)處理優(yōu)化,能夠篩選出規(guī)范的、有結(jié)構(gòu)化的數(shù)據(jù),為后續(xù)的研究做準備。(3)選取幾種常用的數(shù)據(jù)處理算法和數(shù)據(jù)分析方法,將這些算法和方法進行對比分析,選擇適合學生在線學習數(shù)據(jù)的優(yōu)化算法和分析方法,掌握這些算法和分析方法的原理,精通這些算法和方法的使用方式,然后利用大數(shù)據(jù)技術(shù)為后面的研究做鋪墊;(4)選取兩個數(shù)值計算課程班級的學生作為實證研究對象,形成對照組,進行實證研究;(5)對所選取的研究對象進行成績分析,以驗證研究方法的有效性。
教學實證分析系統(tǒng)的功能模塊如圖1所示。
圖1 教學實證分析系統(tǒng)的功能模塊Fig.1 Functional module of teaching empirical analysis system
A.數(shù)據(jù)的獲得。統(tǒng)一錄入學生基本信息到三峽大學網(wǎng)絡教學平臺,任課教師在平臺上發(fā)布教學相關(guān)資源和知識結(jié)構(gòu),創(chuàng)建各類教學區(qū)域,如作業(yè)、測試、答疑討論、案例庫與問卷等。課后,學生能夠在平臺中學習知識、提交作業(yè)、互相討論、鞏固教學內(nèi)容,以加強學生學習效果,提高學習效率。利用平臺獲取學生的學號、姓名、班級和年級等數(shù)據(jù),通過分析方法得到對結(jié)果無影響的相關(guān)參數(shù),將其列入學習成績相關(guān)的指標中,確定并選取以下指標:(1)學生登錄網(wǎng)絡教學平臺的次數(shù)、課堂討論發(fā)帖次數(shù)、課后記錄知識點的次數(shù)、復習課件的次數(shù)、練習試卷的次數(shù)、提交試卷和作業(yè)的次數(shù)、學習最終成績、單次在線時長和在線總時長;(2)將學生基本信息全部錄入到教學平臺中,融合學生的校園卡所存儲的數(shù)據(jù)和成長發(fā)展數(shù)字化平臺的數(shù)據(jù),根據(jù)在校情況、回訪情況和檔案記錄情況分析學生的日常學習和生活,依據(jù)多維度分析法確定學生時間和成長兩個維度之間的關(guān)系,給出學生的在校軌跡。
B.數(shù)據(jù)的處理。在學習分析數(shù)據(jù)工具的選擇上運用了以下算法:(1)決策樹算法:經(jīng)常用于學習者的模式識別與預測;(2)神經(jīng)網(wǎng)絡算法:應用在模式識別中,能夠?qū)Ω深A學習和學習預警提供一定的決策支持;(3)支持向量機算法:主要用在模型識別、模型分類和模型回歸分析中;(4)K-Means聚類算法:在學習分析中可以應用于數(shù)據(jù)的聚類分析。
C.實證研究對象的選取和具體研究過程。(1)選取兩個班的學生分成1、2兩個組;(2)按照前6周學習結(jié)果預測兩個組學生可能會出現(xiàn)的危機情況;(3)將預測結(jié)果告知1組,對1組學生后6周的教學過程進行適當干預;(4)2組的學生不干預,只預測;(5)對1組學生進行相關(guān)指導;(6)參照學生最終成績、回訪結(jié)果和調(diào)查結(jié)果,確定學習危機預測準確與否及這種預測和適當?shù)母深A可否激勵學生提高學習積極性、課程考試過關(guān)率、學習動力和學習有效性。
利用數(shù)據(jù)挖掘技術(shù)對數(shù)值計算這門課的學生在線學習相關(guān)數(shù)據(jù)進行分析研究可以得到學習數(shù)據(jù)與學生成績二者之間的關(guān)系,及時了解學生的學習情況并發(fā)現(xiàn)學習過程中出現(xiàn)的不足,預測學生在學習時可能遇到的難題,為三峽大學理學院在線教學平臺的建設(shè)與改進提供理論指導,形成較為完善的在線教學平臺。