張慶生 廖敬萍 張麗麗
摘 要:自適應網絡學習平臺測量兩個知識模塊的相似性、相對難度和先行關系,動態(tài)地為學生推薦知識模塊,它可以廣泛地應用在網絡課程的安排順序、自適應測試等。文中采用領域分析的方法,對網絡學習平臺的日志數據進行特征提取,將特征值添加到相關知識模塊關系的訓練和測試數據集,并采用線性回歸、高斯過程和神經網絡預測數據集中的兩個知識模塊的相似性、相對難度和先行關系,實驗結果在實踐中具有可行性。
關鍵詞:自適應學習平臺;知識模塊;特征值提??;預測
中圖分類號:G434 文獻標識碼:A 文章編號:2095-1302(2016)07-00-01
0 引 言
互聯網、移動計算和物聯網技術促使越來越多的教師把學習資料放置在網絡學習平臺,方便學生隨時隨地學習。然而,網絡學習平臺并沒有考慮學生自身的因素,所有學生獲得完全一樣的學習資料。為適應學生的差異性及學生特點的變化,自適應網絡學習平臺需要對學生的知識水平、學習興趣、學習目標和任務等建模[1],以滿足學生的需求。
有關學生學習活動的特征值可以預測兩個知識模塊(例如,一對練習題目)的相似性、相對難度和先行關系,為學生提供與其知識水平相近的練習題目[2]。在自適應學習平臺領域,沒有規(guī)定從學生學習活動數據中提取何種特征值,本文擴展的研究[2],提取新特征值并應用于相關的預測算法,為自適應學習平臺的設計與實現提供理論說明和實驗證據。
1 數據集與特征提取
分析實驗的數據來自均一教育平臺(http://www.junyiacademy.org),由它提供中小學數學課程的練習題目。文獻[2]的數據集抽取時間是2014年7月。本次使用的數據集抽取時間為2015年1月,是文獻[2]的增量數據集。該數據集有722個練習題目,247 605個學生用戶,學生學習記錄共25 925 992條。考慮到練習題目的學生用戶人數過少,其行為可能對特征值產生較大偏差,因此,過濾學生用戶數小于100的練習題目,并過濾1 048條練習題目花費時間是負數的錯誤記錄。
1.1 訓練和測試數據集
首先,應確定數據集的練習題目對A和B。該訓練集有1 131條記錄,選擇239個練習作為A,再隨機選取343個練習作為B,每個練習A與大約5個其它練習配對。測試集有823條記錄,選擇130個練習作為A,再隨機選擇330個練習作為B,每個練習A與大約6個其它練習配對。
其次,領域專家對相關練習題目進行它們所需的知識是否相似、是否B比A難、是否A為B的先行知識的問卷測評。采用1~9評分制,相似性分數越高表明A和B越相似,難度分數越高表明B比A難,5分表示兩者難度相同,先行關系分數越高表明A是B的先行程度高。專家評分的平均值作為練習題目對關系的期望值。
1.2 特征提取
訓練集和測試集只有練習題目對應的名稱、相似性、相對難度和先行關系的評分,無練習題目特征值。特征值可以從有關學生學習的日志數據中提取,并插入到訓練集和測試集,最終形成訓練和測試預測算法所用的數據,其過程如圖1所示。
圖1中的練習題目表是練習題的描述:先行關系、練習題在知識地圖上的坐標、所屬主題、所屬領域和練習題的最快回答時間,前幾項直接插入數據集。練習A和B的最快回答時間比率,A和B的間距作為導出特征值插入數據集。從學生學習日志數據中提取特征值:A和B平均回答時間差值、回答次數差值、每個學生回答題目平均次數、第一次正確回答次數差值、每個學生第一次正確回答平均次數、每個學生使用系統(tǒng)建議題目的平均次數、使用A和B的學生人數比率、每個學生使用系統(tǒng)的題目提示的平均次數。表1所列為有關兩次實驗所涉及的特征值數目及相同特征值。
2 實驗
實驗采用數據挖掘工具weka[3]提供的分類方法。表2和表3的相對平方誤差RSE描述預測的準確程度,其值越小越好,斯皮爾曼相關系數Spm分析預測值序列和期望值序列的相關程度,其值越大越好。
表2和表3的方法1是文獻[2]采用各類回歸算法產生的最佳值羅列,方法2、3和4是本次實驗采用的多元線性回歸、高斯過程和反向傳播神經網絡算法。
在表3中,除方法4產生的結果與方法1有一定的差距外,方法2和3產生的結果與方法1的結果接近或者超過時,說明采用本次實驗的特征值,并選擇合適的分類算法可以預測知識模塊間的關系。
3 結 語
實驗結果表明,從學生日志數據選擇可能的特征值及合適的分類算法可預測知識模塊間的關系,結合用戶控制自適應過程,可用于設計實現自適應學習平臺。
參考文獻
[1] Brusilovsky P.,Millan E..User Models for Adaptive Hypermedia and Adaptive Educational Systems[M]. Brusilovsky P., Kobsa A. and Nejdl W.. The Adaptive Web: Methods and Strategies of Web Personalization.Germany: Springer Press,2007:3-53.
[2] Chang Haw-Shiuan, Hsu Hwai-Jung, Chen Kuan-Ta. Modeling Exercise Relationships in E-Learning: A Unified Approach[C].Educational Data Mining Proceedings,2015:532-535.
[3] weka.數據挖掘工具[EB/OL]. http://www.cs.waikato.ac.nz/ml/weka.[2015-10-15].