摘要:采用非負矩陣分解特征抽取方法對在線課程平臺所記錄的學習數(shù)據(jù)進行降維與壓縮,提取影響在線課程平臺上學生學習質(zhì)量的主要特征群集。結合群集特征,根據(jù)學生個體的學習行為指標及反映學生學習效果的特征指標的權值大小,依次選取多級特征指標,形成教育特征群集網(wǎng)絡,進而分析可得影響教育個體質(zhì)量的核心特征指標。
關鍵詞:特征抽??;非負矩陣分解;群集;特征指標
0. 引言
國外學者較為重視在線課程平臺數(shù)據(jù)資源的研究,在Instructional quality of Massive Open Online Courses'—文中,分析了在線課程平臺教學設計的質(zhì)量,隨機抽取76個大規(guī)模開放在線課程的數(shù)據(jù)資源,分析和比較在線課程平臺的教學設計質(zhì)量。此外,還有一些研究者將注意力集中到在線課程學習平臺的學習評價和最終學分評定問題上,基于COURSERA等大型慕課平臺積累的學習數(shù)據(jù),對平臺的"學生互評"評價方式做了分析,論證其合理性和有效性。國內(nèi)關于在線課程平臺的數(shù)據(jù)資源的研究大多也集中在2012年之后。北京、上海、廣州等地已經(jīng)利用新的數(shù)據(jù)信息處理手段為用戶提供基本公共教育服務。如北京教育音像報刊總社在北京市教委的領導下,開發(fā)了“名師在線”服務平臺,并可提供后臺數(shù)據(jù)分析報表。
本文針對教育個體學習特征的完整數(shù)據(jù)鏈,采用特征抽取方法提取出影響教育質(zhì)量的主要群集特征,構建教育特征數(shù)據(jù)網(wǎng)絡,并可進一步分析得到影響教育個體質(zhì)量的核心特征。
1. 非負矩陣分解特征抽取
結合本文在線課程平臺教育特征數(shù)據(jù)群集分析問題,要求各學習特征節(jié)點隸屬于某個群集的程度值或權值,不能為負值,因此適用于非負矩陣分解(Non-negative Matrix Factorization, NMF)算法[1-2]。NMF方法是由Lee和Seung在《Nature》上提出, 它使分解后的所有分量均為非負值,能使數(shù)據(jù)的維數(shù)得到一定程度的約減,克服了傳統(tǒng)矩陣分解的很多問題,具有實現(xiàn)上的簡便性、分解形式和分解結果上的可解釋性,以及占用存儲空間少等諸多優(yōu)點。
2. 群集特征分析
群集是指系統(tǒng)中相互吸引的高度聚集的狀態(tài)或現(xiàn)象,普遍存在于自然界和人類社會。在教育特征數(shù)據(jù)中,連接權重大的學習行為節(jié)點構成群集,表示該學習行為相關性高。找出教育特征數(shù)據(jù)中的群集,即可找到表征學生學習個體行為的核心特征。
NMF方法中的V=WH,其中V是由m個學生樣本和其n個學習行為特征構成的數(shù)據(jù)集矩陣,W是分解得到的大小為m*k的特征矩陣,H是分解出的大小為k*n的系數(shù)矩陣[3]。如對采集到的學生個體教育特征數(shù)據(jù)進行NMF分解,得到3個群集特征的權值如圖1所示。
由學生個體行為及學習效果的指標的權值大小,結合群集特征大小,可依次選取多級特征指標形成教育特征群集網(wǎng)絡。
3. 教育特征群集網(wǎng)絡構建
群集特征的差異表明,網(wǎng)絡呈現(xiàn)出明顯的層次拓撲結構,大多數(shù)節(jié)點分別依附在若干個節(jié)點上,形成若干個小網(wǎng)絡,小網(wǎng)絡經(jīng)過選擇性的互聯(lián)形成大網(wǎng)絡并產(chǎn)生少數(shù)幾個中心節(jié)點,最后這幾個中心節(jié)點互聯(lián)成完整的網(wǎng)絡[4-6]。
將采集到的學生樣本的特征數(shù)據(jù)通過上節(jié)NMF方法分解,可得到的群集特征,結合學生個體的學習行為指標和學習效果指標,可構建學習教育特征網(wǎng)絡如圖2所示。
由圖2可知,節(jié)點1、3和節(jié)點4相關性較大,構成一個群集特征,其中各節(jié)點分別對應各教育個體的行為指標特征或效果指標特征。通過NMF分解得到的權重大小,可對節(jié)點1、3、4進行權重排序,分析出更為重要的核心節(jié)點及所對應的指標。同理也可對位于同一個群集的節(jié)點2、5、6及節(jié)點7、8、9進行分析,從而可得到影響教育個體質(zhì)量的核心特征指標。
4. 結論
本文研究了基于NMF的特征抽取方法提取影響學生質(zhì)量的核心特征;根據(jù)這些反映個體質(zhì)量的群集特征的權值大小,可幫助教師分析學生個體學習質(zhì)量的核心指標,歸納在線教育環(huán)境下有效教學活動發(fā)生的條件與關鍵要素,為構建有效教學模式提供理論與實踐基礎。同時,在此分析基礎上,可進一步有效地設計規(guī)則來激發(fā)學生主體的主動性、積極性,為學生提供更有針對性的教學干預。
參考文獻:
[1]張小林,基于高斯混合模型和非負矩陣分解的復雜網(wǎng)絡社區(qū)檢測[D]. 西安電子科技大學,2014.12. 33-42.
[2]李樂, 章毓晉. 非負矩陣分解算法綜述[J].電子學報, 2008, 36(4): 737-743.
[3]Wang F., T Li, X. Wang, et al.. Community discovery using non-neg ative matrix factorization[J]. Data Mining and Knowledge Discovery, 2011, 22:493-521.
[4]徐曉,張清,張玉來,張世波.論復雜網(wǎng)絡理論在教育技術領域的應用[J]. 寧波大學學報(教育科學版),2014,36(6):89-93.
[5]吳增海.社交網(wǎng)絡模型的研究[D].中國科學技術大學, 2012,5:50-62.
[6]黃麗蒂.基于群集風險理論的體育建筑看臺安全設計研究[J]. 哈爾濱工業(yè)大學,2014.7.23-43.
支撐項目:2017年武漢市教育局高校教學研究重點項目(2017008)
作者信息:周靜,湖北襄陽,副教授,博士,江漢大學,數(shù)據(jù)挖掘與分析及計算機教育,湖北省武漢市沌口經(jīng)濟開發(fā)區(qū)江漢大學數(shù)學與計算機科學學院,430056。