摘要:大數(shù)據(jù)時代的到來,對數(shù)據(jù)挖掘技術(shù)的應用提出了更高要求。首屆“學習分析技術(shù)與知識國際會議”的召開,將數(shù)據(jù)挖掘方法與學習管理系統(tǒng)建立關(guān)聯(lián),并從分析學習者的行為中來改善和提升物理教育效率。本文將從數(shù)據(jù)挖掘的方法、內(nèi)容、方向、結(jié)果呈現(xiàn)等方面,就其在學習分析中的應用展開探討,并從優(yōu)化數(shù)據(jù)挖掘方法上來改善學習分析技術(shù)的有效應用。
關(guān)鍵詞:數(shù)據(jù)挖掘 學習分析 關(guān)鍵技術(shù) 應用探討
基金項目:本文系河南省軟科學研究計劃項目(項目編號:142400410263,142400410267,142400410671)”的階段性研究成果。
大數(shù)據(jù)時代下信息指數(shù)型增長已經(jīng)成為趨勢,對于海量數(shù)據(jù)的分析及呈現(xiàn),迫切需要從數(shù)據(jù)挖掘技術(shù)的應用中來獲取有效信息?,F(xiàn)代教育領(lǐng)域中對信息化技術(shù)的應用較為廣泛,各類虛擬學習環(huán)境的構(gòu)建需要符合學生的學習特性,這些數(shù)據(jù)即多又雜,更需要專門的軟件工具來進行改善和處理。可以說,學習分析技術(shù)是數(shù)據(jù)分析及數(shù)據(jù)挖掘技術(shù)基礎上發(fā)展而來的應用,因此,從學習分析定義及數(shù)據(jù)模型的構(gòu)建上來增強對學生學習行為的研究,有助于科學的評估和預測學生的表現(xiàn),改善學生的學習方式。虛擬技術(shù)中的學習環(huán)境的營造,可以通過數(shù)據(jù)挖掘技術(shù)來實現(xiàn),特別是對于海量教育數(shù)據(jù)的有效提取,以幫助教育者進行分析和改進教學決策。
1 學習分析中的關(guān)鍵技術(shù)
1.1聚類技術(shù)
對于數(shù)據(jù)挖掘中的聚類,主要從抽象對象的集合分組中來進行歸類,聚類是對具有相似特性的多個類或簇進行分組的過程,并利用顯性或隱性方式進行描述。在聚類分析中,不同算法下對相關(guān)數(shù)據(jù)的分類集合也是不同的,因此需要結(jié)合數(shù)據(jù)特征來進行有效的聚類操作。在虛擬學習環(huán)境中,對于每門課程知識的建構(gòu),可以從學生的不同表現(xiàn)上來進行分組聚類。如對于學習積極性高的團體,可以從增強知識拓展及關(guān)聯(lián)度上來滿足學生學習要求;對于成績較低、參與度不高的學生,可以從激勵措施的組建上來增強學生的學習積極性??梢?,對于聚類技術(shù)的運用,關(guān)鍵是要從學生學情的分組上,融入不同的虛擬分組策略,以激發(fā)學生能夠更好的參與學校,增進小組間學習的交流和協(xié)作。
1.2關(guān)聯(lián)規(guī)則的挖掘
從大數(shù)據(jù)環(huán)境中對相關(guān)聯(lián)數(shù)據(jù)的挖掘,主要是通過數(shù)據(jù)庫中各項集的可信度、支持度的取值來進行。對于某數(shù)據(jù)庫來說,利用形式化語言進行描述時,每一個事務都是集合,而每個集合都是M項,X、Y是其中的兩項,其關(guān)聯(lián)規(guī)則表示為X[?]Y的蘊含式。對于數(shù)據(jù)庫中的各個事務規(guī)則來說,其所占的總事務百分比就是該規(guī)則的可信度。可見,對于關(guān)聯(lián)規(guī)則的挖掘主要是通過對數(shù)據(jù)庫的事務間的關(guān)系進行關(guān)聯(lián)。在虛擬網(wǎng)絡環(huán)境下,對于各類關(guān)聯(lián)規(guī)則的挖掘,有助于我們從學生的學習行為中來挖掘關(guān)聯(lián)關(guān)系,對于這些關(guān)聯(lián)關(guān)系進行關(guān)注,從中來轉(zhuǎn)變和調(diào)整教學策略,增強學生對知識的學習融合度,更好的提升教學效率。為此,可以通過對課程資源進行關(guān)聯(lián)規(guī)則挖掘,通過學生訪問量,以及學生的學習成績進行對比,從中發(fā)現(xiàn)成績與那些資源的訪問有關(guān)系,并從學習資源的重組中來增強學生的訪問量。如對于某些訪問量不高的資源,在與學生的成績關(guān)聯(lián)上作用不大,可以進行有選擇性的刪除,避免占用學生的學習時間,也提升了資源整合的效率。
1.3分類算法
對于數(shù)據(jù)挖掘中的數(shù)據(jù)分類是基于某一共同特性而建立的數(shù)據(jù)分組,其分類方法可以是基于學生的某類學習行為,也可以是針對某一個體或群體。以決策樹為例,對于分類方法的運用主要從分類規(guī)則的設定中,以判斷各決策樹的結(jié)構(gòu)是否健壯,對于分類對象的屬性定義是否準確,能否加快決策樹的訪問速度。對于學習行為進行分析時,分類算法可以預測學生的學習成績,并從中來關(guān)聯(lián)學習動機。如針對學習積極性較低的學生,可以從補救措施的激勵上來增進參與度。對于決策樹在構(gòu)建分層教學模型中,依據(jù)決策樹的層次關(guān)系來優(yōu)化教學內(nèi)容,能夠更好的促進分層教學效率。同時,對于決策樹的D3算法分類,可以從學生數(shù)據(jù)庫進行學習能力分類,便于教師采取相應對策來改善學生的學習態(tài)度。
1.4時間序列分析
對于學習環(huán)境中的學生學習狀態(tài)的分析是實時的,其產(chǎn)生的數(shù)據(jù)量也是按照時間序列進行排列的。因此,在進行學習行為分析時,可以從時間序列來動態(tài)的收集學生信息,及時發(fā)現(xiàn)學習行為中的問題,并靈活調(diào)整教學資源來優(yōu)化虛擬教學。時間序列是數(shù)據(jù)挖掘中的重要技術(shù),如在學生課程資源的挖掘中,能夠結(jié)合訪問時間、教育資源的關(guān)鍵詞進行檢索,以分析學習者的學習行為及趨勢,通過反饋來重新編排和優(yōu)化教學內(nèi)容,提升教學資源的利用率。如在時間序列分析中可以完成練習作業(yè)的布置,結(jié)合學習者對相關(guān)課程的跟蹤數(shù)據(jù),從而明確練習的重點。在Moodle平臺上,借助于對學習者行為數(shù)據(jù)的挖掘與分析,可以預測學生對某類知識的掌握程度,從而有針對性的開展作業(yè)輔導。另外,在對系統(tǒng)進行檢測時,可以利用前饋神經(jīng)網(wǎng)絡(FFNN)、支持向量機技術(shù)(SVM)、概率集合SFAM分類器來進行準確分類,提升時間序列的分析優(yōu)勢。
2 基于用戶的學習分析技術(shù)實踐
基于學習管理的各類分析工具的應用,對于提升高等教育,尤其是遠程教育改革中發(fā)揮了重要作用。以某院校網(wǎng)絡教學為例,通過對各指標數(shù)據(jù)的分類挖掘,如“上網(wǎng)人數(shù)”、“登陸次數(shù)”、“在線時長”、“瀏覽資源次數(shù)”、“論壇發(fā)帖總數(shù)”等有關(guān)學習行為的匯總,來反映學生網(wǎng)絡學習的頻度、進度、以及均衡性,并從組織、引導和改進上來優(yōu)化網(wǎng)絡資源結(jié)構(gòu),跟蹤學生的學習行為。通過數(shù)據(jù)挖掘技術(shù)在學習分析中的應用,能夠從教學上獲取各類活動的總量及平均情況,以監(jiān)測網(wǎng)絡學習工作現(xiàn)狀,為教學評估和網(wǎng)絡教學實施提供參考。
2.1 課程資源瀏覽情況分析
結(jié)合《開放教育學習指南》要求,對于網(wǎng)絡課程模塊的監(jiān)測與分析結(jié)果中,能夠清晰的反映各類資源瀏覽的頁面?zhèn)€數(shù)、各學習者對各模塊及內(nèi)容的關(guān)注程度;如對于瀏覽頻次較高的資源頁面,表明受到學習者的關(guān)注。在課程章節(jié)設計、體驗區(qū),問題庫、以及資料庫等模塊使用分析中,學生的學習習慣能夠從其參與度、個人人均瀏覽頻次等參數(shù)中來獲得。如對于各章節(jié)內(nèi)的資源訪問量較高,說明學生從課程的學習及體驗需求較高,學習者在模擬的體驗區(qū)能夠參與到網(wǎng)絡互動,激發(fā)學習興趣;對于問題庫的訪問量也較大,說明學生能夠從常見問題的解答中來釋疑解惑,便于學習者盡快掌握網(wǎng)絡學習方法。endprint
2.2 自主學習路徑分析
對于學習過程靜態(tài)信息的獲取,可以幫助我們從中來梳理學生的“自主學習路徑”。以聚類算法為例,通過對網(wǎng)絡資源模塊的訪問跳轉(zhuǎn)進行分析,以“瀏覽時間+學號”作為鍵值,以“瀏覽順序”為序列,以“瀏覽模塊”為預測值來建構(gòu)挖掘結(jié)構(gòu),從中來獲得各模塊信息的轉(zhuǎn)換情況,從中來獲得學習者的自主學習路徑。如在“課程章節(jié)”與“體驗區(qū)”模塊的對比分析中,學習者的跳轉(zhuǎn)訪問概率較低,而在“資料庫”與“問題庫”等輔助模塊中,學習者的跳轉(zhuǎn)概率較大,說明學生對學習方法的了解較為側(cè)重,也為我們進一步優(yōu)化課程鏈接,拓寬學習資源提出了要求。
3 結(jié)語
隨著對數(shù)據(jù)挖掘領(lǐng)域的研究深入,對于計算機技術(shù)與心理學、教育學的知識的融合更加緊密,因此從數(shù)據(jù)挖掘的專業(yè)化上,依據(jù)現(xiàn)代專門教育理論,從學習分析的心理認知、行為認知中進行闡釋將會成為主流。同時,對于現(xiàn)有數(shù)據(jù)挖掘交互信息的分類,一方面從課程資源的訪問上來探索學習規(guī)律,另一方面從學生認知、社會層面來對學生的學習行為進行跟蹤和提取,加深對其剖析,揭示隱藏的知識信息以改善教育決策。另外,在數(shù)據(jù)挖掘個性化上,對于傳統(tǒng)的依據(jù)學生行為的分析,難以從總體情況上來提升教學決策參考,而Siemens教授從構(gòu)建學習者模型視角,分析學習者的學習過程,從中來獲取某一類學生的特征值,以提供個性化的教學服務。對于學習分析技術(shù)中的數(shù)據(jù)挖掘運用,重在從數(shù)據(jù)誤解方法上來提升教育資源的針對性、可操作性和靈活性,滿足各類學生的不同需求。
參考文獻:
[1] 魏順平.學習分析技術(shù):挖掘大數(shù)據(jù)時代下教育數(shù)據(jù)的價值[J]. 現(xiàn)代教育技術(shù). 2013(02).
[2] 魏雪峰,宋靈青.學習分析:更好地理解學生個性化學習過程——訪談學習分析研究專家George Siemens教授[J]. 中國電化教育. 2013(09).
[3] 孫洪濤. 學習分析視角下的遠程教學交互分析案例研究[J]. 中國電化教育. 2012(11).
[4] 吳青,羅儒國.學習分析:從源起到實踐與研究[J]. 開放教育研究. 2015(01).
[5] 胡藝齡,顧小清,趙春.在線學習行為分析建模及挖掘[J]. 開放教育研究. 2014(02).
作者簡介:楊鳳霞,女,河南開封人,1979年3月生,講師,碩士研究生,研究方向:計算機應用,云計算。endprint