劉金鳳,徐展,蘭朝鳳
細粒度學習行為分析在信息化教學中的應用
劉金鳳,徐展,蘭朝鳳
(哈爾濱理工大學 測控技術與通信工程學院,黑龍江 哈爾濱 150080)
現(xiàn)代化線上教育技術在教育教學中的應用受到國家和各大高校的高度重視.為了將線上教學結果有機結合到高校教育過程,將通過線上學習平臺提取學生的學習過程數(shù)據(jù),對學生個人的學習行為及學習效果進行分析預測,旨在打破傳統(tǒng)課堂教學過程中的“填鴨式”“滿堂灌”的陋習.將收集的粗粒度數(shù)據(jù)進一步細粒度化,得到細粒度參數(shù),從而發(fā)現(xiàn)學生的隱性數(shù)據(jù),如學習興趣、學習態(tài)度等.實驗結果表明,細粒度指標在預測學生的總評成績上起到了至關重要的作用.通過粗粒度指標及細粒度指標,歸類出五種不同類型的學生群體,確定若干典型行為特征,為教師對學生學習行為干預給予針對性地參考.
細粒度參數(shù);學習行為分類;數(shù)據(jù)提?。惶卣髦匾耘袆e
利用信息技術所提供的自主探索、多重交互、合作學習、資源共享等學習環(huán)境,把學生的主動性、積極性充分調(diào)動起來,可以使學生的創(chuàng)新思維與實踐能力在整合過程中得到有效的鍛煉.為了改善信息化教學模式,將信息技術更好地融合到基礎課程交互平臺建設中,進行信息技術與課程的“大整合”,建設數(shù)字化教育環(huán)境,必須深度挖掘學生信息庫數(shù)據(jù),優(yōu)化教學過程和評價體系,提高教學效率和教學效果.
目前,已有眾多研究者利用數(shù)據(jù)挖掘技術分析教育領域的學習數(shù)據(jù).屈泳[1]等通過視頻觀看完成率、課程訪問次數(shù)、論壇參與情況、單元測驗成績、期末測驗成績等五個指標對課程學習成績進行預測.胡祖輝[2]等通過成績數(shù)據(jù)、上網(wǎng)數(shù)據(jù)、學生的個人信息探究學生的學習質量.You[3]等通過線上平臺數(shù)據(jù),挖掘出影響成績預測結果的關鍵指標.劉桂梅[4]提出了多維細粒度的思想,將七種學習行為特征劃分為多個維度,分析比較不同學習模式.王暢[5]通過學生在各個學習網(wǎng)頁上點擊的總次數(shù)作為數(shù)據(jù)來源對學習成績進行預測.但目前挖掘出的學習數(shù)據(jù)仍然都為粗粒度指標,而且只在粗粒度指標上進行變化分析.事實上這些粗粒度指標,不能細致地反映學生的學習行為.一個學習者的粗粒度指標較好,并不能說明學習者的學習積極性較高.所以需要細化粗粒度指標,挖掘更深層含義的細粒度指標,結合粗粒度指標與細粒度指標,觀察學習者的學習行為.
本文利用云計算、大數(shù)據(jù)等技術,以Jupyter,VisualStudio Code等軟件平臺和學習通等APP為載體,將整個教學資源重新整合,構建出了更完善的在線學習平臺.該平臺打通了校園內(nèi)網(wǎng)和外網(wǎng)的連接,實現(xiàn)了優(yōu)質教學資源的共享化和教育信息化,利于學生學習過程數(shù)據(jù)信息的深度挖掘.本研究中的數(shù)據(jù)信息就來自于該在線學習平臺.
數(shù)據(jù)收集來自104名大學生,學生使用完善的在線學習實驗平臺,通過教師端查詢學生學習過程中的各類數(shù)據(jù),將其作為粗粒度指標來源,再利用SPSSStatistics對粗粒度信息數(shù)據(jù)進行整合、統(tǒng)計與分析,為后期提取細粒度信息提供有效的數(shù)據(jù)支撐,對采集到的原始數(shù)據(jù)進行預處理得到粗粒度指標信息[6].數(shù)據(jù)處理需要從大量、分散、缺失的數(shù)據(jù)中抽取并推導出對解決問題有價值、有意義的數(shù)據(jù),經(jīng)過清洗、集成、歸一化、標準化的手段得到處理后的數(shù)據(jù)集.數(shù)據(jù)處理過程見圖1.首先分析數(shù)據(jù),選取重要內(nèi)容,通過算術和邏輯運算得到進一步的信息,按照相關信息進行有效地分組,再將整理好的數(shù)據(jù)集成合并,并統(tǒng)一單位,化為數(shù)值型數(shù)據(jù).由于不同變量的數(shù)值存在量綱的差異,因此還要進行歸一化處理,采用線性函數(shù)歸一化方式,對原始數(shù)據(jù)進行線性變換,通過原始數(shù)據(jù)和最小值的差值占最大值和最小值之間的比例換算,將所有數(shù)據(jù)壓縮至0~1區(qū)間內(nèi)進行比較.對處理后的數(shù)據(jù)再進行深入挖掘,選用合適的算法進行訓練得到符合實際情況且效果較好的行為特征指標.數(shù)據(jù)深入挖掘的工具選用SPSSModeler[7],通過軟件內(nèi)置的機器學習算法,分析數(shù)據(jù)獲得預測知識.
圖1 數(shù)據(jù)分析與處理
通過對不同角度的粗粒度指標深入解讀,基于時間維度對粗粒度指標參數(shù)進行細化,得到細粒度指標.細粒度信息作為數(shù)據(jù)粒度在空間尺度的更高程度細化,能提供數(shù)據(jù)分析微觀視角,具體指標內(nèi)容及含義見表1.
表1 粗粒度指標及細粒度指標
目標預測就是根據(jù)預處理過的數(shù)據(jù)集,得到目標變量的預測值,比較目標預測值和目標變量實際值,針對兩者的相關性進行相應的分析研究,確定構建函數(shù)預測模型的合理性,以對未來的數(shù)據(jù)或測量特征值進行預測.
在研究中,基于粗粒度指標及細粒度指標對目標變量總評成績進行回歸預測,通過預測模型將粗粒度指標及細粒度指標進行混合排序,得到對預測結果影響大的指標特征.由于期末試題成績指標是總評成績的組成部分,所以預測指標不含期末試題成績.同時,為了細致地觀察指標對目標預測的影響,將持續(xù)時間較長的指標,如視頻觀看時長、定期學習、簽到延時時間、程序調(diào)試周期再進一步劃分,分為中期指標和終期指標,觀察兩者對預測結果的影響.
不同預測算法其原理不同,得到預測結果也不同.本研究綜合考慮準確率最高,指標重要性排序羅列因素最多的要求下,進行算法選擇,采用機器學習算法MLP神經(jīng)網(wǎng)絡進行學習行為的分析與預測,有效預測指標28個,將數(shù)據(jù)樣本集的80%作為訓練集,20%作為測試集.根據(jù)MLP神經(jīng)網(wǎng)絡對綜合成績預測,所得平均絕對誤差為0.103,平均相對誤差為0.011.通過影響因素分析可以得到的重要指標中,粗粒度指標為報告成績、資料包閱讀個數(shù)、平均作業(yè)成績、視頻觀看時長.細粒度指標為測試時長、程序調(diào)試通過率、簽到延時時間、章節(jié)學習次數(shù)、作業(yè)時長、主題討論字數(shù).驗證得出細粒度指標對學習者成績的預測至關重要.
基于粗粒度指標及細粒度指標進行總評成績的預測,雖然通過結果的高低,可以看出一個學生對于這門課程掌握知識的多少,但是僅僅從成績的高低,不能準確掌握學習者對課程學習所體現(xiàn)的學習態(tài)度、學習習慣等學習行為結果.所以要深入分析特征指標映射出的學生的學習行為[8],并對其進行延深思考.
通過選取上文提出的所有粗粒度及細粒度指標,對學習者群體進行聚類,對不同的學生群體之間加深認知,從學習習慣、學習方式、學習積極性等多角度了解學生,針對每個學生群體進行不同的學習鞭策.
3.3.1常用聚類算法目前實際應用中的聚類分析方法有很多種類型.根據(jù)不同的類型羅列聚類算法見圖2.不同的劃分方式有不同的優(yōu)缺點,可以用于處理不同需求的聚類任務.數(shù)據(jù)樣本的類型、數(shù)據(jù)集的規(guī)模、數(shù)據(jù)存在噪聲等問題都將會影響聚類算法的選取.基于劃分的聚類方法是通過樣本點之間的距離計算相似度,將數(shù)據(jù)集合劃分為若干個簇.基于層次的聚類方法通常以樹狀圖的形式表現(xiàn)凝聚或分裂兩種聚類方式,該方法可解釋性強.基于密度的聚類方法通過觀察樣本點分布的密集程度,密集程度高的為簇,低的作為噪聲處理.基于模型的聚類方法是通過數(shù)據(jù)樣本的真實分布計算模型參數(shù),最后利用所得模型完成聚類[9].模糊聚類是將隸屬度的思想應用到聚類,輸出為數(shù)據(jù)屬于每一簇的可能性.
圖2 聚類算法
3.3.2聚類指標聚類完成后通過六種內(nèi)部指標對聚類結果進行評判,評估指標介紹見表2.內(nèi)部評價指標僅利用數(shù)據(jù)集的屬性特征,不考慮數(shù)據(jù)集的樣本標簽,對聚類算法的優(yōu)劣進行評價.通過計算總體的相似度、簇間平均相似度或簇內(nèi)平均相似度來評價聚類質量.
表2 內(nèi)部評價指標介紹
3.3.3聚類流程及結果通過機器學習聚類算法對學生群體進行合理的分類,學習者聚類算法流程見圖3.用戶進入系統(tǒng)后,選擇適合自己數(shù)據(jù)集的聚類模型進行訓練,查看聚類結果,再選用聚類內(nèi)部指標對訓練模型進行評估,針對評估值的好壞再進行下一步的操作.若對評估結果不滿意,用戶可以重新選擇聚類算法對數(shù)據(jù)集進行聚類.如果用戶想要預先指定需要劃分的簇數(shù)個數(shù),就可以選擇劃分聚類的K-means等算法,否則就選擇密度聚類DBSCAN等算法.如果用戶的數(shù)據(jù)集樣本規(guī)模大,就可以選擇采用層次聚類Birch聚類算法.不同的聚類算法,其原理和分類結果不盡相同,需要根據(jù)聚類目標和總體分類要求來綜合衡量采用何種聚類算法.
圖 3 聚類流程
以分類邊界清晰、類間分布人數(shù)相對均勻為目標,采用劃分聚類K-means算法基于粗細粒度指標對學生進行分類.樣本數(shù)總共為104,分成五類,聚類人數(shù)分別為23,16,19,22,24個,分類結果見圖4.圖4中每個顏色表示一類,且每類的聚類中心由黑色加號標明.
采用劃分聚類K-means算法得到CH指標為90,SC為0.398,DBI為0.984,S_Dbw值為0.124,RMSSTD為0.175,RS為0.479.通過觀察,CH值很高,SC指標和S_Dbw值在0~1之間,DBI小于1,RS值大于RMSSTD,表示K-means算法對于該數(shù)據(jù)集聚類效果很好,類內(nèi)緊密又類間分離,綜合考慮了簇的緊湊性、分離性以及不均勻性等因素.
圖4 K-means數(shù)據(jù)分類結果
3.3.4聚類分析對比每類中心的粗粒度指標和細粒度指標數(shù)據(jù),羅列變化較大的指標參數(shù)(見表3~4).
表3 K-means聚類結果Ⅰ
表4 K-means聚類結果Ⅱ
通過表中的參數(shù),結合粗粒度指標及細粒度指標,對比分析每一類群體的特點:
(1)第1類群體簽到延時時間最長,課堂內(nèi)發(fā)布的隨堂練習成績最高,討論字數(shù)很高,課后學習即課件資料包的下載忽略不計,視頻觀看時長幾乎沒有,平均作業(yè)成績中等偏上,報告成績中等.這類群體學生具有拖延行為,喜愛交流學習,動手能力突出,但不愛課后復習,不愛聽課,學習積極性中等.該類群體屬于交流學習行為.
(2)第2類群體總評成績不合格.除簽到延時指標及資料包相關指標外,其他指標都是最低,即對學習任務的完成度都很低,每項任務都只瀏覽過,但都沒有認真完成,更沒有進行深入的學習思考.這類群體對這門課毫無興趣.該類群體屬于跟風學習行為.
(3)第3類群體總評成績最好.絕大部分指標都為最高,簽到延時時間也是最短.反映了這類群體上課的積極性及對知識的掌握程度最高,體現(xiàn)了學生較強的自我管理能力.該類群體屬于聽課學習行為.
(4)第4類群體相比于其他類群體在資料包的學習上特別突出,資料包閱讀個數(shù)及資料包訪問天數(shù)都為最高,平均作業(yè)成績高但答題時間也最長,而且視頻的觀看時長很低.反映了這類群體喜歡探索性學習思考,獨立學習能力較高.該類群體屬于獨立學習行為.
(5)第5類群體程序調(diào)試通過率最高,課后學習即課件資料包的下載沒有,視頻觀看時長也很低,簽到延時時間很長,不愛討論,作業(yè)及報告成績都中等偏下.不參加課時安排內(nèi)的活動,只完成作業(yè)報告等重要考核,而且程序調(diào)試成功率過高,缺乏調(diào)試過程,證明他們不考慮學習的過程,只關心學習的結果.這類群體學習屬于臨時抱佛腳行為.
針對第1類群體而言,教師提高課內(nèi)外互動,并加強小組合作,便能提升第一類學習群體的學習積極性.針對第2類群體而言,教師不僅需要對學生單獨溝通,還需要單獨設立不同內(nèi)容進行深度測試,保證學習質量.針對第3類群體而言,發(fā)現(xiàn)學生感興趣的課程和內(nèi)容,并針對同一視頻觀看頻次或者程序調(diào)試過程中出現(xiàn)的問題可以給予針對性指導.針對第4 類群體,教師無需過多干預,只需要增加項目的可操作性和資料的適用性及完整性.針對第 5類群體而言,可以更多地展示課程學習內(nèi)容的前置知識和后續(xù)學習項目,以進一步提高學生的積極性.
在信息化教學環(huán)境下,本文對學習者學習過程中產(chǎn)生的行為數(shù)據(jù)進行了多角度分析,最大程度挖掘線上教學模式下所產(chǎn)生粗粒度指標,再基于時間維度等進一步細化粗粒度參數(shù)得到細粒度指標,結合粗粒度指標與細粒度指標,通過一系列預測算法找到影響學生學習效果的重要特征指標,并且預測出學生的成績與實際值進行對比.通過機器學習聚類算法對學生群體分成五類,發(fā)現(xiàn)一些具有普遍性的學習行為特點及規(guī)律,預測學生對課程知識點的掌握情況,并有效判別出學生的學習態(tài)度和學習的興趣程度,分數(shù)高者并不一定會認真學習這門課程,分數(shù)中等的學生不一定就對這門課程興趣低,所以需要利用深度學習算法對學生的學習態(tài)度和學習行為進行細化分析,準確定位,才能更好地幫助學生完成課程學習.
將粗、細粒度信息相結合能使原認知評估體系具有空間尺度多樣化特征.因此,研究應該兼顧粗粒度信息及深層細粒度信息,提升預測效果,挖掘隱含規(guī)律.但目前在線學習平臺找到可提煉的細粒度指標自由度不大,而且不能通過平臺跟蹤學生的學習軌跡,需要進一步改進.
[1] 屈泳,陳春芳,阮小軍,等.MOOC學習環(huán)境下的學習行為評價建模與應用[J].高師理科學刊,2022,42(10):66-73.
[2] 胡祖輝,施佺.高校學生上網(wǎng)行為分析與數(shù)據(jù)挖掘研究[J].中國遠程教育,2017,23(2):26-32.
[3] YOU,JI Won.Identifying significant indicators using LMS data to predict course achievement in online learning[J].Internet and Higher Education,2016,29(8):23-30.
[4] 劉桂梅.基于學習者行為的模式識別及成績預測研究[D].長沙:湖南大學,2021.
[5] 王暢.基于學生在線學習行為的成績預測方法研究[D].桂林:桂林電子科技大學,2022.
[6] 黃戌珺.基于在線學習行為分析的學習效果預測方法研究[D].武漢:華中師范大學,2018.
[7] 秦世名.面向在線學習行為分析的學習效果預測方法研究[D].武漢:華中師范大學,2019.
[8] 陳坤.基于在線學習社區(qū)學習者學習行為的建模與預測研究[D].武漢:華中師范大學,2019.
[9] 王玉晗,羅鄧三郎.聚類算法綜述[J].科技資訊,2018,16(24):10-11.
[10] Hassani M,Seidl T.Internal Clustering Evaluation of Data Streams[J].Trends and Applications in Knowledge Discovery and Data Mining,2015,9441:198-209.
[11] 魯杰,閆炳基,趙偉,等.基于不同算法的高爐操作爐型聚類效果對比[J].工程科學學報,2022,44(12):2081-2089.
[12] 李瑞珠.多指標聚類算法的研究[D].廣州:廣東工業(yè)大學,2021.
Application of fine-grained learning behavior analysis in information teaching
LIU Jinfeng,XU Zhan,LAN Chaofeng
(School of Measurement Control Technology and Communication Engineering,Harbin University of Science and Technology,Harbin 150080,China)
The application of modern online educational technology in education and teaching has been highly valued by the state and universities.In order to combine the online education outcome with the process of university education,this study is targeted to pick up learning behavior index of undergraduates to effectively predict individual learning behavior and learning efficiency,through online platform.The purpose is to break the bad habits of cramming and filling the classroom in the process of traditional classroom teaching.Further refine the collected coarse-grained data to obtain fine-grained parameters and discover students′ hidden data,such as learning interest,learning attitude and so on.The experimental results show that fine-grained indicators play an important role in predicting students′ overall grades.Through the analysis of indicators,identify five different types of student groups and several typical behavior characteristics are determined,so as to have a deeper understanding of students′ learning progress.
fine-grained parameters;learning behavior classification;data extraction;discrimination of feature importance
1007-9831(2023)12-0093-06
TP391.4
A
10.3969/j.issn.1007-9831.2023.12.016
2023-04-28
黑龍江省高等教育教學改革項目( SJGY20210384)
劉金鳳(1978-),女,黑龍江哈爾濱人,副教授,博士,從事算法優(yōu)化設計、信息技術應用研究.E-mail:1097246760@qq.com