[摘 要] 基于學(xué)習(xí)投入理論,依據(jù)學(xué)習(xí)者在線學(xué)習(xí)過(guò)程中產(chǎn)生的行為數(shù)據(jù),采用滯后序列分析法與GSEQ工具進(jìn)行行為序列分析,利用PSO-BP算法在Matlab編程軟件中構(gòu)建基于學(xué)習(xí)行為序列的成績(jī)預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,訓(xùn)練集與預(yù)測(cè)集的準(zhǔn)確率均大約為80%,基于學(xué)習(xí)行為序列的成績(jī)預(yù)測(cè)模型具有一定實(shí)用意義。
[關(guān)鍵詞] 學(xué)習(xí)行為序列;滯后序列分析;成績(jī)預(yù)測(cè)模型;PSO-BP;學(xué)習(xí)行為投入
[中圖分類(lèi)號(hào)] G424.74 [文獻(xiàn)標(biāo)識(shí)碼] A
[文章編號(hào)] 1673—1654(2024)05—079—009
一、前言
隨著信息技術(shù)的高速發(fā)展,線上MOOC、超星學(xué)習(xí)通等線上教學(xué)模式逐漸成為一種教學(xué)趨勢(shì)。在線學(xué)習(xí)環(huán)境下,學(xué)習(xí)者學(xué)習(xí)過(guò)程產(chǎn)生的眾多數(shù)據(jù)也為學(xué)習(xí)分析提供了關(guān)鍵依據(jù)。EDUCAUSE 將學(xué)習(xí)分析定義為“使用數(shù)據(jù)和模型來(lái)預(yù)測(cè)學(xué)生的學(xué)習(xí)進(jìn)步和行為表現(xiàn),并能基于數(shù)據(jù)采取恰當(dāng)策略”[1]。學(xué)習(xí)行為分析是學(xué)習(xí)分析的重要組成部分,通過(guò)對(duì)學(xué)習(xí)過(guò)程中的相關(guān)行為數(shù)據(jù)進(jìn)行分析,挖掘出隱藏在行為數(shù)據(jù)背后的有價(jià)值信息[2]。目前關(guān)于學(xué)習(xí)預(yù)測(cè)的相關(guān)研究主要基于學(xué)習(xí)行為參與度數(shù)據(jù),這些粗粒度數(shù)據(jù)并不能細(xì)致地反映出學(xué)習(xí)者的學(xué)習(xí)路徑、認(rèn)知投入水平等,而學(xué)習(xí)行為序列則能更好地反映出學(xué)習(xí)者的學(xué)習(xí)偏好、學(xué)習(xí)模式、認(rèn)知水平、投入度等。
當(dāng)前國(guó)內(nèi)關(guān)于學(xué)習(xí)分析技術(shù)的研究主要關(guān)注學(xué)習(xí)行為模式識(shí)別、挖掘?qū)W習(xí)模式與學(xué)習(xí)效果的關(guān)系等。例如,王溢琴通過(guò)學(xué)習(xí)行為序列對(duì)優(yōu)秀群體與中等群體在不同學(xué)習(xí)階段的學(xué)習(xí)行為模式的差異進(jìn)行了研究[3];Yang等人通過(guò)滯后序列分析法對(duì)高校學(xué)生在協(xié)同翻譯活動(dòng)不同階段的學(xué)習(xí)模式的差異進(jìn)行了研究[4]。國(guó)內(nèi)外的研究主要集中于學(xué)習(xí)偏好、學(xué)習(xí)行為模式、學(xué)習(xí)行為數(shù)據(jù)、學(xué)習(xí)效果或成績(jī)預(yù)測(cè)關(guān)鍵技術(shù)等方面的研究,對(duì)學(xué)習(xí)行為分析中的行為序列進(jìn)行分析與實(shí)踐研究尚不足,因此本文主要對(duì)學(xué)習(xí)行為序列的分析及成績(jī)預(yù)測(cè)的方法進(jìn)行研究,構(gòu)建基于行為序列的成績(jī)預(yù)測(cè)模型,并通過(guò)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行模型的評(píng)價(jià),探索學(xué)習(xí)者的學(xué)習(xí)路徑、偏好,為教師教學(xué)方案的改善提供參考信息,輔助學(xué)生對(duì)學(xué)習(xí)過(guò)程進(jìn)行反思,同時(shí)為成績(jī)預(yù)測(cè)模型方向的研究提供新思路。
二、相關(guān)理論與概念
(一)學(xué)習(xí)行為投入理論
早期研究認(rèn)為,學(xué)習(xí)投入僅受單因素影響。但隨著對(duì)學(xué)習(xí)投入研究的不斷深入,國(guó)內(nèi)外研究者認(rèn)識(shí)到學(xué)習(xí)投入需從多維角度去研究,而學(xué)習(xí)行為投入是學(xué)習(xí)投入中的重要一環(huán)。眾多關(guān)于學(xué)習(xí)行為投入的研究發(fā)現(xiàn)其概念的界定主要在時(shí)間、學(xué)習(xí)活動(dòng)的強(qiáng)度與努力程度三個(gè)方面。本研究將學(xué)習(xí)行為限定于在線學(xué)習(xí)環(huán)境下,學(xué)習(xí)者與學(xué)習(xí)平臺(tái)的交互過(guò)程。王文晶將學(xué)習(xí)行為投入理論與行為序列聚類(lèi)結(jié)果相結(jié)合,研究基于學(xué)習(xí)序列與成績(jī)之間的關(guān)聯(lián),幫助學(xué)習(xí)者建立正確的學(xué)習(xí)行為模式,進(jìn)而提高學(xué)習(xí)效果[5]。杜鑫基于SSLD的數(shù)據(jù),利用學(xué)習(xí)行為序列,探索其與學(xué)習(xí)效果的相關(guān)性,深入理解課程學(xué)習(xí)過(guò)程及學(xué)生學(xué)習(xí)行為投入之間的關(guān)聯(lián),進(jìn)而得到促進(jìn)學(xué)生學(xué)業(yè)成功的依據(jù)[6]。本研究主要依據(jù)學(xué)習(xí)行為投入理論對(duì)學(xué)習(xí)者進(jìn)行序列特征分析。
(二)學(xué)習(xí)行為序列
學(xué)習(xí)行為是學(xué)習(xí)者在學(xué)習(xí)過(guò)程中產(chǎn)生的一類(lèi)學(xué)習(xí)記錄,一般分為線上學(xué)習(xí)行為與線下學(xué)習(xí)行為。線下學(xué)習(xí)行為主要是學(xué)習(xí)者在課堂學(xué)習(xí)中發(fā)生的肢體、語(yǔ)言、表情等行為;線上學(xué)習(xí)行為主要是在線學(xué)習(xí)環(huán)境下,學(xué)習(xí)者在MOOC、SPOC、學(xué)習(xí)通等平臺(tái)上點(diǎn)擊相關(guān)課程、訪問(wèn)資源、線上答題、討論等行為。
學(xué)習(xí)行為序列是學(xué)習(xí)者在發(fā)生一個(gè)行為后繼續(xù)發(fā)生下一個(gè)行為的連續(xù)過(guò)程產(chǎn)生的序列。本次研究主要是在線學(xué)習(xí)環(huán)境下,對(duì)學(xué)習(xí)行為序列的研究,即在線上學(xué)習(xí)過(guò)程中,學(xué)習(xí)者在學(xué)習(xí)通平臺(tái)按時(shí)間順序從一個(gè)模塊點(diǎn)擊進(jìn)入另一個(gè)模塊的路徑,以及在每個(gè)模塊停留的時(shí)間、留下的足跡等,這些行為鏈即學(xué)習(xí)行為序列。研究中發(fā)現(xiàn),不同成績(jī)等級(jí)的學(xué)習(xí)者在學(xué)習(xí)過(guò)程中會(huì)產(chǎn)生不同的學(xué)習(xí)行為序列,這些行為序列在一定程度上反映了學(xué)習(xí)者的學(xué)習(xí)偏好和學(xué)習(xí)路徑,而行為序列與成績(jī)之間具有相關(guān)關(guān)系?;诖?,將關(guān)鍵行為序列作為成績(jī)預(yù)測(cè)的特征向量,構(gòu)建基于行為序列的成績(jī)預(yù)測(cè)模型。
(三)學(xué)習(xí)成績(jī)預(yù)測(cè)模型
學(xué)習(xí)過(guò)程產(chǎn)生眾多數(shù)據(jù)。雖然線上平臺(tái)的學(xué)習(xí)數(shù)據(jù)便于收集,并隱藏著大量潛在信息,但往往復(fù)雜、零散、無(wú)序。為解決此問(wèn)題,研究者通常選擇數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)分析,同時(shí)基于數(shù)據(jù)挖掘,圍繞在線學(xué)習(xí)數(shù)據(jù)對(duì)學(xué)習(xí)成績(jī)進(jìn)行預(yù)測(cè)。例如,黎龍珍基于線上學(xué)習(xí)數(shù)據(jù)利用SMOTE過(guò)采樣與LightGBM算法進(jìn)行預(yù)測(cè)模型的構(gòu)建與優(yōu)化,解決了數(shù)據(jù)不平衡問(wèn)題對(duì)測(cè)算精度的影響[7];袁敏構(gòu)建行為評(píng)價(jià)體系,分析不同特征學(xué)習(xí)者的行為差異,利用邏輯回歸與神經(jīng)網(wǎng)絡(luò)對(duì)成績(jī)進(jìn)行分類(lèi)預(yù)測(cè),從行為干預(yù)模型、平臺(tái)管理者及學(xué)習(xí)者三個(gè)視角對(duì)學(xué)習(xí)者進(jìn)行干預(yù)[8]。本研究則基于學(xué)生學(xué)習(xí)行為序列與機(jī)器學(xué)習(xí)方法進(jìn)行成績(jī)預(yù)測(cè)模型的構(gòu)建。
三、基于學(xué)習(xí)行為序列的成績(jī)預(yù)測(cè)模型的構(gòu)建
(一)方法概述
1. 滯后序列分析流程
滯后序列分析(lag sequential analysis,LSA)是由薩基特提出的,旨在評(píng)估序列行為隨著時(shí)間變化發(fā)生的概率。該方法主要檢驗(yàn)學(xué)習(xí)行為顯著性,分析一種行為在另一種行為出現(xiàn)之后所發(fā)生概率的顯著性來(lái)挖掘?qū)W習(xí)者的學(xué)習(xí)行為模式[9]。一般包括如圖1所示的五個(gè)步驟。
滯后序列分析利用GSEQ來(lái)實(shí)現(xiàn)。分析過(guò)程中,首先嚴(yán)格按照GSEQ軟件的格式要求進(jìn)行行為編碼并輸入該編碼,再經(jīng)過(guò)系統(tǒng)編譯生成MDS文件,再檢驗(yàn)行為編碼的一致性,然后進(jìn)行行為序列分析,得到行為序列轉(zhuǎn)換頻率與殘差表,最后根據(jù)調(diào)整后的殘差值(Z-score)篩選出有顯著意義的行為序列,繪制行為轉(zhuǎn)換圖。
2.行為序列分析
從超星學(xué)習(xí)通平臺(tái)獲取學(xué)習(xí)者線上學(xué)習(xí)行為數(shù)據(jù)并進(jìn)行行為編碼。利用滯后序列分析方法對(duì)學(xué)生的行為序列計(jì)算其行為序列頻次和調(diào)整后的殘差值,依據(jù)學(xué)習(xí)行為投入理論對(duì)行為序列進(jìn)行分析。牟智佳基于學(xué)習(xí)行為投入理論,將行為序列進(jìn)一步歸入不同的學(xué)習(xí)投入方式,根據(jù)學(xué)習(xí)者特征與學(xué)習(xí)行為投入進(jìn)行學(xué)習(xí)行為序列分析[10];張家華基于學(xué)習(xí)行為投入理論將行為分為操作行為、協(xié)作行為、問(wèn)題解決行為,對(duì)干預(yù)前后學(xué)習(xí)者的學(xué)習(xí)行為序列進(jìn)行差異性分析[11]。本研究將主要依據(jù)張家華的方法。
3.粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)
BP(back propagation,反向傳播)神經(jīng)網(wǎng)絡(luò)算法本質(zhì)上是一種具有多層次結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法,其特點(diǎn)是信號(hào)向前傳遞,而算法訓(xùn)練的誤差向后傳遞,在比較誤差和期望值的過(guò)程中,對(duì)每一層網(wǎng)絡(luò)的連接權(quán)值及閾值不斷地進(jìn)行調(diào)節(jié),最終使得神經(jīng)網(wǎng)絡(luò)的訓(xùn)練輸出盡可能地與期望輸出接近,完成神經(jīng)網(wǎng)絡(luò)訓(xùn)練目的[12]。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)主要由輸入層、隱含層和輸出層三個(gè)部分組成。
粒子群算法(Particle Swarm Optimization,PSO)是基于鳥(niǎo)群捕食活動(dòng)而演化出來(lái)的優(yōu)化算法。在尋優(yōu)計(jì)算中,通過(guò)不斷跟蹤最優(yōu)解,實(shí)現(xiàn)對(duì)粒子速度和位置的更新,從而不斷尋求最優(yōu)解。該算法被廣泛應(yīng)用于優(yōu)化問(wèn)題的求解過(guò)程[13]。粒子更新速度與位置的規(guī)則如下:
[Vj+1i=ωVji+c1r1pb-Xji+c2r2gb-Xji] (1)
[Xj+1i=Xji+Vj+1i] (2)
其中,[Vji]與[Xji]為第i次迭代時(shí)粒子的速度與位置,[ω]為慣性因子,[c1]與[c2]均代表個(gè)體學(xué)習(xí)因子,[r1]與[r2]為[0,1]間的隨機(jī)數(shù),[pb]與[gb]代表當(dāng)前單個(gè)粒子與全部粒子的最優(yōu)位置。
BP神經(jīng)網(wǎng)絡(luò)的各層初始權(quán)值和閾值對(duì)模型的訓(xùn)練有很大影響,但其初始權(quán)值和閾值又是隨機(jī)生成的,會(huì)對(duì)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度產(chǎn)生較大影響[14]。因此本研究主要采用PSO-BP神經(jīng)網(wǎng)絡(luò)算法(粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò))進(jìn)行成績(jī)預(yù)測(cè),將預(yù)測(cè)的迭代誤差、精確率、召回率、F1分?jǐn)?shù)作為預(yù)測(cè)模型的評(píng)估指標(biāo)。
(二)基于學(xué)習(xí)行為序列的成績(jī)預(yù)測(cè)模型設(shè)計(jì)
許多研究者依據(jù)學(xué)習(xí)行為粗粒度數(shù)據(jù),并選擇不同算法構(gòu)建預(yù)測(cè)模型。例如,郭濤等人構(gòu)建PSO-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型挖掘?qū)W生行為數(shù)據(jù),篩選具有代表性的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入,選擇課程成績(jī)作為神經(jīng)網(wǎng)絡(luò)的輸出,成績(jī)預(yù)測(cè)效果較好,為提高教學(xué)質(zhì)量提供了新思路[15];江波等人利用特征值,并通過(guò)四類(lèi)機(jī)器學(xué)習(xí)算法,對(duì)及格、未及格這兩類(lèi)學(xué)習(xí)效果進(jìn)行預(yù)測(cè)[16]。本研究在學(xué)習(xí)行為序列的基礎(chǔ)上,利用機(jī)器學(xué)習(xí)算法構(gòu)建成績(jī)預(yù)測(cè)模型,預(yù)測(cè)學(xué)習(xí)者的成績(jī)。主要采用了分類(lèi)算法中的PSO-BP神經(jīng)網(wǎng)絡(luò)算法,該算法是一種將粒子群優(yōu)化與反向傳播相結(jié)合的訓(xùn)練算法,集合了PSO和BP兩種算法的優(yōu)點(diǎn),可以克服單一算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的局限性,通過(guò)全局優(yōu)化來(lái)提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率和訓(xùn)練結(jié)果準(zhǔn)確性,提高在模式識(shí)別、數(shù)據(jù)挖掘、預(yù)測(cè)分析等領(lǐng)域的廣泛應(yīng)用。
如圖2所示,先對(duì)獲取的線上行為數(shù)據(jù)進(jìn)行行為編碼,再通過(guò)滯后分析方法篩選出具顯著性的行為序列,繪制行為序列轉(zhuǎn)換圖,依據(jù)學(xué)習(xí)行為投入理論進(jìn)行行為序列分析,再依據(jù)PSO-BP神經(jīng)網(wǎng)絡(luò)算法對(duì)學(xué)生的學(xué)習(xí)成績(jī)進(jìn)行預(yù)測(cè)。
(三)基于學(xué)習(xí)行為序列的成績(jī)預(yù)測(cè)模型評(píng)價(jià)
PSO-BP神經(jīng)網(wǎng)絡(luò)算法的迭代過(guò)程如圖3所示。
圖4的PSO-BP神經(jīng)網(wǎng)絡(luò)算法迭代過(guò)程中,粒子群迭代到17次時(shí),適應(yīng)度值0.14,趨于平穩(wěn),收斂性較好。
由于該模型利用PSO-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行成績(jī)的分類(lèi)預(yù)測(cè),所以預(yù)測(cè)效果的評(píng)估主要依據(jù)訓(xùn)練集與測(cè)試集預(yù)測(cè)的最終精確率、召回率、F1分?jǐn)?shù)。如圖6所示,訓(xùn)練集與預(yù)測(cè)集的預(yù)測(cè)精確率均在70%左右,召回率在80%左右,F(xiàn)1分?jǐn)?shù)在70%-80%之間。因此,總體來(lái)講,該模型的預(yù)測(cè)效果具有研究意義。
四、基于學(xué)習(xí)行為序列的成績(jī)預(yù)測(cè)模型的應(yīng)用
(一)實(shí)驗(yàn)設(shè)計(jì)
基于滯后序列分析、相關(guān)性分析與神經(jīng)網(wǎng)絡(luò)分類(lèi)算法等方法,探索以下問(wèn)題:
1.通過(guò)數(shù)據(jù)挖掘方法挖掘?qū)W習(xí)通平臺(tái)日志數(shù)據(jù),探索學(xué)習(xí)者的行為序列轉(zhuǎn)換情況,行為序列出現(xiàn)的概率達(dá)到顯著性水平的有哪些;
2.探索學(xué)習(xí)行為序列與課程成績(jī)是否顯著相關(guān);
3.基于行為序列構(gòu)建的成績(jī)預(yù)測(cè)模型能否得到驗(yàn)證,其準(zhǔn)確率如何。
研究以某師范大學(xué)一門(mén)教育技術(shù)學(xué)專(zhuān)業(yè)課《教學(xué)技術(shù)與媒體》2022年春季學(xué)期學(xué)習(xí)通平臺(tái)記錄的102名學(xué)習(xí)者的日志數(shù)據(jù)為樣本。該課程采用線下講授與線上自主學(xué)習(xí)相結(jié)合的學(xué)習(xí)形式,課程持續(xù)6個(gè)月,共32學(xué)時(shí)。該課程利用多媒體平臺(tái)開(kāi)展教學(xué),學(xué)生基于學(xué)習(xí)通平臺(tái)的學(xué)習(xí)活動(dòng)主要包括學(xué)習(xí)理論知識(shí)、參與交流討論、查閱資料、完成作業(yè)、參與測(cè)試、查看學(xué)習(xí)通知等。102名學(xué)生在學(xué)習(xí)通平臺(tái)共產(chǎn)生12252條日志數(shù)據(jù)作為本研究的數(shù)據(jù)樣本,依據(jù)記錄時(shí)間、學(xué)號(hào)、行為等重要字段研究學(xué)生的行為序列轉(zhuǎn)換情況與行為序列特征。
通過(guò)Python中的Requests庫(kù)、HTML解析庫(kù)及正則表達(dá)式爬取并解析學(xué)習(xí)者日志中的學(xué)生動(dòng)作數(shù)據(jù),去除偶發(fā)動(dòng)作類(lèi)型,將21種在學(xué)習(xí)通平臺(tái)的交互動(dòng)作歸為6種行為,作為行為序列分析的行為數(shù)據(jù)。依據(jù)李爽基于行為序列分析對(duì)在線學(xué)習(xí)參與模式的探索中描述的行為編碼風(fēng)格,對(duì)6種行為進(jìn)行編碼,編碼內(nèi)容如下表1所示。
(二)行為序列分析
1. 行為序列總體情況分析
首先對(duì)學(xué)生在該課程學(xué)習(xí)過(guò)程中產(chǎn)生的所有行為進(jìn)行頻次統(tǒng)計(jì)。如表2行為序列頻次表所示,列表示起始行為,行表示緊接著起始行為后發(fā)生的行為,即由列行為跳轉(zhuǎn)到行行為稱(chēng)為一個(gè)行為序列;表中數(shù)字為列行為跳轉(zhuǎn)到行行為發(fā)生的頻次。其中,產(chǎn)生頻次較多的行為序列為文檔學(xué)習(xí)DL后緊接著進(jìn)行下一個(gè)文檔學(xué)習(xí)DL,該序列簡(jiǎn)稱(chēng)DLDL,頻次為1348次;作業(yè)練習(xí)AP后緊接著下一個(gè)作業(yè)練習(xí)AP,序列簡(jiǎn)稱(chēng)APAP,頻次為614次;作業(yè)練習(xí)AP后緊接著文檔學(xué)習(xí)DL行為,序列簡(jiǎn)稱(chēng)APDL,頻次為437次。
2. 行為序列轉(zhuǎn)換分析
基于行為序列頻次,利用滯后序列分析方法,得到調(diào)整后的殘差表Z-score,如表3。Z-scoregt;1.96表明該行為序列出現(xiàn)的頻次在統(tǒng)計(jì)學(xué)上具有顯著意義(plt;0.05)??梢?jiàn),表3中FDFD從交流討論跳轉(zhuǎn)到另一個(gè)交流討論、VLVL從一個(gè)視頻學(xué)習(xí)跳轉(zhuǎn)到另一個(gè)視頻學(xué)習(xí)、APCN作業(yè)練習(xí)后緊接著進(jìn)行查閱通知等16個(gè)行為序列發(fā)生的頻次具有顯著意義。
為更加清楚地觀察學(xué)生在課程學(xué)習(xí)過(guò)程中發(fā)生的行為路徑,依據(jù)表3繪制了圖5的行為序列轉(zhuǎn)換圖。
圖5中各個(gè)節(jié)點(diǎn)表示各種學(xué)習(xí)行為,節(jié)點(diǎn)之間的連線表示具有顯著意義的行為序列,箭頭表示行為轉(zhuǎn)換的方向。如圖所示,學(xué)生在學(xué)習(xí)通平臺(tái)上發(fā)生的行為序列轉(zhuǎn)換具有多樣性,在6種學(xué)習(xí)行為中,F(xiàn)D交流討論、VL視頻學(xué)習(xí)、DL文檔學(xué)習(xí)、AP作業(yè)練習(xí)有著更多顯著意義的序列,這些序列包括單向跳轉(zhuǎn)與雙向跳轉(zhuǎn)。圖5顯示出學(xué)習(xí)者具有如下的潛在學(xué)習(xí)行為習(xí)慣、模式、偏好:
(1)在進(jìn)行一次交流討論后更傾于再進(jìn)行下一次交流討論,在討論區(qū)連續(xù)發(fā)表或回復(fù)其他同學(xué)、老師的提問(wèn),或者查詢學(xué)習(xí)通知來(lái)了解當(dāng)前的學(xué)習(xí)任務(wù);
(2)在視頻學(xué)習(xí)后更傾向于選擇下一個(gè)視頻進(jìn)行學(xué)習(xí),或者進(jìn)行章節(jié)測(cè)試;
(3)在文檔學(xué)習(xí)后更傾向于下一個(gè)文檔學(xué)習(xí),或者進(jìn)行章節(jié)測(cè)試檢測(cè)自己的學(xué)習(xí)效果,或者進(jìn)行作業(yè)練習(xí),完成課程作業(yè);
(4)在作業(yè)練習(xí)后更傾向于完成下一個(gè)練習(xí),或者查詢本章節(jié)的學(xué)習(xí)通知來(lái)了解本次學(xué)習(xí)的具體要求;
(5)在查詢本次學(xué)習(xí)的相關(guān)要求與任務(wù)后,更傾向于作業(yè)練習(xí)或者文檔學(xué)習(xí)。
(三)成績(jī)預(yù)測(cè)分析與評(píng)價(jià)
1. 特征選擇
學(xué)生成績(jī)由平時(shí)成績(jī)、考試成績(jī)、考核成績(jī)?nèi)糠纸M成,最終的成績(jī)?yōu)槿糠殖煽?jī)的平均分。在進(jìn)行各個(gè)行為序列與成績(jī)的相關(guān)性檢驗(yàn)之前將學(xué)生的成績(jī)劃分為四個(gè)等級(jí):等級(jí)4,不及格,小于60分;等級(jí)3,及格,大于等于60分且小于70分;等級(jí)2,良好,大于等于70分且小于80分;等級(jí)1,優(yōu)秀,大于等于80分。將成績(jī)等級(jí)與各個(gè)行為序列進(jìn)行獨(dú)立樣本檢驗(yàn),檢驗(yàn)結(jié)果如下表4所示:表中的列表示行為序列,行表示成績(jī)等級(jí);表中的數(shù)據(jù)為理論頻數(shù),理論頻數(shù)越大說(shuō)明相關(guān)性越大??ǚ街禐?9.30,拒絕域臨界值為25.03,卡方值大于臨界值說(shuō)明對(duì)于不同成績(jī)等級(jí),學(xué)生的行為序列有顯著性差異,plt;0.05說(shuō)明原假設(shè)不成立。行為序列與成績(jī)有相關(guān)性,由表4可知,DLST文檔學(xué)習(xí)后緊接著章節(jié)測(cè)試行為、APAP作業(yè)練習(xí)后繼續(xù)作業(yè)練習(xí)行為、APDL作業(yè)練習(xí)后繼續(xù)文檔學(xué)習(xí)等行為序列與成績(jī)的相關(guān)性最高。由于學(xué)生的成績(jī)主要集中在良好與及格等級(jí),因此特征選擇主要依據(jù)良好、及格的頻數(shù)分布情況與具有顯著意義的行為序列進(jìn)行,最終確定特征為:DLST文檔學(xué)習(xí)后進(jìn)行章節(jié)測(cè)試、APAP作業(yè)練習(xí)繼續(xù)另一個(gè)作業(yè)練習(xí)、DLDL文檔學(xué)習(xí)后繼續(xù)另一個(gè)文檔學(xué)習(xí)、DLAP文檔學(xué)習(xí)后進(jìn)行作業(yè)練習(xí)、CNAP查閱通知后進(jìn)行作業(yè)練習(xí)、CNDL查閱通知后進(jìn)行文檔學(xué)習(xí)。
2.成績(jī)預(yù)測(cè)分析
通過(guò)Matlab利用PSO-BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行成績(jī)預(yù)測(cè)。將70%的數(shù)據(jù)作為訓(xùn)練集,30%的數(shù)據(jù)作為測(cè)試集,預(yù)測(cè)的結(jié)果如圖6所示。經(jīng)過(guò)數(shù)次訓(xùn)練,第十七輪的預(yù)測(cè)性能最好,訓(xùn)練集的準(zhǔn)確率在84.32%,測(cè)試集的準(zhǔn)確率在79.85%,總之在訓(xùn)練到第十輪時(shí)模型準(zhǔn)確率最高,誤差最小。
同時(shí),表5顯示,訓(xùn)練集的準(zhǔn)確率均達(dá)到80%以上,預(yù)測(cè)效果較好;而測(cè)試集中,成績(jī)預(yù)測(cè)的準(zhǔn)確率只有等級(jí)1、等級(jí)2達(dá)到80%以上。總體來(lái)看,等級(jí)1、等級(jí)2的準(zhǔn)確率較高,等級(jí)3、等級(jí)4的準(zhǔn)確率仍有提升空間。
五、結(jié)語(yǔ)
通過(guò)滯后序列分析方法,結(jié)合學(xué)習(xí)行為投入理論對(duì)學(xué)生整體的行為序列進(jìn)行轉(zhuǎn)換與分析,歸納出具有顯著意義的行為序列,利用獨(dú)立性卡方檢驗(yàn)將學(xué)生的學(xué)習(xí)行為序列與成績(jī)進(jìn)行相關(guān)性分析,確定影響學(xué)生學(xué)習(xí)成績(jī)的關(guān)鍵行為序列特征,利用PSO-BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行成績(jī)分類(lèi)預(yù)測(cè)。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),在36個(gè)行為序列中存在16種具有顯著意義的行為序列;獨(dú)立性卡方檢驗(yàn)顯示,這些行為序列與成績(jī)具有相關(guān)性。因此,該模型具有實(shí)用意義。
參考文獻(xiàn):
[1] 菅保霞.基于腦偏好風(fēng)格的在線學(xué)習(xí)行為序列差異研究[D].東北師范大學(xué),2019.
[2] 楊現(xiàn)民,王懷波,李冀紅.滯后序列分析法在學(xué)習(xí)行為分析中的應(yīng)用[J].中國(guó)電化教育,2016,(02):17-23+32.
[3] 王溢琴,齊悅.基于LSA的在線學(xué)習(xí)行為序列演變分析[J].中國(guó)信息技術(shù)教育,2022,(08):108-112.
[4] Yang X,Li J,Guo X,et al. Group Interactive Network And Behavioral Patterns In Online English-To-Chinese Cooperative Translation Activity [J]. Internet amp; Higher Education,2015,25:28-36.
[5] 王文晶,閆俊伢.基于學(xué)習(xí)行為序列的在線學(xué)習(xí)研究[J].計(jì)算機(jī)時(shí)代,2022,(09):115-118.DOI:10.16644/j.cnki.cn33-1094/tp.2022.09.026.
[6] 杜鑫,陳敏,魏署光.學(xué)業(yè)成功學(xué)生是如何學(xué)習(xí)的——基于課程學(xué)習(xí)行為序列的分析[J].高等教育研究,2022,43(02):81-89.
[7] 黎龍珍.基于在線學(xué)習(xí)行為分析的成績(jī)預(yù)測(cè)模型研究[D].貴州財(cái)經(jīng)大學(xué),2021.DOI:10.27731/d.cnki.ggzcj.2021.000372.
[8] 袁敏.大數(shù)據(jù)環(huán)境下在線學(xué)習(xí)行為分析及學(xué)習(xí)成績(jī)預(yù)測(cè)研究[D].上海工程技術(shù)大學(xué),2021.DOI:10.27715/d.cnki.gshgj.2021.000262.
[9] Sackett E. Observing Behavior [M] //" Vol.1:Theory And Applications In Mental Retardation. Univ. Park Pr,1978.
[10] 牟智佳,張勤娜,陳思睿.基于行為序列的學(xué)習(xí)行為模式識(shí)別與教學(xué)干預(yù)[J].現(xiàn)代教育技術(shù),2020,30(05):74-80.
[11] 張家華,繆佳佳,鄒柳聰.學(xué)習(xí)干預(yù)對(duì)在線學(xué)習(xí)者的影響及其學(xué)習(xí)行為序列差異[J].現(xiàn)代教育技術(shù),2020,30(03):32-38.
[12] 王佑鎂,李寧宇,尹以晴,等.從再現(xiàn)到預(yù)測(cè):基于BP神經(jīng)網(wǎng)絡(luò)的中小學(xué)生數(shù)字閱讀素養(yǎng)評(píng)測(cè)體系研究[J].電化教育研究,2022,43(08):68-76.DOI:10.13811/j.cnki.eer.2022.08.009.
[13] 張濤,劉晶,胡海波.IPSO-BP神經(jīng)網(wǎng)絡(luò)模型的教學(xué)質(zhì)量評(píng)價(jià)[J].實(shí)驗(yàn)室研究與探索,2023,42(06):174-178+193.DOI:10.19927/j.cnki.syyt.2023.06.035.
[14] 曾麗芳,李麗萍,江紹萍.基于BP神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)[J/OL].云南民族大學(xué)學(xué)報(bào)(自然科學(xué)版):1-11[2023-10-13].http://kns.cnki.net/kcms/detail/53.1192.n.20220706.1638.010.html.
[15] 郭濤,魏勇,熊杰.PSO-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在智慧課堂中的應(yīng)用研究[J].計(jì)算機(jī)時(shí)代,2021,(03):52-56.DOI:10.16644/j.cnki.cn33-1094/tp.2021.03.016.
[16] 江波,高明,陳志翰,等.基于行為序列的學(xué)習(xí)過(guò)程分析與學(xué)習(xí)效果預(yù)測(cè)[J].現(xiàn)代遠(yuǎn)程教育研究,2018,(02):103-112.
Research on the Construction of the Performance Prediction Model Based on the Student Learning Behavior Sequence
Ye Yi1" Xu Xinhua1" Ye Xiaoxiao2" Wang Chenyu1" Lu Yue3
1 School of Computer and Information Engineering,Hubei Normal University,Huangshi,Hubei,435002
2 School of Engineering and Technology,Hubei University of Technology,Wuhan,Hubei,430068
3 Jianghan University,Wuhan,Hubei,430056
Abstract:Based on the learning behavior input theory and learning behavior data generated by learners' online learning,this paper used the lag sequence analysis method and GSEQ tool,constructed the performance prediction model based on the Matlab programming software. The experimental results showed that the accuracy of both training set and prediction set were about 80%,and the performance prediction model based on learning behavior sequence had some practical significance.
Key words:Learning Behavior Sequence,Lag Sequence Analysis,Performance Prediction Model,PSO-BP,Learning Behavior Engagement
(責(zé)任編輯:陳暢)