張明焱,杜 旭,李 浩
華中師范大學(xué)國(guó)家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心,武漢 430079
在線學(xué)習(xí)已成為當(dāng)今教育系統(tǒng)中必不可少的學(xué)習(xí)方式,通過(guò)分析學(xué)生的在線學(xué)習(xí)行為以支持相關(guān)的教學(xué)決策或觸發(fā)相應(yīng)的教學(xué)干預(yù)[1-2]吸引了大量的研究工作[3]。該研究領(lǐng)域也被稱為學(xué)習(xí)分析(learning analysis)。早期預(yù)警(early warning)是學(xué)習(xí)分析領(lǐng)域中的一個(gè)熱門主題[4]。早期預(yù)警通過(guò)構(gòu)建預(yù)測(cè)模型在學(xué)期較早階段預(yù)測(cè)學(xué)生的最終成績(jī),以識(shí)別出盡可能多的不及格風(fēng)險(xiǎn)(簡(jiǎn)稱at-risk)學(xué)生,方便教師在學(xué)期結(jié)束前采取干預(yù)措施,最終降低學(xué)生不及格的比例[5]。但僅識(shí)別出at-risk學(xué)生無(wú)法幫助教師采取有針對(duì)性的干預(yù)措施。已有的研究表明,識(shí)別關(guān)鍵預(yù)測(cè)因子,找出造成at-risk的因素對(duì)于教師采取針對(duì)性的教學(xué)干預(yù)措施意義重大[6-7]。因此,早期預(yù)警的核心問(wèn)題是:(1)提高at-risk學(xué)生的識(shí)別率;(2)確定合適的干預(yù)時(shí)間點(diǎn);(3)提供有效的干預(yù)信息。
國(guó)內(nèi)外學(xué)者都對(duì)早期預(yù)警進(jìn)行了研究。Wang 等人[8]利用改進(jìn)的Apriori算法對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析,找出數(shù)據(jù)中隱藏的課程關(guān)聯(lián)規(guī)則,然后將這些規(guī)則應(yīng)用于學(xué)生成績(jī)預(yù)警,及時(shí)找出可能出現(xiàn)不及格的課程,并對(duì)部分學(xué)生給出警示,加強(qiáng)學(xué)習(xí)監(jiān)督。Ak?ap?nar等人[9]使用學(xué)生閱讀電子書(shū)的數(shù)據(jù)和機(jī)器學(xué)習(xí)模型預(yù)測(cè)學(xué)生最終成績(jī)。為了確定采取干預(yù)措施所需的最佳模型和最佳時(shí)間點(diǎn),使用13 種算法以及不同周的課程數(shù)據(jù)進(jìn)行預(yù)測(cè),并對(duì)比了結(jié)果。Howard 等人[10]通過(guò)分析本科生的評(píng)估數(shù)據(jù)和個(gè)人信息數(shù)據(jù)建立早期預(yù)警模型,并重點(diǎn)研究干預(yù)的最佳時(shí)間。其結(jié)論表明,最佳干預(yù)時(shí)間是在課程中期,且學(xué)生需要改變學(xué)習(xí)策略以適應(yīng)新的課程要求。然而,已有的研究多數(shù)基于累積行為頻率作為預(yù)測(cè)變量。Hung 等人[11]指出累積行為頻率存在一些問(wèn)題。如未能考慮到不同學(xué)生學(xué)習(xí)行為模式之間的差異,忽略了多種行為模式可導(dǎo)致課程不及格,未能考慮到課程活動(dòng)的要求會(huì)隨課程進(jìn)展發(fā)生變化等問(wèn)題。因此at-risk學(xué)生的預(yù)測(cè)結(jié)果還有進(jìn)一步提升的空間。
學(xué)生的學(xué)習(xí)模式?jīng)Q定了其學(xué)習(xí)表現(xiàn)。學(xué)習(xí)模式被定義為“學(xué)習(xí)者通常采用的連貫的學(xué)習(xí)活動(dòng),包括他們對(duì)學(xué)習(xí)的信念和學(xué)習(xí)動(dòng)機(jī)”。通過(guò)分析學(xué)習(xí)模式能夠解釋造成學(xué)習(xí)表現(xiàn)差異的原因,進(jìn)一步區(qū)分不同學(xué)習(xí)表現(xiàn)的群體[12],因而提高不及格學(xué)生的識(shí)別率。在學(xué)習(xí)管理系統(tǒng)(learning management system,LMS)中,學(xué)生的行為是最易收集的,且已被廣泛應(yīng)用于描述學(xué)生在LMS中學(xué)習(xí)模式的變量,這些變量構(gòu)成了學(xué)生的行為模式。已有的研究采用各種行為的累積次數(shù)描述學(xué)生的行為模式。這種方法雖代表了模式的宏觀特征,卻無(wú)法進(jìn)一步區(qū)分累積頻率相似但頻率分布不同的學(xué)生,而他們具有不同的學(xué)習(xí)表現(xiàn)[11]。學(xué)習(xí)生行為的時(shí)間序列數(shù)據(jù)包含學(xué)習(xí)過(guò)程信息,即學(xué)習(xí)者在不同課程時(shí)期的行為分布,它描述了學(xué)生微觀行為模式,能夠進(jìn)一步區(qū)分不同類型的群體。
為了進(jìn)一步提高at-risk學(xué)生的識(shí)別率,可對(duì)學(xué)生的行為模式數(shù)據(jù)進(jìn)行特征處理。多項(xiàng)研究表明,使用自動(dòng)編碼器(autoencoder)對(duì)原始數(shù)據(jù)進(jìn)行特征壓縮和噪聲消除可以改善模型的性能(例如Zhao 等人[13]的研究)。autoencoder 也已被用于教育領(lǐng)域的研究。例如,Du 等人[14]提出了一個(gè)基于變分自編碼器(LVAE)和深度神經(jīng)網(wǎng)絡(luò)(DNN)的集成框架(LVAEPre),以解決教育數(shù)據(jù)集的高度不平衡問(wèn)題。Li 等人[15]提出了基于autoencoder的復(fù)合特征模型,該模型結(jié)合學(xué)習(xí)數(shù)據(jù)中的多重特征來(lái)推斷學(xué)生未來(lái)兩周的行為。由于學(xué)生的行為模式可以用時(shí)間序列數(shù)據(jù)表示,結(jié)合能夠處理序列數(shù)據(jù)的長(zhǎng)短期記憶(long short-term memory,LSTM)單元構(gòu)建自動(dòng)編碼器(LSTM-autoencoder)可以對(duì)學(xué)生行為模式數(shù)據(jù)進(jìn)行特征提取和去噪,進(jìn)而提高模型預(yù)測(cè)效果。
在線學(xué)習(xí)中,學(xué)生的最終成績(jī)?nèi)Q于課程各個(gè)階段的學(xué)習(xí)活動(dòng),而不同階段的學(xué)習(xí)活動(dòng)對(duì)最終成績(jī)的影響存在差異。對(duì)學(xué)習(xí)者的時(shí)間序列數(shù)據(jù)進(jìn)行分析,可以回溯學(xué)習(xí)者過(guò)程,發(fā)現(xiàn)影響學(xué)習(xí)成績(jī)的關(guān)鍵因子。注意力機(jī)制能夠計(jì)算出輸入變量相對(duì)輸出結(jié)果的權(quán)重,采用注意力機(jī)制分析學(xué)生行為模式,可以得到不同課程階段中各種行為對(duì)最終成績(jī)的影響程度。教師可根據(jù)這些信息進(jìn)一步分析at-risk學(xué)生在學(xué)習(xí)過(guò)程中存在的得失,進(jìn)而采取個(gè)性化的干預(yù)措施。如針對(duì)性監(jiān)督、輔助或改變后期的教學(xué)策略等。
本文提出一種通過(guò)深度學(xué)習(xí)模型對(duì)微觀行為模式進(jìn)行分析以實(shí)現(xiàn)學(xué)習(xí)成績(jī)?cè)缙陬A(yù)警的方法-結(jié)合LSTMautoencoder 特征處理和注意力權(quán)重計(jì)算的at-risk 學(xué)生早期預(yù)警模型(LSTM-autoencoder and attention based early warning model,LAA)。該方法采用LSTM-autoencoder對(duì)學(xué)生行為的時(shí)間序列數(shù)據(jù)進(jìn)行特征提取和去噪,通過(guò)注意力機(jī)制計(jì)算出不同學(xué)期周次、不同行為對(duì)最終成績(jī)的影響權(quán)重,并識(shí)別出at-risk學(xué)生和最早干預(yù)時(shí)間點(diǎn)。該方法不僅可以提高at-risk學(xué)生的召回率,提前教學(xué)干預(yù)時(shí)間,還可幫助教師進(jìn)行精準(zhǔn)的個(gè)性化教學(xué)干預(yù)。
Autoencoder在序列數(shù)據(jù)的特征提取方面獲得了廣泛的應(yīng)用。其編碼器部分能夠?qū)斎胄蛄袛?shù)據(jù)進(jìn)行維度壓縮,解碼器能從壓縮數(shù)據(jù)中恢復(fù)信息。整個(gè)訓(xùn)練過(guò)程要求能夠盡可能多的恢復(fù)原始數(shù)據(jù)中的信息,實(shí)現(xiàn)數(shù)據(jù)特征提取和去噪。
學(xué)生的行為模式具有前后關(guān)聯(lián)性,即前一段時(shí)間的學(xué)習(xí)行為會(huì)對(duì)后一段時(shí)間的學(xué)習(xí)行為產(chǎn)生影響。本文采用能夠記憶序列因果信息的LSTM 神經(jīng)元搭建autoencoder。根據(jù)LSTM網(wǎng)絡(luò)結(jié)構(gòu),每個(gè)LSTM神經(jīng)元都包含輸入門(it)、遺忘門(ft)和輸出門(Ot)。輸入門控制輸入信息,遺忘門控制哪些信息應(yīng)當(dāng)被舍棄,輸出門控制神經(jīng)元的輸出。各個(gè)門的計(jì)算公式如下:
ht表示t時(shí)刻神經(jīng)元的輸出,ht-1表示前一時(shí)刻單元的輸出。LSTM當(dāng)前狀態(tài)Ct計(jì)算如下:
本文通過(guò)LSTM-autoencoder 提取學(xué)習(xí)者時(shí)間序列數(shù)據(jù)中的前后學(xué)習(xí)行為關(guān)聯(lián)信息,并增強(qiáng)數(shù)據(jù)特征,以提高學(xué)習(xí)成績(jī)預(yù)測(cè)的結(jié)果。為了簡(jiǎn)化實(shí)驗(yàn)同時(shí)提高預(yù)測(cè)準(zhǔn)確率,autoencoder的編碼和解碼部分都采用單層的LSTM 神經(jīng)元。LSTM-autoencoder 模型架構(gòu)如圖1 所示。訓(xùn)練過(guò)程可以描述為[16]:
本文中,LSTM-autoencoder的輸入數(shù)據(jù)為學(xué)生行為的時(shí)間序列數(shù)據(jù)。輸入數(shù)據(jù)形狀為S(students)×M(時(shí)間步)×N(行為),經(jīng)過(guò)編碼器處理成S(students)×M(時(shí)間步)×1(編碼)的數(shù)據(jù),最終解碼器輸出S(students)×M(時(shí)間步)×N(恢復(fù)的行為)數(shù)據(jù)。整個(gè)訓(xùn)練過(guò)程結(jié)束后,學(xué)生的行為模式信息被保存在解碼器恢復(fù)出的序列數(shù)據(jù)中。
本文采用Raffel 等人[17]的研究中提出的用于解決LSTM問(wèn)題的前饋?zhàn)⒁饬W(wǎng)絡(luò)架構(gòu)進(jìn)行關(guān)鍵預(yù)測(cè)因子分析,計(jì)算各類學(xué)習(xí)行為對(duì)最終成績(jī)的影響權(quán)重和不同學(xué)期周次對(duì)成績(jī)的影響權(quán)重。該注意力模塊如圖2所示。
圖2 注意力計(jì)算模塊Fig.2 Attention calculation module
對(duì)于一般的注意力模塊,其隱層狀態(tài)計(jì)算公式為:
T為輸入序列的時(shí)間步長(zhǎng),αtj是狀態(tài)hj在每個(gè)時(shí)間步t計(jì)算的權(quán)重。這些上下文向量被用于計(jì)算新的狀態(tài)序列s,其中st取決于st-1,ct和模型在t-1 時(shí)的輸出。權(quán)重αtj計(jì)算公式如下:
其中,a是一個(gè)通過(guò)學(xué)習(xí)得到的函數(shù),可以考慮為給定hj的值和先前狀態(tài)st-1來(lái)計(jì)算hj的層級(jí)重要性值。這個(gè)公式使得新的狀態(tài)序列s可以更直接地獲取整個(gè)狀態(tài)序列h。
對(duì)上述隱層狀態(tài)計(jì)算方法進(jìn)行簡(jiǎn)化,使其可以用于從整個(gè)序列中產(chǎn)生單維向量c,方法如下:
a仍然是一個(gè)可學(xué)得的函數(shù),但現(xiàn)在僅取決于ht。在這種表述中,可以將注意力視為通過(guò)計(jì)算狀態(tài)序列h的自適應(yīng)加權(quán)平均值來(lái)生成輸入序列的固定長(zhǎng)度嵌入c。由于計(jì)算可以完全并行化,該方法會(huì)帶來(lái)較大的效率提升。
本文提出的結(jié)合LSTM-autoencoder 特征處理和注意力權(quán)重計(jì)算的at-risk 學(xué)生早期預(yù)警模型(LAA)架構(gòu)如圖3所示。
圖3 LAA早期預(yù)警模型Fig.3 LAA early warning model
原始行為數(shù)據(jù)經(jīng)過(guò)預(yù)處理和編碼,構(gòu)造成N個(gè)行為的時(shí)間序列數(shù)據(jù);采用LSTM-autoencoder對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)行為模式信息的特征提取和去噪;注意力層對(duì)解碼器的輸出數(shù)據(jù)進(jìn)行權(quán)重計(jì)算。后層神經(jīng)元通過(guò)Dense層和Softmax神經(jīng)元實(shí)現(xiàn)成績(jī)預(yù)測(cè)。本文提出的模型具體思路如下所示。
模型LAA早期預(yù)警模型:
輸入:訓(xùn)練數(shù)據(jù)X;數(shù)據(jù)時(shí)間步T,特征維數(shù)F;自動(dòng)編碼器層數(shù)L,訓(xùn)練周期數(shù)E,批量大小B;注意力模塊層數(shù)L′。
輸出:學(xué)生成績(jī)類別C,特征權(quán)重Wf,時(shí)間步權(quán)重Wt。
步驟:
1.對(duì)數(shù)據(jù)進(jìn)行歸一化處理,計(jì)算編碼層的激活輸出,編碼器將F維特征壓縮成1維;
2.自動(dòng)編碼器中間層將編碼層的輸出復(fù)制到T個(gè)時(shí)間步上;
3.解碼器將中間層的數(shù)據(jù)重構(gòu)成與輸入層相同的維度,得到特征恢復(fù)后的數(shù)據(jù);
4.注意力層利用公式(9)和(10)計(jì)算重構(gòu)數(shù)據(jù)各個(gè)特征對(duì)目標(biāo)變量的影響權(quán)重Wf(或各時(shí)間步對(duì)目標(biāo)變量的影響權(quán)重Wt);
5.通過(guò)反向傳播算法計(jì)算整個(gè)序列上的誤差,并更新網(wǎng)絡(luò)參數(shù)。
6.重復(fù)步驟1~5,直到反向傳播算法停止更新參數(shù),輸出類別C(0或1),訓(xùn)練完成。
本文提出的模型計(jì)算量分析如下。整個(gè)模型的計(jì)算量取決于時(shí)間步T和特征維數(shù)F。編碼器將F維特征壓縮到1維;解碼器的輸出維度與編碼器輸入維度相同,且都由T和F決定。注意力模塊在計(jì)算特征權(quán)重Wf時(shí),計(jì)算量由F決定,在計(jì)算時(shí)間步權(quán)重Wt時(shí),計(jì)算量由T決定。學(xué)生的課程周期通常不會(huì)超過(guò)20 周,因此時(shí)間步T≤20,屬于短序列;在線學(xué)習(xí)平臺(tái)中學(xué)生行為類別多數(shù)為個(gè)位數(shù),即F≤10;為了簡(jiǎn)化模型架構(gòu)同時(shí)保證性能,編碼器和解碼器部分都采用單層的LSTM。因此,本文提出的模型具有低復(fù)雜度、計(jì)算快的特點(diǎn)。
數(shù)據(jù)收集自美國(guó)一所學(xué)校2015—2016 年完全在線的課程,包含476門課程,4 607名學(xué)生,課程持續(xù)16周,總計(jì)3 625 619條日志。這些數(shù)據(jù)記錄了學(xué)生在線學(xué)習(xí)的所有行為,本文將這些學(xué)習(xí)行為分為以下五類:
(1)訪問(wèn)資源(Content,1 249 738 條記錄):所有與瀏覽課程資料相關(guān)的行為。
(2)參與評(píng)估(Assessment,1 019 901條記錄):所有與課程評(píng)估相關(guān)的行為。
(3)查看分?jǐn)?shù)(CheckGrade,277 513 條記錄):查看課程評(píng)估成績(jī)、作業(yè)成績(jī)等信息的行為(此行為在已有的文獻(xiàn)中被識(shí)別為早期預(yù)警關(guān)鍵因子)。
(4)參與交互(Interaction,1 029 900 條記錄):所有與線上互動(dòng)有關(guān)的行為,包括同伴互動(dòng)或師生互動(dòng)。
(5)其他行為(Others,48 567 條記錄):不屬于上述類別的其他次要行為。
本文對(duì)學(xué)生的原始日志數(shù)據(jù)進(jìn)行清洗后,計(jì)算每周各個(gè)行為的頻率,每個(gè)學(xué)生的記錄最終生成16(周)×5(行為)的時(shí)間序列數(shù)據(jù)。同時(shí),計(jì)算每周所有行為的總頻率,每個(gè)學(xué)生的記錄最終生成16(周)×1(總頻率)的時(shí)間序列數(shù)據(jù)。其中,每周總頻率等于每周5種行為頻率之和。
對(duì)于學(xué)生的成績(jī)數(shù)據(jù),以60 分為標(biāo)準(zhǔn)將學(xué)生劃分成及格(≥60 分,標(biāo)記為類別0)和不及格(<60 分,標(biāo)記為類別1)兩類。其中,及格(以下簡(jiǎn)稱success)學(xué)生為3 673人(占比79.73%),不及格(at-risk)學(xué)生為934人(占比20.27%)。
為了深入分析LAA 對(duì)不同類型學(xué)生的識(shí)別能力,本文分別對(duì)success 學(xué)生和at-risk 學(xué)生的時(shí)間序列數(shù)據(jù)進(jìn)行聚類,探索這兩類學(xué)生中存在的行為模式。時(shí)間序列聚類可以比較學(xué)生行為模式的相似性,將具有相似模式的學(xué)生分為同一個(gè)群,將具有不同模式的學(xué)生分為不同的群。為了提高時(shí)間序列聚類效果,本文在聚類前對(duì)學(xué)生的時(shí)間序列數(shù)據(jù)進(jìn)行了特征處理。結(jié)果表明,該數(shù)據(jù)集中存在3種success學(xué)習(xí)行為模式和3種at-risk學(xué)習(xí)行為模式。各群人數(shù)分布如表1所示。
表1 success學(xué)生和at-risk學(xué)生的行為模式Table 1 Patterns of success and at-risk students
3 種success 學(xué)生的典型行為模式如圖4(a)、(b)、(c)所示,具體描述如下:
(1)均衡型(success cluster 1)。該群學(xué)生3種主要行為(訪問(wèn)資源、參與評(píng)估和參與交互)比例接近,且保持穩(wěn)定的高行為頻率(例如圖4(a)學(xué)生A 的行為模式)。已有的研究表明,具有穩(wěn)定且持續(xù)參與水平的學(xué)生能夠獲得更高的學(xué)習(xí)表現(xiàn)。
(2)高交互型(success cluster 2)。該群學(xué)生的交互頻率遠(yuǎn)高于其他行為,他們主要通過(guò)論壇討論完成課程學(xué)習(xí)(例如圖4(b)學(xué)生B 的行為模式)。已有的研究表明,高水平的交互行為有助于提高學(xué)習(xí)表現(xiàn)。
(3)勤奮型(success cluster 3)。該群學(xué)生三種主要行為比例接近,在學(xué)期開(kāi)始的行為頻率遠(yuǎn)高于其他群,且整個(gè)學(xué)期維持相對(duì)穩(wěn)定的參與水平(例如圖4(c)學(xué)生C的行為模式)。通常高參與度意味著高的學(xué)習(xí)動(dòng)機(jī),能夠促進(jìn)學(xué)習(xí)效果。
3種at-risk學(xué)生的典型行為模式如圖4(d)、(e)、(f)所示,具體描述如下:
(1)低參與型(at-risk cluster 1)。該群學(xué)生幾乎不參與學(xué)習(xí)活動(dòng),屬于因參與度過(guò)低而表現(xiàn)不好的學(xué)生(例如,圖4(d)學(xué)生D的行為模式)。低參與是最常見(jiàn)且最易被識(shí)別的at-risk類型之一[18],教師無(wú)需通過(guò)模型而直接使用數(shù)據(jù)可視化方法就能識(shí)別該群體。
(2)低交互型(at-risk cluster 2)。該群學(xué)生的交互行為頻率隨著課程的進(jìn)展越來(lái)越低(例如圖4(e)學(xué)生E的行為模式),表明其在學(xué)習(xí)過(guò)程中并不重視與教師或同學(xué)交流。低交互容易導(dǎo)致學(xué)生對(duì)知識(shí)點(diǎn)缺乏理解和掌握[19],造成低學(xué)習(xí)表現(xiàn)。
(3)非持續(xù)型(at-risk cluster 3)。該類型學(xué)生具有不穩(wěn)定的參與頻率,且各種行為頻率的相對(duì)大小也多次發(fā)生變化(例如,圖4(f)學(xué)生F的行為模式)。該群學(xué)生參與頻率的下降體現(xiàn)了其學(xué)習(xí)動(dòng)機(jī)的減退[20]。
圖4 及格(success)和不及格(at-risk)學(xué)生的行為模式Fig.4 Patterns of success and at-risk students
本文設(shè)置兩個(gè)基線模型與LAA進(jìn)行早期預(yù)警預(yù)測(cè)比較,分別是:
(1)基線模型1??傤l率行為序列(total frequency of behavior series)+RNN 模型(TFB)??傤l率序列是學(xué)習(xí)者每周行為之和的序列數(shù)據(jù),表征學(xué)習(xí)者的宏觀行為模式。使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)作為預(yù)測(cè)模型。
(2)基線模型2。原始行為序列(original behavior series)+RNN模型(OB)。原始行為序列是學(xué)習(xí)者每周5種行為頻率序列,包含學(xué)習(xí)者微觀行為模式的原始信息。使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)作為預(yù)測(cè)模型。
(3)LAA 模型。對(duì)學(xué)習(xí)者微觀行為模式原始信息進(jìn)行特征處理和權(quán)重計(jì)算后實(shí)現(xiàn)成績(jī)預(yù)測(cè)。
本文采用準(zhǔn)確率和召回率作為評(píng)價(jià)指標(biāo),用以比較3個(gè)模型的早期預(yù)警性能。對(duì)于早期預(yù)警,其目的是在學(xué)期較早階段通過(guò)模型識(shí)別盡可能多的at-risk學(xué)生,因而召回率是比準(zhǔn)確率更重要的評(píng)價(jià)指標(biāo)[21-23]。
2.2.1 早期預(yù)警比較
本文使用3種模型在每周進(jìn)行了成績(jī)預(yù)測(cè)。表2僅列出每隔一周預(yù)測(cè)成績(jī)得到的準(zhǔn)確率和召回率。所有結(jié)果都是取五折交叉驗(yàn)證平均值。結(jié)果表明,LAA在各周都取得了與基線模型相似的準(zhǔn)確率和更高的召回率。
表2 早期預(yù)警預(yù)測(cè)結(jié)果比較Table 2 Comparison of early warning prediction results%
在已有的研究中,識(shí)別出較多(如50%以上)的at-risk 學(xué)生的時(shí)間點(diǎn)被確定為最佳干預(yù)時(shí)間。LAA 模型在第5周(5/16周,未在表中列出)可識(shí)別50.54%以上的at-risk 學(xué)生,比基線模型提前一周。因此,教師可在第5周對(duì)LAA模型篩選出的at-risk學(xué)生開(kāi)展教學(xué)干預(yù)。
表3列出了3種模型識(shí)別的at-risk學(xué)生行為模式類型和人數(shù)。LAA識(shí)別出最多的低交互型和非持續(xù)型學(xué)生。
表3 模型對(duì)3種at-risk學(xué)生的識(shí)別結(jié)果Table 3 Identification results of three kinds of at-risk pattern students
本文采用上述學(xué)校的2018年數(shù)據(jù)驗(yàn)證所提方法的泛化能力。該數(shù)據(jù)中的課程持續(xù)20 周,共7 592 977 條行為日志數(shù)據(jù),參與者為7 701 名學(xué)生。其中,5 743 人及格,1 958人不及格。學(xué)生的行為日志被編碼為7種類別的行為(訪問(wèn)資源、查看通知、完成作業(yè)、參與評(píng)估、參與交互、查看成績(jī)和其他行為)。結(jié)果表明,LAA 在每個(gè)周都取得了最高的準(zhǔn)確率和召回率。LAA 在第6 周(6/20周)可識(shí)別50%以上的at-risk學(xué)生;在第20周取得了最高的召回率(分別是:TFB-61.69%、OB-73.13%、LAA-79.73%)。
2.2.2 早期預(yù)警關(guān)鍵預(yù)測(cè)因子分析
通過(guò)注意力模塊計(jì)算得到success 學(xué)生和at-risk 學(xué)生的各周次對(duì)最終成績(jī)的影響權(quán)重如圖5所示。R為atrisk 學(xué)生,S 為success 學(xué)生。學(xué)生R 權(quán)重最大的周是第10周,學(xué)生S權(quán)重最大的周是第13周。這表明不同學(xué)習(xí)表現(xiàn)的學(xué)生,學(xué)期各周次對(duì)成績(jī)的影響程度有所差異。
圖5 At-risk和success學(xué)生的各周次權(quán)重Fig.5 Week weights of at-risk and success students
學(xué)生R 和學(xué)生S 的各種行為對(duì)最終成績(jī)影響權(quán)重如圖6所示。學(xué)生R的行為權(quán)重大小依次為:參與交互(Interaction)>查看成績(jī)(CheckGrade)>訪問(wèn)資源(Content)>參與評(píng)估(Assessment)>其他行為(Others)。學(xué)生S 的行為權(quán)重大小依次為:訪問(wèn)資源(Content)>參與評(píng)估(Assessment)>其他行為(Others)>參與交互(Interaction)>查看成績(jī)(CheckGrade)??梢钥闯?,及格學(xué)生和不及格學(xué)生雖然有相同的行為類別,但是各類行為對(duì)學(xué)習(xí)結(jié)果的影響權(quán)重不同。
圖6 At-risk和success學(xué)生的各類行為權(quán)重Fig.6 Behavior weights of at-risk and success students
在實(shí)際的教學(xué)活動(dòng)中,教師按照課程大綱安排學(xué)生在特定階段完成課程任務(wù),參加指定的學(xué)習(xí)活動(dòng)。LAA模型計(jì)算出關(guān)鍵周次和行為,可幫助教師對(duì)照標(biāo)準(zhǔn)課程設(shè)計(jì)來(lái)發(fā)現(xiàn)學(xué)生在某個(gè)階段學(xué)習(xí)上存在的具體問(wèn)題,進(jìn)而采取干預(yù)措施。
本文提出的LAA 方法可在學(xué)期較早的階段識(shí)別50%以上的at-risk學(xué)生,相比基線模型取得了相似的準(zhǔn)確率和更高的召回率。該方法對(duì)識(shí)別低交互類型和非持續(xù)類型的at-risk學(xué)生具有明顯優(yōu)勢(shì),且可以將教學(xué)干預(yù)時(shí)間提前一周。LAA模型通過(guò)計(jì)算各周注意力權(quán)重和各種行為的注意力權(quán)重,挖掘出影響學(xué)習(xí)結(jié)果的最重要周次和行為類別,可以方便教師選回溯學(xué)習(xí)過(guò)程。教師可根據(jù)預(yù)測(cè)結(jié)果精準(zhǔn)定位需要干預(yù)的群體,并根據(jù)影響at-risk 學(xué)生成績(jī)的周次和行為權(quán)重,從課程設(shè)計(jì)、學(xué)習(xí)活動(dòng)評(píng)估和學(xué)習(xí)監(jiān)控等方面對(duì)學(xué)生進(jìn)行個(gè)性化的教學(xué)干預(yù)。盡管LAA模型取得了比基線模型較高的召回率,如何進(jìn)一步提高準(zhǔn)確率是后續(xù)工作需要研究的內(nèi)容。