駱莉莎,黃星華,苑 溦
(江蘇開放大學(xué),江蘇 南京 210036)
當(dāng)前,網(wǎng)絡(luò)學(xué)習(xí)已經(jīng)成為重要的新型學(xué)習(xí)方式。2020年的突發(fā)疫情從客觀上快速將線上教育推向了普遍化與大眾化。然而,這一快速轉(zhuǎn)變也潛藏著很多實(shí)際問題,比如學(xué)生短時(shí)間內(nèi)還不能適應(yīng)新的學(xué)習(xí)方式,傳統(tǒng)課堂學(xué)習(xí)評價(jià)重結(jié)果輕過程的模式已經(jīng)不再適用。
許多學(xué)者對于線上教育的評價(jià)方法進(jìn)行了系統(tǒng)研究。馮天敏和張世祿[1]指出,在線學(xué)習(xí)的評價(jià)目的在于監(jiān)控學(xué)習(xí)進(jìn)程、保證學(xué)習(xí)質(zhì)量、促進(jìn)學(xué)生發(fā)展。雷軍程[2]比較了Udacity、Coursera、Edx 三大MOOC 平臺(tái)的課程評估方式,發(fā)現(xiàn)其評價(jià)模式與目前傳統(tǒng)課堂教學(xué)的評價(jià)模式類似。代利利和李經(jīng)山[3]指出,翻轉(zhuǎn)課堂學(xué)習(xí)需對評價(jià)體系的基本價(jià)值取向、三個(gè)關(guān)鍵維度和指標(biāo)構(gòu)成、操作方法和權(quán)重分配等進(jìn)行設(shè)計(jì)。其他學(xué)者[4-5]都對在線教育評價(jià)進(jìn)行了研究。
綜合已有研究來看,如何利用大數(shù)據(jù)挖掘技術(shù)分析在線學(xué)習(xí)行為,采用合理、科學(xué)、創(chuàng)新、量化的評價(jià)手段反映學(xué)生學(xué)習(xí)過程的每個(gè)環(huán)節(jié),已經(jīng)成為當(dāng)前研究的熱點(diǎn)。本文將討論如何基于在線學(xué)習(xí)數(shù)據(jù)實(shí)時(shí)預(yù)測學(xué)生的學(xué)習(xí)行為。
學(xué)生學(xué)習(xí)是一個(gè)循序漸進(jìn)的過程,在線學(xué)習(xí)平臺(tái)可以記錄學(xué)習(xí)過程中每個(gè)階段的學(xué)習(xí)數(shù)據(jù),這些數(shù)據(jù)可以看做時(shí)間序列數(shù)據(jù)。人工智能領(lǐng)域的循環(huán)神經(jīng)網(wǎng)絡(luò)最適合處理時(shí)間序列問題。RNN 的特點(diǎn)是隱藏單元間的連接是循環(huán)的;如果輸入的是一個(gè)時(shí)間序列,可以將其在時(shí)間維度展開,其中的每一個(gè)單元,除了處理當(dāng)前時(shí)間點(diǎn)的輸入數(shù)據(jù)外,還要處理前一個(gè)單元的輸出,最終輸出一個(gè)時(shí)間序列。然而,RNN 模型無法學(xué)習(xí)到“長依賴”的問題。隨后出現(xiàn)了LSTM(Long Short-Term Memory)長短期記憶網(wǎng)絡(luò)以消除RNN 長期依賴不可靠的問題。
LSTM,是一種特殊的RNN,能夠?qū)W習(xí)較長時(shí)間范圍內(nèi)數(shù)據(jù)的依賴關(guān)系,如學(xué)生近一個(gè)月的學(xué)習(xí)狀態(tài)對接下來一周的學(xué)習(xí)狀態(tài)的影響。LSTM 是為了避免“長依賴”問題而精心設(shè)計(jì)的。LSTM 也擁有RNN 的鏈狀結(jié)構(gòu),但是重復(fù)模塊則擁有不同的結(jié)構(gòu)。與神經(jīng)網(wǎng)絡(luò)的簡單的一層相比,LSTM 擁有四層,這四層以特殊的方式進(jìn)行交互,其結(jié)構(gòu)如圖1 所示。
圖1 LSTM 神經(jīng)網(wǎng)絡(luò)模型
本研究基于某課程的在線教學(xué)平臺(tái)自動(dòng)統(tǒng)計(jì)的學(xué)生學(xué)習(xí)數(shù)據(jù)開展模型訓(xùn)練。本次研究共使用了兩個(gè)在線教學(xué)班(共145 名學(xué)生)的在線學(xué)習(xí)時(shí)間序列數(shù)據(jù)。
本文訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的目標(biāo)在于找到學(xué)生學(xué)習(xí)時(shí)間序列的某種規(guī)律以指導(dǎo)教學(xué)。為此,需首先回答以下兩個(gè)問題:
應(yīng)該用哪些數(shù)據(jù)來衡量學(xué)生的學(xué)習(xí)情況。因本研究針對的是學(xué)習(xí)的時(shí)間序列數(shù)據(jù),首先要求這樣的數(shù)據(jù)應(yīng)該是隨著學(xué)習(xí)進(jìn)程推進(jìn)能實(shí)時(shí)收集、不斷擴(kuò)充的數(shù)據(jù),而不是單個(gè)時(shí)間點(diǎn)的數(shù)據(jù);因而,期中考試成績、期末考試成績不能作為衡量數(shù)據(jù)。其次,由于涉及數(shù)據(jù)量大,這樣的數(shù)據(jù)應(yīng)該是能夠自動(dòng)采集的,而不需要太多教師手動(dòng)的操作;因而,在線學(xué)習(xí)平臺(tái)自動(dòng)記錄的數(shù)據(jù)更加符合要求,如教學(xué)資料的學(xué)習(xí)時(shí)長、學(xué)習(xí)次數(shù)、反復(fù)查看次數(shù)、學(xué)習(xí)資料的下載次數(shù)、簽到數(shù)、討論參與次數(shù)、章節(jié)測驗(yàn)成績(系統(tǒng)自動(dòng)批改)等。再次,學(xué)習(xí)數(shù)據(jù)應(yīng)該是多維的,用于學(xué)生學(xué)習(xí)情況衡量的數(shù)據(jù)應(yīng)該既包括學(xué)習(xí)過程的參與程度數(shù)據(jù),也需要包括學(xué)習(xí)效果的衡量數(shù)據(jù);只注重其中一個(gè)方面是偏頗的。經(jīng)過數(shù)據(jù)篩選,本研究采用學(xué)生對學(xué)習(xí)視頻的觀看次數(shù)和章節(jié)測驗(yàn)(系統(tǒng)自動(dòng)批改)成績作為學(xué)生學(xué)習(xí)參與程度和學(xué)習(xí)效果兩方面的評價(jià)。
對于學(xué)生的學(xué)習(xí)數(shù)據(jù)時(shí)間序列,究竟應(yīng)該用前多少次的學(xué)習(xí)數(shù)據(jù)預(yù)測接下來一次學(xué)習(xí)的學(xué)習(xí)數(shù)據(jù)?這個(gè)問題在已有研究中并沒有確切的方法。首先,學(xué)生的學(xué)習(xí)時(shí)間應(yīng)該遵循一定的規(guī)律,一般我們希望學(xué)習(xí)時(shí)長是穩(wěn)定的,使得學(xué)習(xí)進(jìn)程是持續(xù)穩(wěn)定高效推進(jìn)的。然而,各種因素都會(huì)影響學(xué)生在特定時(shí)間點(diǎn)的學(xué)習(xí)投入程度,可能的因素(包括但不限于)如下:(1)該時(shí)間點(diǎn)學(xué)生恰好有其他事務(wù)導(dǎo)致學(xué)習(xí)時(shí)間明顯降低甚至為零;(2)該部分課程教學(xué)資源較為枯燥,學(xué)生普遍沒有學(xué)習(xí)興趣;(3)學(xué)生基于之前的學(xué)習(xí)時(shí)間和測試分?jǐn)?shù)認(rèn)為該門課程較為簡單,投入時(shí)間不足。對于第(1)個(gè)因素,因?qū)儆趯W(xué)生的個(gè)人偶然因素,教師難以控制,在本研究的模型中也的確難以體現(xiàn),故在LSTM 模型中增加了Dropout 層,可在一定程度上消除隨機(jī)因素對本研究模型預(yù)測效果的不利影響。對于第(2)、(3)個(gè)因素,可以通過課程學(xué)習(xí)數(shù)據(jù)反映出來。本研究通過數(shù)據(jù)分析來尋找答案。為此,以145 名學(xué)生的學(xué)習(xí)數(shù)據(jù)為數(shù)據(jù)集進(jìn)行研究,70%作為訓(xùn)練集,30%作為測試集,以均方差作為模型優(yōu)劣的衡量參數(shù)。LSTM 模型的結(jié)構(gòu)為四個(gè)堆疊LSTM 層,每層配置一個(gè)隨機(jī)Dropout層,最后通過一個(gè)全連接層得到輸出值(輸出值即為下一次視頻觀看時(shí)長)。結(jié)果如圖2 所示。
圖2 中,隨著采用的前期數(shù)據(jù)量的增加,模型預(yù)測的均方誤差逐漸減小,預(yù)測精度逐漸升高。當(dāng)采用的前期數(shù)據(jù)量較多時(shí),在實(shí)際教學(xué)過程中,需要前期有一定時(shí)長的教學(xué)活動(dòng)之后本研究的模型才能開始發(fā)揮作用,不利于教師及時(shí)了解學(xué)情;當(dāng)采用前期數(shù)據(jù)量較少時(shí),模型精度無法保證。對比圖2 中某學(xué)生學(xué)習(xí)數(shù)據(jù)的實(shí)際預(yù)測效果,綜合考慮,可選擇采用前5 次學(xué)習(xí)數(shù)據(jù)預(yù)測下一次學(xué)習(xí)數(shù)據(jù),由此平衡了模型精度與教學(xué)反饋及時(shí)性的矛盾。
為檢驗(yàn)?zāi)P蛻?yīng)用效果,以第一教學(xué)班數(shù)據(jù)作為模型訓(xùn)練與調(diào)試的數(shù)據(jù)集,隨后以第二教學(xué)班在線教學(xué)過程作為本研究成果的模擬應(yīng)用場景。
圖2 模型誤差與采用的前期數(shù)據(jù)次數(shù)
圖3 為隨機(jī)選擇的12 位同學(xué)的學(xué)習(xí)數(shù)據(jù)(各個(gè)教學(xué)視頻的觀看時(shí)長)。圖中,實(shí)心點(diǎn)代表實(shí)際數(shù)據(jù),叉代表本研究模型的預(yù)測數(shù)據(jù)??梢钥吹?,盡管有一定誤差,但模型基本能反映數(shù)據(jù)的整體變化趨勢。由于是根據(jù)前5 次學(xué)習(xí)數(shù)據(jù)預(yù)測下一次數(shù)據(jù),故前5 次無預(yù)測數(shù)據(jù)。從圖中可以看出本研究模型預(yù)測結(jié)果的一些特點(diǎn):
(1)模型預(yù)測值與實(shí)際值相比,波動(dòng)幅度更小。這是由于模型預(yù)測是基于全班所有學(xué)生的學(xué)習(xí)數(shù)據(jù),反映的是學(xué)生的整體情況,相對個(gè)體而言更為穩(wěn)定,因此波動(dòng)較小。
(2)模型對學(xué)生的較大波動(dòng)的學(xué)習(xí)數(shù)據(jù)有敏感的響應(yīng)。當(dāng)學(xué)生的某次學(xué)習(xí)時(shí)長有明顯向上或向下跳動(dòng)時(shí),模型預(yù)測的下一次學(xué)習(xí)時(shí)長也將相應(yīng)變化,說明模型能反映學(xué)生個(gè)性行為。
(3)模型預(yù)測具有一定保守性。當(dāng)學(xué)生在某次學(xué)習(xí)中學(xué)習(xí)時(shí)長突然下降時(shí),即使學(xué)生在下一次學(xué)習(xí)立刻恢復(fù)正常學(xué)習(xí)時(shí)長,模擬預(yù)測的學(xué)習(xí)數(shù)據(jù)仍然偏低,需要多次學(xué)習(xí)后才能恢復(fù)到與實(shí)際相當(dāng)?shù)念A(yù)測值;而當(dāng)學(xué)生學(xué)習(xí)時(shí)長突然上升后再次降低到穩(wěn)定水平時(shí),模型預(yù)測值也將快速降低,而不會(huì)維持在較高水平。
圖3 不同學(xué)生各次視頻觀看時(shí)長預(yù)測與實(shí)際對比
本研究基于在線教學(xué)的學(xué)生學(xué)習(xí)數(shù)據(jù)構(gòu)建了基于前5 次在線教學(xué)視頻觀看時(shí)長和各章測試成績預(yù)測下一次在線視頻學(xué)習(xí)時(shí)長的人工智能神經(jīng)網(wǎng)絡(luò)模型(LSTM 模型)。應(yīng)用分析表明:該預(yù)測模型能很好反映學(xué)生的在線學(xué)習(xí)行為,具備滿意的預(yù)測能力。該模型對教師實(shí)時(shí)把握在線教學(xué)學(xué)情有輔助作用。