李秀英
(甘肅省蘭州市第五中學(xué),甘肅 蘭州 730000)
2020 年初,在教育部“停課不停學(xué)”工作部署下,廣大教師利用互聯(lián)網(wǎng)平臺積極開展線上教學(xué)活動,學(xué)生居家期間就能利用網(wǎng)絡(luò)資源自主學(xué)習(xí),并使用在線測驗系統(tǒng)完成階段性學(xué)習(xí)評估。如果能從這些在線考試數(shù)據(jù)中挖掘分析、定位學(xué)生的知識掌握情況,就能為學(xué)生提供更加精準(zhǔn)的個性化輔導(dǎo)。
傳統(tǒng)教學(xué)中,教師采用紙質(zhì)試卷進行階段性學(xué)習(xí)測驗,學(xué)習(xí)效果評估僅是對學(xué)生成績進行簡單的統(tǒng)計分析,不能準(zhǔn)確反映出學(xué)生個體的真實學(xué)習(xí)狀況。相比傳統(tǒng)紙質(zhì)試卷測驗,在線測驗更容易收集一些傳統(tǒng)閱卷觀察不到過程性數(shù)據(jù)(答題時間、答題順序、更改次數(shù)等),對這些數(shù)據(jù)進一步挖掘分析,可以排除學(xué)生依靠運氣選對答案的情況,降低教師的主觀判而產(chǎn)生的誤差,從而提高學(xué)習(xí)效果評估精準(zhǔn)度。
本文提出了一種基于BP 神經(jīng)網(wǎng)絡(luò)的在線自學(xué)效果評估模型,可為中學(xué)生在線自主學(xué)習(xí)提供較為科學(xué)、合理的學(xué)習(xí)效果評估方法。
同一知識點在不同題型中的得分率不同,即掌握這個知識點的難易程度有所差異。其主要是學(xué)生得分的高低反映出的試題以及所含知識點的難易度。評價個體對一個知識點的掌握程度,與包含這個知識點的試題是直接聯(lián)系的,因此將其納入評價指標(biāo)中。主觀題難度系數(shù)計算如式(1)所示:
v 代表試題選項數(shù),x 表示該題答對學(xué)生數(shù),xm代表參考學(xué)生總?cè)藬?shù)。
當(dāng)學(xué)生點擊第i道題目后,開始記錄第i題答題起始時間ti1,點擊下一題選項后,記錄當(dāng)前題目答題截止時間ti2,該題答題起止時間差值即為答題時間ti:
按式(3)計算每道題的答題時間。如果學(xué)生再一次對某題目進行回顧或是修改,則答題時間繼續(xù)累加。
學(xué)生答題時可能對某些選項勾選情況進行修改,更改次數(shù)是學(xué)生點擊題目選項的次數(shù),如果進入某題答題頁面而沒有勾選題目選項,則不累加其更改次數(shù)。
學(xué)生答題時該題號會被記錄下來,每題將被重新賦予順序號,若學(xué)生對該題答案進行更改,則不會更改其賦予的順序號。本文僅將答題是否順序作為一個屬性,因此僅判斷是否為順序答題。
學(xué)生學(xué)習(xí)效果評估方法可以分為數(shù)值統(tǒng)計、專家系統(tǒng)法和神經(jīng)網(wǎng)絡(luò)法三種,其中神經(jīng)網(wǎng)絡(luò)更適用于非線性問題,并且評價曲線是與很多因素相關(guān)的一個非線性函數(shù),對于抽取和逼近這種非線性函數(shù),神經(jīng)網(wǎng)絡(luò)是一種比較合適的方法。
BP 神經(jīng)網(wǎng)絡(luò),是一種利用誤差反向傳播(Back Propagation)算法訓(xùn)練的多層級前饋神經(jīng)網(wǎng)絡(luò),適用于解決非線性模式識別和分類評價問題,是目前神經(jīng)網(wǎng)絡(luò)中應(yīng)用領(lǐng)域較為廣泛的一種算法。
BP 神經(jīng)網(wǎng)絡(luò)由三層以上神經(jīng)元構(gòu)成的,如圖1 所示,主要包含輸入層、隱含層和輸出層,三者具有不同的作用。數(shù)據(jù)先傳進輸入層,而后在隱含層進行多層級計算,最后由輸出層將結(jié)果傳出。如果輸出結(jié)果與期望存在較大偏差,則將誤差信號沿輸出層、隱含層向輸入層反向傳播,依次調(diào)整各層級神經(jīng)元之間的連接權(quán)值,不斷修正輸出層結(jié)果,使誤差信號滿足閾值范圍。輸入、輸出層神經(jīng)元數(shù)由輸入、輸出數(shù)據(jù)的維度確定,隱含層神經(jīng)元數(shù)的確定目前尚無明確的方法,一般由訓(xùn)練結(jié)果不斷優(yōu)化調(diào)整確定的。
BP 神經(jīng)網(wǎng)絡(luò)模型設(shè)計使用多層神經(jīng)元構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,如圖2 所示,將知識點得分、難易程度、答題時間、更改次數(shù)、答題順序等測試數(shù)據(jù)輸入模型,利用反向傳播方法對神經(jīng)網(wǎng)絡(luò)的權(quán)值和偏差進行反復(fù)的調(diào)整訓(xùn)練,使輸出的結(jié)果與測試結(jié)果盡可能地接近,當(dāng)網(wǎng)絡(luò)輸出層的誤差平方和小于指定的誤差時完成模型訓(xùn)練,而后利用訓(xùn)練好的模型對樣本數(shù)據(jù)進行預(yù)測分析,最終得到學(xué)生知識點掌握程度情況。
本文研究數(shù)據(jù)為甘肅省蘭州市第五中學(xué)八年級321 名學(xué)生在線測試物理成績,該試題共有五個部分25 道題,涉及知識點八個大類,其中客觀題21 道,主觀題4 道。在線考試過程中,每道題知識點掌握情況都以問卷調(diào)查方式詢問學(xué)生,學(xué)生點選“完全掌握”、“一般”或“未掌握”,完成知識點掌握程度數(shù)據(jù)采集。
經(jīng)過數(shù)據(jù)清洗與預(yù)處理,去掉7 條未完成考試數(shù)據(jù),共有314 條完整性較好的數(shù)據(jù)?,F(xiàn)隨機抽取100條樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,其余214條數(shù)據(jù)作為測試數(shù)據(jù)集。
知識點用大寫字母(A、B···H)表示,知識點后面的括號表示該題知識點分值,例如A(3)表示該題涉及A 知識點的分值為3 分,部分題涉及多個知識點,則該題號下分別給出了涉及知識點及分值,如表4.1 所示。
通過知識點的分值及得分計算各知識點的得分率,并提取答題過程性數(shù)據(jù)(答題時間、更改次數(shù)、答題順序)、知識點掌握度問卷調(diào)查情況,如表4.2 所示。知識點下方的數(shù)字表示涉及該知識點的題目編號。
通過該表格進一步分析各學(xué)生的知識點掌握情況。其中,“答題順序”字段中“1”表示該題為順序答題,“0”表示該題不是順序答題,“是否掌握”字段中“1”表示完全掌握,“0.5”表示一般掌握,“0”表示未掌握。
為了避免神經(jīng)元的飽和性,將輸入和輸出向量設(shè)計好以后,就需要對樣本進行歸一化處理,將數(shù)據(jù)處理為[0,1]之間的數(shù)據(jù),在此采用公式(4)進行歸一化處理。
利用式(4)分別對各知識點中答題時間進行歸一化處理,將每一個知識點答題情況看做一條訓(xùn)練樣本數(shù)據(jù),由于試題有8 個知識點,訓(xùn)練數(shù)據(jù)中共有50 名學(xué)生,因此我們可得到400 個輸入?yún)?shù)數(shù)據(jù),如表4.3 所示。
本文采用的BP 神經(jīng)網(wǎng)絡(luò)模型,輸入層為5 個屬性因子(得分率、難度系數(shù)、答題時間、更改次數(shù)、答題順序),隱含層取10,輸出層為1 個預(yù)測因子(知識點掌握程度),學(xué)習(xí)速率取0.01。
根據(jù)樣本和網(wǎng)絡(luò)結(jié)構(gòu)的特點,隱含層和輸出層的傳遞函數(shù)分別選擇tansig 和logsig,網(wǎng)絡(luò)訓(xùn)練函數(shù)采用trainlm,網(wǎng)絡(luò)學(xué)習(xí)算法采用Levenberg-Marquardt 算法。該神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練后需達到的要求是:單個樣本的均方誤差小于0.01,全部樣本均方誤差小于0.001,訓(xùn)練過程迭代5000 次。
利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對剩下的214 名學(xué)生成績數(shù)據(jù)(即1712 條知識點測試數(shù)據(jù))進行驗證,1645 條數(shù)據(jù)符合該神經(jīng)網(wǎng)絡(luò)模型,即準(zhǔn)確率為96.1%,預(yù)測準(zhǔn)確有效。
本文利用BP 神經(jīng)網(wǎng)絡(luò)模型對知識點掌握程度進行驗證,相對于傳統(tǒng)教學(xué)評估是一種新的嘗試,該方法完全可以適用于在線考試數(shù)據(jù)分析,進一步預(yù)測學(xué)生學(xué)習(xí)效果,為精準(zhǔn)教學(xué)提供數(shù)據(jù)化支撐。下一步工作,可以進一步結(jié)合眼動技術(shù),在考試過程中采集學(xué)生的注視時間、注視位置等數(shù)據(jù)進一步分析學(xué)生心理特征,更加準(zhǔn)確預(yù)測分析學(xué)生知識點掌握水平及學(xué)習(xí)效果評估。