未晛
(北京勞動保障職業(yè)學院,北京 100029)
近年來,人工神經(jīng)網(wǎng)絡(luò)已被廣泛應用于教育、醫(yī)療衛(wèi)生、經(jīng)濟等諸多領(lǐng)域,并在疫情期間的社會生活中發(fā)揮了巨大作用[1][2]。在教育領(lǐng)域,教學成績是一項評價學校教學質(zhì)量的重要指標,對于學生學業(yè)、教師教學能力及學校教學管理意義重大。利用人工神經(jīng)網(wǎng)絡(luò)對學習成績進行預測,給學生課業(yè)學習提供風險提示,并對學生專業(yè)發(fā)展提供合理化建議;教師據(jù)此制定或調(diào)整更符合學生成長規(guī)律的教學策略,同時促進自身教學水平的提高,進而提升學校教學質(zhì)量;學校教務(wù)部門可預判各學科教學質(zhì)量,優(yōu)化教學管理進而預防教學事故的發(fā)生。學習成績預測已成為人工神經(jīng)網(wǎng)絡(luò)在教育領(lǐng)域應用研究的熱點與難點[3-6]。
目前,在學生成績預測實踐中常采用BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),這類算法具有很好的非線性映射能力、泛化能力、容錯能力,并在應用中取得了一定效果。但人們在使用過程中發(fā)現(xiàn),該類算法存在收斂速度慢、容易陷入局部極小值等缺陷[6]。同時,BP 神經(jīng)網(wǎng)絡(luò)只能單獨處理單獨的輸入,前一個輸入和后一個輸入是完全無關(guān)的。然而,學生的學習成績具有一定相關(guān)性,即前期課程基礎(chǔ)對后期課程成績有一定影響,此時BP 神經(jīng)網(wǎng)絡(luò)就產(chǎn)生了不適應性[7-9]。這時,就常用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型。長短期記憶網(wǎng)絡(luò)(Long Short Term Memory networks,LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)的典型代表,該模型除具有常規(guī)循環(huán)神經(jīng)網(wǎng)絡(luò)特征外,還能較好地解決原始循環(huán)神經(jīng)網(wǎng)絡(luò)的長距離依賴問題,已成為當前最流行的循環(huán)神經(jīng)網(wǎng)絡(luò),這也貼近學生成績的數(shù)據(jù)變化規(guī)律?;诖?,本文利用長短期記憶網(wǎng)絡(luò),以北京勞動保障職業(yè)學院學生成績?yōu)槔?,進行成績預測,并在此基礎(chǔ)上給出針對學生、教師及學校三類群體的合理化建議,以達到提高教學質(zhì)量的目的。
LSTM 是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),由霍克賴特(Hochreiter)和施米德胡貝(Schmidhuber)提出,用于處理長時間序列數(shù)據(jù)。LSTM 采用特殊隱式單元,在繼承了大部分RNN 模型特性的同時,能夠解決長期依賴問題,避免梯度消失,模型準確度高、訓練速度快、并行處理能力強[10-12]。目前基本的LSTM 網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 LSTM 結(jié)構(gòu)圖
LSTM 模型由遺忘門限、輸入門限、輸出門限和神經(jīng)單元狀態(tài)組成。遺忘門限決定哪些信息需要被丟棄,表達式為:
其中,ft為遺忘門限的激活向量;σ為sigmoid 函數(shù);W為權(quán)重矩陣;ht為LSTM 神經(jīng)元的輸出向量;xt為LSTM 神經(jīng)元;bf為偏置項;下標t表示不同時刻。
輸入門限決定哪些新信息被存放到單元狀態(tài)中,表達式為:
其中,it為輸入門限的激活向量;為當前輸入的單元狀態(tài)。
LSTM 模型的關(guān)鍵是單元狀態(tài),即貫穿圖1的水平線,單元狀態(tài)類似于傳送帶,貫穿整個鏈條,只有小的線性相互作用,使其容易以不變的方式向下流動,表達式為:
其中,Ct為神經(jīng)元細胞狀態(tài)向量。
輸出門限是來控制單元狀態(tài)有多少輸出到LSTM 模型的當前值,表達式為:
其中,ot為輸出門限的激活向量。式(1)到式(6)就是LSTM 模型前向計算的全部公式。
LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)的訓練算法采用反向傳播算法,包括以下幾個步驟:首先,按照公式(1)到公式(6)前向計算每個神經(jīng)元的輸出值,即ft、it、Ct、ot、ht五個向量的值。其次,反向計算每個神經(jīng)元的誤差項δ 值。像循環(huán)神經(jīng)網(wǎng)絡(luò)一樣,誤差項向兩個方向進行反向傳播:一個是沿時間的反向傳播;一個是將誤差項向上一層傳播。再次,根據(jù)誤差項,使用一定的優(yōu)化算法,通過計算每個權(quán)重的梯度來調(diào)整模型參數(shù),使預測結(jié)果靠近優(yōu)化目標。最后,通過上述迭代過程訓練模型,直至訓練得到符合要求的優(yōu)化目標,從而建立滿足誤差要求的LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)預測模型。
本文進行成績預測的數(shù)據(jù)均來自北京勞動保障職業(yè)學院學生的真實成績數(shù)據(jù),數(shù)據(jù)格式為:姓名、性別、學號、學年、學期、課程名稱、成績等,具體如表1 所示。
表1 學生成績數(shù)據(jù)
由于存在部分考生請病假、事假,導致缺考等異常情況,需要對數(shù)據(jù)進行預處理,包括去除空項、非正常數(shù)據(jù)等。同時,選擇相關(guān)度較好的基礎(chǔ)物理、基礎(chǔ)數(shù)學等課程,結(jié)合入學成績及各學年度的行圓成績(主要表征學生在考勤、自習課、宿舍衛(wèi)生、校園紀律等方面的表現(xiàn))進行成績預測,每位學生由4 項特征屬性進行描述,并做出如下假設(shè):
假設(shè)1:學生成績可以通過入學成績、各階段歷史成績和學生行圓成績來反映。
假設(shè)2:影響學生成績的因素比較穩(wěn)定,不會大起大落。
按照假設(shè)對數(shù)據(jù)進一步處理(去除非必要項)得到表2 所示的結(jié)果。表2 第一項為序號,第二項到第四項為基礎(chǔ)數(shù)學成績、基礎(chǔ)物理成績、行圓成績和入學成績。
表2 學生成績預處理結(jié)果
由于預測成績數(shù)據(jù)集由4 維特征向量構(gòu)成,所以,輸入層的節(jié)點數(shù)量為4,輸出層為LSTM模型的輸出結(jié)果,即目標課程成績基礎(chǔ)數(shù)學和基礎(chǔ)物理,所以輸出節(jié)點數(shù)為2。根據(jù)構(gòu)建神經(jīng)網(wǎng)絡(luò)超參數(shù)的經(jīng)驗,本文采用經(jīng)典的三層網(wǎng)絡(luò)模型,LSTM 循環(huán)層的節(jié)點數(shù)為20 個,如圖2 所示。優(yōu)化采用Adam 算法,使用Dropout 正則化方法來防止過擬合現(xiàn)象的發(fā)生。預測回歸類模型精度的評價方法很多,本文采用平均絕對值誤差來衡量模型預測結(jié)果的好壞。
圖2 LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)的預測框架
首先,為保持數(shù)據(jù)集的獨立性且不被窺探,在將數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)訓練之前,先將數(shù)據(jù)分成訓練集和測試集。數(shù)據(jù)集中共計7680 個4 維數(shù)據(jù),6144 個數(shù)據(jù)集被用作訓練數(shù)據(jù),其余數(shù)據(jù)用于測試,然后將訓練集和測試集分成輸入和輸出變量。最后,將輸入(X)重構(gòu)為LSTM 預期的3D 格式。
其次,對訓練數(shù)據(jù)和測試數(shù)據(jù)進行歸一化處理。數(shù)據(jù)歸一化是很重要的環(huán)節(jié),常用方法如下:
其中xi為樣本數(shù)據(jù)、xmin為最小值、xmax為最大值為歸一化后的數(shù)值。
最后,在神經(jīng)網(wǎng)絡(luò)的訓練過程中,通常利用損失函數(shù)來衡量網(wǎng)絡(luò)模型對訓練數(shù)據(jù)的擬合能力。神經(jīng)網(wǎng)絡(luò)算法通過多次的訓練迭代來調(diào)整模型參數(shù)(即網(wǎng)絡(luò)的權(quán)重值),最終通過損失函數(shù)的下降趨勢來判斷算法是否已經(jīng)取得理想的深度神經(jīng)網(wǎng)絡(luò)模型。圖3 為訓練數(shù)據(jù)集的損失函數(shù),模型收斂較快。
圖3 訓練和測試損失函數(shù)
為方便查看預測成績結(jié)果,采用兩種方式進行顯示:一種是列表方式,另外一種是圖表方式。在匹配學生的姓名、學號、系統(tǒng)預測成績后可分別顯示出來,形式如表3 所示。另外,預測數(shù)據(jù)也可以呈圖表顯示,如圖4 所示。
表3 列表顯示學生成績預測
圖4 學生成績預測結(jié)果
從表3 和圖4 可以看出,基礎(chǔ)物理和基礎(chǔ)數(shù)學的預測成績和實際考試成績誤差較小,預測精度較為準確。但個別學生(如學生5)的預測成績和實際成績誤差較大,后經(jīng)教務(wù)處證實,入學前約30 名學生并未選擇基礎(chǔ)物理學科,而其他學科則處于持續(xù)學習中,數(shù)據(jù)的相關(guān)性受到影響,學生5 為其中之一。同時,對課程的喜愛程度、回答問題次數(shù)等因素也影響學生的課程成績,這或許是導致預測成績精度稍差的原因之一??傮w而言,模型預測成績和實際考試成績的趨勢一致,精度較為精確。
綜上,基于學生基礎(chǔ)物理、基礎(chǔ)數(shù)學、入學成績,以及各學年度行圓成績等數(shù)據(jù),在假設(shè)條件下,利用LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)模型進行成績預測具有較好的實驗效果,表明該方法具有效性和實用性。
學習成績預測是為教育教學服務(wù)的,探討預測成績數(shù)據(jù),在不同維度上對提高教學效果具有重要意義。為充分利用預測數(shù)據(jù),達到提高教學質(zhì)量的目的,成績預測有三項功能建議。
首先,對于學生而言,基于成績預測結(jié)果可以篩查出處于及格線以下及邊緣的課程,達到對學生課程學習進行提醒與警示的目的,以便學生對薄弱科目進行重點復習或突破,減少課程不及格的風險。學生可以通過專用接口查詢學業(yè)預警情況。例如,蔡同學從表4 中可以看到存在掛科風險的課程名稱為“基礎(chǔ)數(shù)學”,今后會更加注重該學科的學習。通過學生學業(yè)預警,能夠給學生更直觀的警醒或提示,使其能夠更加重視某學科的學習,及時解決學習中存在的問題,預防不能如期畢業(yè)情況的發(fā)生。同時,學生可以明確自己的優(yōu)勢學科,在進行專業(yè)選擇、畢業(yè)設(shè)計時,倚靠優(yōu)勢學科,發(fā)揮特長,在畢業(yè)擇業(yè)時亦能做到“人盡其才”。
表4 學生學業(yè)預警
其次,對于教師而言,通過篩查授課科目的不及格率,定性或半定量了解學生的學習狀態(tài),對處于及格線及其邊緣的同學重點關(guān)注,并主動提供學業(yè)幫助。表5 為根據(jù)預測數(shù)據(jù)篩查出的基礎(chǔ)數(shù)學某任課教師所教授學生中,存在掛科風險的學生姓名及其預測分數(shù)。針對表5 中的學生,教師可以從學生的學習興趣、自我效能感、學習策略等方面切入,分層分類開展教學管理。對于這部分學生,教師可適當?shù)亟档徒虒W目標,增加成功激勵,提高其自我效能感,并加強薄弱環(huán)節(jié)的調(diào)節(jié)、鼓勵尋求幫助和進行自我監(jiān)控能力的培養(yǎng)。
表5 某學科掛科風險學生列表
最為重要的是,教師不僅要關(guān)注學生成績數(shù)據(jù)本身,更應思考數(shù)據(jù)背后是一個個有待教育、引導的鮮活個體。在關(guān)注學生學習成績的同時,更要關(guān)心學生身心健康的發(fā)展。同時,借助新的信息技術(shù)手段及時調(diào)整授課方式方法、改進教學手段,促使教師不斷反思教學過程。特別是近年來,利用人工智能技術(shù)高效開展線上課程(釘釘直播課、學習通、雨課堂等),擴展了教學方式,離散了教學過程的“時間—空間”(可回放、重復、非教室),進一步豐富了教師的授課方式和教學手段,助力教師對學生(存在掛科風險)的課業(yè)輔導與教學。
最后,對于學校教務(wù)部門而言,可以系統(tǒng)地對教師的教學質(zhì)量做出預評估。如果某科目成績低的學生過多,則證明該課程存在發(fā)生教學事故的風險。這時需要提示相關(guān)教學部門及時介入干預,同時提醒相關(guān)教師更加注重教學效果,甚至可以采取更為嚴格的管理措施來防范教學事故的發(fā)生。對學校教務(wù)部門而言,通過對教學質(zhì)量的預警評估,能夠達到改善學生管理和預防教學事故的目的。
本研究可以在以下方面進一步擴展:①優(yōu)化基礎(chǔ)數(shù)據(jù)。學習成績是學習效果的直接體現(xiàn),受到諸如學生情感、行為、原有基礎(chǔ)知識結(jié)構(gòu)等諸多因素的影響,越能準確刻畫這些信息,并且恰當?shù)厝谌氲筋A測模型中,越能提高模型的預測精度。例如,開展學生情感特征及目標學科成績關(guān)聯(lián)性分析,并科學量化融入模型,無疑對提高模型預測精度大有裨益。所以,這些因素的科學量化及準確表達是一個重要的研究方向。②探索教學過程時效性評價新途徑。在本文中,預測結(jié)果是依據(jù)歷史成績、入學成績,以及考勤、宿舍衛(wèi)生、校園紀律等行為特征進行的階段性成績預測。實際上,隨著師生在教學過程中的互動,在學生更加注重自身學業(yè)、教師持續(xù)優(yōu)化教學設(shè)計并改善教學活動等因素的共同影響下,教學效果必然實時發(fā)生變化,導致模型預測結(jié)果亦發(fā)生變化。預測結(jié)果的變化量可作為教師教學效果過程性評價的一個重要參考。
本文的實驗結(jié)果表明,LSTM 模型能夠較準確地預測學生的課程成績,具有一定的有效性和實用性。研究對預測數(shù)據(jù)所具有的豐富內(nèi)涵進行了不同維度的挖掘,并提出預測成績的三項功能建議,具有一定的推廣及實用價值。