陳佳明 駱力明 宋潔
摘 ?要: 針對(duì)教育領(lǐng)域特定應(yīng)用場(chǎng)景,利用數(shù)據(jù)挖掘技術(shù)處理教育數(shù)據(jù)是目前熱點(diǎn)研究問(wèn)題之一。課程成績(jī)預(yù)測(cè)指對(duì)一門課程學(xué)生的期末成績(jī)進(jìn)行預(yù)測(cè),其關(guān)鍵問(wèn)題是通過(guò)選取合適的學(xué)生特征和確定最優(yōu)的預(yù)測(cè)算法來(lái)構(gòu)建預(yù)測(cè)準(zhǔn)確率高的模型。針對(duì)大學(xué)基礎(chǔ)課的特點(diǎn),從主客觀兩方面選擇特征,對(duì)比了4個(gè)效果最優(yōu)的課程成績(jī)預(yù)測(cè)分類算法,以準(zhǔn)確率較高的算法構(gòu)成加權(quán)投票集成算法,發(fā)現(xiàn)加權(quán)投票集成算法的預(yù)測(cè)準(zhǔn)確率和AP值最高,為利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)課程成績(jī)預(yù)測(cè)提供了一種有效的方法。
關(guān)鍵詞: 成績(jī)預(yù)測(cè)模型; 教育數(shù)據(jù)挖掘; 加權(quán)投票集成算法; 模型構(gòu)建; 大學(xué)基礎(chǔ)課; 分類算法
中圖分類號(hào): TN911.1?34; TP391 ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)01?0093?06
Course performance weighted voting prediction model of college fundamental courses
CHEN Jiaming, LUO Liming, SONG Jie
Abstract: To process the educational data from specific application scenario in education field by data mining technology is one of the popular research projects. Course performance prediction refers to the prediction of final performance of students in a curriculum, whose key issue is to build a high?accuracy model by selecting proper student features and determining optimal prediction algorithm. The features are selected from both subjective and objective aspects according to features of university basic courses. Four optimal classification algorithms of curriculum performance prediction are compared and the weighted voting integrated algorithm is constituted with the algorithms with higher accuracy. The weighted voting integrated algorithm can reach the best accuracy and AP value, which provides an effective method for realization of curriculum performance prediction by utilizing data mining technology.
Keywords: performance prediction model; educational data mining; weighted voting integrated algorithm; model construction; college elementary course; classification algorithm
0 ?引 ?言
教育數(shù)據(jù)挖掘(Educational Data Mining,EDM)是近年來(lái)熱門的數(shù)據(jù)挖掘研究領(lǐng)域之一,可以為教師提供用于評(píng)估的信息,為教師設(shè)計(jì)與調(diào)整教學(xué)環(huán)境和方法的決策提供教學(xué)基礎(chǔ)[1]。學(xué)生成績(jī)預(yù)測(cè)是教育數(shù)據(jù)挖掘領(lǐng)域的重點(diǎn)研究課題之一[2]。學(xué)生成績(jī)的預(yù)測(cè)分為總體學(xué)業(yè)預(yù)測(cè)和課程成績(jī)預(yù)測(cè)兩類。其中,總體學(xué)業(yè)預(yù)測(cè)是對(duì)一個(gè)持續(xù)時(shí)間較長(zhǎng)的教學(xué)過(guò)程(如某一學(xué)年或本科四年)中大學(xué)生整體的學(xué)習(xí)情況進(jìn)行觀察,預(yù)測(cè)大學(xué)生學(xué)年末或畢業(yè)時(shí)的學(xué)業(yè)表現(xiàn)。例如,文獻(xiàn)[3]以巴基斯坦某信息技術(shù)專業(yè)學(xué)生大學(xué)四年的課程成績(jī)作為輸入,預(yù)測(cè)學(xué)生畢業(yè)設(shè)計(jì)的成績(jī)。課程成績(jī)預(yù)測(cè)比總體學(xué)業(yè)預(yù)測(cè)更有針對(duì)性,是指對(duì)一門課程(在線課程或者課堂教學(xué))學(xué)生的期末成績(jī)進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果可以輔助教師對(duì)學(xué)生進(jìn)行個(gè)性化指導(dǎo),從而為學(xué)習(xí)能力較強(qiáng)的學(xué)生提供更豐富的知識(shí)和技能培養(yǎng),為學(xué)習(xí)效果不理想的學(xué)生給予更多有針對(duì)性的幫助,也可以幫助學(xué)生減少學(xué)業(yè)壓力[4]。
課程成績(jī)預(yù)測(cè)的主要研究問(wèn)題為輸入特征和算法的選擇,即針對(duì)特定的學(xué)習(xí)情境指定相關(guān)的影響因素作為特征,并使用適合的算法構(gòu)建最優(yōu)的預(yù)測(cè)模型對(duì)成績(jī)進(jìn)行預(yù)測(cè)。特征主要分為兩類,即學(xué)習(xí)能力水平和課堂參與度。常用的預(yù)測(cè)算法包括多元線性回歸、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和邏輯回歸等。例如,文獻(xiàn)[5]將績(jī)點(diǎn)、前導(dǎo)課成績(jī)和平時(shí)作業(yè)成績(jī)作為特征,比較多元線性回歸、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等回歸算法預(yù)測(cè)物理力學(xué)課學(xué)生的成績(jī),發(fā)現(xiàn)支持向量機(jī)算法的準(zhǔn)確率最高為87.5%;文獻(xiàn)[6]利用邏輯回歸及其改進(jìn)的兩種遷移學(xué)習(xí)算法,以學(xué)生每周慕課視頻觀看進(jìn)度、每周作業(yè)完成進(jìn)度和每周作業(yè)成績(jī)作為特征,預(yù)測(cè)慕課學(xué)生是否通過(guò),發(fā)現(xiàn)遷移學(xué)習(xí)算法LR?SIM準(zhǔn)確率更高更穩(wěn)定。文獻(xiàn)[7]應(yīng)用數(shù)據(jù)挖掘方法構(gòu)建自適應(yīng)第二外語(yǔ)在線學(xué)習(xí)系統(tǒng),以中國(guó)臺(tái)灣地區(qū)70名大學(xué)生的性別、個(gè)性和焦慮程度作為特征,預(yù)測(cè)其在線英語(yǔ)課的課程成績(jī),發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)效果更好。
從上述研究可以總結(jié)出,不同情境適用的特征和最優(yōu)算法不同,因此課程成績(jī)預(yù)測(cè)需要根據(jù)課程特點(diǎn)來(lái)選擇特征,并對(duì)多種算法進(jìn)行對(duì)比實(shí)驗(yàn),構(gòu)建出最優(yōu)模型。為了全面地反映學(xué)生的學(xué)習(xí)情況,大學(xué)基礎(chǔ)課的課程成績(jī)預(yù)測(cè)需要從主觀和客觀兩方面來(lái)選擇特征。本文根據(jù)大學(xué)基礎(chǔ)課的特點(diǎn),選擇績(jī)點(diǎn)、相關(guān)前導(dǎo)課成績(jī)、平時(shí)作業(yè)成績(jī)和提問(wèn)次數(shù)作為客觀特征,選擇個(gè)人興趣作為主觀特征,實(shí)現(xiàn)并對(duì)比課程成績(jī)預(yù)測(cè)中常用且被驗(yàn)證效果較好的支持向量機(jī)(分為高斯核函數(shù)算法和多項(xiàng)式核函數(shù)算法兩種)、BP神經(jīng)網(wǎng)絡(luò)和邏輯回歸等算法。并引入加權(quán)投票機(jī)制,將預(yù)測(cè)準(zhǔn)確率較高的高斯核函數(shù)支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行集成,發(fā)現(xiàn)加權(quán)投票集成算法的預(yù)測(cè)準(zhǔn)確率和平均查準(zhǔn)率(Average Precision,AP) 最高。利用預(yù)測(cè)效果最佳的加權(quán)投票集成算法,本文構(gòu)建了大學(xué)基礎(chǔ)課的課程成績(jī)預(yù)測(cè)模型,為教師開展個(gè)性化教學(xué)提供了參考,為大學(xué)基礎(chǔ)課的課程成績(jī)預(yù)測(cè)提供了一個(gè)有效的方法。
1 ?特征選取與模型構(gòu)建
1.1 ?特征選取
影響大學(xué)基礎(chǔ)課課程成績(jī)的因素體現(xiàn)在客觀和主觀兩個(gè)方面。依據(jù)文獻(xiàn)[8]提出的模型,影響學(xué)生課程成績(jī)的因素主要分為三個(gè)方面:過(guò)往學(xué)習(xí)能力、課程表現(xiàn)和對(duì)課程的主觀態(tài)度。其中,學(xué)生的過(guò)往學(xué)習(xí)能力和課程表現(xiàn)屬于客觀因素,可通過(guò)客觀記錄的數(shù)據(jù)進(jìn)行分析,對(duì)課程成績(jī)起到了主要影響[6];學(xué)生對(duì)課程的主觀態(tài)度屬于主觀因素,可通過(guò)問(wèn)卷調(diào)研獲取并分析,對(duì)課程成績(jī)起到了次要影響[9?10]。因此,為了全面反映大學(xué)基礎(chǔ)課學(xué)生的特征,準(zhǔn)確預(yù)測(cè)大學(xué)基礎(chǔ)課學(xué)生的課程成績(jī),本文從主觀和客觀兩方面選擇特征并進(jìn)行分析。
1.1.1 ?客觀因素
客觀因素中,體現(xiàn)過(guò)往學(xué)習(xí)能力的因素有績(jī)點(diǎn)、相關(guān)前導(dǎo)課成績(jī)和學(xué)歷等因素,體現(xiàn)課程表現(xiàn)的因素有提問(wèn)次數(shù)、平時(shí)成績(jī)和課堂活動(dòng)參與度等因素。文獻(xiàn)[5]通過(guò)對(duì)比驗(yàn)證了采用績(jī)點(diǎn)、相關(guān)前導(dǎo)課成績(jī)和平時(shí)作業(yè)成績(jī)作為特征可以更好地預(yù)測(cè)大學(xué)基礎(chǔ)課成績(jī)。文獻(xiàn)[11]分析了提問(wèn)次數(shù)作為深入探究的表現(xiàn)對(duì)學(xué)生成績(jī)的影響。在大學(xué)基礎(chǔ)課中,績(jī)點(diǎn)反映了學(xué)生在學(xué)習(xí)新課程之前已經(jīng)具備的綜合學(xué)習(xí)能力,對(duì)學(xué)生學(xué)習(xí)一門新的課程會(huì)產(chǎn)生較大的影響。相關(guān)前導(dǎo)課成績(jī)反映了學(xué)生前導(dǎo)知識(shí)掌握情況,對(duì)新課程的成績(jī)有較強(qiáng)的影響[12],且時(shí)間相近的前導(dǎo)課成績(jī)可以更準(zhǔn)確地反映學(xué)生的前導(dǎo)知識(shí)水平[5]。平時(shí)作業(yè)成績(jī)重點(diǎn)體現(xiàn)學(xué)生學(xué)習(xí)新課程的情況。提問(wèn)次數(shù)反映了學(xué)生參與課程相關(guān)的深入探討的頻次及學(xué)生的學(xué)習(xí)積極性,對(duì)知識(shí)的理解程度具有較大影響。結(jié)合文獻(xiàn)[8]的學(xué)生課程成績(jī)模型和對(duì)大學(xué)基礎(chǔ)課影響因素的分析,本文選取績(jī)點(diǎn)、相關(guān)前導(dǎo)課成績(jī)、平時(shí)作業(yè)成績(jī)和提問(wèn)次數(shù)作為大學(xué)基礎(chǔ)課成績(jī)預(yù)測(cè)的客觀特征,如表1所示。
1.1.2 ?主觀因素
主觀因素中,體現(xiàn)學(xué)生對(duì)課程主觀態(tài)度的因素主要有學(xué)習(xí)興趣、自我效能感和學(xué)習(xí)動(dòng)機(jī)等。文獻(xiàn)[13]驗(yàn)證了學(xué)習(xí)興趣對(duì)大學(xué)課程成績(jī)具有較強(qiáng)影響。在大學(xué)基礎(chǔ)課中,學(xué)習(xí)興趣影響學(xué)生學(xué)習(xí)的主動(dòng)性,主要分為個(gè)人興趣和情境興趣兩類。與情境興趣相比,個(gè)人興趣作為學(xué)生在課前對(duì)課程內(nèi)容產(chǎn)生的興趣[14],對(duì)學(xué)生的課堂表現(xiàn)、知識(shí)掌握、價(jià)值觀和成績(jī)均有更強(qiáng)、更長(zhǎng)期的影響[15]。因此,本文選取學(xué)生的個(gè)人興趣作為大學(xué)基礎(chǔ)課成績(jī)預(yù)測(cè)的主觀特征。本文通過(guò)量表來(lái)測(cè)量個(gè)人興趣,改編了文獻(xiàn)[16]設(shè)計(jì)的初始興趣(Initial Interest,即個(gè)人興趣)問(wèn)卷,設(shè)計(jì)出適用于大學(xué)基礎(chǔ)課的5分制個(gè)人興趣問(wèn)卷。
1.2 ?模型構(gòu)建
結(jié)合所選的主觀和客觀特征進(jìn)行建模之前,需要確定預(yù)測(cè)模型的輸出。課程成績(jī)預(yù)測(cè)模型的輸出主要分為是否通過(guò)課程、百分制分?jǐn)?shù)和5分制分?jǐn)?shù)三類。每類預(yù)測(cè)結(jié)果都有相應(yīng)的應(yīng)用。其中,5分制分?jǐn)?shù)主要用于個(gè)性化教學(xué)。本文的研究目標(biāo)是為教師開展個(gè)性化教學(xué)提供參考。因此,本文采用5分制課程成績(jī)作為輸出,將學(xué)生的百分制課程成績(jī)根據(jù)區(qū)間劃分為5個(gè)等級(jí),如表2所示。
對(duì)5分制的課程成績(jī)進(jìn)行預(yù)測(cè)是一個(gè)多分類問(wèn)題,需要通過(guò)分類算法求解。分類算法需要對(duì)分類器進(jìn)行訓(xùn)練,并對(duì)分類器的超參數(shù)進(jìn)行調(diào)優(yōu)以得到最優(yōu)的模型。本文對(duì)課程成績(jī)預(yù)測(cè)常用的分類算法及其需要調(diào)整的超參數(shù)進(jìn)行了分析。
1.2.1 ?課程成績(jī)預(yù)測(cè)的分類算法
課程成績(jī)預(yù)測(cè)常用的分類算法有支持向量機(jī)、邏輯回歸和BP神經(jīng)網(wǎng)絡(luò)等。其中,支持向量機(jī)算法需要解決如下最優(yōu)化問(wèn)題[17]:
[ ? ? ? ?minw,b,ξ12wTw+Ci=1mξis.t. ? ?y(i)(wT?(X(i))+b)>1-ξi,ξi>0] (1)
式中[C]為懲罰系數(shù)。支持向量機(jī)算法根據(jù)采用的核函數(shù)分為多類,其中,多項(xiàng)式核函數(shù)支持向量機(jī)的決策函數(shù)為:
[fk(X)=sgni=1mα(i)y(i)[X*X(i)+b]d] (2)
式中:[d]為多項(xiàng)式的階;[b]為偏置系數(shù)。
高斯核函數(shù)支持向量機(jī)的決策函數(shù)為:
[fk(X)=sgni=1mα(i)y(i)exp-γX-X(i)2] (3)
式(1)~式(3)中:[γ]為構(gòu)造高維特征的參數(shù);[C],[d],[b]是支持向量機(jī)算法中需要調(diào)節(jié)的超參數(shù)。邏輯回歸是經(jīng)典的分類算法之一,其損失函數(shù)為:
[L(w)=i=1mlog(1+exp(-y(i)wTX(i)))+Cw2] (4)
邏輯回歸需要調(diào)整超參數(shù)[C],在最小化[Lw]的同時(shí)提高模型的泛化能力。不同于邏輯回歸,BP神經(jīng)網(wǎng)絡(luò)加入了隱藏層的概念,通過(guò)反向傳播算法重復(fù)調(diào)整權(quán)值和閾值來(lái)最小化損失函數(shù)的值。常用的BP神經(jīng)網(wǎng)絡(luò)為三層MLP(Multi?Layer Perceptron)[18],需要調(diào)節(jié)隱藏層神經(jīng)元個(gè)數(shù)[nhidden]來(lái)優(yōu)化效果。
1.2.2 ?模型分析
本文將上述課程成績(jī)預(yù)測(cè)常用的分類算法作為分類器,構(gòu)建學(xué)生課程成績(jī)預(yù)測(cè)模型,如圖1所示。
模型的輸入為5個(gè)特征,輸出為5個(gè)成績(jī)等級(jí),是一個(gè)多變量、多分類模型。鑒于上述分類算法均適用于二分類問(wèn)題,模型采用OvR方法將二分類問(wèn)題轉(zhuǎn)換為多分類問(wèn)題進(jìn)行求解。模型的分類器如式(5)所示:
[f(X(i))=Φ(X(i),y(i))] (5)
式中向量[X(i)]表示第[i]個(gè)樣本的特征向量,如表3所示;[Φ]表示決策函數(shù),根據(jù)采用的分類算法決定。向量[y(i)=][[y(i)1,y(i)2,y(i)3,y(i)4,y(i)5]T]表示第[i]個(gè)樣本的實(shí)際分類結(jié)果,其中,[y(i)k∈{-1,1}k∈{1,2,3,4,5}];[f(X(i))]為模型判定第[i]個(gè)樣本的分類結(jié)果,取值為[[f1(X(i)),f2(X(i)),][f3(X(i)),f4(X(i)),f5(X(i))]T],其中,[fk(X(i))∈{-1,1}]且[k∈{1,2,3,4,5}]。
由于單個(gè)分類算法的預(yù)測(cè)能力是有限的,為了構(gòu)建準(zhǔn)確率更高的模型,本文使用投票法對(duì)分類算法進(jìn)行改進(jìn)。投票法是一種集成學(xué)習(xí)方法[19],對(duì)多個(gè)分類算法的預(yù)測(cè)結(jié)果進(jìn)行投票,將得票最高的結(jié)果作為最終預(yù)測(cè)結(jié)果,實(shí)現(xiàn)對(duì)多個(gè)分類算法的權(quán)衡,提高預(yù)測(cè)準(zhǔn)確率。然而,不同子分類器的預(yù)測(cè)準(zhǔn)確率不同。如果直接進(jìn)行投票,則預(yù)測(cè)結(jié)果會(huì)受到預(yù)測(cè)誤差較大的子分類器的影響。為了減弱這種負(fù)面影響,本文引入加權(quán)投票機(jī)制,將預(yù)測(cè)準(zhǔn)確率較高的課程成績(jī)預(yù)測(cè)分類算法進(jìn)行加權(quán)投票集成,為預(yù)測(cè)準(zhǔn)確率高的子分類器分配更高的權(quán)值,加強(qiáng)其對(duì)最終結(jié)果的影響,進(jìn)一步提高預(yù)測(cè)準(zhǔn)確率。預(yù)測(cè)準(zhǔn)確率定義為:
[p(f(X(i)),y(i))=1mi=1m1(f(X(i))=y(i))] (6)
式中[1(x)]為指示函數(shù)。權(quán)值的定義如下:
[wl=pl(f(X(i)),y(i))l=1Lpl(f(X(i)),y(i))] (7)
式中:[pl]表示第[l]個(gè)子分類器的預(yù)測(cè)準(zhǔn)確率;[L]為子分類器總個(gè)數(shù)。集成后的分類器的預(yù)測(cè)結(jié)果概率值為:
[P=l=1LwlPll] (8)
式中:[Pl]表示第[l]個(gè)分類器預(yù)測(cè)結(jié)果的概率,向量[P]中最大值對(duì)應(yīng)的類別為集成算法最終的分類結(jié)果。為了驗(yàn)證加權(quán)投票集成算法的效果,本文結(jié)合所選主觀、客觀特征,分別將上述課程成績(jī)預(yù)測(cè)常用的算法加權(quán)投票集成算法作為模型的分類器進(jìn)行模型訓(xùn)練和調(diào)優(yōu),通過(guò)對(duì)比選擇最優(yōu)的算法構(gòu)建大學(xué)基礎(chǔ)課的課程成績(jī)預(yù)測(cè)模型。
2 ?實(shí)驗(yàn)與討論
2.1 ?數(shù)據(jù)收集與預(yù)處理
本文結(jié)合上述對(duì)特征選取和模型構(gòu)建的分析,以北京某高校大學(xué)基礎(chǔ)課面向?qū)ο蟪绦蛟O(shè)計(jì)(C++)的54名學(xué)生為研究對(duì)象,未對(duì)學(xué)生進(jìn)行直接干預(yù),通過(guò)收集學(xué)生的特征和期末成績(jī)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。
學(xué)生的客觀特征通過(guò)教務(wù)系統(tǒng)和課程教師統(tǒng)計(jì)。其中,績(jī)點(diǎn)和相關(guān)前導(dǎo)課成績(jī)均采集自學(xué)校的教務(wù)系統(tǒng)。相關(guān)前導(dǎo)課成績(jī)?yōu)榘俜种?,?jī)點(diǎn)和平時(shí)作業(yè)成績(jī)?yōu)?分制。平時(shí)作業(yè)成績(jī)來(lái)源于課程教師的統(tǒng)計(jì)結(jié)果。本文采集的平時(shí)作業(yè)成績(jī)以12次實(shí)驗(yàn)報(bào)告的成績(jī)?yōu)闇?zhǔn),統(tǒng)計(jì)情況如表4所示。
提問(wèn)次數(shù)通過(guò)課程教師和助教進(jìn)行統(tǒng)計(jì)。該C++課中學(xué)生對(duì)教師的提問(wèn)通過(guò)在線社區(qū)Moodle、微信以及實(shí)驗(yàn)報(bào)告留言三種方式進(jìn)行,因此本文統(tǒng)計(jì)了微信、Moodle和實(shí)驗(yàn)報(bào)告中每個(gè)學(xué)生提問(wèn)的次數(shù),以教學(xué)周為一個(gè)教學(xué)階段進(jìn)行收集,共計(jì)12次,統(tǒng)計(jì)結(jié)果如表5所示。其中,微信提問(wèn)來(lái)源于學(xué)生與助教和教師的微信聊天記錄,Moodle提問(wèn)來(lái)源于學(xué)生在Moodle社區(qū)討論區(qū)中的發(fā)帖與回復(fù),實(shí)驗(yàn)報(bào)告提問(wèn)來(lái)源于學(xué)生平時(shí)編程實(shí)驗(yàn)中實(shí)驗(yàn)報(bào)告的反思與討論部分。
主觀特征通過(guò)問(wèn)卷計(jì)算得出。學(xué)生在課程第一周通過(guò)在線填寫的方式完成該問(wèn)卷。本文共收回54份有效問(wèn)卷,以學(xué)生每道題目打分的均值作為該學(xué)生個(gè)人興趣分值,其統(tǒng)計(jì)結(jié)果如表6所示。
鑒于分類算法對(duì)于特征間數(shù)值的差異較為敏感,因此需要在訓(xùn)練之前將特征進(jìn)行歸一化處理以防止某一特征因?yàn)閿?shù)值較大在模型預(yù)測(cè)時(shí)占據(jù)主導(dǎo)地位。本文采用均值歸一化的方法進(jìn)行特征縮放,將特征的數(shù)值映射到區(qū)間[0,1]內(nèi),以便于獲得更有效、可靠的模型。
2.2 ?模型訓(xùn)練與參數(shù)調(diào)節(jié)
本文以Python為編程語(yǔ)言編寫各個(gè)算法,在macOS High Sierra環(huán)境中進(jìn)行模型的訓(xùn)練和測(cè)試。實(shí)驗(yàn)以具有5個(gè)特征的648個(gè)樣本作為輸入,其中70%的數(shù)據(jù)用作訓(xùn)練集,其余30%的數(shù)據(jù)用作測(cè)試集,以預(yù)測(cè)準(zhǔn)確率(Accuracy)作為衡量模型效果的指標(biāo)之一,通過(guò)訓(xùn)練集訓(xùn)練出模型,利用該模型預(yù)測(cè)測(cè)試集樣本的分類。實(shí)驗(yàn)在進(jìn)行模型訓(xùn)練時(shí)利用Grid Search方法,通過(guò)10?fold交叉驗(yàn)證調(diào)節(jié)各個(gè)算法的超參數(shù)。各個(gè)算法調(diào)參結(jié)果見表7。
在調(diào)節(jié)超參數(shù)之后,實(shí)驗(yàn)計(jì)算了各個(gè)算法對(duì)5個(gè)成績(jī)等級(jí)預(yù)測(cè)準(zhǔn)確率的均值,如表8所示。其中,BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)準(zhǔn)確率最高,其次是高斯核函數(shù)支持向量機(jī)算法,二者均達(dá)到90%以上的預(yù)測(cè)準(zhǔn)確率;而多項(xiàng)式核函數(shù)支持向量機(jī)和邏輯回歸的預(yù)測(cè)準(zhǔn)確率較低。
本文選擇預(yù)測(cè)準(zhǔn)確率較高的高斯核函數(shù)支持向量機(jī)算法和BP神經(jīng)網(wǎng)絡(luò)算法作為加權(quán)投票集成算法的子分類器并計(jì)算其預(yù)測(cè)準(zhǔn)確率,與其他四個(gè)模型的預(yù)測(cè)準(zhǔn)確率進(jìn)行對(duì)比,如圖2所示。
除了模型的預(yù)測(cè)準(zhǔn)確率,分類模型常用繪制ROC曲線和PR(Precision?Recall,精確率?召回率)曲線等方法來(lái)評(píng)估模型的效果。其中,PR曲線更加適合于偏斜性較大(skewed)的樣本[20]。本文的研究對(duì)象中成績(jī)等級(jí)為5的樣本量遠(yuǎn)小于其他等級(jí)的樣本量,存在偏斜性較大的特點(diǎn),因此,本文選用PR曲線來(lái)評(píng)估模型的效果。在PR曲線中,橫軸表示召回率(Recall),縱軸表示精確率(Precision),PR曲線下方的面積為AP(Average Precision)的值。AP的定義如下:
[AP=01p(r)dr] (9)
式中:[p]表示精確率;[r]表示召回率。PR曲線越接近右上角,曲線下方的面積(即AP的值)越大,模型的效果就越好。本實(shí)驗(yàn)中5個(gè)模型的PR曲線如圖3所示。其中,加權(quán)投票集成算法的PR曲線最接近右上方,AP值最大為0.97,說(shuō)明加權(quán)投票集成算法模型對(duì)于偏斜性較大的樣本的預(yù)測(cè)效果要優(yōu)于其他四個(gè)模型,更加符合本文研究對(duì)象的特征。因此,采用加權(quán)投票集成算法構(gòu)成的模型可以更好地對(duì)大學(xué)基礎(chǔ)課的課程成績(jī)等級(jí)進(jìn)行預(yù)測(cè)。
3 ?結(jié) ?論
本文針對(duì)大學(xué)基礎(chǔ)課的特點(diǎn),從主觀和客觀兩方面選擇特征,以績(jī)點(diǎn)、相關(guān)前導(dǎo)課成績(jī)、平時(shí)作業(yè)成績(jī)和提問(wèn)次數(shù)作為客觀特征,以個(gè)人興趣作為主觀特征,將學(xué)生成績(jī)劃分為5個(gè)等級(jí)進(jìn)行課程成績(jī)預(yù)測(cè)。為了達(dá)到更精準(zhǔn)的預(yù)測(cè)效果并解決大學(xué)基礎(chǔ)課因課程開展周期長(zhǎng)而導(dǎo)致的樣本量較小與數(shù)據(jù)偏斜性較大的問(wèn)題,本文以預(yù)測(cè)準(zhǔn)確率和AP值最高的加權(quán)投票集成算法作為分類器構(gòu)建大學(xué)基礎(chǔ)課的課程成績(jī)預(yù)測(cè)模型。該模型可以從主觀和客觀兩方面特征預(yù)測(cè)學(xué)生的課程期末成績(jī),從而輔助教師的個(gè)性化教學(xué),為教師教學(xué)策略和教學(xué)環(huán)境的調(diào)整提供參考,同時(shí)也可以幫助學(xué)生預(yù)估大學(xué)基礎(chǔ)課的學(xué)習(xí)情況。后續(xù)研究會(huì)將知識(shí)點(diǎn)的掌握情況納入預(yù)測(cè)特征,比平時(shí)作業(yè)成績(jī)更加精確地反映學(xué)生的學(xué)習(xí)情況,并嘗試改進(jìn)數(shù)據(jù)收集的方式,增加樣本量,并針對(duì)小樣本的特點(diǎn),嘗試對(duì)現(xiàn)有算法進(jìn)行改進(jìn)并進(jìn)行更多組對(duì)比實(shí)驗(yàn),從而進(jìn)一步提高模型的預(yù)測(cè)效果。
注:本文通訊作者為駱力明。
參考文獻(xiàn)
[1] ROMERO C, VENTURA S. Educational data mining: a survey from 1995 to 2005 [J]. Expert systems with applications, 2007, 34(1): 135?146.
[2] PE?A?AYALA A. Educational data mining: a survey and a data mining?based analysis of recent works [J]. Expert systems with applications, 2014, 41(4): 1432?1462.
[3] ASIF R, MERCERON A, ALI S A, et al. Analyzing undergraduate students′ performance using educational data mining [J]. Computers & education, 2017, 113: 177?194.
[4] THAI?NGHE N, HORV?TH T, SCHMIDT?THIEME L. Factorization models for forecasting student performance [C]// Proceedings of the 4th International Conference on Educational Data Mining. Eindhoven: EDM, 2011: 11?20.
[5] HUANG S, FANG N. Predicting student academic performance in an engineering dynamics course: a comparison of four types of predictive mathematical models [J]. Computers & education, 2013, 61: 133?145.
[6] HE J, BAILEY J, RUBINSTEIN B I P, et al. Identifying at?risk students in massive open online courses [C]// Proceedings of the Twenty?ninth AAAI Conference on Artificial Intelligence. Austin: AAAI, 2015: 1749?1755.
[7] WANG Y, LIAO H C. Data mining for adaptive learning in a TESL?based e?learning system [J]. Expert systems with applications, 2011, 38(6): 6480?6485.
[8] PARMENTIER P. La réussite des études universitaires: facteurs structurels et processuels de la performance académique en première année en medicine [D]. Belgium: Université Catholique de Louvain, 1994.
[9] DE BARBA P G, KENNEDY G E, AINLEY M D. The role of students′ motivation and participation in predicting performance in a MOOC [J]. Journal of computer assisted learning, 2016, 32(3): 218?231.
[10] BAILEY T H, PHILLIPS L J. The influence of motivation and adaptation on students′ subjective well?being, meaning in life and academic performance [J]. Higher education research & development, 2016, 35(2): 201?216.
[11] NEWMANN F M, MARKS H M, GAMORAN A. Authentic pedagogy and student performance [J]. American journal of education, 1996, 104(4): 280?312.
[12] 黃建明.貝葉斯網(wǎng)絡(luò)在學(xué)生成績(jī)預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)科學(xué),2012,39(11A):280?282.
[13] PINTRICH P R. The dynamic interplay of student motivation and cognition in the college classroom [J]. Advances in motivation and achievement, 1989, 6: 117?160.
[14] RENNINGER K A. Individual interest and development: Implications for theory and practice [J]. The role of interest in learning and development, 1992, 26(3/4): 361?395.
[15] HIDI S. Interest and its contribution as a mental resource for learning [J]. Review of educational research, 1990, 60(4): 549?571.
[16] HARACKIEWICZ J M, DURIK A M, BARRON K E, et al. The role of achievement goals in the development of interest: reciprocal relations between achievement goals, interest, and performance [J]. Journal of educational psychology, 2008, 100(1): 105.
[17] CORTES C, VAPNIK V. Support?vector networks [J]. Machine learning, 1995, 20(3): 273?297.
[18] GALLINARI P, THIRIA S, BADRAN F, et al. On the relations between discriminant analysis and multilayer perceptrons [J]. Neural networks, 1991, 4(3): 349?360.
[19] DIETTERICH T G. Ensemble methods in machine learning [C]// International workshop on multiple classifier systems. Berlin: Springer, 2000: 1?15.
[20] DAVIS J, GOADRICH M. The relationship between precision?recall and ROC curves [C]// Proceedings of the 23rd international conference on machine learning. Pittsburgh: ACM, 2006: 233?240.
作者簡(jiǎn)介:陳佳明,男,碩士研究生,主要研究方向?yàn)槿斯ぶ悄芘c教育、數(shù)據(jù)挖掘。
駱力明,男,教授,碩士研究生導(dǎo)師,主要研究領(lǐng)域?yàn)橹悄芙逃?、軟件系統(tǒng)實(shí)現(xiàn)。
宋 ?潔,女,碩士研究生,主要研究方向?yàn)榻逃夹g(shù)。