摘" 要" 教育大數(shù)據(jù)現(xiàn)已成為促進(jìn)教育變革與創(chuàng)新的技術(shù)力量和思維方式,也成為當(dāng)前教育技術(shù)領(lǐng)域研究的熱點(diǎn)問(wèn)題。在高等教育大數(shù)據(jù)中,學(xué)生成績(jī)分析是核心問(wèn)題,受到眾多研究者與研究機(jī)構(gòu)的關(guān)注。從教育數(shù)據(jù)挖掘的角度對(duì)學(xué)生成績(jī)分析進(jìn)行系統(tǒng)性綜述,將學(xué)生成績(jī)分析劃分為三個(gè)步驟,即教育大數(shù)據(jù)的獲取與預(yù)處理、學(xué)生成績(jī)分析方法和數(shù)據(jù)分析結(jié)果可視化及應(yīng)用,詳細(xì)介紹學(xué)生成績(jī)分析的各類方法以及應(yīng)用,依據(jù)學(xué)生成績(jī)分析研究進(jìn)行總結(jié),并對(duì)未來(lái)研究方向進(jìn)行展望。
關(guān)鍵詞" 高等教育;教育大數(shù)據(jù);教育數(shù)據(jù)挖掘;學(xué)生成績(jī)分析;集成學(xué)習(xí);深度學(xué)習(xí);支持向量機(jī)
中圖分類號(hào):G642.47" " 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2024)14-0032-05
0" 引言
近年來(lái)隨著信息技術(shù)的高速發(fā)展,信息化、數(shù)據(jù)化深刻改變了人們的生活方式和社會(huì)結(jié)構(gòu)。大數(shù)據(jù)是一個(gè)跨學(xué)科的領(lǐng)域,在教育領(lǐng)域,學(xué)生的各類數(shù)據(jù)信息都儲(chǔ)存在學(xué)校的教學(xué)數(shù)據(jù)庫(kù)中。如何從校園數(shù)據(jù)信息中挖掘出其蘊(yùn)含的豐富信息并加以處理或解釋,運(yùn)用于學(xué)生管理、教師教學(xué)等場(chǎng)合,成為當(dāng)今教育發(fā)展亟須解決的問(wèn)題。
對(duì)高等教育數(shù)據(jù)進(jìn)行挖掘、分析的研究多是為了提高學(xué)生成績(jī),進(jìn)而提升人才培養(yǎng)質(zhì)量。因此,在過(guò)去的幾十年,研究者使用各種數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等方法分析探究學(xué)生成績(jī)相關(guān)的因素。本文對(duì)國(guó)內(nèi)外近十年高等教育大數(shù)據(jù)相關(guān)的學(xué)生成績(jī)分析研究進(jìn)行討論,從技術(shù)的視角對(duì)常用的方法進(jìn)行分類總結(jié),并對(duì)后續(xù)研究進(jìn)行思考與展望。
1" 基于數(shù)據(jù)挖掘的學(xué)生成績(jī)分析
高等教育大數(shù)據(jù)中的學(xué)生成績(jī)分析旨在以提高學(xué)生成績(jī)或?qū)Ω呶W(xué)生進(jìn)行學(xué)業(yè)預(yù)警為需求,選取合適的數(shù)據(jù)、算法、模型進(jìn)行教育數(shù)據(jù)挖掘,得出結(jié)論,制定決策。從教育數(shù)據(jù)入手,如學(xué)生成績(jī)數(shù)據(jù)、課程數(shù)據(jù)、個(gè)人信息、生活數(shù)據(jù)等,使用相關(guān)的教育數(shù)據(jù)挖掘工具,分析學(xué)生成績(jī)相關(guān)因素,提出可執(zhí)行的建議。如圖1所示,學(xué)生成績(jī)分析流程可大致劃分為教育大數(shù)據(jù)的獲取和預(yù)處理、學(xué)生成績(jī)數(shù)據(jù)挖掘方法和數(shù)據(jù)分析可視化及應(yīng)用。
1.1" 數(shù)據(jù)的獲取和預(yù)處理
在進(jìn)行學(xué)生成績(jī)分析前,應(yīng)該對(duì)獲取的學(xué)生成績(jī)數(shù)據(jù)及相關(guān)教育大數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是一項(xiàng)艱苦且復(fù)雜的任務(wù),有時(shí)會(huì)占據(jù)解決數(shù)據(jù)挖掘問(wèn)題總時(shí)間的一半以上。由于校園數(shù)據(jù)包含多個(gè)來(lái)源,且存在噪聲、缺失等,因此,有必要將數(shù)據(jù)集成轉(zhuǎn)換為便于存儲(chǔ)、輸入、輸出的形式。結(jié)構(gòu)化的數(shù)據(jù)如學(xué)生信息、成績(jī)數(shù)據(jù)通常使用二維表的形式存儲(chǔ),簡(jiǎn)單的數(shù)據(jù)處理后即可調(diào)用。而復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù),獲取與預(yù)處理方式則較為多樣化,如使用物聯(lián)網(wǎng)感知技術(shù)與智能語(yǔ)音識(shí)別技術(shù)獲取的數(shù)據(jù)、校園Wi-Fi日志數(shù)據(jù)、在線學(xué)習(xí)平臺(tái)數(shù)據(jù)等。
在數(shù)據(jù)預(yù)處理時(shí),還應(yīng)該重視的一點(diǎn)是保護(hù)學(xué)生隱私。教育大數(shù)據(jù)中存在大量的圖像、語(yǔ)音以及文本數(shù)據(jù),其中包含的信息內(nèi)容都構(gòu)成學(xué)生的隱私,若發(fā)生泄露,會(huì)造成倫理問(wèn)題,還可能產(chǎn)生法律風(fēng)險(xiǎn)。羅江華等[1]就人工智能賦能課堂可能造成的倫理困境提出四大化解策略:提升算法透明度、避免數(shù)據(jù)濫用、建立制約關(guān)系、建立倫理框架。李默妍[2]從技術(shù)角度提出基于聯(lián)邦學(xué)習(xí)的教育數(shù)據(jù)挖掘隱私保護(hù)方案,取消了數(shù)據(jù)傳輸與共享的步驟,從根本上解決隱私泄露問(wèn)題。
1.2" 學(xué)生成績(jī)分析方法
教育數(shù)據(jù)挖掘的方法一般與數(shù)據(jù)挖掘領(lǐng)域的方法相同。因此,大多數(shù)的傳統(tǒng)數(shù)據(jù)挖掘技術(shù),如分類、聚類、關(guān)聯(lián)規(guī)則挖掘等,已經(jīng)成功地應(yīng)用在學(xué)生成績(jī)分析中。通過(guò)對(duì)研究論文的閱讀與整理,將在學(xué)生成績(jī)分析中常用的數(shù)據(jù)挖掘方法劃分為以下幾類。
1.2.1" 聚類算法
聚類算法可以顯著地將數(shù)據(jù)量聚集在有意義的聚類之中,減少數(shù)據(jù)分析的時(shí)間復(fù)雜度。在教育數(shù)據(jù)挖掘中,使用最多的是K-means聚類算法。
Ivan?evi?等[3]測(cè)量了學(xué)生在教室或?qū)嶒?yàn)室環(huán)境中的座位選擇,并評(píng)估其對(duì)學(xué)習(xí)成績(jī)的影響。研究采用K-means算法,對(duì)4 096份學(xué)生的位置選擇進(jìn)行聚類分析,聚類后發(fā)現(xiàn)選擇前排座位的學(xué)生要比選擇后排座位的學(xué)生的學(xué)習(xí)評(píng)估成績(jī)高10%。申民哲[4]對(duì)學(xué)生成績(jī)、課程通過(guò)率、去圖書(shū)館次數(shù)、學(xué)生消費(fèi)等數(shù)據(jù)構(gòu)成的數(shù)據(jù)集進(jìn)行K-means聚類分析,以形成學(xué)生特征標(biāo)簽。
聚類算法可行性高且具有可解釋性。通過(guò)將一些變量(如完成學(xué)習(xí)任務(wù)的時(shí)間、學(xué)生在課堂上的行為、教室位置關(guān)系、學(xué)生學(xué)習(xí)動(dòng)機(jī)等)與學(xué)生成績(jī)數(shù)據(jù)相關(guān)聯(lián),可針對(duì)具有相同學(xué)習(xí)特征的學(xué)生群體制定對(duì)應(yīng)的教育方法,開(kāi)展個(gè)性化教育或是發(fā)現(xiàn)學(xué)習(xí)途徑。
1.2.2" 關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則挖掘算法是指對(duì)測(cè)試數(shù)據(jù)通過(guò)算法或模型查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。在教育數(shù)據(jù)挖掘中,常用的關(guān)聯(lián)規(guī)則挖掘算法有Apriori算法、FP-growth算法等。
陳穎[5]對(duì)某校電氣自動(dòng)化專業(yè)83名學(xué)生的33門(mén)課程成績(jī)用關(guān)聯(lián)規(guī)則和Apriori算法計(jì)算支持度和置信度,找尋成績(jī)數(shù)據(jù)之間存在的潛在關(guān)聯(lián),設(shè)計(jì)課程推薦系統(tǒng)。曾興[6]提出采用自底向上的遍歷方式改進(jìn)FP-growth算法,根據(jù)學(xué)生歷史成績(jī)挖掘出不同課程之間的關(guān)聯(lián)性。
關(guān)聯(lián)規(guī)則挖掘算法簡(jiǎn)單且可行性高,在高等教育大數(shù)據(jù)中的研究主要為課程之間的關(guān)聯(lián)分析,如通過(guò)學(xué)生成績(jī)分析不同課程之間的關(guān)聯(lián)性或是學(xué)習(xí)知識(shí)點(diǎn)之間存在的相關(guān)性,以此為教育管理者制定課程教育規(guī)劃或?yàn)閷W(xué)生推薦相關(guān)課程學(xué)習(xí)等。
1.2.3" 決策樹(shù)
分類與回歸技術(shù)都可以用于預(yù)測(cè)學(xué)生成績(jī),分類用于預(yù)測(cè)樣本可能的類標(biāo)簽,回歸可以發(fā)現(xiàn)連續(xù)變量間具有的某種線性或非線性關(guān)系。決策樹(shù)是一種用于分類與回歸的非參數(shù)監(jiān)督學(xué)習(xí)方法,以樹(shù)結(jié)構(gòu)的形式自上而下構(gòu)建分類或回歸模型。
連家劍[7]對(duì)收集的就業(yè)結(jié)果進(jìn)行分類劃分,以有代表性的課程作為能力屬性,通過(guò)C4.5算法構(gòu)建決策樹(shù)得出課程成績(jī)與就業(yè)方向的關(guān)聯(lián)性,完成就業(yè)推薦模型的構(gòu)建。毛天怡[8]對(duì)某校學(xué)生四年的學(xué)生入學(xué)信息數(shù)據(jù)、歷史成績(jī)單數(shù)據(jù)、課程信息數(shù)據(jù)等,在進(jìn)行數(shù)據(jù)集成、數(shù)據(jù)預(yù)處理和特征工程后,構(gòu)建基于學(xué)生畫(huà)像特征庫(kù)的CART回歸樹(shù)模型,以預(yù)測(cè)學(xué)生成績(jī)。
決策樹(shù)算法由于其準(zhǔn)確度較高且具有可解釋性,在學(xué)生成績(jī)分析問(wèn)題中受到眾多研究者關(guān)注,用以預(yù)測(cè)學(xué)生成績(jī)分組,對(duì)可能不及格的學(xué)生進(jìn)行學(xué)業(yè)預(yù)警或更精確地預(yù)測(cè)學(xué)生成績(jī),以提供更多的信息,如學(xué)生成績(jī)進(jìn)步/退步幅度、班級(jí)或年級(jí)均分等,可供教師或教學(xué)管理者對(duì)接下來(lái)的教育方案作出調(diào)整。
1.2.4" 支持向量機(jī)
在機(jī)器學(xué)習(xí)中,支持向量機(jī)(Support Vector Machine,SVM)是一種有效的監(jiān)督學(xué)習(xí)模型,可用于分類與回歸。該算法通過(guò)求解樣本中兩類之間的最大邊距超平面,將問(wèn)題化為求解凸二次規(guī)劃的問(wèn)題。由于支持向量機(jī)是只考慮二分類的算法,在學(xué)生成績(jī)分析問(wèn)題中,支持向量機(jī)經(jīng)常被用于對(duì)學(xué)生成績(jī)及格/不及格的劃分,即用于學(xué)業(yè)預(yù)警之中。
楊浩[9]使用學(xué)生的平均成績(jī)、成績(jī)標(biāo)準(zhǔn)差與生活規(guī)律指數(shù)結(jié)合SVM算法,在學(xué)生畫(huà)像系統(tǒng)中使用機(jī)器學(xué)習(xí)框架實(shí)現(xiàn)學(xué)生掛科預(yù)警功能。Sembiring等[10]根據(jù)學(xué)生興趣、學(xué)習(xí)時(shí)間、學(xué)習(xí)狀態(tài)等信息構(gòu)建支持向量機(jī)學(xué)業(yè)預(yù)測(cè)模型,對(duì)于學(xué)業(yè)差的學(xué)生預(yù)測(cè)準(zhǔn)確率達(dá)到93.7%。
然而對(duì)于學(xué)生成績(jī)的二分類,在大多數(shù)情況下及格人數(shù)遠(yuǎn)大于不及格人數(shù),這導(dǎo)致在預(yù)測(cè)學(xué)生是否不及格的成績(jī)問(wèn)題下,支持向量機(jī)的準(zhǔn)確度往往不是最優(yōu),且由于其優(yōu)化存在局限性,大數(shù)據(jù)背景下該算法存在計(jì)算量大的問(wèn)題。
1.2.5" 集成學(xué)習(xí)
集成學(xué)習(xí)是通過(guò)構(gòu)建并結(jié)合多個(gè)機(jī)器學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù),可以用于分類與回歸問(wèn)題的集成。通過(guò)對(duì)訓(xùn)練集數(shù)據(jù)訓(xùn)練若干個(gè)個(gè)體弱學(xué)習(xí)器,最終結(jié)合形成一個(gè)強(qiáng)學(xué)習(xí)器。因此,集成學(xué)習(xí)器效果通常優(yōu)于單獨(dú)的機(jī)器學(xué)習(xí)方法。隨機(jī)森林是建立在決策樹(shù)基礎(chǔ)上的一種集成學(xué)習(xí)器,由多個(gè)沒(méi)有關(guān)聯(lián)的決策樹(shù)組成,通過(guò)多個(gè)決策樹(shù)投票決定最后的結(jié)果。
Tarik等[11]根據(jù)72 010名學(xué)生的成績(jī)構(gòu)建成績(jī)預(yù)測(cè)模型,在線性回歸、回歸型決策樹(shù)、回歸型隨機(jī)森林三種預(yù)測(cè)模型中,回歸型隨機(jī)森林給出了最好的預(yù)測(cè)結(jié)果。提升樹(shù)算法是建立在決策樹(shù)基礎(chǔ)上的另一種集成學(xué)習(xí)器,在預(yù)警模型中應(yīng)用非常廣泛。崔佳杉[12]結(jié)合PSO算法建立基于XGBoost算法的學(xué)業(yè)成績(jī)預(yù)警模型,選擇UCI公開(kāi)的包括29個(gè)學(xué)生的相關(guān)屬性數(shù)據(jù)作為訓(xùn)練集與數(shù)據(jù)集,模型具有較高的效率和實(shí)驗(yàn)準(zhǔn)確率。
類似隨機(jī)森林以及提升樹(shù)算法的集成學(xué)習(xí)器在學(xué)生成績(jī)分析中準(zhǔn)確率高,且具有很好的解釋性,受到眾多研究者關(guān)注。
1.2.6" 深度學(xué)習(xí)
深度學(xué)習(xí)是一種特殊的機(jī)器學(xué)習(xí),是借鑒人腦由眾多神經(jīng)元組成的特性而形成的一個(gè)框架,可以近似為多層的神經(jīng)網(wǎng)絡(luò)模型。深度學(xué)習(xí)近年來(lái)已經(jīng)在多個(gè)領(lǐng)域得到較為廣泛的應(yīng)用,在教育大數(shù)據(jù)領(lǐng)域也已有一定數(shù)量的研究。
Zhang等[13]提出一種稀疏注意力卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)中國(guó)高等教育本科生成績(jī),該模型不僅有良好的精準(zhǔn)度,而且對(duì)“為什么根據(jù)課程的關(guān)聯(lián)來(lái)預(yù)測(cè)學(xué)生是否及格”這一問(wèn)題給出解釋。Hu等[14]
提出基于長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)的貝葉斯深度學(xué)習(xí)模型,該模型相比標(biāo)準(zhǔn)的深度學(xué)習(xí)模型能捕獲長(zhǎng)期依賴關(guān)系,在學(xué)生成績(jī)預(yù)測(cè)過(guò)程中能捕獲學(xué)生的知識(shí)狀態(tài),模擬學(xué)生的知識(shí)進(jìn)化過(guò)程,得到更好的預(yù)測(cè)效果。
深度學(xué)習(xí)精準(zhǔn)度高,但相比傳統(tǒng)數(shù)據(jù)挖掘方法對(duì)數(shù)據(jù)依賴性更強(qiáng),在學(xué)生成績(jī)分析中應(yīng)用需要大量的數(shù)據(jù)訓(xùn)練。如何將深度學(xué)習(xí)技術(shù)更好地運(yùn)用于當(dāng)今高等教育領(lǐng)域是研究者工作的重點(diǎn)所在。
1.3" 學(xué)生成績(jī)分析可視化及應(yīng)用
1.3.1" 學(xué)生成績(jī)分析可視化
在高等教育大數(shù)據(jù)背景下的學(xué)生成績(jī)分析中,數(shù)據(jù)可視化對(duì)于海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律、增強(qiáng)數(shù)據(jù)表現(xiàn)、提升數(shù)據(jù)價(jià)值具有重要作用。根據(jù)可視化技術(shù)的類型,本文整理總結(jié)在學(xué)生成績(jī)分析研究中的三種可視化方式,如表1所示。
1)多維數(shù)據(jù)可視化,指多個(gè)維度屬性的數(shù)據(jù)變量經(jīng)過(guò)處理后以直觀的圖表形式映射。教育相關(guān)工作者通過(guò)多維數(shù)據(jù)可視化可以更方便地了解教育現(xiàn)狀,總結(jié)教育規(guī)律,制定相關(guān)政策。
2)文本數(shù)據(jù)可視化,指通過(guò)對(duì)文本資源的分析,利用計(jì)算機(jī)技術(shù)將其以圖形化方式呈現(xiàn),適用于文本主題發(fā)現(xiàn)、熱點(diǎn)發(fā)現(xiàn)等,可從多角度提取多種數(shù)據(jù)特征對(duì)文本進(jìn)行集合分析和展示。
3)網(wǎng)絡(luò)數(shù)據(jù)可視化,指將每個(gè)主題代表為一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn),網(wǎng)絡(luò)中節(jié)點(diǎn)與節(jié)點(diǎn)之間的連線代表主體之間的關(guān)聯(lián)性。在教育大數(shù)據(jù)背景下,網(wǎng)絡(luò)數(shù)據(jù)可視化能更方便研究者對(duì)于學(xué)生之間的交互關(guān)系、知識(shí)點(diǎn)之間的關(guān)聯(lián)等的理解。
1.3.2" 學(xué)生成績(jī)分析應(yīng)用
學(xué)生成績(jī)分析應(yīng)用涉及教育的多個(gè)方面,可以針對(duì)教育系統(tǒng)的任何相關(guān)利益者,如學(xué)生、教師、管理人員以及研究人員本身。根據(jù)現(xiàn)有研究,本文整理且總結(jié)在學(xué)生成績(jī)分析研究中的四個(gè)主要應(yīng)用方向,如表2所示。
1)預(yù)測(cè)學(xué)生成績(jī)、學(xué)習(xí)成果。在這類應(yīng)用中,目標(biāo)是預(yù)估一個(gè)可以描述學(xué)生的值或變量,該值可以反映學(xué)生的表現(xiàn)、學(xué)習(xí)成果等特點(diǎn)。預(yù)測(cè)學(xué)生成績(jī)與學(xué)習(xí)成果最常用的方法就是回歸與分類,也會(huì)結(jié)合如聚類算法、特征選擇等方法。
2)決策支持系統(tǒng)。學(xué)生成績(jī)分析研究中的另一個(gè)主要應(yīng)用方向是決策支持系統(tǒng),這類應(yīng)用可以通過(guò)對(duì)學(xué)生的行為數(shù)據(jù)、成績(jī)數(shù)據(jù)等進(jìn)行分析,為教師、管理人員提供決策、制定規(guī)章等以輔助學(xué)生學(xué)習(xí),增強(qiáng)學(xué)生學(xué)習(xí)效果。
3)預(yù)測(cè)不良行為。類似于預(yù)測(cè)學(xué)生成績(jī),此類應(yīng)用常用方法是回歸與分類模型。但在此類應(yīng)用中,重點(diǎn)更多在于檢測(cè)學(xué)生可能的不良行為,如學(xué)業(yè)不及格、作弊、退學(xué)等,主要作為一個(gè)在線工具,用于及時(shí)創(chuàng)建警報(bào)通知學(xué)生或教學(xué)管理人員。
4)適應(yīng)性系統(tǒng)。此類應(yīng)用基于計(jì)算機(jī)學(xué)習(xí)中的智能系統(tǒng),使系統(tǒng)適應(yīng)用戶的行為,即個(gè)性化。隨著教育的發(fā)展,不同類別學(xué)生的需求不同,適應(yīng)性系統(tǒng)能更好地滿足不同學(xué)生的需要。
2" 未來(lái)展望
本文介紹當(dāng)今的高等教育大數(shù)據(jù)和教育數(shù)據(jù)挖掘背景,回顧在此背景下的關(guān)于學(xué)生成績(jī)分析的各類研究。目前,教育大數(shù)據(jù)研究正處于穩(wěn)定發(fā)展的階段,已經(jīng)形成一系列的研究成果,但在如下幾方面仍需進(jìn)一步深入研究。
2.1" 教育大數(shù)據(jù)的獲取和預(yù)處理
目前在高等教育領(lǐng)域,對(duì)于教育大數(shù)據(jù)的采集,主要集中于學(xué)生的部分行為層面,如學(xué)習(xí)的課程、到課率、作業(yè)完成情況以及課程成績(jī)等。這些數(shù)據(jù)并不能夠全面地對(duì)學(xué)生進(jìn)行分析,缺乏學(xué)習(xí)過(guò)程中產(chǎn)生的種種數(shù)據(jù)信息、教學(xué)過(guò)程中的行為信息或是學(xué)生的生理心理健康信息等。融合關(guān)鍵技術(shù)與數(shù)據(jù)分析方法,將更全面更完整的學(xué)生數(shù)據(jù)應(yīng)用于高等教育大數(shù)據(jù)分析,是今后研究的重點(diǎn)所在。
2.2" 學(xué)生成績(jī)分析方法
對(duì)于學(xué)生成績(jī)分析中應(yīng)用的各類教育數(shù)據(jù)挖掘方法,集成學(xué)習(xí)器是傳統(tǒng)機(jī)器學(xué)習(xí)中普遍最為準(zhǔn)確的預(yù)測(cè)學(xué)生成績(jī)的方法,常見(jiàn)的集成學(xué)習(xí)器有隨機(jī)森林、提升樹(shù)算法等。而深度學(xué)習(xí)是目前最為熱門(mén)的方法,但由于對(duì)數(shù)據(jù)依賴性高等特點(diǎn),深度學(xué)習(xí)所能應(yīng)用的范圍還較為有限。深度學(xué)習(xí)最大的優(yōu)勢(shì)在于能夠從大數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征表示,非常適合處理復(fù)雜與不確定性的教育大數(shù)據(jù)。結(jié)合更全面的學(xué)生數(shù)據(jù),對(duì)學(xué)生進(jìn)行特征建模,以更加精準(zhǔn)地預(yù)測(cè)學(xué)習(xí)成績(jī),而且能于早期進(jìn)行學(xué)業(yè)預(yù)警。借助深度學(xué)習(xí)的方法,教育大數(shù)據(jù)的分析挖掘?qū)⒏幼詣?dòng)化、智能化、深度化、精準(zhǔn)化。
2.3" 學(xué)生成績(jī)分析應(yīng)用
隨著教育的發(fā)展,教育方面的各類需求會(huì)越來(lái)越多,適應(yīng)性系統(tǒng)即個(gè)性化教育體系是將來(lái)教育研究應(yīng)用的重點(diǎn)所在。適應(yīng)性系統(tǒng)是在傳統(tǒng)學(xué)習(xí)基礎(chǔ)上的一種輔助學(xué)習(xí)工具,能夠?yàn)椴煌愋偷膶W(xué)生提供適合的高效的學(xué)習(xí)指導(dǎo),針對(duì)學(xué)生的特點(diǎn)、學(xué)習(xí)風(fēng)格偏好,給出更合適的學(xué)習(xí)路徑,預(yù)測(cè)學(xué)生學(xué)習(xí)狀態(tài),改善學(xué)生學(xué)習(xí)體驗(yàn),指導(dǎo)學(xué)生更準(zhǔn)確地制訂個(gè)人學(xué)習(xí)以及就業(yè)計(jì)劃。
3" 參考文獻(xiàn)
[1] 羅江華,王琳,劉璐.人工智能賦能課堂反饋的倫理困境及風(fēng)險(xiǎn)化解[J].現(xiàn)代遠(yuǎn)程教育研究,2022,34(2):
29-36.
[2] 李默妍.基于聯(lián)邦學(xué)習(xí)的教育數(shù)據(jù)挖掘隱私保護(hù)技術(shù)探索[J].電化教育研究,2020,41(11):94-100.
[3] Ivan?evi? V, ?elikovi? M, Lukovi? I. The individual stability of student spatial deployment and its"implications[M]//IEEE. Proceedings of the Inter-national Symposium on Computers in Education.2012:1-4.
[4] 申民哲.基于數(shù)據(jù)挖掘的學(xué)生畫(huà)像與學(xué)業(yè)預(yù)警方法研究[D].鄭州:鄭州輕工業(yè)大學(xué),2022.
[5] 陳穎.基于大數(shù)據(jù)的成績(jī)分析與課程推薦系統(tǒng)應(yīng)用研究[D].長(zhǎng)春:吉林建筑大學(xué),2021.
[6] 曾興.基于關(guān)聯(lián)規(guī)則挖掘的學(xué)生成績(jī)分析研究[D].??冢汉D洗髮W(xué),2018.
[7] 連家劍.大學(xué)生就業(yè)畫(huà)像系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].南寧:廣西大學(xué),2020.
[8] 毛天怡.基于學(xué)生畫(huà)像和課程相似度的學(xué)生成績(jī)預(yù)測(cè)模型[D].杭州:浙江大學(xué),2020.
[9] 楊浩.高校學(xué)生畫(huà)像系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2019.
[10] Sembiring S, Zarlis M, Hartama D, et al. Pre-diction of student academic performance by an application of data mining techniques[M]//Proceedings of the 2nd International Conference on Management Science and Artificial Intelli-gence.2011:110-114.
[11] Tarik A, Aissa H, Yousef F. Artificial intelli-gence and machine learning to predict student performance during the COVID-19[J].Procedia Computer Science,2021,184:835-840.
[12] 崔佳杉.基于教育數(shù)據(jù)挖掘的學(xué)生學(xué)業(yè)預(yù)警模型研究[D].烏魯木齊:新疆師范大學(xué),2021.
[13] Zhang YP, An R, Cui JQ, et al. Undergraduate grade prediction in Chinese higher education using convolutional neural networks[M]//Pro-
ceedings of the 11th International Conference on Learning Analytics and Knowledge Confe-rence.2021:462-468.
[14] Hu Q, Rangwala H. Reliable deep grade predic-tion with uncertainty estimation[M]//Pro-ceedings of the 9th International Conference on
Learning Analytics amp; Knowledge.2019:76-85.
[15] 王剛濤.基于機(jī)器學(xué)習(xí)的學(xué)業(yè)預(yù)警研究[D].西安:西安石油大學(xué),2021.
[16] Collins C, Carpendale S, Penn G. Docuburst: Visua-
lizing document content using language struc-ture[M]//Computer Graphics Forum. Oxford, UK: Blackwell Publishing Ltd,2009,28(3):1039-1046.
[17] Leeds D D, Zhang T, Weiss G M. Mining course groupings using academic performance[M]//Pro-ceedings of the 14th International Conference on Educational Data Mining.2021:1-5.
[18] PARDOS Z A, KAO K. MoocRP: An open-source analytics platform[M]//Proceedings of the 2nd ACM Conference on Learning.Vancouver, New York:
ACM,2015:103-110
[19] 葉澤俊.基于數(shù)據(jù)挖掘的大學(xué)英語(yǔ)四級(jí)通過(guò)率預(yù)測(cè)建模研究[J].長(zhǎng)春師范大學(xué)學(xué)報(bào),2019,38(12):55-62.
[20] Zimmermann J, Brodersen K H, Heinimann H R, et al. A model-based approach to predicting graduate-level performance using indicators of undergraduate-level performance[J].Journal of Educational Data Mining,2015,7(3):151-176.
[21] Romero C, Zafra A, Luna J M, et al. Associa-tion rule mining using genetic programming to"provide feedback to instructors from multiple-choice quiz data[J].Expert Systems,2013,30(2):162-172.
[22] 李娜.基于混合協(xié)同過(guò)濾的高校選課推薦方法研究[D].長(zhǎng)沙:中南大學(xué),2013.
[23] 馮俊,胥莉,閔蘭.基于Apriori算法的高校學(xué)生考試作弊動(dòng)機(jī)分析與應(yīng)對(duì)[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,42(2):174-180.
[24] Krumm A E, Waddington R J, Teasley S D, et al."A learning management system-based early warn-ing system for academic advising in undergra-duate engineering[M]//Learning analytics.Sprin-ger,New York,2014:103-119.
[25] 陳錦輝.基于數(shù)據(jù)挖掘技術(shù)的高校學(xué)生用戶畫(huà)像系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2019.
*項(xiàng)目來(lái)源:西北工業(yè)大學(xué)教育教學(xué)改革研究項(xiàng)目(2022JGWG05)。
作者簡(jiǎn)介:王勁,西北工業(yè)大學(xué)教務(wù)部副部長(zhǎng),博士,助理研究員;龍江,博士,副教授,碩士生導(dǎo)師;郭陽(yáng)明,博士,教授,博士生導(dǎo)師;鄭波,助理研究員,西北工業(yè)大學(xué)教務(wù)部學(xué)生注冊(cè)中心業(yè)務(wù)主管。