亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        適用于學(xué)生成績預(yù)測的學(xué)習(xí)數(shù)據(jù)特征綜述

        2023-10-08 13:15:04陳靜靜
        軟件工程 2023年10期
        關(guān)鍵詞:預(yù)測特征算法

        張 峰, 陳靜靜

        (山東科技大學(xué)計算機科學(xué)與工程學(xué)院, 山東 青島 266590)

        0 引言(Introduction)

        教育數(shù)據(jù)挖掘[1](Educational Data Mining,EDM)是當(dāng)前教學(xué)技術(shù)領(lǐng)域研究的熱點,旨在從海量的教育數(shù)據(jù)中發(fā)現(xiàn)隱藏信息。目前,已有大量工作通過分析學(xué)生學(xué)習(xí)數(shù)據(jù)的非過程性特征,如教育背景、上課出勤率等,利用決策樹[2]、樸素貝葉斯分類法[3]、線性回歸[4]和神經(jīng)網(wǎng)絡(luò)[5]等機器學(xué)習(xí)方法建立成績預(yù)測模型。然而,現(xiàn)有方法大多忽略了學(xué)生在學(xué)習(xí)過程中產(chǎn)生的一些過程性特征數(shù)據(jù),也包含有價值的學(xué)生知識水平信息,如學(xué)習(xí)過程中視頻觀看的頻次等數(shù)據(jù)。這些數(shù)據(jù)能夠反映學(xué)生真實的學(xué)習(xí)情況,可以作為預(yù)測學(xué)生學(xué)習(xí)成績的依據(jù)[6]。例如,對于一組被學(xué)生循環(huán)觀看的視頻,可以認(rèn)為學(xué)生學(xué)習(xí)視頻內(nèi)容時難度較大,也反映學(xué)生在學(xué)習(xí)部分視頻時投入精力較多[7]。目前,很少有綜述性研究從成績預(yù)測所使用的學(xué)習(xí)特征的層面對已有工作進行梳理、分析和總結(jié)。因此,本文根據(jù)不同的學(xué)習(xí)特征對現(xiàn)有學(xué)生成績預(yù)測的研究工作進行分類總結(jié)。

        1 基于機器學(xué)習(xí)技術(shù)的成績預(yù)測流程(Performance prediction process based on machine learning technique)

        基于機器學(xué)習(xí)技術(shù)的學(xué)生成績預(yù)測模型構(gòu)建的基本流程如圖1所示,主要包括數(shù)據(jù)采集、數(shù)據(jù)提取與預(yù)處理、構(gòu)建成績預(yù)測模型三個步驟。首先,通過在線學(xué)習(xí)平臺獲取與學(xué)生學(xué)習(xí)相關(guān)的過程性特征、非過程性特征數(shù)據(jù);其次,采用各種學(xué)習(xí)分析方法對數(shù)據(jù)進行分析,確定可用于預(yù)測的數(shù)據(jù),并對數(shù)據(jù)進行預(yù)處理,包括對數(shù)據(jù)進行過濾和篩選,確保采集的數(shù)據(jù)與學(xué)習(xí)高度相關(guān)聯(lián),此外要進行必要的數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)歸一化,以及處理大量雜亂的數(shù)據(jù)等;最后,提取數(shù)據(jù)特征,采取多種機器學(xué)習(xí)算法包括邏輯回歸、決策樹、樸素貝葉斯、支持向量機、反向傳播和隨機森林建立成績預(yù)測模型。通過對各種模型進行對比,選擇最佳的模型對學(xué)生成績進行預(yù)測,為學(xué)生學(xué)習(xí)及教師指導(dǎo)提供意見。

        圖1 基于機器學(xué)習(xí)技術(shù)的成績預(yù)測模型構(gòu)建流程Fig.1 Construction process of performance prediction model based on machine learning technique

        2 基于學(xué)習(xí)特征的成績預(yù)測(Performance prediction based on learning data feature)

        基于學(xué)生的教育數(shù)據(jù)進行學(xué)生成績預(yù)測,是教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點。如何利用這些教育數(shù)據(jù),將其轉(zhuǎn)換為有用的信息和知識,為教育決策、教學(xué)優(yōu)化服務(wù)提供幫助,已經(jīng)成為教育數(shù)據(jù)挖掘的研究目標(biāo),也是教育工作者尤其是教育決策者重點關(guān)注的內(nèi)容[8]。研究分析學(xué)生學(xué)習(xí)的相關(guān)數(shù)據(jù),并以此為據(jù),為后續(xù)的建模工作提供充足的數(shù)據(jù)資源,是學(xué)生成績預(yù)測任務(wù)的基本前提。本文基于現(xiàn)有數(shù)據(jù)特征,從非過程性特征、過程性特征兩個方面對預(yù)測成績的研究工作進行總結(jié)。

        2.1 基于非過程性特征的成績預(yù)測

        使用非過程性特征進行成績預(yù)測,主要包括個人教育背景、先驗知識、認(rèn)知能力、學(xué)習(xí)成績、學(xué)習(xí)時間、學(xué)習(xí)態(tài)度等[9]。本小節(jié)將非過程性特征分為靜態(tài)數(shù)據(jù)和動態(tài)非過程性數(shù)據(jù),并從這兩個方面梳理和總結(jié)主要工作。

        2.1.1 靜態(tài)數(shù)據(jù)

        使用靜態(tài)數(shù)據(jù)(即很長時間內(nèi)不會變化的數(shù)據(jù)),主要包括學(xué)生個人教育背景、學(xué)校類型、學(xué)校排名、家長受教育程度、社會關(guān)系等預(yù)測成績[10-11]。例如,ABU AMRA等[12]首先在線下收集學(xué)生的學(xué)習(xí)行為特征(基本信息、教育背景、父母受教育程度、社會關(guān)系),然后進行數(shù)據(jù)分析以及預(yù)處理,采取多種機器學(xué)習(xí)算法預(yù)測學(xué)生的成績。ACHARYA等[13]收集整理了500名學(xué)生的信息,包括性別、出生日期、所學(xué)專業(yè)、所在城市、父母是否工作等,分別利用最近鄰算法和樸素貝葉斯算法預(yù)測學(xué)生的學(xué)習(xí)成績,并進行成績預(yù)測模型的對比,選取最佳模型預(yù)測學(xué)生的成績。PANDEY等[14]基于524名學(xué)生的性別、年齡、畢業(yè)學(xué)校等18個特征信息,利用決策樹算法預(yù)測學(xué)生完成學(xué)位的評價等級,從而幫助教師了解學(xué)生的學(xué)習(xí)狀況。SAARELA等[15]利用碩士研究生之前的最終評級和他們在本科階段的成績作為特征,用統(tǒng)計方法預(yù)測碩士研究生在校的表現(xiàn)。DAZ MUJICA等[16]使用學(xué)生情感和情緒變量(對大學(xué)課程的滿意度、對學(xué)業(yè)成績的看法、自己壓力、自尊和疲勞等情感因素)對學(xué)生表現(xiàn)進行早期預(yù)測。NGUYEN等[17]通過收集越南1 117名學(xué)生的數(shù)據(jù),包括個人情緒智力(Emotional Intelligence,EI)、生活滿意度、職業(yè)、情緒、學(xué)習(xí)目標(biāo)、毅力、學(xué)習(xí)環(huán)境、社交技能等,使用常見的數(shù)據(jù)分析方法分析以上數(shù)據(jù)對學(xué)生學(xué)業(yè)成績的影響。

        2.1.2 動態(tài)非過程性數(shù)據(jù)

        使用動態(tài)非過程性特征(即指學(xué)生在線學(xué)習(xí)過程中產(chǎn)生的一些非過程性數(shù)據(jù)),包括在線學(xué)習(xí)時間、訪問量、平均學(xué)習(xí)成績等預(yù)測成績[18]。例如,MARBOUTI等[19]利用大學(xué)一年級學(xué)生學(xué)習(xí)計算機課程前5周的行為數(shù)據(jù),包括家庭作業(yè)分?jǐn)?shù)、測驗成績、期中考試成績等,基于多種機器學(xué)習(xí)算法(邏輯回歸、決策樹、樸素貝葉斯和隨機森林等)創(chuàng)建該課程的預(yù)測模型。HANA[20]收集了馬薩里克大學(xué)信息學(xué)院的學(xué)生提供的與學(xué)習(xí)課程相關(guān)的學(xué)分?jǐn)?shù)、平均成績等,使用支持向量機、隨機森林、基于規(guī)則的分類器、IB1和樸素貝葉斯算法預(yù)測學(xué)生的學(xué)業(yè)表現(xiàn)。HUSSAIN等[21]通過數(shù)字電子教育與設(shè)計套件(Digital Electronics Education and Design Suite,DEEDS)系統(tǒng)采集到學(xué)生在數(shù)字設(shè)計課程中各課程學(xué)習(xí)的平均時間、活動總數(shù)、平均空閑時間、平均點擊時間和與學(xué)習(xí)相關(guān)的活動總數(shù),使用人工神經(jīng)網(wǎng)絡(luò)、支持向量機、邏輯回歸、樸素貝葉斯和決策數(shù)等機器學(xué)習(xí)算法,預(yù)測每節(jié)課的學(xué)生成績。JIMéNEZ等[22]利用靜態(tài)數(shù)據(jù)(學(xué)習(xí)者性別、居住地、以前學(xué)校類型)和動態(tài)數(shù)據(jù)(學(xué)生在每門課程中的學(xué)習(xí)成績)為特征,提出了多目標(biāo)時間優(yōu)化模型并運用邏輯回歸、隨機森林等機器學(xué)習(xí)算法對學(xué)習(xí)者進行輟學(xué)預(yù)測。XU等[23]通過收集小規(guī)模在線課程(Small Private Online Course,SPOC)平臺2017年秋季和2018年春季學(xué)生學(xué)習(xí)計算機網(wǎng)絡(luò)課程的學(xué)習(xí)行為,包括點擊流、每次活動花費的時間、作業(yè)活動取得的成績等,使用多元回歸模型預(yù)測學(xué)生的成績,該成績預(yù)測工作具有實用性,為學(xué)習(xí)分析和個性化教學(xué)提供了啟示。宋丹等[24]在教學(xué)多源數(shù)據(jù)采集與處理的基礎(chǔ)上,以“操作系統(tǒng)”課程為例,基于已授專業(yè)課、單元測試(可以理解為平時測驗或作業(yè)成績)、移動端教學(xué)數(shù)據(jù)和虛擬仿真實驗數(shù)據(jù)等多個維度的數(shù)據(jù)進行課程成績預(yù)測。XU等[25]將學(xué)生在線學(xué)習(xí)的時間特征、學(xué)習(xí)成績和在線課程平臺論壇內(nèi)學(xué)生互動相關(guān)的大量屬性構(gòu)成訓(xùn)練集,提出一種新的半監(jiān)督回歸算法,用于預(yù)測遠(yuǎn)程在線課程中本科生的最終成績。HASSAN等[26]通過收集開放式大學(xué)的學(xué)習(xí)數(shù)據(jù)集中的學(xué)生論壇互動的學(xué)習(xí)特征,使用深度長期短期記憶模型預(yù)測學(xué)生的早期輟學(xué)情況。HUNG等[27]結(jié)合靜態(tài)數(shù)據(jù)(包括學(xué)生的基本信息、學(xué)生開學(xué)前的歷史成績等)和動態(tài)數(shù)據(jù)類型(訪問課程材料的頻率、發(fā)布在線討論的頻率等),采用深度學(xué)習(xí)和集成學(xué)習(xí)作為主要算法進行績效成績預(yù)測。

        2.2 基于過程性特征的成績預(yù)測

        3 存在的不足以及未來工作(Existing deficiencies and future work)

        根據(jù)使用非過程性特征和過程性特征兩類數(shù)據(jù)用于學(xué)生成績預(yù)測領(lǐng)域的分析和研究,發(fā)現(xiàn)其存在的不足,并對未來工作進行展望。

        3.1 存在的不足

        第一,使用非過程性特征進行成績預(yù)測的方法中,考慮了多種學(xué)習(xí)數(shù)據(jù),借助積累的學(xué)習(xí)數(shù)據(jù)預(yù)測學(xué)生未來的學(xué)習(xí)成績,既可以幫助教師了解學(xué)生的學(xué)習(xí)狀態(tài),還能方便他們及時發(fā)現(xiàn)教學(xué)過程中存在的問題,以便及時調(diào)整教學(xué)方法;但不足之處在于難以動態(tài)掌握學(xué)生的學(xué)習(xí)狀態(tài),忽略了學(xué)習(xí)過程中隱藏地對成績預(yù)測有效的信息,預(yù)測模型整體的準(zhǔn)確率還有待提高。第二,使用過程性特征進行成績預(yù)測的方法中,雖然使用了學(xué)習(xí)行為過程相關(guān)的特征數(shù)據(jù),但是不足之處在于很少有工作將其用于成績預(yù)測,即使在進行成績預(yù)測時考慮了過程性特征,也只是面向某種類型的學(xué)習(xí)行為,沒有綜合考慮多種類型的學(xué)習(xí)行為,從而影響了成績預(yù)測的準(zhǔn)確性。

        3.2 未來工作

        未來可從學(xué)習(xí)數(shù)據(jù)和成績預(yù)測技術(shù)方面進行改進。第一,未來需要進一步挖掘?qū)W生在學(xué)習(xí)過程中隱含的有價值的信息,可以從整個視頻學(xué)習(xí)過程的角度,考慮學(xué)習(xí)過程中更細(xì)粒度的視頻學(xué)習(xí)行為,例如某個視頻的觀看時長,或者觀看視頻時的拖動、暫停等動作,驗證是否可以獲得更好的預(yù)測效果。第二,基于深度學(xué)習(xí)的成績預(yù)測是當(dāng)前教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點,下一步將視頻學(xué)習(xí)行為特征融入深度學(xué)習(xí)中。

        4 結(jié)論(Conclusion)

        隨著教育信息化的發(fā)展,在線學(xué)習(xí)平臺中積累了大量的學(xué)習(xí)行為數(shù)據(jù),為教育數(shù)據(jù)挖掘的研究提供了數(shù)據(jù)支撐。作為教育數(shù)據(jù)挖掘中的研究熱點,基于機器學(xué)習(xí)技術(shù)的成績預(yù)測能夠及時反饋學(xué)生的學(xué)習(xí)狀態(tài),而學(xué)習(xí)行為數(shù)據(jù)是成績預(yù)測的基礎(chǔ)。本文從基于機器學(xué)習(xí)技術(shù)的學(xué)生成績預(yù)測使用的學(xué)習(xí)數(shù)據(jù)特征的角度,總結(jié)了使用非過程性特征和過程性特征進行成績預(yù)測的相關(guān)工作,指出現(xiàn)有工作存在的不足,希望能夠為使用學(xué)習(xí)數(shù)據(jù)進行成績預(yù)測方面的研究構(gòu)建一個較為完整的全景圖。在后續(xù)的研究中,可以進一步深入挖掘?qū)W習(xí)過程中產(chǎn)生的各類對成績預(yù)測有效的數(shù)據(jù)特征,為構(gòu)建更加準(zhǔn)確的成績預(yù)測模型奠定基礎(chǔ)。

        猜你喜歡
        預(yù)測特征算法
        無可預(yù)測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測卷(A卷)
        選修2-2期中考試預(yù)測卷(B卷)
        如何表達(dá)“特征”
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        不忠誠的四個特征
        進位加法的兩種算法
        抓住特征巧觀察
        不必預(yù)測未來,只需把握現(xiàn)在
        亚洲av无码国产精品色软件| 亚洲欧洲日产国码无码av野外| 国产精品三级国产精品高| 日本免费一区二区三区影院 | 欧美私人情侣网站| 这里只有久久精品| 人妻少妇精品视频一区二区三区| 国产女优一区在线观看| 国产伦人人人人人人性| 久久精品国产一区二区电影| 中文字幕亚洲区第一页| 国产精品国产三级国产剧情 | 手机在线观看av资源| 在线精品无码字幕无码av| 欧美人与物videos另类xxxxx| 亚洲双色视频在线观看| 国产性感丝袜在线观看| 国产精品乱码一区二区三区| 中日韩欧美在线观看| 日本不卡一区二区三区在线| 蜜桃视频在线免费观看| 国产黄在线观看免费观看不卡 | 国产chinese男男gay视频网| mm在线精品视频| 国产麻豆剧传媒精品国产av| 内射人妻视频国内| 亚洲天堂在线视频播放| 国产一区二区高清不卡在线| 精品亚洲国产成人av色哟哟| 亚洲人成电影在线观看天堂色| 日韩在线视精品在亚洲| 在线播放免费播放av片| 综合网在线视频| 91桃色在线播放国产| 2018天天躁夜夜躁狠狠躁| 无码一区二区三区老色鬼| 国产无遮挡又黄又爽无VIP| 美女扒开腿露内裤免费看| 亚洲人成人网站在线观看| 无夜精品久久久久久| 国产伦理一区二区久久精品|