亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學(xué)習(xí)的學(xué)生學(xué)情預(yù)警方法研究

        2023-11-22 06:03:25曹夢川歐陽儀伍丹杜朋軒
        現(xiàn)代信息科技 2023年19期
        關(guān)鍵詞:機器學(xué)習(xí)

        曹夢川 歐陽儀 伍丹 杜朋軒

        摘? 要:對學(xué)生的學(xué)習(xí)成績進行預(yù)測分析,提前預(yù)警學(xué)生可能存在的掛科或成績下降風(fēng)險,從而幫助學(xué)生和教師更好地制定學(xué)習(xí)計劃和提高教學(xué)效率。采集了包括學(xué)生的平時成績、考勤、性別和期末成績等多種因素的數(shù)據(jù),使用線性回歸模型進行數(shù)據(jù)建模和預(yù)測分析。研究結(jié)果表明,該模型預(yù)測誤差小,具有實際應(yīng)用價值。研究成果可為學(xué)生和教師提供有益的參考,以便更好地實現(xiàn)教育教學(xué)目標(biāo)。

        關(guān)鍵詞:機器學(xué)習(xí);數(shù)據(jù)建模;預(yù)測分析;線性回歸

        中圖分類號:TP181;TP39? 文獻標(biāo)識碼:A? 文章編號:2096-4706(2023)19-0142-04

        Research on Student Learning Situation Early Warning Method Based on Machine Learning

        CAO Mengchuan, OU Yangyi, WU Dan, DU Pengxuan

        (Ningxia Polytechnic, Ningxia? 750021, China)

        Abstract: This research focuses on predicting and analyzing students' academic performance, gives an early warning of possible risk of failing or declining grades in advance, and helps students and teachers better plan their studies and improve teaching efficiency. The research collects data on various factors including students' regular grades, attendance, gender, and final grades, and uses linear regression models for data modeling and prediction analysis. The results show that the model has small prediction errors and practical application value. The results of this research can provide useful references for students and teachers to better achieve educational and teaching goals.

        Keywords: Machine Learning; data modeling; prediction analysis; linear regression

        0? 引? 言

        學(xué)生成績是評價學(xué)生學(xué)習(xí)成果的重要指標(biāo)之一。然而,現(xiàn)今本科、大專的教育模式與高中、初中的截然不同,因每學(xué)期代課的班級、院系、年級不同,教師很難及時關(guān)注所有學(xué)生的學(xué)習(xí)情況。當(dāng)學(xué)生在學(xué)習(xí)過程中出現(xiàn)學(xué)習(xí)狀態(tài)下滑、成績掉落、有期末掛科風(fēng)險等情況,教師無法及時幫助學(xué)生調(diào)整學(xué)習(xí)狀態(tài),學(xué)生也會因此產(chǎn)生消極的學(xué)習(xí)態(tài)度。因此,如何對學(xué)生學(xué)習(xí)情況進行監(jiān)控預(yù)警,及時發(fā)現(xiàn)學(xué)生在學(xué)習(xí)過程中的問題并提供對應(yīng)的幫助,是教育工作者和家長們一直關(guān)注的問題。在這樣的背景下,本文提出了一種使用機器學(xué)習(xí)對學(xué)生平時成績進行數(shù)據(jù)建模以預(yù)警學(xué)生學(xué)習(xí)情況的方法。

        1? 實現(xiàn)方法

        本次研究采用Python為主要開發(fā)語言,Python擁有眾多可用于數(shù)據(jù)科學(xué)、人工智能、機器學(xué)習(xí)等領(lǐng)域的開發(fā)庫,可以幫助開發(fā)者更加高效地編寫和構(gòu)建程序,大幅簡化代碼編寫,將重心更多地放在科研中。開發(fā)工具采用Jupyter Notebook;使用Pandas開發(fā)庫進行數(shù)據(jù)前期數(shù)據(jù)清洗、特征處理;采用的機器學(xué)習(xí)算法、二值化、特征縮放、模型構(gòu)建、模型評分、數(shù)據(jù)集劃分等方法來自scikit-learn開發(fā)庫。

        1.1? 流程設(shè)計

        圖1為學(xué)生平時成績預(yù)測模型的實現(xiàn)流程圖。

        1.2? 原始數(shù)據(jù)集建立

        本文以寧夏職業(yè)技術(shù)學(xué)院軟件學(xué)院2021級100位學(xué)生在2021—2022年第二學(xué)期所學(xué)“數(shù)據(jù)分析與應(yīng)用”課程的歷史數(shù)據(jù)作為原始數(shù)據(jù),采集特征包括學(xué)生的姓名、學(xué)號、性別、年級、期中成績、平時成績、考勤、期末成績、課堂作業(yè)成績。

        1.3? 特征工程

        特征工程是對學(xué)生學(xué)情預(yù)警數(shù)據(jù)建模的第二步,也是最重要的一步,它是指對原始數(shù)據(jù)進行特征提取、特征轉(zhuǎn)換和特征選擇等操作,以獲得對建模有用的特征(圖2)。特征工程是建立學(xué)生學(xué)習(xí)成績模型的關(guān)鍵環(huán)節(jié),直接影響模型的準(zhǔn)確性和實用性。將經(jīng)過特征工程處理后的數(shù)據(jù)集劃分為訓(xùn)練集和測試集,其中訓(xùn)練集占80%,測試集占20%,便于后續(xù)的測試與驗證。

        1.3.1? 數(shù)據(jù)清洗

        數(shù)據(jù)清洗是指在對原始數(shù)據(jù)進行處理之前,對數(shù)據(jù)進行檢查、修改和刪除,以確保數(shù)據(jù)質(zhì)量和準(zhǔn)確性的過程。在本次研究中,首先要檢查學(xué)生信息是否存在缺失值和異常值,如果存在缺失值,需要采用合適的方式對數(shù)據(jù)進行處理,例如當(dāng)該學(xué)生的成績出現(xiàn)了空缺值,可采用該名學(xué)生的平均值填充;如果存在異常值,則刪除該數(shù)據(jù)。

        1.3.2? 特征提取

        特征提取是機器學(xué)習(xí)中的一個重要步驟,其目的是將原始數(shù)據(jù)轉(zhuǎn)換為更具有代表性的特征。在機器學(xué)習(xí)中,特征是指用于描述數(shù)據(jù)的屬性或特性。良好的特征提取可以幫助機器學(xué)習(xí)算法更準(zhǔn)確地建立模型,提高預(yù)測和分類的準(zhǔn)確性。本次實驗所收集到的學(xué)生數(shù)據(jù)特征不是全部都可用于訓(xùn)練模型,需要從學(xué)生數(shù)據(jù)中提取有用的特征,將無用特征刪除。實驗進行了以下的特征提?。?/p>

        刪除無用特征:在本次研究中,學(xué)生的姓名、學(xué)號、年級對于成績預(yù)警來說沒有任何幫助,需要將其刪除。刪除后特征如表1所示。

        合并特征:將每個學(xué)生的平時成績和課堂作業(yè)成績特征合并為一個平時成績特征,合并比例為平時成績占比60%,課堂作業(yè)成績占比40%;將期中成績和期末成績特征合并成為期末成績特征,合并比例為期中成績占比40%,期末成績占比60%。合并后將原始成績特征刪除。合并后如表2所示。

        1.3.3? 特征編碼

        特征編碼是將數(shù)據(jù)集中的特征轉(zhuǎn)換為機器學(xué)習(xí)算法可以理解和處理的形式的過程。在機器學(xué)習(xí)中,算法只能處理數(shù)字化的特征,因此需要將非數(shù)字化的特征轉(zhuǎn)換為數(shù)字化的形式。特征編碼的作用是將非數(shù)字化的特征轉(zhuǎn)換為數(shù)字化的形式,以便機器學(xué)習(xí)算法可以對其進行處理和分析,提高模型的準(zhǔn)確性和效率,從而提高模型的預(yù)測能力。由于學(xué)生的性別特征無法直接被用于模型訓(xùn)練,所以需要將特征二值化,男轉(zhuǎn)換為1,女轉(zhuǎn)換為0。本次研究采用Scikit-learn庫中的Binarizer類對數(shù)據(jù)進行二值化。

        1.3.4? 特征縮放

        特征縮放是指將不同特征的取值范圍縮放到相同的區(qū)間內(nèi),常見的縮放方式包括標(biāo)準(zhǔn)化和歸一化。特征縮放提高了模型訓(xùn)練的速度和精度,避免異常值對模型的影響,使模型更容易理解。在本次實驗中各項數(shù)據(jù)之間的差距較大,需要對數(shù)據(jù)進行特征縮放,以保證數(shù)據(jù)具有可比性。經(jīng)過多次實驗表明,對特征使用標(biāo)準(zhǔn)化縮放所達到的模型效果更適用于本次的研究。

        1.3.5? 數(shù)據(jù)集劃分

        由于在模型構(gòu)建的過程中需要不斷地檢驗?zāi)P偷臏?zhǔn)確率、檢驗?zāi)P偷呐渲眉坝?xùn)練程度、過擬合還是欠擬合等,所以需要將訓(xùn)練數(shù)據(jù)再劃分為兩個部分,一部分用于訓(xùn)練的訓(xùn)練集,另一部分是進行檢驗的驗證集。驗證集可以重復(fù)使用,主要用于輔助構(gòu)建模型,調(diào)整模型。在本次實驗中,將處理后的數(shù)據(jù)以8:2的比例劃分訓(xùn)練集和測試集。

        1.4? 模型選擇和構(gòu)建

        模型選擇和構(gòu)建是建模的核心環(huán)節(jié),該環(huán)節(jié)的主要任務(wù)是選擇適合學(xué)生數(shù)據(jù)建模的機器學(xué)習(xí)模型,不同的模型有不同的假設(shè)和約束條件,可以適用于不同的問題和數(shù)據(jù)集。選擇一個合適的模型可以提高預(yù)測的準(zhǔn)確性和泛化能力,避免過擬合或欠擬合的問題。因此在模型選擇和構(gòu)建過程中,需要考慮模型的準(zhǔn)確性、可解釋性、泛化能力等因素。

        在學(xué)生平時成績數(shù)據(jù)建模中,常用的機器學(xué)習(xí)模型包括線性回歸模型、決策樹模型、支持向量機模型和神經(jīng)網(wǎng)絡(luò)模型等。本次研究采用線性回歸模型,下面是模型選擇和構(gòu)建的具體步驟。

        1.4.1? 模型選擇

        線性回歸是一種用于建立變量之間線性關(guān)系的模型,該模型假設(shè)自變量與因變量之間存在線性關(guān)系,即自變量的每一個單位變化都會導(dǎo)致因變量發(fā)生相同的單位變化,同時它的系數(shù)具有可解釋性,可以通過系數(shù)的大小和符號來解釋不同自變量對因變量的影響程度和方向。在學(xué)生成績預(yù)警建模中,因為學(xué)生平時各項學(xué)習(xí)指標(biāo)會影響學(xué)生的期末成績,所以可以使用線性回歸模型來預(yù)測學(xué)生的學(xué)情。線性回歸模型的公式如下:

        y = β0 + β1 x1 + β2 x2 + … + βn xn

        其中,y為因變量,x1、x2、xn為自變量,β0、β2、βn為模型的參數(shù)。

        在本次研究中,模型的線性回歸公式為:

        y = θ0 + θ1 x1 + θ2 x2 + θ3 x3

        其中,x1為平時成績,x2為考勤,x3為性別(0或1),θ0、θ1、θ2、θ3為模型參數(shù),y為期末成績。

        1.4.2? 模型的構(gòu)建

        模型的構(gòu)建分為三個步驟:模型擬合、模型評估和模型應(yīng)用。其中模型擬合的本質(zhì)是求解上述公式的參數(shù)θ0、θ1、θ2、θ3,使用最小二乘法計算預(yù)測值與真實值的平方差,即可求解模型的參數(shù),公式如下:

        其中,yi為真實值, 為預(yù)測值。將模型代入上式,得到:

        將上式關(guān)于模型參數(shù)求導(dǎo),得到模型參數(shù)的最優(yōu)解:

        其中, 為模型參數(shù)的最優(yōu)解,x為數(shù)據(jù)集的自變量(考勤、性別、平時成績),y為數(shù)據(jù)集的因變量(期末成績)。將? 帶入公式內(nèi),即可實現(xiàn)模型擬合。

        在模型擬合之后,需要對模型進行評估,以確定模型的準(zhǔn)確性和泛化能力。為了保證實驗的嚴(yán)謹(jǐn),本次研究選擇了選擇3種評估方式對模型進行評估,包括均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)和決定系數(shù)(Coefficient of Determination, R2)。

        均方誤差(MSE)是評估線性回歸模型預(yù)測效果的常用指標(biāo)。它計算的是預(yù)測值與真實值之間差的平方的平均值。其公式如下:

        其中,yi為第i個樣本的真實值, 為該樣本的預(yù)測值,m為樣本數(shù)。

        均方根誤差(RMSE)是MSE的平方根,它更直觀地反映了預(yù)測值與真實值之間的差距。其公式如下:

        決定系數(shù)(R2)是評估線性回歸模型擬合優(yōu)度的指標(biāo),它表示模型能夠解釋樣本數(shù)據(jù)變異性的比例。其取值范圍在0到1之間,越接近1表示模型的擬合效果越好。R2的公式如下:

        其中, 為所有樣本數(shù)據(jù)的平均值。

        表3是采用MSE、RMSE、R2三種評估方式的結(jié)果。

        從表中可以看出,該線性回歸模型在測試集上的MSE為8.48,RMSE為2.91,R2為0.87,說明該模型具有較高的預(yù)測準(zhǔn)確性,可以滿足實驗的初步要求。

        在模型評估之后,即模型應(yīng)用階段,可將學(xué)生平時成績信息帶入模型,模型將預(yù)測學(xué)生的成績通過接口傳入預(yù)警方法中。預(yù)警方法通過對預(yù)測成績進行分級,60以下為紅色預(yù)警,70~79為黃色預(yù)警,80~100為綠色預(yù)警,當(dāng)學(xué)生預(yù)測成績處于黃色和紅色預(yù)警階段,證明該名學(xué)生有成績下降和掛科的風(fēng)險。

        綜上所述,模型選擇和構(gòu)建是學(xué)生平時成績數(shù)據(jù)建模的關(guān)鍵環(huán)節(jié)。在選擇模型時,需要考慮模型的準(zhǔn)確性、可解釋性、泛化能力等因素,并根據(jù)實際需求選擇最合適的模型。在構(gòu)建模型時,需要進行模型擬合、模型評估和模型應(yīng)用等步驟,以獲得準(zhǔn)確、穩(wěn)定和可靠的預(yù)測結(jié)果。

        2? 結(jié)果驗證分析

        本次結(jié)果驗證使用2022級人工智能技術(shù)與應(yīng)用班級28位同學(xué)在2022—2023學(xué)年第一學(xué)期“數(shù)據(jù)分析”課程數(shù)據(jù)進行結(jié)果驗證,并使用預(yù)測結(jié)果和真實結(jié)果進行對比,以下是其中5位學(xué)生的預(yù)測成績和實際成績的數(shù)據(jù)對比,結(jié)果如表4所示。

        由表4可得出,學(xué)生的期末成績預(yù)測值與實際期末成績進行對比,預(yù)測的成績與實際的成績之間的誤差較小,預(yù)測值可有效地反映學(xué)生在學(xué)習(xí)過程中的成績情況,說明該模型具有實際的應(yīng)用價值,可以為學(xué)生和老師提供有效的成績預(yù)警。通過分析該模型參數(shù)的權(quán)重,發(fā)現(xiàn)學(xué)生的平時成績對于預(yù)測模型的影響最大,考勤和性別的影響相對較小。這也說明了學(xué)生的平時成績是影響學(xué)生成績的重要因素,需要在教學(xué)中重點關(guān)注和提升。

        3? 結(jié)? 論

        通過上述實驗可以看出,基于線性回歸算法構(gòu)建的學(xué)生平時成績預(yù)測模型的預(yù)測準(zhǔn)確率是可以初步滿足學(xué)生學(xué)情預(yù)警的。雖然預(yù)測結(jié)果存在一定的誤差,但整體上預(yù)測結(jié)果與實際成績的差距較小。在實際應(yīng)用中,可以使用該模型來進行學(xué)生的成績預(yù)警,及時發(fā)現(xiàn)學(xué)生的學(xué)情問題,提供個性化的學(xué)習(xí)建議,及時調(diào)整學(xué)習(xí)態(tài)度,在一定程度上改善學(xué)習(xí)狀態(tài),從而實現(xiàn)對學(xué)生學(xué)情的監(jiān)測和預(yù)警。未來,可以進一步改進模型,采用更加復(fù)雜的機器學(xué)習(xí)算法,如決策樹、隨機森林等,以提高預(yù)測的準(zhǔn)確性。

        參考文獻:

        [1] 王琪,靳瑩.中等教育學(xué)段學(xué)情分析研究述評 [J].教育理論與實踐,2023,43(2):54-57.

        [2] 魏超.機器學(xué)習(xí)算法在大學(xué)生綜合素質(zhì)測評預(yù)警中的對比研究 [J].電腦編程技巧與維護,2022(12):127-129.

        [3] 崔爭艷,劉晨晨,孫濱.基于機器學(xué)習(xí)的MOOC學(xué)習(xí)者棄學(xué)預(yù)測與預(yù)警系統(tǒng)實現(xiàn) [J].信息與電腦:理論版,2022,34(1):65-67.

        [4] 徐彩鳳.依托TPACK理論,推進統(tǒng)計信息化教學(xué)——以“一元線性回歸模型的應(yīng)用”為例 [J].中學(xué)數(shù)學(xué)月刊,2023(3):48-50+63.

        [5] 李治軍,姚蓉.基于主成分分析和多元線性回歸的黑龍江省用水效率研究 [J].水利科技與經(jīng)濟,2023,29(2):60-64.

        [6] 李非.案例分析在統(tǒng)計多元線性回歸預(yù)測模型教學(xué)中的應(yīng)用研究 [J].現(xiàn)代職業(yè)教育,2019(8):86-87.

        [7] 劉學(xué)彥,趙建立,相文楠,等.擬線性回歸預(yù)測模型的穩(wěn)定最小二乘解 [J].數(shù)學(xué)的實踐與認(rèn)識,2011,41(20):92-97.

        作者簡介:曹夢川(1990—),男,漢族,寧夏銀川人,助教,碩士,研究方向:數(shù)據(jù)分析、人工智能。

        收稿日期:2023-04-09

        基金項目:2022年度職業(yè)教育研究和開放教育綜合改革研究專項課題(XJ202207);2020年寧夏回族自治區(qū)科學(xué)技術(shù)學(xué)會第五批自治區(qū)青年科技人才托舉工程

        猜你喜歡
        機器學(xué)習(xí)
        基于詞典與機器學(xué)習(xí)的中文微博情感分析
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
        活力(2016年8期)2016-11-12 17:30:08
        基于支持向量機的金融數(shù)據(jù)分析研究
        基于Spark的大數(shù)據(jù)計算模型
        基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
        基于圖的半監(jiān)督學(xué)習(xí)方法綜述
        機器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        極限學(xué)習(xí)機在圖像分割中的應(yīng)用
        亚洲狼人社区av在线观看| 五月综合激情婷婷六月| 亚洲春色在线视频| 在线看片无码永久免费aⅴ| 国产美女被遭强高潮露开双腿| 精品熟女av中文字幕| 国产精品久久国产精品99 gif| 国产成人av性色在线影院色戒| 国产一级三级三级在线视| 国产国语一级免费黄片| 亚洲一区二区三区中国| 俺去俺来也在线www色官网| 日韩一区二区肥| 国产精品高清一区二区三区人妖 | 日本一级三级在线观看| 人妻熟妇乱又伦精品hd| 99精品国产高清一区二区麻豆| 亚洲国产精品午夜电影| 日韩人妻美乳中文字幕在线| 久久精品夜色噜噜亚洲a∨| 成人妇女免费播放久久久| 国产精品综合久久久久久久免费| 少妇呻吟一区二区三区| 国产玉足榨精视频在线观看| 国产激情精品一区二区三区| 色婷婷亚洲精品综合影院| 亚洲天堂99| 亚洲乱码中文字幕综合69堂| 日韩中文字幕在线观看一区| 看黄a大片日本真人视频直播| 久久久久久久久久久熟女AV | 中文字幕一区乱码在线观看| 白丝爆浆18禁一区二区三区| 国产精品揄拍100视频| 国产三级黄色的在线观看| 国产亚洲精品色婷婷97久久久| 国产成人精品123区免费视频| 亚洲两性视频一三区| 91国产熟女自拍视频| 中文无码伦av中文字幕| 亚洲乱码视频在线观看|