亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績分析中的應(yīng)用

        2023-10-24 10:45:48展金梅陳君濤田飛
        科技資訊 2023年19期
        關(guān)鍵詞:數(shù)據(jù)挖掘學(xué)生

        展金梅 陳君濤 田飛

        (1.瓊臺師范學(xué)院; 2.海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院 海南 ???571127)

        數(shù)據(jù)挖掘是一種可以從大量數(shù)據(jù)中自動獲取知識的技術(shù),利用該技術(shù)對學(xué)生的成績進(jìn)行分析,數(shù)據(jù)挖掘可以幫助教育工作者更全面、深入地了解學(xué)生的學(xué)習(xí)情況和學(xué)習(xí)習(xí)慣,為教學(xué)提供更加有效的支持,促進(jìn)學(xué)生的成長和發(fā)展。首先,數(shù)據(jù)挖掘可以用來分析學(xué)生的學(xué)科成績和各類影響因素之間的相關(guān)性。例如:通過分析學(xué)生的學(xué)科選擇、學(xué)習(xí)行為、考試習(xí)慣、家庭背景等方面的因素,可以找出影響學(xué)科成績的關(guān)鍵因素,進(jìn)而幫助教育工作者發(fā)現(xiàn)學(xué)生的學(xué)習(xí)強(qiáng)項(xiàng)和學(xué)習(xí)弱項(xiàng),制定更有針對性的教學(xué)策略。其次,數(shù)據(jù)挖掘可以用來挖掘?qū)W生學(xué)習(xí)行為和習(xí)慣方面的信息。例如:通過分析學(xué)生在學(xué)習(xí)時(shí)間、學(xué)習(xí)方式、學(xué)習(xí)效率等方面的數(shù)據(jù),可以發(fā)現(xiàn)學(xué)生的學(xué)習(xí)傾向和學(xué)習(xí)偏好,進(jìn)而為教育工作者提供更好的教學(xué)方法和指導(dǎo)建議。數(shù)據(jù)挖掘作為一種發(fā)掘隱藏有價(jià)值信息的獲取手段,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育管理,可以有效地提高學(xué)校的教育水平和教學(xué)質(zhì)量。

        1 國內(nèi)外研究現(xiàn)狀

        數(shù)據(jù)挖掘技術(shù)起源于1989年,它是數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge Discovery in Databases,KDD)中的一個(gè)步驟。數(shù)據(jù)挖掘一般是指通過某些算法去發(fā)掘隱藏于大量數(shù)據(jù)中的有價(jià)值信息的過程。數(shù)據(jù)挖掘是一個(gè)多學(xué)科交叉的科學(xué)研究領(lǐng)域,其以計(jì)算機(jī)科學(xué)為基礎(chǔ),通過數(shù)理統(tǒng)計(jì)、數(shù)據(jù)分析、數(shù)據(jù)庫技術(shù)、機(jī)器學(xué)習(xí)和模式識別等方法,實(shí)現(xiàn)挖掘隱藏信息的目標(biāo)。

        近年來,國內(nèi)學(xué)者也進(jìn)行了許多教育數(shù)據(jù)挖掘的相關(guān)研究,如張華等人[1]、婁德涵[2]通過分析學(xué)生在學(xué)習(xí)生活中產(chǎn)生的行為數(shù)據(jù),構(gòu)建數(shù)據(jù)挖掘模型,分析研究學(xué)生的勤奮性、學(xué)習(xí)生活規(guī)律性和學(xué)習(xí)成績之間的相關(guān)程度,相較于其他算法,此算法可以更準(zhǔn)確地預(yù)測學(xué)生的學(xué)業(yè)表現(xiàn)。劉曉雲(yún)等人[3]使用決策樹、邏輯回歸和關(guān)聯(lián)規(guī)則3 種數(shù)據(jù)挖掘方法,對學(xué)生上網(wǎng)行為的屬性(上網(wǎng)時(shí)長、上網(wǎng)次數(shù)、網(wǎng)絡(luò)流量等)和學(xué)習(xí)成績之間的關(guān)系進(jìn)行了研究,研究發(fā)現(xiàn)這些屬性和學(xué)習(xí)成績均為負(fù)相關(guān),其中上網(wǎng)時(shí)長影響最大。劉大蓮等人[4]、李鳳英等人[5]、胡祖輝等人[6]使用學(xué)生的學(xué)習(xí)成績、個(gè)人基本信息等數(shù)據(jù),按照一定規(guī)則生成能力指標(biāo)數(shù)據(jù),根據(jù)學(xué)生在校行為信息和能力指標(biāo)使用數(shù)據(jù)挖掘技術(shù)對學(xué)生畢業(yè)去向進(jìn)行分析和預(yù)測,研究發(fā)現(xiàn)學(xué)生能力指標(biāo)對畢業(yè)去向影響最大,性別影響最小。單耀等人[7]、金玉[8]、張建萍等人[9]使用K-Means++算法對學(xué)生在校期間的學(xué)習(xí)行為和學(xué)習(xí)成績之間的關(guān)聯(lián)性進(jìn)行了相應(yīng)的研究,挖掘?qū)W生各種學(xué)習(xí)行為與學(xué)習(xí)成績之間的相關(guān)性。

        國內(nèi)外學(xué)者對數(shù)據(jù)挖掘技術(shù)與應(yīng)用進(jìn)行了眾多研究,也取得了大量成果。研究中使用較為廣泛的算法分別為K-Means算法、Apriori算法、決策樹算法和神經(jīng)網(wǎng)絡(luò)算法等。本文主要使用K-Means++聚類算法,對學(xué)生的各科學(xué)習(xí)成績進(jìn)行挖掘分析,通過挖掘出的信息,對學(xué)生進(jìn)行分類,幫助學(xué)校有針對性地對學(xué)生進(jìn)行教學(xué)。

        2 K-Means++算法

        在數(shù)據(jù)挖掘領(lǐng)域,K-means 是一個(gè)非常有效且高頻率使用的聚類算法,但是K-means 也有很大的局限性.首先,初始類的中心點(diǎn)對聚類效果有直接影響,聚類的準(zhǔn)確性十分依賴初始中心點(diǎn)的選擇;其次,算法的聚類結(jié)果非常容易陷入局部最優(yōu),重新隨機(jī)分配聚類中心點(diǎn)后,聚類的效果可能會更好;最后,該算法對數(shù)據(jù)的孤立點(diǎn)比較敏感,游離于正常數(shù)據(jù)之外的異常點(diǎn)會對聚類效果產(chǎn)生一定的影響。為了解決K-means算法的局限性,研究學(xué)者依據(jù)類間距離最大、類內(nèi)距離最小的原則、保證各個(gè)聚類中心點(diǎn)盡可能遠(yuǎn)的條件下,提出了K-Means++算法。

        K-Means算法的局限性主要來源于初始中心點(diǎn)的選擇,其所有初始中心點(diǎn)均為隨機(jī)選擇。K-Means++算法是在K-Means 算法的基礎(chǔ)上,對初始中心點(diǎn)的選擇進(jìn)行了優(yōu)化和改進(jìn)。由隨機(jī)選擇所有初始中心點(diǎn)改進(jìn)為隨機(jī)選擇一個(gè)初始中心點(diǎn),其余初始中心點(diǎn)的選擇關(guān)鍵點(diǎn)是:通過計(jì)算每個(gè)數(shù)據(jù)點(diǎn)被選擇為初始中心點(diǎn)的加權(quán)概率,計(jì)算得到的概率越大,被選擇的可能性也就越大。對于每一個(gè)數(shù)據(jù)點(diǎn)xi被選擇概率Pi的計(jì)算方法如式(1)和式(2)所示。

        式(1)、式(2)中:D(xi)為數(shù)據(jù)點(diǎn)xi與當(dāng)前所有初始中心點(diǎn)中最近的一個(gè)中心點(diǎn)的歐氏距離;ui為第j個(gè)初始中心點(diǎn);n為當(dāng)前已生成初始中心點(diǎn)的數(shù)目;m為所有數(shù)據(jù)點(diǎn)的數(shù)目。選擇下一個(gè)初始中心點(diǎn)時(shí),重新計(jì)算每個(gè)數(shù)據(jù)點(diǎn)被選擇的概率,直到完成選擇所有初始中心點(diǎn)。

        完成聚類中心點(diǎn)初始化之后,計(jì)算數(shù)據(jù)點(diǎn)與各個(gè)聚類中心之間的歐氏距離,根據(jù)距離將數(shù)據(jù)點(diǎn)劃分到最近的那一個(gè)簇。之后,根據(jù)每個(gè)簇中所有樣本的均值,重新計(jì)算聚類中心點(diǎn),計(jì)算方法如式(3)所示。

        式(3)中,ci為第i個(gè)聚類中心點(diǎn)。重新計(jì)算并更新聚類中心點(diǎn)之后,繼續(xù)重復(fù)數(shù)據(jù)點(diǎn)劃分和聚類中心點(diǎn)更新這兩個(gè)步驟,直到聚類中心點(diǎn)不再更新,或者達(dá)到預(yù)設(shè)的迭代次數(shù)。至此,完成對所有數(shù)據(jù)點(diǎn)的歸類。

        3 學(xué)生成績數(shù)據(jù)挖掘的設(shè)計(jì)與實(shí)現(xiàn)

        學(xué)生在校期間各科考試成績對學(xué)校來說是非常重要的教育類數(shù)據(jù),然而,目前考試成績僅僅作為學(xué)科考核通過與否的指標(biāo)的方法遠(yuǎn)遠(yuǎn)沒有發(fā)揮出其價(jià)值,許多隱藏在其下的信息并未挖掘出來。如果能夠從考試成績挖掘出學(xué)生的成績特點(diǎn)等信息,可以有針對性地對學(xué)生進(jìn)行教學(xué)指導(dǎo)。為此,本文設(shè)計(jì)了一套基于數(shù)據(jù)挖掘的學(xué)生成績分析模型。該模型主要分為3個(gè)模塊:數(shù)據(jù)預(yù)處理、K-Means++聚類、聚類結(jié)果分析。系統(tǒng)模型詳見圖1。

        圖1 數(shù)據(jù)挖掘模型

        3.1 數(shù)據(jù)預(yù)處理

        進(jìn)行考試成績數(shù)據(jù)預(yù)處理的目的,一方面是為了保證數(shù)據(jù)的有效性和準(zhǔn)確性,另一方面是因?yàn)镵Means++聚類算法對異常或者孤立數(shù)據(jù)比較敏感,如某學(xué)科某考生缺考,這種情況就會影響聚類效果。

        數(shù)據(jù)預(yù)處理可分為以下3個(gè)部分:數(shù)據(jù)選擇、數(shù)據(jù)清洗和數(shù)據(jù)變換。

        數(shù)據(jù)選擇主要是去除與成績無關(guān)的數(shù)據(jù),如學(xué)號、姓名、班級等信息,僅僅保留各科成績作為聚類模型的擬合數(shù)據(jù)。本文通過篩選關(guān)鍵字段的方法,將學(xué)生各科成績從數(shù)據(jù)庫中抽取出來進(jìn)行字段篩選。

        數(shù)據(jù)清洗是為了刪除重復(fù)數(shù)據(jù)和修復(fù)異常數(shù)據(jù),主要通過計(jì)算機(jī)完成。由于錄入成績的時(shí)候可能會出現(xiàn)錯誤錄入的情況,對于考生成績?nèi)笔闆r的數(shù)據(jù)處理,使用估算填充的方法,通過該考生其他目成績與班級所有同學(xué)成績之間的差異進(jìn)行分析或邏輯推理進(jìn)行估算,得出填充值。如據(jù)缺考學(xué)生的其他科目成績在班級排名,估計(jì)出缺考科目的成績。

        數(shù)據(jù)變換可以視為數(shù)據(jù)歸一化處理,保證所有數(shù)據(jù)擁有相同的度量單位,如大部分學(xué)科考試滿分成績?yōu)橐话俜?,而某些考試卻不是百分制,又或者某些老師評分過于嚴(yán)格或?qū)捤?,這些情況都會對聚類產(chǎn)生一定的影響。數(shù)據(jù)歸一化就是將全班的成績映射到[0,1]的區(qū)間內(nèi),如式(4)所示。

        式(4)中:X為由全班學(xué)生的該科目成績xi組成的集合;Xmin和Xmax分別為全班成績的最低分和最高分;yi為歸一化后的成績。數(shù)據(jù)預(yù)處理前后的各科目成績?nèi)绫?和表2所示。

        表1 預(yù)處理前的各科目成績 (單位:分)

        表2 預(yù)處理后的各科目成績 (單位:分)

        3.2 成績聚類

        本文使用K-Means++算法進(jìn)行聚類,在進(jìn)行聚類前,首先要確定類或簇的數(shù)目k,如果k設(shè)定的太小,則不能有效地將數(shù)據(jù)分開,當(dāng)k=1時(shí),表示未進(jìn)行聚類,后者說將所有數(shù)據(jù)聚為一類。如果k值設(shè)定的過大,則會出現(xiàn)個(gè)別類的數(shù)據(jù)點(diǎn)太少的情況,當(dāng)k=m時(shí),m為數(shù)據(jù)點(diǎn)的個(gè)數(shù),也可以表示未進(jìn)行聚類,或者說每一個(gè)數(shù)據(jù)點(diǎn)都是一類。

        由于K-Means++算法復(fù)雜度與k值的大小呈正相關(guān),所以在可以進(jìn)行有效分類的情況下,k越小越好。本文使用類內(nèi)均方誤差作為評定聚類效果的指標(biāo),將清洗后的學(xué)生成績數(shù)據(jù)作為輸入數(shù)據(jù),k值分別設(shè)為2~7,類內(nèi)均方誤差隨k值的變化曲線如圖2所示。

        圖2 類內(nèi)均方誤差隨k變化曲線圖

        從圖2中可以看出,當(dāng)k≥5 之后,類內(nèi)均方誤差開始處于穩(wěn)定狀態(tài),所以將k設(shè)定為5比較合適。

        3.3 聚類結(jié)果分析

        使用K-Means++算法將學(xué)生成績分為5 類,每一類可以看作一個(gè)成績集群,該成績集群的學(xué)生有著相似的各科考試成績特點(diǎn)。第一類學(xué)生人數(shù)較多,占比約為46%,該類學(xué)生大部分科成績比較均衡,少量科目偏低,處于中游水平,需要對此類學(xué)生進(jìn)行全方位的加強(qiáng)教育;第二類學(xué)生占比約為12%,“程序設(shè)計(jì)與實(shí)踐”科目成績偏低,其他科目成績一般,此類學(xué)生需要著重學(xué)習(xí)“程序設(shè)計(jì)課程”科目,其他成績也需要一定的學(xué)習(xí);第三類占比約為17%,“操作系統(tǒng)實(shí)踐”科目成績較好,其他科目成績一般,需要加強(qiáng)其他科目的學(xué)習(xí);第四類占比約為13%,所有科目成績均偏低,此類學(xué)生需要在鼓勵學(xué)習(xí)的基礎(chǔ)上,給予一些照顧,讓其利用好業(yè)余閑暇時(shí)間補(bǔ)習(xí)功課;第五類占比約為12%,整體成績均處于中游偏上水平,該類學(xué)生可以進(jìn)行一些課外拓展實(shí)踐,能更好地利用學(xué)習(xí)到的知識,提升課外實(shí)踐動手能力。

        4 結(jié)語

        數(shù)據(jù)挖掘作為強(qiáng)有力的數(shù)據(jù)分析技術(shù),在多個(gè)領(lǐng)域已經(jīng)進(jìn)行了廣泛且的應(yīng)用,取得了令人滿意的效果。在教學(xué)教育與信息技術(shù)正在快速結(jié)合的趨勢下,數(shù)據(jù)挖掘技術(shù)擁有廣闊的應(yīng)用前景,教育數(shù)據(jù)也將得到更加充分的應(yīng)用。本文設(shè)計(jì)了一個(gè)基于數(shù)據(jù)挖掘的成績分析模型,能夠較好地根據(jù)學(xué)生的各科成績特點(diǎn),對學(xué)生成績進(jìn)行聚類分析,學(xué)??梢允褂镁垲惤Y(jié)果,有針對性地對每類學(xué)生使用不同的教學(xué)策略,提高學(xué)校的教學(xué)成效。

        猜你喜歡
        數(shù)據(jù)挖掘學(xué)生
        快把我哥帶走
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        《李學(xué)生》定檔8月28日
        電影(2018年9期)2018-11-14 06:57:21
        趕不走的學(xué)生
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        學(xué)生寫話
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        學(xué)生寫的話
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        日韩a无v码在线播放| 精品国产一区二区三区香蕉| 日本成熟妇人高潮aⅴ| 亚洲啪啪色婷婷一区二区| 欧美性猛交99久久久久99按摩| 嗯啊好爽高潮了在线观看| 欧美俄罗斯40老熟妇| 亚洲欧美另类激情综合区| 国内精品久久久久久久久齐齐| 国产91福利在线精品剧情尤物| 96精品免费视频大全| 射进去av一区二区三区| 国产成人午夜高潮毛片| 性色av无码一区二区三区人妻| 免费高清日本中文| 中文字幕日韩精品中文字幕| 久久99精品久久久久久清纯| 97se亚洲精品一区| 无码人妻精品一区二区三区下载| 国产一区二区三区色区| 天堂精品人妻一卡二卡| 青草久久婷婷亚洲精品| 久久成人影院精品777| 国产午夜福利不卡在线观看视频| 日韩人妻中文字幕一区二区| 亚洲一区二区日韩专区| 久久精品国产网红主播| 99热免费精品| 国产成人AⅤ| 在线免费观看毛视频亚洲精品| 蜜桃视频一区二区在线观看| 国产成人精品日本亚洲| 欧美日韩国产乱了伦| 国产精品自产拍在线18禁 | 在线观看日本一区二区三区四区 | 人妻无码一区二区三区免费| 日韩中文字幕欧美亚洲第一区| 青青草视频华人绿色在线| 一本色道加勒比精品一区二区| 狂野欧美性猛xxxx乱大交| 老熟妇乱子伦av|