亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的大學(xué)生學(xué)習(xí)預(yù)測(cè)研究

        2021-06-16 14:21:46苗育源
        電子技術(shù)與軟件工程 2021年5期
        關(guān)鍵詞:低分決策樹(shù)概率

        苗育源

        (山西農(nóng)業(yè)大學(xué) 山西省晉中市 030800)

        1 引言

        近年來(lái),國(guó)內(nèi)許多學(xué)者已成功地將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育領(lǐng)域上,如學(xué)校招生策略的制訂、學(xué)習(xí)障礙鑒定等研究。此外,以學(xué)生學(xué)業(yè)成就為分析目標(biāo)的相關(guān)研究,則有針對(duì)學(xué)生基本數(shù)據(jù)、學(xué)生缺曠課、家庭與學(xué)校環(huán)境的影響為主要分析方向,鮮少有針對(duì)學(xué)生個(gè)人的學(xué)習(xí)態(tài)度進(jìn)行分析。然而學(xué)習(xí)態(tài)度是學(xué)生在學(xué)習(xí)活動(dòng)的歷程中,指示學(xué)習(xí)行為的方向,因此若所持的評(píng)價(jià)為正面,則對(duì)于所學(xué)的課程將全力以赴。有鑒于此,本研究將運(yùn)用數(shù)據(jù)挖掘中的決策樹(shù)分類法,針對(duì)大學(xué)生的學(xué)習(xí)態(tài)度,建構(gòu)學(xué)習(xí)成績(jī)的分類模型,并找出預(yù)測(cè)低學(xué)習(xí)成績(jī)或成績(jī)低落的相關(guān)決策規(guī)則,以提供教師作為教學(xué)時(shí)的參考。

        2 研究方法

        本研究架構(gòu)是先從某科技大學(xué)校務(wù)信息系統(tǒng)的數(shù)據(jù)庫(kù)中,分別取得2020年度第二學(xué)期企業(yè)管理系一年級(jí)專業(yè)課程的教學(xué)評(píng)價(jià)問(wèn)卷數(shù)據(jù)以及學(xué)生學(xué)期成績(jī),以C4.5 決策樹(shù)算法開(kāi)始進(jìn)行數(shù)據(jù)挖掘工作,最后再將具有高準(zhǔn)確率的規(guī)則,提供給教師作為教學(xué)參考,希望借以提升學(xué)生的學(xué)習(xí)成績(jī)。

        2.1 數(shù)據(jù)收集與整理

        本文收集的一年級(jí)專業(yè)課程部分,分別為A 專業(yè)一年級(jí)、B 專業(yè)一年級(jí)、以及C 專業(yè)一年級(jí)的各五門課程,合計(jì)十五門課程。原始教學(xué)評(píng)價(jià)(含學(xué)生對(duì)教師評(píng)價(jià)與學(xué)生自我評(píng)價(jià)兩部分)與學(xué)生學(xué)期成績(jī)數(shù)據(jù)共有15022 筆,剔除非本研究分析的數(shù)據(jù)(如教師評(píng)價(jià)部分)以及數(shù)據(jù)不全的記錄,再經(jīng)過(guò)數(shù)據(jù)匯整后,進(jìn)入分析的數(shù)據(jù)合計(jì)為532 筆。每筆數(shù)據(jù)共有六個(gè)屬性,其中五個(gè)屬性是屬于學(xué)生自我評(píng)價(jià)部分(問(wèn)卷說(shuō)明詳如表1),另一個(gè)屬性則為學(xué)生學(xué)期成績(jī)。

        由于本研究主要是研究學(xué)生自我評(píng)價(jià)與學(xué)生成績(jī)之間的關(guān)聯(lián)性,因此成績(jī)屬性為本研究的類別標(biāo)記屬性,也就是輸出的分類結(jié)果。而有鑒于每一門課程的授課教師評(píng)定成績(jī)的標(biāo)準(zhǔn)不一,因此本研究在進(jìn)行決策樹(shù)分析之前,先將每門課程的學(xué)生學(xué)期成績(jī)(v)進(jìn)行分類處理,以平均值(mf)與標(biāo)準(zhǔn)差(sf)區(qū)分為H:高分群(v ≥mf+sf/2)、M:中分群(mf-sf≤v

        2.2 使用決策樹(shù)進(jìn)行分類

        本研究的所有實(shí)驗(yàn)皆通過(guò)Microsoft Excel2013 中的計(jì)算、排序與樞紐分析等功能來(lái)操作,并獲得所有分析結(jié)果。

        2.2.1 模式訓(xùn)練與驗(yàn)證

        本研究建立決策樹(shù)規(guī)則的方式,是采取兩階段方式進(jìn)行。第一階段先以A專業(yè)一年級(jí)的五門專業(yè)課程數(shù)據(jù)(課程代號(hào)分別為A、B、C、D、E、F),采五組交叉驗(yàn)證的方式建構(gòu)決策樹(shù),也就是分別取四門課程數(shù)據(jù)作為訓(xùn)練樣本(80%),再以剩下的另一門課程數(shù)據(jù)作為測(cè)試樣本(20%),以找出準(zhǔn)確率最高的決策樹(shù)。

        第二階段則是將準(zhǔn)確率最高的決策樹(shù)轉(zhuǎn)換成分類規(guī)則,結(jié)合B專業(yè)一年級(jí)與C 專業(yè)一年級(jí)的10 門專業(yè)課程數(shù)據(jù)進(jìn)行驗(yàn)證,找出預(yù)測(cè)率高于80%且準(zhǔn)確人數(shù)超過(guò)5 人的規(guī)則。

        表1:學(xué)生自我評(píng)價(jià)問(wèn)卷說(shuō)明

        2.2.2 以決策樹(shù)建立分類系統(tǒng)

        (1)建立樹(shù)狀結(jié)構(gòu)。本研究是以Quinaln(1993)所提出的C4.5 算法來(lái)建立決策樹(shù),此算法是由該學(xué)者修正自己之前發(fā)表的ID3(IterativeDichotomizer3)決策樹(shù)歸納算法而來(lái),其基本概念是計(jì)算出獲利比值(gainratio)最大的屬性,作為決策樹(shù)中每一節(jié)點(diǎn)的分支屬性,以形成一個(gè)子樹(shù),然后從剩下的屬性中,再次計(jì)算出獲利比值最大的屬性,以進(jìn)行下一節(jié)點(diǎn)的分割,如此重復(fù)操作,最后形成整棵決策樹(shù)。

        (2)修剪樹(shù)狀結(jié)構(gòu)。C4.5 算法中是以錯(cuò)誤預(yù)估率(predicted error rate)為修剪標(biāo)準(zhǔn),也就是當(dāng)被分類于某一子樹(shù)的所有訓(xùn)練數(shù)據(jù)個(gè)數(shù)為T,其中有E 個(gè)訓(xùn)練數(shù)據(jù)分類錯(cuò)誤,而錯(cuò)誤預(yù)估率就是由TE 來(lái)評(píng)估,當(dāng)錯(cuò)誤率高于某一個(gè)臨界值時(shí),就進(jìn)行修剪。

        由于本研究中可供分析的輸入變量?jī)H有五個(gè),并不會(huì)建構(gòu)過(guò)度復(fù)雜的決策樹(shù),因此于建構(gòu)決策樹(shù)過(guò)程中,僅使用當(dāng)訓(xùn)練數(shù)據(jù)個(gè)數(shù)與樹(shù)的節(jié)點(diǎn)數(shù)比值低于2 時(shí)的修剪方法,以避免節(jié)點(diǎn)再往下分支就會(huì)造成品質(zhì)測(cè)量值太低的問(wèn)題。此外,本研究為了觀察學(xué)生學(xué)習(xí)態(tài)度與學(xué)業(yè)成就之間的關(guān)系,在形成葉節(jié)點(diǎn)(leaf node)的方式,不采取以多數(shù)決投票的傳統(tǒng)方式進(jìn)行,也就是說(shuō),除了可以完全分類的葉節(jié)點(diǎn)外,其他則采用概率分配的方式進(jìn)行預(yù)測(cè)。

        3 結(jié)果

        經(jīng)由五組交叉驗(yàn)證所獲得的結(jié)果(如表2),決策樹(shù)在經(jīng)過(guò)修剪之后,由A、C、D、E(以下簡(jiǎn)稱ACDE)四門課程所獲得的決策樹(shù)規(guī)則其準(zhǔn)確率最高。為節(jié)省篇幅,以下僅針對(duì)該組的決策樹(shù)建構(gòu)過(guò)程簡(jiǎn)述如后。

        ACDE 四門課程數(shù)據(jù)經(jīng)過(guò)整理后,可供分析使用的記錄共有173 筆,其中計(jì)有60 人成績(jī)屬于H 類別、有72 人成績(jī)屬于M 類別、以及有41 人成績(jī)屬于L 類別,其他各種數(shù)據(jù)的分布情形整理于表3。而經(jīng)過(guò)完整計(jì)算所獲得的決策樹(shù)結(jié)果共有54 條規(guī)則,修剪后的決策樹(shù)后剩下48 條規(guī)則,同樣針對(duì)B 課程數(shù)據(jù)來(lái)進(jìn)行驗(yàn)證,驗(yàn)證結(jié)果顯示,該課程中符合驗(yàn)證規(guī)則進(jìn)行驗(yàn)證的人數(shù)維持為42 人,正確人數(shù)提升為27 人,準(zhǔn)確率達(dá)64.3%。

        表2:五組決策樹(shù)驗(yàn)證結(jié)果

        表3:ACDE 四門課程數(shù)據(jù)合并后的學(xué)生人數(shù)分布情形

        表4:預(yù)測(cè)率達(dá)80%并且正確人數(shù)達(dá)5 人的規(guī)則結(jié)果

        本研究第二階段以該決策樹(shù)所獲得的48 條規(guī)則,針對(duì)A 專業(yè)一年級(jí)的B 課程、B 專業(yè)一年級(jí)的五門課程、以及C 專業(yè)一年級(jí)的五門課程,合計(jì)11 門課程(共346 人)的數(shù)據(jù)進(jìn)行驗(yàn)證工作,其中有338 人可按照規(guī)則進(jìn)行驗(yàn)證,正確人數(shù)為246 人,整體預(yù)測(cè)率為72.8%。最后再?gòu)尿?yàn)證結(jié)果中挑選出預(yù)測(cè)率達(dá)80%且正確人數(shù)達(dá)5 人的規(guī)則(表4),從所得的8 條規(guī)則中我們可以發(fā)現(xiàn):

        (1)如果當(dāng)學(xué)生偶爾缺課、上課偶爾聽(tīng)講、對(duì)課程不太了解且對(duì)于課程尚有興趣時(shí),則該學(xué)生的成績(jī)可能為中分群的概率為42.9%、低分群的概率為57.1%。

        (2)如果當(dāng)學(xué)生偶爾缺課、上課聽(tīng)講還算用心、課后很少?gòu)?fù)習(xí)且對(duì)課程尚有興趣,則該學(xué)生的成績(jī)可能為中分群的概率為66.7%、低分群的概率為33.3%。

        (3)如果當(dāng)學(xué)生很少缺課、對(duì)課程了解、課后很少?gòu)?fù)習(xí)、上課還算用心聽(tīng)講且對(duì)課程尚有興趣,則該學(xué)生的成績(jī)可能為中分群的概率為83.3%、低分群的概率為16.7%。

        (4)如果當(dāng)學(xué)生很少缺課、對(duì)課程了解、課后偶爾復(fù)習(xí)、上課還算用心聽(tīng)講且對(duì)課程有興趣,則該學(xué)生的成績(jī)可能為中分群的概率為47.1%、低分群的概率為41.2%。

        (5)如果當(dāng)學(xué)生很少缺課、對(duì)課程了解、課后偶爾復(fù)習(xí)且上課很用心聽(tīng)講,則該學(xué)生的成績(jī)可能為高分群或中分群的概率各為50%。

        (6)如果當(dāng)學(xué)生從未缺課、課后很少?gòu)?fù)習(xí)且對(duì)課程不太了解,則該學(xué)生的成績(jī)可能為高分群、中分群或低分群的概率各為33.3%。

        (7)如果當(dāng)學(xué)生從未缺課、課后偶爾復(fù)習(xí)且對(duì)課程不太了解,則該學(xué)生的成績(jī)可能為高分群或中分群的概率各為50%。

        (8)如果當(dāng)學(xué)生從未缺課、課后經(jīng)常復(fù)習(xí)、對(duì)課程非常有興趣且對(duì)課程非常了解,則該學(xué)生的成績(jī)可能為高分群的概率為61%、中分群的概率為38.5%。

        從以上挖掘結(jié)果中可以發(fā)現(xiàn),決策樹(shù)中的第一層分類都是學(xué)生出席情形(Q26),所以學(xué)生出席率的高低對(duì)學(xué)生成績(jī)會(huì)有絕對(duì)的影響。

        4 結(jié)論

        本研究運(yùn)用C4.5 分類法,研究大學(xué)生的自我學(xué)習(xí)態(tài)度與學(xué)業(yè)學(xué)習(xí)成效之間的關(guān)系,由研究結(jié)果得知學(xué)生的缺課情形對(duì)學(xué)生成績(jī)具有明確的分類效果,因此若能有效提升學(xué)生出席情形,則定能改善學(xué)生的學(xué)業(yè)學(xué)習(xí)成效。然大學(xué)屬于學(xué)術(shù)自由的殿堂,不如之前高中職的學(xué)習(xí)階段,無(wú)法也不能以教條式的制度要求學(xué)生到課,因此借由授課教師如何思考改善自我的教學(xué)方法與品質(zhì),提高學(xué)生學(xué)習(xí)興趣與到課意愿。

        猜你喜歡
        低分決策樹(shù)概率
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        概率與統(tǒng)計(jì)(一)
        概率與統(tǒng)計(jì)(二)
        低分劇成了大眾的“情緒容器”
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
        決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        孩子考了低分以后
        基于決策樹(shù)的出租車乘客出行目的識(shí)別
        低氧低分壓環(huán)境下泡塑吸附火焰原子吸收光譜法測(cè)定常量金
        西藏科技(2015年1期)2015-09-26 12:09:20
        精品高潮呻吟99av无码视频| 国产女人精品视频国产灰线| 人人爽人人爽人人片av| 久久中文字幕人妻熟av女蜜柚m| 韩国女主播一区二区在线观看 | 久久精品国产成人午夜福利| 国产婷婷色综合av蜜臀av| 亚洲va在线va天堂va手机| 亚洲AV无码久久久久调教| 日日麻批免费高清视频| 日韩精品无码一区二区| 国产午夜福利短视频| 亚洲最稳定资源在线观看| 国产午夜精品视频观看| 精品国偷自产在线视频九色| 无遮挡边吃摸边吃奶边做| 五月天婷婷一区二区三区久久| 亚洲1区第2区第3区在线播放| 亚洲 欧美 国产 制服 动漫| 中文字幕美人妻亅u乚一596| 亚洲一区二区成人在线视频| 国产白浆一区二区在线| 欧美牲交a欧美牲交aⅴ免费真| 国产精品露脸视频观看| 成人国产自拍在线播放| 精品国产a一区二区三区v| 精品成人av一区二区三区| 国产成人亚洲综合无码DVD| 男女动态视频99精品| 真实的国产乱xxxx在线| 成人免费视频在线观看| 午夜人妻中文字幕福利| 最新国产不卡在线视频 | 99久久久无码国产aaa精品| 青青青草国产熟女大香蕉| 日本久久久免费观看视频| 国产亚洲欧美精品久久久| 成人xx免费无码| 日本少妇又色又紧又爽又刺激| 最近中文字幕国语免费| 久久久国产精品麻豆|