亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績分析

        2018-08-14 10:00:24狄曉嬌
        現(xiàn)代商貿(mào)工業(yè) 2018年17期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則考試成績決策樹

        狄曉嬌

        摘 要:信息技術(shù)的發(fā)展及應(yīng)用以及如何利用信息技術(shù)提高高校的管理水平,是高職院校面臨的重大課題。在學(xué)習(xí)和工作的過程中接觸到數(shù)據(jù)挖掘這一先進(jìn)的概念,力圖通過數(shù)據(jù)挖掘從學(xué)生的成績中找到隱含在其中的有效信息,這樣既可以幫助老師了解學(xué)生的學(xué)習(xí)情況,又可以幫助學(xué)生了解學(xué)習(xí)重點(diǎn),達(dá)到教學(xué)相長的目的。利用數(shù)據(jù)挖掘技術(shù)中的決策樹的相關(guān)知識和方法,以多屆學(xué)生的《計(jì)算機(jī)應(yīng)用基礎(chǔ)》成績,對學(xué)生的成績進(jìn)行分析。主要使用數(shù)據(jù)挖掘中的決策樹知識將決策樹應(yīng)用在學(xué)生成績數(shù)據(jù)挖掘的模型上,使用SPSS Modeler 軟件利用C 5.0 算法分析出哪些因素對于《計(jì)算機(jī)應(yīng)用基礎(chǔ)》考試的影響最大,揭示其中規(guī)律,為今后教學(xué)工作及教學(xué)安排提供有效的科學(xué)的指導(dǎo)依據(jù)。

        關(guān)鍵詞:數(shù)據(jù)挖掘;考試成績;決策樹;關(guān)聯(lián)規(guī)則

        中圖分類號:G4 文獻(xiàn)標(biāo)識碼:Adoi:10.19311/j.cnki.1672-3198.2018.17.083

        1 決策樹的基本概念

        在已有的大量源數(shù)據(jù)中得到有效的分類器有許多種辦法,決策樹就是其中一種有效的辦法。他在數(shù)據(jù)挖掘中尤其在數(shù)據(jù)分類領(lǐng)域中應(yīng)用十分廣泛。決策樹算法主要是通過一組輸入樣本數(shù)據(jù)然后對樣本進(jìn)行決策樹歸納的一種方法。決策樹的表現(xiàn)形式是一個(gè)倒樹狀結(jié)構(gòu)圖,并且在樹枝的節(jié)點(diǎn)上一般還附帶概率結(jié)果,它是一種是直觀的使用統(tǒng)計(jì)概率來分析對象的圖表示方法。

        2 幾種常用的決策樹算法

        常見的算法有CHAID、CART、Quest和C5.0。判斷決策樹算法是否合適,就看每一個(gè)決策樹分組的組之間的差別是否夠大,屬性差別越大就是算法越合適。決策樹算法擅長處理離散型數(shù)據(jù),并且處理非數(shù)值性數(shù)據(jù)時(shí)效率的方面也有不錯(cuò)的表現(xiàn)。

        3 決策樹的評價(jià)標(biāo)準(zhǔn)

        建立了決策樹模型后需要給出該模型的評估值,這樣才可以來判斷模型的優(yōu)劣。學(xué)習(xí)算法模型使用訓(xùn)練集 (training set) 建立模型,使用校驗(yàn)集 (test set) 來評估模型。經(jīng)過校驗(yàn)集評估后決策樹進(jìn)行評價(jià)。評估指標(biāo)有分類的準(zhǔn)確度,描述的簡潔性和計(jì)算的復(fù)雜程度等指標(biāo)。

        4 決策樹在計(jì)算機(jī)成績分析中的應(yīng)用

        4.1 確定挖掘?qū)ο?/p>

        本次挖掘的對象是以《計(jì)算機(jī)基礎(chǔ)》為基礎(chǔ)信息,之所以選擇這門課程,是因?yàn)樗切律雽W(xué)的第一門與計(jì)算機(jī)相關(guān)的課程,也是今后繼續(xù)學(xué)習(xí)計(jì)算機(jī)相關(guān)課程的基礎(chǔ)。

        《計(jì)算機(jī)基礎(chǔ)》包含平時(shí)成績及期末考試成績??荚囋谛律雽W(xué)的第一學(xué)期的期末,即每年的1月份進(jìn)行期末考試,期末考試總分為40分,占總成績的40%。期末考試的形式為上機(jī)操作,其中包括Word,Excel和powerpoint分別占總成績的40%,40%,20%。在平時(shí)成績中有3次隨堂測驗(yàn)同樣分別是Word,Excel和powerpoint,將其成績匯總作為平時(shí)成績,總分為60分,平時(shí)成績占總成績的60%。

        本論文決定使用決策樹方法研究《計(jì)算機(jī)基礎(chǔ)》考試中word,Excel和powerpoint幾個(gè)部分對最終成績的影響程度。通過構(gòu)造決策樹可以更容易找到哪些因素對最終成績影響更大。同時(shí)采用關(guān)聯(lián)規(guī)則中的Apriori算法研究《計(jì)算機(jī)基礎(chǔ)》和后續(xù)課程《fireworks》的關(guān)聯(lián)。

        4.2 數(shù)據(jù)的預(yù)處理

        本文用到的2013至2015級學(xué)生的《計(jì)算機(jī)基礎(chǔ)》成績及《fireworks》成績,是在學(xué)校教務(wù)部門,使用我校教務(wù)部門的教務(wù)管理軟件下載得到,由于學(xué)校的管理軟件的功能有限,所以下載的成績是以班級為單位的。

        (1)數(shù)據(jù)的預(yù)處理。

        數(shù)據(jù)的預(yù)處理對與數(shù)據(jù)挖掘有著重要的作用,在本文研究的目標(biāo)模型是多界學(xué)生的《計(jì)算機(jī)基礎(chǔ)》及其后續(xù)學(xué)習(xí)課程的成績,并且這些成績是以Excel文件的形式保存的。其中包含的屬性包含學(xué)號、姓名、平時(shí)成績、期末成績、總成績、專業(yè)名稱、課程名稱、任課教師等?,F(xiàn)在需要做的就是對這些數(shù)據(jù)進(jìn)行集成和預(yù)處理。

        (2)數(shù)據(jù)清理。

        數(shù)據(jù)預(yù)處理的第一步就是處理缺失數(shù)據(jù)。通常情況下對于缺失值的處理方法包括:人工填寫,使用最有可能的數(shù)值,忽略數(shù)值,平均值填充等方法。在處理《計(jì)算機(jī)基礎(chǔ)》考試成績的過程中發(fā)現(xiàn)大部分缺失值產(chǎn)生的原因是由于缺考造成的,所以對于缺失值的處理方法是忽略條目的方法。由計(jì)算機(jī)基礎(chǔ)是第一學(xué)期的考試科目,所以缺考學(xué)生沒有,得到有效數(shù)據(jù)2397條。

        (3)數(shù)據(jù)集成。

        我們需要將《計(jì)算機(jī)基礎(chǔ)》,《fireworks》等科目的成績集成在一個(gè)成績表中,也就是數(shù)據(jù)集成。

        集成后數(shù)據(jù)表格包含《計(jì)算機(jī)應(yīng)用基礎(chǔ)》,《fireworks》考試成績,每門課程包括平時(shí)成績,期末成績及總成績,任課教師等屬性。其中原始樣本為2397個(gè),經(jīng)過預(yù)處理可以進(jìn)行數(shù)據(jù)挖掘的樣板數(shù)為2253個(gè)。本次數(shù)據(jù)挖掘樣本有效率為94%。

        (4)數(shù)據(jù)的歸約。

        經(jīng)過數(shù)據(jù)集成后,我們還需要對數(shù)據(jù)進(jìn)行歸約,對數(shù)據(jù)進(jìn)行離散化處理把連續(xù)型數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù),可以使數(shù)據(jù)挖掘的結(jié)果更加直觀簡潔。在本文中我們通過數(shù)據(jù)集成,將學(xué)生的成績數(shù)據(jù)集成到一個(gè)包含學(xué)號、姓名、專業(yè)類別、平時(shí)成績、期末成績、總成績等屬性的數(shù)據(jù)文件。首先我們研究的課題是利用決策樹研究平時(shí)成績與期末成績和影響考試通過率因素。所以首先剔除《fireworks》的考試成績,以及專業(yè)類別、任課教師屬性。還因?yàn)樾彰c學(xué)號兩個(gè)屬性是屬于相關(guān)屬性,也就是說姓名與學(xué)號是對應(yīng)的關(guān)系,相互可以替代,但是姓名還有重名的可能,而學(xué)號是唯一的,所以將姓名的屬性剔除。只保留學(xué)號,平時(shí)成績,期末成績,總成績這些屬性。

        對于決策樹的構(gòu)成最好使用離散型數(shù)值,這樣可以使結(jié)果簡潔,減少計(jì)算量。所以,我們需要將成績庫中的數(shù)據(jù)進(jìn)行離散化處理。目前,期末考試的總成績?yōu)?00分,而評價(jià)學(xué)生通過考試的分?jǐn)?shù)線為60分,所以,將總成績屬性離散化為兩個(gè)部分,即:將高于60分的學(xué)生成績轉(zhuǎn)換為“yes”,分?jǐn)?shù)低于60分的成績轉(zhuǎn)換為“no”。

        平時(shí)成績占總成績60%,滿分為60分,按照平時(shí)成績大于54分,小于等于60分;大于47分,小于等于53分;大于41分,小于等于47分;大于35分,小于等于41分;小于等于35分五個(gè)層次,將平時(shí)成績分為“Super”“Hi”,“Mid”,“Low”,“No”五個(gè)等級。平時(shí)成績分為Word,Excel,powerpoint及平時(shí)表現(xiàn)分?jǐn)?shù)四個(gè)部分,其滿分分別是20,20,10,10。將這些成績按照滿分的90%,80%,70%,60% 分成“Super”“Hi”,“Mid”,“Low”,“No”五個(gè)等級。

        與此同時(shí),期末成績占總成績的40%,共40分,按照期末成績分?jǐn)?shù)大于35分,小于等于40分;大于31分,小于等于35分;大于27分,小于等于31分;大于23分小于等于27分;小于等于23分,分為“Super”“Hi”,“Mid”,“Low”,“No”五個(gè)等級。

        4.3 利用決策樹做成績分析

        使用SPSS Modeler軟件中C5.0模型,得到運(yùn)算結(jié)果。

        通過對結(jié)果的查看得到對于考試成績影響最大的是“平時(shí)”部分,預(yù)測變量的重要性=0.36;然后是powerpoint和word部分,預(yù)測變量的重要性=0.23;而“出勤”部分對于是否通過考試的影響重要性為0.18。由此得出結(jié)論:對于判斷一個(gè)學(xué)生是否通過考試的幾個(gè)因素中平時(shí)成績最重要,word,powerpoint和出勤情況的占比差不多,但是對于Excel部分的相關(guān)性卻不是很強(qiáng),但是由于對于學(xué)生來說word與Excel和powerpoint的重要性在學(xué)習(xí)和以后的應(yīng)用中是同等重要的,所以應(yīng)該加強(qiáng)考試出題中Excel的難度比重,如圖1所示。

        提高Excel成績與最終考試成績的相關(guān)性,使教學(xué)的成果在考試中得到均衡的體現(xiàn),更好的表現(xiàn)出考試的均衡性。通過對規(guī)則的研究可以得到一些有用的規(guī)則,我們發(fā)現(xiàn)如圖2。

        IF powerpoint成績是“Hi”或者“Mid”then 通過考試的比率為98.33%。其他的規(guī)則由于樣本比例不是很多所以沒有更多的挖掘意義。具體形成的決策樹如圖3。

        通過以上的數(shù)據(jù)挖掘,我們可以看出在眾多影響學(xué)生成績的因素中,平時(shí)成績對學(xué)生最終成績的影響是最大的。所以如果想要提高學(xué)生的最終成績,就需要提高學(xué)生的平時(shí)成績。而平時(shí)成績主要是由考勤及平時(shí)幾次考試的成績決定的,因此如果希望提高學(xué)生的最終成績一定要保證平時(shí)的出勤率,和平時(shí)的學(xué)習(xí)效果。

        另外,從以上的規(guī)則中我們還可以看出對于最終成績影響較大的還有powerpoint部分,這部分知識點(diǎn)較簡單,學(xué)習(xí)起來也較容易,因此比較容易拿分,因此需要提高其他方面知識點(diǎn)的分布,增強(qiáng)學(xué)生的學(xué)習(xí)效果。

        5 總結(jié)

        信息化技術(shù)的發(fā)展,對于高校這既是機(jī)遇又是挑戰(zhàn),筆者所在的學(xué)校的各個(gè)管理部門也在引入先進(jìn)的管理系統(tǒng),完善各自部門的管理。比如近些年學(xué)校陸續(xù)上了教務(wù)管理系統(tǒng)、學(xué)生管理系統(tǒng)、人事管理系統(tǒng)等等。這樣使得筆者所在學(xué)校的管理水平上了一個(gè)臺階。升級新的管理系統(tǒng)為我校積累了大量數(shù)據(jù)資源。如何利用先進(jìn)管理系統(tǒng)帶來的寶貴的數(shù)據(jù)資源也為學(xué)校各界人士提出了問題。筆者嘗試?yán)脭?shù)據(jù)挖掘這樣一個(gè)新興的學(xué)科來對學(xué)校的數(shù)據(jù)進(jìn)行一些分析,力圖從中挖掘出一些隱藏在數(shù)據(jù)中的一些信息,為學(xué)校的建設(shè)提供科學(xué)的理論依據(jù)。

        參考文獻(xiàn)

        [1]范佳鳳,袁娟,許艷敏.基于成績分析的大學(xué)教與學(xué)現(xiàn)狀思考[J].現(xiàn)代商貿(mào)工業(yè),2013,(03).

        [2]戎荷婷,王瑞玲,武晶,楊秋白.學(xué)生行為對學(xué)生成績的影響探究[J].現(xiàn)代商貿(mào)工業(yè),2016,(23).

        [3]臧琛,李景平,劉海亮,王景磊.工程訓(xùn)練學(xué)生成績考核體系探討與設(shè)計(jì)[J].現(xiàn)代商貿(mào)工業(yè),2017,(09).

        猜你喜歡
        關(guān)聯(lián)規(guī)則考試成績決策樹
        考試成績轉(zhuǎn)換成偏態(tài)分布量化成績的算法
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價(jià)體系中的應(yīng)用
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測方法
        基于決策樹的出租車乘客出行目的識別
        考試成績
        因子分析法在高中地理考試成績分析中的應(yīng)用
        国产精品成人无码久久久久久| 天天躁日日躁狠狠很躁| 天天干成人网| 无码一区二区三区在| av一区二区在线免费观看| 极品粉嫩嫩模大尺度无码视频| 亚洲男人第一无码av网站| 国产最新一区二区三区天堂| 一区二区三区日本久久| 极品少妇被黑人白浆直流| 怡红院a∨人人爰人人爽| 婷婷色综合成人成人网小说| 白白色福利视频在线观看| 国产激情久久久久久熟女老人| 国产精品无码av天天爽| 久久综合亚洲色社区| 一区二区三区日本美女视频| www国产亚洲精品| 99久久国产福利自产拍| 一区二区视频观看在线| 国产女人av一级一区二区三区| 国产丝袜美女| 久久亚洲精品ab无码播放| 粉嫩小泬无遮挡久久久久久| 日本久久精品福利视频| 中国老熟女重囗味hdxx| 四虎成人免费| 亚洲av乱码国产精品观看麻豆| 久青草影院在线观看国产| 久久久久久久久久久国产| 色yeye在线观看| 亚洲中文字幕精品久久吃奶| 亚洲成av人的天堂在线观看| 日韩久久一级毛片| 一本久道视频无线视频试看 | 国产日韩亚洲中文字幕| 久久99热只有频精品8国语| 亚洲精品无amm毛片| 日韩中文在线视频| 一本色道久久综合亚洲精品不| 五月天中文字幕mv在线|