亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        決策樹分類算法在課程成績預(yù)測中的應(yīng)用

        2022-09-21 01:34:16楊麗萍郭宏升
        電子測試 2022年17期
        關(guān)鍵詞:分類課程

        楊麗萍,郭宏升

        (1.包頭師范學(xué)院信息科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古包頭,014030;2.包頭師范學(xué)院政治與法律學(xué)院,內(nèi)蒙古包頭,014030)

        0 引言

        近年來,隨著教育系統(tǒng)對大數(shù)據(jù)應(yīng)用的不斷探討,大數(shù)據(jù)對高校教師教學(xué)與管理的支持日益加強,同時,在高校教育管理中,人們深刻認識到大數(shù)據(jù)在管理與決策中的重要作用,不再依賴于傳統(tǒng)意義上的經(jīng)驗管理和直覺推斷。大數(shù)據(jù)可以深度挖掘教育教學(xué)數(shù)據(jù)中的隱藏信息,發(fā)現(xiàn)教育過程中存在的問題和關(guān)鍵點,提供決策來優(yōu)化教育管理。

        利用大數(shù)據(jù)分析技術(shù)可以系統(tǒng)全面地整合學(xué)生的行為數(shù)據(jù),對課堂教學(xué)實現(xiàn)全面的評價與分析。教師通過對學(xué)生行為相關(guān)的海量數(shù)據(jù)進行分析,可以發(fā)現(xiàn)學(xué)生的學(xué)習(xí)行為之間的關(guān)聯(lián)關(guān)系,以及學(xué)習(xí)行為與學(xué)習(xí)結(jié)果之間的關(guān)聯(lián)關(guān)系,從而對學(xué)生的學(xué)習(xí)成績、課堂表現(xiàn)、知識掌握情況進行預(yù)測與評估,制定更為合理的教學(xué)方案,對有個性化需要的學(xué)生提供幫助。

        1 決策樹分類算法描述

        決策樹是一類常見的機器學(xué)習(xí)方法,是對訓(xùn)練集中數(shù)據(jù)表現(xiàn)出的屬性進行總結(jié)分類,為表現(xiàn)出來的屬性找到一個確切的描述與分類的模型,由該模型可以對未來不可預(yù)測的數(shù)據(jù)進行分類[1]。決策樹分類算法是以給定數(shù)據(jù)樣本為基礎(chǔ)的歸納學(xué)習(xí)方法。在給定已知類標號的數(shù)據(jù)集的情況下,采用自頂向下的遞歸方式產(chǎn)生一棵樹結(jié)構(gòu)[2]。樹的最頂層結(jié)點稱為根結(jié)點,最底層結(jié)點稱為葉結(jié)點,每個葉結(jié)點代表樣本的類別。根結(jié)點和葉結(jié)點之間的結(jié)點稱為內(nèi)部結(jié)點。決策樹分類算法首先選擇具有最高信息增益的描述屬性作為給定數(shù)據(jù)集的分支屬性,從而創(chuàng)建決策樹中的一個結(jié)點,并且根據(jù)該描述屬性的不同取值再創(chuàng)建分支,之后對各分支中的樣本子集遞歸調(diào)用上述方法建立該結(jié)點的各個子結(jié)點[3]。當某個分支上的所有數(shù)據(jù)樣本都屬于同一個類別時劃分停止,形成葉結(jié)點;或者當某個分支上的樣本不屬于同一個類別,但是又沒有剩余的描述屬性可以進一步劃分數(shù)據(jù)集時也形成葉結(jié)點,并且用多數(shù)樣本所屬的類別來標記這個葉結(jié)點。對未知類標號的數(shù)據(jù)樣本進行分類時,從根結(jié)點開始逐層向下判斷,直到葉結(jié)點,就可以得到該數(shù)據(jù)樣本的類標號。

        2 決策樹分類算法實現(xiàn)

        2.1 計算對訓(xùn)練集分類所需的期望信息

        假設(shè)給定的數(shù)據(jù)集為X={(xi,yi)|i=1,2,…,total},其中樣本xi(i=1,2,…,total)用d維特征向量xi=(xi1,xi2,…,xid)來表示,xi1,xi2,…,xid分別對應(yīng)d個描述屬性A1,A2,…,Ad的具體取值;yi(i=1,2,…,total)表示樣本xi的類標號,假設(shè)要研究的分類問題含有m個類別,則yi∈{c1,c2,…,cm}。在創(chuàng)建根結(jié)點時,數(shù)據(jù)集X是最初給定的所有數(shù)據(jù),在創(chuàng)建內(nèi)部結(jié)點時,數(shù)據(jù)集X是上層結(jié)點的某個分枝對應(yīng)的數(shù)據(jù)集。

        假設(shè)nj是數(shù)據(jù)集X中屬于類別cj的樣本數(shù)量,則各類別的先驗概率為P(cj)=nj/total,j=1,2,…,m。對給定數(shù)據(jù)集X分類所需的期望信息為:

        2.2 計算各個描述屬性劃分訓(xùn)練集時的信息增益[4]

        設(shè)描述屬性Af(f=1,2,…,d)具有q個不同的取值{a1f,a2f,…,aqf},利用描述屬性Af可以將數(shù)據(jù)集X劃分為q個子集{X1,X2,…,Xq},其中Xs(s=1,2,…,q)中的樣本在Af上具有相同的取值asf。設(shè)ns表示子集Xs中的樣本數(shù)量,njs表示子集Xs中屬于類別cj的樣本數(shù)量。則由描述屬性Af劃分數(shù)據(jù)集X所得的熵為:

        其中,pjs=njs/ns表示在子集Xs中類別為cj的數(shù)據(jù)樣本所占的比例。則利用描述屬性Af(f=1,2,…,d)劃分數(shù)據(jù)集時的信息增益為:

        2.3 對數(shù)據(jù)集進行繼續(xù)劃分

        選擇具有最高信息增益的描述屬性作為給定數(shù)據(jù)集X的分枝屬性,從而創(chuàng)建決策樹中的一個結(jié)點,并且根據(jù)該描述屬性的不同取值再創(chuàng)建分枝,之后對各分枝中的樣本子集遞歸調(diào)用上述方法建立該結(jié)點的各個子結(jié)點。當某個分枝上的所有數(shù)據(jù)樣本都屬于同一個類別時劃分停止,形成葉結(jié)點;或者當某個分枝上的樣本不屬于同一個類別,但是又沒有剩余的描述屬性可以進一步劃分數(shù)據(jù)集時也形成葉結(jié)點,并且用多數(shù)樣本所屬的類別來標記這個葉結(jié)點。

        3 實驗測試與分析

        3.1 實驗數(shù)據(jù)集

        本文采用2020學(xué)年度20電子班“C語言程序設(shè)計”課程教學(xué)中學(xué)生的課程學(xué)習(xí)數(shù)據(jù)以及期末考試成績數(shù)據(jù)作為樣本數(shù)據(jù),每一個樣本數(shù)據(jù)的描述屬性包括學(xué)號、姓名、出勤率、課堂互動、小組討論、課后作業(yè)、PTA平臺程序設(shè)計,其中學(xué)號和姓名不作為構(gòu)造決策樹的屬性,分類類別為期末成績,包括3個類別,分別是良好(80~100分)、中等(60~79分)和不合格(0~59分)。表1給出了部分樣本數(shù)據(jù)的描述屬性和類別標記。

        表1 部分樣本數(shù)據(jù)

        3.2 對描述屬性值進行邏輯化

        對于出勤率,0表示滿,1表示不滿;對于課堂互動,0表示積極,1表示不積極;對于小組討論,0表示積極,1表示不積極;對于課后作業(yè),0表示優(yōu),1表示良,2表示中;對于PTA平臺程序設(shè)計,0表示優(yōu),1表示良,2表示中;對于期末成績,80~100表示良好, 60~79表示中等,0~59表示不合格。例如,邏輯化后,學(xué)號1的數(shù)據(jù)可以表示為{0,0,0,0,0,”良好”}。

        3.3 采用決策樹分類算法構(gòu)造決策樹

        本文采用java語言實現(xiàn)該算法,主要包括以下幾個方法:

        Object[][] createDataSet():建立樣本數(shù)據(jù)集

        double calcShannonEnt(Object[][] dataSet):計算對訓(xùn)練集分類所需的期望信息

        int chooseBestFeatureToSplit(Object dataSet[][]):求信息增益最大的描述屬性

        Object createTree(Object dataSet[][], String labels[]):構(gòu)造決策樹[5]

        String classify(HashMapinputTree,String featLabels[],Object[]testVec):利用決策樹進行分類

        根據(jù)表1給定的樣本數(shù)據(jù)構(gòu)造決策樹,運行結(jié)果如圖1所示。

        圖1 構(gòu)造決策樹運行結(jié)果

        該運行結(jié)果對應(yīng)的決策樹如圖2所示。

        圖2 運行結(jié)果對應(yīng)的決策樹

        當給定的未知分類的數(shù)據(jù)為{1,1,1,2,2},采用上述決策樹進行分類,運行結(jié)果如圖3所示。

        圖3 采用決策樹進行分類的結(jié)果

        4 結(jié)語

        本文采用2020學(xué)年度“C語言程序設(shè)計”課程教學(xué)中學(xué)生的課程學(xué)習(xí)數(shù)據(jù)以及期末考試成績數(shù)據(jù)作為樣本數(shù)據(jù),采用決策樹分類算法構(gòu)造決策樹分類器,并利用該決策樹分類器對2021學(xué)年度“C語言程序設(shè)計”課程前期階段學(xué)生的學(xué)習(xí)數(shù)據(jù)進行分類,對分類結(jié)果為不合格的學(xué)生有針對性地進行重點關(guān)注和課程知識點專項輔導(dǎo),同時根據(jù)分類結(jié)果,對課程的教學(xué)方案進行適當調(diào)整,最終2021學(xué)年度“C語言程序設(shè)計”課程取得了優(yōu)異的教學(xué)效果,學(xué)生通過率達到98%,成績優(yōu)秀率達到90%。

        猜你喜歡
        分類課程
        《無機化學(xué)》課程教學(xué)改革
        云南化工(2021年6期)2021-12-21 07:31:42
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        數(shù)字圖像處理課程混合式教學(xué)改革與探索
        軟件設(shè)計與開發(fā)實踐課程探索與實踐
        計算機教育(2020年5期)2020-07-24 08:53:38
        為什么要學(xué)習(xí)HAA課程?
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        給塑料分分類吧
        亚洲精品第一国产麻豆| 波多野吉衣av无码| 好紧好爽免费午夜视频| 久久久国产乱子伦精品作者| 国産精品久久久久久久| 亚洲av永久无码一区| 亚洲中文字幕乱码免费| 国产丝袜高跟美腿一区在线| 国产自拍精品在线视频| 国产精品成人av大片| 男人吃奶摸下挵进去啪啪软件| 亚洲人成人无码www影院| 亚洲男人的天堂网站| 亚洲日韩乱码中文无码蜜桃臀 | 青青草绿色华人播放在线视频| 精品综合久久88少妇激情| 91露脸半推半就老熟妇| 亚洲精品色午夜无码专区日韩| 爆爽久久久一区二区又大又黄又嫩| 永久黄网站色视频免费| 日韩丝袜亚洲国产欧美一区 | 91久久国产精品综合| 久久精品不卡一区二区三区| 亚洲成av人片乱码色午夜| 人妻少妇精品中文字幕av| 日韩欧美在线综合网| 中文国产成人精品久久一区| 日韩激情av不卡在线| 国产欧美在线观看不卡 | 91色老久久偷偷精品蜜臀懂色 | 久久免费网国产AⅤ| 国产丝袜免费精品一区二区 | 精品综合久久88少妇激情| 天天爽夜夜爽人人爽一区二区| 成人综合网亚洲伊人| 国产成人国产在线观看| 国产精品一区二区三区色| 蜜桃传媒免费在线观看| 热久久国产欧美一区二区精品| 亚洲综合性色一区| 色婷婷亚洲十月十月色天|