亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘在學(xué)生評(píng)優(yōu)管理中的應(yīng)用研究

        2014-07-07 10:02:03孫斌
        科教導(dǎo)刊 2014年16期
        關(guān)鍵詞:決策支持決策樹數(shù)據(jù)挖掘

        孫斌

        摘 要 隨著數(shù)字化校園建設(shè)步伐的加快,各大高校都有了比較完善的校園網(wǎng)系統(tǒng)。與此同時(shí),高校在日常教學(xué)管理過程中積累了大量的數(shù)據(jù),這些數(shù)據(jù)都是寶貴的信息資源。但是目前,這些數(shù)據(jù)主要的用途只是提供簡單的查詢和報(bào)表統(tǒng)計(jì),對(duì)這些數(shù)據(jù)所隱藏的深層次的信息沒有充分地利用。如何更好地利用這些數(shù)據(jù),為高校學(xué)生管理部門提供重要決策依據(jù),從而進(jìn)一步提高高校學(xué)生管理水平和效率,成為一個(gè)新的研究課題。

        關(guān)鍵詞 學(xué)生綜合測(cè)評(píng) 決策支持 數(shù)據(jù)挖掘 決策樹

        中圖分類號(hào):G647 文獻(xiàn)標(biāo)識(shí)碼:A

        Application of Data Mining in Students' Appraised Management

        SUN Bin

        (School of Economics and Management, Inner Mongolia University

        of Science &Technology, Baotou, Inner Mongolia 014010)

        Abstract With digital speed up the pace of campus construction, major colleges and universities have a fairly complete campus network system. At the same time, the university has accumulated a large amount of data in daily teaching and management process, these data are a valuable information resource. But for now, the main purpose of these data only provide a simple query and reporting statistics, these data are hidden depth information is not fully utilized. How to make better use of these data provide an important basis for decision making for the college student management departments, so as to further improve the management level and efficiency of university students has become a new research topic.

        Key words students' comprehensive evaluation; decision support; data mining; decision tree

        1 數(shù)據(jù)挖掘技術(shù)

        1.1 數(shù)據(jù)挖掘概述

        數(shù)據(jù)挖掘(Data Ming)是建立在數(shù)據(jù)庫與人工智能技術(shù)上的一種新技術(shù)。目前,一個(gè)普遍的對(duì)數(shù)據(jù)挖掘的定義是:數(shù)據(jù)挖掘是一個(gè)基于某種目的,從數(shù)據(jù)集合中提取出彼此之間有著特殊關(guān)系的信息處理過程。數(shù)據(jù)挖掘可以說一個(gè)決策支持過程,涉及到的技術(shù)有:模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、數(shù)據(jù)倉庫、人工智能、可視化技術(shù)等,數(shù)據(jù)挖掘可以幫助用戶自動(dòng)分析數(shù)據(jù),并進(jìn)行歸納性推理,發(fā)現(xiàn)潛在模式,為決策者調(diào)整策略提供科學(xué)性指導(dǎo),從而減少風(fēng)險(xiǎn)。

        傳統(tǒng)的數(shù)據(jù)分析方法,例如報(bào)表、查詢、聯(lián)機(jī)應(yīng)用等手段,通常是帶著明確目標(biāo),分析固定數(shù)據(jù)而追求預(yù)期結(jié)果。數(shù)據(jù)挖掘與這些方法有著本質(zhì)不同,數(shù)據(jù)挖掘是在沒有明確假設(shè)的條件下去發(fā)現(xiàn)信息、挖掘信息。主要任務(wù)是關(guān)聯(lián)、聚類、分類、預(yù)測(cè)、分析偏差等等,常見的數(shù)據(jù)挖掘方法有決策樹、遺傳算法、貝葉斯網(wǎng)絡(luò)等等。

        1.2 數(shù)據(jù)挖掘的處理流程

        下面介紹一下數(shù)據(jù)挖掘的一般處理流程,數(shù)據(jù)挖掘是個(gè)復(fù)雜的多階段過程,一般分為如下幾個(gè)階段:

        (1) 挖掘?qū)ο蟠_定:這是數(shù)據(jù)挖掘的第一步,包括理解數(shù)據(jù),提出問題,明確挖掘目標(biāo)。

        (2) 數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)準(zhǔn)備是整個(gè)挖掘過程中所占比例最大的一個(gè)階段,是保證挖掘成功的前提條件,主要目的就是選取合適數(shù)據(jù),統(tǒng)一數(shù)據(jù)格式,建立數(shù)據(jù)倉庫,數(shù)據(jù)準(zhǔn)備階段可以分為三個(gè)子過程:數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換。

        (3) 數(shù)據(jù)挖掘:此階段核心在于模式的發(fā)現(xiàn),就是利用相關(guān)算法和挖掘工具對(duì)準(zhǔn)備的數(shù)據(jù)進(jìn)行分析,產(chǎn)生預(yù)期結(jié)果。

        (4) 對(duì)結(jié)果分析、評(píng)價(jià):就是將數(shù)據(jù)挖掘的結(jié)果分析驗(yàn)證,得到有價(jià)值的信息,比如挖掘出的規(guī)則、模式等等,決定了挖掘的有效性,以一種直觀、容易理解的形式呈現(xiàn)給客戶,通常會(huì)用到可視化技術(shù),計(jì)算機(jī)圖形學(xué)等等。

        2 數(shù)據(jù)挖掘中的決策樹技術(shù)

        在分類預(yù)測(cè)技術(shù)中,最常用的就是決策樹算法。決策樹的具有結(jié)構(gòu)簡單,效率高,適用于大規(guī)模、非數(shù)值型數(shù)據(jù)處理,分類精度高等優(yōu)點(diǎn)。決策樹是基于貪心算法,通過自然而下遞歸的方法構(gòu)造,由分枝與節(jié)點(diǎn)組成,節(jié)點(diǎn)則又分為根節(jié)點(diǎn)、內(nèi)部節(jié)點(diǎn)、葉子節(jié)點(diǎn),分類對(duì)象的屬性由根節(jié)點(diǎn)與內(nèi)部節(jié)點(diǎn)對(duì)應(yīng),葉子節(jié)點(diǎn)則代表一種可能的分類結(jié)果,在內(nèi)部節(jié)點(diǎn)進(jìn)行屬性比較然后判斷向下的分支。依此遞歸,就形成了一條從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的比較路徑,從而形成一套完成取向表達(dá)。本文研究采用的是ID3算法:

        算法流程簡述如下:

        (1) 相關(guān)數(shù)據(jù)的計(jì)算:假設(shè)是個(gè)對(duì)象的數(shù)據(jù)集,數(shù)據(jù)集的類別屬性數(shù)為,即(=1,2,3...),計(jì)算對(duì)象分類所需的期望信息,如下公式得出: = (,,…,) = (),其中是樣本屬于的概率估計(jì)。

        然后設(shè)屬性由個(gè)不同值,用{,,…,}集合表示,然后將數(shù)據(jù)集劃分為{,,…}的子集,其中包含的樣本,此樣本在上有相同的值,即為。如果被選定為測(cè)試屬性,那么{,,…}就是從節(jié)點(diǎn)擴(kuò)展的新節(jié)點(diǎn)。那么從劃分出的數(shù)據(jù)子集的信息熵由公式得出:

        = (,,…)

        其中, (,,…) = (), = 最后即可得出信息增益值:= (,,…)

        (2) 構(gòu)建決策樹:根據(jù)上述步驟計(jì)算的值進(jìn)行決策樹構(gòu)建。首先,用最大信息增益值的屬性變量作為決策樹的根節(jié)點(diǎn),對(duì)屬性的值創(chuàng)建分支,并且劃分樣本。然后再遞歸形成決策樹。如果分組下的數(shù)據(jù)有相同的目標(biāo)變量值,則決策樹就到達(dá)了葉結(jié)點(diǎn),否則在分組內(nèi)再次確立分支準(zhǔn)則,繼續(xù)遞歸構(gòu)建樹的下一層分枝。決策樹停止構(gòu)建的條件為:屬性劃分完畢,結(jié)點(diǎn)數(shù)據(jù)集為空集,給定節(jié)點(diǎn)的樣本為同一類樣本。

        3 決策樹技術(shù)在學(xué)生綜合測(cè)評(píng)管理工作中的應(yīng)用

        在學(xué)生綜合測(cè)評(píng)管理工作中,可以通過決策樹進(jìn)行分類規(guī)劃。首先是建立決策樹的根節(jié)點(diǎn),利用表征數(shù)據(jù)的關(guān)鍵屬性段建立,從而確定數(shù)據(jù)訓(xùn)練集,然后輸入已有數(shù)據(jù),建立可以預(yù)測(cè)學(xué)生信息的決策樹,便于學(xué)生的評(píng)優(yōu)與定位。

        一般學(xué)校的學(xué)生評(píng)優(yōu)工作是圍繞綜合測(cè)評(píng)進(jìn)行,而綜合測(cè)評(píng)涉及到很多方面,政治覺悟修養(yǎng)、學(xué)業(yè)成績、實(shí)踐動(dòng)手能力、身體素質(zhì)等等,這些數(shù)據(jù)很多都不能量化,因此學(xué)校對(duì)這些數(shù)據(jù)采取層次分析或者模糊分析等人工測(cè)評(píng)方法,人工評(píng)測(cè)的準(zhǔn)確性與公平性得不到保證。利用決策樹可以很方便解決這個(gè)問題。首先將幾方面的素質(zhì)分成等級(jí),比如政治覺悟修養(yǎng),按照“優(yōu)、良、中、差”四個(gè)等級(jí)表征,以學(xué)生的學(xué)號(hào)作為索引關(guān)鍵字,對(duì)數(shù)據(jù)分類來表征不同的數(shù)據(jù)對(duì)象,建立“政治修養(yǎng)”決策樹;至于分析成績工作方面,可以列出若干因素,然后構(gòu)建決策樹,比較影響因子大小,從而得出結(jié)論。而且還可以對(duì)得到的決策樹再次分類預(yù)測(cè),包括:預(yù)測(cè)離散值,構(gòu)建模型對(duì)現(xiàn)有數(shù)據(jù)分類,提出學(xué)生評(píng)優(yōu)管理中無用數(shù)據(jù)等;將原本數(shù)據(jù)分為具有一定特征的數(shù)據(jù)分類,便于管理者直接定位所需數(shù)據(jù)。

        4 應(yīng)用舉例

        決策樹在學(xué)生成績分析管理工作中用途十分廣泛,下面結(jié)合一個(gè)具體實(shí)例來介紹常見的數(shù)據(jù)處理、數(shù)據(jù)挖掘的過程,并且根據(jù)決策樹分析影響學(xué)生成績的因素。

        4.1 數(shù)據(jù)預(yù)處理

        表1是某職業(yè)學(xué)院2011級(jí)財(cái)務(wù)信息學(xué)生的成績與基本狀況表。

        表1

        首先對(duì)以上數(shù)據(jù)進(jìn)行離散化處理,得到的結(jié)果如表2:

        表2

        其中,學(xué)生是按照學(xué)號(hào)順序排列,共51名學(xué)生,性別只有男女兩種,下面對(duì)其他幾個(gè)選項(xiàng)說明:

        (1)出勤情況中,0表示經(jīng)常不出勤,0.5表示全勤,1表示偶爾不出勤;(2)政治面貌中,0表示群眾,0.2表示團(tuán)員,0.4表示黨員;(3)生源地中,0表示城市,0.2表示農(nóng)村。

        4.2 構(gòu)建模型

        此例研究的是觀察學(xué)生的綜合評(píng)價(jià)與哪些因素有關(guān),希望發(fā)現(xiàn)學(xué)生評(píng)價(jià)與學(xué)生性別、出勤、政治面貌、生源地等因素的關(guān)系,以確定很多問題,例如黨員是否可以嚴(yán)格要求自身學(xué)習(xí),城市生源學(xué)生的成績是否優(yōu)于農(nóng)村生源學(xué)生等等。首先根據(jù)決策樹算法構(gòu)建模型,先進(jìn)行對(duì)數(shù)據(jù)的處理,然后應(yīng)用算法建立決策樹,并根據(jù)決策樹分析上述問題。流程簡介如下:(1)對(duì)數(shù)據(jù)表中的幾個(gè)屬性進(jìn)行信息熵的計(jì)算,計(jì)算過程是根據(jù)上節(jié)提供的公式;(2)將得到的信息增益最大的屬性當(dāng)做決策樹的根節(jié)點(diǎn),然后進(jìn)行數(shù)據(jù)子集劃分;(3)重復(fù)1、2步驟,對(duì)每個(gè)數(shù)據(jù)子集劃分,知道所有樣本是同一類或者屬性劃分完畢為止。如圖1所示:

        圖1

        4.3 具體計(jì)算過程,以性別屬性為例

        (1)計(jì)算分類屬性信息量。在數(shù)據(jù)表中,有51個(gè)樣本,其中優(yōu)秀為10個(gè),良好為10個(gè),一般有17個(gè),較差有14個(gè),下面計(jì)算每個(gè)信息的信息熵:

        由公式,計(jì)算得到:(,,,)= (11,10,16,15)= 1.9732。

        (2)計(jì)算每個(gè)屬性的信息量。對(duì)于性別屬性,該屬性只有“男”、“女”兩種,其中對(duì)于男性,簇結(jié)論為優(yōu)秀、良好、一般,較差的樣本數(shù)分別為4、4、13、11個(gè);對(duì)于女性,簇結(jié)論為優(yōu)秀、良好、一般、較差的樣本個(gè)數(shù)分別為7、6、4、2個(gè)。

        對(duì)于男性的評(píng)價(jià)表信息量的計(jì)算:(4,4,13,11)=1.708;

        對(duì)于女性的評(píng)價(jià)信息表的計(jì)算:(7,6,4,2)=1.877。

        對(duì)于性別屬性的信息熵的計(jì)算則是:

        (性別) = (4,4,13,11) + (7,6,4,2)=1.7709。

        同理,計(jì)算得到:(出勤) = 1.3923;(政治面貌) = 1.7965;(生源地) = 1.8232.

        (1) 信息增量的計(jì)算

        Gain(性別)=1.9732-1.7709=0.2023

        Gain(出勤)=1.9732-1.3923=0.5809

        Gain(政治面貌)=1.9732-1.7965=0.1767

        Gain(生源地)=1.9732-1.8232=0.15

        4.4 構(gòu)造決策樹

        有上述計(jì)算結(jié)果知,出勤信息增益最大,因此作為根節(jié)點(diǎn),然后再計(jì)算剩下三個(gè)屬性字段,得到的結(jié)果是剩下三個(gè)字段,政治面貌的信息增益大于其余兩個(gè),因此作為剩下兩個(gè)屬性的根節(jié)點(diǎn),然后依次類推,形成的決策樹如下所示:

        圖2

        4.5 決策樹分析

        通過上面決策樹分析,我們可以得出如下結(jié)論:(1)最學(xué)生成績影響最大的因素是出勤率,出勤率不高的學(xué)生成績不好;(2)性別、生源地對(duì)學(xué)生成績沒有太大影響,還沒有政治面貌的影響大。因此,學(xué)生如果想提高學(xué)習(xí)成績,應(yīng)該做到不缺課、不曠課,教師在教學(xué)過程中,對(duì)待男女生、城市鄉(xiāng)村學(xué)生一視同仁。

        通過這個(gè)例子,我們剔除了數(shù)據(jù)集合中無關(guān)的屬性,還將對(duì)學(xué)生成績影響因素按照影響大小進(jìn)行了排序,從而找出真正影響學(xué)生成績的原因,得到有助于教學(xué)決策改進(jìn)的重要信息。

        5 總結(jié)與展望

        由本文的研究可以看出,數(shù)據(jù)挖掘技術(shù)在學(xué)生成績管理分析工作中的作用還是比較明顯的,特別是決策樹的應(yīng)用,對(duì)綜合評(píng)價(jià)學(xué)生素質(zhì)有著巨大的啟示與現(xiàn)實(shí)意義。在今后的工作中還有如下幾個(gè)方面需要進(jìn)行思考、改進(jìn):(1)在對(duì)挖掘結(jié)果的分析研究中,生成的分類規(guī)則與實(shí)際情況存在一定的誤差,有些研究數(shù)據(jù)存在一定的片面性,還應(yīng)該采取一定改進(jìn)手段,優(yōu)化挖掘效率。(2)本文的研究方法主要采用的是決策樹手段,對(duì)其他的數(shù)據(jù)挖掘方式還有待進(jìn)一步研究,以期采取多種挖掘方式改進(jìn)對(duì)學(xué)生的成績管理工作。

        參考文獻(xiàn)

        [1] 范明,孟小峰等譯.數(shù)掘挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2000.

        [2] Han Jiawei、Kamber Micheline.數(shù)掘挖掘:概念與技術(shù)(影印版)[M].北京:高等教育出版社,2000.

        [3] 董彩云等.數(shù)掘挖掘及其在高校教學(xué)系統(tǒng)中的應(yīng)用[J].濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版),2004.18(1):65-68.

        [4] 倪現(xiàn)君.基于數(shù)據(jù)挖掘分類技術(shù)的高校教學(xué)方法研究[J].科學(xué)技術(shù)與工程,2006.6(4):390-392.

        [5] Minos Garofalakis、Dongjoon Hyun,Bui iding Decision Trees with Constraints,Data Mining and Knowledge Discovery,2003.2:187-214.

        [6] J.Han,J.pei and Y.Yin.Mining Frequent patterns without candidate enerateion In proc,2000 ACM—SIGMOD Int Conf Management of Data[C].2000.5:I-I.

        猜你喜歡
        決策支持決策樹數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        商業(yè)智能分析模式在醫(yī)保病人住院化管理當(dāng)中的應(yīng)用研究
        建立跨區(qū)域、多維度、品種一體化預(yù)算管控體系
        秦山核電應(yīng)急決策支持系統(tǒng)開發(fā)與研究
        科技視界(2016年15期)2016-06-30 00:32:07
        基于決策樹的出租車乘客出行目的識(shí)別
        基于RFID的汽車零件銷售策略支持模型
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        精品中文字幕精品中文字幕 | 免费国产线观看免费观看| 少妇仑乱a毛片| 在线观看免费无码专区| 无码午夜成人1000部免费视频| 欧美婷婷六月丁香综合色| 国产欧美日韩专区毛茸茸| 青青草免费激情自拍视频| 亚洲一区二区三区四区精品| 亚洲成av人片不卡无码| 一本色道久久99一综合| 国产乱子伦精品免费女| 亚洲人妻精品一区二区三区| 青青草成人在线播放视频| 极品白嫩的小少妇| 荡女精品导航| 久久国产乱子精品免费女| 高清不卡av在线播放| 亚洲精品国精品久久99热| 成人看片黄a免费看那个网址| 亚洲伊人久久大香线蕉影院| 精品91精品91精品国产片| 精品精品国产一区二区性色av| 国产精品激情自拍视频| 最近日本免费观看高清视频| 亚洲日产无码中文字幕| 老岳肥屁熟女四五十路| 午夜免费电影| 一本色道久久综合狠狠躁| 亚洲an日韩专区在线| 久久精品国产亚洲av夜夜| 狂猛欧美激情性xxxx大豆行情 | 亚洲www视频| 精品婷婷国产综合久久| 天天爽夜夜爽人人爽| 精品国产人成亚洲区| 婷婷激情六月| 你懂的视频网站亚洲视频| 日韩免费视频| 老熟女高潮一区二区三区 | 在线观看免费人成视频色9|