亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)聯(lián)規(guī)則在中職學(xué)校招生管理系統(tǒng)中的應(yīng)用

        2017-10-13 20:07:58唐堅(jiān)勝張晶晶鄧珍榮
        關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

        ◆何 萌 唐堅(jiān)勝 張晶晶 鄧珍榮

        ?

        關(guān)聯(lián)規(guī)則在中職學(xué)校招生管理系統(tǒng)中的應(yīng)用

        ◆何 萌1唐堅(jiān)勝2張晶晶1鄧珍榮1

        (1.桂林電子科技大學(xué)計(jì)算機(jī)與信息安全學(xué)院 廣西 541004;2.桂林林業(yè)學(xué)校 廣西 541004)

        針對(duì)中等職業(yè)學(xué)校招生規(guī)模的不斷擴(kuò)大的現(xiàn)象,提高中職生源質(zhì)量已經(jīng)成為各培養(yǎng)單位的重點(diǎn)工作。傳統(tǒng)的生源質(zhì)量分析主要是計(jì)算考生成績(jī)的均值、方差、區(qū)分度等,僅對(duì)單個(gè)獨(dú)立的數(shù)據(jù)進(jìn)行分析,無(wú)法獲取數(shù)據(jù)間的有價(jià)值信息。本文將數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則應(yīng)用于分析中職學(xué)校學(xué)生入學(xué)成績(jī)、在校生學(xué)習(xí)成績(jī)、就業(yè)狀況和生源質(zhì)量之間的內(nèi)在關(guān)系,找出對(duì)影響招生質(zhì)量有價(jià)值的信息,為招生政策的制定提供參考。

        數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;生源質(zhì)量

        0 引言

        當(dāng)今大數(shù)據(jù)時(shí)代,數(shù)據(jù)處理量越來(lái)越大,僅僅依靠傳統(tǒng)的數(shù)據(jù)處理方式已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足人們現(xiàn)實(shí)生活中的需求,數(shù)據(jù)挖掘技術(shù)的發(fā)展引起了各行各業(yè)的高度關(guān)注。近年來(lái),中等職業(yè)教育得到國(guó)家政策大力扶持,職業(yè)學(xué)校規(guī)模逐漸擴(kuò)大、自主招生程度不斷提高,生源數(shù)量已經(jīng)成為政府和社會(huì)評(píng)價(jià)中等職業(yè)學(xué)校辦學(xué)實(shí)力的一個(gè)重要指標(biāo)。如何從學(xué)校豐富的數(shù)據(jù)信息中提取出有價(jià)值的數(shù)據(jù)資料,已經(jīng)成為教學(xué)管理中值得探索的問題之一。數(shù)據(jù)挖掘技術(shù)可以為學(xué)??茖W(xué)決策助一臂之力。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于中等職業(yè)學(xué)校招生信息系統(tǒng),搜集各種數(shù)據(jù)表征的內(nèi)容及其相互關(guān)系,根據(jù)學(xué)生入學(xué)前的信息與在校就讀期間的學(xué)習(xí)成績(jī)等特點(diǎn),分析中職學(xué)校生源質(zhì)量,可為中職學(xué)校制定招生計(jì)劃、提高生源質(zhì)量提供有效的參考信息。有助于及時(shí)發(fā)現(xiàn)教學(xué)與管理中的問題,促進(jìn)教育教學(xué)改革,提高教學(xué)管理工作的質(zhì)量和效率。

        1 關(guān)聯(lián)規(guī)則

        1.1 數(shù)據(jù)挖掘技術(shù)概述

        從具有隨機(jī)干擾、噪聲、錯(cuò)誤、缺失和不完整的大量數(shù)據(jù)中,將對(duì)人們有用的、隱含的、潛在的、未知的信息提取出來(lái)的操作,稱為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘技術(shù)在當(dāng)前形勢(shì)下應(yīng)運(yùn)而生。數(shù)據(jù)挖掘是一種深層次的數(shù)據(jù)信息分析方法,是從數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)和決策支持的過程,主要基于人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析原有數(shù)據(jù),做出歸納性的推理,從數(shù)據(jù)中挖掘出潛在的模式,預(yù)測(cè)分析對(duì)象的行為趨勢(shì),從而幫助決策或調(diào)整策略。數(shù)據(jù)挖掘的任務(wù)有關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等,其中最常用的是聚類分析和關(guān)聯(lián)規(guī)則分析。數(shù)據(jù)挖掘技術(shù)已成功地應(yīng)用在許多企業(yè)中,對(duì)提高企業(yè)經(jīng)濟(jì)效益和管理效率有顯著的影響。

        在中等職業(yè)教育領(lǐng)域,有很多可以挖掘的信息,如學(xué)生入學(xué)成績(jī)管理、學(xué)生在校成績(jī)管理、學(xué)生家庭狀況、入學(xué)率情況和畢業(yè)就業(yè)質(zhì)量等。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于對(duì)中職學(xué)校學(xué)生成績(jī)的分析,分析生源質(zhì)量與各種因素之間隱藏的內(nèi)在聯(lián)系,這對(duì)整個(gè)中職院校擴(kuò)大規(guī)模、提高辦學(xué)質(zhì)量具有重要的實(shí)踐意義。

        1.2 關(guān)聯(lián)規(guī)則概述

        數(shù)據(jù)挖掘中有一類問題,叫做關(guān)聯(lián)規(guī)則挖掘或頻繁項(xiàng)集挖掘。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘應(yīng)用最廣的一種方法。關(guān)聯(lián)規(guī)則挖掘是在海量的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)各項(xiàng)之間的關(guān)系關(guān)聯(lián)規(guī)則的支持度和置信度。它們分別反映了所發(fā)現(xiàn)規(guī)則的有用性和確定性。通過設(shè)定最小支持度閾值和最小置信度閾值,選取有趣的關(guān)聯(lián)規(guī)則。當(dāng)挖掘出的關(guān)聯(lián)規(guī)則的支持度和置信度都滿足這兩個(gè)閡值時(shí)就認(rèn)為這個(gè)規(guī)則是有效的,否則就是無(wú)效的,這些閾值一般可由領(lǐng)域?qū)<以O(shè)定。挖掘關(guān)聯(lián)規(guī)則的整個(gè)過程主要包括兩個(gè)方面,一個(gè)是發(fā)現(xiàn)頻繁項(xiàng)集:找出支持度大于等于用戶設(shè)置的最小支持度的項(xiàng)集;另一方面是生成關(guān)聯(lián)規(guī)則:由步驟一發(fā)現(xiàn)的頻繁項(xiàng)集生成關(guān)聯(lián)規(guī)則,并且這些關(guān)聯(lián)規(guī)則的置信度不小于用戶給定的最小置信度挖掘關(guān)聯(lián)規(guī)則的整個(gè)過程如圖1所示。

        圖1挖掘關(guān)聯(lián)規(guī)則的過程

        數(shù)據(jù)發(fā)掘技術(shù)中的關(guān)聯(lián)規(guī)則挖掘,是利用計(jì)算機(jī)自動(dòng)從大量的數(shù)據(jù)中去分析和發(fā)現(xiàn)有關(guān)聯(lián)的規(guī)則。計(jì)算機(jī)本身需要了解所有發(fā)生的情況,并依次整理,把相關(guān)的事件合并整理在一起,然后對(duì)每件事進(jìn)行掃描分析,以總結(jié)出事物的關(guān)聯(lián)性規(guī)律。數(shù)據(jù)挖掘技術(shù)對(duì)于中職的學(xué)生信息管理工作來(lái)說,是一種可以化繁瑣為簡(jiǎn)單的技術(shù),對(duì)于工作效率的提高以及工作準(zhǔn)確度的保證都有很重要的意義,因此在很多中職學(xué)校中,數(shù)據(jù)挖掘技術(shù)都被作為了其學(xué)生信息管理的研究工作的重點(diǎn)。

        2 Apriori算法

        Apriori算法是經(jīng)典的關(guān)聯(lián)規(guī)則的挖掘算法,被廣泛應(yīng)用于各種領(lǐng)域。Apriori算法主要用于發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫(kù)中的布爾型關(guān)聯(lián)規(guī)則,是一種尋找頻繁項(xiàng)集的基本算法,其基本原理是使用一種稱作逐層搜索的迭代方法,即用k項(xiàng)集去探索(k +1)項(xiàng)集針對(duì)大量的事務(wù)數(shù)據(jù)。從單個(gè)項(xiàng)開始逐個(gè)遍歷所有事務(wù),并與預(yù)設(shè)的最小支持度閾值相比較,如果支持度小于預(yù)設(shè)的閾值,則這一項(xiàng)將被刪除,進(jìn)而擴(kuò)充到所有事務(wù),頻繁項(xiàng)集就是最終保留下來(lái)的項(xiàng)的集合。關(guān)聯(lián)規(guī)則通過子集產(chǎn)生法來(lái)生成,與用于預(yù)設(shè)的最小置信度閾值相比,如果置信度低于這一閾值,則將這一關(guān)聯(lián)規(guī)則刪除,最終保留下來(lái)的關(guān)聯(lián)規(guī)則符合用戶需要。Apriori 算法可以描述如下:

        (1)產(chǎn)生頻繁一項(xiàng)集;

        (2)產(chǎn)生頻繁k(2→end)項(xiàng)集;

        (3)產(chǎn)生頻繁候選k項(xiàng)集;

        ①由頻繁k-1項(xiàng)集連接成為k項(xiàng)集;

        ②檢測(cè)k項(xiàng)集的所有的k-1子集是否為頻繁項(xiàng)集,若是該k 項(xiàng)集就成為了頻繁候選項(xiàng)集;

        (4)掃描事務(wù)數(shù)據(jù)庫(kù)D對(duì)每個(gè)候選k項(xiàng)集計(jì)數(shù)。

        (5)達(dá)到最少支持度的頻繁候選k項(xiàng)成為頻繁k項(xiàng)集。

        3 關(guān)聯(lián)規(guī)則在中職學(xué)校管理系統(tǒng)中的應(yīng)用

        3.1 數(shù)據(jù)分析過程

        實(shí)驗(yàn)使用的數(shù)據(jù)為桂林市衛(wèi)生學(xué)校2013、2014、2015級(jí)學(xué)生的數(shù)據(jù),數(shù)據(jù)分析過程如下圖2,從原始數(shù)據(jù)到發(fā)現(xiàn)規(guī)則的過程大致要經(jīng)過數(shù)據(jù)的準(zhǔn)備、預(yù)處理、數(shù)據(jù)挖掘與結(jié)果分析四個(gè)步驟。

        圖2數(shù)據(jù)分析過程

        3.2 關(guān)聯(lián)規(guī)則挖掘算法在中職招生中應(yīng)用

        在桂林市衛(wèi)生學(xué)校學(xué)生數(shù)據(jù)集合中,既存在布爾型的數(shù)據(jù)(如學(xué)生的性別、家庭住址),又存在數(shù)值型的數(shù)據(jù)(如學(xué)生的成績(jī))。根據(jù)數(shù)據(jù)的特征,選用Apriori作為數(shù)據(jù)挖掘算法,發(fā)現(xiàn)數(shù)據(jù)集合之間的關(guān)聯(lián)關(guān)系。將桂林市衛(wèi)生學(xué)校學(xué)生的入學(xué)成績(jī)與畢業(yè)信息進(jìn)行數(shù)據(jù)關(guān)聯(lián)分析,得出有利于選拔優(yōu)質(zhì)生源的有用信息。對(duì)2010-2012年學(xué)生的入學(xué)成績(jī)信息、在校成績(jī)信息和畢業(yè)信息進(jìn)行分析,設(shè)定支持度=10%,置信度=30%,挖掘出如表 1 所示的參考規(guī)則。

        表1參考規(guī)則

        序號(hào)參考規(guī)則 1初高中學(xué)校=重點(diǎn)學(xué)校→畢業(yè)生質(zhì)量=優(yōu) 2初高中學(xué)校=重點(diǎn)學(xué)?!厴I(yè)生質(zhì)量=良 3入學(xué)成績(jī)(平均分)=A或B→畢業(yè)生質(zhì)量=優(yōu) 4入學(xué)成績(jī)(平均分)=A或B→畢業(yè)生質(zhì)量=良 5入學(xué)成績(jī)(語(yǔ)文)=A或B→畢業(yè)生質(zhì)量=差 6入學(xué)成績(jī)(語(yǔ)文)=C或D→畢業(yè)生質(zhì)量=差 7在校成績(jī)(平均分)=A或B→畢業(yè)生質(zhì)量=優(yōu) 8在校成績(jī)(政治)=A或B→畢業(yè)生質(zhì)量=差 9在校成績(jī)(政治)=C或D→畢業(yè)生質(zhì)量=優(yōu) ……

        數(shù)據(jù)挖掘的結(jié)果在實(shí)際中不一定存在必然的聯(lián)系,要結(jié)合實(shí)際情況對(duì)得到的關(guān)聯(lián)規(guī)則加以分析,通過設(shè)置不同的支持度閥值和置信度閥值,可以得到不同的關(guān)聯(lián)規(guī)則。將規(guī)則庫(kù)加以調(diào)整,為招生工作提供輔助支持。例如:表1挖掘的規(guī)則是學(xué)生的生源入學(xué)成績(jī)與畢業(yè)生是否優(yōu)秀之間的關(guān)聯(lián)規(guī)則,先判斷產(chǎn)生的子集是否屬于生源特征資料維的,滿足這個(gè)條件才能挖出規(guī)則來(lái)。這樣可以有效地濾除有意義的關(guān)聯(lián)規(guī)則,減少數(shù)據(jù)的冗余。

        參考規(guī)則中的規(guī)則5和6入學(xué)成績(jī)(語(yǔ)文)=A或D→畢業(yè)生質(zhì)量=良,無(wú)論學(xué)生入學(xué)考試語(yǔ)文成績(jī)是高或是低,學(xué)生畢業(yè)的質(zhì)量都不是優(yōu),此條規(guī)則在挑選生源時(shí)沒有任何實(shí)際意義。而規(guī)則3和4入學(xué)成績(jī)(平均分)=A或D,學(xué)生畢業(yè)的質(zhì)量則是可以直觀看出,可見可以通過平均分來(lái)判斷生源質(zhì)量是否優(yōu)秀,此信息可以提供給學(xué)校作為是否錄取該生的條件。

        4 結(jié)論

        通過將關(guān)聯(lián)規(guī)則應(yīng)用到中職學(xué)校招生管理系統(tǒng),可對(duì)生源的質(zhì)量?jī)?yōu)劣進(jìn)行初步的分析和評(píng)價(jià)。關(guān)聯(lián)規(guī)則挖掘提供了一個(gè)進(jìn)行合理挖掘的模式和挖掘方向,加快了挖掘速度、減少了數(shù)據(jù)的冗余度,為該中職專院校招生管理提供了一個(gè)方向。

        招生階段是整個(gè)學(xué)生培養(yǎng)周期的最初階段,高質(zhì)量的生源是學(xué)生培養(yǎng)質(zhì)量的有力保證。數(shù)據(jù)挖掘技術(shù)作為中職專院校管理學(xué)生信息工作的有力工具,不但可以提高信息管理工作的效率,還對(duì)招生工作及相關(guān)政策的制定有一定的指導(dǎo)和幫助。數(shù)據(jù)挖掘技術(shù)在中職學(xué)生信息分析中可以發(fā)揮重要的作用,為制定科學(xué)的教育策略提供依據(jù)。只要選擇合適的分析對(duì)象、進(jìn)行合理的算法選擇,數(shù)據(jù)挖掘技術(shù)將在教育領(lǐng)域的其它方面獲得更多應(yīng)用。

        [1]王毅鵬.高職院校招生與就業(yè)管理信息系統(tǒng)的研究與實(shí)現(xiàn)[D].西安電子科技大學(xué),2012.

        [2]王暉,王琪,何瓊.數(shù)據(jù)挖掘理論與實(shí)例[M].北京:經(jīng)濟(jì)科學(xué)出版社,2012.

        [3]郭濤,張代遠(yuǎn).基于關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘Apriori算法的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011.

        [4]馮璐妹,趙建寧.基于Apriori的高效關(guān)聯(lián)規(guī)則挖掘算法在教育考試系統(tǒng)中的應(yīng)用研究[J].軟件,2013.

        [5]Huang Hong-zhi,Cai Yan-rong.Web-based design of the management information system for the chemical laboratory in the university. International Conference on Computer Design and Applications(ICCDA),2010.

        桂林市科學(xué)研究與技術(shù)開發(fā)計(jì)劃項(xiàng)目(2016010406-4)。

        猜你喜歡
        數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨(dú)的規(guī)則和演變
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        中文字幕人妻互换av| 亚洲国产成人手机在线观看| 四虎无码精品a∨在线观看| 国产女人av一级一区二区三区| 亚洲av无码偷拍在线观看| 亚洲小说区图片区另类春色| 在线观看无码一区二区台湾 | 日韩精品久久伊人中文字幕| 久草青青91在线播放| 久久一区二区三区老熟女| 国产不卡在线视频观看| 曰欧一片内射vα在线影院| 男人扒开女人双腿猛进女人机机里 | 亚洲伊人伊成久久人综合| 伦伦影院午夜理论片| 久久久精品人妻久久影视| av深夜福利在线| 丝袜美腿亚洲综合一区| av免费在线播放视频| 婷婷五月深深久久精品| 久久久久久免费毛片精品| 亚洲高清有码在线观看| 中文字幕一区乱码在线观看 | 国产98色在线 | 国产| 无码专区天天躁天天躁在线| 国产成人美女AV| 久久国产女同一区二区| 亚洲国产av无码精品无广告| 300部国产真实乱| 人妻无码ΑV中文字幕久久琪琪布 尤物AV无码色AV无码麻豆 | 成年视频国产免费观看| 日本一区二区久久精品亚洲中文无| 少妇人妻中文久久综合| 国产精品成人观看视频| 亚洲都市校园激情另类| 久久国产精品国语对白 | 亚洲国产长腿丝袜av天堂| 高清高速无码一区二区| 国产亚洲精品一区在线| 屁屁影院ccyy备用地址| 亚洲最大在线精品|