亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘在高校學(xué)生成績預(yù)警中的應(yīng)用研究

        2017-04-10 07:37:37陳苗馬燕
        電腦知識與技術(shù) 2017年4期
        關(guān)鍵詞:學(xué)生成績Apriori算法關(guān)聯(lián)規(guī)則

        陳苗++馬燕

        摘要:隨著高校教務(wù)系統(tǒng)數(shù)據(jù)庫中大量數(shù)據(jù)的積累,教師卻難以從中獲取有價值的信息。針對此現(xiàn)狀,利用數(shù)據(jù)挖掘中的Apriori算法,挖掘出頻繁項集的特點(diǎn),通過Apriori算法對學(xué)生成績進(jìn)行分析處理,預(yù)設(shè)支持度與置信度找出數(shù)據(jù)庫中具有聯(lián)系和不同可信度的課程成績作為關(guān)聯(lián)規(guī)則,將關(guān)聯(lián)規(guī)則用于學(xué)生成績預(yù)警,對處于危險區(qū)的學(xué)生提前作出預(yù)警通知。

        關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則 ;Apriori算法;學(xué)生成績;預(yù)警

        中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)04-0204-03

        伴隨著信息時代的飛速發(fā)展,數(shù)據(jù)大量積累,數(shù)據(jù)挖掘應(yīng)運(yùn)而生,并得到了廣泛關(guān)注。數(shù)據(jù)挖掘技術(shù)之所以能取得極大的關(guān)注,主要是可以處理的大量數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識。隨著高校的不斷擴(kuò)招,各校的生源量明顯增多,但就特別容易出現(xiàn)學(xué)生層次不均、成績參差不齊的現(xiàn)象。目前大部分高校教務(wù)處都是利用教務(wù)管理系統(tǒng)對學(xué)生的信息及成績進(jìn)行管理,但都存在沒有對學(xué)生的數(shù)據(jù)進(jìn)行統(tǒng)計和分析的問題。本文將通過導(dǎo)出學(xué)生的專業(yè)主干課程的成績,并對其進(jìn)行統(tǒng)計和分析,對部分不及格課程門數(shù)較多,即將面臨畢不了業(yè)或拿不到學(xué)位證的學(xué)生提出預(yù)警,對他們的學(xué)習(xí)過程進(jìn)行監(jiān)督。眾所周知,同一專業(yè)不同的課程之間必然存在著一定的聯(lián)系,本文通過利用數(shù)據(jù)挖掘技術(shù)對學(xué)生成績進(jìn)行統(tǒng)計、處理和全面的分析,挖掘出學(xué)生在各個課程成績之間存在的內(nèi)在聯(lián)系,找出其中的關(guān)系,全面掌握學(xué)生的學(xué)習(xí)情況,從而對這些成績不及格門數(shù)較多的學(xué)生提出預(yù)警,在今后的學(xué)習(xí)中,輔導(dǎo)員可根據(jù)分析結(jié)果加強(qiáng)對這些學(xué)生的學(xué)習(xí)過程的監(jiān)督和管理,提升學(xué)生的及格率,更進(jìn)一步的保證學(xué)校的畢業(yè)率。

        1關(guān)聯(lián)規(guī)則算法:Apriori算法

        1.1關(guān)聯(lián)規(guī)則

        設(shè)[II1,I2,…Im]為項的集合,與任務(wù)相關(guān)的數(shù)據(jù)[D]是數(shù)據(jù)庫事務(wù)的集合,其中每個任務(wù)T是項的集合,其中每個任務(wù)T是項的集合,使得[T?TID]為每個事務(wù)的標(biāo)識符。設(shè)[A]是一個項集,事務(wù)T包含[A]當(dāng)且僅當(dāng)[A?T]。關(guān)聯(lián)規(guī)則形如[如A?B的蘊(yùn)涵式],其中[A?I,B?I],并且滿足[A?B=?]。規(guī)則[A?B]在事務(wù)集[D]中成立,具有支持度[s],其中[s]是[D]中事務(wù)包含[A?B](即集合[A和B]的并或者[A和B]二者)的百分比,即是概率[P(A?B)],規(guī)則[A?B]在事務(wù)集[D]中具有置信度,其中[c是D]中包含[A]的事務(wù),同時也包含[B]的百分比。這是條件概率。即[supportA?B=P(A∪B)]

        [confidenceA?B=P(B|A)]

        同時滿足最小支持度閾值([min_sup])和最小置信閾值[(min_conf)]的規(guī)則稱作強(qiáng)規(guī)則【5】。

        1.2 Apriori算法

        Apriori算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則挖掘過程分解步驟:

        1)通過采用迭代的方法檢索出事務(wù)數(shù)據(jù)庫中所有頻繁項集。即找出事務(wù)數(shù)據(jù)庫D中所有大于等于指定最小支持度閾值的項目集。

        2)利用頻繁項目集挖掘出滿足用戶需要的強(qiáng)關(guān)聯(lián)規(guī)則。即找出支持度和置信度大于等用戶給定的支持度和置信度閾值的關(guān)聯(lián)規(guī)則。

        尋找頻繁項集是挖掘關(guān)聯(lián)的最核心的一步,對挖掘關(guān)聯(lián)規(guī)則的總體性能起到了決定性的作用。第二步是在第一步找到的頻繁項集的基礎(chǔ)上列出所有可能的關(guān)聯(lián)規(guī)則,同時,找出滿足支持度和置信度要求的強(qiáng)關(guān)聯(lián)規(guī)則即可【5】。

        2 Apriori算法在學(xué)生成績分析中的應(yīng)用

        2.1數(shù)據(jù)預(yù)處理

        以某大學(xué)2013級計算機(jī)科學(xué)與技術(shù)專業(yè)學(xué)生的專業(yè)課程成績?yōu)槔?,如?所示,從教務(wù)管理系統(tǒng)中導(dǎo)出該班級的成績,利用關(guān)聯(lián)規(guī)則算法挖掘課程和學(xué)生成績之間關(guān)系。原始數(shù)據(jù)表分學(xué)年進(jìn)行存儲,其中包括本學(xué)年的班級所有學(xué)生的專業(yè)必修課和專業(yè)選修課的成績。

        2.1.1課程選擇

        相比而言,學(xué)生公選課程范圍比較廣,甚至?xí)霈F(xiàn)一個班級只有一名學(xué)生選擇同一門課程的現(xiàn)象,即僅有一個事務(wù)包含此項目,不滿足關(guān)聯(lián)規(guī)則的最小支持度的要求。根據(jù)2013級計算機(jī)專業(yè)的成績單顯示,同班學(xué)生選擇同一門公選課的較少,所以公選課的成績不作為數(shù)據(jù)來源,不對此進(jìn)行分析。因此,數(shù)據(jù)庫的數(shù)據(jù)包含學(xué)生的專業(yè)必修課成績和專業(yè)選修課成績。

        2.1.2成績離散化處理

        學(xué)生的原始成績由百分制或等級制表現(xiàn)出來的,我們需要將這些成績進(jìn)行統(tǒng)一化處理,將成績分為4個類別。百分制成績劃分如下:成績大于或等于90分,等級為1;成績大于等于80且小于90分,等級為2;成績大于等于60且小于80分的等級為3;成績小于60,成績等級為4。根據(jù)本專業(yè)的人才培養(yǎng)方案,選取15門課程進(jìn)行研究,分別對這些課程用字母A~O進(jìn)行標(biāo)識。

        2.2數(shù)據(jù)處理

        2.2.1數(shù)據(jù)轉(zhuǎn)化

        根據(jù)成績等級劃分規(guī)則和課程標(biāo)識碼,將該班級學(xué)生的課程成績做成事務(wù)表,轉(zhuǎn)化后的數(shù)據(jù)如表2所示。

        2.2.2數(shù)據(jù)統(tǒng)計

        從教務(wù)處系統(tǒng)中導(dǎo)出來的成績可能出現(xiàn)重復(fù)或者學(xué)生缺考導(dǎo)致成績空缺的現(xiàn)象。對于重復(fù)的數(shù)據(jù),選擇學(xué)生初修成績,將缺考的成績修改為0。統(tǒng)計離散化后全部成績,得到的部分統(tǒng)計結(jié)果如下:

        [等級 課程\&高等數(shù)學(xué)1\&電工技術(shù)基礎(chǔ)\&計算機(jī)導(dǎo)論\&C語言程序設(shè)計\&高等數(shù)學(xué)2\&線性代數(shù)\&數(shù)字邏輯電路\&數(shù)據(jù)結(jié)構(gòu)\&離散數(shù)學(xué)\&匯編語言程序設(shè)計\&網(wǎng)站建設(shè)與

        網(wǎng)頁制作\&…\&等級1\&1\&2\&1\&1\&1\&2\&3\&4\&2\&3\&1\&…\&等級2\&2\&6\&6\&7\&4\&8\&4\&7\&3\&3\&15\&…\&等級3\&16\&13\&15\&15\&14\&12\&16\&10\&14\&14\&7\&…\&等級4\&4\&2\&0\&0\&4\&1\&0\&2\&4\&3\&0\&…\&]

        由表3可以看出,部分課程集中于某一個等級,如”高等數(shù)學(xué)”課程,16人等級為4,其他等級人數(shù)7人,該班級的人數(shù)為23,其余7名同學(xué)所占比例7/23,即關(guān)聯(lián)規(guī)則的最小支持度不到1/3。設(shè)定關(guān)聯(lián)規(guī)則的最小支持度為1/3,當(dāng)某門課程等級學(xué)生不足7名時,將其排除在待數(shù)據(jù)挖掘數(shù)據(jù)庫中。通過統(tǒng)計,得到如下以0.33作為最小支持度篩選的數(shù)據(jù)。

        [等級 課程\&高等數(shù)學(xué)1\&電工技術(shù)基礎(chǔ)\&計算機(jī)導(dǎo)論\&C語言程序設(shè)計\&高等數(shù)學(xué)2\&線性代數(shù)\&數(shù)字邏輯電路\&數(shù)據(jù)結(jié)構(gòu)\&離散數(shù)學(xué)\&匯編語言程序設(shè)計\&網(wǎng)站建設(shè)與

        網(wǎng)頁制作\&…\&等級1\&1\&2\&1\&1\&1\&2\&3\&4\&2\&3\&1\&…\&等級2\&2\&6\&6\&7\&4\&8\&4\&7\&3\&3\&15\&…\&等級3\&16\&13\&15\&15\&14\&12\&16\&10\&14\&14\&7\&…\&等級4\&4\&2\&0\&0\&4\&1\&0\&2\&4\&3\&0\&…\&]

        2.3算法實(shí)現(xiàn)

        通過對數(shù)據(jù)的預(yù)處理,我們采用關(guān)聯(lián)規(guī)則Apriori算法對數(shù)據(jù)進(jìn)行挖掘。本文的實(shí)現(xiàn)環(huán)境為Window 7 系統(tǒng),MATLAB2014a下進(jìn)行編程。設(shè)置最小支持度為0.33,最小置信度為0.5。得到了352個頻繁項集,540條關(guān)聯(lián)規(guī)則。對部分結(jié)果進(jìn)行分析可知課程A、課程E、課程F存在著兩兩相關(guān)、相互制約的關(guān)系,學(xué)生的成績普遍較低,課程C與課程G、課程D與課程H也存在著兩兩相關(guān)、互相影響的關(guān)系。通過對數(shù)據(jù)表的檢索,可找出符合此關(guān)聯(lián)規(guī)則的學(xué)生,由輔導(dǎo)員對這些學(xué)生發(fā)出預(yù)警通知。本文通過對學(xué)生實(shí)際成績數(shù)據(jù)進(jìn)行檢驗(yàn),對以上規(guī)則進(jìn)行驗(yàn)證。通過提出預(yù)警,加強(qiáng)對學(xué)生的學(xué)習(xí)過程的監(jiān)督和管理,有效避免學(xué)生出現(xiàn)不能畢業(yè)或拿不到學(xué)位證的情況。

        3 結(jié)束語

        總之,以關(guān)聯(lián)規(guī)則算法為基礎(chǔ),通過對學(xué)生成績的處理、統(tǒng)計、分析和挖掘,,得到了關(guān)聯(lián)規(guī)則作為學(xué)生成績的預(yù)警因子,對成績不理想的學(xué)生提出預(yù)警通知,一方面加強(qiáng)了對學(xué)生成績的管理,另一方面也有效的提升教學(xué)管理水平和學(xué)生的畢業(yè)率。但Apriori算法過于繁雜,可通過改進(jìn)Apriori算法來提高檢索效率,從而不斷完善成績預(yù)警,更好地為教育事業(yè)服務(wù)。

        參考文獻(xiàn):

        [1] 李紅林,孔德劍.基于Apriori算法的高教教學(xué)評價數(shù)據(jù)挖掘[J].中國科技信息,2010,22(21):241-242.

        [2] 袁漢寧,王樹良.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2015:126-127.

        [3] 張皓.數(shù)據(jù)挖掘技術(shù)在構(gòu)建學(xué)生成績預(yù)警系統(tǒng)的應(yīng)用[J].電腦知識與技術(shù),2011,19(7):4529-4530

        [4] 張瑋.基于數(shù)據(jù)挖掘的高校學(xué)生成績預(yù)警系統(tǒng)設(shè)計[J].科技資訊,2013(6):23.

        [5] Jiawei Han, Micheline Kamber.Data Mining Concepts and Techniques[M].北京:機(jī)械工業(yè)出版社,2011.

        [6] 梁嘯.基于數(shù)據(jù)挖掘的高校學(xué)生成績預(yù)警技術(shù)的研究[D].武漢:武漢理工大學(xué),2014:33-35.

        猜你喜歡
        學(xué)生成績Apriori算法關(guān)聯(lián)規(guī)則
        淺析數(shù)據(jù)挖掘技術(shù)在學(xué)生管理系統(tǒng)中的應(yīng)用
        東方教育(2016年20期)2017-01-17 20:57:58
        基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于云平臺MapReduce的Apriori算法研究
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
        高職數(shù)學(xué)分層教學(xué)學(xué)生成績評價的數(shù)學(xué)模型
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關(guān)聯(lián)規(guī)則的計算機(jī)入侵檢測方法
        Excel+VBA開發(fā)之《學(xué)生成績管理系統(tǒng)》的設(shè)計與實(shí)現(xiàn)
        精品无码国产自产拍在线观看| 国产三级精品三级在线| 国产精品毛片av毛片一区二区| 亚洲国产精品无码久久一线| 国产真实夫妇视频| 国产亚洲精品成人无码精品网站| 中文字幕日本韩国精品免费观看| 亚洲av无一区二区三区| 高潮潮喷奶水飞溅视频无码| 久久精品国产亚洲av高清色欲| 精品视频在线观看一区二区三区| 中文字日产幕码三区做法| 国产精品成熟老女人| www插插插无码免费视频网站 | 黑丝美女喷水在线观看| 少妇爽到高潮免费视频| 欧美色欧美亚洲另类二区| 双腿张开被9个黑人调教影片| 色人阁第四色视频合集网| 久草手机视频在线观看| 一本久道综合在线无码人妻| 亚洲福利视频一区| 精品日本一区二区视频| 大陆老熟女自拍自偷露脸| 国产婷婷色综合av蜜臀av| 麻豆变态另类视频在线观看| 久久精品国产亚洲av日韩精品| 人妻丰满熟妇aⅴ无码| 亚洲精品久久国产高清情趣图文| 乱色视频中文字幕在线看| 99青青草视频在线观看| 亚洲av永久中文无码精品综合| 四虎精品视频| 青青草视频在线你懂的| 91中文人妻熟女乱又乱| 亚洲欧洲偷自拍图片区| av草草久久久久久久久久久 | 邻居少妇张开腿让我爽视频| 在线无码中文字幕一区| 欧美老妇与zozoz0交| 美女视频永久黄网站免费观看国产|