亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于頻繁項(xiàng)集的學(xué)生選課行為分析

        2018-10-27 11:25:08江君董顯亮王相娥
        科技視界 2018年16期
        關(guān)鍵詞:數(shù)據(jù)挖掘

        江君 董顯亮 王相娥

        【摘 要】在大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析深度融合到各行各業(yè)中,教育作為數(shù)據(jù)挖掘逐步涉及的領(lǐng)域,許多技術(shù)得到了快速的發(fā)展。當(dāng)今大部分高校對(duì)學(xué)生行為的分析存在著較大的盲區(qū),本文依據(jù)教育數(shù)據(jù)挖掘技術(shù),通過(guò)關(guān)聯(lián)規(guī)則挖掘,對(duì)學(xué)生課程選擇的最小關(guān)聯(lián)規(guī)則進(jìn)行挖掘,以此進(jìn)行學(xué)生的行為分析?;贏PRIOR算法發(fā)現(xiàn)并生成頻繁項(xiàng)集,從中挖掘出同時(shí)滿足最小支持度和最小置信度的強(qiáng)關(guān)聯(lián)規(guī)則,并建立學(xué)生選課關(guān)聯(lián)特征模型,分析其中的特殊聯(lián)系及潛在規(guī)律。最后,通過(guò)實(shí)驗(yàn)驗(yàn)證該算法具有實(shí)際意義,對(duì)提高學(xué)校的管理和教學(xué)以及對(duì)學(xué)生更好的認(rèn)識(shí)自身提供幫助。

        【關(guān)鍵詞】數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;行為分析

        中圖分類號(hào): G642 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 2095-2457(2018)16-0132-002

        DOI:10.19694/j.cnki.issn2095-2457.2018.16.060

        【Abstract】In the Big data age,the data analysis is deeply integrated into all walks of life,education as data mining gradually involved in the field,many technologies have been rapid development.Nowadays,most colleges and universities have a big blind spot in the analysis of students behavior,based on the education data mining technology, this paper excavates the minimum Association rules of Students course selection by mining the association rules,in order to analyze the students behavior.Based on the Aprior algorithm,the frequent itemsets are discovered and generated,and the strong association rules satisfying the minimum support and the minimum confidence are excavated, and the characteristic model of the students elective course is established,and the special relationship and the potential rules are analyzed.Finally,the experiment verifies that the algorithm has practical significance,and it can help to improve the management and teaching of the school and the students better understanding.

        【Key words】Data mining;Association Rules;Behavioral analysis

        0 引言

        隨著我國(guó)信息技術(shù)與教育深度融合工作的全面展開(kāi),以及互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等新一代信息科學(xué)技術(shù)的高速發(fā)展,人們對(duì)客觀世界的認(rèn)識(shí)和數(shù)據(jù)管理水平的逐步提高。教育成為數(shù)據(jù)挖掘逐步涉及的領(lǐng)域[1],使得許多技術(shù)得到了快速的發(fā)展(例如關(guān)聯(lián)規(guī)則挖掘,序列模式挖掘等技術(shù)),這也進(jìn)一步促進(jìn)了教育數(shù)據(jù)挖掘技術(shù)的發(fā)展。當(dāng)前我國(guó)大學(xué)生的教育,存在著較為嚴(yán)重的學(xué)生行為分析盲區(qū)。我們需要從這些海量的數(shù)據(jù)資源中去挖掘出更深層次對(duì)學(xué)校和教師有意義的信息[2]。通過(guò)潛在的學(xué)生行為產(chǎn)生的數(shù)據(jù),對(duì)學(xué)生的選課行為做出分析,進(jìn)而教學(xué)管理者能夠更好的制定管理策略和教學(xué)策略,這對(duì)學(xué)校的管理和教學(xué)有著十分重要的意義。同時(shí)進(jìn)一步促進(jìn)了教育與數(shù)據(jù)挖掘技術(shù)的發(fā)展。

        1 APRIOR算法

        APRIOR算法作為一種挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法,其基本思想是:首先找出所有的頻集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。然后由頻集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小可信度。然后使用第一步找到的頻集產(chǎn)生期望的規(guī)則,產(chǎn)生只包含集合的項(xiàng)的所有規(guī)則,其中每一條規(guī)則的右部都只有一項(xiàng)。一旦這些規(guī)則被生成,那么只有那些大于用戶給定的最小可信度的規(guī)則才被留下來(lái)。為了生成所有頻集,使用了遞歸的方法。該算法已經(jīng)被廣泛的應(yīng)用到商業(yè)、網(wǎng)絡(luò)安全等各個(gè)領(lǐng)域。

        2 基于APRIOR算法的選課行為分析

        2.1 數(shù)據(jù)來(lái)源與預(yù)處理

        本研究選取由遼寧省某大學(xué)選修教學(xué)課程管理中心提供的2014-2016級(jí)學(xué)生選修課學(xué)習(xí)數(shù)據(jù)作為數(shù)據(jù)源,其格式如表1所示:

        為了有效的挖掘,需要對(duì)以上數(shù)據(jù)表進(jìn)行數(shù)據(jù)清理,避免出現(xiàn)包含噪聲、不完整、不一致的數(shù)據(jù)。例如采用忽略元組法將未開(kāi)課程、中停課程的相應(yīng)記錄刪除;個(gè)別學(xué)生沒(méi)有正確錄入課程的,把課程相應(yīng)數(shù)據(jù)補(bǔ)錄正確。同學(xué)們的ID,姓名,學(xué)號(hào)等隱私數(shù)據(jù)通過(guò)ExcelAPI中函數(shù)進(jìn)行了合理的變形從而達(dá)到脫敏的效果。通過(guò)數(shù)據(jù)清洗和隱私數(shù)據(jù)脫敏處理后,最終采集到25860條有效記錄。

        2.2 關(guān)聯(lián)規(guī)則挖掘

        2.2.1 生成頻繁1項(xiàng)集

        在Python中,集合類型set是可變的,不存在哈希值。而frozenset是凍結(jié)的集合類型,不可變、存在哈希值。因此,使用frozenset類型存儲(chǔ)的頻繁項(xiàng),可以作為字典的key保存下來(lái),有利于后續(xù)創(chuàng)建頻繁項(xiàng)集集合(key為頻繁項(xiàng),value為支持度)。由于頻繁項(xiàng)的長(zhǎng)度為1,我們可以通過(guò)統(tǒng)計(jì)data中各個(gè)元素出現(xiàn)的頻次,直接生成頻繁1項(xiàng)集。項(xiàng)集使用Python中的字典類型進(jìn)行存儲(chǔ),key表示頻繁項(xiàng),value表示對(duì)應(yīng)的支持度。我們將最小支持度設(shè)為15。

        2.2.2 生成頻繁k項(xiàng)集

        從k>=2開(kāi)始,根據(jù)得到的頻繁(k-1)項(xiàng)集,生成頻繁k項(xiàng)集。這個(gè)過(guò)程由函數(shù)getFrequentItemSetWithSupport()負(fù)責(zé)(簡(jiǎn)稱gFISWS()函數(shù)),返回k頻繁項(xiàng)集。反復(fù)調(diào)用gFISWS()函數(shù), 得到完整的頻繁k項(xiàng)集集合,直到達(dá)到停止條件,集頻繁k項(xiàng)集為空。在連接步中,將頻繁(k-1)項(xiàng)集與自身連結(jié),生成k項(xiàng)候選集candidate_items。在剪枝步中,使用先驗(yàn)性質(zhì)對(duì)候選項(xiàng)集進(jìn)行過(guò)濾,減少運(yùn)算量。這個(gè)性質(zhì)就是:頻繁項(xiàng)集的所有非空子集必然是頻繁項(xiàng)集。

        2.2.3 生成關(guān)聯(lián)規(guī)則

        我們從頻繁項(xiàng)集中抽取關(guān)聯(lián)規(guī)則,形如"如果學(xué)生學(xué)習(xí)過(guò)課程A,那么下學(xué)期還會(huì)去學(xué)習(xí)課程B"的結(jié)論[3]。我們針對(duì)每個(gè)頻繁項(xiàng)集,生成關(guān)聯(lián)規(guī)則(包括條件和結(jié)論),并計(jì)算出相應(yīng)的置信度。生成頻繁項(xiàng)集之后,可以得到同時(shí)滿足最小支持度和最小置信度的強(qiáng)關(guān)聯(lián)規(guī)則。例如,對(duì)于頻繁項(xiàng)集{'X','Y'}來(lái)說(shuō),關(guān)聯(lián)規(guī)則X→Y的置信度如下所示:

        對(duì)于頻繁k項(xiàng)集中的每個(gè)元素value,調(diào)用getAllSubsets()函數(shù)得到value的所有非空子集,對(duì)于非空子集中的每個(gè)元素condition,找到除去condition的所有剩余元素conclusion_items,根據(jù)置信度公式,計(jì)算confidence,將所有滿足條件(>min_conf)的潛在關(guān)聯(lián)規(guī)則[[condition,conclusoin_items],confidence]放入association_rules中.

        2.3 規(guī)則與結(jié)果分析

        2.3.1 關(guān)聯(lián)規(guī)則轉(zhuǎn)換

        data.csv中存儲(chǔ)了課程信息,通過(guò)附加ExcelAPI加載項(xiàng),我們可以獲取課程的具體信息,將關(guān)聯(lián)規(guī)則中的課程ID信息,替換為課程名稱。

        2.3.2 關(guān)聯(lián)規(guī)則結(jié)果分析

        這一環(huán)節(jié)最終將抽取的關(guān)聯(lián)規(guī)則計(jì)算出相應(yīng)的置信度,數(shù)據(jù)結(jié)果如表2所示。從149門課程,9169名學(xué)生中我們用頻繁項(xiàng)關(guān)聯(lián)技術(shù)識(shí)別出每位學(xué)生身上最常見(jiàn)的選課行為,由于生成數(shù)據(jù)集的關(guān)聯(lián)規(guī)則較多,為了便于展示截取一部分截圖。在最小支持度為15的情況下,情形一大部分學(xué)生在選擇“中醫(yī)養(yǎng)生與保健1”“應(yīng)聘與口語(yǔ)交際”兩門課的前提下,第三門課程絕大多數(shù)會(huì)選擇“易經(jīng)與人生”。情形二大部分學(xué)生在選擇“密碼學(xué)基礎(chǔ)1”,“人際交往心理學(xué)”兩門課的前提下,第三門課程絕大多數(shù)會(huì)選擇“影視鑒賞”。以情形一為例,不難得出“中醫(yī)養(yǎng)生與保健1”與“易經(jīng)與人生”這兩門課的相關(guān)度是非常高的,而與之并列出現(xiàn)的“應(yīng)聘與口語(yǔ)交際”課程反而顯得更為有價(jià)值。結(jié)合所選高校校內(nèi)規(guī)定課程庫(kù)中所有課程分為藝術(shù)類A,素質(zhì)類Q,人文類H,自然科學(xué)類N四大類,學(xué)生四年在校學(xué)習(xí)期間需修滿AQHN四類學(xué)科,絕大部分的學(xué)生同一類的課程只會(huì)選一次。因此加上AQHN類型限制條件對(duì)數(shù)據(jù)結(jié)果進(jìn)行重定義分析,數(shù)據(jù)集的結(jié)果變得更為的貼切真實(shí)情況。

        3 結(jié)論

        本文通過(guò)數(shù)據(jù)集的挖掘,選擇最小關(guān)聯(lián)規(guī)則以此發(fā)現(xiàn)大學(xué)生選課過(guò)程中的特殊聯(lián)系以及潛在相關(guān)度。通過(guò)這些潛在信息和關(guān)聯(lián)規(guī)則,管理者可以更好地制定管理策略和教學(xué)策略,這對(duì)提高學(xué)校的管理和教學(xué)以及對(duì)學(xué)生更好的認(rèn)識(shí)自身都具有著非常重要的意義,也進(jìn)一步推進(jìn)了社會(huì)對(duì)教育類數(shù)據(jù)挖掘分析的進(jìn)程。

        【參考文獻(xiàn)】

        [1]孫云帆,齊美玲.數(shù)據(jù)挖掘在教育應(yīng)用中的淺析[J].商場(chǎng)現(xiàn)代化,2012(24):161-162.

        [2]劉建煒,張穎.基于學(xué)習(xí)歷程數(shù)據(jù)分析的學(xué)生行為預(yù)測(cè)研究[J].阜陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,33(01):68-72.

        [3]姜永超.基于數(shù)據(jù)挖掘的學(xué)生選課及學(xué)習(xí)行為分析算法研究[J].現(xiàn)代電子技術(shù),2016,39(13):145-148.

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘在高校圖書(shū)館中的應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開(kāi)發(fā)實(shí)踐
        中文字幕日本人妻一区| 亚洲熟妇丰满多毛xxxx| 国产精品一区二区在线观看| 97超级碰碰人妻中文字幕| 亚洲AVAv电影AV天堂18禁| 亚洲中文字幕第一页免费| 色老头一区二区三区| 亚洲亚洲亚洲亚洲亚洲天堂| 亚洲综合视频一区二区| 亚洲av成人片色在线观看高潮| 97精品伊人久久大香线蕉| 日韩欧美精品有码在线观看| 狼人精品剧情av在线观看| 亚洲av综合av国产av中文| 欧美国产日韩a在线视频| 精品久久久久久99人妻| 免费看av网站在线亚洲| 少妇裸体性生交| 国产极品久久久久极品| 久久久久久无码AV成人影院| 中国亚洲av第一精品| 国产精品成人免费视频一区| 五月天精品视频在线观看| 亚洲一区丝袜美腿在线观看| 综合亚洲二区三区四区在线| 午夜性色一区二区三区不卡视频| 国产精品一区二区 尿失禁| 亚洲av套图一区二区| 日韩一区av二区三区| 48久久国产精品性色aⅴ人妻 | 国产欧美成人一区二区a片| 巨熟乳波霸若妻在线播放| 色婷婷亚洲十月十月色天| 日韩人妻精品中文字幕专区| 99re8这里有精品热视频免费| 亚洲色欲久久久综合网| 国产不卡av一区二区三区| 99热在线观看| 亚洲福利视频一区| 国产一区二区三区涩涩| 亚洲国产成人精品无码区在线播放|