亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于頻繁項集的學生選課行為分析

        2018-10-27 11:25:08江君董顯亮王相娥
        科技視界 2018年16期
        關鍵詞:行為分析關聯規(guī)則數據挖掘

        江君 董顯亮 王相娥

        【摘 要】在大數據時代,數據分析深度融合到各行各業(yè)中,教育作為數據挖掘逐步涉及的領域,許多技術得到了快速的發(fā)展。當今大部分高校對學生行為的分析存在著較大的盲區(qū),本文依據教育數據挖掘技術,通過關聯規(guī)則挖掘,對學生課程選擇的最小關聯規(guī)則進行挖掘,以此進行學生的行為分析?;贏PRIOR算法發(fā)現并生成頻繁項集,從中挖掘出同時滿足最小支持度和最小置信度的強關聯規(guī)則,并建立學生選課關聯特征模型,分析其中的特殊聯系及潛在規(guī)律。最后,通過實驗驗證該算法具有實際意義,對提高學校的管理和教學以及對學生更好的認識自身提供幫助。

        【關鍵詞】數據挖掘;關聯規(guī)則;行為分析

        中圖分類號: G642 文獻標識碼: A 文章編號: 2095-2457(2018)16-0132-002

        DOI:10.19694/j.cnki.issn2095-2457.2018.16.060

        【Abstract】In the Big data age,the data analysis is deeply integrated into all walks of life,education as data mining gradually involved in the field,many technologies have been rapid development.Nowadays,most colleges and universities have a big blind spot in the analysis of students behavior,based on the education data mining technology, this paper excavates the minimum Association rules of Students course selection by mining the association rules,in order to analyze the students behavior.Based on the Aprior algorithm,the frequent itemsets are discovered and generated,and the strong association rules satisfying the minimum support and the minimum confidence are excavated, and the characteristic model of the students elective course is established,and the special relationship and the potential rules are analyzed.Finally,the experiment verifies that the algorithm has practical significance,and it can help to improve the management and teaching of the school and the students better understanding.

        【Key words】Data mining;Association Rules;Behavioral analysis

        0 引言

        隨著我國信息技術與教育深度融合工作的全面展開,以及互聯網、大數據、云計算等新一代信息科學技術的高速發(fā)展,人們對客觀世界的認識和數據管理水平的逐步提高。教育成為數據挖掘逐步涉及的領域[1],使得許多技術得到了快速的發(fā)展(例如關聯規(guī)則挖掘,序列模式挖掘等技術),這也進一步促進了教育數據挖掘技術的發(fā)展。當前我國大學生的教育,存在著較為嚴重的學生行為分析盲區(qū)。我們需要從這些海量的數據資源中去挖掘出更深層次對學校和教師有意義的信息[2]。通過潛在的學生行為產生的數據,對學生的選課行為做出分析,進而教學管理者能夠更好的制定管理策略和教學策略,這對學校的管理和教學有著十分重要的意義。同時進一步促進了教育與數據挖掘技術的發(fā)展。

        1 APRIOR算法

        APRIOR算法作為一種挖掘關聯規(guī)則的頻繁項集算法,其基本思想是:首先找出所有的頻集,這些項集出現的頻繁性至少和預定義的最小支持度一樣。然后由頻集產生強關聯規(guī)則,這些規(guī)則必須滿足最小支持度和最小可信度。然后使用第一步找到的頻集產生期望的規(guī)則,產生只包含集合的項的所有規(guī)則,其中每一條規(guī)則的右部都只有一項。一旦這些規(guī)則被生成,那么只有那些大于用戶給定的最小可信度的規(guī)則才被留下來。為了生成所有頻集,使用了遞歸的方法。該算法已經被廣泛的應用到商業(yè)、網絡安全等各個領域。

        2 基于APRIOR算法的選課行為分析

        2.1 數據來源與預處理

        本研究選取由遼寧省某大學選修教學課程管理中心提供的2014-2016級學生選修課學習數據作為數據源,其格式如表1所示:

        為了有效的挖掘,需要對以上數據表進行數據清理,避免出現包含噪聲、不完整、不一致的數據。例如采用忽略元組法將未開課程、中停課程的相應記錄刪除;個別學生沒有正確錄入課程的,把課程相應數據補錄正確。同學們的ID,姓名,學號等隱私數據通過ExcelAPI中函數進行了合理的變形從而達到脫敏的效果。通過數據清洗和隱私數據脫敏處理后,最終采集到25860條有效記錄。

        2.2 關聯規(guī)則挖掘

        2.2.1 生成頻繁1項集

        在Python中,集合類型set是可變的,不存在哈希值。而frozenset是凍結的集合類型,不可變、存在哈希值。因此,使用frozenset類型存儲的頻繁項,可以作為字典的key保存下來,有利于后續(xù)創(chuàng)建頻繁項集集合(key為頻繁項,value為支持度)。由于頻繁項的長度為1,我們可以通過統計data中各個元素出現的頻次,直接生成頻繁1項集。項集使用Python中的字典類型進行存儲,key表示頻繁項,value表示對應的支持度。我們將最小支持度設為15。

        2.2.2 生成頻繁k項集

        從k>=2開始,根據得到的頻繁(k-1)項集,生成頻繁k項集。這個過程由函數getFrequentItemSetWithSupport()負責(簡稱gFISWS()函數),返回k頻繁項集。反復調用gFISWS()函數, 得到完整的頻繁k項集集合,直到達到停止條件,集頻繁k項集為空。在連接步中,將頻繁(k-1)項集與自身連結,生成k項候選集candidate_items。在剪枝步中,使用先驗性質對候選項集進行過濾,減少運算量。這個性質就是:頻繁項集的所有非空子集必然是頻繁項集。

        2.2.3 生成關聯規(guī)則

        我們從頻繁項集中抽取關聯規(guī)則,形如"如果學生學習過課程A,那么下學期還會去學習課程B"的結論[3]。我們針對每個頻繁項集,生成關聯規(guī)則(包括條件和結論),并計算出相應的置信度。生成頻繁項集之后,可以得到同時滿足最小支持度和最小置信度的強關聯規(guī)則。例如,對于頻繁項集{'X','Y'}來說,關聯規(guī)則X→Y的置信度如下所示:

        對于頻繁k項集中的每個元素value,調用getAllSubsets()函數得到value的所有非空子集,對于非空子集中的每個元素condition,找到除去condition的所有剩余元素conclusion_items,根據置信度公式,計算confidence,將所有滿足條件(>min_conf)的潛在關聯規(guī)則[[condition,conclusoin_items],confidence]放入association_rules中.

        2.3 規(guī)則與結果分析

        2.3.1 關聯規(guī)則轉換

        data.csv中存儲了課程信息,通過附加ExcelAPI加載項,我們可以獲取課程的具體信息,將關聯規(guī)則中的課程ID信息,替換為課程名稱。

        2.3.2 關聯規(guī)則結果分析

        這一環(huán)節(jié)最終將抽取的關聯規(guī)則計算出相應的置信度,數據結果如表2所示。從149門課程,9169名學生中我們用頻繁項關聯技術識別出每位學生身上最常見的選課行為,由于生成數據集的關聯規(guī)則較多,為了便于展示截取一部分截圖。在最小支持度為15的情況下,情形一大部分學生在選擇“中醫(yī)養(yǎng)生與保健1”“應聘與口語交際”兩門課的前提下,第三門課程絕大多數會選擇“易經與人生”。情形二大部分學生在選擇“密碼學基礎1”,“人際交往心理學”兩門課的前提下,第三門課程絕大多數會選擇“影視鑒賞”。以情形一為例,不難得出“中醫(yī)養(yǎng)生與保健1”與“易經與人生”這兩門課的相關度是非常高的,而與之并列出現的“應聘與口語交際”課程反而顯得更為有價值。結合所選高校校內規(guī)定課程庫中所有課程分為藝術類A,素質類Q,人文類H,自然科學類N四大類,學生四年在校學習期間需修滿AQHN四類學科,絕大部分的學生同一類的課程只會選一次。因此加上AQHN類型限制條件對數據結果進行重定義分析,數據集的結果變得更為的貼切真實情況。

        3 結論

        本文通過數據集的挖掘,選擇最小關聯規(guī)則以此發(fā)現大學生選課過程中的特殊聯系以及潛在相關度。通過這些潛在信息和關聯規(guī)則,管理者可以更好地制定管理策略和教學策略,這對提高學校的管理和教學以及對學生更好的認識自身都具有著非常重要的意義,也進一步推進了社會對教育類數據挖掘分析的進程。

        【參考文獻】

        [1]孫云帆,齊美玲.數據挖掘在教育應用中的淺析[J].商場現代化,2012(24):161-162.

        [2]劉建煒,張穎.基于學習歷程數據分析的學生行為預測研究[J].阜陽師范學院學報(自然科學版),2016,33(01):68-72.

        [3]姜永超.基于數據挖掘的學生選課及學習行為分析算法研究[J].現代電子技術,2016,39(13):145-148.

        猜你喜歡
        行為分析關聯規(guī)則數據挖掘
        探討人工智能與數據挖掘發(fā)展趨勢
        基于并行計算的大數據挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于北斗衛(wèi)星導航的罪犯行為分析方法
        關聯規(guī)則,數據分析的一把利器
        數據挖掘在高校課堂教學質量評價體系中的應用
        物理教師課堂教學板書與媒體呈現行為的分析與策略
        基于行為分析的木馬檢測系統設計與實現
        金融經濟中的金融套利行為分析及若干研究
        經營者(2016年12期)2016-10-21 09:12:11
        關聯規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關聯規(guī)則的計算機入侵檢測方法
        五月婷婷激情小说| 亚洲av永久无码天堂网| 国产在线无码精品无码| 国产欧美日韩精品丝袜高跟鞋| 又色又爽又高潮免费视频观看| 无码av免费精品一区二区三区| 在线中文字幕有码中文| 亚洲AV无码久久精品国产老人| 国产免费的视频一区二区| 日韩人妻一区二区中文字幕| 天天射综合网天天插天天干| 亚洲av无码日韩av无码网站冲| 国产午夜福利片| √最新版天堂资源在线| 精品高清国产乱子伦| 国产自拍伦理在线观看| 日本最新一区二区三区在线| 狠狠色噜噜狠狠狠狠97首创麻豆| 色综合久久久无码中文字幕| 99久久婷婷国产综合精品电影| 午夜亚洲www湿好大| 91制服丝袜| 免费观看在线一区二区| 一二三四在线观看视频韩国| 午夜精品久久久久久久久| 欧美黑人群一交| 2022Av天堂在线无码| 抖射在线免费观看视频网站| 蜜桃在线高清视频免费观看网址| 不卡一区二区黄色av| 人人妻人人澡人人爽欧美一区双 | 日韩人妻无码一区二区三区久久| 亚洲а∨天堂久久精品2021| 视频一区欧美| 久久天堂精品一区专区av| 色久悠悠婷婷综合在线| 偷拍激情视频一区二区三区| 欧美jizzhd精品欧美| 国产91精选在线观看麻豆| 国产精品久久一区性色a| 亚洲性日韩一区二区三区|