亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)聯(lián)規(guī)則挖掘在網(wǎng)絡(luò)課程推薦中的應(yīng)用

        2011-01-09 05:49:26郜振霞吳軍華王學(xué)軍
        關(guān)鍵詞:項集置信度事務(wù)

        郜振霞,吳軍華,王學(xué)軍,3

        (1.南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇南京 210009;2.聊城大學(xué)傳媒技術(shù)學(xué)院,山東 聊城 252000;3.承德石油高等專科學(xué)校,河北承德 067000)

        關(guān)聯(lián)規(guī)則挖掘在網(wǎng)絡(luò)課程推薦中的應(yīng)用

        郜振霞1,2,吳軍華1,王學(xué)軍1,3

        (1.南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇南京 210009;2.聊城大學(xué)傳媒技術(shù)學(xué)院,山東 聊城 252000;3.承德石油高等??茖W(xué)校,河北承德 067000)

        以網(wǎng)絡(luò)課程推薦為例探索關(guān)聯(lián)規(guī)則在網(wǎng)絡(luò)教學(xué)平臺中的實現(xiàn)與應(yīng)用。引入關(guān)聯(lián)規(guī)則中的Apriori算法應(yīng)用于網(wǎng)絡(luò)課程關(guān)聯(lián)分析,從而挖掘出潛在的網(wǎng)絡(luò)課程相關(guān)規(guī)律,為學(xué)生學(xué)習、教師安排教學(xué)內(nèi)容等提供科學(xué)依據(jù)。

        關(guān)聯(lián)規(guī)則;Apriori算法;網(wǎng)絡(luò)課程推薦

        關(guān)聯(lián)規(guī)則挖掘(Association Rule Mining)是幫助發(fā)現(xiàn)大量數(shù)據(jù)庫項集之間的關(guān)聯(lián)關(guān)系,隨著大量數(shù)據(jù)的增加和存儲,人們對于從數(shù)據(jù)庫中挖掘這些規(guī)則越來越感興趣。關(guān)聯(lián)規(guī)則挖掘問題已經(jīng)成為數(shù)據(jù)挖掘中最成熟、最重要、最活躍的內(nèi)容。

        1 關(guān)聯(lián)規(guī)則基礎(chǔ)

        關(guān)聯(lián)規(guī)則問題由Agrawal等人于1993年首先提出,以后諸多的研究人員對關(guān)聯(lián)規(guī)則的挖掘問題進行了大量的研究。簡單地說,關(guān)聯(lián)規(guī)則就是給定一組項目和一個記錄集合,通過分析記錄集合,推導(dǎo)出項目間的相關(guān)性[1]。

        關(guān)聯(lián)規(guī)則挖掘問題可以這樣來表述:設(shè)I={i1,i2,i3,…,im,…,ip}是挖掘的數(shù)據(jù)庫中全體項目(Item)集合,im(m=1,2,…,p)稱為項目(item);D={t1,t2,…,tk…,tn}是挖掘的數(shù)據(jù)集,tk(k=1,2,…,n)稱為事務(wù)(Transaction),其中每個事務(wù)tk是一個項目集合,并滿足tk?I。每個事務(wù)都有唯一的標識符,稱為TID。

        一個關(guān)聯(lián)規(guī)則便是一個如下形式的蘊涵關(guān)系,X→Y,其中X?I,Y?I,且X∩Y=φ。X或Y是一個項目的集合,X為前件,Y為后件。

        規(guī)則X→Y的支持度(Support)是指D中包含X∪Y的事務(wù)的百分比。支持度表示規(guī)則在事務(wù)集合D中使用的頻繁程度。設(shè)n是D中事務(wù)的數(shù)目,規(guī)則X→Y的支持度公式為

        規(guī)則X→Y的置信度(Confidence)是指既包含了X又包含了Y的事務(wù)的數(shù)量占所有包含了X的事務(wù)的百分比。規(guī)則X→Y的置信度計算公式為

        支持度和置信度是兩個常用的衡量關(guān)聯(lián)規(guī)則強度的指標。關(guān)聯(lián)規(guī)則挖掘就是指在給定的一個事務(wù)集合T中找到所有滿足用戶指定的最小支持度(minsup)和最小置信度(minconf)的關(guān)聯(lián)規(guī)則。

        關(guān)聯(lián)規(guī)則挖掘過程一般可分為兩個步驟:1)獲取頻繁項集。根據(jù)最小支持度找出數(shù)據(jù)集中的所有頻繁項集。2)產(chǎn)生關(guān)聯(lián)規(guī)則。根據(jù)頻繁項集合最小置信度產(chǎn)生關(guān)聯(lián)規(guī)則。

        2 Apriori算法

        在關(guān)聯(lián)規(guī)則的眾多算法中,Apriori算法是最為經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法,后來的許多算法都是對Apriori算法的改進和擴展。Apriori算法是挖掘單維布爾型關(guān)聯(lián)規(guī)則頻繁項目集的有效算法。

        Apriori算法分兩步進行:第一步生成所有頻繁項目集,一個頻繁項目集就是一個支持度高于minsup的項集;第二步從頻繁項目集中生成所有可信關(guān)聯(lián)規(guī)則,一個可信關(guān)聯(lián)規(guī)則就是置信度高于minconf的規(guī)則。頻繁項目集生成部分,Apriori算法使用逐層搜索的迭代算法,利用k—項集探索(k+1)—項集。它采用多輪搜索的方法,每一輪搜索掃描一遍整個數(shù)據(jù)集,并最終生成所有的頻繁項目集。以下是Apriori算法產(chǎn)生頻繁集部分算法的描述。

        其中Candidate-gen()函數(shù)被用于生成除第一趟之外的每一趟掃描的候選項目集,主要包括合并和剪枝兩步,使用的主要依據(jù)是向下封閉原理,頻繁項集的任一子集也一定是頻繁的,其算法描述這里不再贅述。

        3 關(guān)聯(lián)規(guī)則挖掘在網(wǎng)絡(luò)課程推薦中的應(yīng)用

        學(xué)生登錄不同的網(wǎng)絡(luò)課程網(wǎng)站時會留下“痕跡”,采集這些“痕跡”,利用關(guān)聯(lián)規(guī)則挖掘算法進行數(shù)據(jù)分析,找到學(xué)生訪問的頻繁網(wǎng)絡(luò)課程集,借此對學(xué)生進行課程推薦。

        這里所使用的網(wǎng)絡(luò)課程平臺是基于網(wǎng)站群技術(shù)建立的?;诖似脚_建設(shè)的網(wǎng)絡(luò)課程獨立成站并且可以使用不同的服務(wù)器。學(xué)生登錄某一網(wǎng)絡(luò)課程時就會在該網(wǎng)絡(luò)課程的服務(wù)器上留下“痕跡”,即產(chǎn)生服務(wù)器日志文件。由于這些“痕跡”分布在不同的服務(wù)器上,數(shù)據(jù)的搜集和清洗都比較困難。針對學(xué)生需要憑借個人賬號登錄學(xué)習網(wǎng)絡(luò)課程的特點,每當學(xué)生進入某一課程時,平臺系統(tǒng)會自動寫入一條“登入”記錄到數(shù)據(jù)庫中,對這些登入數(shù)據(jù)信息進行挖掘,就大大簡化了數(shù)據(jù)預(yù)處理工作。如果需要,也可以按照學(xué)生年級、專業(yè)對學(xué)生登入信息進行分類存儲。

        這里只給出“登入”信息表的片段,借以描述數(shù)據(jù)預(yù)處理的過程。流程如下:

        1)數(shù)據(jù)獲取 系統(tǒng)自動寫入的登入信息存儲在數(shù)據(jù)庫中相應(yīng)的課程登入信息表中,如表1所示。

        2)事務(wù)識別 學(xué)生登錄課程進行學(xué)習,學(xué)習時間一般較長,因此在劃分用戶事務(wù)集時,用簡單的時間段劃分,這里以日期為依據(jù)劃分用戶事務(wù)。事務(wù)識別算法如表2所示。

        表1 課程登入信息表

        表2 課程訪問事務(wù)識別算法

        表1中的舉例信息經(jīng)過事務(wù)識別,可得到事務(wù)集合,如表3所示。

        表3 課程事務(wù)表

        使用Apriori算法進行關(guān)聯(lián)規(guī)則挖掘,以課程事務(wù)表中的事務(wù)集合為原數(shù)據(jù),進行頻繁課程集的挖掘。如果 minsup=40%,minconf=70%,那么從上述事務(wù)表片段中可以得到頻繁集{501805},得出規(guī)則501805→501815。根據(jù)課程號找到相應(yīng)課程名稱,即501805對應(yīng)課程《數(shù)據(jù)結(jié)構(gòu)》,501815對應(yīng)課程《C程序設(shè)計》,規(guī)則可以解釋為關(guān)注《數(shù)據(jù)結(jié)構(gòu)》的同學(xué)的大多數(shù)(70%以上)還關(guān)注了《C程序設(shè)計》。因此就可以根據(jù)規(guī)則對學(xué)生提出網(wǎng)絡(luò)課程學(xué)習的建議,如果學(xué)生學(xué)習了《數(shù)據(jù)結(jié)構(gòu)》,便可推薦其再去學(xué)習或復(fù)習《C程序設(shè)計》課程。

        4 結(jié)束語

        網(wǎng)絡(luò)課程平臺支持網(wǎng)絡(luò)課程的教學(xué),網(wǎng)絡(luò)課程信息量巨大,運用關(guān)聯(lián)規(guī)則挖掘算法進行數(shù)據(jù)挖掘,能夠得到網(wǎng)絡(luò)課程很多有價值的信息,本文挖掘出的網(wǎng)絡(luò)課程間的規(guī)則不僅可以向?qū)W生提供課程推薦,而且對教師安排網(wǎng)絡(luò)課程鏈接、調(diào)整教學(xué)內(nèi)容等也同樣具有指導(dǎo)意義。

        [1] 趙軼,周艷山.Apriori算法在高校課程設(shè)置中的應(yīng)用研究[J].林區(qū)教學(xué),2008(6):121-122.

        [2] 朱艷麗,高國紅.Apriori算法研究及其在學(xué)生成績分析中的應(yīng)用[J].福建電腦,2010(1):147.

        [3] 李雪嬋.關(guān)聯(lián)規(guī)則在課程相關(guān)性中研究與應(yīng)用.計算機與數(shù)字工程[J],2006,34(9):173-176.

        [4] 元昌安.數(shù)據(jù)挖掘原理與SPSS Clementione應(yīng)用[M].北京:電子工業(yè)出版社,2009.

        Application of Association Rule in Network Course Recommendation

        GAO Zhen-xia1,2,WU Jun-hua1,WANG Xue-jun1,3
        (1.School of Electronic and Information Engineering,Nanjing University of Technology,Nanjing 210009,Jiangsu,China;2.School of Media and Communications,Liaocheng University,Liaocheng 252000,Shandong,China;3.Chengde Petroleum College,Chengde 067000,Hebei,China)

        The paper mainly uses the network course recommendation as an example to explore the realization and application of association rule in network course platform.It applies the Apriori algorithm to the association analysis of network courses,providing a scientific basis for learning and teaching.

        association rule;Apriori algorithm;network course recommendation

        TP393-45

        A

        1008-9446(2011)04-0052-03

        2011-10-25

        郜振霞(1980-),女,山東聊城人,南京工業(yè)大學(xué)在讀碩士研究生,主要從事計算機應(yīng)用、數(shù)據(jù)挖掘的研究。

        猜你喜歡
        項集置信度事務(wù)
        “事物”與“事務(wù)”
        基于分布式事務(wù)的門架數(shù)據(jù)處理系統(tǒng)設(shè)計與實現(xiàn)
        硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
        河湖事務(wù)
        正負關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        SQLServer自治事務(wù)實現(xiàn)方案探析
        多假設(shè)用于同一結(jié)論時綜合置信度計算的新方法?
        国产高潮迭起久久av| 免费一区二区三区在线视频| 精品久久久久久午夜| 伊人狼人大香线蕉手机视频| 国产人妻鲁鲁一区二区| 婷婷亚洲久悠悠色悠在线播放| 无码 制服 丝袜 国产 另类 | 日韩美女人妻一区二区三区| 99久久精品在线视频| 亚洲国产天堂一区二区三区| 国产女精品| 国产精品久久国产三级国| 一区二区三区精品少妇| 西川结衣中文字幕在线| 看av免费毛片手机播放| 亚洲一级无码片一区二区三区| 国产精品很黄很色很爽的网站| 亚洲天堂成人av影院| 鲁鲁鲁爽爽爽在线视频观看| 日本高清中文字幕一区二区三区| 92自拍视频爽啪在线观看| 国产精品人妻熟女男人的天堂| 六月丁香综合在线视频| 国产在线一91区免费国产91| 精品女同一区二区三区在线播放器| 人妻少妇精品视频专区vr| 久久综合九色综合欧美狠狠| 中文字幕巨乱亚洲| 精品国产亚洲av高清日韩专区| 精品人妻av区乱码| 麻豆精品久久久久久久99蜜桃| 蜜桃视频中文字幕一区二区三区 | 久久国产精品男人的天堂av| 国产一区二区三区我不卡| 40岁大乳的熟妇在线观看| 色伊人国产高清在线| 国产丝袜一区丝袜高跟美腿| 色综合av综合无码综合网站| 亚洲成人中文| 国内偷拍第一视频第一视频区| 一区二区三区内射美女毛片|