亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種混合型的增量數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘算法

        2014-12-05 03:05:48鄧廣彪
        電腦知識與技術(shù) 2014年31期

        鄧廣彪

        摘要:在數(shù)據(jù)庫中增加數(shù)據(jù)且調(diào)整最小支持度時,數(shù)據(jù)庫中關(guān)聯(lián)規(guī)則會發(fā)生變化,為從數(shù)據(jù)量和最小支持度同時發(fā)生變化的數(shù)據(jù)庫中快速獲取頻繁項集,發(fā)現(xiàn)變化后的關(guān)聯(lián)規(guī)則,通過對FIM和AIUA算法進(jìn)行分析,提出一種結(jié)合兩種算法優(yōu)點的增量數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘My_FIM_AIUA算法,該算法能減少數(shù)據(jù)庫掃描次數(shù),減少候選項集數(shù)量。通過實驗表明My_FIM_AIUA算法能在數(shù)據(jù)量和最小支持度同時變化時快速找到頻繁項集,提高挖掘增量數(shù)據(jù)關(guān)聯(lián)規(guī)則的速度。

        關(guān)鍵詞:關(guān)聯(lián)規(guī)則;增量數(shù)據(jù);支持度變化

        中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)31-7237-04

        Abstract: There will be some changes of association rules when adding data and adjusting the minimum support in the database. In order to obtain the frequent item sets quickly from the database when changes of the data size and minimum support happened at the same time, and to find out the changed association rule, the My_FIM_AIUA mining algorithm for incremental data association rule that combined the advantages of FIM and AIUA will be proposed by means of the analysis of FIM and AIUA algorithm. This algorithm can reduce the times of database scanning and decrease the numbers of candidate items. Thus, an experiment will be taken to show that the My_FIM_AIUA algorithm can search the frequent item sets quickly when changes of data size and minimum support happened at the same time, and it can improve the speed of mining the incremental data association rule.

        Key words: association rule; incremental data; support changes

        1 概述

        關(guān)聯(lián)規(guī)則挖掘是指從海量數(shù)據(jù)中尋找頻繁在一起出現(xiàn)的事務(wù)及規(guī)律,經(jīng)典的算法有Apriori算法和FP增長算法,但這兩種算法都是面向數(shù)據(jù)量不變且最小支持度不變[1]。關(guān)聯(lián)規(guī)則挖掘經(jīng)常會出現(xiàn)數(shù)據(jù)量、最小支持度變化的情況,那么關(guān)聯(lián)規(guī)則增量更新主要分為數(shù)據(jù)量不變最小支持度變大/變小、最小支持度不變而數(shù)據(jù)量增加/減少、最小支持度和數(shù)據(jù)量兩者同時發(fā)生變化三種[2]。為能快速發(fā)現(xiàn)數(shù)據(jù)量變化但最小支持度不變的關(guān)聯(lián)規(guī)則,D.W.Cheung等人提出FUP算法[3]以及T.F.Gharib等人提出FIM算法[4],且FIM比FUP執(zhí)行效率高;為能發(fā)現(xiàn)數(shù)據(jù)量不變但最小支持度變化的關(guān)聯(lián)規(guī)則,馮玉才等人提出了IUA算法[5]及楊學(xué)兵等人提出了AIUA算法[6],AIUA從IUA改進(jìn)而得,所以AIUA比IUA執(zhí)行效率更高??稍诂F(xiàn)實工作中,數(shù)據(jù)量和最小支持度可能同時變化,為能快速發(fā)現(xiàn)兩者同時變化后的關(guān)聯(lián)規(guī)則,皋軍等人提出My_IUA算法[7]以及唐璐等人提出IFU算法[8],但My_IUA算法在數(shù)據(jù)量增加且支持度變大時存在頻繁項集遺漏以及數(shù)據(jù)量增加且支持度變小的時候存在頻繁項集發(fā)現(xiàn)錯誤的情況;IFU算法是在FUP和IUA算法的基礎(chǔ)上提出并改進(jìn)。為此,在總結(jié)FIM和AIUA算法優(yōu)點的基礎(chǔ)上,提出My_FIM_AIUA算法,在數(shù)據(jù)量增加和最小支持度變大時改進(jìn)FIM算法快速找到頻繁項集,相對FIM算法減少掃描新增數(shù)據(jù)的次數(shù);在數(shù)據(jù)量增加和最小支持度變小時拓展AIUA算法找到相關(guān)頻繁項集,修正My_IUA算法的錯誤,減少候選項集的數(shù)量。My_FIM_AIUA算法在FIM和AIUA基礎(chǔ)上提出,執(zhí)行速度相比IFU算法要更快。

        2 FIM和AIUA算法

        2.1 FIM算法基本思想

        FIM算法是最小支持度不變、數(shù)據(jù)量變化時的一種關(guān)聯(lián)規(guī)則挖掘算法,它的基本思想是如果一個項集要是最終的頻繁項集,要么是原數(shù)據(jù)庫DB中的頻繁項集,要么是新增數(shù)據(jù)庫db中的頻繁項集。該算法假設(shè)DB中的現(xiàn)有頻繁項集[LDBk]都已保存,首先掃描新增數(shù)據(jù)得到db的頻繁項集[Ldbk],將[LDBk]和[Ldbk]中相同的頻繁項集加入到最終頻繁項集[L'k]并將其從[LDBk]和[Ldbk]中刪除;接著掃描db對[LDBk]剩余的頻繁項集更新支持度計數(shù)并將滿足最小支持度計數(shù)的加入[L'k];最后掃描DB對[Ldbk]中剩余的頻繁項集更新支持度計數(shù)并將滿足最小支持度的加入[L'k]。

        2.2 AIUA算法基本思想

        從實驗結(jié)果可知,My_FIM_AIUA算法的運行時間均比Apriori和IFU算法要少,說明My_FIM_AIUA算法執(zhí)行速度快。雖然3個算法掃描數(shù)據(jù)庫的次數(shù)一致,但My_FIM_AIUA算法大大減少了候選項集的數(shù)量,所以在掃描數(shù)據(jù)庫時對候選項集支持度計數(shù)所花時間變少。從挖掘得到的頻繁項集個數(shù)看,My_FIM_AIUA算法與Apriori算法挖掘結(jié)果基本一致,說明My_FIM_AIUA算法的正確性。

        My_FIM_AIUA算法的缺點是需要保存[Lk]中頻繁項集的支持度計數(shù),若[Lk]非常大超過運行時內(nèi)存的可使用空間將成為本算法的瓶頸,而且該算法在支持度變小時與其他算法類似,依然需要多次掃描DB來獲得頻繁項集。

        5 結(jié)束語

        在信息量暴增和急需數(shù)據(jù)背后知識指導(dǎo)工作的信息時代,如何快速發(fā)現(xiàn)增量數(shù)據(jù)和最小支持度變化的關(guān)聯(lián)規(guī)則是企事業(yè)單位信息管理系統(tǒng)必須要解決的問題。該文提出的My_FIM_AIUA算法在一定程度上提高了數(shù)據(jù)量和最小支持度同時變化時頻繁項集的挖掘效率,但該算法需要較大的內(nèi)存空間以及多次掃描數(shù)據(jù)庫,如何能減少掃描數(shù)據(jù)庫的次數(shù)或減少候選項集的數(shù)量將能進(jìn)一步提高算法的執(zhí)行效率,這是以后進(jìn)一步研究待解決的問題。

        參考文獻(xiàn):

        [1] 劉凱.彭國志.關(guān)聯(lián)規(guī)則挖掘方法研究[J].電腦知識與技術(shù),2010,6(5):1029-1031.

        [2] 涂明,張公讓,程業(yè)媛.一種高效的關(guān)聯(lián)規(guī)則增量式更新算法[J].微電子學(xué)與計算機(jī),2010,27(9):56-60.

        [3] D.W.Cheung, J.Han, V.T.Ng. Maintenance of Discovered Association Rules in Large Databases: An Incremental Updating Technique[C].Proceedings of the 12th international conference on Data Engineering, 1996:212-223.

        [4] T.F.Gharib, M.Taha, and H.Nassar, "An efficient technique for incremental updating of association rules. " International Journal of Hybrid Intelligent Systems,pages 45-53,May 2008.

        [5] 馮玉才,馮劍琳.關(guān)聯(lián)規(guī)則的增量式更新算法[J].軟件學(xué)報,1998,9(4):301-306.

        [6] 楊學(xué)兵,安紅梅.一種高效的關(guān)聯(lián)規(guī)則增量式更新算法[J].計算機(jī)技術(shù)與發(fā)展,2007,17(1):108-110+113.

        [7] 皋軍,王建東.關(guān)聯(lián)規(guī)則挖掘算法更新與拓展[J].計算機(jī)工程與應(yīng)用,2003,35:178-179+202.

        [8] 唐璐,江紅,上官秋子. 一種改進(jìn)的關(guān)聯(lián)規(guī)則的增量式更新算法[J].計算機(jī)應(yīng)用與軟件,2012,29(4):246-248.

        My_FIM_AIUA算法的缺點是需要保存[Lk]中頻繁項集的支持度計數(shù),若[Lk]非常大超過運行時內(nèi)存的可使用空間將成為本算法的瓶頸,而且該算法在支持度變小時與其他算法類似,依然需要多次掃描DB來獲得頻繁項集。

        5 結(jié)束語

        在信息量暴增和急需數(shù)據(jù)背后知識指導(dǎo)工作的信息時代,如何快速發(fā)現(xiàn)增量數(shù)據(jù)和最小支持度變化的關(guān)聯(lián)規(guī)則是企事業(yè)單位信息管理系統(tǒng)必須要解決的問題。該文提出的My_FIM_AIUA算法在一定程度上提高了數(shù)據(jù)量和最小支持度同時變化時頻繁項集的挖掘效率,但該算法需要較大的內(nèi)存空間以及多次掃描數(shù)據(jù)庫,如何能減少掃描數(shù)據(jù)庫的次數(shù)或減少候選項集的數(shù)量將能進(jìn)一步提高算法的執(zhí)行效率,這是以后進(jìn)一步研究待解決的問題。

        參考文獻(xiàn):

        [1] 劉凱.彭國志.關(guān)聯(lián)規(guī)則挖掘方法研究[J].電腦知識與技術(shù),2010,6(5):1029-1031.

        [2] 涂明,張公讓,程業(yè)媛.一種高效的關(guān)聯(lián)規(guī)則增量式更新算法[J].微電子學(xué)與計算機(jī),2010,27(9):56-60.

        [3] D.W.Cheung, J.Han, V.T.Ng. Maintenance of Discovered Association Rules in Large Databases: An Incremental Updating Technique[C].Proceedings of the 12th international conference on Data Engineering, 1996:212-223.

        [4] T.F.Gharib, M.Taha, and H.Nassar, "An efficient technique for incremental updating of association rules. " International Journal of Hybrid Intelligent Systems,pages 45-53,May 2008.

        [5] 馮玉才,馮劍琳.關(guān)聯(lián)規(guī)則的增量式更新算法[J].軟件學(xué)報,1998,9(4):301-306.

        [6] 楊學(xué)兵,安紅梅.一種高效的關(guān)聯(lián)規(guī)則增量式更新算法[J].計算機(jī)技術(shù)與發(fā)展,2007,17(1):108-110+113.

        [7] 皋軍,王建東.關(guān)聯(lián)規(guī)則挖掘算法更新與拓展[J].計算機(jī)工程與應(yīng)用,2003,35:178-179+202.

        [8] 唐璐,江紅,上官秋子. 一種改進(jìn)的關(guān)聯(lián)規(guī)則的增量式更新算法[J].計算機(jī)應(yīng)用與軟件,2012,29(4):246-248.

        My_FIM_AIUA算法的缺點是需要保存[Lk]中頻繁項集的支持度計數(shù),若[Lk]非常大超過運行時內(nèi)存的可使用空間將成為本算法的瓶頸,而且該算法在支持度變小時與其他算法類似,依然需要多次掃描DB來獲得頻繁項集。

        5 結(jié)束語

        在信息量暴增和急需數(shù)據(jù)背后知識指導(dǎo)工作的信息時代,如何快速發(fā)現(xiàn)增量數(shù)據(jù)和最小支持度變化的關(guān)聯(lián)規(guī)則是企事業(yè)單位信息管理系統(tǒng)必須要解決的問題。該文提出的My_FIM_AIUA算法在一定程度上提高了數(shù)據(jù)量和最小支持度同時變化時頻繁項集的挖掘效率,但該算法需要較大的內(nèi)存空間以及多次掃描數(shù)據(jù)庫,如何能減少掃描數(shù)據(jù)庫的次數(shù)或減少候選項集的數(shù)量將能進(jìn)一步提高算法的執(zhí)行效率,這是以后進(jìn)一步研究待解決的問題。

        參考文獻(xiàn):

        [1] 劉凱.彭國志.關(guān)聯(lián)規(guī)則挖掘方法研究[J].電腦知識與技術(shù),2010,6(5):1029-1031.

        [2] 涂明,張公讓,程業(yè)媛.一種高效的關(guān)聯(lián)規(guī)則增量式更新算法[J].微電子學(xué)與計算機(jī),2010,27(9):56-60.

        [3] D.W.Cheung, J.Han, V.T.Ng. Maintenance of Discovered Association Rules in Large Databases: An Incremental Updating Technique[C].Proceedings of the 12th international conference on Data Engineering, 1996:212-223.

        [4] T.F.Gharib, M.Taha, and H.Nassar, "An efficient technique for incremental updating of association rules. " International Journal of Hybrid Intelligent Systems,pages 45-53,May 2008.

        [5] 馮玉才,馮劍琳.關(guān)聯(lián)規(guī)則的增量式更新算法[J].軟件學(xué)報,1998,9(4):301-306.

        [6] 楊學(xué)兵,安紅梅.一種高效的關(guān)聯(lián)規(guī)則增量式更新算法[J].計算機(jī)技術(shù)與發(fā)展,2007,17(1):108-110+113.

        [7] 皋軍,王建東.關(guān)聯(lián)規(guī)則挖掘算法更新與拓展[J].計算機(jī)工程與應(yīng)用,2003,35:178-179+202.

        [8] 唐璐,江紅,上官秋子. 一種改進(jìn)的關(guān)聯(lián)規(guī)則的增量式更新算法[J].計算機(jī)應(yīng)用與軟件,2012,29(4):246-248.

        国产精品国产午夜免费福利看| 果冻传媒2021精品一区| 欧美性猛交内射兽交老熟妇| 97精品国产91久久久久久久| 在线一区二区三区免费视频观看| 一区二区视频中文字幕| 久久久久久九九99精品| 99re6热在线精品视频播放6| 亚洲欧美成人久久综合中文网| 91精品国产综合久久精品密臀| 久久久久人妻精品一区三寸| 日产精品久久久久久久蜜臀| 尤物AV无码色AV无码麻豆| 日本免费看一区二区三区| 亚洲精品无码永久在线观看| 国产中老年妇女精品| 国产成人香蕉久久久久| 成人av一区二区三区四区| 亚州性无码不卡免费视频| 亚洲中文字幕无码永久在线| 91精品在线免费| 99精品久久精品一区| 国产精品嫩草99av在线| 国产精品国三级国产av| 免费av片在线观看网站| 素人系列免费在线观看| 亚洲av五月天一区二区| 和外国人做人爱视频| 国产主播在线 | 中文| 亚洲综合新区一区二区| 亚洲一区二区三区尿失禁| 久久久久麻豆v国产精华液好用吗 欧美性猛交xxxx乱大交丰满 | 国产精品无码久久久久| 国产va免费精品高清在线观看| av免费在线播放一区二区| 男人的天堂中文字幕熟女人妻| 日日碰狠狠躁久久躁96avv | 国产精品一区二区午夜久久| 日本黄色3级一区二区| 激情综合色综合啪啪五月丁香| 国产成人亚洲综合无码DVD|