亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進的FP—growth關(guān)聯(lián)規(guī)則挖掘算法

        2017-07-11 21:08:52郝天鵬王斌
        電腦知識與技術(shù) 2017年15期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

        郝天鵬 王斌

        摘要:數(shù)據(jù)挖掘技術(shù)被廣泛用于處理存儲在數(shù)據(jù)庫中的大量數(shù)據(jù),以提取所需的信息。其有多種獲取數(shù)據(jù)的技術(shù),關(guān)聯(lián)規(guī)則挖掘是其中最有效的數(shù)據(jù)挖掘技術(shù)之一。它從大量數(shù)據(jù)中發(fā)現(xiàn)隱藏的所需數(shù)據(jù)模式。在現(xiàn)有技術(shù)中的頻繁模式生長(FP-growth)算法是找到期望關(guān)聯(lián)規(guī)則的最有效的算法,它只需掃描數(shù)據(jù)庫兩次進行處理。但FP-growth算法的問題是在大規(guī)模數(shù)據(jù)環(huán)境下它生成大量的條件Fp樹,造成挖掘效率低下的問題。在提出算法中,我們設(shè)計了一種新技術(shù),它挖掘出所有的頻繁項集,而不產(chǎn)生條件Fp樹。與傳統(tǒng)FP-growth算法不同,它僅掃描數(shù)據(jù)庫一次,這降低了算法的時間效率。并且找出頻繁項集合的頻率,以獲取所需的關(guān)聯(lián)規(guī)則。實驗證明,改進FP-growth算法的效率較傳統(tǒng)FP-growth算法有很大提高。

        關(guān)鍵詞:FP樹;關(guān)聯(lián)規(guī)則;頻繁項集;數(shù)據(jù)挖掘

        1概述

        數(shù)據(jù)挖掘技術(shù)用于處理存儲在數(shù)據(jù)倉庫中的非常大量的數(shù)據(jù)數(shù)據(jù)庫,找出所需的有用知識和信息?,F(xiàn)在,許多數(shù)據(jù)挖掘技術(shù)已經(jīng)被提出來了,如關(guān)聯(lián)規(guī)則、決策樹、神經(jīng)網(wǎng)絡(luò)等。并且該技術(shù)已經(jīng)成為人們關(guān)注的焦點。數(shù)據(jù)挖掘中最著名的技術(shù)之一便是關(guān)聯(lián)規(guī)則挖掘。這是最高效的數(shù)據(jù)挖掘技術(shù)。它從大型數(shù)據(jù)庫中發(fā)現(xiàn)隱藏模式,并找到數(shù)據(jù)中不同屬性之間的關(guān)系。

        關(guān)聯(lián)規(guī)則首先被R.Agrawal等人提出。規(guī)則用于得到用戶輸入數(shù)值的支持度和置信度。關(guān)聯(lián)規(guī)則通常是形式x-y的表達式,其中x是前項,y是結(jié)果。關(guān)聯(lián)規(guī)則表示在x已經(jīng)發(fā)生的條件下,y發(fā)生的次數(shù)的支持度和置信度。這段時間內(nèi)很多生成關(guān)聯(lián)規(guī)則算法被提出來。眾所周知的算法是Apriori算法和FP-growth算法。

        Apriori算法是用于關(guān)聯(lián)規(guī)則挖掘的最熟知的算法之一。R.Agrawal提出了Apfiofi算法來挖掘數(shù)據(jù)集中的頻繁模式,算法搜索過程是由連接和剪枝兩部分組成,利用一層一層搜索的迭代方法來找出數(shù)據(jù)庫中項目集的關(guān)系來形成規(guī)則。但由于該算法有反復(fù)掃描數(shù)據(jù)庫和產(chǎn)生大量候選項集的缺點。于是提出FP-growth算法,該算法的優(yōu)勢表現(xiàn)為挖掘全部頻繁項集卻不產(chǎn)生大量候選集。晏杰,亓文娟提出的基于Apriori&FP-growth算法的研究。對Apriori算法和FP-growth具體執(zhí)行過程進行了展示,并提出各自算法的優(yōu)缺點,最后通過實驗展示性能上的差別。

        FP-growth(頻繁模式增長)使用前綴樹(FP-tree)結(jié)構(gòu)的壓縮方式存儲數(shù)據(jù)庫數(shù)據(jù)。FP-growth算法采用分治的策略分兩步來查找數(shù)據(jù)庫的頻繁項集。首先將數(shù)據(jù)庫中的項以及關(guān)聯(lián)關(guān)系壓縮到FP樹中,然后它將FP樹分割成更小的條件FP樹然后單獨挖掘出每個子樹的頻繁項集。但是隨著大規(guī)模數(shù)據(jù)的產(chǎn)生,F(xiàn)P-growth算法也存在著缺陷,算法將事務(wù)數(shù)據(jù)庫中的所有記錄壓縮進一棵樹中(FP-tree)。如果數(shù)據(jù)庫很大時,構(gòu)造基于內(nèi)存的FP-tree是不現(xiàn)實的。因此,F(xiàn)P-growth算法在挖掘大型數(shù)據(jù)集時可能導(dǎo)致失敗。對此缺點Krishna等人提出了并行處理數(shù)據(jù)庫辦法,通過對數(shù)據(jù)庫數(shù)據(jù)進行分割,各個分割點單獨進行挖掘,最后將結(jié)果合并。但該算法對挖掘頻繁模式過程中存在性能瓶頸并沒有改進,因此馬月坤等人又提出了改進的FP-Growth算法及其分布式并行實現(xiàn),他們對FP-Growth算法進行改進,通過基于頻繁閉模式項集策略對完備模式樹進行剪枝進而減少空間搜索,達到提高算法挖掘效率。

        針對海量數(shù)據(jù)的挖掘問題,本文提出了改進的FP-growth關(guān)聯(lián)規(guī)則挖掘算法。這個算法的主要優(yōu)點是可以較為容易的得到所有頻繁項目集。其主要特點是僅掃描數(shù)據(jù)庫一次就生成頻繁項集,而不生成任何條件FP樹。

        猜你喜歡
        關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于關(guān)聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
        移動通信(2016年20期)2016-12-10 09:09:04
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        午夜精品男人天堂av| 乱人伦视频69| 国产三级黄色片子看曰逼大片 | 精品在免费线中文字幕久久| 三级黄色片一区二区三区| av免费网站免费久久网| 亚洲国产婷婷六月丁香| 无码人妻久久一区二区三区app | 日本高清一区二区三区色| 中文字幕影片免费人妻少妇| 医院人妻闷声隔着帘子被中出| 越猛烈欧美xx00动态图| 国产精品久久婷婷婷婷| 国产伦一区二区三区久久| 久久精品国产av麻豆五月丁| 欧美大屁股xxxx高跟欧美黑人| 亚洲日韩国产精品第一页一区| 校花高潮一区日韩| 亚洲成人av大片在线观看| 国产高清在线精品一区app| 男女车车的车车网站w98免费| 欧美日韩国产成人综合在线影院| 国产日韩精品视频一区二区三区| 一本久道竹内纱里奈中文字幕| 吃奶呻吟打开双腿做受视频 | 黄色一区二区三区大全观看| 99久久99久久精品免费看蜜桃| 天堂一区人妻无码| 99在线国产视频| 快射视频网站在线观看| 亚洲 日本 欧美 中文幕| 国产xxxx99真实实拍| 国产chinese在线视频| 亚洲av色香蕉一区二区三区av| 中文字幕 亚洲精品 第1页| 亚洲色欲久久久综合网| 青青青伊人色综合久久亚洲综合 | 国产精品永久久久久久久久久| 日产国产精品亚洲系列| 国产思思久99久精品| 男女啪啪啪的高清视频|