摘要:關(guān)聯(lián)規(guī)則反映了大量數(shù)據(jù)中項(xiàng)集之間的相互依存性和關(guān)聯(lián)性。文章介紹了關(guān)聯(lián)規(guī)則挖掘方法的原理,然后對(duì)關(guān)聯(lián)挖掘及其典型算法進(jìn)行分析,指出了Apriori算法的局限性在于會(huì)產(chǎn)生大量冗余的候選集并頻繁掃描數(shù)據(jù)庫(kù)。接下來(lái)給出一種改進(jìn)的Apriori算法,通過(guò)減少對(duì)數(shù)據(jù)庫(kù)搜索的次數(shù),從而減少數(shù)據(jù)挖掘過(guò)程中的I/O開銷。實(shí)踐證明,用改進(jìn)后的算法進(jìn)行關(guān)聯(lián)挖掘,效率優(yōu)于傳統(tǒng)的方法。
關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;頻繁頂集