管恩政 常曉宇 王 喆 周春光
摘要:為解決從數(shù)據(jù)庫中挖掘長模式可能遇到較高的計(jì)算復(fù)雜度問題,提出一種新的算法FFSPAN。傳統(tǒng)上,要判斷一個(gè)序列是否頻繁,需要在原數(shù)據(jù)庫中判斷整個(gè)序列是否頻繁;而算法FFSPAN是通過在序列數(shù)據(jù)庫中尋找一個(gè)頻繁項(xiàng)或一個(gè)頻繁項(xiàng)集來代替尋找一個(gè)完整的頻繁序列,而且FFSPAN算法每次掃描的數(shù)據(jù)庫都是迅速減小的,這使得算法在挖掘的序列模式越長時(shí)越有效.在標(biāo)準(zhǔn)測試數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,F(xiàn)FSPAN算法非常有效。
關(guān)鍵詞:序列模式;長模式;深度優(yōu)先;數(shù)據(jù)挖掘
中圖分類號:TP31
文獻(xiàn)標(biāo)識碼:A
文章編號:1671-5489(2005)06-0768-05