摘要:提出一種基于矩陣加權(quán)關(guān)聯(lián)規(guī)則的空間粒度聚類(lèi)算法。該算法核心思想是根據(jù)文檔特征向量矩陣提取文檔的相似度,再在該關(guān)聯(lián)規(guī)則算法上進(jìn)行聚類(lèi)來(lái)尋找相似關(guān)系的頻繁項(xiàng)集。通過(guò)引入核函數(shù),樣本點(diǎn)被非線(xiàn)性變換映射到高維特征空間進(jìn)行聚類(lèi),提高聚類(lèi)性能。通過(guò)矩陣加權(quán)關(guān)聯(lián)規(guī)則算法進(jìn)行聚類(lèi)。通過(guò)實(shí)驗(yàn)表明,在處理中小型文檔時(shí),該算法的精確度優(yōu)于傳統(tǒng)Apriori算法和K-mean算法;在處理大型文檔時(shí),該算法的時(shí)間復(fù)雜度小于傳統(tǒng)的K-mean算法。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;粒度;聚類(lèi)算法;頻繁項(xiàng)集
中圖分類(lèi)號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A