周 兵 沈鈞毅 彭勤科
摘要:在分析BIRCH算法不足的基礎(chǔ)上,提出了一種基于隨機抽樣和聚類特征的聚類算法(CLAP).該算法采用隨機抽樣技術(shù),從數(shù)據(jù)庫中抽取一部分數(shù)據(jù)進行聚類的預(yù)處理過程,這樣大大降低了運行時間.CLAP通過設(shè)立索引樹的葉節(jié)點的直徑和聚類直徑,提高了聚類的精度,并采用全局搜索和局部搜索相結(jié)合的方式,消除了輸入順序?qū)垲愘|(zhì)量的影響.測試結(jié)果表明,CLAP算法不僅提高了聚類速度,而且改善了聚類質(zhì)量.
關(guān)鍵詞:聚類;BIRCH算法;隨機抽樣
中圖分類號:TP31l文獻標識碼:A文章編號:0253—987X(2003)12—1234—04