吳 寧 柏春霞 祝毅博
摘要:針對樸素貝葉斯分類方法中屬性值條件獨立假設(shè)不適應(yīng)實際情況的問題,提出了關(guān)聯(lián)規(guī)則森林表示法及應(yīng)用關(guān)聯(lián)規(guī)則森林的改進貝葉斯分類算法(ABC算法)。ABC算法利用關(guān)聯(lián)規(guī)則挖掘得到滿足條件的關(guān)聯(lián)規(guī)則,并由此來構(gòu)造關(guān)聯(lián)規(guī)則森林,而規(guī)則森林中所有根節(jié)點的概率與所有適用的規(guī)則置信度連乘,就得到所有屬性值的聯(lián)合概率。應(yīng)用UDI數(shù)據(jù)集對分類器進行了測試,分類結(jié)果表明,ABC算法的分類準確率明顯高于樸素貝葉斯分類算法,平均提高5%,特別是對屬性間有著較強依賴關(guān)系的數(shù)據(jù)集,其分類準確率提高了37%。
關(guān)鍵詞:樸素貝葉斯分類;關(guān)聯(lián)規(guī)則;聯(lián)合概率
中圖分類號:TP311.13文獻標志碼:A文章編號:0253—987X(2009)02—0048—05