汪際和
【摘 要】在挖掘關聯(lián)規(guī)則的過程中,人們往往不僅關心項集出現(xiàn)的頻率而且關心項集的重要性,為此,本文應用權重來綜合考慮項集的頻率和重要性,在構建概念格的過程中應用加權的值來更新概念和相應的邊。
【關鍵詞】概念格;頻繁項集;建格算法
0 引言
概念格是由德國的數(shù)學家Wille.R于1982年提出的一種基于序理論的數(shù)據(jù)分析工具,由于它的特殊結構等一些特點,在知識發(fā)現(xiàn),信息檢索等方面得到廣泛應用。關聯(lián)規(guī)則的關鍵步驟是找出符合最小支持度條件的頻繁項集,體現(xiàn)于概念格中則表現(xiàn)為找出滿足條件的內涵集之間的關聯(lián)性。而頻繁項集和概念格中的節(jié)點存在一種對應關系,所以,尋找頻繁項集的過程可以看作是根據(jù)最小支持度構建概念格的過程。
如何構造和簡化概念格,一直是形式概念分析中的重要內容,為了更好地構建概念格,許多學者進行了大量研究并取得了比較豐碩的成果[3-6]。
3 結論
本算法綜合考慮了項集在事務數(shù)據(jù)庫中出現(xiàn)的頻率(即支持度)和重要性(即用權值表示),根據(jù)用戶對頻率和重要性的關心程度來設置權重?琢。當然,在該算法中,由于加權頻繁項集的超集不一定頻繁,所以就不能對候選項集剪枝。另外,對于不同的項集可以動態(tài)地設置權重等。對它們的研究將是下一步的工作。
【參考文獻】
[1]Jiawei Han,Micheline Kamber.范明,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(第二版)[M].北京:機械工業(yè)出版社,2008.
[2]Bernhard Ganter.Rudolf Wille.馬垣,等,譯.形式概念分析[M].北京:科學出版社,2007.
3]簡宋全,胡學鋼,蔣美華.擴展概念格的漸進式構造[J].計算機工程與應用,2001,37(15):132-134.
[4]王德興,胡學鋼,王浩.基于量化概念格的關聯(lián)規(guī)則挖掘[J].合肥工業(yè)大學學報,2002,25(5):678-682.
[5]張繼福,張素蘭,鄭鏈.加權概念格及其漸進式構造[J].模式識別與人工智能,2005(2):171-176.
[6]翟悅,郭文書,王立娟.利用擴展概念格進行關聯(lián)分類的算法[J].遼寧工程技術大學學報(自然科學版),2015,34(11):1280-1284.
[責任編輯:王楠]