摘 要:概念學(xué)習(xí)作為一種重要的數(shù)據(jù)分析方法,被廣泛應(yīng)用于模式識別、知識發(fā)現(xiàn)等領(lǐng)域。本文針對海量數(shù)據(jù)中的動態(tài)模糊數(shù)據(jù),從DFL的角度出發(fā),對動態(tài)模糊概念學(xué)習(xí)問題進行了深入的研究,提出了動態(tài)模糊概念的形式化表示方法、動態(tài)模糊概念格的構(gòu)建方法。給出一個實驗用例,驗證相關(guān)算法的有效性。
關(guān)鍵詞:動態(tài)模糊集;動態(tài)模糊概念;動態(tài)模糊概念格
中圖分類號:O142
概念學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域中的一個重要而且基礎(chǔ)的領(lǐng)域,它是一種良好的數(shù)據(jù)分析工具。近年來,一直有不斷深入的研究在概念領(lǐng)域出現(xiàn)?;诮?jīng)典集合的概念格認(rèn)知方法研究,形式概念分析的一種主要數(shù)據(jù)結(jié)構(gòu)就是概念格。在概念格中每個節(jié)點是一個概念,外延是指概念所覆蓋的實例空間(對象);內(nèi)涵是指所覆蓋實例的共同特征(屬性)。該結(jié)構(gòu)反映了對象與屬性之間的聯(lián)系以及概念泛化與特化關(guān)系的一種完備的概念層次結(jié)構(gòu)。在模糊屬性的概念分析方面:國際上,Karl Erich Wolff提出模糊信息表示法,并且成功的構(gòu)造了基于語言變量值的分級格。在國內(nèi),針對數(shù)據(jù)語義的不確定性和學(xué)習(xí)過程的動態(tài)模糊性,李凡長教授和其領(lǐng)導(dǎo)的研究小組最先提出了動態(tài)模糊集合及其相關(guān)理論,更進一步提高了數(shù)據(jù)分析的有效性。鑒于此,本文主要針對概念學(xué)習(xí)中概念的動態(tài)模糊性問題,主要利用DFS工具對概念學(xué)習(xí)的動態(tài)模糊數(shù)據(jù)進行研究,提出了動態(tài)模糊概念的表示模型,構(gòu)建了動態(tài)模糊概念格等。
1 DFL理論基礎(chǔ)
1.1 動態(tài)模糊邏輯介紹
1.2 動態(tài)模糊概念的表示模型
動態(tài)模糊概念定義在一個實例空間 之上,待學(xué)習(xí)的概念或函數(shù)稱為目標(biāo)概念,記作c。學(xué)習(xí)目標(biāo)函數(shù)時,需要提供一套訓(xùn)練樣例,每個樣例為 中的一個實例 以及它的目標(biāo)概念值 ,當(dāng) 時為正例,當(dāng) 時為反例, 為給定的動態(tài)模糊閾值。二元組 表示其包含了實例 的目標(biāo)概念值 。
在動態(tài)模糊概念學(xué)習(xí)理論中概念的內(nèi)涵是指所有對象的共有屬性集合。而動態(tài)模糊概念的外延是指動態(tài)模糊概念內(nèi)涵所能夠確定的最大動態(tài)模糊對象集。一個動態(tài)模糊概念是一個完備的動態(tài)模糊序偶。能夠包含所有對象的動態(tài)模糊概念稱為動態(tài)模糊全概念;能夠包含所有動態(tài)模糊屬性的概念稱為動態(tài)模糊空概念。
2 動態(tài)模糊概念格構(gòu)建
目前概念格的構(gòu)建算法主要分為兩種:一種是批次式建格算法(Batch Algorithm);另一種是遞增式建格算法(Increment Algorithm)。批次式建格算法主要適用于數(shù)據(jù)規(guī)模相對較小的實例空間上,類似的算法有Bordat,Chein,Ganter,Nourine算法等。遞增式建格算法適用于數(shù)據(jù)不斷更新的實例空間上,相應(yīng)的算法主要有Godin,Capineto,TB.H.O算法等。本文考慮到DF概念之間客觀存在的層次關(guān)系,將采用分層構(gòu)建DF概念格的思想。
在概念格中,可以通過屬性來決定概念的層次結(jié)構(gòu)。根據(jù)屬性集合的長度來定義概念格的層數(shù),引入了基于分層的DF概念格建格思想。
根據(jù)動態(tài)模糊概念格的分層思想,采用分層自頂向下的方式擴展式生成動態(tài)模糊概念格。具體算法步驟如下:
首先,為了提高動態(tài)模糊概念格的精度,根據(jù)動態(tài)模糊形式背景的截集運算規(guī)則,對形式背景B:(X,Y,I)進行預(yù)處理,得到處理后的動態(tài)模糊處理背景。然后,排除滿足以下兩個條件的元集:
A) ,即滿足所有屬性的樣例集合。
B) ,即能夠覆蓋所有實例的屬性集合。
參考文獻:
[1]R.Wille,Restructuring lattice theory:an approach based on hierarchies of concepts,in I.Rival(Ed.),Ordered sets,Ridel,Dordrecht,Boston,1982,PP.445-470.
[2]K.E.Wolff,Conceptual Interpretation of Fuzzy Theory[C].in the 6th European Congress on Intelligent Techniques and Soft Computing EUFIT98,Aachen,1998,PP.555-562.
[3]Carpineto C,Romano G.Galois.An order-theoretic approach to conceptual clustering[C].Utgoffped Proceedings of ICML-93.Amher st:Elsevier,1993:33-40.
[4]T.B.Ho.Incremental conceptual clustering in the frame work of Galois lattice[J].In Lu H,Motoda H,Liu H,eds KDD:Techniques and Applications.World Siecntific,1997:49-64.
[5]李凡長,楊季文,張莉.動態(tài)模糊數(shù)據(jù)分析理論與方法[J].北京:科學(xué)出版社,2013,3.