鐘 誠,王哲河
(海南熱帶海洋學(xué)院 海洋信息工程學(xué)院,海南 三亞 572022)
基于上下近似與邊界域的粗糙集之間的相似度量
鐘 誠,王哲河
(海南熱帶海洋學(xué)院 海洋信息工程學(xué)院,海南 三亞 572022)
度量不確定性集合的相似度是粗糙集的核心內(nèi)容之一.對現(xiàn)有的基于上下近似的粗糙集相似度量方法進行分析,提出一種基于上下近似與邊界域的粗糙集間的相似度量公式,并通過例子說明,該方法具有較高的分辨力.
粗糙集;上下近似;邊界域;相似度量
粗糙集理論是Pawlak教授于1982年提出的一種能夠定量分析處理不精確、不一致、不完整信息與知識的數(shù)學(xué)工具[1].該理論已成功地應(yīng)用在機器學(xué)習(xí)與知識發(fā)現(xiàn)、模式識別、數(shù)據(jù)挖掘、過程與控制、決策支持與分析等方面.粗糙集理論無需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗信息,是通過等價關(guān)系的分類以及分類對于目標(biāo)的近似實現(xiàn)知識發(fā)現(xiàn).知識的不確定性主要是由給定論域里粗糙近似的邊界引起的,當(dāng)邊界為空時,知識是完全確定的.邊界越大,知識就越粗糙.在實際應(yīng)用過程中,經(jīng)常需要比較兩種知識模式的一致性或相似性.因此,不同的相似度方法也不斷提出[2-6].
文獻[2-3]都是基于上下近似集的粗糙集之間相似度量,其中文獻[3]對文獻[2]的公式加以改進,不但分別考慮了集合間的上、下近似集間的差集,而且又考慮了上下近似集距離的權(quán)重.但實際上集合間的邊界域距離的大小也會直接影響不確定性集合的相似度,基于這點,本文提出一種基于上下近似與邊界域的粗糙集相似度量方法.并通過例子將其與文獻[2-3]的基于上下近似的粗糙集相似度量公式進行比較,說明該方法具有更高的分辨力.
等價關(guān)系可以將對象集分類.從認知的角度來看,人們需要通過分類去認識那些不能精確分類表示的對象集,這種集合稱為粗糙集.
下面給出有關(guān)的基本概念,詳細的討論見文獻[1,5,7-11].
設(shè)IS=(U,A,V,f)是一個信息系統(tǒng),U為對象集,A為屬性集,f為U和A的關(guān)系集,V為屬性的值域,B?A,x∈U屬性B對應(yīng)的x等價類為:
[x]B={y∈U|f(x,a)=f(y,a),?a∈B},
定義1 設(shè)(U,R)為近似空間,X,Y?U.
1)若RX=RY,則稱集合X和Y為R下粗相等,記作X≈RY;
定義2 設(shè)U是一個非空論域,記P(U)為U的所有子集的集合S∶P(U)×P(U)→[0,1],?X,Y,Z∈P(U),如果S滿足:
1)0≤S(X,Y)≤1;
則稱S(X,Y)是集合X,Y之間的相似度.
如果將1)換成“當(dāng)且僅當(dāng)X=Y時S(X,Y)=1”.則稱S(X,Y)是集合X,Y之間的弱相似度.
相似度量是檢索兩個知識模式一致性以及相似性的一個重要方法,因此,定義一種分辨力較高的相似度量公式是很有必要的.本文將分析文獻[2-3]的基于上下近似集的相似度量方法,在此基礎(chǔ)上,提出一種基于上下近似與邊界域的粗糙集相似度量方法.
2.1 現(xiàn)有的基于上下近似的粗糙集相似度量
定義3[2]設(shè)(U,R)為近似空間,?X,Y?U定義
(1)
定義4[3]設(shè)(U,R)為近似空間,?X,Y?U,α,β∈[0,1],α+β=1.定義
(2)
經(jīng)研究,發(fā)現(xiàn)定義3只是考慮了粗糙集間的上、下近似的差集,而定義4不但考慮粗糙集間的上、下近似的差集,而且考慮了上、下近似的差集對集合間的相似度量的影響,并引入了權(quán)重計算.邊界域的大小會影響集合的粗糙度,所以粗糙集間的邊界域的差集也會影響粗糙集間的相似度,而定義3,4都沒有考慮粗糙集間的邊界域的差集對相似度的影響.因此,本文將提出一種基于上下近似集與邊界域的粗糙集間的相似度量方法.
2.2 基于上下近似與邊界域的粗糙集相似度量
為了方便敘述下文的基于上下近似集與邊界域的粗糙集相似度量公式,先給出邊界域距離的定義.
由定義5可得到以下性質(zhì).
定理1 設(shè)(U,R)為近似空間,?X,Y?U,則有以下性質(zhì)成立.
證明 由定義5,顯然性質(zhì)1)成立.
推論1 若X=Y=φ,則dXY=0.
定義6 設(shè)(U,R)為近似空間,?X,Y?U,α,β,γ∈[0,1],α+β+γ=1.定義
(3)
下面定理的結(jié)果是一種相似度量.
定理2 設(shè)(U,R)為近似空間,則?X,Y?U,S(X,Y)為X與Y關(guān)于等價關(guān)系R的相似度.
證明 顯然S(X,Y)滿足定義2中的1)-3),下面證明其滿足定義中的條件4).
所以
故S(X,Y)≥S(X,Z).同理可證:S(Y,Z)≥S(X,Z).
性質(zhì)1 設(shè)(U,R)為近似空間,則S(U,φ)=0.
推論2 設(shè)(U,R)為近似空間,?X?U,S(X,φ)=0.
性質(zhì)2 設(shè)(U,R)為近似空間,?X,Y?U∧X≈RY,則S(X,Y)=1.
證明 由定義2及定義5,即可證該性質(zhì)成立.
性質(zhì)3 設(shè)(U,R)為近似空間,?X,Y?U,且X,Y是關(guān)于R的精確集,則
證明 若X,Y是關(guān)于R的精確集,則
故由定義5可證.
下面給出一個具體的例子.
所以有
利用文獻[2]定義的相似度量即式(1)可得:
利用文獻[3]定義的相似度量即式(2)可得:
從結(jié)果可以看出,由式(1)計算得的兩個集合的相似度太低,而式(2)又太高,由式(3)計算得到的相似度更貼近實際.
本文在現(xiàn)有的上下近似集粗糙相似度量方法研究的基礎(chǔ)上,討論了邊界域?qū)Σ淮_定性集合相似度的影響,并提出一種基于上下近似集與邊界域的粗糙集合間的相似度量方法.最后通過例子進行驗證,本文所提出的相似度量方法具有更高的分辨力.
[1]Pawlak Z.Rough Sets [J].International Journal of Computer and Information Sciences, 1982, 11(5):341-356.
[2]劉文軍,趙利萍.粗糙集的相似度量[J].數(shù)學(xué)理論與應(yīng)用.2012,32(3):35-42.
[3]林娟,米據(jù)生,解濱.粗糙集的兩種相似性度量[J].計算機科學(xué).2015,42(6):79-100.
[4]張清華,王進,王國胤.粗糙模糊集的近似表示[J].計算機學(xué)報,2015,38(7):1484-1494.
[5]徐久成,沈均毅,王國胤.Rough集之間的相似度量[J].計算機科學(xué),2003,30(10):55-60.
[6]史占紅,連玉平.基于包含度的粗糙集間的相似性度量[J].數(shù)學(xué)教學(xué)研究,2008,27(2):53-54.
[7]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京: 科學(xué)出版社, 2008.
[8]王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述[J].計算機學(xué)報,2009,32(7):1229-1243.
[9]徐偉華.序信息系統(tǒng)與粗糙集介紹及研究綜述[J].瓊州學(xué)院學(xué)報,2014,21(5):12-16.
[10]李敬,王利東,李曉慶,等.基于優(yōu)勢度的序信息系統(tǒng)屬性重要性度量[J].瓊州學(xué)院學(xué)報,2015,22(5):17 -22.
[11]張文修,梁怡,徐萍,等.基于包含度的不確定性推理[M].北京:清華大學(xué)出版社,2007.
(編校:曾福庚)
Similarity Measures between Rough Sets Based on theLower and Upper Approximation and Boundary Domain
ZHONG Cheng, WANG Zhe-he
(School of Ocean Information Engineering, Hainan Tropical Ocean University, Sanya Hainan 572022, China)
Measuring the similarity of the uncertain set is one of the cores of the rough set.The analysis was conducted on the current rough set similarity measuring methods based on the lower and upper approximation.Consequently, a similarity measuring formula between rough sets on the basis of the lower and upper approximation and boundary region was proposed.Examples showed that the method has a higher resolution.
rough set; lower and upper approximation; boundary region; similarity measure
格式:鐘誠,王哲河.基于上下近似與邊界域的粗糙集之間的相似度量[J].海南熱帶海洋學(xué)院學(xué)報,2017,24(2):39-42.
2016-11-01
海南熱帶海洋學(xué)院青年科研基金(QYQN201515,QYQN201428)
鐘誠(1981-),男,海南昌江人,海南熱帶海洋學(xué)院海洋信息工程學(xué)院講師,碩士,主要研究方向為粗糙集、數(shù)據(jù)處理.
TP18; O159
A
2096-3122(2017) 02-0039-04
10.13307/j.issn.2096-3122.2017.02.08