沈 林
(莆田學(xué)院,福建 莆田 351100)
Ziarko提出的變精度粗糙集[1]是對(duì)Pawlak的經(jīng)典粗糙集[2]的改進(jìn),通過(guò)引入?yún)?shù)β,提高粗糙集對(duì)抗噪音的能力,并且可以處理不一致數(shù)據(jù),是粗糙集理論中的重要方法.針對(duì)經(jīng)典粗糙集無(wú)法直接處理連續(xù)型數(shù)據(jù),Hu提出了鄰域粗糙集,并對(duì)變精度在鄰域粗糙集中的應(yīng)用進(jìn)行了研究[3,4].在各種變精度粗糙集的模型中,參數(shù)β的取值通常依賴于先驗(yàn)知識(shí),且主觀性強(qiáng),缺乏客觀的依據(jù).Zhang和Xue在文獻(xiàn)5和文獻(xiàn)6中用相似度分析不同參數(shù)β下的近似集接近目標(biāo)概念的程度.本文依據(jù)此思路,給出一種針對(duì)變精度鄰域粗糙集的精度取值新方法,通過(guò)計(jì)算在不同精度下近似集同目標(biāo)概念的相似度,選擇可以使相似度最高的精度.
設(shè)DS=(U,C∪D,V,f)為一決策系統(tǒng),u={x1,x2,…,xn}為論域空間,C、D分別是條件屬性和決策屬性,V為C∪D的值域,f是U×(C∪D)→V的映射.
定義1樣本xi的鄰域關(guān)系記為δ(xi)={xj|xj∈U,ΔA(Xi,xj)≤δ,其中 δ為鄰域半徑,A?C,ΔA(Xi,xj)表示在屬性A下樣本xi和xj的距離.
定義2引入?yún)?shù) β(0.5≤β≤1),有X?U,則有:
分別稱為X關(guān)于β的下近似和上近似.
定義3xi對(duì)X的隸屬度記為:
隸屬度可以用來(lái)表示樣本xi屬于目標(biāo)概念X的程度,取值范圍為[0,1].本文依據(jù)所有樣本的隸屬度情況來(lái)選擇參數(shù)β.
定義4近似集同目標(biāo)概念相似度可使用下面的計(jì)算公式:
為了改變以往的參數(shù)β取值缺乏客觀依據(jù),本文通過(guò)分析在不同的β下,近似集同目標(biāo)概念相似度的變化情況,尋找可以使相似度最大的β.算法如下:
輸入:決策系統(tǒng)DS=(U,C∪D,V,f)及目標(biāo)概念X.
輸出:更合理的參數(shù)β.
Step1:計(jì)算論域U在條件屬性C下的劃分U/C={X1,X2,…,Xn};
Step2:計(jì)算每個(gè)樣本xi的鄰域?qū)的隸屬度μi;
Step3:篩選出在[0.5,1]區(qū)間內(nèi)的 μi,并去除重復(fù)值;
Step4:計(jì)算各個(gè) μi下的下近似集 Rμi(X);
Step5:計(jì)算各個(gè) μi下的 Sμi(X,Rμi(X));
Step6:找出 Sμi(X,Rμi(X))最大時(shí)的 μi;
Step7:結(jié)束算法.
為了更加清晰地說(shuō)明第二節(jié)的參數(shù)β選取算法,本節(jié)以表1的決策信息表舉例,詳細(xì)說(shuō)明算法的運(yùn)算過(guò)程.其中,U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10},條件屬性C={c1,c2,c3},決策屬性D=miw0ew0.
表1 決策信息表
可以看出決策屬性D將U分為兩部分:U/D={X1=(x1,x2,x3,x5,x6),X2=(x4,x7,x8,x9,x10)}.設(shè)鄰域半徑取0.1,每個(gè)樣本在條件屬性C的鄰域如表所示:
表2 樣本的鄰域及對(duì)X1的隸屬度
接下來(lái)依次計(jì)算每個(gè)隸屬度下的下近似集,以及同x1的相似度,計(jì)算可得:
通過(guò)上面的計(jì)算,可以發(fā)現(xiàn)當(dāng)μ=3/5時(shí),得到的S3/5(X1,R3/5)=4/5最大,最接近目標(biāo)概念X1,所以若目標(biāo)概念為X1,應(yīng)當(dāng)將精度設(shè)置為3/5.
本文提出了一種用于變精度鄰域粗糙集的精度值選取方法,可以解決以往精度值選取依賴先驗(yàn)知識(shí),主觀性強(qiáng)的缺點(diǎn),可以使變精度鄰域粗糙集模型更加具有客觀性.本文選取的值可以使找出的下近似更加貼近目標(biāo)概念,可以有效地減小變精度鄰域粗糙集的邊界域.
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2018年6期