梁美社,米據(jù)生,張少譜
(1.石家莊鐵道大學 數(shù)理系,河北 石家莊 050043;2.河北師范大學 數(shù)學科學學院,河北 石家莊 050024)
粗糙集最早是由Pawlak[1]于1982 年提出的。經(jīng)典的粗糙集模型是建立在等價關(guān)系之上,由于等價關(guān)系的要求過于嚴苛,為了適應(yīng)各類復(fù)雜數(shù)據(jù)環(huán)境,許多學者提出了包括優(yōu)勢關(guān)系[2]、容差關(guān)系[3]、模糊關(guān)系[4]、鄰域關(guān)系[5]等擴展的粗糙集模型??紤]集合之間的重疊關(guān)系,許多研究者給出了該理論的概率推廣[6-8]。概率粗糙集模型是其中一種重要的推廣[9-11]。該模型中的概率近似算子是根據(jù)條件概率和閾值(能承受不確定性或分類錯誤的程度)來確定的。當前,概率粗糙集模型大致分為三類:決策理論粗糙集模型、變精度粗糙集模型和貝葉斯粗糙集模型。Yao 在文獻[12]中,基于粗糙隸屬度和粗糙包含度,重新討論了概率粗糙集近似算子,給出了3 個模型的統(tǒng)一框架。近年來,概率粗糙集模型在應(yīng)用方面取得了很大進展[13-15],Sun 等[16]基于概率粗糙集的三支決策原理,提出了一種改進的Pawlak 沖突分析模型。與原有的Pawlak 沖突分析模型相比,所提出的模型不僅為處理沖突分析問題提供了新的視角和方法,而且克服了原有模型的局限性。基于模糊熵,Ma[17]給出了三支概率粗糙集模型中兩種屬性約簡方法。Yang 等[18]提出了基于模糊關(guān)系的概率粗糙集模型,并將其用于醫(yī)療診斷系統(tǒng)中。盡管該模型中采用了模糊關(guān)系,但真正起作用的是模糊關(guān)系的截關(guān)系。這意味著它仍然是基于經(jīng)典二元關(guān)系的概率粗糙集模型。
概率理論中的事件一般指樣本空間中的精確指定的元素集合[19]。然而日常生活中,人們也常常遇到模糊的、不清晰的事件[20]。這就需要討論模糊概率近似空間框架下,模糊事件的概率粗糙近似問題。文獻[21]提出了4 種模糊概率近似算子,然后應(yīng)用貝葉斯決策理論,研究了模糊事件的三支決策問題,指出了決策理論粗糙集與模糊概率粗糙集的關(guān)系。作為模糊集理論的重要推廣,直覺模糊集理論是Atanassov[22-23]于1986 年提出的。由于該理論在考慮隸屬度的同時,增加了元素對集合的非隸屬度和猶豫度等信息,因此比模糊集在表達模糊性上更加細膩,在處理不確定性問題方面更具靈活性和實用性。郭智蓮等[24]提出了基于直覺模糊關(guān)系的概率粗糙集模型。與文獻[18]類似,利用閾值將直覺模糊關(guān)系轉(zhuǎn)化成經(jīng)典二元關(guān)系,它依然是基于經(jīng)典二元關(guān)系的概率粗糙集模型。當前,在直覺模糊概率近似空間框架下,很少文獻對直覺模糊事件進行概率粗糙近似研究。因此,有必要將概率粗糙集模型進一步推廣到直覺模糊概率近似空間,進而拓展模型的應(yīng)用。
在現(xiàn)有文獻的基礎(chǔ)上,本文首先定義了直覺模糊條件概率。在直覺模糊概率空間下構(gòu)造了雙論域廣義直覺模糊概率粗糙集模型,討論了模型的主要性質(zhì)。最后,將模型應(yīng)用到臨床診斷系統(tǒng)中。
定義1[22-23]設(shè)U={x1,x2,···,xn}是非空有限論域,稱A={〈μA(x),νA(x)〉|x∈U}為U上的直覺模糊集合,其中 μA:U→[0,1],νA:U→[0,1]分別為U中元素a關(guān)于A的隸屬度和非隸屬度,且對于任意x∈U都滿足 0≤μA(x)+νA(x)≤1。稱πA(x)=1?μA(x)?νA(x)為x關(guān)于A的猶豫度或不確定度。如果對于任意x∈U都有 πA(x)=0,則直覺模糊集合退化成模糊集合。U上全體直覺模糊集記為IFS(U)。
定義2[22-23]對于任意A,B∈IFS(U),有:
1)A?B???x∈U,μA(x)≤μB(x)且 νA(x)≥νB(x);
2)A=B???x∈U,μA(x)=μB(x)且νA(x)=νB(x);
3)~A={〈νA(x),μA(x)〉|x∈U};
4)A∩B??{〈μA(x)∧μB(x),νA(x)∨νB(x)〉|x∈U};
5)A∪B??{〈μA(x)∨μB(x),νA(x)∧νB(x)〉|x∈U};
6)A⊕B={〈μA(x)+μB(x)?μA(x)μB(x),νA(x)νB(x)〉|x∈U};
7)A?B={〈μA(x)μB(x),νA(x)+νB(x)?νA(x)νB(x)〉|x∈U}。
設(shè)U、V是兩個非空有限論域,稱IR:U×V→[0,1]×[0,1]是U到V上的直覺模糊二元關(guān)系。對于任意x∈U,IR(x)={〈μIR(x,y1),νIR(x,y1)〉,〈μIR(x,y2),νIR(x,y2)〉,···,〈μIR(x,ym),νIR(x,ym)〉|yj∈V,j=1,2,···,m}
表示V上的直覺模糊集合。從粒的角度來看,IR(x)可以看成對象x的一個直覺模糊粒,而{IR(x)|x∈U}可看成U上的一個直覺模糊粒結(jié)構(gòu)。
設(shè)U是一個非空有限論域,R是U×U上的一個等價關(guān)系,則稱(U,R)為一個近似空間。于是R產(chǎn)生了U上的一個劃分U/R={[xi]R|xi∈U},[xi]R稱為含xi的等價類。?X?U,X關(guān)于R的下近似和上近似分別定義為={(x∈U|[x]R?)X},={x∈U|[x]R∩X≠?}。稱序?qū)閄關(guān)于等價關(guān)系R的粗糙集[1]。
設(shè)U是一個非空有限論域,R是U×U上的一個等價關(guān)系,P是定義在由U的子集構(gòu)成的 σ代數(shù)上的概率測度,則稱(U,R,P)為一個概率近似空間。?X?U,0≤β<α≤1,X關(guān)于近似空間(U,R,P)及閾值 α、β 的概率粗糙下近似和上近似分別定義為
其中P(X|[x]R)表示[x]R中元素屬于X的概率。稱序?qū)閄關(guān)于(U,R,P)及閾值 α、β的概率粗糙集[8]。
定義3[18]設(shè)U、V是兩個非空有限論域,稱R:U×V→[0,1]是U到V上的模糊二元關(guān)系。?λ∈[0,1],稱Rλ為R的 λ截關(guān)系,即Rλ={(x,y)∈U×V|R(x,y)≥λ}。?x∈U,令Rλ(x)={y∈V|R(x,y)≥λ}。
定義4[18]設(shè)U、V是兩個非空有限論域,R是U到V上的模糊二元關(guān)系。P是定義在由V的子集構(gòu)成的 σ代數(shù)上的概率測度。稱(U,V,R,P)為U到V上的模糊概率近似空間。?λ∈[0,1],0≤β<α≤1,Y?V,則Y關(guān)于(U,V,R,P)及閾值 λ、α、β的下、上近似分別為
根據(jù)上下近似,很容易計算Y關(guān)于(U,V,R,P)及閾值 λ、α、β的模糊概率正域、負域以及邊界域,即
如果P(Y|Rλ(x))=|Y∩Rλ(x)|/|Rλ(x)|,其中|Rλ(x)|表示集合的Rλ(x)基數(shù),R是U到V上的經(jīng)典等價二元關(guān)系,令 α=1,β=0,則定義4 中模糊概率粗糙集將退化為經(jīng)典粗糙集。
定義5[24]設(shè)U、V是兩個非空有限論域,稱IR 是U到V上的直覺模糊二元關(guān)系。?λ1,λ2∈[0,1],稱為 IR關(guān)于(λ1,λ2)的截關(guān)系,即={(x,y)∈U×V|μIR(x,y)≥λ1,νIR(x,y)≤λ2}。?x∈U,為對象x的截關(guān)系類,其中={y∈V|μIR(x,y)≥λ1,νIR(x,y)≤λ2}。
定義6[24]設(shè)U、V是兩個非空有限論域,稱IR 是U到V上的直覺模糊二元關(guān)系。P是定義在由V的子集構(gòu)成的 σ代數(shù)上的概率測度。稱(U,V,IR,P)為U到V上的直覺模糊概率近似空間。?λ1,λ2∈[0,1],0≤β<α≤1,Y?V,則Y關(guān)于(U,V,IR,P)及閾值 λ1、λ2、α、β的下、上近似分別為
根據(jù)上、下近似,很容易計算Y關(guān)于(U,V,IR,P)及閾值 λ1、λ2、α、β的直覺模糊概率正域、負域、以及邊界域,即
雖然上述直覺模糊概率粗糙集采用了直覺模糊關(guān)系,但真正起作用的是直覺模糊關(guān)系的(λ1,λ2)截關(guān)系,即將直覺模糊關(guān)系轉(zhuǎn)化成經(jīng)典二元關(guān)系后的經(jīng)典概率粗糙集模型。若Y∈IFS(V)為V上的直覺模糊集合,條件概率公式將無法計算,直覺模糊集合Y的概率粗糙下、上近似也將無法計算。其次,令V={y1,y2,y3,y4},IR∈IFS(V),其中 IR={〈0.7,0.21〉,〈0.8,0.1〉,〈0.69,0.2〉,〈0.71,0.21〉}。若取(λ1,λ2)=(0.7,0.2),則根據(jù)定義5 有 IR(0.7,0.2)={y2}。若取(λ1,λ2)=(0.7,0.21),則 IR(0.7,0.21)={y1,y2,y4}。隸屬度和非隸屬的極小改變,會導(dǎo)致截關(guān)系的結(jié)果出現(xiàn)很大差異,即直覺模糊關(guān)系的(λ1,λ2)截關(guān)系不具有魯棒性。文獻[24]中指出,同一疾病的不同癥狀表現(xiàn)強度是不同的,因此選取一組(λ1,λ2)參數(shù)所得的結(jié)果也不近合理。
為了解決這一問題,下面我們給出一種新的雙論域上的廣義直覺模糊概率粗糙集模型。
一個直覺模糊集合可以看作一個直覺模糊事件,根據(jù)文獻[25]可以定義直覺模糊事件的概率。
定義7[25]設(shè)U是非空有限論域,P是定義在由U的子集構(gòu)成的 σ代數(shù)上的概率測度。對于任意直覺模糊集(直覺模糊事件)A∈IFS(U),A的 直覺模糊概率P?(A)定義如下:
顯然 0≤P?(A)≤1,且對于任意A,B∈IFS(U),若A?B,則P?(A)≤P?(B)。若?x∈U,P(x)=1/|U|,當A是一個經(jīng)典集合時,則P?(A)=P(A)=|A|/|U|。
例1 設(shè)U={x1,x2,x3,x4},若對于任意x∈U,P(x)=1/|U|。A是U上的直覺模糊集合且A={〈0.7,0.1〉,〈0.2,0.6〉,〈0.7,0.0〉,〈0.1,0.8〉},則根據(jù)定義7 計算可知:
如果兩個直覺模糊事件A、B∈IFS(U)是相互獨立的,則直覺模糊條件概率定義如定義8。
定義8設(shè)U是非空有限論域,P是定義在由U的子集構(gòu)成的 σ代數(shù)上的概率測度。對于任意直覺模糊集(直覺模糊事件)A、B∈IFS(U),若P?(B)≠0,A關(guān)于B的直覺模糊條件概率P?(A|B)定義為
例2設(shè)A,B∈IFS(U),其中A={〈0.7,0.1〉,〈0.2,0.6〉,〈0.7,0.0〉,〈0.1,0.8〉},B={〈0.8,0.1〉,〈0.6,0.1〉,〈0.3,0.6〉,〈0.3,0.6〉}若 ?x∈U,P(x)=1/|U|,則
如果A和B退化成經(jīng)典集合,那么上述直覺模糊條件概率則退化成經(jīng)典集合的條件概率,即
性質(zhì)1?A,B,C∈IFS(U),如果P?(A)≠0,則:
1)P?(?|A)=0,P?(U|A)=1;
2)如果B?C,則P?(B|A)≤P?(C|A)。
證明根據(jù)定義2、7,結(jié)論1)和2)顯然成立。
定義9設(shè)(U,V,IR,P)為U到V上的直覺模糊概率近似空間。A∈IFS(V),令 0≤β<α≤1,則A關(guān)于(U,V,IR,P)及閾值 α、β 的下、上近似分別為
投資人們也開始意識到,共享單車盈利模式短期無解,而巨頭們認為,共享單車很難單獨存活,只有進入到巨頭的大生態(tài)之內(nèi),才有其商業(yè)回報上的價值和意義,餓了么就是一例。
根據(jù)上、下近似,可以計算A關(guān)于(U,V,IR,P)及閾值 α、β的直覺模糊概率正域、負域,以及邊界域,即
如果直覺模糊關(guān)系 IR 和直覺模糊集A分別退化成模糊關(guān)系和模糊集合,則(α,β)-廣義直覺模糊概率粗糙集退化成文獻[21]中(α,β)-模糊概率粗糙集;如果直覺模糊關(guān)系 IR和直覺模糊集A分 別退化成經(jīng)典等價關(guān)系和經(jīng)典集合,則(α,β)-廣義直覺模糊概率粗糙集退化成文獻[8] 中(α,β)-概率粗糙集。
性質(zhì)2設(shè)(U,V,IR,P)為U到V上的直覺模糊概率近似空間。對于A,B∈IFS(V),0≤β<α≤1,有下列結(jié)論成立:
證明根據(jù)定義8、9 易證結(jié)論1)、2)。下面來證明結(jié)論3)~6)。
結(jié)論5)證明過程和結(jié)論4)相同。
若 β=1?α,就得到了一種特殊的(α,β)-廣義直覺模糊概率粗糙集,這時只需要確定參數(shù) α一個閾值。
定義10設(shè)(U,V,IR,P)為U到V上的直覺模糊概率近似空間。?A∈IFS(V),令0.5<α≤1,則A關(guān)于(U,V,IR,P)及閾值α 的下上近似分別為
根據(jù)上、下近似,可以計算A關(guān)于(U,V,IR,P)及閾值 α的直覺模糊概率正域、負域,以及邊界域,即
如果直覺模糊關(guān)系 IR 和直覺模糊集A分別退化成模糊關(guān)系和模糊集合,則 α?廣義直覺模糊概率粗糙集退化成文獻[21]中 α?模糊概率粗糙集;如果直覺模糊關(guān)系 IR 和直覺模糊集A分別退化成經(jīng)典等價關(guān)系和經(jīng)典集合,則 α?廣義直覺模糊概率粗糙集退化成經(jīng)典的 α?概率粗糙集。
當只關(guān)心那些在一定程度上支持直覺模糊事件的對象時,可以使用 α?廣義直覺模糊概率粗糙集。這時只需要確定一個閾值 α。類似的,也能得到性質(zhì)3。
性質(zhì)3設(shè)(U,V,IR,P)為U到V上的直覺模糊概率近似空間。對于A,B∈IFS(V),0.5<α≤1,有下列結(jié)論成立:
根據(jù)定義8、10,類似性質(zhì)2 易證性質(zhì)3,這里就不再重復(fù)了。
本節(jié)將討論雙論域上的廣義直覺模糊概率粗糙集在醫(yī)療診斷上的應(yīng)用。
例3有一個醫(yī)療診斷實例,其中U={x1,x2,···,x9}為一組患者集合,V={y1,y2,···,y5}為一組癥狀集合。每個患者x∈U關(guān)于癥狀y∈V的隸屬度和非隸屬度如表1 所示。
表1 患者與癥狀之間的直覺模糊關(guān)系Table 1 Intuitionistic fuzzy relationship between patients and symptoms
假設(shè)A為某種疾病,它的臨床診斷表現(xiàn)為A={〈0.7,0〉,〈0.2,0.6〉,〈0,0.9〉,〈0.7,0〉,〈0.1,0.8〉}設(shè)癥狀集合上的概率分布函數(shù)為P(y)=1/|V|(?y∈V),根據(jù)定義8,疾病A關(guān)于每個患者xi∈U(即信息粒度IR(xi),i=1,2,···,9)的直覺模糊條件概率分別為P?(A|IR(x1))=0.57,P?(A|IR(x2))=0.06,P?(A|IR(x3))=0.51,P?(A|IR(x4))=0.52,P?(A|IR(x5))=0.80,P?(A|IR(x6))=0.74,P?(A|IR(x7))=0.33,P?(A|IR(x8))=0.09,P?(A|IR(x9))=0.28。
令α=0.7,β=0.5,根據(jù)定義9 有如下結(jié)果:
因此可以得到以下結(jié)論:在給定閾值α=0.7,β=0.5的情況下,患者x5、x6一定感染了疾病A,需要立即進行治療;患者x2、x7、x8、x9一定沒有感染疾病A,暫時不需要進行治療;患者x1、x3、x4可能感染了疾病A,需要進一步檢查確診。
若令 α=0.55,根據(jù)定義10 有如下結(jié)果:
此時,可以得到以下結(jié)論:在給定閾值α=0.55的情況下,患者x1、x5、x6一定感染了疾病A,需要立即進行治療;患者x2、x7、x8、x9一定沒有感染了疾病A,暫時不需要進行治療;患者x3、x4可能感染了疾病A,需要進一步檢查確診。
另外,還考慮下面一個醫(yī)療診斷問題,數(shù)據(jù)來源于文獻[26]。
例4假設(shè)有四名患者,記為U={Al,Bob,Joe,Ted},癥狀集合V={T,H,S,C,CP},其中T 表示溫度,H 表示頭痛,S 表示胃痛,C 表示咳嗽,CP 表示胸痛。診斷結(jié)果集合D={Vf,Ma,Ty,St,Ch},其中Vf 表示病毒性感冒,Ma 表示瘧疾,Ty 表示傷寒,St 表示胃病,Ch 表示胸肺病。表2 為患者與癥狀之間的直覺模糊關(guān)系,表3 為疾病與癥狀之間的直覺模糊關(guān)系。下面我們來確定每位患者的診斷結(jié)果。
表2 患者與癥狀之間的直覺模糊關(guān)系Table 2 Intuitionistic fuzzy relationship between patients and symptoms
表3 疾病與癥狀之間的直覺模糊關(guān)系Table 3 Intuitionistic fuzzy relationship between diseases and symptoms
由于每種疾病的主要表現(xiàn)癥狀各不相同,根據(jù)這一特點,令P(y)=μV(y)/∑y∈VμV(y)。表2 中,用A1={〈0.8,0.1〉,〈0.6,0.1〉,〈0.2,0.8〉,〈0.6,0.1〉,〈0.1,0.6〉}表示患者Al 在每種癥狀下的直覺模糊集合;表3 中,用Vf={〈0.4,0.0〉,〈0.3,0.5〉,〈0.1,0.7〉,〈0.4,0.3〉,〈0.1,0.7〉}表示疾病Vf 在每種癥狀下的直覺模糊集合,其他以此類推。根據(jù)定義8,計算診斷結(jié)果中病毒性感冒關(guān)于每位患者的直覺模糊條件概率:
計算其他疾病關(guān)于每位患者的直覺模糊條件概率,結(jié)果如表4 所示。
表4 疾病關(guān)于患者的直覺模糊條件概率Table 4 Intuitionistic fuzzy conditional probability of diseases about patients
設(shè)閾值 α=0.7,β=0.5。據(jù)定義9 可知,Vf 關(guān)于閾值α、β的下、上近似為。根據(jù)上、下近似,Vf 關(guān)于閾值 α、β的直覺模糊概率正域、負域,以及邊界域分別為POS0.7(Vf)=?,NEG0.5(Vf)=U,BN(0.7,0.5)(Vf)=?。也就是說,所有患者均都沒有患有疾病Vf(病毒性感冒)。類似的,計算其他疾病關(guān)于閾值 α、β的直覺模糊概率正域、負域,以及邊界域如下:
POS0.7(Ma)={Al,Joe,Ted},NEG0.5(Ma)={Bob},BN(0.7,0.5)(Ma)=?;
POS0.7(Ty)=?,NEG0.5(Ty)={Al,Bob,Ted},BN(0.7,0.5)(Ty)={Joe};
POS0.7(St)={Bob},NEG0.5(St)={Al,Joe,Ted},BN(0.7,0.5)(St)=?;
POS0.7(Ch)=?,NEG0.5(Ch)=U,BN(0.7,0.5)(Ch)=?
由上面的計算可知,Al 一定患有疾病Ma(瘧疾);Bob 一定患有疾病St(胃?。?;Joe 一定患有疾病Ma(瘧疾),可能患有疾病Ty(傷寒);Ted 一定患有疾病Ty(傷寒)。
將計算結(jié)果與其他文獻進行比較,結(jié)果如表5所示。與其他方法不同的是,由于條件概率的加入,根據(jù)不同的閾值,患者Joe 一定患有疾病Ma(瘧疾),可能患有疾病Ty(傷寒)。這樣的診斷結(jié)果更加符合實際,因為臨床癥狀表現(xiàn)可能不是由單一疾病引起的。因此,需進一步檢查,從而對癥治療。
表5 不同方法的結(jié)果比較Table 5 Comparison of results of different methods
已有的雙論域直覺模糊概率粗糙集模型通過設(shè)置兩個閾值 λ1、λ2,討論了經(jīng)典集合的概率粗糙下、上近似。從概率角度出發(fā),一個直覺模糊集合就是一個直覺模糊事件。本文首先給出了直覺模糊條件概率的定義。隨后,在直覺模糊概率空間下構(gòu)造了雙論域廣義直覺模糊概率粗糙集模型,討論了模型的主要性質(zhì)。最后,將模型應(yīng)用到臨床診斷系統(tǒng)中,并與已有文獻中的結(jié)果進行比較。結(jié)果表明,所提出的概率粗糙集模型進一步豐富了概率粗糙集理論,更加符合實際應(yīng)用。下一步,考慮直覺模糊條件概率具有單調(diào)性,將討論廣義直覺模糊概率粗糙集中的屬性約簡問題。另外,由于直覺模糊集具有接受、拒絕和猶豫的語義,將該模型與三支決策模型相結(jié)合,繼續(xù)拓展該模型在其他領(lǐng)域的應(yīng)用也是我們未來的研究內(nèi)容。