徐偉華,蔣宗穎
(西南大學(xué) 人工智能學(xué)院,重慶 400715)
直覺模糊集[1]是保加利亞學(xué)者Atanassov在1986年提出的一種基于模糊集理論[2]的推廣.其核心思想是在模糊集隸屬度的基礎(chǔ)上,增加了非隸屬度以及猶豫度的概念,以期能夠更加全面、清晰地描述和理解模糊概念.直覺模糊集理論提出以來,受到了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注,也成功應(yīng)用到物流服務(wù)、圖像融合、決策判斷、機(jī)器學(xué)習(xí)、醫(yī)療診斷等領(lǐng)域[3-7].當(dāng)前已經(jīng)成為處理模糊性和不確定性問題的有效工具.
粗糙集[8]是1982年波蘭學(xué)者Pawlak提出的另一種處理不確定性問題的工具.該理論強(qiáng)調(diào)從數(shù)據(jù)本身出發(fā),不需要任何所研究問題的先驗(yàn)知識(shí)便可以從數(shù)據(jù)中發(fā)現(xiàn)知識(shí).屬性約簡(jiǎn)[9-10]是粗糙集理論研究中最為重要的內(nèi)容之一,其基本內(nèi)容是指在保持決策能力不變的前提下盡可能去除冗余元素,降低知識(shí)庫(kù)的內(nèi)存存儲(chǔ)空間,有助于在知識(shí)獲取過程中降低時(shí)間復(fù)雜度.此外,眾多學(xué)者從不同的角度對(duì)屬性約簡(jiǎn)進(jìn)行了研究,并取得了很多重要成果[11-14].
現(xiàn)實(shí)生活中,決策信息系統(tǒng)一般不是基于等價(jià)關(guān)系,而是基于條件屬性取值為直覺模糊數(shù)的優(yōu)勢(shì)關(guān)系,這更符合實(shí)際需求.本文通過對(duì)隸屬度、非隸屬度和猶豫度加權(quán)定義了一個(gè)加權(quán)得分函數(shù),從而定義了一種直覺模糊偏序關(guān)系,并在此基礎(chǔ)上構(gòu)造度量偏好直覺模糊序決策信息系統(tǒng).進(jìn)一步在度量偏好直覺模糊序決策信息系統(tǒng)中引入了分布(最大分布)函數(shù)和分布(最大分布)辨識(shí)矩陣,給出獲取決策信息系統(tǒng)全部分布(最大分布)約簡(jiǎn)的方法,并通過一個(gè)具體實(shí)例分析比較了兩種約簡(jiǎn)方法的優(yōu)劣性.
信息系統(tǒng)通常由論域和條件屬性構(gòu)成,特別地,當(dāng)信息系統(tǒng)中具有決策屬性的時(shí)候,稱該信息系統(tǒng)為決策信息系統(tǒng).為了更好地理解決策信息系統(tǒng),在此給出相關(guān)的基本概念[15-16].
定義2給定一個(gè)決策信息系統(tǒng)DI=(U,AT∪3j5nb5r,F,G),對(duì)任意f∈F,g∈G,a∈AT和x∈U,有f(x,a)=(θa(x),?a(x)),g(x,d)∈R(R為實(shí)數(shù)集),分別表示對(duì)象x在條件屬性a和決策屬性d下的取值.其中,函數(shù)θa:U×a→[0,1]和?a:U×a→[0,1]分別表示U中對(duì)象x在條件屬性a下的隸屬度和非隸屬度,并且滿足0≤θa(x)+?a(x)≤1,稱f(x,a)為直覺模糊數(shù).
進(jìn)一步,記h(a)={(θa(x),?a(x))|a∈AT},稱h(a)為U上的直覺模糊集.如果滿足上述性質(zhì),則稱IS=(U,AT,F)是直覺模糊信息系統(tǒng),DI=(U,AT∪z5fbndl,F,G)是直覺模糊決策信息系統(tǒng).
定義3已知DI=(U,AT∪xb5vfhj,F,G)是直覺模糊決策信息系統(tǒng),?x∈U,?a∈AT,定義對(duì)象x對(duì)屬性a的加權(quán)得分函數(shù)為:
Sa(x)=ω1θa(x)-ω2?a(x)-ω3πa(x)
其中:θa(x)和?a(x)分別表示U中對(duì)象x在條件屬性a下的隸屬度和非隸屬度,并且始終滿足0≤θa(x)+?a(x)≤1,πa(x)=1-θa(x)-?a(x)表示對(duì)象x在條件屬性a下的猶豫度,從而加權(quán)得分函數(shù)可以進(jìn)一步表示為:
Sa(x)=(ω1+ω3)θa(x)+(ω3-ω2)?a(x)-ω3
下面將定義直覺模糊決策信息系統(tǒng)中條件屬性值和決策屬性值的偏序關(guān)系.
定義4給定DI=(U,AT∪lhpbxtl,F,G)是直覺模糊決策信息系統(tǒng),對(duì)于?f∈F,?g∈G,?a∈AT以及?x,y∈U,有:
h(x,a)≥h(y,a)?Sa(x)≥Sa(y)
g(x,d)≥g(y,d)
則稱DI=(U,AT∪vfffphb,F,G)為直覺模糊序決策信息系統(tǒng),記DI≥=(U,AT∪rlv5rvb,F,G).
根據(jù)直覺模糊序決策信息系統(tǒng)的構(gòu)造,可以得到基于條件屬性和決策屬性的遞增或遞減的偏序關(guān)系.若某一條件屬性下得到的條件屬性值域構(gòu)成了一個(gè)遞增或遞減的偏序關(guān)系,則稱該條件屬性為該直覺模糊決策信息系統(tǒng)的一個(gè)準(zhǔn)則,同理可以獲取相對(duì)應(yīng)的決策準(zhǔn)則.根據(jù)上述討論,可以獲取由條件屬性值域和決策屬性值域遞增或遞減偏序關(guān)系構(gòu)成的優(yōu)勢(shì)關(guān)系.本文主要討論由遞增的偏序關(guān)系獲得的優(yōu)勢(shì)關(guān)系,不失一般性,本文方法在遞減的偏序情況下同樣適用.
因此,在度量偏好直覺模糊序決策信息系統(tǒng)中,如果a∈AT,?x,y∈U,x、y之間存在優(yōu)勢(shì)關(guān)系“≥”,則用“x≥y”表示x在準(zhǔn)則a下優(yōu)于y.
={(x,y)∈U×U|Sa(x)≥Sa(y),?a∈A}
={y∈U|Sa(y)≥Sa(x),?a∈A}
引理1設(shè)α=(a1,a2,…,an)T,β=(b1,b2,…,bn)T是兩個(gè)n維向量,如果ai=bi(i=1,…,n),則稱向量α等于向量β,記作α=β;如果ai≤bi(i=1,…,n),則稱向量α小于等于向量β,記作α≤β;如果出現(xiàn)其余情況,則稱向量α不小于等于向量β,記作α>β.
由引理1和分布函數(shù)以及最大分布函數(shù)的定義,可以獲得在度量偏好直覺模糊序決策信息系統(tǒng)下的相關(guān)性質(zhì).
(2)~(4)可以由定理2.1(1)和分布函數(shù)以及最大分布函數(shù)的定義可得.
因此,原定理成立.
證明:與定理2.3類似.
在第2節(jié)給出了在度量偏好不協(xié)調(diào)直覺模糊序決策信息系統(tǒng)下分布(最大分布)函數(shù)的定義以及判定定理,這是在準(zhǔn)則集下判斷分布約簡(jiǎn)的基礎(chǔ).在本節(jié)中,將通過定義分布辨識(shí)矩陣的方式給出具體計(jì)算分布約簡(jiǎn)的方法.
因此,原定理成立.
是該度量偏好直覺模糊序決策信息系統(tǒng)的分布辨識(shí)公式.
假設(shè)某醫(yī)院的10位醫(yī)生對(duì)7個(gè)病人(x1,x2,x3,x4,x5,x6,x7)進(jìn)行聯(lián)合診斷,他們分別對(duì)這些病人的病癥(a1,a2,a3,a4)做出判斷,病癥通常為心痛等模糊性詞語,醫(yī)生基于病人描述以及從醫(yī)經(jīng)驗(yàn)給出這些病人擁有這些病癥的程度,從而判斷該病人此刻的病情狀況,病情狀況分為A、B、C三種.表1給出了10位醫(yī)生對(duì)7個(gè)病人的診斷情況,在表1中這樣解釋病人x1在病癥a1下的直覺模糊數(shù):一共有10位醫(yī)生,有4位醫(yī)生認(rèn)為該病人具有病癥a1,5位醫(yī)生認(rèn)為該病人不具有病癥a1,還有1位醫(yī)生無法給出準(zhǔn)確判斷.這時(shí),認(rèn)為病人x1對(duì)病癥a1的隸屬度為0.4,非隸屬度為0.5,猶豫度為0.1,記作f(x1,a1)=(0.4,0.5).可以類似地解釋其他直覺模糊數(shù).此外,在加權(quán)得分函數(shù)中,人們往往更看重隸屬度,所以在此設(shè)置偏好權(quán)重為ω1=0.6,ω2=0.3,ω3=0.1.
表1 度量偏好直覺模糊序決策信息系統(tǒng)
為了便于后續(xù)計(jì)算在該度量偏好直覺模糊序決策信息系統(tǒng)中的分布約簡(jiǎn)以及最大分布約簡(jiǎn),在表2計(jì)算了任意對(duì)象x∈U對(duì)任意屬性a∈AT的加權(quán)得分函數(shù).
根據(jù)表2,可以知道:
表2 上述決策信息系統(tǒng)的加權(quán)得分函數(shù)
方法1:利用定義6求解分布約簡(jiǎn)與最大分布約簡(jiǎn).
方法 2:利用定理3.2求解分布約簡(jiǎn)與最大分布約簡(jiǎn).
根據(jù)表1的度量偏好直覺模糊序決策信息系統(tǒng),可得該系統(tǒng)下的分布約簡(jiǎn)辨識(shí)矩陣,如表3所示.
表3 上述決策信息系統(tǒng)下的分布辨識(shí)矩陣
特別地,便于記錄,在表3中,用屬性的下標(biāo)表示屬性,用0表示分布可辨識(shí)屬性集為空集的情況.
由此可得:
(a1∨a4)∧a4(a1∨a3∨a4)∧(a2∨a3∨a4)∧(a3∨a4)∧a3(a2∨a3)∧
(a1∨a2∨a3∨a4)∧(a1∨a2)=a1∧a2∧a3∧a4
因此,{a1,a2,a3,a4}是該度量偏好直覺模糊序決策信息系統(tǒng)的分布約簡(jiǎn),由定理2.2可以知道{a1,a2,a3,a4}也是該決策信息系統(tǒng)的最大分布約簡(jiǎn).
根據(jù)計(jì)算出的分布約簡(jiǎn)以及最大分布約簡(jiǎn),可以知道,條件屬性集AT是使每個(gè)病人在病情決策類中隸屬度保持不變的屬性集,同時(shí)它也是每個(gè)病人在最大分布病情決策類中保持不變的屬性集.
比較方法1和方法2,發(fā)現(xiàn)二者的計(jì)算結(jié)果都相同,但是它們所需要的時(shí)間未必相同,為了更加客觀地比較不同方法在計(jì)算時(shí)間上的優(yōu)劣,分析了這兩種方法在最壞情況下的時(shí)間復(fù)雜度.為了計(jì)算時(shí)間復(fù)雜度,把任意兩個(gè)對(duì)象在任一屬性下關(guān)于加權(quán)得分函數(shù)的一次比較作為一次基本運(yùn)算,那么在最壞的情況下,可算得方法1的時(shí)間復(fù)雜度為O(|U|2×|AT|×2|AT|),方法2的時(shí)間復(fù)雜度為O(|U|2×|AT|).比較最壞情況下不同方法的時(shí)間復(fù)雜度,認(rèn)為在保持結(jié)果一致的前提下應(yīng)該采用方法2,即分布辨識(shí)矩陣的方法來求解分布約簡(jiǎn),因?yàn)檫@能大量減少時(shí)間成本.
本文在直覺模糊序決策信息系統(tǒng)中,借助偏好權(quán)重定義了加權(quán)得分函數(shù),從而構(gòu)造了度量偏好直覺模糊序決策信息系統(tǒng).通過研究分布約簡(jiǎn)的性質(zhì)得到了相應(yīng)的判定定理,給出了兩種獲取分布約簡(jiǎn)的方法,并通過一個(gè)具體的實(shí)例驗(yàn)證了兩種方法的可行性與有效性.