楊 勇,張東升,王艷茹,張亞男
(西北師范大學計算機科學與工程學院,甘肅 蘭州 730070)
1965年,Zadeh[1]提出了模糊集理論,該理論為處理不精確、不確定的數(shù)據(jù)和信息提供了一個重要工具。Atanassov[2]于1986年對模糊集進行拓展,給出了直覺模糊集概念,由于它同時考慮隸屬度、非隸屬度和猶豫度三方面的信息,因此與模糊集相比,直覺模糊集在處理信息的模糊性和不確定性時更具有靈活性和實用性。Gau和Buehrer[3]于1993年定義了Vague集概念,后來Bustince和Burillo[4]證明了Vague集就是直覺模糊集。
相似度測量是度量兩個對象之間相似程度的一個重要方法,它在決策分析[5]、模式識別[6]和醫(yī)療診斷[7]等領域得到廣泛應用。1995年Chen[8]將相似度引入Vague集,1999年Hong 和Kim[9]對Chen的方法進行改進。2002年Li和Cheng[10]提出了一種測量兩個直覺模糊集間相似程度的計算公式,并將其用在模式識別中。2011年Ye[11]利用向量的知識定義了余弦相似度測量公式,但該公式在某些情況下會出現(xiàn)不合理現(xiàn)象,為彌補該缺陷,Shi和Ye[12]通過考慮隸屬度、非隸屬度和猶豫度三方面的信息對文獻[11]中的公式進行改進,提出余弦相似度測量公式的另外一種形式。接著2013年Tian[13]給出了基于余切函數(shù)的相似度測量公式,使計算過程更加簡單化。受文獻[11]和文獻[13]中相似度測量公式的啟發(fā),本文對三角相似度測量進一步拓展,提出基于正弦函數(shù)的相似度測量公式,并應用于醫(yī)療診斷和汽車發(fā)動機的設計方案決策中。
定義1設X為論域,其中任意一個元素用x表示,則在X上的直覺模糊集A定義為:A={〈x,μA(x),vA(x)〉|x∈X},其中μA(x)和vA(x)分別表示成員隸屬度和非成員隸屬度,即μA(x):X→[0,1],vA(x):X→[0,1],并且需滿足條件0≤μA(x)+vA(x)≤1。此外,πA(x)=1-μA(x)-vA(x),x∈X,表示X中x屬于A的猶豫度或不確定度。
設A={〈x,μA(x),vA(x)〉|x∈X}和B={〈x,μB(x),vB(x)〉|x∈X}為論域X上的兩個直覺模糊集,則:
(1)A?B當且僅當μA(x)≤μB(x),vA(x)≥vB(x),x∈X。
(2)A=B當且僅當μA(x)=μB(x),vA(x)=vB(x),x∈X。
定義2設A={〈x,μA(x),vA(x)〉|x∈X}和B={〈x,μB(x),vB(x)〉|x∈X}為論域X上的兩個直覺模糊集,S為一個映射:IFS(x)×IFS(x)→[0,1],如果它滿足下面4個條件:
(S1) 0≤S(A,B)≤1;
(S2)S(A,B)=1當且僅當A=B;
(S3)S(A,B)=S(B,A);
(S4) 若A?B?C,有S(A,C)≤S(A,B),S(A,C)≤S(B,C)。
則稱S(A,B)為直覺模糊集A和B之間的相似度。
Ye在文獻[11]中利用向量的知識提出了如下基于余弦函數(shù)的相似度測量公式:
C1(A,B)=
(1)
通過研究發(fā)現(xiàn),在該余弦相似度測量公式中,如果μA(xj)=vA(xj)=0或μB(xj)=vB(xj)=0,則該公式就會出現(xiàn)分母為零的現(xiàn)象。在這種情況下,該公式就不能用于計算直覺模糊集A和B之間的相似度測量值。另外,如果μA(xj)=kμB(xj),vA(xj)=kvB(xj),其中k≠1,xj∈X(j=1,2,…,n),即A≠B,則用公式(1)來計算相似度測量值,其結果都等于1。在這種情況下該公式不滿足定義2中的條件(S2)。
為了彌補公式(1)的不足,通過引入隸屬度、非隸屬度和猶豫度三方面的信息,Shi和Ye在文獻[12]中提出了余弦相似度測量公式的另外一種形式。
vA(xj)vB(xj)+πA(xj)πB(xj))/
(2)
Tian在文獻[13]中提出了如下直覺模糊集之間的余切相似度測量公式:
(3)
在實際應用中,直覺模糊集中每個元素的權重往往是不相同的,因此在文獻[11 - 13]中分別提出了如下直覺模糊集之間加權的余弦相似度測量公式和余切相似度測量公式:
WC1(A,B)=
(4)
vA(xj)vB(xj)+πA(xj)πB(xj))/
(5)
(6)
設A和B為論域X={x1,x2,…,xn}上兩個直覺模糊集,則分別定義A和B之間的兩個正弦相似度測量公式SN1(A,B)和SN2(A,B)如下:
μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-
(7)
μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-
(8)
證明
(S1)與(S3)顯然成立,下面只證明(S2)和(S4)。
(S2) 設A和B是論域X={x1,x2,…,xn}上的兩個直覺模糊集,若A=B,則有μA(xj)=μB(xj),vA(xj)=vB(xj),πA(xj)=πB(xj),xj∈X,j=1,2,…,n,得|μA(xj)-μB(xj)|=0,|vA(xj)-vB(xj)|=0,|πA(xj)-πB(xj)|=0。故,SNk(A,B)=1,其中k=1,2。
反之,若SNk(A,B)=1,k=1,2,有|μA(xj)-μB(xj)|=0,|vA(xj)-vB(xj)|=0,|πA(xj)-πB(xj)|=0,xj∈X,j=1,2,…,n。所以μA(xj)=μB(xj),vA(xj)=vB(xj),πA(xj)=πB(xj),x∈X。故,A=B。
(S4) 如果A?B?C,有μA(xj)≤μB(xj)≤μC(xj),vA(xj)≥vB(xj)≥vC(xj),xj∈X,j=1,2,…,n。可得:
|μA(xj)-μB(xj)|≤|μA(xj)-μC(xj)|
(a)
|μB(xj)-μC(xj)|≤|μA(xj)-μC(xj)|
(b)
|vA(xj)-vB(xj)|≤|vA(xj)-vC(xj)|
(c)
|vB(xj)-vC(xj)|≤|vA(xj)-vC(xj)|
(d)
(1)k=1。
由πA(xj)=1-μA(xj)-vA(xj),πB(xj)=1-μB(xj)-vB(xj),πC(xj)=1-μC(xj)-vC(xj),
可得:
|πA(xj)-πB(xj)|=
|(1-μA(xj)-vA(xj))-(1-μB(xj)-vB(xj))|=
|(μB(xj)-μA(xj))+(vB(xj)-vA(xj))|≤|μB(xj)-μA(xj)|∨|vB(xj)-vA(xj)|
|πA(xj)-πC(xj)|=
|(1-μA(xj)-vA(xj))-(1-μC(xj)-vC(xj))|=
|(μC(xj)-μA(xj))+(vC(xj)-vA(xj))|≤|μC(xj)-μA(xj)|∨|vC(xj)-vA(xj)|
從而,
|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-πB(xj)|=
|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|=
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|
因此,
|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-πB(xj)|≤
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|
同理,
|μB(xj)-μC(xj)|∨|vB(xj)-vC(xj)|∨|πB(xj)-πC(xj)|≤
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|
故SN1(A,C)≤SN1(B,C)。
(2)k=2。
由條件可得:
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=
μB(xj)-μA(xj)+vA(xj)-vB(xj)+|μB(xj)-μB(xj)+(vB(xj)-vA(xj))|
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=
μC(xj)-μA(xj)+vA(xj)-vC(xj)+|(μC(xj)-μA(xj))+(vC(xj)-vA(xj))|
①當μB(xj)-μA(xj)≥vB(xj)-vA(xj)時,
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=2(μB(xj)-μA(xj))
②當μB(xj)-μA(xj)≤vB(xj)-vA(xj)時,
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=2(vA(xj)-vB(xj))
③ 當μC(xj)-μA(xj)≥vC(xj)-vA(xj)時,
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=2(μC(xj)-μA(xj))
④ 當μC(xj)-μA(xj)≤vC(xj)-vA(xj)時,
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=2(vA(xj)-vC(xj))
由式(a)及①④可得:
vC(xj)-vA(xj)≥μC(xj)-μA(xj)≥
μB(xj)-μA(xj)≥vB(xj)-vA(xj)
由(c)及②③可得:
μC(xj)-μA(xj)≥vC(xj)-vA(xj)≥
vB(xj)-vA(xj)≥μB(xj)-μA(xj)
因此,
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|≤
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|
同理,
|μB(xj)-μC(xj)|+|vB(xj)-vC(xj)|+|πA(xj)-πB(xj)|≤
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|
故SN2(A,C)≤SN2(B,C)。
□
加權正弦相似度測量公式定義如下:
μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-
(9)
μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-
(10)
當論域X中的每一個元素的權重相同時,即wj=1/n,j=1,2,…,n,公式(9)和公式(10)就轉(zhuǎn)化為公式(7)和公式(8)。上述兩個加權正弦相似度測量公式滿足定義2中的四個條件,證明過程與3.2節(jié)相同。
本節(jié)將通過幾組數(shù)值例子來對本文提出的正弦相似度測量公式與文獻[11-13]中的相似度測量公式進行比較,通過對測量結果進行分析比較來說明本文所提出的相似度測量公式的有效性和合理性。直覺模糊集A和B之間的相似度測量值如表1所示。
從表1中三角相似度測量的結果可以看出,文獻[11]中的余弦相似度測量公式C1(A,B)在第2組和第3組例子之間進行相似度測量計算中出現(xiàn)
Table 1 Values of similarity measure between IFSs A and B
分母為零(無意義)現(xiàn)象,在第1組和第5組例子之間進行相似度測量計算中出現(xiàn)不合理現(xiàn)象。文獻[13]中的公式CT1(A,B)在第1組和第6組例子之間相似度測量結果相同而出現(xiàn)無法區(qū)分現(xiàn)象。因此,上述現(xiàn)象將會給決策者在進行決策時帶來不便。公式C2(A,B)、SN1(A,B)和SN2(A,B)在表1中具有較強的區(qū)分能力,但公式C2(A,B)計算過程相對復雜,相比之下公式SN1(A,B)和SN2(A,B)在實際應用中更具有優(yōu)越性。
(1)醫(yī)療診斷。
現(xiàn)有診斷集合P={P1,P2,P3,P4}分別表示病毒性發(fā)燒、感冒、瘧疾和胃病問題。癥狀集合X={x1(發(fā)燒),x2(頭痛),x3(胃疼),x4(咳嗽)}。經(jīng)專家研究,得到如表2所示數(shù)據(jù)。
Table 2 Standard data of the four symptoms
現(xiàn)有一個病人,其癥狀的診斷結果Q為未知。設w={0.2,0.3,0.4,0.1}為癥狀集合中四個屬性的權重集?,F(xiàn)用本文提出的加權正弦相似度公式進行相應診斷,并與文獻[11-13]中提出的相似度公式的診斷結果進行對比,得到如表3所示結果。
Table 3 Diagnosed results of differentsimilarity measure methods
分析表3中的數(shù)據(jù)可知,對于加權余弦相似度公式WC1,W(P1,Q)=W(P2,Q)=0.9910>W(P4,Q)=0.9216>W(P3,Q)=0.9163,出現(xiàn)了兩個診斷結果的數(shù)值相等并且都是最大值,導致很難將診斷結果歸類到P1(病毒性發(fā)燒)還是P2(感冒)。而加權相似度公式WCT在進行病人診斷結果識別時也出現(xiàn)了同樣情況,而使用相似度公式WC2和本文提出的加權正弦相似度公式WSN1和WSN2則能夠有效地區(qū)分,并把診斷結果Q歸類到P2,即病人患的疾病是感冒。但是,相似度公式WC2計算過程相對復雜,所以本文提出的加權正弦相似度公式在實際應用中更具有優(yōu)越性。
(2)決策應用。
本節(jié)將正弦相似度測量方法用于汽車發(fā)動機設計的備選方案選擇決策例子中,通過實驗的結果來表明所提出的相似度測量公式的合理性。
在汽車發(fā)動機設計的初期,設計師提出了一組備選方案A={A1,A2,A3,A4},分別代表柴油發(fā)動機、汽油發(fā)動機、純電力電動機和混合動力發(fā)動機。設計師對以上四種設計方案都是從屬性集X={x1,x2,x3,x4}來比較,x1:制造成本,x2:能源利用效率,x3:構造合理性,x4:制造難易程度。為了評價備選方案的優(yōu)劣,專家給出了人們期望的設計方案A*,方案中的數(shù)據(jù)由專家給出。四種備選方案在屬性集X上用直覺模糊集模型分別表示如下:
A1={〈x1,0.9,0.1〉,〈x2,0.88,0.05〉,〈x3,0.9,0.1〉,〈x4,0.5,0.2〉}
A2={〈x1,0.9,0.1〉,〈x2,0.83,0.0〉,〈x3,0.65,0.1〉,〈x4,0.6,0.1〉}
A3={〈x1,0.6,0.1〉,〈x2,0.45,0.3〉,〈x3,0.6,0.1〉,〈x4,0.5,0.2〉}
A4={〈x1,0.5,0.2〉,〈x2,0.6,0.15〉,〈x3,0.55,0.2〉,〈x4,0.9,0.1〉}
A*={〈x1,0.8,0.0〉,〈x2,0.8,0.0〉,〈x3,0.8,0.0〉,〈x4,0.8,0.0〉}
設w={0.1,0.25,0.25,0.4}為四個屬性的權重集,在此用本文提出的公式(9)與公式(10)和公式(4)~公式(6)來計算備選方案和專家給出的期望設計方案之間的相似測量值,其相似度測量結果如表4所示。從相似度測量結果的排列順序可以看出A2是最佳設計方案。
目前已有許多基于直覺模糊集相似度測量公式被提出,但現(xiàn)有部分公式在處理某些特殊情況時會出現(xiàn)不合理現(xiàn)象和計算過程相對復雜問題,實際運用效果較差。本文通過考慮隸屬度、非隸屬和猶豫度三方面的信息,首次提出兩種基于正弦函數(shù)的相似度測量公式,證明了其正確性,并通過與其它相似度計算公式進行比較,表明了其優(yōu)越性。
Table 4 Values of similarity measure betweenIFSs A and A* and ranking orders
[1] Zaded L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[2] Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.
[3] Gau W L,Buehrer D J.Vague sets[J].IEEE Transations on Systems,Man, and Cybernetics,1993,23(2):610-614.
[4] Bustince H,Burillo P.Vague sets are intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1996,79(3):403-405.
[5] Ye J.Similarity measures of intuitionistic fuzzy sets based on cosine function for the decision making of mechanical design schemes[J].Journal of Intelligent & Fuzzy Systems,2015,30(1):151-158.
[6] Chu Jun-feng,Wang Ying-ming.Method of pattern recogintion based on new similarity measure of interval-valued intuitionstic fuzzy set[J].Computer Engineering and Applications,2013,49(9):140-143.(in Chinese)
[7] Szmidt E,Kacprzyk J A.Similarity measure for intuitionistic fuzzy sets and its application in supporting medical diagnostic reasoning[J].Artificial Intelligence and Soft Computing,2004,3070(1):388-393.
[8] Chen S M. Measures of similarity between vague sets[J].Fuzzy Sets and Systems,1995,74(2):217-223.
[9] Hong D H, Kim C.A note on similarity measures between vague sets and between elements [J].Information Sciences,1999,115(1-4):83-96.
[10] Li D,Cheng C.New similarity measures of intuition fuzzy ses and application to pattern recoginition[J].Pattern Recognition Letters,2002,23(1-3):221-225.
[11] Ye J.Cosine similarity measure for intuitionsitc fuzzy sets and their applications[J].Mathematical and Computer Modelling,2011,53(1-2):91-97.
[12] Shi L L,Ye J.Study on fault diagnosis of turbine using an improved cosine similarity measure for vague sets[J].Journal of Applied Sciences,2013,13(10):1781-1786.
[13] Tian M Y.A new fuzzy similarity based on cotangent function for medical diagnosis[J].Advanced Modeling and Optimization,2013,15(2):1781-186.
附中文參考文獻:
[6] 楚俊峰,王應明.基于新的區(qū)間直覺模糊集相似性測度的模式識別[J].計算機工程與應用,2013,49(9):140-143.