袁澤華,潘小東
(西南交通大學(xué) 數(shù)學(xué)學(xué)院,四川 成都610031)
一種基于新的直覺(jué)模糊相似度的聚類方法
袁澤華,潘小東
(西南交通大學(xué) 數(shù)學(xué)學(xué)院,四川 成都610031)
針對(duì)現(xiàn)有直覺(jué)模糊聚類方法中大多數(shù)未考慮指標(biāo)權(quán)重,且計(jì)算結(jié)果為實(shí)數(shù)的問(wèn)題,提出了一種基于新直覺(jué)模糊相似度的聚類方法。運(yùn)用直覺(jué)模糊熵得到指標(biāo)權(quán)重,構(gòu)造了一種考慮指標(biāo)權(quán)重的直覺(jué)模糊相似度公式,得到直覺(jué)模糊相似矩陣,構(gòu)造了滿意度閾值。決策者根據(jù)自身滿意度偏好選擇合適滿意度閾值,將直覺(jué)模糊相似矩陣轉(zhuǎn)化為實(shí)數(shù)矩陣,然后利用平方自合成方法得到模糊等價(jià)矩陣,選擇適當(dāng)?shù)闹眯胖颠M(jìn)行聚類,最后通過(guò)實(shí)例驗(yàn)證所提方法的有效性和可行性。
直覺(jué)模糊相似度;聚類方法;直覺(jué)模糊熵;滿意度閾值
1965年美國(guó)自動(dòng)控制專家扎德教授首次提出模糊集理論[1]。隨著該理論的發(fā)展和深入,1986年,保加利亞學(xué)者Atanassov提出了直覺(jué)模糊集的概念[2]。直覺(jué)模糊集是對(duì)傳統(tǒng)模糊集的一種擴(kuò)充和發(fā)展,增加了新的屬性參數(shù):非隸屬度函數(shù)。相對(duì)于傳統(tǒng)的模糊集,直覺(jué)模糊集在處理不確定性信息時(shí)更加的靈活和全面。直覺(jué)模糊集理論在模式識(shí)別、多屬性決策和醫(yī)療圖像處理等領(lǐng)域得到了廣泛的應(yīng)用。
目前許多學(xué)者對(duì)基于模糊集提出了很多的聚類方法,比如FCM聚類算法、模糊傳遞閉包法、編網(wǎng)法等。然而,基于直覺(jué)模糊集的聚類方法研究尚處于起步階段。文獻(xiàn)[3]將模糊C-均值聚類算法推廣為直覺(jué)模糊C-均值聚類,并提出了基于直覺(jué)模糊集的聚類方法。該方法雖然考慮了指標(biāo)權(quán)重問(wèn)題,但其聚類結(jié)果為實(shí)數(shù)。另外,直覺(jué)模糊集本身就反映了一定的猶豫程度,其相似度也應(yīng)該為直覺(jué)模糊數(shù)的形式;文獻(xiàn)[4]針對(duì)聚類問(wèn)題中樣品屬性值不能直接給出的情況,提出了一種基于集值統(tǒng)計(jì)的直覺(jué)模糊聚類方法。但該方法直接利用樣本集的隸屬度進(jìn)行聚類,而忽視了非隸屬度和猶豫度;文獻(xiàn)[5]針對(duì)已有直覺(jué)模糊集聚類方法的局限性,提出了一種基于加權(quán)直覺(jué)模糊集合的聚類模型。然而現(xiàn)有的直覺(jué)模糊聚類方法大多數(shù)都是利用直覺(jué)模糊集的相似度最終得到一個(gè)實(shí)數(shù)相似度。直覺(jué)模糊集本身反映了一定的猶豫程度,其相似度也應(yīng)該表現(xiàn)出一定的猶豫程度。對(duì)此,文獻(xiàn)[6]提出了直覺(jué)模糊相似度的概念,其值為直覺(jué)模糊數(shù),并構(gòu)建了直覺(jué)模糊相似矩陣和直覺(jué)模糊等價(jià)矩陣及其λ-截矩陣,給出了一種直覺(jué)模糊等價(jià)矩陣的聚類方法。但其計(jì)算量較大且給出的直覺(jué)模糊相似度公式不滿足定義中的第4條性質(zhì)。文獻(xiàn)[7]提出了基于直覺(jué)模糊相似矩陣聚類方法,并直接利用直覺(jué)模糊相似矩陣中樣本的隸屬度對(duì)方案直接進(jìn)行聚類。該方法雖然計(jì)算量減小,但未考慮指標(biāo)權(quán)重問(wèn)題,得到模糊相似矩陣后僅僅采用隸屬度作參考進(jìn)行聚類,造成信息的丟失。
針對(duì)現(xiàn)有方法存在的問(wèn)題,本文定義了任意兩個(gè)方案之間隸屬度距離:非隸屬度距離和猶豫度距離。以此為基礎(chǔ)構(gòu)建了一種考慮屬性權(quán)重的相似度,得到直覺(jué)模糊直覺(jué)模糊相似矩陣,設(shè)計(jì)滿意度閾值,將直覺(jué)模糊相似矩陣轉(zhuǎn)化為實(shí)數(shù)矩陣,利用平方自合成方法將實(shí)數(shù)矩陣轉(zhuǎn)化為模糊等價(jià)矩陣并進(jìn)行聚類,解決了現(xiàn)有直覺(jué)模糊聚類方法沒(méi)有考慮指標(biāo)權(quán)重和計(jì)算量較大的問(wèn)題。
定義1.1[1](模糊集合) 設(shè)X是一個(gè)給定論域,則X上一個(gè)模糊集合A={〈x,uA(x)〉|x∈X}。其中uA(x)表示x屬于X的隸屬度,uA:X→[0,1]。
定義1.2[2](直覺(jué)模糊集) 設(shè)X是一個(gè)給定論域,X上的一個(gè)直覺(jué)模糊集A={〈x,uA(x),vA(x)〉|x∈X}。其中uA(x)和vA(x)分別表示為X中的元素x屬于X的隸屬度和非隸屬度,uA:X→[0,1]vA:X→[0,1],且滿足條件0≤uA(x)+vA(x)≤1,x∈X,稱πA(x)=1-uA(x)-vA(x)為X中元素x屬于A的猶豫度。隸屬度uA(x)表示對(duì)象x屬于直覺(jué)模糊集A的程度、非隸屬度vA(x)表示對(duì)象x不屬于直覺(jué)模糊集A以及猶豫度πA(x)表示對(duì)象x對(duì)直覺(jué)模糊集A中立的程度。例如,假設(shè)直覺(jué)模糊集A={〈x,0.4,0.5〉|x∈X},即其隸屬度uA(x)=0.4,非隸屬度vA(X)=0.5,猶豫度πA(x)=0.1,表示對(duì)象x屬于A的程度為0.4,不屬于A的程度為0.5,中立的程度為0.1。X中的元素x屬于A的隸屬度和非隸屬度組成的有序?qū)Α磚A(x),vA(x)〉稱為直覺(jué)模糊數(shù)。直覺(jué)模糊集A可以看作是X上的全體直覺(jué)模糊數(shù)組成的集合,記為IFS(X)。
定義1.3[8](模糊度) 設(shè)A={〈x,uA(x),vA(x)〉|x∈X}為直覺(jué)模糊集,則稱:fA(x)=1-|uA(x)-vA(x)|為x在A中的模糊度。
設(shè)A={〈x,uA(x),vA(x)〉|x∈X}和B={〈x,uB(x),vB(x)〉|x∈X}為直覺(jué)模糊集,則有:
(1)A?B當(dāng)且僅當(dāng)任意x∈X,有uA(x)≤uB(x)且vA(x)≥vB(x);
(2)A=B當(dāng)且僅當(dāng)任意x∈X,有uA(x)=uB(x)且vA(x)=vB(x)。
設(shè)C=(cij)m×n是一個(gè)m×n矩陣,如果任意cij(i=1,2,...,m,j=1,2,...,n)為直覺(jué)模糊數(shù),則稱C為直覺(jué)模糊矩陣。在模糊集理論中,相似矩陣是一種常見(jiàn)的具有自反性和對(duì)稱性的矩陣。文獻(xiàn)[6]將直覺(jué)模糊集理論與相似矩陣結(jié)合,提出了直覺(jué)模糊相似度和直覺(jué)模糊相似矩陣的概念。
定義1.4[6]設(shè)σ:Ω2→Θ,Ω為X上所有自覺(jué)模糊集的集合,且設(shè)Ai∈Ω(i=1,2,3),若σ(A1,A2)滿足以下條件:(1)σ(A1,A2)是直覺(jué)模糊數(shù);(2)σ(A1,A2)=〈1,0〉當(dāng)且僅當(dāng)A1=A2;(3)σ(A1,A2)=σ(A2,A1);(4)如果A1?A2?A3,則σ(A1,A3)?σ(A1,A2),且σ(A1,A3)?σ(A2,A3)。則稱σ(A1,A2)為A1和A2的直覺(jué)模糊相似度。
定義1.5[4]若直覺(jué)模糊矩陣C=(cij)m×n滿足以下兩個(gè)條件:(1)自反性:cii=〈1,0〉,i=1,2,...,m;(2)對(duì)稱性:cij=cji。則稱C為直覺(jué)模糊相似矩陣。
假設(shè)一個(gè)多屬性決策問(wèn)題有m個(gè)可行方案A1,A2,...,Am,n個(gè)評(píng)價(jià)指標(biāo)I1,I2,...,In,可行方案Ai在評(píng)價(jià)指標(biāo)Ij下的屬性值為直覺(jué)模糊數(shù)dij=〈uij,vij〉,可得到直覺(jué)模糊決策矩陣D=(dij)m×n。
下面通過(guò)構(gòu)造一種新的直覺(jué)模糊相似度進(jìn)而得到直覺(jué)模糊相似矩陣。
定理1 設(shè)Ai和Ak為兩個(gè)直覺(jué)模糊集,則
σ(Ai,Ak)=〈αij,βij〉=〈1-d1(Ai,Ak)-d3(Ai,Ak),d2(Ai,Ak)〉
(1)
為Ai和Ak的直覺(jué)模糊相似度。
證明: 需要證明公式(1)滿足定義4的4個(gè)條件。
(1)先證明σ(Ai,Ak)為直覺(jué)模糊數(shù)。d1(Ai,Ak)≥0,d3(Ai,Ak)≥0;αij=1-d1(Ai,Ak)-d3(Ai-Ak)≤1。
又因?yàn)?0≤d1(Ai,Ak)+d2(Ai,Ak)+d3(Ai,Ak)≤1,所以αij=1-d1(Ai,Ak)-d3(Ai,Ak)≥d2(Ai,Ak)≥0。
顯然0≤βij=d2(Ai,Ak)≤1,證明了σ(Ai,Ak)為直覺(jué)模糊數(shù)。
(2)當(dāng)Ai和Ak相等時(shí),σ(Ai,Ak)=〈1,0〉成立。同理,當(dāng)σ(Ai,Ak)=〈1,0〉,即αij=1,βij=0,根據(jù)所給出的公式可得出Ai和Ak是相等的。
(4)如果A1?A2?A3,即u1j≤u2j≤u3j,v1j≥v2j≥v3j,j=1,2,...,n則
;
;且 |u1j-u2j|≤|u1j-u3j|,|v1j-v2j|≤|v1j-v3j|,由文獻(xiàn)[4]得到|π1j-π2j|≤|π1j-π3j|。所以
即σ(A1,A3)≤σ(A1,A2),同理也可得到σ(A1,A3)≤σ(A2,A3)。
通過(guò)上面提出的直覺(jué)模糊相似度公式可將直覺(jué)模糊決策矩陣轉(zhuǎn)化為直覺(jué)模糊相似矩陣D=(dij)m×n,其中cij=σ(Ai,Ak)=〈αij,βij〉為直覺(jué)模糊數(shù)。
令fij=αij+η(1-αij-βij),η∈[0,1]為滿意度閾值,則可將直覺(jué)模糊相似矩陣轉(zhuǎn)化為實(shí)數(shù)矩陣F=(fij)m×n,然后用平方自合成方法將實(shí)數(shù)矩陣轉(zhuǎn)化為模糊等價(jià)矩陣,再選擇合適的置信度λ∈[0,1]對(duì)實(shí)數(shù)矩陣進(jìn)行聚類。
假如各個(gè)指標(biāo)權(quán)重已知的話,直接帶入上述公式進(jìn)行計(jì)算,然而在實(shí)際中很難直接得到各指標(biāo)的權(quán)重,下面結(jié)合直覺(jué)模糊熵來(lái)計(jì)算各個(gè)指標(biāo)的權(quán)重。文獻(xiàn)[9]提出的直覺(jué)模糊熵的公理化定義。
定義2.1[9]?A,B∈IFS(X),隸屬度函數(shù)分別為uA(x)和uB(x),非隸屬度函數(shù)分別為vA(x)和vB(x),猶豫度分別為πA(x)和πB(x)。稱映射E:IFS(X)→R+為IFS(X)上的熵,如果映射E滿足下列條件:
(1)E(A)=0?A∈P(X)(P(X)為普通集合的全體);
(2)E(A)=1??x∈X,uA(x)=vA(x)=0;
(3)?x∈X,若πA(x)=πB(x)且fA(x)≤fB(x),則E(A)≤E(B)。若fA(x)=fB(x)且πA(x)≤πB(x),則E(A)≤E(B);
(4)E(A)=E(AC)。
設(shè)論域X={x1,x2,...,xn},A={〈xi,uA(xi),vA(xi)〉|xi∈X}是X上的直覺(jué)模糊集,由文獻(xiàn)[10]可得到A的模糊熵為:
(2)
特別地,對(duì)于直覺(jué)模糊數(shù)a=〈uA(x),vA(x)〉,其模糊熵為:
(3)
(4)
綜上得到新的直覺(jué)模糊聚類方法如下:
步驟1:查看指標(biāo)的權(quán)重是否給出。若已經(jīng)給出,則轉(zhuǎn)步驟3;若未給出,則轉(zhuǎn)步驟2;
步驟2:通過(guò)式(4)計(jì)算指標(biāo)權(quán)重w=(w1,w2,...,wn);
步驟3:運(yùn)用式(1)得到直覺(jué)模糊相似矩陣C=(cij)m×n;選擇合適的合適的滿意度閾值,將直覺(jué)模糊相似矩陣C=(cij)m×n轉(zhuǎn)化為實(shí)數(shù)矩陣F=(fij)m×n,利用平方自合成方法求得模糊等價(jià)矩陣。
步驟4:選擇合適的置信度λ∈[0,1]對(duì)模糊等價(jià)矩陣進(jìn)行聚類。
本文提出的基于直覺(jué)模糊相似度的聚類方法與現(xiàn)有的方法對(duì)比具有以下兩個(gè)優(yōu)點(diǎn):(1)本文提出的直覺(jué)模糊相似度公式的結(jié)果仍然是直覺(jué)模糊數(shù)形式且考慮了指標(biāo)權(quán)重的問(wèn)題,更加的符合實(shí)際情況;(2)本文提出的聚類方法設(shè)計(jì)了滿意度閾值,決策者可根據(jù)自身偏好選擇合適的滿意度閾值,充分考慮隸屬度、非隸屬度以及猶豫度 3方面的信息。
為了方便對(duì)比,本文引用文獻(xiàn)[9]的實(shí)例(由于直覺(jué)模糊數(shù)的定義不同,我們?cè)跀?shù)據(jù)形式上進(jìn)行了修改,但不影響后面的計(jì)算和聚類)。某汽車市場(chǎng)欲對(duì)5種不同的車Ai(i=1,2,3,4,5)進(jìn)行分類,每輛車有6個(gè)可供評(píng)價(jià)的屬性指標(biāo):燃料消耗量(G1)、摩擦度(G2)、價(jià)格(G3)、舒適度(G4)、車身設(shè)計(jì)(G5)、安全性(G6)。每輛車在各評(píng)價(jià)屬性下的特征信息用直覺(jué)模糊數(shù)表示,如表1所示。
表1 每輛車在各評(píng)價(jià)屬性下的特征信息
由于指標(biāo)的權(quán)重未知,需計(jì)算各指標(biāo)的權(quán)重,根據(jù)式(3)和式(4)可得到w1=0.13,w2=0.17,w3=0.17,w4=0.23,w5=0.16,w6=0.14,運(yùn)用式(1)得到直覺(jué)模糊相似矩陣:
選擇滿意度閾值η=0.5,即滿意度中性,得到實(shí)數(shù)矩陣:
利用自合成方法得到等價(jià)矩陣
選取合適的置信水平值λ∈[0,1],按λ截矩陣t(R)λ進(jìn)行動(dòng)態(tài)聚類
當(dāng)0.81<λ≤1,車組Ai(i=1,2,3,4,5)分為5類,即{A1}、{A2}、{A3}、{A4}、{A5};
當(dāng)0.80<λ≤0.81,車組Ai(i=1,2,3,4,5)分為4類,即{A1}、{A2,A3}、{A4}、{A5};
當(dāng)0.79<λ≤0.80,車組Ai(i=1,2,3,4,5)分為3類,即{A1,A2,A3}、{A4}、{A5};
當(dāng)0.74<λ≤0.79,車組Ai(i=1,2,3,4,5)分為2類,即{A1,A2,A3,A4}、{A5};
當(dāng)0<λ≤0.74,車主Ai(i=1,2,3,4,5)分為1類,即{A1,A2,A3,A4,A5}。
文獻(xiàn)[8]提出的聚類方法如下:當(dāng)0.78<λ≤1,車組分為5類;當(dāng)0.71<λ≤0.78,車組分為3類,為{A1,A2,A3},{A4},{A5};當(dāng)0<λ≤0.71,車組分為1類;沒(méi)有考慮指標(biāo)的權(quán)重,默認(rèn)為指標(biāo)的權(quán)重是相同的;利用用戶對(duì)汽車指標(biāo)指的隸屬度進(jìn)行聚類而忽視非隸屬度和猶豫度,造成用戶對(duì)汽車評(píng)價(jià)信息的丟失。從上述結(jié)果可以看出,本文提出的新的直覺(jué)模糊相似度是有效的。提出的新的聚類方法分類更加詳細(xì)??梢愿鶕?jù)取值不同,分為1到5類。
本文提出的聚類方法分別考慮了指標(biāo)權(quán)重已知和未知兩種情況,對(duì)于未知的情況運(yùn)用直覺(jué)模糊熵方法得到權(quán)重;在得到直覺(jué)模糊相似矩陣后,決策者根據(jù)自己滿意度偏好選擇合適的滿意度閾值η,并將直覺(jué)模糊相似矩陣轉(zhuǎn)化為實(shí)數(shù)矩陣F,觀察實(shí)數(shù)矩陣是否為等價(jià)矩陣,如果不是,則利用平方自合成方法求出實(shí)數(shù)矩陣的傳遞閉包t(R),選擇合適的置信值λ進(jìn)行聚類。從實(shí)例看出本方法的有效性和可行性。
[1] Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[2] Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.
[3] 賀正洪,雷英杰.直覺(jué)模糊C-均值聚類算法研究[J].控制與決策,2011,26(6):847-850.
[4] 陳曉明,姚澤清.基于集值統(tǒng)計(jì)的直覺(jué)模糊聚類[J].模糊系統(tǒng)與數(shù)學(xué),2011,25(3):100-108.
[5] 呂燕,張仕斌.基于加權(quán)直覺(jué)模糊集合的聚類模型[J].計(jì)算機(jī)應(yīng)用,2012,32(4):1070-1073.
[6] 張洪美,徐澤水,陳琦.直覺(jué)模糊集的聚類方法研究[J].控制與決策,2007,22(8):882-888.
[7] Wang Z,Xu Z S,liu S S.A netting clustering analysis method under intuitionistic fuzzy environment[J].Applied Soft Computing,2011,11(8):5558-5564.
[8] 呂印超,郭嗣琮.直覺(jué)模糊集的熵及其一般形式[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(28):52-55.
[9] 吳濤,白禮虎,劉二寶.直覺(jué)模糊集新的熵公式及應(yīng)用[J].計(jì)算機(jī)工與應(yīng)用,2013,49(23):48-51.
[10] 沈小雪,郭嗣琮.新的直覺(jué)模糊熵公式及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(23):28-31.
Clustering Method Based on New Intuitionistic Fuzzy Similarity Degree
YUAN Zhehua, PAN Xiaodong
(Xinan Jiaotong Univesity, Chengdu 610031, China)
Aiming at the problem, which most of the existing intuitionistic fuzzy clustering methods do not take the weight of the index into account and the calculation result is real number, a clustering method based on the new intuitionistic fuzzy similarity degree is proposed. By using the intuitionistic fuzzy entropy, the index weight is obtained, and an intuitionistic fuzzy similarity degree formula for attribute weight is constructed as well as an approach is developed to construct an intuitionistic fuzzy similarity matrix. A satisfaction threshold is designed and the decision maker selects the appropriate satisfaction threshold according to their own preference, and transforms the intuitionistic fuzzy similarity matrix into real matrix, then, the fuzzy equivalence matrix is obtained by using the square self synthesis method, selects the appropriate confidence value to cluster. Finally, an example shows the validity and feasibility of this method.
intuitionistic fuzzy similarity degree; cluster method; intuitionistic fuzzy entropy; satisfaction threshold
10.3969/j.issn.1674-5403.2017.04.019
TP18
A
1674-5403(2017)04-0085-05
2017-07-20
袁澤華(1993-),男,江西九江人,在讀碩士研究生,主要從事模糊決策和數(shù)據(jù)挖掘的研究.