李麗紅,王金朋
(河北理工大學(xué) 理學(xué)院,河北 唐山063009)
粗糙集理論[1]自提出以來在諸多領(lǐng)域得到了迅速發(fā)展和成功應(yīng)用[2],但在實際應(yīng)用中發(fā)現(xiàn)[3]Pawlak粗糙集模型的一個局限性是它所處理的分類必須是完全正確或是肯定的。變精度粗糙集模型[1]的提出擴充了Pawlak粗糙集模型,其中的變精度思想是在基本粗糙集模型的基礎(chǔ)上引入了參數(shù)β(0≤β<0.5),即允許一定程度的錯誤分辨率存在,參數(shù)閾值范圍可以根據(jù)變精度粗糙集近似約簡標準確定[4]。概率型粗糙集模型[1]利用了信息系統(tǒng)中的不完全性和可能存在的統(tǒng)計信息,為研究自然界大量的隨機現(xiàn)象,處理由隨機產(chǎn)生的知識庫的數(shù)據(jù)[1],提供了一個符合實際規(guī)律的反映,由于概率粗糙集中的兩個參數(shù)α和β并無嚴格的條件約束,可能因此造成的對論域U中的一些概念刻畫失真,變精度概率粗糙集模型[5]使這一問題得到改善。貝葉斯決策理論和方法作為統(tǒng)計模式識別的基本方法[6],是在分類錯誤發(fā)生的概率最小的前提下進行分類。討論貝葉斯決策過程,建立貝葉斯的概率粗糙集模型[7]實現(xiàn)了利用概率型粗糙集分析具有最小風險的貝葉斯決策問題,但在實際的應(yīng)用中尋找合適的損失函數(shù)是極不容易的[6],因此通過損失函數(shù)得到合理的參數(shù),也是十分困難的。本文將分析貝葉斯決策過程,在提出合理的損失函數(shù)基礎(chǔ)上,討論貝葉斯決策問題和變精度概率粗糙集模型的聯(lián)系,建立貝葉斯決策的變精度概率粗糙集模型。
定義1[1]設(shè)U是有限論域,集函數(shù)P:2U-[0,1]稱為概率測度,若
(1)P(U)=1
(2)當 A∩B=Φ 有 P(A∪B)=P(A)p(B)
定義2[2]令
其中|X|表示集合X的基數(shù),稱c(X,Y)為集合X關(guān)于集合Y的相對錯誤分辨率。
定義3[1]設(shè)U是有限對象構(gòu)成的論域,R是U上的等價關(guān)系,其構(gòu)成的等價類為
U/R={X1,X2,…,Xn}
記x所在的等價類[x],令P為定義在U的子集構(gòu)成的σ代數(shù)上的概率測度,三元組AP=(U,R,P)稱為概率近似空間。U中的每個子集稱為概念,代表了一個隨機事件。
定義4[5]設(shè)U是有限論域,限定0.5<α≤1,對任意X?U,定義X關(guān)于概率近似空間AP=(U,R,P)依參數(shù)α的下近似
其中:[x]是與對象x具有相同描述的對象的全體,亦稱為x的描述。
x關(guān)于AP依參數(shù)α的概率(I)型正域,邊界和負域分別為:
變精度概率粗糙集模型,通過限定參數(shù)a(0.5<α≤1)的取值范圍,α可認為是分類正確率,變兩個參數(shù)α、β為一個參數(shù),充分地利用了近似空間中盡可能多的有用信息,比較客觀、準確地反映了被認識對象的本質(zhì)屬性,以及數(shù)據(jù)之間的相關(guān)性,從而降低了決策失誤的風險。若令:
且取β=1-α,則模型就變?yōu)槠胀ㄒ饬x下的變精度粗糙集模型。
貝葉斯決策理論和方法是統(tǒng)計模式識別的基本方法?;驹硎牵河邢嗨菩缘臉颖驹谀J娇臻g中互相接近,并形成“集團”,即“物以類聚”。在最小風險的貝葉斯決策過程中,引入風險的概念,利用事件發(fā)生的先驗概率,以求采取某種決策的風險最小。
設(shè) Ω={X1,X2,…,Xs}是具有有限個特征狀態(tài)的集合,每個集合 Xi是 U 的子集,通常稱為概念,A={r1,r2,…,rm}是由 m個可能決策行為構(gòu)成的集合,P(Xj|[x])表示一個對象在描述[x]下處于狀態(tài)Xi的概率;一般假定P(Xj|[x])是已知的,令λ(ri|Xj)表示狀態(tài)為Xj時采用決策ri的風險損失,一般是根據(jù)所研究的具體問題,分析錯誤決策造成損失的嚴重程度,與相關(guān)的專家共同商討確定。
假定一個對象的描述為[x],對于這個對象實施決策ri,則對象在給定描述[x]下采用決策ri的期望損失(條件風險)可由全概率公式得:
對于每一個[x],都對應(yīng)著一個隨機的觀測值,對于不同的描述[x],采取決策ri時,其條件風險的大小是不同的,因此究竟采取那一種決策,隨[x]而定,若將決策rj可以看為對象x函數(shù),記為r(x),則總體風險為:
在考慮錯判帶來的損失時,我們希望損失最小,如果在采取每一個決策或行動時,都使其條件風險最小,即保證每個觀測值下的條件風險最小,則總體期望風險最小。最小風險貝葉斯決策可按下列步驟進行[6]:
(1)?x∈U,利用 P(Xi|[x])及損失函數(shù)值 λ(ri|Xj),按式(1)計算出采取 ri(i=1,2,…,m),的條件風險 R(ri|[x])。
(2)對步驟(1)中得到的 m 個條件風險值 R(ri|[x])(i=1,2,…,m)進行比較,找出使條件風險最小的決策rk,即
則rk就是最小風險貝葉斯決策。
引理1[7]設(shè)U為有限對象構(gòu)成的論域,X為U的子集,則特征狀態(tài)集合Ω={X,-X}。
引理2[7]概念X將論域U分為三部分:pos(X),neg(X),bn(X)。
定理 對論域U上的概念X,若X具有最小風險的貝葉斯決策問題,則必存在一個等價的變精度概率粗糙集模型。
證明:(1)由引理 1知,論域U被分為兩部分:pos(X)和neg(X)。
(2)由引理 2知,概念 X將論域U分為三部分:pos(X),neg(X),bn(X)。對于論域中的每個對象x,其描述[x]都面臨三中可能的決策(肯定決策(Y),否定決策(N),待定決策(D))
(Y)決策 r1:x∈pos(X),即 r1:[x]→pos(X)
(N)決策 r2:x∈neg(X),即 r2:[x]→neg(X)
(D)決策 r3:x∈bn(X),即 r3:[x]→bn(X)
這時決策行為集合 A={r1,r2,r3},令 λ(ri|X)為特征集合 X采取決策ri的風險損失;λ(ri|X-X)為特征集合-X采取決策ri的風險,P(X|[x])為對象在描述[x]下處于狀態(tài)集合X的概率,P(-X|[x])為對象在描述[x]下處于狀態(tài)集合-X的概率,所以,x在描述[x]下采取決策ri的條件風險為:
其中:λi1=λ(ri|X);λi2=λ(ri|-X);i=1,…,m。
由貝葉斯決策過程可得最小風險決策規(guī)則:[1]
由全概率公式知:P(X|[x])+P(-X|[x])=1,可得P(-X|[x])=1-P(X|[x]),將其代入到?jīng)Q策規(guī)則中,并把式(3)也帶入到?jīng)Q策規(guī)則當中,例如我們帶入式(4)可以得到:
R(r1|[x])=λ11P(X|[x])+λ12P(-X|[x])
R(r2|[x])=λ21P(X|[x])+λ22P(-X|[x])
由上面的推導(dǎo)可知:對于任意的x屬于U,最終選擇哪個決策行為,只與對象x的描述[x]處于特征集合X的概率有關(guān),即與P(X|[x])的大小有關(guān)系。
在實際情況中,須選擇合適的風險損失λij(i=1,2,3;j=1,2),才能得到合理的決策規(guī)則,選擇不同的決策自然得到的風險損失是不一樣的,對特征集合X,若選擇肯定的決策r1,則認為風險不大于選擇r3,選擇r3的風險小于于選擇r2,即有:λ11≤λ31<λ21,對于特征集合-X 有 λ12>λ32≥λ22。 為減小決策失誤的風險,對于風險損失函數(shù)我們加強約束條件:
計算可得最小風險決策規(guī)則表達為:
(Y)r1:[x]→pos(X),若 p(X|[x])≥α,p(X|[x])≥γ
(N)r2:[x]→neg(X),若 p(X|[x])≤γ,p(X|[x])≤β
(D)r3:[x]→bn(X),若 β≤p(X|[x])≤α
其中:
由風險損失的約束條件知:α∈[0.5,1],又由待定決策r3知:參數(shù)滿足β≤α,以下分兩種情況討論。
(1)若 β<α,顯然有 β<γ<α 且 β=1-α,這時可能的決策變?yōu)椋?/p>
(Y)r1:[x]→pos(X),若 p(X|[x])≥α
(N)r2:[x]→neg(X),若 p(X|[x])≤1-α
(D)r3:[x]→bn(X),若 1-α≤p(X|[x])≤α
若P(X|[x])=α?xí)r采取肯定決策r1,P(X|[x])=1-α采取否定決策r2,則上述的決策規(guī)則變?yōu)椋?/p>
(Y)r1:[x]→pos(X),若 p(X|[x])≥α
(N)r2:[x]→neg(X),若 p(X|[x])≤1-α
(D)r3:[x]→bn(X),若 1-α<p(X|[x])<α
于是論域U中的概念X的正域、負域和邊界分別為:
pos(X)=∪{[x]|p(X|[x])≥α}
neg(X)=∪{[x]|p(X|[x])≤1-α}
bn(X)=∪{[x]|1-α<p(X|[x])<α}
從而概念X的上近似和下近似是:
為一變精度概率粗糙集模型。
(2)若 β=α,顯然有 β=α=γ=0.5,此時相應(yīng)的貝葉斯決策變?yōu)椋?/p>
(Y)r1:[x]→pos(X),若 p(X|[x])≥0.5
(N)r2:[x]→neg(X),若 p(X|[x])≤0.5
(D)r3:[x]→bn(X),若p(X|[x])=0.5
若p(X|[x])=0.5時取決策r3則上述決策變?yōu)椋?/p>
(Y1)r1:[x]→pos(X),若 p(X|[x])>0.5
(N1)r2:[x]→neg(X),若 p(X|[x])<0.5
(D1)r3:[x]→bn(X),若 p(X|[x])=0.5
概念X的正域,負域,邊界為:
pos(X)=∪{[x]|p(X|[x])>0.5}
neg(X)=∪{[x]|p(X|[x])<0.5}
bn(X)=∪{[x]|p(X|[x])=0.5}
X下近似和上近似為:
此時的邊界稱為概率粗糙集模型(II)的絕對邊界為
綜上可知,對論域U上的概念X,若X具有最小風險的貝葉斯決策問題,則必存在一個等價的變精度概率粗糙集模型。
設(shè)U={x1,x2,…,x6}是去醫(yī)院做診斷的一組病人,特征狀態(tài)集合為 Ω:{有某種疾病, 無某種疾病},X:{有病的人},-X:{無病的人},決策行為 A={r1,r2,r3},其中 r1={進行治療},r2={不進行治療},r3={進一步觀察}。風險損失為 :
λ11=0.01,λ31=0.05,λ21=0.15
λ22=0.01,λ32=0.05,λ12=0.15
其中與對象xi有相同屬性描述的記為[xi]。
p(X|[x1])=0.23,p(X|[x2])=0.35
p(X|[x3])=0.6,p(X|[x4])=0.74
p(X|[x5])=0.88,p(X|[x6])=0.9
求最小風險的貝葉斯決策。
解:依定理可得:
β=1-0.71=0.29
所以有:
pos(X)={x∈U|p(X|[xi])≥0.71}={x4,x5,x6}
neg(X)={x∈U|p(X|[xi])≤0.29}={x1}
bn(X)={x∈U|0.29≤p(X|[xi])<0.71}={x2,x3}
因此, 最小風險的貝葉斯決策是:x4,x5,x6需要治療;x1不需要治療;x2,x3需要進一步觀察。
本文針貝葉斯決策過程中的風險損失難以確定的情況,在沒有改變貝葉斯決策實質(zhì)的情況下,加強了對風險損失條件的限定,減小了決策失誤的風險;另外,討論了分析貝葉斯決策過程和變精度概率粗糙集模型的聯(lián)系,證明了最小風險貝葉斯決策問題可以用一個等價的變精度概率粗糙集模型處理。
[1]張文修,吳偉杰,梁吉業(yè)等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.
[2]Pawlak Idzislaw.Rough Set Theory and Its Applications to Data Analysis[J].Cyberaetics and Systems,1998,29(7).
[3]Iarko Wojciech.Variable Precision Rough Set Model[J].J of Computer and System Sciences,1993,46(1).
[4]趙越嶺,王建輝.基于變精度粗糙集閾值的選取[J].控制與決策,2007.22(1).
[5]孫秉珍,鞏增泰.變精度概率粗糙集模型[J].西北師范大學(xué)學(xué)報,2005,41(4).
[6]舒寧,馬洪超等.模式識別的理論與方法[M].武漢:武漢大學(xué)出版社,2004.
[7]張淮中.Bayes決策的概率型粗糙集模型[J].小型微型計算機系統(tǒng),2004,21(3).