董 仕,馬懷祥
(石家莊鐵道大學(xué) 機(jī)械工程學(xué)院,河北 石家莊 050043)
D-S證據(jù)理論是一種證據(jù)推理的數(shù)值推理方法,該理論是由Dempster首先提出,并由其學(xué)生Shafer推廣并形成證據(jù)理論。D-S證據(jù)理論算法簡(jiǎn)單,融合精度高,能更有效地處理不完全、不精確信息。雖然其在不確定性推理、信息融合、故障診斷等領(lǐng)域有著廣泛的應(yīng)用,但是D-S證據(jù)理論存在的一些問(wèn)題限制其進(jìn)一步推廣,如在合成高度沖突證據(jù)時(shí)方法失效。針對(duì)如何合成高度沖突證據(jù)這一問(wèn)題,國(guó)內(nèi)外學(xué)者進(jìn)行了深入的研究,提出的解決方法主要分為2類,一類是修正D-S組合規(guī)則[1-2],一類是對(duì)證據(jù)源數(shù)據(jù)預(yù)處理[3-4]。在2類方法中,如何有效地度量證據(jù)體之間的沖突程度,是研究者需要考慮的至關(guān)重要的問(wèn)題。
典型的度量證據(jù)間沖突程度的方法有沖突系數(shù)法、Jousselme證據(jù)距離[5]、余弦相似度[6]等。Jousselme首先將Jaccard系數(shù)應(yīng)用到證據(jù)之間距離的計(jì)算之中,使得含多元素焦元的證據(jù)之間的距離度量更加明確。利用Jaccard系數(shù)衡量多元素焦元證據(jù)之間相似性的方法在文獻(xiàn)[3]、文獻(xiàn)[7]、文獻(xiàn)[8]中都有所應(yīng)用。一些學(xué)者根據(jù)實(shí)際問(wèn)題的需要,通過(guò)改變Jaccard系數(shù)的計(jì)算方法,構(gòu)建出了不同的證據(jù)間相似性度量方法。文獻(xiàn)[9]依據(jù)焦元之間的包含關(guān)系,構(gòu)造了新的Jaccard系數(shù)計(jì)算方法,獲得了一種非對(duì)稱的證據(jù)間相似度模型。文獻(xiàn)[10]通過(guò)將Jaccard系數(shù)矩陣分塊,合理地解決了傳感器節(jié)點(diǎn)證據(jù)沖突的問(wèn)題。
文章從證據(jù)間相似性度量的角度出發(fā),針對(duì)在證據(jù)合成時(shí)多元素焦元與單元素焦元間存在的結(jié)果指向不確定性的差異,提出了一種改進(jìn)的Jaccard系數(shù)計(jì)算方法,降低了多元素焦元在證據(jù)相似性度量時(shí)所占比重,并在此方法的基礎(chǔ)上建立了新的證據(jù)合成方法。
Dempster組合規(guī)則可以將來(lái)自同一識(shí)別框架下不同信息源的證據(jù)組合起來(lái)[11]。假設(shè)識(shí)別框架為Θ={θ1,θ2,…,θj,…,θN},其中,θj為識(shí)別框架中的元素,N為元素的個(gè)數(shù)。識(shí)別框架Θ的冪集中包含2N個(gè)子集,子集的數(shù)量即為該識(shí)別框架中能夠產(chǎn)生的命題數(shù)量。m1、m2是來(lái)自于同一識(shí)別框架的2組獨(dú)立的證據(jù)體,Ai、Bj分別為證據(jù)體m1、m2的焦元,其中,i,j=1,2,…,N。利用Dempster組合規(guī)則進(jìn)行兩證據(jù)合成的結(jié)果如下
(1)
式中,m(A)為A的基本概率賦值(basic probability assignment,BPA),m(A)的值反映了對(duì)命題A的信任程度。
(2)
式中,k為沖突系數(shù),是度量?jī)勺C據(jù)之間沖突大小的最初方法。
證據(jù)m1、m2為同一識(shí)別框架Θ={θ1,θ2,…,θj,…,θN}中相互獨(dú)立的2組證據(jù)體,其Jousselme證據(jù)距離[5]定義為
(3)
(4)
多元素焦元是證據(jù)中模糊性和不確定性的主要來(lái)源,在度量證據(jù)間相似性時(shí)會(huì)弱化確定性更高的單元素焦元之間的差異。相對(duì)于多元素焦元,單元素焦元具有更高的確定性,其對(duì)證據(jù)合成的最終結(jié)果影響也最大。本文從單元素焦元在度量證據(jù)間相似度時(shí)更為重要這一觀點(diǎn)出發(fā),在余弦相似度模型的基礎(chǔ)上進(jìn)行改進(jìn),通過(guò)將Jaccard系數(shù)矩陣分塊歸一化,弱化多元素焦元對(duì)相似性度量的影響,同時(shí)單元素焦元的影響度隨之?dāng)U大。將Jaccard矩陣分塊歸一化,既可以保留單元素焦元與多元素焦元之間的集合相似關(guān)系,又可以避免復(fù)雜度越高的焦元對(duì)相似性度量的影響度越高的現(xiàn)象。
現(xiàn)有識(shí)別框架Θ={θ1,θ2,…,θj,…,θN},首先按照命題中包含識(shí)別框架元素的個(gè)數(shù),將原Jaccard系數(shù)矩陣劃分為(N-1)2+2個(gè)區(qū)域,其中將命題中包含元素最多的子集{θ1,θ2,…,θN}與空集?劃分到一個(gè)區(qū)域。按照區(qū)域的劃分進(jìn)行子區(qū)域內(nèi)元素的歸一化處理,以達(dá)到降低復(fù)雜度高的子集在計(jì)算相似度時(shí)所占比重的目的。Jaccard系數(shù)矩陣的具體劃分方式如圖1所示。
圖1 Jaccard系數(shù)矩陣區(qū)域劃分
當(dāng)i≤j時(shí)
(5)
當(dāng)i>j時(shí)
(6)
(7)
利用式(5)~式(7)中得到的新型分塊歸一化Jaccard系數(shù),得到改進(jìn)的相似性度量公式為
(8)
該模型是余弦相似度模型的改進(jìn),其中
(9)
‖mi‖2=〈mi,mi〉
(10)
容易證明,利用分塊歸一化Jaccard系數(shù)改進(jìn)的相似性度量模型滿足以下性質(zhì):
(1) 0≤c′(m1,m2)≤1;
(2)c′(m1,m2)=c′(m2,m1);
(3)c′(m1,m2)=1?m1=m2;
(4)c′(m1,m2)=0?(∪Ai)∩(∪Bj)=?。
為了驗(yàn)證改進(jìn)的相似性度量方法的有效性,參考文獻(xiàn)[6]和文獻(xiàn)[12]中的例子,將本文方法與Jousslme et al[5]所提方法、Wen et al[6]所提度量相似度的方法對(duì)比分析。文獻(xiàn)[5]中Jousslme距離dBPA是度量2個(gè)證據(jù)體之間距離的方法,需要將Jousslme距離轉(zhuǎn)化為相似性測(cè)度1-dBPA,以便于分析對(duì)比。
例1 假設(shè)識(shí)別框架為Θ={
θ1,θ2,θ3},在識(shí)別框架中共有23-1=7個(gè)非空子集,使m1{θ3}=1且一直保持不變,而使m2不斷變化,m2的變化過(guò)程如下。在第一個(gè)事件發(fā)生時(shí),m2中7個(gè)焦元的值相等且都為1/7;由第一個(gè)事件變?yōu)榈诙€(gè)事件時(shí),將m2{
圖2 3種相似性度量方法值的變化情況
對(duì)于Dempster組合規(guī)則中的沖突系數(shù)k,由于兩證據(jù)之間高度沖突,因而其計(jì)算方法在本例中完全失效。從趨勢(shì)上看,3種相似性度量方法值的變化趨勢(shì)大致相同,說(shuō)明3種度量方法均有一定的合理性。當(dāng)事件20發(fā)生時(shí),根據(jù)Wen法測(cè)得的兩證據(jù)之間的相似度為零,這是因其在計(jì)算相似性時(shí)將多元素焦元視為獨(dú)立的個(gè)體,忽視了兩證據(jù)之間客觀存在著一定的相似性。Jousselme法與本文法在例1事件的變化過(guò)程中,證據(jù)間相似度的值都呈下降趨勢(shì)且不為零。本文方法相較于Jousselme法,在事件1發(fā)生時(shí)賦予了兩證據(jù)之間更高的相似性;隨著事件的不斷變化,證據(jù)m2中的多元素焦元BPA值的占比逐漸增大,單元素焦元對(duì)應(yīng)的比重逐漸減少,應(yīng)用本文方法獲得的兩證據(jù)體之間相似度值相較于Jousselme法下降速度更快,證據(jù)之間的相似性度量更加明確。
結(jié)合文獻(xiàn)[3]中所用加權(quán)平均的方法,利用改進(jìn)的相似度計(jì)算公式,對(duì)證據(jù)源數(shù)據(jù)預(yù)處理,步驟如下。
步驟1 由式(8)~式(10)分別計(jì)算n條證據(jù)之間的相似度,得到相似度矩陣CM
(11)
式中,cij′為證據(jù)mi和mj之間相似度的大小,其中,i、j=1,2,…,n。
步驟2 計(jì)算各條證據(jù)的重要度
(12)
步驟3 計(jì)算每條證據(jù)的權(quán)重
(13)
式中,crd(mi)為每條證據(jù)的權(quán)重ωi。
步驟4 依據(jù)式(13)所得的證據(jù)權(quán)重對(duì)證據(jù)源加權(quán)平均,得到修正后的數(shù)據(jù)為
(14)
最后,利用Dempster組合規(guī)則合成n-1次,得到合成結(jié)果。
通過(guò)以下仿真算例,將本文方法與Dempster組合規(guī)則、Murphy[13]法以及文獻(xiàn)[3]中所提方法對(duì)比,驗(yàn)證本文方法的有效性。
例2 假設(shè)識(shí)別框架為Θ={
θ1,θ2,θ3},5個(gè)相互獨(dú)立的證據(jù)體的BPA為:
m1(θ1)=0.5,m1(θ2)=0.2,m1(θ3)=0.3;
m2(θ1)=0,m2(θ2)=0.9,m2(θ3)=0.1;
m3(θ1)=0.55,m3(θ2)=0.1,m3(θ1θ3)=0.35;
m4(θ1)=0.55,m4(θ2)=0.1,m4(θ1θ3)=0.35;
m5(θ1)=0.55,m5(θ2)=0.1,m5(θ1θ2θ3)=0.35。
表1中分別列舉出了幾種方法的合成結(jié)果。通過(guò)對(duì)表中的數(shù)據(jù)分析得知,證據(jù)體m1和m2為高度沖突數(shù)據(jù),采用Dempster組合規(guī)則合成的結(jié)果中m(A)=0,并且當(dāng)證據(jù)量進(jìn)一步增加時(shí),m(A)的值仍然為零。這是由于證據(jù)m2對(duì)命題A的支持度為零,出現(xiàn)了一票否決的現(xiàn)象,Dempster組合規(guī)則失效。文獻(xiàn)[3]中所提方法與本文方法均是在Murphy法基礎(chǔ)上的改進(jìn),因此在兩證據(jù)合成時(shí)3種方法均出現(xiàn)同樣的結(jié)果,隨著證據(jù)量的增加,Murphy法因其是對(duì)證據(jù)源的簡(jiǎn)單平均而導(dǎo)致合成效果較差。
表1 不同方法合成結(jié)果比較
本文方法與文獻(xiàn)[3]中所提方法的結(jié)果均優(yōu)于Murphy法,且由于本文方法在評(píng)價(jià)證據(jù)間相似性時(shí)更多考慮了單元素之間的相似性,擴(kuò)大了單元素焦元的影響力,使得單元素部分相似度更高的證據(jù)所分配的權(quán)重更高,因此增強(qiáng)了BPA值更大事件的支持程度。當(dāng)m1、m2、m33組證據(jù)合成時(shí),m(A)的值相較于文獻(xiàn)[3]中所提方法提升了6.46%;隨著證據(jù)量的增多并出現(xiàn)m1、m2、m3、m44組證據(jù)合成的情況時(shí),本文方法的最終所得m(A)值為0.951 9,相較于Murphy法以及文獻(xiàn)[3]方法對(duì)命題A的支持程度仍為最高;在對(duì)含有更復(fù)雜元素焦元的證據(jù)m1、m2、m53組證據(jù)合成時(shí),本文方法相較于文獻(xiàn)[3]中所提方法m(A)的值提升了9.95%。
通過(guò)將Jaccard系數(shù)矩陣分塊歸一化,對(duì)含有多元素焦元證據(jù)體間的相似性做出了新的定義,對(duì)多元素焦元與單元素焦元在相似性度量時(shí)的重要度做出了明確劃分。通過(guò)不同相似性度量方法的對(duì)比分析,本方法在對(duì)相同的事件處理時(shí),擴(kuò)大了相似度的變化范圍,使證據(jù)間相似性度量更為明確。通過(guò)仿真算例表明,應(yīng)用本文相似性度量方法對(duì)證據(jù)源數(shù)據(jù)預(yù)處理,合成的結(jié)果更加準(zhǔn)確;在證據(jù)中的焦元復(fù)雜度更高時(shí),利用本文所給相似性度量方法的合成結(jié)果相較于其他方法更為有效。