孟晨晨,肖建于,羅 蘭
(淮北師范大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 淮北 235000)
基于相似系數(shù)和Jaccard系數(shù)矩陣的證據(jù)沖突度量方法
孟晨晨,肖建于,羅 蘭
(淮北師范大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 淮北 235000)
針對(duì)傳統(tǒng)的沖突度量和Jousselme距離度量出現(xiàn)沖突誤判的問(wèn)題,提出一種相似系數(shù)和Jaccard系數(shù)矩陣的證據(jù)沖突度量方法。該方法通過(guò)計(jì)算證據(jù)之間的相似系數(shù),利用Jaccard系數(shù)矩陣將相似系數(shù)轉(zhuǎn)化為證據(jù)的沖突程度。理論證明和數(shù)值計(jì)算表明,該方法可以有效地表示證據(jù)間的沖突程度。此外,通過(guò)典型的算例將提出的方法與其他方法進(jìn)行對(duì)比,結(jié)果表明該方法可以全面準(zhǔn)確地度量證據(jù)間的沖突程度。
D-S證據(jù)理論; 沖突度量; 相似系數(shù); Jaccard系數(shù)矩陣
D-S證據(jù)理論[1]可以處理各種不確定和不完善的信息,現(xiàn)已廣泛應(yīng)用于空中目標(biāo)識(shí)別,決策支持,故障檢測(cè)等領(lǐng)域中。如果證據(jù)間存在高度沖突時(shí),使用傳統(tǒng)的Dempster組合規(guī)則常常會(huì)導(dǎo)致悖論。但是,如何度量沖突證據(jù)目前還沒(méi)有一個(gè)統(tǒng)一的衡量標(biāo)準(zhǔn)。文獻(xiàn)[2-3]定義矩陣的奇異值來(lái)度量沖突證據(jù),得到較好的效果。文獻(xiàn)[4]將蔣雯的表達(dá)式推廣到更一般的形式,實(shí)驗(yàn)表明該方法能夠衡量證據(jù)間的沖突程度。文獻(xiàn)[5-9]分別重新定義關(guān)聯(lián)系數(shù)、相關(guān)系數(shù)來(lái)度量沖突證據(jù)。文獻(xiàn)[10]從證據(jù)的非對(duì)稱(chēng)性出發(fā),提出了一種非對(duì)稱(chēng)的證據(jù)沖突度量方法。文獻(xiàn)[11-12]均從改進(jìn)Jousselme距離出發(fā),修正傳統(tǒng)的度量證據(jù)沖突的方法。文獻(xiàn)[13]引入不確定度來(lái)度量證據(jù),以此修正組合規(guī)則。文獻(xiàn)[14-15]將辨識(shí)框架推廣到廣義的冪集空間中,建立一種處理證據(jù)沖突的度量模型。文獻(xiàn)[16-18]從優(yōu)化的角度出發(fā),進(jìn)行沖突度量。
本文擬從證據(jù)的相似性角度出發(fā),定義證據(jù)的相似系數(shù),并結(jié)合Jaccard系數(shù)矩陣來(lái)共同度量證據(jù)間的沖突程度。通過(guò)這種方法來(lái)判斷證據(jù)間是否存在沖突,以此來(lái)決定采取何種組合方法。
定義1 在辨識(shí)框架Θ下的2個(gè)基本概率賦值函數(shù)分別為m1,m2,Dempster組合規(guī)則[1]定義為
(1)
(2)
(1)—(2)式中,k∈[0,1)為沖突系數(shù),通常用k來(lái)度量證據(jù)間的沖突程度。
定義2 假設(shè)在辨識(shí)框架Θ下的2個(gè)基本概率賦值函數(shù)分別為m1,m2,Jousselme距離定義為[19]
(3)
(3)式中,D為Jaccard系數(shù)矩陣,且Jaccard系數(shù)矩陣為實(shí)對(duì)稱(chēng)矩陣,主對(duì)角線(xiàn)元素均為1。D中的元素D(Ai,Bj)=|Ai∩Bj|/|Ai∪Bj|,|Ai∩Bj|表示集合Ai和集合Bj并集的元素個(gè)數(shù),同時(shí)反映了2個(gè)焦元間的沖突程度。
例1 假設(shè)辨識(shí)框架Θ={a,b,c,d,e},系統(tǒng)中的證據(jù)如下
m1(a)=m1(b)=m1(c)=m1(d)=m1(e)=0.2,
m2(a)=m2(b)=m2(c)=m2(d)=m2(e)=0.2。
利用(2)式計(jì)算得出k=0.800 0,表明證據(jù)間存在高度沖突,而利用(3)式計(jì)算出dBPA=0.0000,表明證據(jù)間不存在沖突。但從直觀上看,這2條證據(jù)是完全一致的,并不存在沖突,與dBPA的判斷一致。所以用(1)式會(huì)得出與實(shí)際相反的結(jié)果,會(huì)造成沖突的誤判。
此時(shí),說(shuō)明沖突系數(shù)k不能表征證據(jù)之間的沖突,但是利用Jousselme中的dBPA也存在不能表征證據(jù)之間的沖突問(wèn)題。
例2 假設(shè)在辨識(shí)框架Θ={a,b,c,d}下,系統(tǒng)中的2組證據(jù)分別為
從例1和例2可以看出,利用沖突系數(shù)k和dBPA均可能造成證據(jù)的誤判。
針對(duì)此類(lèi)問(wèn)題,文獻(xiàn)[5]提出基于隨機(jī)變量的偏熵和關(guān)聯(lián)熵的關(guān)聯(lián)系數(shù),雖然關(guān)聯(lián)系數(shù)在同一性檢驗(yàn)、一致性分析領(lǐng)域應(yīng)用較廣泛,但是,在證據(jù)中存在0項(xiàng)時(shí),計(jì)算時(shí)會(huì)出現(xiàn)log0=-∞,為了避免出現(xiàn)以上情況,采取的近似計(jì)算具有一定的工程意義,但是,無(wú)法從物理意義上進(jìn)行解釋。
文獻(xiàn)[6]利用Joussleme證據(jù)距離轉(zhuǎn)化為廣義的證據(jù)距離,并將其中的參數(shù)轉(zhuǎn)換為Hausdorff距離和相似矩陣之和來(lái)共同表征證據(jù)之間的沖突程度。但是,其參數(shù)的設(shè)定具有主觀臆斷性,對(duì)于多個(gè)證據(jù)之間的沖突問(wèn)題則無(wú)法很好地表征。
文獻(xiàn)[18]將k和Pignistic概率距離組成二元組,但是,并沒(méi)有提出一個(gè)公式來(lái)統(tǒng)一這2個(gè)因子,只是單純地根據(jù)閾值來(lái)判斷證據(jù)是否沖突,主觀臆斷較明顯。
針對(duì)k和dBPA存在沖突誤判的情況以及前人研究中的一些客觀存在的問(wèn)題,如:傳感器自身的問(wèn)題;傳感器系統(tǒng)受到外界環(huán)境(如氣象災(zāi)害、敵方人為的干擾)的影響,導(dǎo)致測(cè)量的不準(zhǔn)確;辨識(shí)框架的不完整;參數(shù)閾值確定的主觀性等。故本文提出一種基于相似系數(shù)和Jaccard系數(shù)矩陣的方法來(lái)度量證據(jù)沖突程度。
定義3 假設(shè)在辨識(shí)框架Θ下的2個(gè)基本概率賦值函數(shù)分別為m1,m2,則相似系數(shù)定義為
(i,j= 1,…,N)
(4)
sim具有以下的性質(zhì):
1)sim(m1,m2)∈[0,1]
2)sim(m1,m2)=1?m1(Ai)=m2(Bj)
3)sim(m1,m2)=sim(m2,m1)
4)(∪Ai)∩(∪Bj)=?,當(dāng)且僅當(dāng)sim(m1,m2)=0。其中,Ai,Bj分別為證據(jù)mi(·),mj(·)所對(duì)應(yīng)的焦元。
證明:
1)假設(shè)在辨識(shí)框架Θ下的基本概率函數(shù)m1,m2表示的向量為
m1=[m1(A1),m1(A2)…,m1(AN)]
m2=[m2(B1),m2(B2)…,m2(BN)]
∴左式=
由柯西不等式可知
|
當(dāng)且僅當(dāng)m1=m2,取等號(hào)
∵m1,m2的各個(gè)分量的值均為非負(fù)數(shù),
∴
∴sim(m1,m2)∈[0,1]。
性質(zhì)1)證畢。
2)在性質(zhì)1)的證明中,不等式取等號(hào)的條件是:m1=m2.
∴性質(zhì)2)證畢。
3)sim(m1,m2)=sim(m2,m1)顯然成立。
4)∵(∪Ai)∩(∪Bj)=?
∴表示2個(gè)證據(jù)之間沒(méi)有公共的焦元。
假設(shè)m1中的坐標(biāo)分量m1(Ai)≠0,則m2對(duì)應(yīng)的坐標(biāo)分量m2(Bj)=0,此時(shí)m1(Ai)m2(Bj)=0,即sim(m1,m2)=0
例3 假設(shè)辨識(shí)框架Θ={a,b,c},系統(tǒng)中的證據(jù)如下
m1(a)=0.01,m1(b)=0.99
m2(b)=0.99,m2(c)=0.01
計(jì)算得k=0.019 9,dBPA=0.01,均表明不存在沖突。利用(4)式計(jì)算得出sim(m1,m2)=0.999 9,表明證據(jù)m1和證據(jù)m2對(duì)的支持度很大,與k,dBPA的判斷一致。
例4 假設(shè)在辨識(shí)框架Θ={a,b,c,d,e,f,g}下,系統(tǒng)中的證據(jù)為
m1(a,b,c)=0.6,m1(Θ)=0.4
m2(a,b,c,d)=0.6,m2(Θ)=0.4
m3(e,f,g)=0.6,m3(Θ)=0.4
計(jì)算得k1,2=0.000 0,k1,3,k2,3均等于0.360 0,d1,2=0.300 0,d1,3,d2,3均為0.600 0。表明證據(jù)m1和證據(jù)m3,證據(jù)m2和證據(jù)m3的沖突程度要大于證據(jù)m1和證據(jù)m2的沖突程度。但是,由(4)式分別計(jì)算出sim(m1,m2),sim(m1,m3)sim(m2,m3)均等于0.307 7,表明3個(gè)證據(jù)間具有相同的相似度,與實(shí)際觀察到的結(jié)果不相符。
為了解決相似系數(shù)有時(shí)無(wú)法正確度量沖突的情況,引入Jaccard系數(shù)矩陣D。
將Jaccard系數(shù)矩陣引入到sim中,定義證據(jù)的沖突程度為
(5)
(5)式是為了實(shí)現(xiàn)證據(jù)中數(shù)據(jù)對(duì)目標(biāo)辨識(shí)框架中每個(gè)目標(biāo)的沖突度。
表1是將k,dBPA,1-sim,conf沖突度量值相比較。
表1 4種沖突度量值
從表1可以看出:
1)例1中k=0.800 0表示證據(jù)m1和證據(jù)m2之間有沖突,此時(shí)證據(jù)m1和證據(jù)m2是2組具有相同支持度的證據(jù),所以,用k進(jìn)行沖突度量卻得出與實(shí)際觀察結(jié)果相悖的結(jié)論。而dBPA,1-sim,conf均為0.000 0,與實(shí)際觀察到的結(jié)果相一致。
3)例3中,k,dBPA,1-sim,conf的值均小于0.019 9,表明證據(jù)m1和證據(jù)m2沖突很小。
4)例4中的conf的值均小于dBPA和k的值,表明conf比k和dBPA能夠更好地度量沖突,此時(shí)的證據(jù)m1、證據(jù)m2和證據(jù)m3之間的沖突較小。
利用文獻(xiàn)[20]中典型的算例,分別將文獻(xiàn)[1]中的沖突系數(shù)k,文獻(xiàn)[5]中的關(guān)聯(lián)系數(shù)r,文獻(xiàn)[8]中的相關(guān)系數(shù)cor,文獻(xiàn)[19]中的dBPA,文獻(xiàn)[20]中的difBetP和本文提出的conf進(jìn)行對(duì)比分析,以此來(lái)說(shuō)明本文提出的度量方法也可以較好地描述證據(jù)間的沖突程度。
假設(shè)在辨識(shí)框架Θ中有20個(gè)元素,為了簡(jiǎn)化,用1,2,…,20來(lái)表示元素,即Θ={1,2,…,20},2個(gè)基本概率賦值函數(shù)分別為m1,m2。
m1({2,3,4})=0.05,m1({7})=0.05
m1({Θ})=0.1,m1({A})=0.8
m2({1,2,3,4,5})=1
其中,子集A按照{(diào)1},{1,2},…,{1,2,…,20}規(guī)律變化。
表2對(duì)比了幾種常見(jiàn)的沖突度量值。圖1顯示了k,dBPA,difBetP,1-r,1-cor,conf隨著子集A變化的沖突度量值的變化。
由表2和圖1可以看出:
1)無(wú)論子集A如何變化,沖突系數(shù)k始終為0.050 0,這不符合常理。
表2 6種沖突度量值的對(duì)比表
2)隨著子集A的不斷增加,除了k始終為一條平滑的直線(xiàn)外,其余的幾條沖突度量值曲線(xiàn)的變化趨勢(shì)大體一致。
3)當(dāng)子集A={1,2,…,5}時(shí),除了k曲線(xiàn)外,其余幾條沖突度量值曲線(xiàn)均達(dá)到峰谷。此時(shí)表明證據(jù)m1和證據(jù)m2之間的沖突最小。
4)當(dāng)子集從A={1,2,…,6}變化到A={1,2,…,20}時(shí),dBPA,difBetP,1-r,1-cor和conf的曲線(xiàn)均呈上升趨勢(shì),表明證據(jù)m1和證據(jù)m2的沖突隨著子集A中元素的增加而逐步增大,與直觀上的分析相一致。
5)當(dāng)子集A={1,2,3,4,5}時(shí),conf=0.265 4,此時(shí)的沖突程度值最小。
如前面所述,本文提出的度量證據(jù)沖突程度的conf同dBPA,difBetP,1-r,1-cor一樣均可以隨著子集A的變化,反映證據(jù)之間的沖突程度,與直觀上的分析相一致,同時(shí)解決了相似系數(shù)1-sim有時(shí)無(wú)法正確度量沖突的情況。所以,本文提出的基于相似系數(shù)和Jaccard系數(shù)矩陣的沖突度量方法是可行的,可以全面準(zhǔn)確地衡量證據(jù)間的沖突程度。
圖1 6種沖突度量值隨著子集A的變化對(duì)比圖Fig.1 Comparison of six conflict measure values when subset A changesing
為了避免出現(xiàn)沖突誤判的情況,本文首先定義了相似系數(shù),并結(jié)合Jaccard系數(shù)矩陣來(lái)共同進(jìn)行沖突的度量。通過(guò)算例分析對(duì)比本文的沖突度量方法和其他方法,結(jié)果表明該方法可以全面準(zhǔn)確地衡量證據(jù)間的沖突程度。
但是,本文的方法是在辨識(shí)框架完整的前提下提出的,如果在開(kāi)放世界的前提下,該方法是否適用值得商榷。同時(shí),本文并未給出沖突證據(jù)的合成方法,在基于證據(jù)理論的信息融合系統(tǒng)中如何根據(jù)證據(jù)的沖突來(lái)選擇證據(jù)組合方法則是下一步需要研究的課題。
[1] DEMPSTER A P. Upper and lower probabilities induced by a multivalued mapping[J]. The Annals of Mathematical Statistics, 1976, 38(2): 325-329.
[2] 柯小路,馬荔瑤,王永.奇異值衡量證據(jù)沖突的新方法[J].電子學(xué)報(bào), 2013, 41(10): 2109-2122. KE Xiaolu, MA Liyao, WANG Yong. A New Method to Measure Evidence Conflict Based on Singular Value[J]. Acta Electronica Sinica, 2013, 41(10): 2109-2122.
[3] 王保云,王桂林,王婷,等.基于矩陣奇異值分解的證據(jù)沖突度量算法[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版, 2014, 37(1):43-51. WANG Baoyun, WANG Guilin, WANG Ting, et al. Evidence conflict measure based on singular value decomposition of matrix[J]. Journal of Yunnan University: Natural Sciences Edition, 2014, 37(1):43-51.
[4] 邢曉辰,蔡遠(yuǎn)文,李巖,等.一種改進(jìn)的證據(jù)沖突衡量因子[J]. 電訊技術(shù), 2015, 55(11): 1225-1231. XING Xiaochen, CAI Yuanwen, LI Yan, et al. An improved measure factor of evidence conflict[J]. Telecommunication Engineering, 2015, 55(11): 1225-1231.
[5] 鄧勇,王棟,李齊,等.一種新的證據(jù)沖突分析方法[J].控制理論與應(yīng)用, 2011, 28(6): 839-844. DENG Yong, WANG Dong, LI Qi, et al. A new method to analyze evidence conflict[J]. Control Theory and Applications, 2011, 28(6): 839-844.
[6] MO H M, LU X, DENG Y. A generalized evidence distance[J]. Journal of Systems Engineering and Electronics, 2016, 27(2): 470-476.
[7] 蔣雯,彭進(jìn)業(yè),鄧勇.一種新的證據(jù)沖突表示方法[J].系統(tǒng)工程與電子技術(shù), 2010, 32(3): 562-565. JIANG Wen, PENG Jinye, DENG Yong. New representation method of evidential conflict[J]. Systems Engineering and Electronics, 2010, 32(3): 562-565.
[8] 宋亞飛,王曉丹,雷蕾,等.基于相關(guān)系數(shù)的證據(jù)沖突度量方法[J].通信學(xué)報(bào), 2014, 35(5): 95-100. SONG Yafei, WANG Xiaodan, LEI Lei, et al. Measurement of evidence conflict based on correlation coefficient[J]. Journal on Communications, 2014, 35(5): 95-100.
[9] 李玲玲,馬東娟,王成山,等.DS證據(jù)理論沖突處理新方法[J].計(jì)算機(jī)應(yīng)用研究, 2011, 28(12): 4529-4531. LI Lingling, MA Dongjuan, WANG Chengshan, et al. New method for conflict evidence processing in D-S theory[J]. Application Research of Computers, 2011, 28(12):4529-4531.
[10] 王萬(wàn)請(qǐng),趙擁軍,黃潔,等.一種非對(duì)稱(chēng)的證據(jù)沖突度量方法[J].控制與決策, 2014, 29(3): 533-536. WANG Wanqing, ZHAO Yongjun, HUANG Jie, et al. An asymmetrical measure for evidence conflict[J]. Control and Decision, 2014, 29(3): 533-536.
[11] 彭穎,胡增輝,沈懷榮.一種修正證據(jù)距離[J].電子與信息學(xué)報(bào), 2013, 35(7): 1624-1629. PENG Ying, HU Zenghui, SHEN Huairong. A modified distance of evidence[J]. Journal of Electronics and Information Technology, 2013, 35(7): 1624-1629.
[12] 張燕君,龍呈.一種改進(jìn)的沖突表示方法[J].計(jì)算機(jī)應(yīng)用研究, 2013, 30(6): 1716-1717, 1730. ZHANG Yanjun, LONG Cheng. Improved conflict representation method[J]. Application Research of Computers, 2013, 30(6): 1716-1717, 1730.
[13] 韓德強(qiáng),鄧勇,韓崇昭,等.利用不確定度的沖突證據(jù)組合[J].控制理論與應(yīng)用, 2011, 28(6): 788-792. HAN Deqiang, DENG Yong, HAN Chongzhao, et al. Conflicting evidence combination by using uncertainty degree[J]. Control Theory and Applications, 2011, 28(6): 788-792.
[14] 胡麗芳,關(guān)欣,鄧勇,等.廣義冪集空間中證據(jù)沖突的原因分析[J].控制理論與應(yīng)用,2011,28(12):1717-1722. HU Lifang, GUAN Xin, DENG Yong, et.al. Cause-analysis for conflicting evidences in the generalized power space[J]. Control Theory and Applications, 2011, 28(12): 1717-1722.
[15] DENG Y. Generalized evidence theory[J]. Applied Intelligence, 2015, 43(3): 530-543.
[16] 胡昌華,司小勝,周志杰,等.新的證據(jù)沖突衡量標(biāo)準(zhǔn)下的D-S改進(jìn)算法[J].電子學(xué)報(bào),2009,37(7):1578-1583.
HU Changhua, SI Xiaosheng, ZHOU Zhijie, et al. An improved D-S algorithm under the new measure criteria of evidence conflict[J]. Acta Electronica Sinica, 2009, 37(7): 1578-1583.
[17] 陳圣群,王應(yīng)明.證據(jù)的分組合成方法[J].控制與決策, 2013, 28(4): 574-578. CHEN Shengqun, WANG Yingming. Grouping method for combining evidence[J]. Control and Decision, 2013, 28(4): 574-578.
[18] LIU Z G, PAN Q, DEZART J, et al. Gredal classification rule for uncertain data based on belief functions[J]. Pattern Recognition, 2014, 47(7): 2532-3541.
[19] JOUSSELME A L, GRENIER D, BOSSE E. A new distance between two bodies of evidence[J]. Information Fusion, 2001, 2(1): 91-101.
[20] LIU W R. Analyzing the degree of conflict among belief functions[J]. Artificial Intelligence, 2006, 170(11): 909-924.
(編輯:張 誠(chéng))
The National Natural Science Foundation of China(61102117)
Evidence conflict measurement method based on similarity coefficient and Jaccard matrix
MENG Chenchen,XIAO Jianyu,LUO lan
(School of Computer Science and Technology, Huaibei Normal University, Huaibei 235000, P.R. China)
Aiming at the open issue that the classical conflict coefficient and Jousselme distance measure can not correctly judge the conflict evidence, a new measurement of conflict was presented based on the definition of similarity coefficient and Jaccard matrix. By calculating the similarity coefficient between the evidence and the Jaccard coefficient matrix, the similarity coefficient is transformed into the conflict degree of the evidence. Theoretic proof and numreical examples verify the efficiency of the proposed measurement. A typical example is analyzed and compared with other methods. It has been shown by comparison with other methods that the proposed measurement is more accurate to measure evidence conflict.
D-S evidence theory; conflict measurement; similarity coefficient; Jaccard coefficient matrix
2016-08-01
2017-04-09 通訊作者:肖建于 xy_xiao@163.com
國(guó)家自然科學(xué)基金(61102117)
10.3979/j.issn.1673-825X.2017.03.022
TP274
A
1673-825X(2017)03-0421-06
孟晨晨(1988-),女,安徽巢湖人,碩士研究生。研究方向?yàn)樽C據(jù)理論、信息融合。E-mail:1586079557@qq.com
肖建于(1976-),男,重慶忠縣人,博士,教授,碩士生導(dǎo)師,CCF會(huì)員(44737M)。研究方向?yàn)樾畔⑷诤?、模式識(shí)別。E-mail:xy_xiao@163.com
羅 蘭(1993-),女,安徽巢湖人,碩士研究生。研究方向?yàn)樾畔⑷诤?。E-mail:1272637650@qq.com