宋香鵬,肖建于,吳克鳳,伏明蘭
(淮北師范大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,安徽 淮北 235000)
證據(jù)理論由Dempster提出[1],之后其學(xué)生Shefer在原有的基礎(chǔ)上進一步補充擴展,并在《證據(jù)的數(shù)學(xué)理論》(A Mathematical Theory of Evidence)中將證據(jù)理論的思想推廣開來,證據(jù)理論也因此被眾多學(xué)者探討研究,所以又被稱為D-S證據(jù)理論[2].近些年,信息融合研究領(lǐng)域備受關(guān)注.是因為研究傳感器信息融合可以更好地利用傳感器資源,并且通過對多源信息的組合與優(yōu)化,可以推導(dǎo)出更多的有效信息.而D-S證據(jù)理論就是在解決多源信息不確定性度量上更接近人的思維習慣,并且推理機制相對簡便.被廣泛應(yīng)用到軍事指揮[3]、信號處理[4]、狀態(tài)識別[5-6]、故障診斷、采礦冶金、智能決策、情感識別等領(lǐng)域.
為解決沖突證據(jù)的合成問題,國內(nèi)外學(xué)者提出了許多方法來解決此類問題.較早時期的Lefevre等[7]提出將全局沖突按照相應(yīng)的比例重新分配的統(tǒng)一信度函數(shù)組合方法,但是當證據(jù)高度沖突時,風險系數(shù)無法計算.Sun等[8]提出利用平均化沖突系數(shù)對證據(jù)體的權(quán)重進行優(yōu)化分配,然后根據(jù)改進的合成規(guī)則進行計算,與實際聯(lián)系存在一定的不足.張歡等[9]提出結(jié)合皮爾遜相關(guān)系數(shù)來修改證據(jù)體權(quán)重和BPA中零因子的修正,但是皮爾遜相關(guān)系數(shù)在只有一個重疊項時,無法滿足數(shù)學(xué)規(guī)則.其實,研究人員對改進沖突證據(jù)的組合方法大體上分為兩種,一種是對原始證據(jù)源的修正,另一種是對組合規(guī)則框架修改.對原始證據(jù)源修正這種方法雖然保留了D-S證據(jù)理論的優(yōu)良數(shù)學(xué)性質(zhì),但是卻忽略了證據(jù)體間的相關(guān)性;對組合規(guī)則框架修改這種方法可以很好地處理證據(jù)融合,但是在實際運用中卻存在著一定的局限性.
本文首先具體分析了D-S證據(jù)理論的基本性質(zhì)及其無法解決的悖論問題,總結(jié)出沖突問題的產(chǎn)生是因為在證據(jù)合成時,無法將交集為空的焦元的信任函數(shù)處理恰當.在實際多傳感系統(tǒng)中,考慮到各傳感器得到的證據(jù)存在著相關(guān)關(guān)系.本文提出一種結(jié)合斯皮爾曼等級相關(guān)系數(shù)的證據(jù)合成方法,首先計算出證據(jù)之間的相關(guān)系數(shù)并且得到相關(guān)性矩陣,通過相關(guān)性矩陣構(gòu)造修正系數(shù)來折扣基本可信度分配函數(shù),較大程度上減少分配整體非相關(guān)證據(jù)體的權(quán)重.最后,利用改進的D-S證據(jù)理論組合規(guī)則對修正后的證據(jù)進行合成計算.
識別框架:設(shè)Θ為識別框架,且識別框架Θ中各個元素互相獨立,其中識別框架Θ的所有子集組成的集合稱為Θ的冪集,常用2Θ表示,它的元素個數(shù)記為2|Θ|.
基本概率分布:其中基本信任分配函數(shù)m表示是從一個集合2Θ到[0,1]的映射,A表示識別框架Θ的任一子集,記作A?Θ,滿足以下條件[10]:
(1)
組合規(guī)則:設(shè)m1,m2,…,mn是同一個識別框架Θ下的n個基本信任分配函數(shù),其中焦元表示為Ai(i=1,2,…,N),則D-S的合成規(guī)則為[10]:
(2)
在所有研究改進的D-S證據(jù)理論合成規(guī)則的前提條件下,須滿足以下四個基本性質(zhì)[11]:
性質(zhì)1 交換律
m1⊕m2=m2⊕m1.
(3)
滿足交換律的意義是當證據(jù)合成時,合成計算得到的結(jié)果并不會因為證據(jù)排列順序變化而變化.
性質(zhì)2 結(jié)合律
m1⊕m2⊕m3=(m1⊕m2)⊕m3=m1⊕(m2⊕m3).
(4)
滿足結(jié)合律的意義是當多組證據(jù)合成時,可以任意組合證據(jù)的合成且每個證據(jù)的參與合成順序不影響合成的結(jié)果.
性質(zhì)3 極化性
極化性的意義是假設(shè)在m元素識別框架下n個相同證據(jù)合成后,單元素焦元總的信任分配值增加,m元素焦元的信任分配值減小,且m越大越明顯.
性質(zhì)4 魯棒性
魯棒性是指在多個證據(jù)合成時,基本信任分配函數(shù)的變化引起合成結(jié)果變化的幅度,其中這變化幅度即是魯棒性的量化體現(xiàn)[12].
因為信息具有多源和復(fù)雜的特點,所以在D-S證據(jù)理論合成時出現(xiàn)多種沖突證據(jù)合成的負面問題[13],主要有分為以下四類.
1) “一票否決”問題:證據(jù)合成時,若其中某條證據(jù)與其他證據(jù)完全不一致時,則此條完全不一致的證據(jù)會完全否定合成結(jié)果,即出現(xiàn)一票否決的結(jié)果.
2) “證據(jù)失效”問題:即證據(jù)體在合成中不起作用.
3) “置信沖突”問題:在證據(jù)的信任函數(shù)嚴重矛盾時,會導(dǎo)致不合情理的結(jié)果出現(xiàn).
4) “魯棒性”問題:得到的合成結(jié)果會因為焦元的基本信任函數(shù)發(fā)生微小變化而產(chǎn)生較大的變化.
例1 完全沖突,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表1所示.
表1 完全沖突證據(jù)的BPATab.1 BPA of complete conflict evidence
完全沖突:此識別框架下,計算出沖突系數(shù)K=1,但是在D-S證據(jù)理論合成公式中分母為0,不滿足數(shù)學(xué)規(guī)則,故此現(xiàn)象稱為完全沖突,完全沖突下會造成信息的損失.
例2 0信任沖突,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表2所示.
表2 信任沖突證據(jù)的BPATab.2 BPA without trust evidence of conflict
0信任沖突:此識別框架下,計算出K=0.955,雖然m1和m3都支持A,但是m2(A)=0,完全否定了A,合成的結(jié)果為0,導(dǎo)致融合失敗,出現(xiàn)一票否決的問題,傳感器系統(tǒng)中則會因為少數(shù)傳感器檢測結(jié)果異常,導(dǎo)致整個系統(tǒng)無法正常運轉(zhuǎn).
例3 1信任沖突,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表3所示.
表3 1信任沖突證據(jù)的BPATab.3 BPA of absolute trust conflict evidence
1信任沖突:此識別框架下,計算出K=0.999,合成后的結(jié)果為m(B)=1,但是給出的三個證據(jù)對B的支持很小,顯然違背常理,產(chǎn)生置信沖突問題,傳感器系統(tǒng)中則會因為對低支持度的信息產(chǎn)生過多信任,導(dǎo)致整個傳感系統(tǒng)準確性降低.
例4 沖突系數(shù)失效,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表4所示.
表4 沖突系數(shù)失效的BPATab.4 BPA with conflict coefficient failure
沖突系數(shù)失效:此識別框架下,計算出K=0.882,表明證據(jù)是高度沖突的,但是這是三個完全相同的證據(jù).造成沖突系數(shù)K失效,不能很好的描述此種識別框架下的關(guān)系.
斯皮爾曼等級相關(guān)系數(shù)(Spearman’s rank correlation coefficient)又稱為秩相關(guān)系數(shù),用希臘字母ρ表示.此相關(guān)系數(shù)是衡量統(tǒng)計變量X,Y的依賴性的非參數(shù)指標(衡量分級定序變量間的相關(guān)程度),并且還可以通過利用單調(diào)方程來具體量化統(tǒng)計變量間的相關(guān)性.其中ρ的取值范圍是[-1,1],ρ的公式為:
(5)
di=xi-yi,1≤i≤n.
(6)
兩個統(tǒng)計變量X,Y(或者是兩個集合),它們的元素個數(shù)均為n,兩個統(tǒng)計變量取的第i個值分別用Xi、Yi表示,其中i的取值范圍是1≤i≤n.對X,Y進行排序,得到兩個元素排行集合x、y,其中元素xi、yi分別為Xi在X中的排行以及Yi在Y中的排行.di即為元素間的排行差.
設(shè)m1,m2,…,mn是同一識別框架Θ下的n個基本信任分配函數(shù),焦元分別為Ai(i=1,2,…,N).對mi按照mi(Ak)從大到小排序,其中降序序列中的每個mi(Ak)在原始序列中的位序標記為ri(Ak);對mj按照mj(Ak)從大到小排序,其中降序序列中的每個mj(Ak)在原始序列中的位序標記為rj(Ak).若m(Ak)中有值相同的數(shù)據(jù),則其位序值取相同數(shù)據(jù)在降序序列位序的平均值.將mi,mj看作成統(tǒng)計變量中的X,Y.故其秩次差為:
dk=rj(Ak)-ri(Ak).
(7)
則mi與mj的斯皮爾曼等級相關(guān)系數(shù)即為:
(8)
利用式(7)和式(8)計算出各個證據(jù)體間的斯皮爾曼等級相關(guān)性系數(shù),然后構(gòu)造證據(jù)相關(guān)性矩陣Simij,即為:
其中ρmimj為證據(jù)體mi與mj的斯皮爾曼等級相關(guān)系數(shù)(1≤i≤n,1≤j≤n).
由于斯皮爾曼等級相關(guān)系數(shù)的計算僅使用了數(shù)據(jù)的秩值,并未使用原始數(shù)據(jù),故可將相關(guān)系數(shù)結(jié)果ρ小于等于0的賦值為0.001,以控制非正相關(guān)的證據(jù)體在識別框架中的可信度和權(quán)重占比計算,從而降低非正相關(guān)的證據(jù)體對于整體識別框架的基本概率分布的影響,同時可以克服組合規(guī)則中的置信問題.
(9)
在2.2中通過計算斯皮爾曼等級相關(guān)系數(shù)得到相關(guān)性矩陣,并且優(yōu)化ρ的取值,計算得到修正系數(shù)cre.現(xiàn)將得到的修正系數(shù)cre對原始的基本可信度分配函數(shù)進行修正.公式如下:
mi′(Ai)=cre(mi)×mi,
(10)
mi′(Θ)=cre(mi)×mi(Θ)+(1-cre(mi)).
(11)
最后,利用D-S證據(jù)理論的組合規(guī)則進行合成,計算出融合結(jié)果.歸納總結(jié),本文的算法步驟如下.
1)利用公式(7)和(8)計算出證據(jù)體m1,m2,…,mn間的相關(guān)系數(shù)ρmimj.
2)根據(jù)計算出的相關(guān)系數(shù)得到證據(jù)相關(guān)性矩陣:
3)將相關(guān)性矩陣中相關(guān)性值小于等于0的值賦值為0.001.
4)利用式(9)計算出歸一化后的修正系數(shù)cre(mi).
5)利用式(10)和式(11)計算出修正后的基本可信分配函數(shù)mi′(Ai).
6)根據(jù)D-S證據(jù)理論合成規(guī)則計算,得到融合結(jié)果.
例5 某傳感系統(tǒng)中的識別框架下,給出的命題P={{A},{B},{C},{D}},相應(yīng)的證據(jù)體如表5.
表5 基本算例Tab.5 Basic example
計算的詳細步驟如下所示.根據(jù)式(7)和式(8)計算證據(jù)體之間的斯皮爾曼等級相關(guān)系數(shù).首先計算m1和m2的斯皮爾曼等級相關(guān)系數(shù)如表6.
表6 證據(jù)體間的斯皮爾曼等級相關(guān)系數(shù)Tab.6 Spearman rank correlation coefficient between evidence bodies
由表6可知秩次差平方將其代入式(8),計算出m1和m2的斯皮爾曼等級相關(guān)系數(shù)為:
依次類推,分別計算出證據(jù)體間的相關(guān)系數(shù).得到的相關(guān)性矩陣為:
將相關(guān)性矩陣中相關(guān)性值小于等于0的值賦值為0.001,得到的新矩陣為:
計算修正向量為:
將其進行歸一化處理:
由式(10)和式(11)得到修正后的基本可信度分配函數(shù)為:
P′={{A′},{B′},{C′},{D′}},
m′={0.523 0,0.188 2,0.157 1,0.131 7}.
最后利用D-S證據(jù)理論的組合規(guī)則計算出最終結(jié)果為:
P={{A},{B},{C},{D}},
m={0.971 4,0.016 9,0.007 8,0.003 9}.
本章節(jié)利用傳感系統(tǒng)中經(jīng)典的算例,通過對比分析結(jié)果,表明本文提出的改進算法在解決沖突證據(jù)時符合客觀實際,并且有良好的收斂性和魯棒性.
經(jīng)典算例如表7所示.不同算法對此經(jīng)典算例的計算結(jié)果如表8所示.
表7 經(jīng)典算例Tab.7 Classical example
表8 不同算法對不同數(shù)量證據(jù)體的融合結(jié)果Tab.8 The fusion results of different algorithms on different numbers of evidence bodies
通過結(jié)合D-S證據(jù)理論基本性質(zhì)以及實驗對比分析,得到的結(jié)論如下:
傳統(tǒng)的D-S證據(jù)理論合成方法,其缺陷就是無法合成高沖突的證據(jù).當高沖突證據(jù)合成時,其中此條高沖突證據(jù)會完全否定合成結(jié)果,即出現(xiàn)“一票否決”的結(jié)果.
Yager[14]合成方法,此方法是把存在的沖突證據(jù)部分分配給識別框架全集,但是隨著證據(jù)體數(shù)目增加,m(Θ)也逐漸增加,造成合成的結(jié)果不確定性增加,無法有效的辨識出目標結(jié)果.
胡昌華等[15]提出的基于修改證據(jù)的權(quán)重系數(shù)處理證據(jù)沖突,雖然收斂速度較快,但是當證據(jù)體數(shù)目逐漸增加時,該方法的目標辨識率僅達到80.07%,顯然合成結(jié)果的準確性并不優(yōu)良.
鄧勇等[16]提出的處理沖突證據(jù)的方法,雖然結(jié)果符合常理,但是與本文算法進行比較,明顯得出此方法準確性不高.
孟晨晨等[17]提出可信度和虛假度兩個概念,并且引入證據(jù)間的距離公式,得到修正系數(shù).通過折扣轉(zhuǎn)換計算出合成結(jié)果,該方法能很好保護D-S證據(jù)理論優(yōu)良的數(shù)學(xué)特性.但是其收斂速度并不理想,與本文提出的算法相比,本文方法的收斂性更好,收斂速度更快,并且目標辨識率提高到了91.08%,證據(jù)數(shù)目不斷增加,本文的辨識率越高.
張歡等[9]提出的基于皮爾遜相關(guān)系數(shù)的改進D-S證據(jù)理論方法,在證據(jù)數(shù)目為3時,本文的目標辨識率達到了79.24%,在證據(jù)數(shù)目增加時,張歡提出的改進算法得到的效果最好,但是其忽略了皮爾遜相關(guān)系數(shù)的限制條件.皮爾遜相關(guān)系數(shù)的限制條件數(shù)據(jù)必須是連續(xù)數(shù)據(jù),并且分布方式為高斯分布才能使用此相關(guān)系數(shù).在例4中運用此方法是無效的,因為皮爾遜相關(guān)系數(shù)無法計算此類證據(jù)體,分母為0是其核心矛盾點.在與本文算法對比可知,本文算法適用性更廣,對證據(jù)體的要求沒有文獻[9]中嚴格.
在3組對比實驗中,本文提出的利用斯皮爾曼相關(guān)系數(shù)構(gòu)造的修正系數(shù)算法得到m(A)的融合結(jié)果普遍高于其他學(xué)者改進的算法如圖1所示;伴隨著證據(jù)體數(shù)量增加,此方法表現(xiàn)出更高的合理命題信任度.并且在證據(jù)量較少時,本文算法有著很高的目標辨識率.
其中此實驗對焦元B和C合成結(jié)果變化趨勢如圖2、圖3所示.
圖3 不同算法對不同數(shù)量證據(jù)體下焦元C 合成結(jié)果的變化趨勢Fig.3 The trend of different algorithms to the results of coke C synthesis in different numbers of evidence bodies
本文通過利用斯皮爾曼相關(guān)系數(shù)求出證據(jù)體間的相關(guān)性矩陣,將相關(guān)性矩陣中相關(guān)性值小于等于0的值進行優(yōu)化賦值,然后構(gòu)造修正系數(shù)來修正證據(jù)間的沖突.最后,利用D-S證據(jù)理論組合規(guī)則對修正后的證據(jù)進行合成.通過實驗對比分析,得到該算法特點如下:
引入統(tǒng)計學(xué)三大相關(guān)系數(shù)之一的斯皮爾曼等級相關(guān)系數(shù)來計算證據(jù)體間的相關(guān)性,有效簡化了構(gòu)造距離公式的過程,收斂速度更快.
通過利用相關(guān)性矩陣構(gòu)造的修正系數(shù),合理優(yōu)化折扣基本可信度分配函數(shù),同時可以克服組合規(guī)則中存在的置信問題,提高了目標辨識的準確性.
在處理高度沖突證據(jù)時,該算法在低數(shù)量的證據(jù)下,對目標辨識率很高,伴隨著證據(jù)量的增加,本文算法較其他算法有一定的提高,并且在應(yīng)用范圍上更加廣泛,能夠處理不同數(shù)學(xué)分布的證據(jù)體.