曹 潔,馮 鋒,王進花
(蘭州理工大學 計算機通信學院,蘭州730050)
D-S證據(jù)理論是信息融合技術(shù)得以實現(xiàn)的重要工具,產(chǎn)生于20世紀60年代人們對多值映射工作的研究[1]。相對于概率論,它對證據(jù)的融合無需先驗知識,對信息的表達和處理更加有效,因而D-S證據(jù)理論被廣泛地應(yīng)用于信息融合領(lǐng)域中[2]。然而,在證據(jù)理論發(fā)展應(yīng)用的過程中,也遇到了諸如“一票否決”、“魯棒性差”、“信任度偏移”等問題。對此,研究人員從以下方法開展了研究:
第一類方法,Smarandache等人認為證據(jù)理論框架本身不合理,并對其進行修改,在超冪集的框架上構(gòu)建了DSmT理論。該理論處理不確定信息非常適宜,但對框架的修改難度很大。
第二類方法,許多學者將問題歸咎于Dempster組合規(guī)則歸一化運算,認為將沖突信度按比例分配給其他非空焦元并不合理,因而提出對Dempster組合規(guī)則進行修改[3-6]。
第三類方法,部分學者首先對Dempster組合規(guī)則給予肯定,認為合成結(jié)果有悖常理應(yīng)歸咎于數(shù)據(jù)模型的不合理性,因而提出在組合規(guī)則不變的情況下對證據(jù)源模型進行修改的方法[7-10]。
證據(jù)之間沖突程度的衡量是處理沖突的關(guān)鍵,常常被人們忽視。目前,對于衡量證據(jù)之間的沖突,尚未有統(tǒng)一的方法[11]。算例表明,用經(jīng)典沖突系數(shù)k表征沖突的大小,并不合理。文獻[12-13]提出,將Pignistic概率距離和k組合,構(gòu)成1個二元組用于表征證據(jù)之間的沖突程度,其效果優(yōu)于僅僅使用沖突系數(shù)k,然而由于證據(jù)是嵌套子集,如果證據(jù)條數(shù)>2,則不能有效地判斷證據(jù)之間的沖突。文獻[14-15]利用Jousselme距離和沖突系數(shù)k的簡單平均來修正原始的沖突系數(shù)。文獻[16]用沖突系數(shù)和自定義的證據(jù)距離來描述證據(jù)之間的沖突,但是當存在相同證據(jù)時卻不能用這樣的表達式來描述它們之間的沖突程度。
針對上述問題,在此基于三角模算子定義了證據(jù)之間的相似度,計算得到了證據(jù)距離,并結(jié)合定義的證據(jù)馬氏距離及經(jīng)典沖突系數(shù)k,提出一種比較合理地衡量證據(jù)沖突的沖突系數(shù)。由此得到待組合證據(jù)體相應(yīng)的權(quán)重,采用序貫方式實現(xiàn)證據(jù)組合。
組合前利用折扣因子對待組合證據(jù)予以修正,經(jīng)Dempster組合規(guī)則融合后,利用信任系數(shù)對組合結(jié)果進行第2次修正,然后參與后續(xù)證據(jù)的組合。該組合方法摒棄了對傳統(tǒng)D-S證據(jù)理論模型框架的修改,使實現(xiàn)組合的難度大大降低。其實質(zhì)是對待組合證據(jù)體進行了預(yù)處理,并改變了傳統(tǒng)批量式的融合方式,并未對組合規(guī)則本身進行修正,保留了組合規(guī)則所滿足的交換律和結(jié)合律性質(zhì)。
文獻[17]給出了D-S證據(jù)理論的基本概念。雖然證據(jù)理論在信息融合、故障診斷、智能決策等系統(tǒng)中已獲得廣泛運用,但是在實際應(yīng)用中也遇到了難題。在此舉例說明Dempster組合規(guī)則存在的不足。
當k=1時,不能用Dempster組合規(guī)則進行融合,而當k→1時,對高沖突證據(jù)進行融合,將會產(chǎn)生有悖常理的結(jié)果。
例 1假定辨識框架 Θ={a,b,c},系統(tǒng) 2個證據(jù)為
證據(jù) 1:m1(a)=0.99,m1(b)=0.01
證據(jù) 2:m2(b)=0.01,m2(c)=0.99
證據(jù)m1和m2以0.99的信度值分別最大支持焦元a和c,而支持b的信度值只有0.01,但合成結(jié)果為 m(a)=m(c)=1,m(b)=0,融合結(jié)果有悖常理。同時,如果證據(jù)完全沖突,合成公式的分母為0,組合規(guī)則完全失效。
例 2 假定辨識框架 Θ={A,B,C,D,E},2 個證據(jù)的基本概率分配為
組合后的融合結(jié)果為
完全相同的證據(jù)體m1和m2沖突程度應(yīng)為0。但是,計算得到系數(shù)k=0.8,說明描述證據(jù)沖突程度僅僅依靠傳統(tǒng)沖突系數(shù)k,顯然并不合理。而利用文獻[14-16]所提沖突程度表達式在此計算沖突程度也不為0,據(jù)此可知其所提沖突系數(shù)并不全面。
分析經(jīng)典沖突系數(shù)k及以上兩例可知,僅利用焦元間的非包容性衡量證據(jù)間的沖突程度并不全面,證據(jù)之間的差異性也是衡量沖突程度必須考慮的重要因素。為了在描述證據(jù)沖突時利用證據(jù)之間的差異性,特引入三角模算子(triangular norm)[18]。
三角模算子是人工智能領(lǐng)域中的一種理論方法[19],常依賴于模糊推理的思想,將單源決策映射到另一空間,通過比較來達到判決目的。三角模定義如下:
若映射 T(S1,S2),[0,1]*[0,1]→[0,1],對?a,b,c,d∈[0,1],滿足條件為
若 a≤b,c≤d 則 T(a,b)≤T(c,d);
則映射T稱為三角模算子或三角模。幾種常見的三角模算子如下:
定義1假設(shè)m為識別框架Θ上的BPA函數(shù),定義證據(jù)mi,mj之間的相似度為
定義2證據(jù)mi和mj之間的證據(jù)距離定義為
例3假定辨識框架Θ={a,b,c}, 系統(tǒng)3個證據(jù)為
證據(jù) E1支持 a,E2和 E3支持 c,一般推斷 E2和E1的沖突要大于E2和E3,經(jīng)計算得到k12=0.71,d12=0.32;k23=0.52,d23=0.38(kij為第 i個和第 j個證據(jù)的沖突系數(shù);dij為第i個和第j個證據(jù)的距離)。故根據(jù)沖突系數(shù)判斷E2和E1的沖突大于E2和E3,與分析一致,但按照距離來判斷卻會得到相反的結(jié)論,因此同樣不能單純利用證據(jù)距離來表征沖突程度。
為了更好地描述證據(jù)間的差異性,引入了馬氏距離[20](Mahalanobis distance)。 馬氏距離有別于歐氏距離,由于考慮了各種特征之間的聯(lián)系且獨立于測量尺寸,用于計算2個未知樣本集的相似度非常有效,能夠避免變量相關(guān)性所造成的干擾。
第i,j兩個樣品之間的馬氏距離為
定義3假設(shè)m為識別空間U上的BPA函數(shù),U→[0,1],定義 mi和 mj之間的馬氏距離為
由上可知,沖突系數(shù)kij反映了證據(jù)之間的非包容性,而自定義證據(jù)距離 dBPA(mi,mj)及證據(jù)間的馬氏距離能夠反映證據(jù)間的差異性。鑒于此,為了充分利用兩者在某些情況下的互補性,提出新的證據(jù)沖突程度的表達式為
由式(7)可以看出,新的沖突系數(shù) kij′為 kij,dBPA(mi,mj)和三者共同作用的結(jié)果。只有當三者均為0時,才說明證據(jù)間無沖突,同時也只有當三者都較大時,才能判定證據(jù)之間存在較大的沖突,有效地抑制了單一要素對證據(jù)沖突判定造成的偏差。
證據(jù)的權(quán)重系數(shù)是證據(jù)的“價值”體現(xiàn),與其他證據(jù)沖突較小的證據(jù)為“多數(shù)證據(jù)”,有利于最終組合結(jié)果的正確合成,權(quán)重系數(shù)較大;與其他證據(jù)沖突較大的證據(jù)為“少數(shù)證據(jù)”,它們會使最終合成結(jié)果有悖常理,應(yīng)獲得較小的權(quán)重系數(shù)。在此定義了第 i個與第 j( j≠i)個證據(jù)的矛盾因子 kij′后,令
證據(jù)沖突程度方陣的每一個元素由證據(jù)間的沖突程度構(gòu)成,于是n維沖突方陣為
將沖突方陣的第i行或第i列相加,可得到第i個證據(jù)與其他證據(jù)的總沖突程度,即:
設(shè)有n個待組合的證據(jù)體mi,各自所對應(yīng)的總沖突度為confi,每個證據(jù)體對應(yīng)的權(quán)重為[21]
式中:α為負指數(shù)函數(shù)參數(shù)。
關(guān)鍵證據(jù)的權(quán)重系數(shù)最大,其權(quán)重系數(shù)為
得到的各證據(jù)相對權(quán)重向量為
于是得到證據(jù)mass函數(shù)的“折扣因子”為
根據(jù)“折扣因子”對證據(jù)體進行第1次修正:
修正后的證據(jù)利用D-S規(guī)則進行合成。
定義4證據(jù)mi和mj之間融合的信任系數(shù)定義為
假設(shè)證據(jù) mi和 mj融合后的結(jié)果為 mij(X),則第2次修正的結(jié)果為
將修正的融合結(jié)果Mij′(X)和新證據(jù)重復上述融合與再修正,后續(xù)融合依此類推。融合過程類似于哈夫曼編碼,由于采用序貫式融合,無需再對證據(jù)進行排序。 假設(shè)有 5 個證據(jù) m1,m2,m3,m4,m5,計算得到對應(yīng)的“折扣因子”為 α1,α2,α3,α4,α5,證據(jù)的二次修正過程如圖1所示。
圖1 證據(jù)的二次修正組合過程Fig.1 Secondary correction combination process of evidence
采用上述改進方法進行證據(jù)組合的步驟歸納如下:
步驟1融合系統(tǒng)(傳感器)收集到n個證據(jù),計算兩兩間的證據(jù)相似度;
步驟2計算兩兩間的證據(jù)距離,并得到新的沖突系數(shù);
步驟3構(gòu)造沖突方陣并分別計算各個證據(jù)的權(quán)重系數(shù)、折扣因子及衡量各步融合結(jié)果的信任系數(shù);
步驟4采用序貫式進行證據(jù)二次修正組合,得到最終組合結(jié)果。
1)根據(jù)所提的沖突系數(shù)計算例1中所給證據(jù)體的沖突,由于證據(jù)m1最大支持焦元a,證據(jù)m2最大支持焦元c,2條證據(jù)之間存在較大沖突,由上述計算公式計算得到:
則新的沖突系數(shù)為
例1中,2組證據(jù)的沖突非常高,新沖突系數(shù)亦能準確反映出來。
2)根據(jù)所提出的沖突系數(shù)計算例2中所給證據(jù)體的沖突:
則新的沖突系數(shù)為
例2中,2組證據(jù)完全一致,因此證據(jù)間沖突程度應(yīng)為0,所提方法計算結(jié)果并不為0,但相比經(jīng)典沖突系數(shù)更加切合實際。由此可知所提出的沖突系數(shù)能夠較好地反映證據(jù)間的沖突程度。
以文獻[23]給出的4個證據(jù)為例,將傳統(tǒng)D-S組合方法及典型的幾種修改方法的組合結(jié)果進行對比,從而驗證所提方法的有效性。
假設(shè)辨識框架 Θ={A:民航機,B:轟炸機,C:戰(zhàn)斗機},利用開發(fā)的軟件仿真產(chǎn)生4組傳感器數(shù)據(jù),從而構(gòu)成4個不同的證據(jù)體,即
將這 4 個證據(jù)分別用 Dempster,Yager,Murphy,文獻[3],文獻[22],文獻[23]和本文提出的二次修正組合方法進行融合,結(jié)果如表1所示。
表1 多信息源融合結(jié)果Tab.1 Fusion results of multiple information sources
由表1可知,D-S組合規(guī)則無法有效地處理存在高沖突的證據(jù),若存在支持度為0的證據(jù)體,則證據(jù)合成結(jié)果始終是0,而不依賴其他證據(jù)對該命題有多大的支持概率,即該組合規(guī)則存在“一票否決”的弊端而得出錯誤結(jié)論。
Yager的結(jié)果與D-S組合規(guī)則類似,并未克服“一票否決”的弊端,它將導致證據(jù)沖突的那部分信度值完全轉(zhuǎn)移給Θ,證據(jù)數(shù)量的擴大也導致了未知項m(Θ)增大,從而增加了組合結(jié)果的不確定性。
Murphy平均方法的不足在于忽略了證據(jù)之間的相關(guān)性,雖然也能夠正確識別目標A,由于它僅通過對證據(jù)簡單平均來抵消證據(jù)2中 “壞值”0的影響,在系統(tǒng)收集到4個證據(jù)時才識別出目標A,所以收斂速度較慢。
本文提出的二次修正組合方法采用序貫方式實現(xiàn)證據(jù)組合,分別對組合前的證據(jù)及各步組合結(jié)果進行修正,有效地抑制了“壞證據(jù)”對系統(tǒng)最終融合結(jié)果的影響,提高了融合結(jié)果的準確性,避免了由于D-S融合方法改進而導致運算量的增加,使得整體的融合過程具有較小的計算量。
信息融合系統(tǒng),由于受到人為或自然環(huán)境等因素的干擾,使得收集到的證據(jù)之間常常存在較大沖突,這時傳統(tǒng)的Dempster組合規(guī)則失效,無法得到令人滿意且合理的融合結(jié)論,同時經(jīng)典沖突系數(shù)對證據(jù)沖突的描述也并不合理。鑒于此,基于三角模算子及馬氏距離,同時考慮證據(jù)間的非包容性和差異性,提出了新的沖突表示方法,從而有效地度量證據(jù)之間的沖突程度。然后,基于新的沖突表示方法提出了一種新的沖突信息融合方法,實現(xiàn)了融合過程的二次修正,在系統(tǒng)存在高沖突證據(jù)時仍能獲得正確結(jié)論,且收斂速度快,計算量小。
[1]Pan G,Wu L L.An improved D-S evidence combination rule and its application[J].Systems Engineering,2014,32(6):150-153.
[2]江濤.基于D-S證據(jù)理論的信息融合算法[J].計算機科學,2013,40(11A):120-124.
[3]孫全,葉秀清,顧偉康.一種新的基于證據(jù)理論的合成公式[J].電子學報,2000,28(8):117-119.
[4]Yager R.On the Dempster-Shafer framework and new combination rules[J].Information Sciences,1987,41(2):93-137.
[5]張山鷹,潘泉,張洪才.證據(jù)推理沖突問題研究[J].航空學報,2001,22(4):369-372.
[6]張捍東,王翠華,強克坤.基于焦元支持度的合成規(guī)則[J].控制理論與應(yīng)用,2011,28(5):741-744.
[7]Murphy C K.Combining belief functions when evidence onflicts[J].Information Fusion,2001,2(1):91-101.
[8]鄧勇,施文康,朱振福.一種有效處理沖突證據(jù)的組合方法[J].紅外與毫米波學報,2004,23(1):27-32.
[9]孟晨晨,肖建于.D-S證據(jù)組合規(guī)則下的修正系數(shù)的研究[J].計算機工程與應(yīng)用,2016,52(19):63-67.
[10]許將軍.一種新的證據(jù)權(quán)重系數(shù)確定方法[J].計算機科學,2016,43(6A):93-94.
[11]Wang Li,Bai Jing,Zhang Yi-ran.A New Method for Conflict Evidence Processing in D-S Theory[J].Science Technology and Engineering,2013,13(28):8497-8500.
[12]Liu W R.Analyzing the degree of conflict among Belief functions[J].Artificial Intelligence,2006,170(11):909-924.
[13]Lu R,Xu Q J,Zhang J,et al.Combination method of conflicting evidence based on mahalanobis distance[J].Communications Technology,2015,48(13):278-282.
[14]蔣雯,彭進業(yè),鄧勇.一種新的證據(jù)沖突表示方法[J].系統(tǒng)工程與電子技術(shù),2010,32(3):562-565.
[15]蔣雯,張安,鄧勇.基于新的證據(jù)沖突表示的信息融合方法研究[J].西北工業(yè)大學學報,2010,28(1):27-32.
[16]曹潔,李曉瑤.一種新的證據(jù)融合方法及在目標跟蹤中的應(yīng)用[J].小型微型計算機系統(tǒng),2015,36(4):891-896.
[17]Liu Xi-liang,Chen Gua-ming.Improved evidence combination approach[J].Application Research of Computers,2013,30(9):2668-2671.
[18]仇英輝,何霖.基于三角模算子的RPL協(xié)議路由優(yōu)化算法[J].傳感技術(shù)學報,2015,28(12):1861-1866.
[19]王炫名,張曉林,景曉軍.基于改進型的三角模準則的融合濾波算法[J].電子學報,2011,39(6):1327-1330.
[20]魯睿,徐啟建,張杰,等.一種基于馬氏距離的沖突證據(jù)組合方法[J].通信技術(shù),2015,48(3):278-282.
[21]韓德強,韓崇昭,鄧勇,等.基于證據(jù)方差的加權(quán)證據(jù)組合[J].電子學報,2011,34(3A):153-157.
[22]郭華偉,施文康,劉清坤,等.一種新的證據(jù)組合規(guī)則[J].上海交通大學學報,2006,40(11):1895-1900.
[23]呂雪婷,賈瑞生,孫惠惠.證據(jù)沖突下D-S融合算法的改進[J].系統(tǒng)仿真學報,2013,25(3):571-574.