李曉晴, 劉 瀛, 包素艷
(1.北京交通大學(xué) 機械與電子控制工程學(xué)院,北京 100044; 2.航天新長征大道科技有限公司,北京 100070;3.北京航天愛銳科技有限責(zé)任公司,北京 100076)
導(dǎo)彈是一種“長期貯存,一次使用”的武器裝備,其健康狀態(tài)通常需要綜合多個參數(shù)進行評定,一旦某一關(guān)鍵部位出現(xiàn)故障,將會給整個系統(tǒng)帶來嚴(yán)重影響,后果不堪設(shè)想。但是測試參數(shù)與導(dǎo)彈健康狀態(tài)之間并不存在明顯的對應(yīng)關(guān)系,所以利用測試參數(shù)評估導(dǎo)彈健康狀態(tài)是一個不確定性推理過程,D-S(Dempster-Shafer)證據(jù)理論可以很好地處理基于多源信息不確定推理的問題,對于發(fā)現(xiàn)潛在故障和優(yōu)化決策等方面具有重要作用。本文針對經(jīng)典D-S證據(jù)理論在數(shù)據(jù)融合過程中存在的問題[1],通過對比現(xiàn)有的改進算法,并在此基礎(chǔ)上做了進一步修正,最后用一個實際案例證明了該算法的有效性。
D-S證據(jù)理論起源于20世紀(jì)60年代,最早是由美國的數(shù)學(xué)教授Dempster提出來的,該理論利用上下限概率完美地解決了多值映射的問題,后來Shafer對該理論做了進一步完善并進行了推廣[2]。經(jīng)典的D-S證據(jù)理論主要包括3個基本內(nèi)容:基本可信度分配函數(shù)m、信度函數(shù)Bel和Dempster合成規(guī)則。
(1) 基本可信度分配函數(shù)。
(2) 信度函數(shù)。
Dempster合成規(guī)則是證據(jù)理論的核心,其將來自不同信息源的獨立證據(jù)進行組合,產(chǎn)生更可靠的信息。假設(shè)Bel1和Bel2是同一識別框架上的兩個可信度函數(shù),m1和m2分別是其對應(yīng)的基本可信度分配函數(shù),則Dempster合成規(guī)則可以表示為
(1)
但是當(dāng)K→1時,即證據(jù)之間的沖突程度較大時,經(jīng)典的D-S證據(jù)理論不再適用。實際上,在評估導(dǎo)彈健康狀態(tài)時,各項測試參數(shù)大多通過傳感器采集,而傳感器采集的信息不乏相互沖突矛盾的,如果直接帶入模型,則會導(dǎo)致結(jié)果分析不準(zhǔn)確,需要對D-S證據(jù)理論進行改進。
針對D-S證據(jù)理論不能合成高沖突證據(jù)的問題,主要有以下兩種改進方法。
(1) 修改證據(jù)源。
該方法的前提是認(rèn)為D-S組合規(guī)則本身沒有問題,但是需要對原始證據(jù)進行處理。Murphy最早提出了加權(quán)平均法[3],首先求出所有證據(jù)的基本概率分配(Basic Probability Assignment,BPA)的算術(shù)平均值,然后再利用經(jīng)典的D-S證據(jù)組合規(guī)則進行n-1次融合,通過對證據(jù)進行簡單的加權(quán)處理可以提高沖突證據(jù)融合結(jié)果的精確性,彌補了經(jīng)典證據(jù)理論組合規(guī)則的不足之處[2]。但是該方法在進行加權(quán)處理時,默認(rèn)各個證據(jù)對結(jié)果的影響是相同的,但實際上各個參數(shù)指標(biāo)所占的權(quán)重并不相同,所以Murphy方法還需進一步改進。鄧勇等[4]在Murphy改進方法的基礎(chǔ)上,引入了一個度量各個證據(jù)體之間相似度的距離函數(shù),可以計算出系統(tǒng)中各個證據(jù)相對于其他證據(jù)的支持度,并將該支持度作為權(quán)重,進行加權(quán)平均后利用D-S組合規(guī)則進行融合,該方法具有較強的抗干擾能力,收斂速度也較快。胡昌華等[5]通過Pignistic變換重新定義了衡量證據(jù)間沖突的標(biāo)準(zhǔn),通過引入證據(jù)重要權(quán)重系數(shù),對沖突概率進行重新分配,也可以有效處理證據(jù)之間的沖突。雖然上述幾種方法中都考慮了各個證據(jù)體之間的關(guān)系,可以在一定程度上改善沖突問題,但是并沒有考慮證據(jù)自身的有效性,對最終的融合結(jié)果也會產(chǎn)生一定影響。
(2) 修改合成規(guī)則。
該方法的前提是認(rèn)為最終融合結(jié)果與實際不符是由于組合規(guī)則的不足引起的。最具有代表性的則是Yager[6]法,他認(rèn)為應(yīng)該將沖突證據(jù)賦給辨識框架中的未知部分。雖然這樣處理在一定程度上可以合成高沖突的證據(jù),但是相當(dāng)于完全否定了沖突證據(jù),當(dāng)有2個及以上的證據(jù)源時,該方法的合成效果并不理想。孫全等[7]則認(rèn)為即使證據(jù)間互相沖突但是仍有部分是可用的,可用程度取決于該證據(jù)的可信度,可以把支持證據(jù)沖突的概率賦給各個命題,但是這種方法的一個明顯錯誤在于作者在求解時把證據(jù)集體的可信度當(dāng)做單個證據(jù)的可信度。李弼程等[8]則在孫全的基礎(chǔ)上,將支持證據(jù)沖突的概率按各個命題的平均支持程度進行加權(quán)分配,進一步改進了組合規(guī)則,即使對于高沖突證據(jù),也可以得到較為理想的結(jié)果。李弼程改進的方法雖然使融合結(jié)果更符合實際,但是忽略了各個證據(jù)的可信度。葉清等[9]在李弼程改進方法的基礎(chǔ)上引入了“證據(jù)折扣率”用來確定各個證據(jù)的權(quán)重,將沖突按照證據(jù)權(quán)重進行分配。潘光等[10]則在此基礎(chǔ)上對D-S組合規(guī)則做了進一步改進,通過證據(jù)距離確定單個證據(jù)的可信度,基于可信度采用加權(quán)平均的方法將證據(jù)沖突概率分配給各個命題,這兩種改進方法都加快了融合結(jié)果向正確目標(biāo)收斂的速度。
綜上所述,對比經(jīng)典D-S證據(jù)理論以及兩種主流的改進算法,不難發(fā)現(xiàn),大多數(shù)學(xué)者都將重心放在了分析證據(jù)之間的關(guān)系上,但是證據(jù)本身的有效性和重要程度卻被忽略了。且經(jīng)大多數(shù)文獻結(jié)果證明,修改證據(jù)源要比修改合成規(guī)則在解決沖突問題上更有效[11]。Haenni[12]從工程、哲學(xué)和數(shù)學(xué)的角度證明了“如果在模型X上使用方法Y得出了一個不合理的結(jié)論Z”時,實際上應(yīng)該是模型X的問題,應(yīng)該修正的是模型本身,即證據(jù)源本身,而不是修改合成規(guī)則。
目前,已有不少學(xué)者將改進的D-S證據(jù)理論應(yīng)用在導(dǎo)彈的健康狀態(tài)評估中,改進方法也大多借鑒以上兩種主流方法。文獻[1]中綜合考慮平均概率和證據(jù)理論,構(gòu)造了一種新的D-S證據(jù)組合規(guī)則,采用平均概率合成沖突證據(jù),用于評估導(dǎo)彈控制系統(tǒng)的完好性,但是在證據(jù)合成時并沒有考慮證據(jù)之間的關(guān)系。文獻[13]中建立了基于改進證據(jù)理論的裝備健康狀態(tài)退化模型,在D-S證據(jù)合成規(guī)則中加入了基本概率賦值的“折扣率”,但其選用的三角型隸屬度函數(shù)過于粗糙,不能很好地表征測試數(shù)據(jù)與健康狀態(tài)之間的關(guān)系;文獻[14]中利用粗糙集結(jié)合修正證據(jù)源的D-S證據(jù)理論建立了導(dǎo)彈故障智能診斷推理模型,雖然能夠減少不確定性對導(dǎo)彈故障智能診斷的不利影響,但是計算量較大,復(fù)雜度較高。
所以本文從實際工程問題出發(fā),基于修正證據(jù)源的改進方法,在文獻[4]的基礎(chǔ)上,對證據(jù)源進行處理,計算各個證據(jù)的權(quán)重,并對證據(jù)的可信度進行修正,提出了一種新的基于D-S證據(jù)理論評估導(dǎo)彈健康狀態(tài)的方法。
本方法的核心思想是在利用D-S組合規(guī)則進行融合之前,首先對各個證據(jù)進行處理,從已有的數(shù)據(jù)中分析各個證據(jù)之間的聯(lián)系以及證據(jù)自身的有效性和可靠性,從而確定每個證據(jù)的最終權(quán)重。一方面,根據(jù)香農(nóng)定理,一個證據(jù)自身包含的不確定信息越多,對決策的影響應(yīng)該越小,權(quán)重就越低;另一方面,如果一個測試指標(biāo)的實際測量值即將超過標(biāo)準(zhǔn)閾值,即導(dǎo)彈的健康狀態(tài)將由擬故障過渡到故障,則在決策時應(yīng)該重點突出狀態(tài)較差的參數(shù),使決策結(jié)果向故障狀態(tài)傾斜,提醒用戶重點關(guān)注該導(dǎo)彈。在此基礎(chǔ)上,本文改進的基于D-S證據(jù)理論評估導(dǎo)彈健康狀態(tài)的方案具體步驟如下。
① 根據(jù)同一時間不同導(dǎo)彈相同指標(biāo)的測量值,利用熵權(quán)法計算出各個指標(biāo)的權(quán)重向量W1。信息熵的定義如下:
(2)
式中:p(xi)表示隨機事件X為xi的概率。
熵權(quán)法主要根據(jù)指標(biāo)的變異性的大小來確定指標(biāo)的客觀權(quán)重。通常來說,如果某個指標(biāo)的信息熵越小,說明該指標(biāo)的變異程度越大,提供的信息量越大,在綜合評價中所占的權(quán)重就越大。假設(shè)有n個指標(biāo),利用熵權(quán)法求得的第i個指標(biāo)的權(quán)重為W1i。
② 以一枚導(dǎo)彈作為分析對象,如果有某個指標(biāo)的測量值超出指標(biāo)閾值范圍,即判定該導(dǎo)彈為故障狀態(tài);若所有測試參數(shù)均在標(biāo)準(zhǔn)閾值范圍內(nèi),則進一步分析其所處的健康狀態(tài)。
③ 首先根據(jù)各個測試指標(biāo)的歷史測試均值,上次非故障值和標(biāo)準(zhǔn)值對測試參數(shù)進行歸一化處理,最后取平均值作為最終歸一化值λ;然后按照最終歸一化值求權(quán)重向量W2,歸一化值越大,權(quán)重越大,目的是突出狀態(tài)較差的參數(shù),權(quán)重計算方法如下所示,則第i個參數(shù)對應(yīng)的權(quán)重為W2i。
(3)
④ 根據(jù)測試參數(shù)的歸一化值,利用合適的嶺形隸屬度函數(shù),求出各個指標(biāo)相對于各個健康狀態(tài)等級的隸屬度,即D-S證據(jù)理論中的BPA。
隸屬度函數(shù)用于表示導(dǎo)彈處于某種健康狀態(tài)的程度高低,取值范圍為[0,1],隸屬度越接近于1,隸屬程度越高,反之越低[15]。傳統(tǒng)的三角隸屬度函數(shù)過于粗糙,由于嶺形分布隸屬度函數(shù)具有主值區(qū)間較寬、過渡帶平緩等特征,具有良好的對稱性、穩(wěn)定性和控制敏感度,可以較好地表征各個健康狀態(tài)之間的不確定關(guān)系[16],所以選用嶺形分布隸屬度函數(shù)對相鄰健康狀態(tài)等級之間的不確定性進行量化分析。嶺形隸屬度分布函數(shù)如下所示:
(4)
⑤ 利用Jousselme距離[17]求出各個證據(jù)(指標(biāo))之間的距離,進而求出每個證據(jù)的可信度。Jousselme距離是Jousselme為了衡量兩個證據(jù)之間的相似性提出的一個距離函數(shù)。假設(shè)m1和m2是辨識框架Θ中的兩個BPA函數(shù),將m1和m2視為行向量,則m1和m2之間的距離可以表示為
(5)
(6)
式中:
(7)
‖m‖2=〈m,m〉
(8)
根據(jù)證據(jù)mi和mj之間的距離可以計算兩者之間的相似度S(mi,mj)為
S(mi,mj)=1-dBPA(mi,mj)
(9)
兩者之間的距離越小,相似性越高。依此類推,對于系統(tǒng)中的任意一個證據(jù)mi,可以求得該證據(jù)與系統(tǒng)中其他證據(jù)的相似度,進而求得該證據(jù)與其他證據(jù)的平均相似度為
(10)
平均相似度越高,說明該證據(jù)與其他證據(jù)的距離越近,獲得其他證據(jù)的支持度越高。根據(jù)系統(tǒng)中所有證據(jù)的平均相似度,可以計算出每個證據(jù)的可信度為
(11)
證據(jù)的可信度越高,其在決策過程中所占的權(quán)重越大。
⑥ 綜合步驟①和步驟③中求得的各個證據(jù)的權(quán)重W1i以及權(quán)重W2i對證據(jù)的可信度Ri進行修正。假設(shè)有n個證據(jù),則第i個證據(jù)的權(quán)重為
(12)
⑦ 基于Murphy改進方法,在BPA中加入各個證據(jù)的權(quán)重,利用D-S組合規(guī)則進行n-1次融合,得出最終結(jié)果,該方法的計算過程如下:
(13)
綜上所述,在導(dǎo)彈健康狀態(tài)評估中,首先在性能指標(biāo)測試參數(shù)的基礎(chǔ)上,對單位不一、閾值各異的測試參數(shù)進行歸一化處理;接著根據(jù)參數(shù)的歸一化值和不確定性求出該參數(shù)的綜合權(quán)重;然后利用Jousselme距離求出該證據(jù)的可信度,并對該證據(jù)的權(quán)重進行修正;最后通過改進的嶺形隸屬度函數(shù)確定各個參數(shù)對各個健康狀態(tài)等級的隸屬度,即該證據(jù)的BPA值,構(gòu)建基于改進的D-S證據(jù)理論的導(dǎo)彈健康狀態(tài)評估模型。流程圖如圖1所示。
圖1 導(dǎo)彈健康狀態(tài)評估流程圖
健康狀態(tài)分級是導(dǎo)彈健康狀態(tài)評估的基礎(chǔ),傳統(tǒng)的導(dǎo)彈健康狀態(tài)分級采用的“是非制”過于粗糙,不能準(zhǔn)確掌握導(dǎo)彈當(dāng)前的健康狀態(tài),本文將導(dǎo)彈的健康狀態(tài)根據(jù)參數(shù)測量值的范圍進一步細(xì)化,如表1所示。
表1 健康狀態(tài)分級
以某型號地空導(dǎo)彈為例,假設(shè)表征其健康狀態(tài)的測試指標(biāo)為P1、P2、P3、P4、P5,在2020年的某次測試中,10枚導(dǎo)彈各個測試指標(biāo)的測試情況如表2所示。
表2 10枚導(dǎo)彈測試參數(shù)列表
如果出現(xiàn)某個測試參數(shù)的實際測量值超出標(biāo)準(zhǔn)閾值范圍,則該設(shè)備的健康狀態(tài)直接被判定為故障狀態(tài)。已知表2中各個測試參數(shù)均在標(biāo)準(zhǔn)閾值范圍內(nèi),利用熵權(quán)法可以得到各個測試參數(shù)指標(biāo)在設(shè)備健康狀態(tài)評估中的權(quán)重向量為W1=[0.2171,0.202,0.2184,0.2184,0.1442]。
以其中一枚導(dǎo)彈為例,5個測試參數(shù)對應(yīng)的本次測試實際值、上次測試非故障值、歷史測試均值以及標(biāo)準(zhǔn)閾值如表3所示。
表3 單枚導(dǎo)彈測試參數(shù)列表
考慮到導(dǎo)彈的健康狀態(tài)是一個隨時間累積的過程,不僅與現(xiàn)在的參數(shù)有關(guān),還與設(shè)備的歷史測試數(shù)據(jù)有關(guān),在進行歸一化處理時,將本次測試數(shù)據(jù)與上次非故障測試數(shù)據(jù)、歷史故障數(shù)據(jù)均值以及標(biāo)準(zhǔn)數(shù)據(jù)分別進行比較,可以更準(zhǔn)確地描述當(dāng)前的健康狀態(tài)。經(jīng)過歸一化處理之后,最終歸一化值為λ=[0.4417,0.4139,0.4033,0.3822,0.3295]。為了突出狀態(tài)較差的參數(shù),得到各個參數(shù)的權(quán)重向量W2=[0.2241,0.21,0.2047,0.194,0.1672],改進的嶺形隸屬度分配函數(shù)如圖2所示,其中顏色重疊區(qū)域代表不確定性區(qū)域,處在該區(qū)域的歸一化值,既隸屬于前一狀態(tài),又隸屬于后一狀態(tài),隸度和為1。
圖2 嶺形分布隸屬度函數(shù)示意圖
利用最終歸一化值,根據(jù)隸屬度分布函數(shù),可以求出各個證據(jù)(指標(biāo))對應(yīng)的BPA,假設(shè)優(yōu)秀、良好、較好和擬故障對應(yīng)的質(zhì)量等級分別為A、B、C、D,測試參數(shù)P1、P2、P3、P4、P5對應(yīng)的BPA為m1、m2、m3、m4、m5,具體數(shù)值如表4所示。
表4 基本概率分配(無沖突)
根據(jù)Jousselme距離可以求出這5個證據(jù)指標(biāo)的可信度分別為:R1=0.2013,R2=0.2094,R3=0.2083,R4=0.2096,R5=0.1714。根據(jù)權(quán)重W1和W2對可信度進行修正,可以得到5個證據(jù)指標(biāo)的最終權(quán)重分別為:ω1=0.2142,ω2=0.2071,ω3=0.2105,ω4=0.2073,ω5=0.1609。
下面將本文提出的方法與D-S經(jīng)典理論、Murphy法改進算法以及文獻[4]算法進行對比,融合結(jié)果如表5所示。
表5 算法融合結(jié)果對比(無沖突)
由表5可知,在獲取的信息源中沒有沖突或沖突較小的情況下,4種方法的最終合成結(jié)果相同。對比相同迭代次數(shù)下,本文的改進方法相比于Murphy改進算法和文獻[4]中的方法收斂速度更快,這是因為在融合過程中,根據(jù)各個指標(biāo)的測試值對證據(jù)的可信度做了進一步修正,加快了向正確結(jié)果的收斂速度,也進一步論證了本文改進算法的正確性。
如果修改表3中的P1本次測試值為0.69,即超出閾值范圍,使測試信息中存在一定程度的沖突。經(jīng)計算,最終歸一化值為:λ=[0.6417,0.4139,0.4033,0.3822,0.3295],根據(jù)歸一化值進一步求得各個參數(shù)權(quán)重:W2=[0.2965,0.1907,0.1858,0.1761,0.1518],根據(jù)嶺形隸屬度函數(shù)可以求得各個證據(jù)對應(yīng)的BPA如表6所示。
表6 基本概率分配(有沖突)
由表6可知,證據(jù)1(m1)提供的信息與其他4個證據(jù)提供的信息存在嚴(yán)重沖突。根據(jù)Jousselme距離可以求出這5個證據(jù)指標(biāo)的可信度為:R1=0.0297,R2=0.2522,R3=0.2505,R4=0.2525,R5=0.2151。根據(jù)權(quán)重W1和W2對可信度進行修正,可以得到5個指標(biāo)的最終權(quán)重分別為:ω1=0.1507,ω2=0.2214,ω3=0.2245,ω4=0.2216,ω5=0.1755。
D-S經(jīng)典理論算法中,由于上述信息中證據(jù)1與其他證據(jù)產(chǎn)生明顯沖突,沖突因子K=1,此時經(jīng)典的證據(jù)理論合成規(guī)則不再適用。對比沖突證據(jù)1的權(quán)重,Murphy算法中的權(quán)重為0.2,默認(rèn)與其他證據(jù)權(quán)重相同;文獻[4]算法中的權(quán)重為0.0297,認(rèn)為其作為沖突證據(jù),可提供信息較少,所占權(quán)重也最??;本文改進算法在文獻[4]的基礎(chǔ)上,對沖突證據(jù)的權(quán)重做了進一步修正,最終權(quán)重為0.1570。下面比較Murphy改進算法、文獻[4]算法以及本文算法在解決合成信息存在沖突時的合成結(jié)果,如表7所示。
表7 算法融合結(jié)果對比(有沖突)
由表7可知,3種方法的最終融合結(jié)果均表示該導(dǎo)彈處于良好狀態(tài),說明該方法同樣適用于處理存在沖突信息的情況。由于原始信息中存在沖突證據(jù),參數(shù)1的實際測量值即將超出標(biāo)準(zhǔn)閾值范圍,雖然導(dǎo)彈整體健康狀態(tài)趨于良好,但是如果某個測試指標(biāo)存在異常,在進行合成時,應(yīng)盡量保留該信息,確保合成結(jié)果的真實有效,則文獻[4]的合成結(jié)果與實際情況存在一定偏差。Murphy方法和本文改進方法的合成結(jié)果均保存了該信息,由于Murphy方法默認(rèn)各個證據(jù)的權(quán)重相等,雖然計算簡單,但是卻忽略了證據(jù)自身的有效性和證據(jù)體之間的聯(lián)系;本文的改進方法不僅保留了證據(jù)自身的信息,且結(jié)合了證據(jù)之間的關(guān)系確定了最終權(quán)重,聚焦速度比Murphy改進算法更快,與此同時又保留了處于較好狀態(tài)的小概率,用戶可以根據(jù)評估結(jié)果合理安排維修保養(yǎng)任務(wù),及時排除安全隱患[13],確保整個設(shè)備系統(tǒng)正常運行。
綜上所述,當(dāng)融合信息中存在一定程度的沖突時,不能盲目全盤否定沖突信息,即沖突證據(jù)也可以提供一部分有效信息,且該證據(jù)所占的權(quán)重與其他證據(jù)相比較大,目的是凸顯狀態(tài)較差的參數(shù),使最終融合結(jié)果既不會產(chǎn)生明顯的偏移,同時又保留沖突證據(jù)所提供的信息。
導(dǎo)彈的健康狀態(tài)評估是制定維護與管理任務(wù)的先決條件,本文改進的算法可以對各個測試指標(biāo)進行綜合評估,給出相對客觀的權(quán)重,由于各種因素的干擾,獲取的信息源中有時會有沖突證據(jù)存在,在利用D-S證據(jù)理論進行融合時,不能全部否定沖突信息,要從證據(jù)自身出發(fā),結(jié)合各個證據(jù)自身的有效性和可靠性對證據(jù)的可信度做進一步修正。經(jīng)論證,提出的改進算法的融合結(jié)果與實際情況相符,且向正確結(jié)果收斂的速度要優(yōu)于Murphy改進算法和文獻[4]中的改進算法,對于導(dǎo)彈健康狀態(tài)的評估更加細(xì)化,對D-S證據(jù)理論在導(dǎo)彈以及其他飛行器中健康評估的應(yīng)用具有一定的參考價值。