胡 濤,王 棟,黃震宇,孫 曜,姜龍亭,2
(1.空軍工程大學(xué)航空工程學(xué)院,西安,710038;2.95974部隊(duì),河北滄州,061000)
合理評(píng)估敵機(jī)威脅大小并排序,是進(jìn)行目標(biāo)分配和機(jī)動(dòng)決策的前提條件[1]。但是,不同的決策者依賴于自身專業(yè)知識(shí),使得威脅評(píng)估結(jié)果各異。
傳統(tǒng)的隨機(jī)決策理論認(rèn)為決策者可以完全獲取決策問題信息且決策者處于完全理性的狀態(tài)[2]。而前景理論認(rèn)為,外界的復(fù)雜環(huán)境會(huì)對(duì)決策者的個(gè)人偏好產(chǎn)生重要影響[3],因此采用價(jià)值函數(shù)和權(quán)重函數(shù)代替隨機(jī)決策理論中的效用函數(shù)和概率函數(shù)[4],可考慮評(píng)價(jià)對(duì)象的不確定性,并且可以反映決策者的主觀偏好和風(fēng)險(xiǎn)態(tài)度[5-6],使得決策過程更加符合空戰(zhàn)實(shí)際環(huán)境和飛行員心理行為。
基于上述分析,本文提出一種基于三參考點(diǎn)前景理論和VIKOR法的空戰(zhàn)威脅評(píng)估模型。首先引入前景理論來體現(xiàn)飛行員偏好的不確定性;針對(duì)主觀賦權(quán)法依賴專家知識(shí)的缺陷,考慮各方案間的獨(dú)立性,建立評(píng)估方案集前景價(jià)值最大化規(guī)劃模型求解指標(biāo)權(quán)重;為了克服僅采用指標(biāo)平均值作為參考點(diǎn)的局限性,避免單參考點(diǎn)帶來的信息損失和決策結(jié)果分辨率下降的問題,參考TOPSIS理論[7],引入正負(fù)理想點(diǎn)作為另外2個(gè)參考點(diǎn);最后,綜合考慮群體價(jià)值和個(gè)體遺憾并反映決策者偏好,采用VIKOR法對(duì)目標(biāo)進(jìn)行威脅排序,使得評(píng)估結(jié)果更加符合決策者認(rèn)知,符合空戰(zhàn)實(shí)際情況。
前景理論考慮了復(fù)雜環(huán)境下的決策者心理特征,通過引入價(jià)值函數(shù)和權(quán)重函數(shù)代替?zhèn)鹘y(tǒng)隨機(jī)決策理論中的效用函數(shù)和概率函數(shù),將決策期望轉(zhuǎn)化為前景價(jià)值[8]。當(dāng)前景價(jià)值為收益時(shí),決策者更傾向于風(fēng)險(xiǎn)規(guī)避,而當(dāng)前景價(jià)值為損失時(shí),決策者更傾向于風(fēng)險(xiǎn)偏好[9]。同時(shí)認(rèn)為決策者對(duì)待同等損失和收益時(shí),對(duì)損失更為敏感。決策問題的收益和損失取決于參考點(diǎn)的選擇[10],體現(xiàn)了決策者的不同偏好。
在前景理論中,前景價(jià)值由價(jià)值函數(shù)v(·)和決策權(quán)重函數(shù)π(·)共同決定。
Vij=∑v(xij)π(p)
(1)
式中:Vij為方案Ai在指標(biāo)Cj下的前景價(jià)值;v(xij)為價(jià)值函數(shù),以參考點(diǎn)作為基準(zhǔn),表征在實(shí)際情況下決策者的收入和損失主觀價(jià)值[3];π(p)為決策權(quán)重函數(shù),表征決策者對(duì)于執(zhí)行方案可能得到的收益或損失的心理預(yù)期。
價(jià)值函數(shù)的表達(dá)式為:
(2)
式中:xij表示決策者所獲得的價(jià)值,xij≥0時(shí),說明決策者獲得收益,xij<0時(shí),說明決策者遭受損失;α和β分別表征在遭受收益和損失時(shí)價(jià)值函數(shù)的發(fā)展趨勢(shì),體現(xiàn)決策者的重視程度,0<α,β<1,當(dāng)α=;β=1時(shí),表示決策者對(duì)風(fēng)險(xiǎn)保持中立態(tài)度;λ表示損失規(guī)避系數(shù),λ>1時(shí)表示面臨相同的收益和損失時(shí),決策者對(duì)于損失更敏感。
權(quán)重函數(shù)的表達(dá)式為:
(3)
式中:π+(p)和π-(p)分別表示決策者對(duì)收益和損失的決策權(quán)重函數(shù);p為指標(biāo)概率,θ和μ分別為決策者的收益偏好程度和損失規(guī)避程度。
根據(jù)文獻(xiàn)[11],一般取α=β=0.88、λ=2.25、θ=0.61、μ=0.69。
在空戰(zhàn)對(duì)抗中,敵我雙方的能力參數(shù)和態(tài)勢(shì)信息是進(jìn)行威脅評(píng)估的重要依據(jù),根據(jù)系統(tǒng)效用理論可知,評(píng)估指標(biāo)應(yīng)當(dāng)具有完備性、獨(dú)立性和最小性等特點(diǎn)[12]。因此威脅評(píng)估指標(biāo)體系應(yīng)既包括空戰(zhàn)能力威脅評(píng)估,又包括空戰(zhàn)態(tài)勢(shì)因素威脅評(píng)估,見圖1。
圖1 威脅評(píng)估指標(biāo)體系
2.1.1 空戰(zhàn)能力威脅評(píng)估
根據(jù)文獻(xiàn)[13],構(gòu)建單機(jī)空戰(zhàn)能力威脅模型:
C=
[lnB+ln(1+∑A1)+ln(1+∑A2)]ε1ε2ε3ε4
(4)
式中:C為戰(zhàn)機(jī)的空戰(zhàn)能力;B為機(jī)動(dòng)能力;A1為火力能力;A2為探測(cè)能力;ε1為生存能力;ε2為操縱能力;ε3為航程能力;ε4為電子對(duì)抗能力。
2.1.2 空戰(zhàn)態(tài)勢(shì)因素威脅評(píng)估
在中遠(yuǎn)距空戰(zhàn)中,主要考慮雙方的相對(duì)角度、飛行速度和相對(duì)距離[14],空戰(zhàn)態(tài)勢(shì)幾何關(guān)系見圖2。
圖2 空戰(zhàn)態(tài)勢(shì)示意圖
圖中B為我機(jī),T為敵機(jī);d為我機(jī)與敵機(jī)之間的距離;vb、vt分別為我機(jī)和敵機(jī)的速度;qb為我機(jī)航向與目標(biāo)線夾角,qt為敵機(jī)航向與目標(biāo)線夾角。設(shè)dm為我機(jī)導(dǎo)彈最大攻擊距離,dmt為敵機(jī)導(dǎo)彈最大攻擊距離,dr為我機(jī)探測(cè)設(shè)備最大跟蹤距離,分別定義角度威脅指數(shù)Ta、速度威脅指數(shù)Tv、距離威脅指數(shù)Td如下:
(5)
(6)
(7)
假設(shè)多屬性決策問題有評(píng)估方案集Ai(i=1,2,…,m),評(píng)估指標(biāo)Cj(j=1,2,…,n),則m個(gè)評(píng)價(jià)方案對(duì)n個(gè)評(píng)價(jià)指標(biāo)的評(píng)價(jià)矩陣為Y=[yij]m×n。
由于所選的評(píng)價(jià)指標(biāo)類型和量綱各不相同,導(dǎo)致數(shù)據(jù)無法直接拿來比較,為了消除不可比性,需要對(duì)指標(biāo)值進(jìn)行規(guī)范化處理,得到規(guī)范化評(píng)估矩陣X=[xij]m×n。規(guī)范化處理方法如下:
效益型指標(biāo):
(8)
成本型指標(biāo):
(9)
固定型指標(biāo):
(10)
式中:δj為固定型指標(biāo)uj的最佳取值。
(11)
(12)
根據(jù)拉格朗日乘數(shù)法對(duì)上述規(guī)劃模型進(jìn)行求解,引入?yún)?shù)δ,有:
(13)
對(duì)ωj和δ分別求偏導(dǎo)并令其為0,有:
(14)
則可以得到各評(píng)估指標(biāo)權(quán)重計(jì)算公式為:
(15)
(16)
在前景理論中,單純以各指標(biāo)平均值作為參考點(diǎn)存在諸多局限[15],因此參考TOPSIS理論,引入正負(fù)理想點(diǎn)作為另外2個(gè)參考點(diǎn),從而避免信息丟失和決策結(jié)果分辨率的下降。
實(shí)際空戰(zhàn)過程中飛行員的偏好在很大程度是模糊的,于是本文采用模糊分析法[16]來確定偏好權(quán)重。
首先根據(jù)決策者對(duì)不同參考點(diǎn)的偏好程度,基于式(17)建立模糊矩陣P=[pij]s×s,然后對(duì)P進(jìn)行一致化處理,根據(jù)式(18)~(19)得到模糊一致矩陣Q=[qij]s×s;再根據(jù)式(20)~(21)確立各偏好權(quán)重為L=(l1,l2,…,ls)。
(17)
(18)
(19)
(20)
(21)
VIKOR法是一種多準(zhǔn)則決策方法,同時(shí)考慮最大化群體效益和最小化個(gè)體遺憾[17],可以平衡群體和個(gè)體之間的關(guān)系。相比TOPSIS法,VIKOR法得到的最好方案是帶有優(yōu)先級(jí)的折衷方案,最接近理想方案[18]。
結(jié)合前景理論,VIKOR法的具體步驟如下:
1)確定綜合前景價(jià)值矩陣的正理想解f+和負(fù)理想解f-:
(22)
(23)
2)計(jì)算評(píng)估方案的群體效益值Si和個(gè)體遺憾度Ri:
(24)
(25)
3)計(jì)算評(píng)估方案的折衷排序值Qi:
(26)
4)根據(jù)Si、Ri和Qi的值對(duì)評(píng)估方案進(jìn)行排序。Qi的值越小,代表目標(biāo)的威脅程度越大,即方案越優(yōu)。
1)根據(jù)式(4)~(7)建立評(píng)估矩陣,并根據(jù)式(8)~(10)對(duì)評(píng)估矩陣進(jìn)行規(guī)范化處理,得到規(guī)范化的評(píng)估矩陣X。
2)根據(jù)式(1)~(3)確定基于3個(gè)參照點(diǎn)的評(píng)估方案Ai在指標(biāo)Cj下的前景價(jià)值,得到前景價(jià)值矩陣Vh(h=1,2,3)。
3)根據(jù)式(17)~(21)計(jì)算決策者對(duì)3個(gè)參考點(diǎn)的偏好權(quán)重L=(l1,l2,l3),分別對(duì)其前景價(jià)值矩陣Vh(h=1,2,3)進(jìn)行加權(quán)求和,得到各方案Ai在各指標(biāo)Cj下的綜合前景價(jià)值矩陣V。
4)根據(jù)式(11)~(16)確定評(píng)估指標(biāo)權(quán)重W=(ω1,ω2,…,ωn)。
5)根據(jù)指標(biāo)權(quán)重W和綜合前景價(jià)值矩陣V,采用VIKOR法對(duì)評(píng)估方案進(jìn)行威脅排序。
假設(shè)我機(jī)在空戰(zhàn)中遭遇敵方6架飛機(jī)(F-16C,F-15E,F-5E各2架),由式(4)確定敵機(jī)空戰(zhàn)能力分別為16.8、19.8和9。敵機(jī)在我機(jī)火控雷達(dá)探測(cè)范圍內(nèi),我機(jī)速度為320 m/s,導(dǎo)彈最大射程為60 km,雷達(dá)的最大探測(cè)距離為120 km。空戰(zhàn)態(tài)勢(shì)如表1所示。
表1 空戰(zhàn)態(tài)勢(shì)信息
根據(jù)式(4)~(10),可得規(guī)范化目標(biāo)屬性矩陣X:
根據(jù)式(1)~(3)確定各參考點(diǎn)前景價(jià)值矩陣Vh(h=1,2,3):
根據(jù)式(17)~(21)計(jì)算決策者對(duì)3個(gè)參考點(diǎn)的偏好權(quán)重L:
加權(quán)求和得到綜合前景價(jià)值矩陣V:
根據(jù)式(11)~(16)確定評(píng)估指標(biāo)權(quán)重W:
根據(jù)綜合前景價(jià)值矩陣V和指標(biāo)權(quán)重W,根據(jù)VIKOR法得到排序結(jié)果,如表2所示。
表2 σ=0.5時(shí)三參考點(diǎn)下決策結(jié)果
根據(jù)表2~5,得到當(dāng)σ=0.5時(shí),基于三參考點(diǎn)和其他3種單參考點(diǎn)決策結(jié)果的一個(gè)綜合對(duì)比,如表6和圖3。
表3 σ=0.5時(shí)指標(biāo)平均值參考點(diǎn)下決策結(jié)果
表4 σ=0.5時(shí)正理想點(diǎn)參考點(diǎn)下決策結(jié)果
表5 σ=0.5時(shí)負(fù)理想點(diǎn)參考點(diǎn)下決策結(jié)果
表6 σ=0.5時(shí)4種參考點(diǎn)下決策結(jié)果對(duì)比
圖3 4種參考點(diǎn)下目標(biāo)威脅大小對(duì)比
從表6和圖3可以看出,本文所提的三參考點(diǎn)決策模型和其他單參考點(diǎn)決策模型具有相似的發(fā)展趨勢(shì),且威脅評(píng)估排序結(jié)果基本一致,這反映了三參考點(diǎn)決策模型的穩(wěn)定性。
同時(shí),從威脅排序結(jié)果來看,目標(biāo)4和目標(biāo)6的威脅較大,其中目標(biāo)4的威脅最大,在各種參考點(diǎn)情況下威脅排序都是第一;而目標(biāo)2和目標(biāo)5的威脅較小。本文提出的三參考點(diǎn)決策模型和其他參考點(diǎn)模型結(jié)果存在差異,主要是因?yàn)椋?/p>
1)相比單參考點(diǎn)模型,三參考點(diǎn)決策模型能夠充分體現(xiàn)決策者偏好,并從數(shù)據(jù)的整體分布趨勢(shì)出發(fā),考慮正負(fù)理想點(diǎn)等低概率事件,從而避免了單參考點(diǎn)導(dǎo)致的決策信息損失和決策結(jié)果分辨率下降等問題。
2)VIKOR法在決策過程中沒有考慮決策者的偏好變動(dòng),導(dǎo)致實(shí)際中由于決策者對(duì)個(gè)體遺憾和群體價(jià)值的偏好不同而使決策結(jié)果產(chǎn)生變動(dòng),而三參考點(diǎn)決策模型在構(gòu)建過程中就充分考慮了決策者偏好變動(dòng)。
為了更好體現(xiàn)三參考點(diǎn)決策模型相比單參考點(diǎn)決策模型在評(píng)估目標(biāo)威脅區(qū)分度方面的優(yōu)越性,將4種情形下得到的折衷排序值按照從小到大的順序分別進(jìn)行排列,再將順序折衷排序值兩兩相鄰作差,得到順序折衷排序值差值,并取折衷系數(shù)σ=0.25、0.5、0.75,結(jié)果見圖4和表7,算法編號(hào)1~4分別代表三參考點(diǎn)、指標(biāo)平均值參考點(diǎn)、正理想點(diǎn)參考點(diǎn)、負(fù)理想點(diǎn)參考點(diǎn)決策模型。
從圖4和表7可知,本文所提的三參考點(diǎn)決策模型在計(jì)算折衷排序值時(shí),順序最小折衷排序值差值的數(shù)值最大,順序折衷排序值均值的數(shù)值最大,能夠更好體現(xiàn)目標(biāo)威脅區(qū)分度,對(duì)目標(biāo)威脅進(jìn)行合理評(píng)估及排序。
圖4 4種參考點(diǎn)下順序多準(zhǔn)則折衷排序值差值
表7 4種參考點(diǎn)下目標(biāo)威脅區(qū)分度比較
為了分析折衷系數(shù)σ在考慮群體價(jià)值和個(gè)體遺憾時(shí)對(duì)威脅評(píng)估結(jié)果的影響,將σ∈[0,1]以0.1為間隔,取11次值,通過各參考點(diǎn)決策模型得到威脅評(píng)估結(jié)果進(jìn)行比較,其中排序等級(jí)1~6表示6個(gè)目標(biāo)威脅由最大到最小,結(jié)果見圖5。
圖5 不同折衷系數(shù)下的目標(biāo)威脅排序
由圖5可知,在不同的折衷系數(shù)σ下,基于三參考點(diǎn)決策模型的6個(gè)目標(biāo)威脅排序值基本沒有發(fā)生變化,只有當(dāng)σ=0.1和0.2時(shí),目標(biāo)6的威脅超過了目標(biāo)4;當(dāng)σ≥0.2,目標(biāo)4的威脅超過了目標(biāo)6;基于正理想點(diǎn)參考點(diǎn)的決策結(jié)果變化不大,其結(jié)果變化幅度超過了三參考點(diǎn)決策模型;而基于指標(biāo)平均值參考點(diǎn)和負(fù)理想點(diǎn)參考點(diǎn)的目標(biāo)威脅排序結(jié)果發(fā)生較大偏差。出現(xiàn)上述現(xiàn)象是因?yàn)樵诳紤]不同的折衷系數(shù)σ時(shí),決策者對(duì)于群體和個(gè)體的偏好不同,評(píng)估結(jié)果自然會(huì)存在一定的區(qū)別。而三參考點(diǎn)決策模型能夠充分體現(xiàn)決策者對(duì)于個(gè)體和群體的偏好差異,在模型的構(gòu)建過程中就予以充分考慮,因此模型穩(wěn)定性較強(qiáng)。
針對(duì)當(dāng)前復(fù)雜環(huán)境下空戰(zhàn)威脅評(píng)估未考慮決策者的認(rèn)知局限和決策偏好受個(gè)人知識(shí)背景的影響,以及沒有綜合權(quán)衡單個(gè)目標(biāo)和目標(biāo)群體之間的威脅大小的問題,構(gòu)建基于三參考點(diǎn)的前景理論和VIKOR法的威脅評(píng)估模型,通過仿真驗(yàn)證,可以得出以下結(jié)論:
1)采用基于三參考點(diǎn)的前景理論決策模型能夠減少由于單一參考點(diǎn)產(chǎn)生的決策信息損失和決策結(jié)果分辨率下降的問題,決策結(jié)果區(qū)分度更大。
2)基于前景理論的VIKOR法決策模型,能夠克服傳統(tǒng)VIKOR法沒有考慮決策者偏好變動(dòng)的局限,使得決策更加合理,決策結(jié)果穩(wěn)定性更好。采用VIKOR法進(jìn)行目標(biāo)威脅排序,能夠綜合考慮個(gè)體遺憾和群體價(jià)值,使得威脅排序更加合理。
3)在實(shí)際空戰(zhàn)中,參考點(diǎn)的選擇也與雙方的作戰(zhàn)意圖相關(guān),下一步需要研究雙方作戰(zhàn)意圖對(duì)參考點(diǎn)選取的影響,并針對(duì)參數(shù)取值進(jìn)行研究。