李偉湋, 高培雪, 陳 進(jìn), 路玉卿
(南京航空航天大學(xué) a. 航天學(xué)院; b. 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院/人工智能學(xué)院/軟件學(xué)院; c. 高安全系統(tǒng)的軟件開(kāi)發(fā)與驗(yàn)證技術(shù)工信部重點(diǎn)實(shí)驗(yàn)室,南京 210016)
隨著科技發(fā)展,無(wú)人機(jī)作戰(zhàn)成為現(xiàn)代戰(zhàn)爭(zhēng)中不可或缺的一環(huán),已逐步應(yīng)用于戰(zhàn)爭(zhēng)中的偵查、評(píng)估和監(jiān)聽(tīng)等各個(gè)方面.無(wú)人機(jī)態(tài)勢(shì)評(píng)估是指評(píng)估敵我雙方的戰(zhàn)斗力要素,對(duì)整體戰(zhàn)場(chǎng)態(tài)勢(shì)進(jìn)行判斷,幫助飛行員做出正確決策.對(duì)敵機(jī)態(tài)勢(shì)進(jìn)行合理評(píng)估是進(jìn)行火力分配和機(jī)動(dòng)決策的前提,在戰(zhàn)爭(zhēng)中發(fā)揮著關(guān)鍵作用.在評(píng)估過(guò)程中,無(wú)人機(jī)本身動(dòng)力較小,容易受天氣、地形等環(huán)境因素影響.同時(shí),無(wú)人機(jī)控制系統(tǒng)難以自主處理飛行過(guò)程中的突發(fā)事件[1].因此,深入研究無(wú)人機(jī)態(tài)勢(shì)評(píng)估刻不容緩.
近年來(lái),眾多學(xué)者對(duì)無(wú)人機(jī)態(tài)勢(shì)評(píng)估展開(kāi)研究,提出了多種態(tài)勢(shì)評(píng)估方法.較為常見(jiàn)的有以下幾種:文獻(xiàn)[2]提出了一種基于貝葉斯網(wǎng)絡(luò)的態(tài)勢(shì)評(píng)估方法;文獻(xiàn)[3]構(gòu)建云模型得到目標(biāo)威脅評(píng)估云圖,實(shí)現(xiàn)了威脅評(píng)估;文獻(xiàn)[4]為了提高空戰(zhàn)中目標(biāo)威脅評(píng)估模型的精度,構(gòu)建極限學(xué)習(xí)機(jī)來(lái)解決態(tài)勢(shì)評(píng)估問(wèn)題.無(wú)人機(jī)態(tài)勢(shì)評(píng)估是信息融合的過(guò)程,將多種低層次的信息融合為高層次的信息,從而對(duì)目標(biāo)進(jìn)行態(tài)勢(shì)評(píng)估,得到威脅排序結(jié)果.因此,在一些研究中,將無(wú)人機(jī)態(tài)勢(shì)評(píng)估視為一種群體決策[5]或多屬性決策[6]的問(wèn)題.由于作戰(zhàn)環(huán)境日趨復(fù)雜,且無(wú)人機(jī)容易受到環(huán)境影響,導(dǎo)致態(tài)勢(shì)信息具有明顯的不確定性和模糊性.為解決該問(wèn)題,文獻(xiàn)[6]用直覺(jué)模糊集來(lái)處理信息的不確定性,使用隸屬度函數(shù)精確地描述了不確定信息,將其用于評(píng)估空中目標(biāo)威脅程度.文獻(xiàn)[7]采用直覺(jué)模糊熵計(jì)算目標(biāo)屬性權(quán)重,引入直覺(jué)模糊多準(zhǔn)則妥協(xié)解排序(VIKOR)方法用以解決多目標(biāo)威脅評(píng)估問(wèn)題.文獻(xiàn)[5]將群體決策模型應(yīng)用到目標(biāo)威脅評(píng)估上,之后,文獻(xiàn)[8]針對(duì)目標(biāo)威脅評(píng)估只能得到威脅排序需要進(jìn)一步研究是否應(yīng)該攻擊目標(biāo)的問(wèn)題,在直覺(jué)模糊環(huán)境下提出了一種基于三支決策的目標(biāo)威脅評(píng)估算法.同時(shí),文獻(xiàn)[9]將前景理論引入到?jīng)Q策問(wèn)題中,文獻(xiàn)[10]將前景理論運(yùn)用到空戰(zhàn)目標(biāo)威脅評(píng)估中,文獻(xiàn)[11]進(jìn)而提出一種基于前景理論和VIKOR法的威脅評(píng)估方法.
但當(dāng)前的無(wú)人機(jī)態(tài)勢(shì)評(píng)估過(guò)程仍然存在以下兩個(gè)問(wèn)題:其一,當(dāng)前多數(shù)的態(tài)勢(shì)評(píng)估方法只能得到評(píng)估的排序結(jié)果,仍需飛行員主觀地選擇優(yōu)先攻擊的目標(biāo)和數(shù)量,并且飛行員在決策過(guò)程中多為二支決策,即判斷是否對(duì)敵機(jī)進(jìn)行攻擊,對(duì)于中等威脅的目標(biāo),需要更多的信息進(jìn)行判斷,評(píng)估過(guò)程復(fù)雜,容易出現(xiàn)誤判,易導(dǎo)致決策錯(cuò)誤;其二,外界的復(fù)雜環(huán)境會(huì)影響飛行員的個(gè)人偏好,不同的飛行員心理偏好不同,在整個(gè)空戰(zhàn)過(guò)程中,同一飛行員的心理傾向也會(huì)發(fā)生變化,而以往的評(píng)估過(guò)程中沒(méi)有考慮決策者的主觀偏好和風(fēng)險(xiǎn)態(tài)度,不能反映出真實(shí)的作戰(zhàn)場(chǎng)景.
針對(duì)上述問(wèn)題,提出一種基于三支決策和累積前景價(jià)值理論的態(tài)勢(shì)評(píng)估方法.首先利用三支決策模型進(jìn)行態(tài)勢(shì)評(píng)估,該模型在傳統(tǒng)決策問(wèn)題的基礎(chǔ)上,為不確定性結(jié)果增加了延遲決策的選擇,更加符合人的決策認(rèn)知;然后引入累積前景理論體現(xiàn)飛行員偏好的不確定性,在此過(guò)程中使用記分函數(shù)將直覺(jué)模糊數(shù)轉(zhuǎn)換為實(shí)數(shù),從而計(jì)算指標(biāo)平均值,利用指標(biāo)平均值和正負(fù)理想點(diǎn)得到參考點(diǎn);為建立基于累積前景理論的三支決策模型,根據(jù)損失和結(jié)果之間的數(shù)量關(guān)系,得到對(duì)應(yīng)的結(jié)果矩陣,之后通過(guò)比較一個(gè)目標(biāo)的3種累積前景價(jià)值進(jìn)行快速?zèng)Q策.此外,為了考慮不同類型飛行員面對(duì)相同戰(zhàn)場(chǎng)態(tài)勢(shì)時(shí)的區(qū)別,得出與實(shí)戰(zhàn)情景相符的評(píng)估結(jié)果,對(duì)3種類型的飛行員進(jìn)行實(shí)驗(yàn),得到不同的評(píng)估結(jié)果.
設(shè)U是一個(gè)非空論域,則U上的一個(gè)直覺(jué)模糊集可以表示為:A′={〈x,μA(x),vA(x)〉|x∈U},其中,μA(x)為論域中的元素x屬于A′的隸屬度;vA(x)為元素x屬于A′的非隸屬度.μA(x):U→[0, 1]和vA(x):U→[0, 1]是論域上的兩個(gè)映射,對(duì)?x∈U,需滿足以下3個(gè)條件:μA(x)∈[0, 1],vA(x)∈[0, 1]以及μA(x)+vA(x)∈[0,1].定義πA(x)=1-μA(x)-vA(x)為直覺(jué)模糊集A′的猶豫度.
直覺(jué)模糊集中的元素被稱為直覺(jué)模糊數(shù).設(shè)E=(μE,vE)和F=(μF,vF)是兩個(gè)直覺(jué)模糊數(shù),與直覺(jué)模糊集的定義類似,μE、vE和πE分別為直覺(jué)模糊數(shù)E的隸屬度、非隸屬度和猶豫度,μF、vF和πF分別為直覺(jué)模糊數(shù)F的隸屬度、非隸屬度和猶豫度;其中,πE=1-μE-vE,πF=1-μF-vF.常見(jiàn)運(yùn)算為
|πE-πF|)
(1)
S(E)=μE-vE
(2)
式中:d(E,F)為距離函數(shù),用于計(jì)算兩個(gè)直覺(jué)模糊數(shù)之間的距離;S(E)為記分函數(shù).
三支決策理論的基本思想是在實(shí)體評(píng)價(jià)函數(shù)上引入兩個(gè)閾值,并構(gòu)造所需的3個(gè)域,分別為正域、負(fù)域和邊界域,這3個(gè)域可以分別解釋為接受、拒絕和不承諾.根據(jù)貝葉斯決策過(guò)程,決策粗糙集由2個(gè)狀態(tài)和3種行動(dòng)組成[12], 構(gòu)造狀態(tài)集和動(dòng)作集,狀態(tài)集Ω={C,C}表示對(duì)象屬于集合C和不屬于集合C,動(dòng)作集AC={aP,aB,aN},aP、aB和aN分別表示接受、進(jìn)一步研究和拒絕動(dòng)作,下標(biāo)P、B和N分別為對(duì)象x采取接受、進(jìn)一步研究和拒絕動(dòng)作.不同狀態(tài)下執(zhí)行不同的動(dòng)作會(huì)存在不同的損失,對(duì)應(yīng)的損失函數(shù)矩陣如表1所示.其中,λPP、λBP和λNP分別為在狀態(tài)C中的對(duì)象采取接受、進(jìn)一步研究和拒絕動(dòng)作時(shí)的損失;λPN、λBN和λNN分別為不在狀態(tài)C中的對(duì)象采取接受、進(jìn)一步研究和拒絕動(dòng)作時(shí)的損失.同時(shí),存在一個(gè)合理的損失函數(shù)條件:λPP≤λBP≤λNP,λNN≤λBN≤λPN.
表1 損失函數(shù)矩陣Tab.1 Loss function matrix
對(duì)于某一個(gè)對(duì)象x,其在狀態(tài)C中的概率為P(C|x),又稱為條件概率,根據(jù)條件概率大小可得到?jīng)Q策排序結(jié)果.對(duì)象x執(zhí)行不同的動(dòng)作有不同的期望損失,如R(aP|x)為對(duì)象采取接受動(dòng)作時(shí)的期望損失;R(aB|x)為對(duì)象采取進(jìn)一步研究動(dòng)作時(shí)的期望損失,R(aN|x)為對(duì)象采取拒絕動(dòng)作時(shí)的期望損失.通過(guò)比較其執(zhí)行不同動(dòng)作時(shí)的期望損失將對(duì)象劃分到正域、邊界域和負(fù)域中,分別用POS(C)、BND(C)和NEG(C)表示.由此可得決策規(guī)則(P)、(B)、(N)如下:
(P)如果R(aP|x)≤R(aB|x)和R(aP|x)≤R(aN|x),則x∈POS(C).
(B)如果R(aB|x)≤R(aP|x)和R(aB|x)≤R(aN|x),則x∈BND(C).
(N)如果R(aN|x)≤R(aB|x)和R(aN|x)≤R(aP|x),則x∈NEG(C).
1.3.1累積前景理論 Tversky等[13]提出了累積前景理論,其核心為累積前景價(jià)值,它由累積權(quán)重函數(shù)和價(jià)值函數(shù)兩部分組成,假設(shè)共有a1+a2+1個(gè)結(jié)果,記為x=x-a1,x-a1+1, …,xa2,每個(gè)結(jié)果發(fā)生的概率記為p=p-a1,p-a1+1, …,pa2.累積前景價(jià)值為
(3)
式中:πh為累積權(quán)重函數(shù),用來(lái)衡量風(fēng)險(xiǎn)對(duì)決策者的影響;v′(xh)為價(jià)值函數(shù),用來(lái)衡量決策者的主觀感受,其表達(dá)式為
(4)
計(jì)算累積權(quán)重函數(shù)時(shí),首先計(jì)算單個(gè)概率權(quán)重函數(shù).由于人們通常更傾向于去做小概率事件,所以概率權(quán)重函數(shù)為
(5)
(6)
式中:w+(ph)和w-(ph)分別為決策者面對(duì)收益和損失的概率權(quán)重函數(shù);ph為xh的概率;φ和δ分別為風(fēng)險(xiǎn)收益態(tài)度系數(shù)和風(fēng)險(xiǎn)損失態(tài)度系數(shù),經(jīng)典取值為φ=0.61,δ=0.69.
為了對(duì)權(quán)重進(jìn)行累加,將a1+a2+1個(gè)結(jié)果按升序排序?yàn)閤-a1< … πh= (7) 1.3.2改進(jìn)累積前景理論 對(duì)于式(4),一般情況下決策者對(duì)損失更加敏感,但在現(xiàn)實(shí)生活中,也存在決策者對(duì)收益更加敏感的場(chǎng)景,因此引入收益敏感系數(shù)ζ,表達(dá)決策者對(duì)收益的敏感度.同時(shí)擴(kuò)大a和b的取值范圍,將其由前景理論認(rèn)定的 01,分別對(duì)應(yīng)決策者為冒險(xiǎn)型、中間型和保守型,從而根據(jù)決策者的風(fēng)險(xiǎn)類型得出不同的決策結(jié)果.參照文獻(xiàn)[14],改進(jìn)的價(jià)值函數(shù)為 (8) 式中:當(dāng)θ=1,ζ>1時(shí)表示相對(duì)于損失,決策者對(duì)收益更加敏感;當(dāng)θ>1,ζ=1時(shí)表示相對(duì)于收益,決策者對(duì)損失更加敏感. 針對(duì)以往的決策方法認(rèn)為決策者處于完全理性的狀態(tài)并且只能得到威脅排序結(jié)果的問(wèn)題,提出一種基于累積前景理論和三支決策的無(wú)人機(jī)態(tài)勢(shì)威脅評(píng)估方法. 該方法的數(shù)學(xué)描述和實(shí)現(xiàn)過(guò)程如下:假設(shè)敵機(jī)目標(biāo)集合為T={T1,T2, …,Tm},每架敵機(jī)有n個(gè)指標(biāo):A={A1,A2, …,An}.評(píng)估矩陣為Z=(zij)m×n,目標(biāo)為i∈{1, 2, …,m},指標(biāo)為j∈{1, 2, …,n},zij為第i個(gè)目標(biāo)在第j個(gè)指標(biāo)上的值.Z為一個(gè)直覺(jué)模糊矩陣,每個(gè)數(shù)值都是直覺(jué)模糊數(shù),zij=〈μij,vij〉.其中,uij和vij分別為直覺(jué)模糊數(shù)zij的隸屬度和非隸屬度.該方法首先利用直覺(jué)模糊逼近于理想值的排序(TOPSIS)方法計(jì)算每個(gè)目標(biāo)的條件概率,從而得到威脅排序結(jié)果;之后利用結(jié)果矩陣和損失矩陣之間的關(guān)系計(jì)算每個(gè)目標(biāo)的結(jié)果矩陣;最后根據(jù)相關(guān)公式計(jì)算每個(gè)目標(biāo)執(zhí)行不同動(dòng)作時(shí)的累積前景價(jià)值,構(gòu)建新的三支決策規(guī)則進(jìn)行比較,得到威脅分類結(jié)果. 步驟一確定目標(biāo)的正負(fù)理想解. 正負(fù)理想解分別為 2.2.3 營(yíng)養(yǎng)支持 結(jié)核病為全身慢性消耗性疾病。病程長(zhǎng),臨床癥狀重,術(shù)前營(yíng)養(yǎng)狀況差,加之手術(shù)創(chuàng)傷、修復(fù)需要,術(shù)后加強(qiáng)營(yíng)養(yǎng)治療對(duì)患者康復(fù)起著至關(guān)重要的作用。在靜脈輸入適量懸浮紅細(xì)胞、新鮮冰凍血漿、白蛋白、脂肪乳、復(fù)方氨基酸、葡萄糖、維生素和微量元素的同時(shí),還留置鼻胃管,予整蛋白型腸內(nèi)營(yíng)養(yǎng)劑、米湯、果汁等胃腸營(yíng)養(yǎng)。每次鼻飼前先確認(rèn)鼻胃管的深度,回抽胃液無(wú)明顯胃儲(chǔ)留再行鼻飼,鼻飼時(shí)盡量保持半臥位,避免因體位原因?qū)е挛竷?nèi)容物反流而引起誤吸,從而導(dǎo)致肺感染。拔除鼻胃管后鼓勵(lì)并指導(dǎo)患者進(jìn)食高熱量、高蛋白、豐富維生素及礦物質(zhì)飲食,促進(jìn)機(jī)體康復(fù)。 不同類型的指標(biāo)有不同的取值,效益型指標(biāo)是指其值越大結(jié)果越好的指標(biāo),成本型指標(biāo)是指其值越小結(jié)果越好的指標(biāo). 對(duì)于效益型指標(biāo),其正負(fù)理想解分別為 對(duì)于成本型指標(biāo),其正負(fù)理想解分別為 步驟二計(jì)算每個(gè)目標(biāo)的相對(duì)貼近度. 首先,計(jì)算第i個(gè)目標(biāo)到正負(fù)理想點(diǎn)的距離,計(jì)算公式為 (9) (10) 式中:D(Ti,Z+)和D(Ti,Z-)分別為目標(biāo)Ti到正理想解和負(fù)理想解的距離;wj為第j個(gè)指標(biāo)的權(quán)重. 之后,計(jì)算第i個(gè)目標(biāo)的相對(duì)貼近度為 (11) 式中:Pr(C|Ti)為第i個(gè)目標(biāo)在狀態(tài)C中的條件概率;RC(Ti)為第i個(gè)目標(biāo)的相對(duì)貼近度. 結(jié)果矩陣的構(gòu)造方法與三支決策中的損失函數(shù)矩陣類似,矩陣中各元素分別表示在不同狀態(tài)下執(zhí)行3種操作的結(jié)果,矩陣中各元素可以表示為X=[xPPxPNxBPxBNxNPxNN].與損失函數(shù)不同的是,結(jié)果矩陣的值既可以為正也可以為負(fù). 步驟一計(jì)算目標(biāo)在每個(gè)指標(biāo)下的損失函數(shù)矩陣. 指標(biāo)的最大值和最小值分別用zmax和zmin表示.對(duì)于直覺(jué)模糊數(shù)表示的指標(biāo)值,效益型指標(biāo)的最大值和最小值分別為zmax=(1, 0),zmin=(0, 1),成本型指標(biāo)的最大值和最小值分別為zmax=(0, 1),zmin=(1, 0). (12) 步驟二計(jì)算目標(biāo)在每個(gè)指標(biāo)下的結(jié)果矩陣. (13) 步驟三計(jì)算目標(biāo)在多個(gè)指標(biāo)下的綜合結(jié)果矩陣. (14) 步驟一計(jì)算參考點(diǎn). 首先使用記分函數(shù)將模糊矩陣轉(zhuǎn)換為一般矩陣.本文采用經(jīng)典的記分函數(shù),表示為 Sij=μij-vij (15) 式中:Sij為直覺(jué)模糊數(shù)zij的記分函數(shù)值. 之后,求一般矩陣的指標(biāo)平均值: (16) 為避免信息丟失,引入正負(fù)理想點(diǎn)作為另外兩個(gè)參考點(diǎn).同時(shí),在實(shí)際空戰(zhàn)過(guò)程中飛行員的偏好在很大程度上是模糊的,因此本文采用模糊分析法[15]來(lái)確定偏好權(quán)重. 首先根據(jù)決策者對(duì)不同參考點(diǎn)的偏好程度建立模糊矩陣P=[prw]u×u,u為參考點(diǎn)的個(gè)數(shù),具體可表示為 (17) 之后對(duì)P進(jìn)行一致化處理,先按行求和得到qr,再進(jìn)行計(jì)算得到模糊一致矩陣Q=[qrw]u×u,表達(dá)式為 (18) (19) (20) (21) 式中:kr為第r個(gè)參考點(diǎn)的初始偏好權(quán)重;lr為第r個(gè)參考點(diǎn)的偏好權(quán)重. 步驟二計(jì)算每個(gè)目標(biāo)的價(jià)值函數(shù). 以矩陣的形式表示結(jié)果,矩陣內(nèi)每個(gè)結(jié)果對(duì)應(yīng)的價(jià)值函數(shù)為 (22) 步驟三計(jì)算每個(gè)目標(biāo)的累積權(quán)重函數(shù). 首先計(jì)算權(quán)重函數(shù),表達(dá)式為 (23) (24) 式中:w+(pi)和w-(pi)分別為決策者面對(duì)收益和損失的概率權(quán)重函數(shù);pi為第i個(gè)目標(biāo)的概率. 之后,計(jì)算累積權(quán)重函數(shù).價(jià)值函數(shù)單調(diào)遞增,因此對(duì)價(jià)值函數(shù)進(jìn)行排序,獲得每個(gè)動(dòng)作相關(guān)聯(lián)的累積權(quán)重函數(shù)為 (25) (26) 式中:Pr(C|Ti) 為第i個(gè)目標(biāo)Ti屬于狀態(tài)C的概率;Pr(C|Ti)為目標(biāo)Ti不屬于狀態(tài)C的概率;為第i個(gè)目標(biāo)屬于狀態(tài)C時(shí)采取動(dòng)作k的價(jià)值函數(shù);為第i個(gè)目標(biāo)不屬于狀態(tài)C時(shí)采取動(dòng)作k的價(jià)值函數(shù);為Pr(C|Ti)時(shí)第i個(gè)目標(biāo)采取動(dòng)作k的累積權(quán)重函數(shù);為Pr(C|Ti)時(shí)第i個(gè)目標(biāo)采取動(dòng)作k的累積權(quán)重函數(shù);k=P,B,N. 步驟四計(jì)算每個(gè)目標(biāo)在不同操作下的累積前景價(jià)值. 由價(jià)值函數(shù)和累積權(quán)重函數(shù)可以計(jì)算3種不同操作下的累積前景價(jià)值.當(dāng)價(jià)值函數(shù)不同時(shí),累積權(quán)重函數(shù)不同,對(duì)應(yīng)的計(jì)算方法也不同,具體公式為 (27) (28) (29) 式中:Vi(aP|Ti)、Vi(aB|Ti)和Vi(aN|Ti)分別為對(duì)目標(biāo)Ti采取接受、進(jìn)一步研究和拒絕動(dòng)作得到的累積前景價(jià)值. 最后,根據(jù)累積前景價(jià)值最大的原則,每個(gè)目標(biāo)的三支決策規(guī)則為 (P)如果滿足Vi(aP|Ti)≥Vi(aB|Ti)和Vi(aP|Ti)≥Vi(aN|Ti), 則Ti∈POS(C). (B)如果滿足Vi(aB|Ti)≥Vi(aP|Ti)和Vi(aB|Ti)≥Vi(aN|Ti), 則Ti∈BND(C). (N)如果滿足Vi(aN|Ti)≥Vi(aP|Ti)和Vi(aN|Ti)≥Vi(aB|Ti), 則Ti∈NEG(C). 采用文獻(xiàn)[16]中的無(wú)人機(jī)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析,具體數(shù)據(jù)如下:假設(shè)我機(jī)在空戰(zhàn)中遭遇5架敵機(jī),敵機(jī)目標(biāo)集合表示為T={T1,T2, …,T5} ;每架敵機(jī)選取8個(gè)評(píng)估指標(biāo),即類型、距離、角度、速度、高度、干擾能力、穿透能力和防護(hù)等級(jí),評(píng)估指標(biāo)集合表示為A={A1,A2, …,A8},其中,距離、角度和高度為成本型指標(biāo),其余為效益型指標(biāo).歸一化多屬性直覺(jué)模糊信息矩陣Z如表2所示. 表2 歸一化多屬性直覺(jué)模糊信息矩陣Tab.2 Normalized multi-attribute intuitionistic fuzzy evaluation information matrix 通過(guò)公式計(jì)算得到每個(gè)目標(biāo)的條件概率、不同狀態(tài)下的權(quán)重函數(shù)及結(jié)果矩陣,如表3~5所示. 使用記分函數(shù)將直覺(jué)模糊信息矩陣轉(zhuǎn)換為一般矩陣,利用公式計(jì)算得到η=(0.365,0.135, 0.5), 表3 每個(gè)目標(biāo)的條件概率Tab.3 Conditional probability of each target 表4 每個(gè)目標(biāo)的權(quán)重函數(shù)Tab.4 Weight function of each target 表5 每個(gè)目標(biāo)的結(jié)果矩陣Tab.5 Outcome matrix of each target 通過(guò)計(jì)算得到指標(biāo)平均值、正理想點(diǎn)和負(fù)理想點(diǎn),再乘以對(duì)應(yīng)的偏好權(quán)重,即可得到本文需要的參考點(diǎn),具體算式為 0.518 8×0.5=-0.172 6 利用參考點(diǎn)、結(jié)果矩陣計(jì)算得到相應(yīng)的價(jià)值函數(shù),并由價(jià)值函數(shù)和權(quán)重函數(shù)計(jì)算得到相應(yīng)的累積前景價(jià)值,如表6所示.其中,VP、VB和VN分別為目標(biāo)采取接受、進(jìn)一步研究和拒絕動(dòng)作時(shí)的累積前景價(jià)值. 表6 每個(gè)目標(biāo)的累積前景價(jià)值Tab.6 Cumulative prospect value of each target 由表3可知,基于綜合直覺(jué)模糊信息矩陣的態(tài)勢(shì)評(píng)估的排序結(jié)果是T1>T3>T2>T4>T5.由表6可知,基于決策規(guī)則的直覺(jué)模糊信息矩陣的客觀分類結(jié)果是POS(C)={T1},BND(C)={T2,T3},NEG(C)={T4,T5}.這意味著首先應(yīng)該攻擊和干擾T1,不攻擊和干擾T4和T5,需要更多的信息判斷是否要攻擊T2和T3. 3.2.1評(píng)估結(jié)果對(duì)比與分析 為了進(jìn)一步說(shuō)明本方法的有效性和優(yōu)越性,本文與文獻(xiàn)[7-8,16]的決策方法進(jìn)行對(duì)比,簡(jiǎn)要對(duì)4個(gè)方案的評(píng)估結(jié)果進(jìn)行分析.其中,文獻(xiàn)[7]采用直覺(jué)模糊VIKOR方法,文獻(xiàn)[8]采用三支決策的方法,文獻(xiàn)[16]采用直覺(jué)模糊相似度量推理模型(IFSMRM)方法.4種決策方法仿真分析時(shí)使用同一組數(shù)據(jù),決策結(jié)果對(duì)比如表7所示. 表7 實(shí)驗(yàn)結(jié)果對(duì)比Tab.7 Comparison of experimental results 在4種方法的評(píng)估結(jié)果中,本文方法與三支決策方法得到的排序結(jié)果一致,分類結(jié)果有所不同,說(shuō)明決策者的心理態(tài)度會(huì)影響威脅評(píng)估結(jié)果.在戰(zhàn)場(chǎng)中考慮決策者心理具有研究?jī)r(jià)值,驗(yàn)證了本文方法的正確性.本文方法與IFSMRM方法所得結(jié)果在目標(biāo)T1和T3上不一致,與T3相比,T1的速度更快,類型指標(biāo)的值更大,表示作戰(zhàn)能力更強(qiáng),更容易發(fā)起攻擊,因此T1的威脅等級(jí)更高;IFSMRM方法預(yù)先設(shè)定了7個(gè)威脅等級(jí),目標(biāo)T1和T3在相同的威脅等級(jí)中,T2被劃分到下一個(gè)威脅等級(jí)中;T3與T2相比,距離、角度和高度等略小,但T3的類型也略小,表示其作戰(zhàn)能力稍差,因此二者的威脅程度相差不大,本文方法將T2與T3劃分到同一個(gè)區(qū)間是合理的,并且將目標(biāo)劃分到3個(gè)區(qū)間符合人類心理認(rèn)知,驗(yàn)證了本方法的合理性.本文方法與VIKOR方法得到的排序結(jié)果不一致,與T3相比,T1的速度更快,類型指標(biāo)值更大,表示作戰(zhàn)能力更強(qiáng),更容易發(fā)起攻擊,因此T1的威脅等級(jí)更高;與T4相比,T2的速度較小,距離較遠(yuǎn),但其類型指標(biāo)值遠(yuǎn)大于T4,表示其作戰(zhàn)能力遠(yuǎn)強(qiáng)于T4,有能力發(fā)動(dòng)突然襲擊,因此T2的威脅等級(jí)更高,顯然本文方法更符合客觀分析. 與文獻(xiàn)[7]使用的VIKOR方法相比,本文方法得到的威脅評(píng)估結(jié)果更符合實(shí)際認(rèn)知,且能提供客觀分類結(jié)果,更好地為決策者提供決策支持.與文獻(xiàn)[8]僅使用三支決策對(duì)比,兩者使用同樣的方法計(jì)算三支決策的條件概率,三支決策中威脅排序結(jié)果與概率大小保持一致,因此兩種方法得到的排序結(jié)果相同;同時(shí)本文方法將累積前景理論和三支決策相結(jié)合,將決策者的心理考慮到評(píng)估結(jié)果中,不同決策者可以根據(jù)自己的風(fēng)險(xiǎn)偏好選擇偏好權(quán)重,得到不同的參考點(diǎn);同一決策者面對(duì)不同的戰(zhàn)場(chǎng)態(tài)勢(shì),得到不同的參考點(diǎn);由不同的參考點(diǎn)得到不同的分類結(jié)果,符合真實(shí)戰(zhàn)場(chǎng)環(huán)境,解決了以往態(tài)勢(shì)評(píng)估未考慮決策者心理的問(wèn)題.與文獻(xiàn)[16]使用的IFSMRM方法對(duì)比,本文采用三支決策的方法,不僅得到了威脅排序結(jié)果,而且得到了對(duì)目標(biāo)的具體操作,不同域的目標(biāo)有不同的操作,有利于飛行員進(jìn)行快速?zèng)Q策,解決了當(dāng)前決策困難、易產(chǎn)生誤判的問(wèn)題.并且無(wú)需事先設(shè)定威脅等級(jí),可根據(jù)新的三支決策規(guī)則實(shí)時(shí)地做出威脅分類,選擇優(yōu)先作戰(zhàn)目標(biāo). 4種方法的目標(biāo)威脅評(píng)估值如圖1所示.4種方法均通過(guò)比較目標(biāo)威脅值得到威脅排序結(jié)果,即表7中的排序結(jié)果. 圖1 4種方法的目標(biāo)威脅評(píng)估值Fig.1 Threat assessment results of 4 methods 3.2.2復(fù)雜度對(duì)比與分析 根據(jù)4種方法的具體流程,可得其時(shí)間復(fù)雜度均為O(mn).隨機(jī)進(jìn)行10次實(shí)驗(yàn),方法耗時(shí)結(jié)果如圖2所示.在4種方法對(duì)比中,雖然本文方法耗時(shí)較高,但本文方法和其他方法具有相同且較低的時(shí)間復(fù)雜度,耗時(shí)仍然能夠滿足戰(zhàn)場(chǎng)實(shí)時(shí)性要求. 圖2 4種方法的耗時(shí)Fig.2 Time of 4 methods 為了驗(yàn)證不同類型的飛行員在面對(duì)相同的戰(zhàn)場(chǎng)環(huán)境時(shí)會(huì)有不同的態(tài)勢(shì)評(píng)估結(jié)果,采用了3種典型的參數(shù)組合,如表8所示.表8中參數(shù)a=0.37,b=0.59,ζ=1,θ=1.51來(lái)源于文獻(xiàn)[17]中的實(shí)驗(yàn)值;參數(shù)a=1,b=1,ζ=1,θ=2.25以及參數(shù)a=1.21,b=1.21,ζ=1,θ=2.25來(lái)源于文獻(xiàn)[14]中的實(shí)驗(yàn)值;權(quán)重函數(shù)參數(shù)均來(lái)源于文獻(xiàn)[14]中的實(shí)驗(yàn)值. 表8 3種典型的參數(shù)組合Tab.8 3 typical parameter combinations 為了清楚說(shuō)明決策參數(shù)對(duì)目標(biāo)態(tài)勢(shì)評(píng)估的影響,通過(guò)數(shù)值仿真得到了3種類型下的目標(biāo)態(tài)勢(shì)評(píng)估關(guān)系.由表9和表10可知,在3種典型參數(shù)組合情況下,威脅評(píng)估結(jié)果總體比較穩(wěn)定,但是目標(biāo)分類結(jié)果不同.因?yàn)橥{評(píng)估排序結(jié)果與條件概率的排序保持一致,所以不同類型的飛行員只影響分類結(jié)果.首先,冒險(xiǎn)型決策者認(rèn)為目標(biāo)T2和T3都應(yīng)該攻擊;中間型和保守型認(rèn)為目標(biāo)T2和T3需要更多的信息來(lái)判斷是否需要攻擊,說(shuō)明不同類型的飛行員決策結(jié)果不同,受到了飛行員主觀心理因素的影響.其次,中間型和保守型的分類結(jié)果相同,但累積前景價(jià)值不同,保守型的目標(biāo)T4和T5的累積前景價(jià)值更小,說(shuō)明其不想攻擊的意愿更強(qiáng)烈,該決策結(jié)果符合人類認(rèn)知.總體結(jié)果表明,在實(shí)際空戰(zhàn)中要充分考慮飛行員的心理,對(duì)飛行員類型進(jìn)行判斷,從而使態(tài)勢(shì)評(píng)估結(jié)果更符合實(shí)際作戰(zhàn)情況. 表9 3種類型決策者的累積前景價(jià)值 表10 3種類型決策者的結(jié)果Tab.10 Results of 3 types of decision makers 為研究不同參數(shù)取值對(duì)態(tài)勢(shì)評(píng)估結(jié)果的影響情況,分析不同參數(shù)的靈敏度,如損失規(guī)避系數(shù)θ、風(fēng)險(xiǎn)態(tài)度系數(shù)a和b,使用最大累積前景價(jià)值Vmax=max{VP,VB,VN}比較態(tài)勢(shì)評(píng)估結(jié)果.損失規(guī)避系數(shù)θ對(duì)不同目標(biāo)的最大累積前景價(jià)值Vmax的影響如圖3所示. 由圖3可知,隨著損失規(guī)避系數(shù)θ的不斷增加,目標(biāo)T1、T2、T3、T4和T5的最大累積前景價(jià)值均處于下降趨勢(shì),但目標(biāo)所在的域不同,代表其威脅程度也不同.具體而言,隨著θ的增大,目標(biāo)T1仍處于正域,采取攻擊操作的累積前景價(jià)值不斷減小,說(shuō)明目標(biāo)T1的威脅評(píng)估結(jié)果隨θ的增大而減小.隨著θ的增大,目標(biāo)T2和T3從正域過(guò)渡到邊界域,采取不攻擊操作的累積前景價(jià)值不斷減小,說(shuō)明目標(biāo)T2和T3的威脅評(píng)估結(jié)果隨θ的增大而減小.隨著θ的增大,目標(biāo)T4和T5仍處于負(fù)域,采取不攻擊操作的累積前景價(jià)值不斷減小,說(shuō)明目標(biāo)T4和T5的威脅評(píng)估結(jié)果隨θ的增大而增大.綜上說(shuō)明,隨著損失規(guī)避系數(shù)θ的不斷增大,目標(biāo)的威脅評(píng)估結(jié)果也呈現(xiàn)出不同的變化趨勢(shì). 圖3 損失規(guī)避系數(shù)θ擾動(dòng)Fig.3 Perturbation of loss avoidance coefficient θ 圖4為風(fēng)險(xiǎn)態(tài)度系數(shù)a對(duì)不同目標(biāo)的最大累積前景價(jià)值Vmax的影響.由圖4可知,隨著a不斷增加,目標(biāo)T2和T3的累積前景價(jià)值較大值均呈現(xiàn)出先下降后緩慢上升的趨勢(shì);目標(biāo)T1、T4和T5的累積前景價(jià)值較大值均呈現(xiàn)出下降趨勢(shì).隨著a不斷增大,決策者類型從冒險(xiǎn)型不斷向保守型過(guò)渡.在這個(gè)過(guò)程中,目標(biāo)T2和T3從正域過(guò)渡到邊界域,目標(biāo)T4從負(fù)域過(guò)渡到邊界域;目標(biāo)T3、T4和T5的排序發(fā)生微小變化,說(shuō)明不同類型的決策者會(huì)影響排序和分類結(jié)果. 圖4 風(fēng)險(xiǎn)態(tài)度系數(shù)a擾動(dòng)Fig.4 Perturbation of risk-return attitude coefficient a 圖5為風(fēng)險(xiǎn)態(tài)度系數(shù)b對(duì)不同目標(biāo)的最大累積前景價(jià)值Vmax的影響.由圖5可知,隨著b不斷增大,目標(biāo)的累積前景價(jià)值最大值均呈現(xiàn)出上升的趨勢(shì).但目標(biāo)所在的域不同,代表其威脅程度也不同.具體而言,隨著b的增大,決策者類型從冒險(xiǎn)型向保守型不斷過(guò)渡,在這個(gè)過(guò)程中,目標(biāo)T1、T2和T3仍處于正域或邊界域,采取攻擊操作的累積前景價(jià)值不斷增大,說(shuō)明目標(biāo)的威脅評(píng)估結(jié)果隨b的增大而增大;目標(biāo)T4和T5處于負(fù)域,采取不攻擊操作的累積前景價(jià)值不斷增大,說(shuō)明目標(biāo)T4和T5的威脅評(píng)估結(jié)果隨b的增大而減小.綜上說(shuō)明,隨著風(fēng)險(xiǎn)態(tài)度系數(shù)b的不斷增大,目標(biāo)的威脅評(píng)估結(jié)果也呈現(xiàn)出不同的變化趨勢(shì). 圖5 風(fēng)險(xiǎn)態(tài)度系數(shù)b擾動(dòng)Fig.5 Perturbation of risk-return attitude coefficient b 針對(duì)無(wú)人機(jī)態(tài)勢(shì)評(píng)估決策困難及未考慮復(fù)雜外界環(huán)境對(duì)決策者的影響問(wèn)題,提出一種基于累積前景理論的三支決策模型,并據(jù)此進(jìn)行了仿真實(shí)驗(yàn),主要結(jié)論如下: (1) 與傳統(tǒng)的態(tài)勢(shì)評(píng)估方法相比,基于累積前景與三支決策的態(tài)勢(shì)評(píng)估方法在對(duì)目標(biāo)進(jìn)行決策時(shí),能夠使得分類結(jié)果更加合理,有利于飛行員做出快速?zèng)Q策,解決了決策困難的問(wèn)題,更好地滿足戰(zhàn)場(chǎng)快速打擊的需求. (2) 與傳統(tǒng)的三支決策方法相比,本方法在決策過(guò)程中引入了累積前景價(jià)值,不同的決策者有不同的風(fēng)險(xiǎn)偏好,同一決策者在面對(duì)不同戰(zhàn)場(chǎng)態(tài)勢(shì)時(shí)心理也會(huì)發(fā)生變化,從而得到不同的參考點(diǎn),可以反映出決策者的決策偏好和風(fēng)險(xiǎn)態(tài)度,使決策結(jié)果更符合現(xiàn)實(shí)場(chǎng)景. (3) 不同類型的飛行員在面對(duì)相同目標(biāo)時(shí)會(huì)得到不同的態(tài)勢(shì)評(píng)估結(jié)果,表明在實(shí)際空戰(zhàn)中要充分考慮飛行員的心理,對(duì)飛行員類型進(jìn)行判斷,從而使態(tài)勢(shì)評(píng)估結(jié)果更符合實(shí)際作戰(zhàn)情況.2 基于累積前景理論和三支決策的態(tài)勢(shì)評(píng)估方法
2.1 計(jì)算三支決策的條件概率
2.2 計(jì)算結(jié)果矩陣
2.3 計(jì)算每個(gè)目標(biāo)的累積前景價(jià)值
3 仿真及實(shí)驗(yàn)分析
3.1 仿真分析
3.2 實(shí)驗(yàn)對(duì)比與分析
3.3 決策參數(shù)分析
3.4 參數(shù)敏感性分析
4 結(jié)論