亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于馬爾科夫鏈的平臺生存任務(wù)模型與航路評估

        2018-03-08 08:53:18李小兵周新志
        計算機測量與控制 2018年2期
        關(guān)鍵詞:馬爾科夫航路代價

        李小兵,周新志,寧 芊

        (1.四川大學(xué) 電子信息學(xué)院, 成都 610065; 2.中國電子科技集團公司第29研究所 電子信息控制重點實驗室, 成都 610036)

        0 引言

        在雷達武器威脅環(huán)境里,飛行平臺通常都需要執(zhí)行一些任務(wù),比如偵查敵方雷達部署情況,因此飛行平臺不僅需要關(guān)注自身生存率,同時還要考慮能任務(wù)完成的概率。平臺的生存率定義為無傷害返回的的概率[1],對于如何有效求解航路上飛行平臺的生存率問題,目前的研究還較少,已有的方法主要是直接從平臺與雷達武器的距離關(guān)系模型來建立生存模型,并在此基礎(chǔ)上計算飛行平臺的生存率[2-3]。這種方法只考慮了被發(fā)現(xiàn)和被打擊兩種狀態(tài),并且模型一旦建立就不容易擴展和修改,更重要的是忽略了狀態(tài)之間隨時間的依賴關(guān)系。在任務(wù)方面,目前的研究也主要集中在任務(wù)規(guī)劃方面[4-5],在計算任務(wù)完成率方面,已有的方法也是使用飛行平臺與任務(wù)中心的距離來建立任務(wù)模型,并在此基礎(chǔ)上得到任務(wù)完成的概率。

        傳統(tǒng)方法沒能有效刻畫生存模型和任務(wù)模型,也沒能將生存模型和任務(wù)模型有機地統(tǒng)一起來,并且無法直觀地關(guān)注到平臺能完成任務(wù)且無傷害返回的概率。另外傳統(tǒng)方法不能有效地在生存和任務(wù)之間權(quán)衡,對航路的好壞進行有效評估。近年來,為了突破傳統(tǒng)方法的制約,有些學(xué)者開始嘗試從隨機過程的角度來對飛行平臺的生存和任務(wù)建立模型,其中最有效地便是使用馬爾科夫鏈模型來建立飛行平臺的生存模型。

        基于馬爾科夫鏈的方法,在最初只建立了來兩個狀態(tài)的生存模型[6],后來發(fā)展出了一種五狀態(tài)的生存模型[7-8]?;隈R爾科夫鏈的生存模型能直觀地展現(xiàn),航路上飛行平臺的生存狀態(tài)概率的變化。但是飛行平臺在關(guān)注生存的同時還需要考慮完成任務(wù)的概率,并且還能關(guān)注到不同航路的好壞。為此本文在基于馬爾科夫鏈的生存模型的基礎(chǔ)上加入任務(wù)模型,并建立生存任務(wù)聯(lián)合模型。在生存任務(wù)模型中,能得到無傷害完成任務(wù)的概率計算模型。為了度量航路的好壞,在生存任務(wù)聯(lián)合模型的基礎(chǔ)上,引入生存代價和任務(wù)獎勵,從而得到航路的代價,并以此代價度量航路好壞。

        1 生存任務(wù)模型

        1.1 生存模型

        為了既能體現(xiàn)飛行平臺生存狀態(tài)的真實性和完整性,又能使建模簡單,在此選擇5個生存狀態(tài)。這5個狀態(tài)分別是未被發(fā)現(xiàn)U、被發(fā)現(xiàn)D、被跟蹤T、參與作戰(zhàn)E、被打擊H,通常未被發(fā)現(xiàn)狀態(tài)U作為初始狀態(tài)。H狀態(tài)是吸收態(tài),因為飛行平臺被打擊后會一直處于這個狀態(tài)。生存狀態(tài)之間是隨時間相互依賴的,當平臺被跟蹤之前需先被雷達發(fā)現(xiàn),平臺從被跟蹤到被武器擊中這一過程中還需經(jīng)歷參與作戰(zhàn)這一狀態(tài)。飛行平臺還可以逃離雷達和武器區(qū),逃離時的狀態(tài)也只能是依次進行,從參與作戰(zhàn)狀態(tài)到未被發(fā)現(xiàn)需要依次經(jīng)歷跟蹤和被發(fā)現(xiàn)兩個狀態(tài)。

        刻畫生存狀態(tài)之間的依賴關(guān)系,需要用時間連續(xù)狀態(tài)離散的馬爾科夫鏈{X(t)|t>0},其中X(t)代表平臺在時刻t的生存狀態(tài)。時間連續(xù)狀態(tài)離散的馬爾科夫鏈具有馬爾科夫性,即過程的將來狀態(tài)與過程的歷史狀態(tài)無關(guān),只與過程的現(xiàn)在狀態(tài)有關(guān),其具體定義為式(1):

        P[X(t+Δ)=j|X(t)=i]=λijΔ,

        (1)

        其中:i,j表示生存狀態(tài),P是轉(zhuǎn)移概率,λij為轉(zhuǎn)移強度,Δ為無限小時間。馬爾科夫性與平臺的前后狀態(tài)轉(zhuǎn)移關(guān)系保持了一致。由于馬爾科夫性的存在,因此連續(xù)時間離散狀態(tài)的馬爾科夫鏈可充分刻畫飛行平臺生存狀態(tài)之間的關(guān)系,具體模型如圖1所示。在圖1中,S表示雷達環(huán)境,W表示武器環(huán)境,O表示雷達武器之外的環(huán)境。

        圖1 五狀態(tài)生存模型

        1.2 生存任務(wù)聯(lián)合模型

        平臺完成任務(wù)狀態(tài)也是隨機的,對于完成任務(wù)狀態(tài)的模型如圖2所示。在圖2中,I表示平臺還未完成任務(wù),F(xiàn)表示平臺完成任務(wù)。F是吸收態(tài),因為平臺一旦完成任務(wù)后就會一直在這個狀態(tài),因此不存在從F到I的轉(zhuǎn)移強度。平臺在任務(wù)執(zhí)行區(qū)域M之外一般不可能完成任務(wù),因此在任務(wù)執(zhí)行區(qū)之外λIF=0。

        圖2 任務(wù)模型

        為了能使平臺關(guān)注到完成任務(wù)且無傷害返回的概率psm,為此需要將生存模型和任務(wù)模型聯(lián)合起來,具體聯(lián)合形式如圖3所示。圖3中包含了所有可能存在的聯(lián)合狀態(tài)及狀態(tài)間的轉(zhuǎn)移關(guān)系,總共包含十個狀態(tài),UI、DI、TI、EI和HI分別為未被發(fā)現(xiàn)、被發(fā)現(xiàn)、被跟蹤、參與作戰(zhàn)和被打擊時還未完成任務(wù)的狀態(tài),同樣UF、DF、TF、EF和HF表示為相應(yīng)生存狀態(tài)時已完成任務(wù)的狀態(tài)。在聯(lián)合模型中,狀態(tài)UI一般作為起始狀態(tài)。

        圖3 生存-任務(wù)模型

        在圖3水平方向上,生存狀態(tài)并不取決于是否完成任務(wù),那么此方向的狀態(tài)轉(zhuǎn)移與生存模型里的狀態(tài)轉(zhuǎn)移保持一致。在垂直方向上,完成任務(wù)的概率并不取決于生存狀態(tài),那么此方向的狀態(tài)轉(zhuǎn)移與任務(wù)模型里的狀態(tài)轉(zhuǎn)移保持一致。當平臺處于HI狀態(tài)時仍有機會轉(zhuǎn)移到HF狀態(tài),除非平臺完全被擊毀。于是在生存-任務(wù)模型里,平臺完成任務(wù)且無傷害返回的概率可表達為式(2):

        psm=pUF+pDF+pTF+pEF

        (2)

        1.3 轉(zhuǎn)移強度與環(huán)境

        生存任務(wù)模型中的轉(zhuǎn)移關(guān)系由轉(zhuǎn)移強度λ來刻畫。轉(zhuǎn)移強度由飛行平臺所在的環(huán)境提供,未被標識的轉(zhuǎn)移強度為0,表示此環(huán)境下狀態(tài)轉(zhuǎn)移不可能發(fā)生。不同的環(huán)境提供不同的轉(zhuǎn)移強度。在環(huán)境O里λET>0,λTD>0,λDU>0,其他為0,表示離開雷達武器區(qū)域,朝著更安全的狀態(tài)轉(zhuǎn)移。在環(huán)境O的基礎(chǔ)上,環(huán)境S里增加了λUD>0,λDT>0,表示有被雷達發(fā)現(xiàn)和跟蹤的可能。環(huán)境W在環(huán)境S的基礎(chǔ)上還提供了λTE>0,λEH>0,表示有參與作戰(zhàn)和被打擊的可能。

        狀態(tài)轉(zhuǎn)移強度的大小可由1/τij來衡量。在生存模型中,τij反映了地面雷達武器系統(tǒng)的平均反應(yīng)時間或狀態(tài)切換時間。在任務(wù)模型中,τij表示完成任務(wù)所需的平均時間。雷達武器威脅環(huán)境,提供的轉(zhuǎn)移強度模型使用三種模型[9]中的常數(shù)模型,實際具體的取值應(yīng)由領(lǐng)域?qū)<医o出。

        雷達、武器及任務(wù)的物理模型,可抽象為二維圓域或三維球域,這樣不僅建模簡潔,又不會失去對雷達武器主要性質(zhì)的把握,更多關(guān)于雷達武器的模型可參考一些專家的建議[1]。武器通常被探測雷達包圍,因為武器需要雷達來探測、跟蹤及鎖定飛行目標。當然雷達與雷達以及武器與武器之間還可以相互重疊,以表示雷達之間以及武器之間能相互合作,對于在重疊區(qū)域的轉(zhuǎn)移強度的計算,可使用已有的方法[9]。另外飛行平臺能執(zhí)行任務(wù)的區(qū)域,通常被雷達武器包圍著,這是符合實際情況的。

        2 航路評估

        2.1 狀態(tài)概率計算

        為了能評估航路上飛行平臺每個狀態(tài)概率隨時間的變化,需要求解狀態(tài)概率,連續(xù)時間離散狀態(tài)的馬爾科夫鏈框架為求解狀態(tài)概率提供了解決思路。首先構(gòu)造轉(zhuǎn)移強度矩陣Λ(t),然后通過求解(3)式所示的微分方程,以此得到狀態(tài)概率向量p(t)。

        (3)

        其中狀態(tài)概率向量p(t)的第j個元素為狀態(tài)j的概率pj(t),且狀態(tài)概率向量的初始形式為:

        若以Λij(t)來表示轉(zhuǎn)移強度矩陣Λ(t)第i行第j列的元素,則Λij(t)的具體形式為:

        由于飛行平臺在不同時間可能處于不同的威脅環(huán)境里,因此整個飛行航路上的轉(zhuǎn)移強度矩陣Λ(t)是隨時間變化的。設(shè)威脅環(huán)境k里的轉(zhuǎn)移強度矩陣為Λk,時間長度為tn,因而在航路上Λ(t)的取值為:

        由于生存任務(wù)模型的狀態(tài)只有十個,是有限數(shù)量的,而且Λ(t)在某一時間段里為常矩陣,因此(3)式可用式(4)方法來求解。

        p(tn) =eΛn-1 T·(tn -tn-1 )p(tn-1)

        (4)

        在(4)式中需要求解矩陣指數(shù),對于矩陣Λ的矩陣指數(shù)的求解方法為:

        2.2 航路代價計算

        在得到飛行平臺狀態(tài)概率的基礎(chǔ)上,為了在生存和任務(wù)兩方面度量航路的好壞,在此引入兩類代價,一類是單位時間狀態(tài)保持代價bi,一類是單位時間狀態(tài)轉(zhuǎn)移代價cij。用v(t)表示在時刻t飛行平臺在航路上的期望累積代價,累積代價量化了航路對于飛行平臺在生存和任務(wù)兩方面的好壞。記x(t)=[p(t),v(t)]T,于是有關(guān)期望累積代價的微分方程如式(5)和式(6)所示:

        (5)

        (6)

        式(6)中A(t)是一個矩陣,其具體形式為:

        求解式(6)使用式(7)所示的迭代方法。

        x(tn) =eAn-1 ·(tn -tn-1 )x(tn-1)

        (7)

        代價參數(shù)bi是關(guān)于平臺生存狀態(tài)的代價。bH*=0,因為H是吸收態(tài),當平臺處于此狀態(tài)便不再離開。當平臺處于U狀態(tài)時,這時對于平臺來說是很安全的,因此bU*=0。當平臺處于其他生存狀態(tài)時,應(yīng)當假定bE*≥bT*≥bD*≥0,因為平臺處于狀態(tài)D、T和E時,受到的威脅逐漸增強。代價參數(shù)cij是關(guān)于生存狀態(tài)轉(zhuǎn)移的代價參數(shù),其中cE*,H*≥0,其他生存狀態(tài)轉(zhuǎn)移的代價為0,因為其他生存狀態(tài)轉(zhuǎn)移代價可歸于狀態(tài)代價。對于任務(wù)狀態(tài)轉(zhuǎn)移來說,平臺從未完成任務(wù)轉(zhuǎn)移到完成任務(wù)狀態(tài)的過程,應(yīng)當?shù)玫絛F的獎勵,dF的大小衡量了任務(wù)的重要性。于是航路評估就可以在生存和任務(wù)之間進行權(quán)衡,比如在任務(wù)區(qū),即使生存率會很低,如果任務(wù)很重要,則可能dF>cE*,H*。代價參數(shù)具體描述如式(8)和式(9):

        b=[0,bD*,bT*,bE*,0]

        (8)

        (9)

        3 仿真設(shè)計與結(jié)果分析

        3.1 場景設(shè)置與仿真結(jié)果

        圖4展示了一個二維場景,在此場景中放置了三個雷達和兩個武器,并放置了兩條航路和兩個任務(wù)區(qū),任務(wù)和武器都被雷達覆蓋。兩條航路的起點均為(0,0),終點均為(300,-25),航路2是由航路1通過改變有限個路標點的Y方向的值得到,并以兩條航路中間的公共點作為分界點將航路分成前段和后段。

        圖4 包含航路、雷達武器及任務(wù)的場景

        環(huán)境O、S、W及M中的轉(zhuǎn)移強度設(shè)置如表1所示,平臺生存代價參數(shù)的設(shè)置如表2所示。平臺在0.3個單位時間(min)里以1.2 km的航程速度飛行。仿真結(jié)果中,圖5至圖8分別顯示了平臺在航路1和航路2上狀態(tài)概率隨時間的變化,圖中的曲線代表狀態(tài)概率面積圖的外側(cè)輪廓線。圖9顯示了兩條航路上完成任務(wù)且無傷害返回概率的變化。圖10顯示了完成任務(wù)的獎勵值dF分別取0、50、300和600時兩條航路上的代價變化。

        表1 轉(zhuǎn)移強度設(shè)置

        表2 生存代價參數(shù)設(shè)置

        圖5 航路1有關(guān)任務(wù)未完成狀態(tài)的概率

        圖6 航路1有關(guān)任務(wù)完成狀態(tài)的概率

        圖7 航路2有關(guān)任務(wù)未完成狀態(tài)的概率

        圖8 航路2有關(guān)任務(wù)完成狀態(tài)的概率

        圖9 完成任務(wù)且無傷害返回概率

        圖10 不同dF值時航路1(黑色)和 航路2(灰色)的代價變化

        3.2 結(jié)果分析

        圖5至圖8的狀態(tài)概率變化反映了兩條航路所經(jīng)過的環(huán)境。最開始平臺處于環(huán)境O,這時只有UI狀態(tài),當飛行平臺進入雷達環(huán)境S時,有關(guān)生存狀態(tài)D和T的概率迅速增加,而關(guān)于作戰(zhàn)E和被打擊H狀態(tài)只在平臺進入武器環(huán)境W里發(fā)生。當平臺經(jīng)過任務(wù)區(qū)M時,關(guān)于完成任務(wù)F狀態(tài)的概率開始增加。

        在航路的前一段,航路2比航路1關(guān)于DI和TI的狀態(tài)概率增加得更多。這與航路2的前段經(jīng)過兩雷達的重疊區(qū)相一致,因為在雷達重疊區(qū)具有更強發(fā)現(xiàn)和跟蹤能力。在航路的后一段,雖然航路2經(jīng)過了武器重疊區(qū),但最終航路2與航路1的被打擊時已完成任務(wù)HF狀態(tài)概率相差不大,這與兩條航路后段經(jīng)過相同的任務(wù)區(qū),且兩武器區(qū)有相同的最好武器相一致。

        從任務(wù)狀態(tài)概率來看,在圖6和圖8中,航路2比航路1關(guān)于完成任務(wù)F的狀態(tài)概率多一次增加的過程。這與航路2比航路1在前段多經(jīng)過一個任務(wù)區(qū)相一致。從圖9中的完成任務(wù)且無傷害返回的概率上看,航路2比航路1多一次上升過程,這與航路2的前半段經(jīng)過了一個任務(wù)區(qū)區(qū)相一致。在終點時,航路2的psm明顯大于航路1的psm,從這個角度來說,航路2好于航路1。如果平臺很注重能完成任務(wù)且能無傷害返回,那么此時就可為飛行平臺提供決策支持。

        從psm的角度不能完全衡量航路的好壞,因為不能在任務(wù)和生存之間進行權(quán)衡。圖10顯示了不同dF值時兩條航路累積代價的變化,其中較粗的黑實線是航路2的代價曲線,灰色曲線代表航路1的代價曲線。dF的不同取值衡量了任務(wù)相對生存的重要性。當不考慮任務(wù)只考慮生存時,航路2的累積代價更高,此時航路1優(yōu)于航路2。當dF=50時,航路2與航路1的代價都有所降低,且它們之間的差距在縮小,但航路2的代價依然高于航路1的代價。當dF=300時,兩條航路最終的代價幾乎一樣,此時兩條航路無明顯好壞。當dF=600時,航路2的代價明顯比航路1的代價低,這時航路2反而比航路1更好。

        4 結(jié)論

        本文采用馬爾科夫鏈的方法,將飛行平臺的生存和任務(wù)看作是隨機過程,并分別對生存和任務(wù)來建立模型,然后有效統(tǒng)一生存模型和任務(wù)模型。在生存任務(wù)模型的基礎(chǔ)上,對計算航路代價,并以此代價有效地衡量了航路有關(guān)生存和任務(wù)兩方面的好壞。基于馬爾科夫鏈的方法能直觀地展現(xiàn)了狀態(tài)和航路代價隨時間的變化,也展現(xiàn)了不同航路上能完成任務(wù)且無傷害返回的概率變化,并對航路進行有效評估。狀態(tài)概率、航路代價都可為飛行平臺在生存和任務(wù)兩方面提供決策支持。

        [1] Helldin T,Erlandsson T. Automation guidelines for introducing survivability analysis in future fighter aircraft[A]. Proceedings 28th Congress of International Council of the Aeronautical Sciences[C]. Brisbane,Australia:ICAS,2012:1-10.

        [2] 郭鳳娟,張 安,張耀中,等. 高空無人偵察機生存力仿真研究[J]. 西北工業(yè)大學(xué)學(xué)報,2009,27(6):827-832.

        [3] 李壽安,宋筆鋒,李東霞. 飛機在單個射彈打擊下的生存概率分析[J].哈爾濱工業(yè)大學(xué)學(xué)報,2009,41(3):121-124.

        [4] 蔡凌峰,傅愛萍,成海東. 無人機任務(wù)動態(tài)重規(guī)劃方法[J].指揮信息系統(tǒng)與技術(shù),2013,4(6):31-36,79.

        [5] 羅 賀,秦英祥,王國強,等. 一種無人機偵察能力評估模型[J].火力與控制指揮,2016,41(2):7-12.

        [6] Erlandsson T,Niklasson L. An air-to-ground combat survivability model[J]. Journal of Defense Modeling and Simulation: Applications,Methodology,Technology,2015,12(3):273-287.

        [7] Erlandsson T,Niklasson L. Comparing Air Mission Routes from a Combat Survial Perspective[A]. Proceedings of the 26th International Florida Artificial Intelligence Research Society Conference[C]. Palo Alto,California:AAAI Press,2013:58-63.

        [8] Erlandsson T,Niklasson L. Automatic evaluation of air mission routes with respect to combat survial[J]. Information Fusion,2014,20(11):88-98.

        猜你喜歡
        馬爾科夫航路代價
        基于疊加馬爾科夫鏈的邊坡位移預(yù)測研究
        基于實時航路的PFD和ND的仿真研究
        基于改進的灰色-馬爾科夫模型在風機沉降中的應(yīng)用
        愛的代價
        海峽姐妹(2017年12期)2018-01-31 02:12:22
        代價
        馬爾科夫鏈在教學(xué)評價中的應(yīng)用
        應(yīng)召反潛時無人機監(jiān)聽航路的規(guī)劃
        托勒密世界地圖與新航路的開辟
        成熟的代價
        基于Event改進模型的交叉航路碰撞風險評估
        亚洲av免费不卡在线观看| 最新国产成人在线网站| 色中文字幕视频在线观看| 手机在线观看av资源| 久9re热视频这里只有精品| 国产精品久久久久国产a级| 久久久亚洲精品午夜福利| 国产中文字幕一区二区视频| 亚洲av色欲色欲www| 天躁夜夜躁狼狠躁| 99久久精品国产自在首页| 情头一男一女高冷男女| 中文字幕免费在线观看动作大片| 国产精品美女久久久久| 呦泬泬精品导航| 国产午夜激情视频在线看| 国产精品无码一区二区三级| 8ⅹ8x擦拨擦拨成人免费视频| 精品国产一区二区三区久久女人| 国产黄色一区二区三区,| 国产成人精品亚洲日本在线观看| 亚洲国产成人va在线观看天堂| 粉嫩高中生无码视频在线观看| 蜜桃国产精品视频网站| 亚洲午夜成人精品无码色欲| 黄又色又污又爽又高潮动态图| 中日无码精品一区二区三区| 美艳善良的丝袜高跟美腿| 免费无码毛片一区二区app| 五月婷婷六月激情| 日本一区二区高清在线观看| 中文字幕 亚洲精品 第1页| 日韩电影一区二区三区| 最新手机国产在线小视频| 国产91成人精品高潮综合久久| 风流老熟女一区二区三区| 亚洲人成精品久久久久| 亚洲综合小综合中文字幕| 国模冰莲自慰肥美胞极品人体图 | 国产精品麻豆成人av| 男女射黄视频网站在线免费观看|