李常雙,胡建軍,周飛飛,趙喜慶(軍事交通學(xué)院,天津300161)LI Chang-shuang,HU Jian-jun,ZHOU Fei-fei,ZHAO Xi-qing(Academy of Military Transportation,Tianjin 300161,China)
隨機環(huán)境下鐵路軍事運輸保障作戰(zhàn)模擬決策方法研究
Study on Decision-making in Simulation of Military Railway Transport Guarantee under Stochastic Condition
李常雙,胡建軍,周飛飛,趙喜慶(軍事交通學(xué)院,天津300161)
LI Chang-shuang,HU Jian-jun,ZHOU Fei-fei,ZHAO Xi-qing(Academy of Military Transportation,Tianjin 300161,China)
以博弈論為基礎(chǔ),以戰(zhàn)時鐵路軍事運輸保障為背景,建立了紅藍雙方動態(tài)非接觸對抗的決策模型;針對戰(zhàn)時鐵路軍事運輸保障決策中的隨機問題,提出了天氣影響因子和隨機影響因子,反映戰(zhàn)場隨機環(huán)境對紅藍雙方的影響,并建立了隨機期望值決策模型。通過模擬,合理設(shè)置戰(zhàn)場隨機狀態(tài),客觀分析輸送過程,為戰(zhàn)時鐵路軍事運輸保障決策提供有力的決策支持,方法直觀、有效,具有很好的應(yīng)用前景。
鐵路軍事運輸保障;隨機環(huán)境;決策;博弈論
Abstract:This paper on the basis of game theory,and taking the military railway transport guarantee on war time as the background,we established an opposed dynamic and non-contact decision-making model.Aiming at the problems in military decision-making under stochastic condition in uncertainty, we put forward the factors of weather and stochastic influence, which reflects the influence of stochastic condition on the red and the blue,and establishes stochastic opposed decisionmaking models in anticipant value and in correlative chance way farther.It can be seen from the simulating results that the models can dispose the stochastic status in battlefield reasonably,analyse the transport result impersonally,and offer a powerful decision-making sustaining for military command and control.The proposed method is very practical and effective, and has a good applying future.
Key words:military railway transport guarantee;stochastic condition;decision-making;game theory
Study on Decision-making in Simulation of Military Railway Transport Guarantee under Stochastic Condition
作戰(zhàn)指揮決策是為完成和依據(jù)各種條件而進行的選擇作戰(zhàn)目標和選擇實現(xiàn)目標行動策略的思維活動。其中,每項指揮活動都是一個不確定性的動態(tài)過程,最終的決策效果取決于動態(tài)過程中每一決策階段的局勢都要朝著有利于自己的方向發(fā)展。信息化條件下的戰(zhàn)爭,戰(zhàn)場空間增大,交戰(zhàn)空間減小,前后方的概念日益模糊,因此,鐵路軍事運輸始終在高強度的對抗環(huán)境中進行。此外,由于信息化戰(zhàn)爭的復(fù)雜性、隱蔽性、欺騙性、對抗性越來越凸顯,大量的決策可能在不確定環(huán)境中進行,因此,研究不確定條件下的動態(tài)指揮決策優(yōu)化方法及其應(yīng)用顯得非常重要。針對以上問題,本文以戰(zhàn)時鐵路運輸保障非接觸對抗環(huán)境為背景,在一般博弈論的基礎(chǔ)上,建立了隨機環(huán)境下動態(tài)決策模型,并進行模擬驗證。
設(shè)定戰(zhàn)時鐵路軍事運輸保障作戰(zhàn)模擬的對抗雙方為紅方機動方(記為Y),藍方阻撓方(記為B)。紅方包含多個列車梯隊Yi=(Y1,Y2,…,Ym),主要任務(wù)是在藍方阻撓破壞的情況下選擇最優(yōu)策略,使總延誤時間最?。凰{方包含空中打擊力量Bj=(B1,B2,…,Bq),主要任務(wù)是對紅方機動徑路上的關(guān)鍵點進行打擊以阻撓紅方機動;本文模擬的是運輸過程中的動態(tài)決策方法,因此不考慮裝卸載過程。由于戰(zhàn)時鐵路軍事運輸對抗環(huán)境的特點,機動方與阻撓方?jīng)]有直接的火力交互,雙方的決策收益通過路網(wǎng)空間R=(E,V)反應(yīng)。
基于動態(tài)規(guī)劃的思想,采用模擬的方法將運輸過程按若干時域離散化為K個階段。紅藍雙方及路網(wǎng)的階段狀態(tài)空間模型如下:
式1表示階段k時紅方機動與搶修狀空間,式2表示k階段藍方武器平臺狀態(tài)空間,式3表示路網(wǎng)在階段k節(jié)點與路段狀態(tài)空間。
2.1 隨機環(huán)境影響因子建模
由于軍事運輸過程中的復(fù)雜性、隱蔽性、欺騙性和對抗性,使得獲取信息的難度越來越復(fù)雜,大量的決策均在不確定環(huán)境中進行。同時,眾多的不確定因素對決策的影響是很大的,在眾多不確定因素中,一般的,天氣因素對鐵路運輸?shù)挠绊戄^小,但在戰(zhàn)時軍事運輸中,對藍方的空中打擊和紅方的搶修/搶建影響更為直觀和直接。本文考慮將隨機環(huán)境下的隨機因素劃分為基于Markov chain的隨機天氣模型以及影響雙方?jīng)Q策收益的隨機因素影響因子兩種模型,其中,隨機因素影響因子模型用以反映情報偵察、戰(zhàn)場評估等隨機因素的影響。
2.1.1 基于Markov chain的隨機天氣模型
將輸送模擬過程中的天氣影響程度分為3級:1級、2級、3級,其中1級最好,3級最差。天氣狀態(tài)更新的時間同樣為階段k的時間步長,共有K個更新周期。設(shè)節(jié)點i區(qū)域Ai處在階段k的天氣狀態(tài)為ai()k,狀態(tài)空間為{1,2,3},由于共有N個區(qū)域,可知該天氣模型是一個有4NK種狀態(tài)的馬爾科夫鏈。定義pwij(k)為當(dāng)前階段天氣狀態(tài)i,下個階段變?yōu)閖的轉(zhuǎn)移概率。天氣因素對紅藍雙方的活動影響通常通過定性分析或以經(jīng)驗值進行估計,很難確定準確的分布函數(shù)。本文假設(shè)天氣影響隨機變量ζIa(k)∈(1,+∞)表示階段k在節(jié)點v處天氣狀態(tài)ai(k)對紅藍雙方策略收益的影響程度,則天氣影響因子χIi(k)=pwij(k)·ζIa(k)。
2.1.2 隨機因素影響因子建模
正態(tài)分布函數(shù)常用于描述眾多獨立隨機因素共同作用下的影響,這里設(shè)戰(zhàn)場環(huán)境下情報狀況及戰(zhàn)場態(tài)勢評估等若干隨機因素對雙方策略收益的綜合影響為服從正態(tài)分布N( μ,σ)的隨機變量ξji(k),其中,μ∈[-1,1],σ∈[0,1]。當(dāng)μ∈[-1,0]時,表示作戰(zhàn)平臺受到了隨機環(huán)境的負面影響,決策收益有所減少;當(dāng)μ∈[0,1]時,表示作戰(zhàn)平臺受到了隨機環(huán)境的正面影響,決策收益有所增強。故,正態(tài)分布隨機變量ξji(k),i={1,2,…,n},j={1,2}定義為階段k節(jié)點i處隨機變量對紅藍雙方的影響程度。λji(k)為隨機影響因子,表示戰(zhàn)場隨機影響因子階段k節(jié)點i處對紅藍雙方的影響程度,j={1,2}。為了度量其對各作戰(zhàn)平臺的實際影響,取隨機變量的正弦值,將各隨機變量產(chǎn)生的影響范圍度量在(0,2)之間,有:
2.2 紅方?jīng)Q策目標模型
紅方的決策目標包含機動決策與搶修/搶建模型,由于加入了隨機影響因子,由確定性函數(shù)轉(zhuǎn)變?yōu)椴淮_定性函數(shù),因此,采用期望值算法[1],將目標函數(shù)變?yōu)橄鄬Υ_定性的問題。
2.2.1 基于路網(wǎng)可靠性的紅方機動模型
石玉峰在文獻[2]中提出了基于可靠性的戰(zhàn)時隨機運輸時間的路徑優(yōu)化模型,本文在文獻[2]的基礎(chǔ)上提出建立隨機環(huán)境下的機動模型,將問題轉(zhuǎn)化為多階段離散狀態(tài)下,求置信水平下,任務(wù)完成時間T的悲觀值,即T最小值,得出各階段k所對應(yīng)的最優(yōu)機動路徑。
其中,T為目標函數(shù),即為輸送完成的最小時限,E(T)表示輸送完成的期望時間,E( Tij(k))表示通過節(jié)點i的路徑ij的期望時間,α為T不超過T的置信水平,V為路網(wǎng)的節(jié)點集合,χ1i(k),λ1i(k)分別為階段k時,節(jié)點i處影響紅方的天氣影響因子和隨機環(huán)境影響因子。
2.2.2 搶修/搶建目標模型
符號說明:
qi(k)表示第k階段節(jié)點i可投入的搶修力量。搶修力量包括人員、器材、機械工具等。
Q總表示整個作戰(zhàn)階段可投入的搶修力量總量。
Q作業(yè)面表示節(jié)點i受打擊后,最大作業(yè)面可展開的搶修力量。
q'i(k)表示k階段節(jié)點i可提供的搶修等級,與毀傷等級相對應(yīng)。
Di(k)表示第k階段節(jié)點i的毀傷等級。
其中,式(4)為目標函數(shù),E( Tij(k))為第k階段紅方搶修/搶建策略下經(jīng)過路網(wǎng)中節(jié)點i的徑路期望通過時間;式(5)表示β置信水平下,紅方搶修/搶建策略;式(6)中有:搶修弧ij的通過期望時間(搶修收益):
搶建弧ij的通過期望時間(搶建收益):
T集(k)表示滿足節(jié)點i搶修/搶建等級下的保障力量的最小集結(jié)時間;E (T修(k ))E (T建(k))分別表示搶修/搶建滿足通車條件(平均行駛速度不低于30km/h)的平均期望時間;T(k)T(k)表示通過節(jié)點i的平均通過時修通建通間。
式(7)代表搶修力量約束,式(8)代表作業(yè)條件約束,式(9)代表搶修等級約束。
2.3 藍方阻撓模型的建立
由于戰(zhàn)時鐵路網(wǎng)中影響車流量和通過時間的樞紐站、區(qū)間段上的橋梁、隧道等目標易受打擊,在路網(wǎng)變形,將這些易受打擊破壞的目標轉(zhuǎn)化為節(jié)點,進而考慮路網(wǎng)最短路關(guān)鍵點與關(guān)鍵邊的問題。文獻[3]建立了基于關(guān)鍵點與關(guān)鍵邊算法的藍方阻撓模型,藍方阻撓模型的實質(zhì)在于對路網(wǎng)最短路關(guān)鍵點和關(guān)鍵邊的選擇上,因此路網(wǎng)最短路關(guān)鍵點與關(guān)鍵邊的確定是建立模型的基礎(chǔ)。在此基礎(chǔ)上,引入隨機影響因子,采用期望值[1]算法將模型轉(zhuǎn)化為相對確定性問題。將問題轉(zhuǎn)化為γ置信水平下,藍方選擇打擊當(dāng)前路網(wǎng)上影響紅方輸送的關(guān)鍵節(jié)點,使阻撓紅方機動時間最大。
模型的假設(shè)條件:
①藍方對節(jié)點目標打擊后視為目標毀傷程度劃分為3級:破壞、嚴重破壞、摧毀,對應(yīng)的通過能力分別下降30%、60%、100%;通過能力的下降以通過時間延遲反映。
②路網(wǎng)結(jié)構(gòu)經(jīng)過變形刪除禁止點,并將橋梁等目標表示為節(jié)點形式,根據(jù)假想敵美軍相關(guān)軍事理論,模擬中只考慮打擊路網(wǎng)關(guān)鍵節(jié)點以達到作戰(zhàn)企圖。
建立模型:
圖1 抽象路網(wǎng)
符號定義如下:
V1——原路網(wǎng)最短路集合
V——未被破壞的路網(wǎng)最短路集合
V——藍方路網(wǎng)目標集合
Xi——通過節(jié)點i的列車數(shù)
ti——列車通過節(jié)點i的平均時間
mi——藍方投入到第i個打擊點的打擊力量數(shù)
n——藍方單個打擊力量攜彈單位
pit——第i個節(jié)點的突防概率
pim——藍方對第i個節(jié)點的命中概率
M——藍方可動用的打擊力量
Tg——藍方預(yù)定遲滯時間
Ni——損毀第i個節(jié)點所需彈藥數(shù)
α——藍方可以接受的損失率
3.1 初始條件設(shè)定
圖1為某路網(wǎng)的抽象圖,模擬背景設(shè)定為紅方開始從s點至t點的一次輸送,藍方集結(jié)空中打擊力量,阻撓紅方輸送,對紅方當(dāng)前輸送路網(wǎng)上的關(guān)鍵節(jié)點進行打擊,以達到延遲紅方機動、割裂紅方態(tài)勢部署的目的。表1和表2分別表示不同天氣條件下藍方突防概率和命中率,表3表示節(jié)點i受藍方打擊后,通過節(jié)點i的弧ij滿足最低通行條件的最小增加時間的期望值。
模擬共進行了K步,初始參數(shù)如表中數(shù)值設(shè)定,天氣狀態(tài)和隨機影響因子采用蒙特卡洛方法進行模擬,取第k階段為例,紅方可選策略:A,當(dāng)前路網(wǎng)最短路輸送;B,等待路徑上節(jié)點搶修/搶建;C,選擇繞行徑路;D,選擇其他方式輸送;藍方可選策略:E,打擊當(dāng)前路網(wǎng)上的關(guān)鍵節(jié)點;F,不打擊。
3.2 模擬結(jié)果及分析
表1 藍方突防概率
表2 藍方對節(jié)點i的命中率
表3 通過節(jié)點i的最小增加時間
應(yīng)用Game bit博弈分析工具進行均衡求解。(1)在未考慮天氣影響因素和隨機環(huán)境影響因子的情況下,得到策略均衡點:s*1(k)=(A,A,B,A,A,A,B,A,A),輸送徑路為s-1-4-t;s*2=(F,F,E,F,F,E,F,F,F)。(2)引入隨機影響因子,對決策目標函數(shù)進行蒙特卡洛模擬,得到均衡點s*1(k)=(C,A,A,A,D),輸送徑路s-2-5,變?yōu)槠渌绞捷斔停瑂*2(k)=(F,F,E,F,F)??梢钥吹剑S機環(huán)境的影響對雙方?jīng)Q策的選擇均產(chǎn)生了影響,隨機影響因子對輸送過程產(chǎn)生了不可忽視的影響。
本文以隨機環(huán)境下的鐵路軍事運輸保障為背景,主要研究了以博弈論為基礎(chǔ)的隨機環(huán)境下的鐵路軍事運輸保障決策問題,建立了動態(tài)非直接火力交互對抗的決策模型,并根據(jù)戰(zhàn)場隨機環(huán)境對各參戰(zhàn)平臺的影響,提出了天氣影響因子和隨機影響因子,建立隨機期望值對抗決策模型。模擬結(jié)果表明,隨機影響因子的設(shè)置可以使得鐵路軍事運輸保障作戰(zhàn)模擬更加貼近真實環(huán)境。建立隨機環(huán)境下的紅藍雙方?jīng)Q策模型,分析戰(zhàn)場隨機環(huán)境對鐵路軍事運輸保障指揮決策的影響,為戰(zhàn)時鐵路軍事運輸保障指揮決策提供了有力的輔助決策依據(jù),具有良好的應(yīng)用前景。
[1]劉寶碇,趙瑞清,王綱.不確定規(guī)劃及應(yīng)用[M].北京:清華大學(xué)出版社,2003:61-110.
[2]石玉峰.戰(zhàn)時隨機運輸時間路徑優(yōu)化研究[J].系統(tǒng)工程理論與實踐,2005(4):133-136.
[3]李常雙,李庚.戰(zhàn)時鐵路軍事運輸保障模擬藍方阻撓模型研究[J].軍事交通學(xué)院學(xué)報,2010(5):18-20.
[4]張莉,張安.隨機環(huán)境下編隊協(xié)同對地攻防對抗決策方法分析與研究[J].兵工學(xué)報,2007(10):1229-1233.
[5]戴玲,夏學(xué)知.基于Markov天氣模型的流量管理改航策略[J].艦船電子工程,2007(4):57-59.
[6]A.Nilim,L.El Ghaou,i V.Duong,M.Hansen.Trajectory based air traffic management(tb-atm)under weather uncertainty [C]//In Proc.of the Fourth International Air Traffic Management R&D Seminar ATM,Santa Fe,NewMexico,2001:5-6.
F530
A
1002-3100(2010)10-0106-05
2010-07-06
李常雙(1984-),男,內(nèi)蒙古通遼人,軍事交通學(xué)院研究生管理大隊軍事運籌學(xué)專業(yè)碩士研究生,研究方向:作戰(zhàn)軍交運輸保障模擬、車輛路徑優(yōu)化問題。