劉順利,陳亞生,陳 琳
(1防空兵指揮學院,鄭州 450052;2南京軍區(qū)軍訓和兵種部,南京 210000)
空中目標威脅度一般是指敵方對我方保衛(wèi)目標侵襲成功的可能性及侵襲成功時可能造成的破壞程度。對敵空中目標的威脅度評估和火力單元射擊有利度評估是指揮信息系統(tǒng)區(qū)分兵力、火力的基本依據(jù)。
目前對空中目標威脅度的評估模型較多[1-2],為了使模型在設(shè)定的場合有很強的適應(yīng)能力,必須對一些因素作相應(yīng)簡化,因此限定了模型在其他場合的適用性;加之新空中目標、新戰(zhàn)場情況等的不斷出現(xiàn),因此使得空中目標威脅度評估模型總在不斷研究更新中。Agent[3-4]技術(shù)的發(fā)展為解決模型的適用性提供了有效方法。文中用Agent模型自下而上的建模方式把空中目標威脅度評估劃分為多個具有高度自治能力的Agent實體,通過對這些實體和知識庫的維護,實現(xiàn)空中目標威脅度評估的通用化、智能化,使空中目標威脅度評估更加精確、高效,且能適應(yīng)不同的戰(zhàn)場環(huán)境。
基于Agent的目標威脅度評估模型通過和火力分配系統(tǒng)中其他Agent交互得到威脅度估計因素,并模擬人的思維方式對任務(wù)和進度進行分析,進行威脅度評估。根據(jù)空中目標威脅度評估的特點,建立目標威脅度評估模型體系結(jié)構(gòu)如圖1所示,在動態(tài)環(huán)境中,模型以環(huán)境事件作為Agent反應(yīng)的前提,在目標支配下,利用強化學習方法進行在線學習,產(chǎn)生最優(yōu)動作策略集,也就是空中目標威脅度。
空中目標威脅度評估的Agent模型可分為感知模塊、意圖模塊、執(zhí)行模塊和知識庫模塊。其中:
態(tài)勢感知模塊負責獲取當前環(huán)境以及自身內(nèi)部狀態(tài)的認知,對目標威脅度評估因素和自身任務(wù)、進度的分析報告情況與火力分配系統(tǒng)中其他Agent進行通信和交互;
意圖模塊主要從知識庫中獲取威脅度評估的因素,并根據(jù)空情和影響空中目標威脅度的因素對空中目標威脅度產(chǎn)生認知,同時修正推理過程中相應(yīng)的權(quán)重;
知識庫模塊主要存儲影響空中目標威脅度的因素知識,并通過自身學習改變各因素相應(yīng)權(quán)重;
執(zhí)行模塊將系統(tǒng)對目標威脅度的認知狀態(tài)按照威脅度評估的最優(yōu)化原則生成符合戰(zhàn)場環(huán)境的空中目標威脅度評估策略,并對結(jié)果進行反饋和修正,根據(jù)自身意圖、動作策略以及對當前態(tài)勢的認知采取相應(yīng)動作。
圖1 空中目標威脅度評估的Agent模型體系結(jié)構(gòu)
1)天氣因素。天候?qū)δ繕送{度的影響主要是降雨、降雪及起霧等情況下。
2)被保衛(wèi)目標情況。根據(jù)空襲兵器目標選擇將其分為以下五個方面:領(lǐng)導機構(gòu)與相關(guān)系統(tǒng);關(guān)鍵的生產(chǎn)設(shè)施;與居民日常生產(chǎn)相關(guān)目標,包括供水系統(tǒng),生產(chǎn)用品供應(yīng)等;與防空力量相關(guān)的目標;與輿論相關(guān)的目標。不同的空襲兵器對不同的被保衛(wèi)目標威脅程度不同。
3)目標類型。將來襲目標按轟炸機、殲擊轟炸機、強擊機、武裝直升機、隱形飛機等類型層層細化到具體機型。
4)攜彈類型。目標攜帶彈藥類型不同其威脅度也不相同。
5)目標位置。目標位置包括目標高度、目標距離、目標相對于被保衛(wèi)目標的航路捷徑投影,這些因素都屬于越小威脅度越大的參數(shù),即高度、距離、航路捷徑越小的目標威脅度越大,但都有一個下限值。因此在接收目標位置信息后,可以先行對其它因素加權(quán)求取威脅度。
6)目標速度??罩心繕怂俣却?,則可射擊時間短,其射擊誤差大,目標威脅度大;反之,空中目標速度小,威脅度小。
7)目標架數(shù)??罩心繕思軘?shù)越多,其威脅度越大;反之則越小。
空中目標威脅度評估知識庫中知識為認知模型的知識庫,作為初始知識使用,初始值由專家經(jīng)驗及其它權(quán)威數(shù)據(jù)源得出,知識庫中內(nèi)容還應(yīng)該包括在之后自學過程中產(chǎn)生的新知識。知識庫之間為并行關(guān)系。這里主要構(gòu)建天氣因素、被保衛(wèi)目標類型、空中目標相對位置知識庫。
2.2.1 空中目標在不同天氣條件下威脅度知識庫
空中目標在不同天氣條件下威脅度Wt[i]不同。將能見度較好、不影響空襲兵器作戰(zhàn)效能的天氣條件歸類為Wh1,將降雨、降雪、濃霧等能見度低、影響敵空襲兵器空襲效能的天氣條件歸類為Wh2;根據(jù)敵空襲兵器的不同作戰(zhàn)性能將其分為轟炸機Style1,戰(zhàn)斗機Style2,強擊機Style3,武裝直升機Style4,電子戰(zhàn)飛機Style5,從陸地或海面發(fā)射的巡航導彈Style6。由于目前戰(zhàn)斗機設(shè)計性能差距較大,將機型中具有全天候作戰(zhàn)能力的戰(zhàn)斗機、性能先進載彈量大的轟炸機等加注A,具有隱身性能的飛機加注Y;巡航導彈中為多彈頭的加注D,帶核彈頭的加注H;飛機攜彈種類分為一般對地攻擊炸彈、火箭彈As1,精確制導炸彈或?qū)桝s2,集束炸彈As3,碳纖維彈As4,空對地導彈As5,從空中發(fā)射的巡航導彈為As6,反輻射導彈As7,核彈為As8。其詳細知識庫設(shè)計略。在這里天時、機型和彈藥類型由態(tài)勢感知A-gent中感知,經(jīng)過Agent間通信機制具體將其分類。
2.2.2 空中目標對被保衛(wèi)目標的威脅度知識庫
敵空襲兵器對被保衛(wèi)目標的威脅度Wm[i]各不相同,目標類型根據(jù)敵空襲重點的選擇分為國家領(lǐng)導指揮機構(gòu)Ob1;關(guān)鍵生產(chǎn)設(shè)施Ob2;居民生產(chǎn)設(shè)施Ob3;輿論通信設(shè)施Ob4;地面交通設(shè)施,其中公路、鐵路等地面設(shè)施為Ob5,機場為Ob6;軍事力量平臺,其中指揮機構(gòu)為Ob7,武器平臺為Ob8,雷達系統(tǒng)為Ob9。其詳細知識庫設(shè)計略。
2.2.3 空中目標相對位置威脅度知識庫
空中目標在空中點坐標由空情報知獲得,其相對位置不同,威脅度Wp[i]也不相同。在這里主要考慮空中目標的高度、航路捷徑的影響??紤]這些位置函數(shù)是一種連續(xù)函數(shù),因此,空中目標相對位置威脅度也采用連續(xù)函數(shù)表示,而該連續(xù)函數(shù)的系數(shù)采用知識庫表示。這里首先采用模糊數(shù)學的方法,構(gòu)建威脅度的分布函數(shù),再由分布函數(shù)構(gòu)建出其隸屬函數(shù)。從分布函數(shù)角度而言,各種機型是一樣的,但它們有別于導彈。
1)空中目標在不同高度的威脅度Wh[i]分布如圖2、圖3所示。
圖2 飛機的高度威脅度
圖3 巡航導彈的高度威脅度
圖中:H[i]為敵機相對保衛(wèi)目標的高度,H[i]以百米為單位。根據(jù)現(xiàn)代空襲兵器的戰(zhàn)術(shù)技術(shù)性能,目標高度小于或等于0的可能性較小。模型中,當目標高度小于或等于0時,認為H[i]=0;a、b為系數(shù)。
由圖2和圖3可得高度威脅度Wh[i]為:
2)空中目標航路投影捷徑威脅度Wd[i]的分布如圖4、圖5所示。
圖中:dj[i]為來襲敵機相對保衛(wèi)目標的航路捷徑,以百米為單位;c、d為系數(shù)。
圖4 飛機的航路捷徑威脅度
由圖4和圖5可得航路捷徑威脅度Wd[i]為:
在這里根據(jù)空中目標不同建立其高度和航路捷徑的系數(shù)相關(guān)的知識庫(略),同時在知識庫中加入空中目標的飛行狀態(tài)和航路方向,其中飛行狀態(tài)分為水平飛行Fs1和俯沖Fs2,其中當水平飛行時Fs1取0.3和俯沖時Fs2取0.8;航路方向劃分為臨近Course1和離遠Course2,其中臨近時Course1取1和離遠時Course2?。?。
圖5 巡航導彈的航路捷徑威脅度
知識庫的自學習采用自適應(yīng)神經(jīng)模糊推理系統(tǒng)[5](ANFIS),該系統(tǒng)是一種用來在給定的輸入輸出數(shù)據(jù)中產(chǎn)生模糊規(guī)則的系統(tǒng)方法。這里以空中目標在不同天氣條件下威脅度知識庫為例,說明其工作過程,對其中輸入和輸出作了相應(yīng)的簡化,其工作過程如圖6所示。
第一層是輸入層。其輸入為飛機類型、攜彈類型和天氣情況,輸出為轟炸機(S1)、戰(zhàn)斗機(S2),一般炸彈(As1)、精確制導炸彈(As2),能見度較好(Wh1)、能見度不好(Wh2)。
圖6 空中目標在不同天氣條件下威脅度知識庫學習算法
第二層為模糊化層。該層采用鐘形激活函數(shù)。
第三層為規(guī)則層。本例中共生成8個規(guī)則。
第四層為歸一化層。該層每個神經(jīng)元接收來自規(guī)則層所有神經(jīng)元的輸入,并計算給定規(guī)則的歸一化激活強度。
第五層是逆模糊層。
第六層表示總和神經(jīng)元。
ANFIS處理問題時,沒有必要給出規(guī)則后項參數(shù)的任何先驗知識,ANFIS會學習這些參數(shù)并調(diào)節(jié)成員函數(shù)。ANFIS采用混合學習算法,其學習的過程融合了最小二乘估算法和梯度下降法,可表示為一個P線性方程。
利用ANFIS學習算法,經(jīng)過學習可得到轟炸機攜帶精確制導炸彈在能見度較高的情況下威脅度最大,為0.788,其權(quán)重經(jīng)過學習后為0.7822;而戰(zhàn)斗機攜帶一般炸彈在能見度較低情況下的威脅度較小,為0.213,其權(quán)重經(jīng)過學習后為0.112。
評估空中目標威脅度的Agent學習算法,采用神經(jīng)網(wǎng)絡(luò)方法。首先說明兩點:1)由于在現(xiàn)代反空襲作戰(zhàn)中,敵空襲兵器可以全方位發(fā)起攻擊,而且判定目標威脅度時,空中目標并不處于攻擊段,所以在此模型中暫不考慮空襲兵器主攻方向的因素;2)計算空中目標威脅度時,只考慮一批目標中只有一架飛機或一枚巡航導彈,若需考慮一批目標中有多個空襲兵器,可在一個空中目標的基礎(chǔ)上計算。
圖7 目標威脅度評估
第一層為歸一化層,共取3個節(jié)點,輸入為各種機型在天氣、被保衛(wèi)目標類型及空中目標相對位置的威脅度估計,其輸入由評估因素知識庫輸出值提供;
第二層為BP網(wǎng)絡(luò)輸入層,相應(yīng)也取3個節(jié)點;
第三層為隱層,此處取8個節(jié)點,輸出特性函數(shù)取S型函數(shù);
第四層為輸出層,取1個節(jié)點,輸出特性函數(shù)取S型函數(shù),輸出值即為空中目標對被保衛(wèi)目標的威脅程度,此處采用(0,1)區(qū)間的連續(xù)數(shù)。
設(shè)網(wǎng)絡(luò)中輸入層權(quán)值為ω1mj(m =1,2,3;j=1,2,…,8),輸入層節(jié)點為o1m(m=1,2,3);中間層的權(quán)值為ω2j(j=1,2,…,8),中間層的節(jié)點值為o2j(j=1,2,…,8),中間層的閥門值為θ2j(j=1,2,…,8);輸出層的閥門值為θ3,輸出層的節(jié)點值也即威脅度值為w。則節(jié)點值的數(shù)學表達式為:
威脅度計算主要是用于防空作戰(zhàn)指揮信息系統(tǒng)中對空中目標的威脅度進行排序,從而為防空兵群火力分配提供基本依據(jù)。為了驗證該模型的有效性,本例采用10個訓練樣本(見表1),設(shè)定10個不同種類和不同飛行條件的目標,其期望威脅度值由專家確定。將表1中的樣本值輸入進行BP神經(jīng)網(wǎng)絡(luò)模型的自學習訓練,得出訓練后的權(quán)值和閥門值(見表2)。
表1 樣本數(shù)據(jù)
表2 BP神經(jīng)網(wǎng)絡(luò)模型訓練后的權(quán)值和閥門值
在此選定4個檢驗樣本(見表3)。將表2中的經(jīng)過自學習得出的權(quán)值和閥門值代入BP神經(jīng)網(wǎng)絡(luò)模型,對4個檢驗樣本進行威脅度計算,得出實際輸出威脅度值。該模型的輸出威脅度與期望威脅度排序一致且誤差均小于0.005,從而驗證了該模型的有效性。
表3 檢驗數(shù)據(jù)
Agent技術(shù)應(yīng)用正處于起步階段,對于一些概念和關(guān)鍵技術(shù)的理解還沒有達到共識。由于考慮因素的多樣性、全面性,以及自學習算法的復(fù)雜性等,實際上利用Agent評估空中目標威脅度是非常復(fù)雜的過程,文中重在說明方法和過程,因此對一些情況進行了必要的簡化。
[1] 劉己斌.城市防空作戰(zhàn)指揮自動化系統(tǒng)火力分配研究[D].鄭州:防空兵指揮學院,2001.
[2] 范勇,陳有偉,李為民.彈炮結(jié)合防空武器系統(tǒng)火力分配模型[J].火力與指揮控制,2004,29(3):46-48.
[3] 劉剛.基于智能Agent的動態(tài)協(xié)作任務(wù)求解機制及應(yīng)用研究[D].北京:鐵道科學研究院,2006.
[4] 石純一,張偉.基于Agent的計算[M].北京:清華大學出版社,2007.
[5] [澳大利亞]邁克·耐格納威斯基.人工智能智能系統(tǒng)指南[M].顧力栩,等譯.北京:機械工業(yè)出版社,2007.