王鵬 彭琿 薛芳俠 許一男
摘要:針對(duì)當(dāng)前CGF行為建模時(shí)存在的決策過程過于呆板和教條化、仿真實(shí)體逼真度存在缺陷、同一仿真實(shí)體建立不同決策模型時(shí)采用的方法過于單一等問題,對(duì)行為建模技術(shù)進(jìn)行了研究,建立了自行高炮CGF的戰(zhàn)術(shù)規(guī)則庫,重點(diǎn)研究如何應(yīng)用基于規(guī)則的專家系統(tǒng)對(duì)自行高炮CGF人類行為模型進(jìn)行開發(fā),最后基于此方法對(duì)車長的行為模型進(jìn)行了設(shè)計(jì)實(shí)現(xiàn)。該方法避免了對(duì)復(fù)雜的乘員決策行為進(jìn)行分析和建模的過程,實(shí)時(shí)性好,對(duì)今后相關(guān)的研究工作具有較好的參考價(jià)值。
關(guān)鍵詞:計(jì)算機(jī)生成兵力; 自行高炮; 行為建模; 規(guī)則庫; 專家系統(tǒng)
中圖分類號(hào):TN911?34; TP391.9 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004?373X(2013)02?0100?04
計(jì)算機(jī)生成兵力(Computer Generated Forces,CGF)是能在基于分布交互仿真技術(shù)構(gòu)建的虛擬戰(zhàn)場(chǎng)環(huán)境中,產(chǎn)生一定自治性智能行為實(shí)體的仿真軟件[1],如何有效地對(duì)自行高炮CGF實(shí)體對(duì)象及其行為進(jìn)行建模,是自行高炮CGF研究的重要內(nèi)容。CGF的行為建模分為物理行為建模和人類行為建模,其中人類行為建模是CGF行為建模的重點(diǎn)[2]。本文將論述當(dāng)前CGF人類行為建模存在的問題,針對(duì)這些問題給出行為建模方法,重點(diǎn)研究如何應(yīng)用這些方法對(duì)自行高炮CGF人類行為模型進(jìn)行開發(fā)。
1 CGF人類行為建模問題分析
人類行為建模是CGF的核心技術(shù)之一,按照DoD的定義,它是指“對(duì)在軍事仿真中需要表示的人的行為或表現(xiàn)進(jìn)行建模”[3]。CGF系統(tǒng)中許多軍事仿真中的合成兵力采用相對(duì)原始的人類模型來構(gòu)造,其中決策行為往往采用一種粗糙、脆弱的方式來表示,這使得所產(chǎn)生的虛擬兵力表現(xiàn)出不切實(shí)際的行為和過分簡(jiǎn)單化的反應(yīng),不符合真實(shí)的戰(zhàn)斗員和分隊(duì)的行為[4]。當(dāng)前CGF系統(tǒng)中使用的決策方法存在的主要問題有:
(1)決策過程過于呆板和教條化。決策行為缺乏可變性、柔順性和適應(yīng)性[5]。
(2)仿真實(shí)體逼真度存在缺陷。很多仿真實(shí)體所使用的決策模型都沒有考慮到個(gè)體的疲勞程度、作戰(zhàn)經(jīng)驗(yàn)、情緒沖動(dòng)、時(shí)間壓力以及作戰(zhàn)技能水平等因素對(duì)決策結(jié)果產(chǎn)生的影響,并且這些因素對(duì)于每個(gè)仿真實(shí)體所產(chǎn)生的影響應(yīng)當(dāng)有所不同。
(3)同一仿真實(shí)體建立不同決策模型時(shí)采用的方法過于單一。
2 行為建模技術(shù)研究
2.1 行為建模技術(shù)分析
在此針對(duì)上節(jié)提出的人類行為建模中存在的問題,對(duì)自行高炮CGF的行為建模技術(shù)進(jìn)行研究,給出其解決方法。開發(fā)CGF的難點(diǎn)和重點(diǎn)之一在于CGF實(shí)體行為的生成,如何生成真實(shí)可信的實(shí)體行為是CGF研究的核心問題。CGF系統(tǒng)中常用的決策方法可以分為兩大類:基于人工智能技術(shù)的決策方法和基于效用理論的決策方法。前者又可以分為基于規(guī)則的專家系統(tǒng)和符號(hào)推理系統(tǒng)兩類;后者可以分為基于屬性的決策方法和對(duì)策方法兩類。其中,基于規(guī)則的專家系統(tǒng)最常見,專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問題的計(jì)算機(jī)程序[6]。自行高炮的防空作戰(zhàn)過程是一個(gè)非常有序的動(dòng)態(tài)過程,采用基于規(guī)則的專家系統(tǒng)可以直接使用車長、炮手的作戰(zhàn)經(jīng)驗(yàn),避免了對(duì)復(fù)雜的乘員決策行為進(jìn)行分析和建模的過程,而且計(jì)算開銷小,實(shí)時(shí)性好。
2.2 規(guī)則庫的構(gòu)建
自行高炮CGF實(shí)體在虛擬戰(zhàn)場(chǎng)中與對(duì)手作戰(zhàn)并不是隨意進(jìn)行的,而是根據(jù)自行高炮作戰(zhàn)經(jīng)驗(yàn)的積累而已經(jīng)形成的一些基本戰(zhàn)術(shù)原則,自行高炮乘員在防空作戰(zhàn)時(shí)一般基于這些規(guī)則選擇一定的戰(zhàn)術(shù)動(dòng)作,并操縱高炮完成所選動(dòng)作?;谝?guī)則的專家系統(tǒng)中,最根本的就是知識(shí)庫,也稱規(guī)則庫。規(guī)則庫由一條條戰(zhàn)術(shù)規(guī)則構(gòu)成,戰(zhàn)術(shù)規(guī)則由軍事專家制定,包括產(chǎn)生戰(zhàn)術(shù)動(dòng)作的產(chǎn)生條件和戰(zhàn)術(shù)動(dòng)作。戰(zhàn)術(shù)規(guī)則的基本形式為:
3 人類決策行為模型實(shí)現(xiàn)
根據(jù)上節(jié)可知,車長和炮手決策行為的規(guī)則較為有序,本文以車長的決策行為為例,采用基于規(guī)則的專家系統(tǒng)對(duì)車長的決策行為模型進(jìn)行建立,并給出相應(yīng)的仿真實(shí)現(xiàn),其中車長的決策行為模型主要為車長改變威脅度的決策行為模型。單炮搜索雷達(dá)能自動(dòng)判決威脅度,采用的是V/D準(zhǔn)則[9],并以此來定出1號(hào)、2號(hào)……威脅度。在實(shí)戰(zhàn)時(shí)有時(shí)需要攻擊按V/D準(zhǔn)則確定的2號(hào)或其他號(hào)目標(biāo),而炮塔調(diào)轉(zhuǎn)只允許調(diào)往1號(hào)目標(biāo)威脅度目標(biāo)方位,為此需要人工改變威脅度號(hào)將要攻擊目標(biāo)的威脅度改為1號(hào)威脅度[10]。
3.1 改變威脅度的時(shí)機(jī)分析
改變威脅度的時(shí)機(jī)與轉(zhuǎn)移火力的時(shí)機(jī)有密切的關(guān)系,在有上級(jí)的轉(zhuǎn)移火力指示時(shí),按上級(jí)指示進(jìn)行,當(dāng)?shù)貌坏缴霞?jí)指示時(shí),則應(yīng)根據(jù)當(dāng)時(shí)的空情自行掌握。
本文通過對(duì)車長作戰(zhàn)行為進(jìn)行分析,建立如下決策指標(biāo):是否接到上級(jí)轉(zhuǎn)移火力指示、目標(biāo)是否被擊落、目標(biāo)是否過捷徑點(diǎn)離遠(yuǎn)飛行以及是否突然發(fā)現(xiàn)威脅更大的目標(biāo)。根據(jù)指標(biāo)體系建立的改變威脅度時(shí)機(jī)的行為規(guī)則如圖1所示。仿真開始后,首先判斷有沒有接到上級(jí)轉(zhuǎn)移火力的指示,若有,則放棄原威脅度為1的目標(biāo);若沒有,則判斷目標(biāo)是否被擊落,若目標(biāo)被擊落,則雷達(dá)利用V/D準(zhǔn)則自動(dòng)地對(duì)其余目標(biāo)進(jìn)行威脅度判斷;若沒有被擊落,則判斷目標(biāo)是否過捷徑點(diǎn)遠(yuǎn)離飛行,若目標(biāo)已過航,則放棄原威脅度為1的目標(biāo);若沒有過航,則判斷車長是否發(fā)現(xiàn)對(duì)高炮威脅度更大的目標(biāo),若沒有發(fā)現(xiàn),攻擊原威脅度為1的目標(biāo);若發(fā)現(xiàn)有威脅度更大的目標(biāo),則放棄原威脅度為1的目標(biāo),車長通過改變威脅度編號(hào),使高炮攻擊改變威脅度后威脅度為1的目標(biāo),仿真結(jié)束。
3.2 車長改變威脅度的行為模型實(shí)例
將CGF實(shí)體放在綜合作戰(zhàn)環(huán)境中,訓(xùn)練水平和個(gè)人性格特征差異體現(xiàn)在其具有不同的獲取和記憶能力。
在作戰(zhàn)環(huán)境中有的CGF實(shí)體會(huì)感到“疲勞”和“緊張”,而有的則不會(huì),參加訓(xùn)練的人員仿佛是“真人”或其控制的實(shí)體進(jìn)行交互,從而提高了訓(xùn)練的真實(shí)性和交互性。根據(jù)改變威脅度的戰(zhàn)術(shù)行為規(guī)則進(jìn)行實(shí)例開發(fā),考慮到?jīng)Q策行為對(duì)系統(tǒng)實(shí)時(shí)性、運(yùn)算速度以及軟件的可移植性要求較高,故本文基于VC 6.0開發(fā)環(huán)境進(jìn)行開發(fā)。圖2為某車長改變威脅度決策行為的實(shí)例應(yīng)用。
圖1 改變威脅度的決策行為規(guī)則
某次仿真訓(xùn)練中,由藍(lán)方武器節(jié)點(diǎn)生成4批目標(biāo),目標(biāo)信息傳送到車長威脅度決策行為模型中,通過目標(biāo)威脅度判斷,分別得到4批目標(biāo)的威脅度,車長根據(jù)威脅度判斷的結(jié)果和戰(zhàn)場(chǎng)態(tài)勢(shì)來判斷最終要攻擊的目標(biāo)批次。決策調(diào)節(jié)器來反映不同技能車長的決策效能,根據(jù)作戰(zhàn)技能和時(shí)間壓力的輸入值得出該車長的技能參數(shù)為2.055,時(shí)間壓力指數(shù)為0.48,即該車長具有一定的實(shí)戰(zhàn)經(jīng)驗(yàn),在本次決策中時(shí)間壓力適中。決策中接到上級(jí)轉(zhuǎn)移火力的指示后,放棄原來威脅度最大的目標(biāo),轉(zhuǎn)而通過改變威脅度來攻擊上級(jí)指示的目標(biāo)。
圖2 車長改變威脅度的決策行為模型實(shí)例
4 結(jié) 語
本文對(duì)自行高炮CGF中的人類行為建模進(jìn)行了研究,首先分析了CGF人類行為模型的主要內(nèi)容及其重要意義,針對(duì)當(dāng)前人類行為建模存在的問題給出相應(yīng)的解決方法。提出智能決策規(guī)則庫的構(gòu)建方法,通過對(duì)自行高炮作戰(zhàn)規(guī)則的提取,采用基于規(guī)則的專家系統(tǒng)對(duì)車長的決策行為進(jìn)行建模。
該方法避免了對(duì)復(fù)雜的乘員決策行為進(jìn)行分析和建模的過程,而且計(jì)算開銷小,實(shí)時(shí)性好,對(duì)今后相關(guān)的研究工作具有較好的參考價(jià)值。
參考文獻(xiàn)
[1] 郭齊勝,楊立功,楊瑞平,等.計(jì)算機(jī)生成兵力導(dǎo)論[M].北京:國防工業(yè)出版社,2006.
[2] 楊立功,郭齊勝.計(jì)算機(jī)生成兵力研究進(jìn)展[J].計(jì)算機(jī)仿真,2000,17(3):4?7.
[3] 薄濤.格斗空戰(zhàn)行為建模技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2002.
[4] 尹全軍.基于多Agent的計(jì)算機(jī)生成兵力建模與仿真研究[D]. 長沙:國防科學(xué)技術(shù)大學(xué),2005.
[5] 連云峰.基于CGF技術(shù)的坦克排進(jìn)攻戰(zhàn)斗行為建模與仿真研究[D].石家莊:軍械工程學(xué)院,2008.
[6] 梁冠輝.基于仿真平臺(tái)的自行高炮武器系統(tǒng)作戰(zhàn)效能評(píng)估方法研究[D].石家莊:軍械工程學(xué)院,2010.
[7] 孫少斌,陳璐,張仁友.基于智能體技術(shù)的CGF行為模擬研究[J].火力與指揮控制,2009,34(3):79?83.
[8] 熊會(huì)祥.自行高炮武器系統(tǒng)作戰(zhàn)指揮模擬訓(xùn)練關(guān)鍵技術(shù)研究與應(yīng)用[D].石家莊:軍械工程學(xué)院,2009.
[9] 孫珠峰,孫堯,黃文斌.計(jì)算機(jī)生成兵力定量化行為的調(diào)整模型[J].計(jì)算機(jī)工程,2005,31(3):158?160.
[10] 陳選社.PGZ95式25 mm自行高炮作戰(zhàn)指揮[D].鄭州:鄭州防空兵學(xué)院,2003.