亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于魯棒優(yōu)化的無人機空戰(zhàn)博弈決策

        2015-06-05 15:31:25章衛(wèi)國黃得剛
        系統(tǒng)工程與電子技術 2015年11期
        關鍵詞:分配優(yōu)化策略

        王 昱,章衛(wèi)國,傅 莉,黃得剛,李 勇

        (1.西北工業(yè)大學自動化學院,陜西西安710129;2.沈陽航空航天大學自動化學院,遼寧沈陽110136;3.沈陽工業(yè)大學電氣工程學院,遼寧沈陽110870)

        基于魯棒優(yōu)化的無人機空戰(zhàn)博弈決策

        王 昱1,2,章衛(wèi)國1,傅 莉2,黃得剛1,李 勇3

        (1.西北工業(yè)大學自動化學院,陜西西安710129;2.沈陽航空航天大學自動化學院,遼寧沈陽110136;3.沈陽工業(yè)大學電氣工程學院,遼寧沈陽110870)

        作為無人機空戰(zhàn)過程中較大的不確定性因素,作戰(zhàn)雙方毀傷概率易受外界因素影響,可能在一定范圍波動,針對這一問題將魯棒優(yōu)化思想引入無人機空戰(zhàn)博弈模型中,結合納什均衡求解的適應度函數(shù)的期望和方差,建立了變權重的自適應目標函數(shù),設計了權重的分配方法。在確保策略解可行的同時,提高了毀傷概率變化因素下混合策略的魯棒性。仿真實驗結果表明,與原博弈模型相比,新模型納什均衡解下的雙方博弈收益受參數(shù)變化影響較小,可提供更可靠的策略參考。

        無人機;不確定性因素;魯棒優(yōu)化;納什均衡;自適應權重

        0 引 言

        無人機編隊協(xié)同自主作戰(zhàn)作為未來空戰(zhàn)的理想形態(tài),近年來受到各國航空領域相關學者的廣泛關注。而如何利用無人機的多目標攻擊能力,確定合適的火力分配方案是研究的焦點,目前已有大量的研究成果涌現(xiàn)[112]。然而,在已有文獻中,空戰(zhàn)過程中的不確定性(特別是參數(shù)的不確定性)往往被忽視,文獻[13- 14]雖然考慮到參數(shù)變化區(qū)間,但未采取有針對性的處理方法。不難理解,參數(shù)的波動將直接影響火力分配策略的最優(yōu)性,因此,火力分配策略解的魯棒性尤為重要,即實現(xiàn)無論參數(shù)在指定變化范圍內(nèi)怎么擾動,得到的仍是可行解,且解的變化量能夠符合預期[15]。在無人機空戰(zhàn)中,考慮某些參數(shù)變化,生成合適的火力分配策略,能夠在一定程度上克服作戰(zhàn)執(zhí)行過程中的不確定性因素。

        本文選擇無人機空戰(zhàn)過程中較典型的不確定性參數(shù)——毀傷概率,在估計其變化區(qū)間后,將博弈論的納什均衡求解目標函數(shù)的均值和方差作為優(yōu)化目標,提出新的加權自適應目標函數(shù),設計自適應權重分配方法,應用粒子群算法對模型進行求解,找尋博弈雙方納什均衡意義下的較優(yōu)火力分配策略。

        1 基于納什均衡的火力分配模型

        文獻[4]已經(jīng)通過實驗證明了針對多隊對抗目標分配問題,相對于不預測甚至不考慮敵方作戰(zhàn)策略的一類決策方法而言,納什博弈策略能夠更大化地攻擊敵方并保存自己,是更好的選擇方法。因此,本文假定雙方均遵從納什均衡理論,則火力分配模型是針對空戰(zhàn)雙方納什均衡點的求解而建立的。

        1.1 火力分配價值函數(shù)模型

        將無人機空戰(zhàn)雙方標記為藍、紅兩方,并將戰(zhàn)斗離散化為K步,計算藍、紅雙方火力分配總體收益函數(shù)為

        根據(jù)作戰(zhàn)雙方對武器使用情況的控制,確定模型約束條件為

        式(7)、式(8)描述了空戰(zhàn)中藍\紅方最多分配給紅方j機\藍方i機的武器數(shù)目約束,分別用W和W表示;式(9)、式(10)描述了第k戰(zhàn)斗步中藍方i機/紅方j機最多發(fā)射的武器數(shù)目約束,分別以(k)和(k)表示。

        1.2 火力分配問題的混合納什均衡點求解模型

        根據(jù)無人機空戰(zhàn)雙方完全敵對的特點,可將其描述成非合作雙矩陣對策的博弈模型。

        采用文獻[16]給出的非合作雙矩陣博弈納什均衡點求解的適應度函數(shù)

        式中

        ?xi,yj≥0為藍、紅雙方策略集中可選的混合策略(各策略的概率分布組合),其中,JB、JR為第1.1節(jié)中的藍、紅兩方的作戰(zhàn)總體收益,J、J分別為JB的第i行、JR的第j列,i=1,2,…,n,j=1,2,…,m。

        由納什均衡解的充要條件[16]可知,混合策略組合空間內(nèi)只有納什均衡解的適應度值最小,為0,即使函數(shù)f(x,y)為最小值0的混合策略(X*,Y*)即為所求的納什均衡解,因此,這是一個極值已知的優(yōu)化問題。

        2 基于納什均衡的魯棒優(yōu)化火力分配模型及算法

        2.1 魯棒優(yōu)化指標選取

        為獲取參數(shù)變化下更可靠的妥協(xié)解,本文采用雙重優(yōu)化指標:①將適應度函數(shù)值f的期望作為最優(yōu)性指標;②為更好地限制不確定性,將f的方差作為魯棒性指標。具體做法為:針對每次迭代后的每個候選解u=(x,y),分別在β和β的變化區(qū)間內(nèi)隨機選取nβ個變化參數(shù),代入式(11)中求取適應度函數(shù)f,由式(12)、式(13)計算其期望和方差:

        分析可知,兩個指標的目標均為最小化,故可將兩個指標的加權和作為最終的火力分配優(yōu)化函數(shù)。

        2.2 綜合目標函數(shù)及自適應權重確定

        借鑒文獻[17]的權重分配思想,結合本文課題,針對每代中每個候選解u,提出基于魯棒優(yōu)化的綜合火力分配目標函數(shù)

        圖1的設定曲線

        分析式(14)易知,綜合模型使得原本的最小值問題轉換成最大值問題。

        2.3 基于粒子群算法的模型求解步驟

        步驟1設定初始參數(shù)、確定雙方空戰(zhàn)策略(設藍方n條,紅方m條),令初始進化的代數(shù)gen=1,確定終止迭代次數(shù)gen_stop。

        步驟2以作戰(zhàn)雙方混合策略組合概率為決策變量,聯(lián)合各分量初始化速度構造粒子。在約束范圍內(nèi)隨機生成規(guī)模為Npop的初始種群Pop,每個粒子格式如下:

        步驟3針對每個個體,按照式(18)隨機在變化區(qū)間內(nèi)初始化nβ個環(huán)境影響因子β和β:

        步驟5按照粒子群算法進行個體位置和速度更新,重復步驟3和步驟4,直到終止條件滿足:若某代群體極值Gbest的目標函數(shù)值連續(xù)count_end代小于指定的誤差限μ,則直接跳出迭代,否則考察終止迭代次數(shù)是否滿足。

        步驟6輸出目標函數(shù)值fe、fvar、f和最優(yōu)個體Gbest。

        3 仿真算例

        本文采用文獻[18]給定的相同的雙方的16組火力分配策略:{1,1;1,1};{1,2;1,1};{2,1;1,1};{2,2;1,1};{1,1;1,2};{1,2;1,2};{2,1;1,2};{2,2;1,2};{1,1;2,1};{1,2;2,1};{2,1;2,1};{2,2;2,1};{1,1;2,2};{1,2;2,2};{2,1;2,2};{2,2;2,2}。{i,j;k,l}表示第一步藍(紅)方1號機攻擊紅(藍)方i號機,藍(紅)方2號機攻擊紅(藍)方j號機;第二步藍(紅)方1號機攻擊紅(藍)方k號機,藍(紅)方2號機攻擊紅(藍)方l號機(i,j,k,l=1,2)。算例參數(shù)如下:

        本文提出的魯棒優(yōu)化方法運行結果如圖2所示。

        圖2 魯棒優(yōu)化方法運行曲線

        圖3 原始方法運行曲線

        由圖2、圖3的運行結果可見,3種仿真的納什均衡指標均接近0,所得混合策略有效。3種情況的納什均衡混合策略解如表1所示。

        由表1可以看出,3種仿真所得的混合概率在策略的指向上基本一致,而概率分布不同;原始模型在不考慮βw變化時的策略傾向于{藍11,紅3},這與文獻[3]采用鄰域搜索算法的結果一致;而考慮βw后,策略傾向發(fā)生改變?yōu)椋{7,紅14};采用魯棒優(yōu)化模型,策略再發(fā)生傾斜,變?yōu)椋{7,紅10}。

        表1 3種情況混合策略解比較

        為檢驗本文提出模型的有效性,下面對3種情況獲取策略下的藍、紅雙方的最優(yōu)收益X*JBY*T、X*JRY*T在100組隨機變化下的期望和方差進行檢驗,結果如圖4所示。

        圖4 3種情況雙方最優(yōu)收益期望和方差比較

        由圖4可見,在3種模型的期望差別不大的情況下,考慮參數(shù)變化的模型2、模型3方差均好于不考慮參數(shù)變化的模型1;而魯棒優(yōu)化模型的方差最小。說明在兩方毀傷概率受不確定因素影響在一定范圍內(nèi)變化時,魯棒優(yōu)化模型計算出的混合策略受干擾最小,魯棒性最強,最為可靠。

        4 結 論

        本文針對無人機空戰(zhàn)中環(huán)境信息不確定的問題,以毀傷概率為不確定因素,結合納什均衡博弈論以及粒子群算法,提出了一種改進權重的火力分配策略魯棒優(yōu)化模型并求解。通過算例仿真驗證,新模型優(yōu)化策略在環(huán)境因素影響因子于估計范圍內(nèi)隨機變化的情況下,給出了更穩(wěn)定的雙方收益,為作戰(zhàn)決策提供更為可靠的信息,驗證了模型和方法的有效性。

        [1]Cruz J B,Simaan M A,Gacic A,et al.Game-theoretic modeling and control of a military air operation[J].IEEE Trans.on Aerospace and Electronic Systems,2001,37(4):1393- 1405.

        [2]Liu Y,Simaan M A,Jr J B C.An application of dynamic nash task assignment strategies to multi-team military air operations[J].Automatica,2003,39(8):1469- 1478.

        [3]Darrah M.UAV cooperative task assignments for a SEAD mission using genetic algorithms[C]∥Proc.of the AIAA Guidance,Navigantion,and Control Conference and Exhibit,2006:1- 9.

        [4]Galati D G,Simaan M A.Effectiveness of the nash strategies in competitive multi-team target assignment problems[J].Transactions of Aerospace and Electronic Systems,2007,43(1):126- 134.

        [5]Li Y,Dong Y N.Weapon-target assignment based on simulated annealing and discrete particle swarm optimization in cooperative air combat[J].Acta Aeronautica et Astronautica Sinica,2010,31(3):626- 631.(李儼,董玉娜.基于SA-DPSO混合優(yōu)化算法的協(xié)同空戰(zhàn)火力分配[J].航空學報,2010,31(3):626- 631.)

        [6]Liu B,Qin Z,Shao L P,et al.Air combat decision making for coordinated multiple target attack using collective intelligence[J].Acta Aeronautica et Astronautica Sinica,2010,31(7):1727- 1739.(劉波,覃征,邵利平,等.基于群集智能的協(xié)同多目標攻擊空戰(zhàn)決策[J].航空學報,2010,31(7):1727- 1739.)

        [7]Liu B,Zhang X P,Wang R,et al.Air combat decision making for coordinated multiple target attack using combinatorial auction[J].Acta Aeronautica et Astronautica Sinica,2010,31(7):1434- 1444.(劉波,張選平,王瑞,等.基于組合拍賣的協(xié)同多目標攻擊空戰(zhàn)決策算法[J].航空學報,2010,31(7):1434- 1444.)

        [8]Liu X,Liu Z,Hou W S,et al.Improved MOPSO algorithm for multi-objective programming model of weapon-target assignment[J].Systems Engineering and Electronics,2013,35(2):326- 330.(劉曉,劉忠,侯文姝,等.火力分配多目標規(guī)劃模型的改進MOPSO算法[J].系統(tǒng)工程與電子技術,2013,35(2):326- 330.)

        [9]Yao M,Wang X Z,Zhao M.Cooperative combat task assignment optimization design for unmanned aerial vehicles cluster[J].Journal of University of Electronic Science and Technology of China,2013,42(5):723- 727.(姚敏,王緒芝,趙敏.無人機群協(xié)同作戰(zhàn)任務分配方法研究[J].電子科技大學學報,2013,42(5):723- 727.)

        [10]Liu X,Liu Z,Hou W S,et al.Solving multi-objective optimization model for weapon target assignment by NRIWO algorithm[J].Journal of Huazhong University of Science and Tech-nology(Natural Science Edition),2013,41(5):68- 72.(劉曉,劉忠,侯文姝,等.NRIWO算法求解火力分配多目標規(guī)劃模型[J].華中科技大學學報(自然科學版),2013,41(5):68- 72.)

        [11]Diao X H,F(xiàn)ang Y W,Xiao B S,et al.Task allocation in cooperative air combat based on multi-agent coalition[J].Journal of Beijing University of Aeronautics and Astronautics,2014,40(9):1268- 1275.(刁興華,方洋旺,肖冰松,等.基于多智能體聯(lián)盟的多機協(xié)同空戰(zhàn)任務分配[J].北京航空航天大學學報,2014,40(9):1268- 1275.)

        [12]Wang Y Q,Luo J J.Target assignment in cooperative attacking of UCAVSbased on multi-intelligence improved glowworm swarm optimization algorithm[J].Journal of Northwestern Polytechnical University,2014,32(3):451- 456.(王永泉,羅建軍.基于多群體改進螢火蟲算法的UCAV協(xié)同多目標分配[J].西北工業(yè)大學學報,2014,32(3):451- 456.)

        [13]Xin B,Chen J,Juan Z,et al.Efficient decision makings for dynamic weapon-target assignment by virtual permutation and tabu search heuristics[J].IEEE Trans.on Systems,Man and Cybernetics,PartC:Applications and Reviews,2010,40(6):649- 662.)

        [14]Xin B,Chen J,Peng Z,et al.An efficient rule-based constructive heuristic to solve dynamic weapon-target assignment problem[J].IEEE Trans.on Systems,Man and Cybernetics,Part A:Systems and Humans,2011,41(3):598- 606.)

        [15]Xu M,Ma L H,Gu J P,et al.An improved robust multi-objective optimization method[J].Control and Decision,2013,28(8):1178-1182,1189.(徐鳴,馬龍華,顧江萍,等.一種改進的多目標魯棒優(yōu)化方法[J].控制與決策,2013,28(8):1178- 1182,1189.)

        [16]Jia W S,Xiang S W,Yang J F,et al.Solving Nash equilibrium for N-persons’non-cooperative game based on immune particle swarm algorithm[J].Application Research of Computers, 2012,29(1):28- 31.(賈文生,向淑文,楊劍鋒,等.基于免疫粒子群算法的非合作博弈Nash均衡問題求解[J].計算機應用研究,2012,29(1):28- 31.)

        [17]Li Y,Liu J C,Wang Y.An improved adaptive weight approach GA for optimizing multi-objective rolling schedules in a tandem cold rolling[J].Control Theory&Applications,2009,26(6):687-693.(李勇,劉建昌,王昱.改進權重自適應GA及冷連軋軋制規(guī)程多目標優(yōu)化[J].控制理論與應用,2009,26(6):687- 693.)

        [18]Ma F,Cao Z Y,Liu H.Construction and search of strategy space of target assignment based on game theory[J].Systems Engineering and Electronics,2010,32(9):1941- 1945.(馬飛,曹澤陽,劉暉.基于博弈論的目標分配策略空間構建與搜索[J].系統(tǒng)工程與電子技術,2010,32(9):1941- 1945.)

        王 昱(198-0- ),女,博士研究生,主要研究方向為無人機空戰(zhàn)態(tài)勢估計、目標分配。

        E-mail:yuki1120@sina.com

        章衛(wèi)國(195-6- ),男,教授,博士,主要研究方向為現(xiàn)代控制方法與智能控制方法及應用、先進與智能飛行控制及優(yōu)化技術。

        E-mail:zhangwg@nwpu.edu.cn

        傅 莉(196-8- ),女,教授,博士,主要研究方向為混雜對策建模方法、智能控制技術、磁流變阻尼器應用技術。

        E-mail:ffulli@163.com

        黃得剛(198-6- ),男,博士研究生,主要研究方向為飛行器路徑規(guī)劃導航、制導與控制。

        E-mail:hdg0216@163.com

        李 勇(198-0- ),男,講師,博士,主要研究方向為多目標優(yōu)化算法、軋制流程優(yōu)化與控制。

        E-mail:liyong.neu@gmail.com

        Game decision making of UAV aerial combat based on robust optimization

        WANG Yu1,2,ZHANG Wei-guo1,F(xiàn)U Li2,HUANG De-gang1,LI Yong3
        (1.School of Automation,Northwestern Polytechnical University,Xi’an 710129,China;2.School of Automation,Shenyang Aerospace University,Shenyang 110136,China;3.School of Electrical Engineering,Shenyang University of Technology,Shenyang 110870,China)

        As one of the large uncertainty factors in the process of unmanned aerial vehicle(UAV)aerial combat,the damage probability of both sides may fluctuate in a certain range for it is easily affected by external factors.To solve this problem,the robust optimization theory is imported into the game model of UAV aerial combat.Integrated with expectation and variance for the fitness function of Nash equilibrium solution,an adaptive objective function with variable weight is established,and the method for weight distribution is designed.The strategy solution is feasible,meanwhile the robustness of hybrid strategies is improved in the case of the damage probability changing.The simulation results show that compared with the original game model,the game revenue for both sides obtained from Nash equilibrium solution of the new model is less affected by the change of parameters.Therefore it can provide more reliable strategies reference.

        unmanned aerial vehicle(UAV);uncertainty factors;robust optimization;Nash equilibrium;adaptive weight

        V 247.1;TP 301.6

        A

        10.3969/j.issn.1001-506X.2015.11.17

        1001-506X(2015)11-2531-05

        2015- 01- 08;

        2015- 03- 11;網(wǎng)絡優(yōu)先出版日期:2015- 07- 16。

        網(wǎng)絡優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20150716.1057.002.html

        國家自然科學基金(61374032);遼寧省教育廳科學研究一般項目(L2015412);沈陽市科技創(chuàng)新團隊(src201204)資助課題

        猜你喜歡
        分配優(yōu)化策略
        超限高層建筑結構設計與優(yōu)化思考
        民用建筑防煙排煙設計優(yōu)化探討
        關于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        例談未知角三角函數(shù)值的求解策略
        應答器THR和TFFR分配及SIL等級探討
        我說你做講策略
        遺產(chǎn)的分配
        一種分配十分不均的財富
        績效考核分配的實踐與思考
        中文资源在线一区二区三区av| 人妻无码Aⅴ中文系列| 亚洲日本VA午夜在线电影| 大尺度极品粉嫩嫩模免费| 玩弄极品少妇被弄到高潮| 国产成人高清视频在线观看免费 | 午夜日韩视频在线观看| 麻豆激情视频在线观看| av熟妇一区二区三区| 亚洲成av人片天堂网无码| 亚洲av日韩av无码污污网站| 无码国产精品一区二区免| 国产亚洲精品综合一区| 蜜桃伦理一区二区三区| 白色白色视频在线观看| 亚洲成a∨人片在线观看无码| 99久久久精品免费观看国产| 亚洲 欧美 综合 另类 中字| 国产喷白浆精品一区二区| 91精品啪在线观九色| 日韩精品内射视频免费观看| 永久免费av无码网站性色av| 欧美手机在线视频| 国产精品丝袜美腿诱惑| 制服丝袜一区二区三区| 丰满老熟妇好大bbbbb| 日本欧美国产精品| 亚洲第一女人天堂av| 国产精品一区av在线| 毛片无码国产| 无码人妻一区二区三区免费| 久久这里只精品国产2| av网址在线一区二区| 手机看黄av免费网址| 亚洲的天堂av无码| 加勒比东京热久久综合| 人妻av有码中文字幕| 精品午夜福利无人区乱码一区| 五月天欧美精品在线观看| 中文字幕一区二区三区精品在线| 一边捏奶头一边高潮视频|