亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        追捕逃逸型微分對策問題的識別域判別

        2012-10-10 12:09:46夏尊銓
        上海理工大學學報 2012年5期
        關鍵詞:局中人微分定理

        張 霞, 高 巖, 夏尊銓

        (1.大連理工大學 數(shù)學科學學院,大連 116024;2.浙江財經(jīng)學院東方學院 信息分院,海寧 314408;3.上海理工大學 管理學院,上海 200093)

        1 問題的提出

        微分對策理論是現(xiàn)代控制理論中的一個重要研究課題,也是對策論的一個重要分支.微分對策是指在局中人之間進行對策活動時要用到微分方程(組)來描述對策現(xiàn)象或規(guī)律的一種對策,是解決對抗與競爭問題的有力工具.微分對策理論的研究可追溯到20世紀40年代,當時因軍事上的需要,由Isaacs帶領的團隊研究了導彈對抗飛行器策略問題,以此為開端,微分對策的基本概念及理論相繼提出,最早的文獻見于Isaacs的《Differential Games》一書[1].微分對策理論的進一步發(fā)展來自兩個方面:一是最優(yōu)控制理論;二是對策論.從最優(yōu)控制到微分對策可看作是從一方控制發(fā)展到雙方或多方控制;從對策論到微分對策,又可看作是從靜態(tài)的對策理論發(fā)展到動態(tài)的對策理論.因此,微分對策理論的研究對控制領域和對策論中問題的解決起著重要的作用[2].而且隨著該理論的不斷發(fā)展,現(xiàn)在也被廣泛應用到科學研究、工程技術、交通運輸、航天航空、環(huán)境保護、經(jīng)濟管理和市場競爭等許多方面[3-5].

        根據(jù)提法的不同,微分對策問題有多種形式.本文將考慮單目標兩人追捕逃逸型微分對策問題(pursuit-evasion games),它是由Isaacs最早提出并命名的.描述如下:

        考慮兩控制變量的微分動力系統(tǒng)

        其中,x∈Rn是狀態(tài)變量;u∈U,v∈V是控制變量;U,V?Rm,f(x,u,v)為Rm+n到Rm上的利普希茨函數(shù).設Ω為Rn中開子集,也稱為目標.引入兩個局中人,第一個局中人為Ursula,控制變量為u,要使系統(tǒng)的狀態(tài)在有限時間內(nèi)到達目標Ω;另一個局中人為Victor,控制變量為v,卻力爭使系統(tǒng)狀態(tài)永遠避開此目標Ω,這就是單目標兩人追捕逃逸型微分對策問題.

        Krasovskii及Subbotin研究了追捕逃逸型微分對策問題的無優(yōu)先規(guī)則的位置策略[2,6],并證明了選擇定理.即在任何初始點x0,或者Ursula贏,或者Victor贏,二者擇一.然而,在Caratheodory意義下系統(tǒng)(1)無解,為此他們推廣了解的定義,給出了近似微分對策.與位置策略的研究方法不同,文獻[7]使用了無預見性策略(nonanticipative stragies),故局中人都可以通過對方行動的信息來決定自己的行動,這在現(xiàn)實中有很多應用事例.文獻[7]的另一個重要貢獻在于通過幾何方式去研究勝利域(victory domain,指無論對方如何行動,局中人都能贏的初始點的集合),據(jù)此可以繼續(xù)作勝利域的數(shù)值計算[8-9].隨后又在文獻[10]中給出了具有狀態(tài)約束的追捕逃逸型問題,并證明了微分對策值的存在性.近期作者又將這一理論推廣到混雜系統(tǒng)[11].

        就具體應用問題來講,微分對策系統(tǒng)識別域(discriminating domain)的判別很重要,它直接關系到勝利域的表示以及微分對策問題的解.然而,正如對一般的非線性控制系統(tǒng)可生存性判別的充要條件很難具體使用一樣[12],目前關于微分對策問題的識別域判別還沒有切實可行的判別準則.為此,本文參照文獻[13]的方法,研究了一類重要的控制系統(tǒng)即仿射非線性控制系統(tǒng)下的追捕逃逸型微分對策問題,給出該問題的系統(tǒng)識別域判別的方法,并結合凸可行問題的算法給出該判別問題的投影算法,最后給出這類微分對策問題的選擇定理.

        2 識別域的判別方法

        首先給出文中用到的幾個定義.

        定義1K為Rn的閉子集,x∈K,若dK(x+p)=‖p‖,則稱向量p∈Rn為K在x處的近似法向量,所有p的集合記為NPK(x).

        定義2 若任意x∈D,任意p∈NPD(x),則稱D為f的識別域.Rn的閉子集K所包含的f的最大識別域稱為f的識別核,記作Discf(K).

        定義3 若任意x∈D,任意p∈NPD(x),則稱D為f的領導域(leadership domain).Rn的閉子集K所包含的f的最大的領導域稱為f的領導核,記作Leadf(K).

        下面討論識別域的判別問題.考慮如下仿射非線性系統(tǒng)

        其中,w(x)為Rn到Rn的利普希茨函數(shù),g(x)和h(x)為Rn到Rm+n的利普希茨函數(shù),u∈U為一度量緊空間.v∈V={v∈Rm|ai(v)≤0,i=1,2,…,r},ai(v)為Rm上的凸函數(shù).

        定義區(qū)域

        這里給定φj(x)為Rn上的連續(xù)可微函數(shù).定義指標集

        為方便問題的研究,在此給出本文所用到的假設條件及已知命題.

        假設1

        a.f(x,u,v)|Rn×U×V→Rn為連續(xù)函數(shù).

        b.對任意u∈U,v∈V,f(·,u,v)為利普希茨連續(xù).

        假設2[14]存在y0∈Rn,使得φj(x)Ty0<0,j=1,2,…,s.

        假設3[14]cl(γ(x))=Γ(x)成立,其中

        這里cl為閉包.

        命題1[14]若假設2及假設3成立,則TD(x)=Γ(x).其中

        命題2[15]若假設1成立,則D為f的識別域的充要條件是:

        任意x∈D,任意u∈U,f(x,u,V)∩TD(x)≠φ其中為空集.

        下面給出判別系統(tǒng)(2)的識別域的充分必要條件.

        定理1 在假設1~3成立的條件下,區(qū)域D為系統(tǒng)(2)中f的識別域當且僅當不等式組

        是相容的.其中,v∈Rm為變量.

        證明 由命題1知,區(qū)域D為f的識別域的充要條件是:

        任意x∈D,任意u∈U,f(x,u,V)∩TD(x)≠φ.當x屬于區(qū)域D的內(nèi)部時,TD(x)=Rn,定理顯然成立.因此只需考慮邊界點的情況,即集合.此時由命題1知,

        所以f(x,u,V)∩TD(x)≠φ等價于下面的不等式組有解

        將y=w(x)+g(x)u+h(x)v代入上面的第二個不等式,即得式(4a)和式(4b),證畢.

        3 投影算法及選擇定理

        下面給出判別系統(tǒng)(2)的識別域的算法.

        因為式(4a)是關于變量v的線性不等式組,故可與式(4b)一起組成下面的凸不等式組

        其中,v∈Rm為變量,q為式(4a)和式(4b)中全部不等式的個數(shù).

        判別該凸不等式組的相容性又可視為凸可行問題,令

        則問題轉(zhuǎn)化為尋找v∈Ψ.解決此問題的一個強有力的方法是投影算法[16],下面給出判別識別域的投影算法.

        Step 2i=0,0<η≤1,取v0∈Rm.

        Step3 若點列{vi}收斂,則停止,x∈D為f的識別域中的點.否則轉(zhuǎn)至Step 4.

        Step 4 計算σk∈?ak(vi)={σk∈Rn|z∈Rn,ak(z)≥ak(vi)+[vi,z-vi]},

        Θi={y∈Rn|ak(vi)+〈σk,y-vi〉≤0,k=1,2,

        Step 5 選擇ωi|η≤ωi≤2-η,計算vi+1=vi+ωi(yi-vi).

        Step 6i=i+1,轉(zhuǎn)至Step 3.

        定理2(收斂性) 在下列條件成立的情況下,算法收斂,即{vi}→v∈Ψ.

        a.ai(v)≤0,i=1,2,…,r為凸連續(xù)函數(shù);

        b.Ψ≠φ;

        c.對任意v,?ai(v)是有界的,i=1,2,…,r.

        最后回到兩人追捕逃逸型微分對策問題,給出在仿射非線性系統(tǒng)下的選擇定理.

        定理3 設f滿足假設1,令Ο=Rn\Ω,則Victor的勝利域為Discf(Ο),Ursula的勝利域為Ο\Discf(Ο).

        證明 參照文獻[7]的選擇定理可以得到Victor的勝利域為Discf(Ο),Ursula的勝利域為Ο\Leadf(Ο).又因為f(x,u,v)=w(x)+g(x)u+h(x)v,故

        即Isaacs條件滿足,所以Leadf(Ο)=Discf(Ο),故結論成立,證畢.

        由此可見,在這種特殊情況下,局中兩人的勝利域瓜分了目標集的補集.而且該微分對策問題與無優(yōu)先規(guī)則的位置策略相同,故只要知道系統(tǒng)的初始狀態(tài),就能確定兩人的對策結局.

        4 結 論

        本文基于非光滑分析及生存理論得出了一類仿射非線性微分對策問題在不等式約束區(qū)域上系統(tǒng)識別域的判別方法,該方法可具體實現(xiàn);并給出了算法,以及兩人追捕逃逸型微分對策問題的選擇定理.雖然微分對策理論的研究及應用有了極大的發(fā)展,但在追捕逃逸型微分對策模型的建立和求解以及不確定型微分對策等方面的研究尚不充分,這可作為進一步研究的課題.

        [1]Isaacs R.Differential games[M].New York:Wiley,1965.

        [2]Krasovskii N N,Subbotin A I.Game theoretical control problems [M ]. New York: Spring-Verlag,1988.

        [3]Getz W M,Pachter M.Two-target pursuit-evasion differential games in the plane[J].JOTA,1981,34 (3):383-403.

        [4]Zhu Q Y,Tembine H,Basar T.Hybrid risk-sensitive mean-field stochastic differential games with application to molecular biology[C]//2011 50th IEEE Conference on Digital Object Identifier.Orlando,2011:4491-4497.

        [5]Steffen J,Georges Z.Developments in differential game theory and numerical methods:economic and management applications[J].Computational Management Science,2007,4(2):159-181.

        [6]Krasovskii N N,Subbotin A I.Universal optimal strategies in positional differential games [J].Differential Equat,1984,19(11):1377-1382.

        [7]Cardallaguet P.Differential game with two players and one target[J].SIAM J Control and Optimization,1996,34(4):1441-1460.

        [8]Quincampoix M,Saint-pierre P.An algorithm for viability kernels in Holderian case:approximation by discrete viability kernels[J].Journal of Math System,Estim and Control,1995,5(1):115-118.

        [9]Cardallaguet P,Quincampoix M,Saint-pierre P.Some algorithms for differential games with two-players and one target[J].Mathematical Modeling and Numerical Analysis,1994,28(4):441-461.

        [10]Cardallaguet P,Quincampoix M,Saint-pierre P.Pursuit differential games with state constraints[J].SIAM J Control and Optimization,2002,39(5):1615-1632.

        [11]Gao Y,Lygeros J, Quincampoix M. On the reachability problem for uncertain hybrid systems[J].IEEE Transactions on Automatic Control,2007,52(9):1572-1586.

        [12]高巖.一類非線性控制系統(tǒng)可生存性判別[J].信息與控制,2005,34(4):510-512.

        [13]高巖.仿射非線性控制系統(tǒng)生存性的判別[J].控制理論與應用,2009,26(6):654-656.

        [14]Demyanov V F, Rubinov A M. Constructive nonsmooth analysis[M].Berne:Peterlang,1995.

        [15]Aubin J P.Viability theory[M].Boston:Birkh?user,1992.

        [16]Garcia-palomares U M.A superlinearly convergence projection algorithm for solving the convex inequality problem[J].Operations Research Letter,1998,22(2/3):97-103.

        猜你喜歡
        局中人微分定理
        J. Liouville定理
        擬微分算子在Hp(ω)上的有界性
        上下解反向的脈沖微分包含解的存在性
        A Study on English listening status of students in vocational school
        2×2型博弈決策均衡的歸一化解法
        “三共定理”及其應用(上)
        超對策模型中多形式結局偏好認知信息融合的0—1規(guī)劃方法
        借助微分探求連續(xù)函數(shù)的極值點
        具有失真認知信息的兩層沖突環(huán)境建模與分析
        對不定積分湊微分解法的再認識
        亚洲 欧美 偷自乱 图片| 日本精品久久性大片日本| 麻豆国产精品伦理视频| 欧美大片va欧美在线播放| 精品国产乱码久久久久久1区2区| 四虎国产精品视频免费看| 女同av免费在线播放| 极品一区二区在线视频观看| 亚洲国产天堂一区二区三区| 999国产精品视频| 国产大全一区二区三区| 日本在线一区二区三区不卡| 午夜一区二区视频在线观看| 国产成人无码精品久久二区三区| 北条麻妃毛片在线视频| 风流少妇一区二区三区| 亚洲av不卡一区男人天堂| 久久久久亚洲av片无码下载蜜桃| 99热最新在线观看| 少妇人妻偷人中文字幕| 夜夜高潮夜夜爽夜夜爱爱一区 | 中文人成影院| 五月激情在线观看视频| 亚洲国产精品无码久久一线| 免费观看又色又爽又黄的韩国| 日韩激情网| 一区二区三区四区亚洲免费| 巨大巨粗巨长 黑人长吊| 亚洲综合伊人制服丝袜美腿| 一区二区三区日本在线| 国产aⅴ激情无码久久久无码| 精品人妻系列无码人妻免费视频| japanese色国产在线看视频| 日本精品一区二区三区在线观看| 少妇高潮惨叫久久久久久电影 | 中文字幕亚洲无线码高清| 久久综合伊人有码一区中文字幕 | 亚洲高清国产成人精品久久 | 国产一区二区三区av在线无码观看 | a级国产精品片在线观看| 91久久国产香蕉熟女线看|