亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一類(lèi)部分可觀測(cè)的倒向重隨機(jī)控制系統(tǒng)

        2021-08-13 08:52:00王維峰郭仲凱
        關(guān)鍵詞:研究

        王維峰,郭仲凱

        (中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,武漢430074)

        最優(yōu)控制問(wèn)題普遍存在于自然科學(xué)和社會(huì)生活的各個(gè)領(lǐng)域,它主要是對(duì)一個(gè)動(dòng)力系統(tǒng)尋求最優(yōu)的控制策略,使某個(gè)目標(biāo)量達(dá)到最大或最小. 隨機(jī)控制理論將隨機(jī)過(guò)程理論與最優(yōu)控制理論相結(jié)合,成為研究隨機(jī)系統(tǒng)的一種有效方法,被廣泛應(yīng)用到物理學(xué)、經(jīng)濟(jì)學(xué)、工程學(xué)、生物學(xué)等學(xué)科中. 1994年,PARDOUX 和PENG首次研究了倒向重隨機(jī)微分方程,給出了方程解的存在唯一性[1]. 2006年,SHI 和 WU在非凸控制區(qū)域情形下研究了耦合正-倒向隨機(jī)控制系統(tǒng)的最大值原理[2]. 2010年,HAN等研究了倒向重隨機(jī)控制系統(tǒng)的最優(yōu)控制問(wèn)題,在凸控制區(qū)域情形下得到了上述問(wèn)題的最大值原理[3].

        上述研究中,控制系統(tǒng)都是完全可觀測(cè)的. 但是,在很多情形下對(duì)系統(tǒng)進(jìn)行控制的時(shí)候,僅僅只能觀察到部分信息. 比如,在金融數(shù)學(xué)中的最優(yōu)投資組合選擇問(wèn)題中,投資者僅僅只能獲得證券股票以前以及當(dāng)前的價(jià)格(動(dòng)態(tài)),不可能了解所有的價(jià)格及政策動(dòng)向,所以投資者只能在所獲得的部分信息下進(jìn)行投資決策. 又比如基金公司的風(fēng)險(xiǎn)控制,他們也只能在獲得的有限信息下做出決策,為公司規(guī)避風(fēng)險(xiǎn). 因此,研究只具有部分信息的控制系統(tǒng)很有必要. 到目前為止,對(duì)這類(lèi)問(wèn)題的研究取得了部分結(jié)果. 如TANG研究了一類(lèi)正向部分可觀測(cè)系統(tǒng)的最大值原理[4],文獻(xiàn)[5-6]研究了正-倒向部分可觀測(cè)系統(tǒng)的最大值原理,文獻(xiàn)[7]在凸控制區(qū)域情形下研究了一類(lèi)部分可觀測(cè)的倒向重隨機(jī)控制系統(tǒng)的最大值原理,文獻(xiàn)[8-9]在非凸控制區(qū)域情形下研究了隨機(jī)控制系統(tǒng)的一階和二階必要條件. 受上述文獻(xiàn)的啟發(fā),本文對(duì)非凸控制區(qū)域情形下的部分可觀測(cè)的倒向重隨機(jī)控制系統(tǒng)進(jìn)行了研究和探討,且控制變量包含在漂移系數(shù)和擴(kuò)散系數(shù)中.

        1 控制系統(tǒng)的建立

        設(shè)(Ω,F,P)是完備的概率空間,T>0是一個(gè)固定的常數(shù).{W(t):0≤t≤T},{B(t):0≤t≤T}和{Y(t):0≤t≤T}是定義在概率空間(Ω,F,P)上的3個(gè)互相獨(dú)立的標(biāo)準(zhǔn)Brown運(yùn)動(dòng),且分別取值于Rm,Rd和Rr.令N表示F的所有P-零集合.對(duì)?t∈[0,T],給出如下定義:

        且:

        本文需要用到以下推廣的伊藤公式[1].

        引理1設(shè)α∈S2([0,T];Rk),β∈M2([0,T];Rk),γ∈M2([0,T];Rk×d),δ∈M2([0,T];Rk×m)滿足:

        則有:

        更一般地,若Φ(·)∈C2(Rk),則:

        令U是Rk中的非空子集,且容許控制集為:

        考慮如下的倒向重隨機(jī)控制系統(tǒng):

        (1)

        其中η∈L2(Ω,FT,P,Rn).

        假設(shè)狀態(tài)過(guò)程(y(t),z(t))不能完全被直接觀測(cè),僅能觀測(cè)到和狀態(tài)過(guò)程相關(guān)的一個(gè)噪聲過(guò)程:

        (2)

        假設(shè)以下條件成立:

        (H1):(i)函數(shù)f:[0,T]×Rn×Rn×m×Rk→Rn,g:[0,T]×Rn×Rn×m×Rk→Rn×d,h:[0,T]×Rn×Rn×m×Rk→Rr關(guān)于y、z都是連續(xù)可微的;

        (ii)fy,fz,gy,gz,h,hy,hz都是有界的.

        ?t∈[0,T],(y1,z1,u1),(y2,z2,u2)∈Rn×Rn×m×Rk,有:

        ‖g(t,y1,z1,u1)-g(t,y2,z2,u2)‖2≤

        |h(t,y1,z1,u1)-h(t,y2,z2,u2)|2≤

        任意給定一個(gè)u(·)∈Uad[0,T],由文獻(xiàn)[1]中的定理1.1可知,存在唯一解:

        (y(·),z(·))=(y(·,u(·)),z(·,u(·)))∈S2([0,T];Rn)×M2([0,T];Rn×d),

        滿足方程(1).

        可以看到方程中有兩個(gè)獨(dú)立的布朗運(yùn)動(dòng)W(t)和B(t),且其中dW積分項(xiàng)是一個(gè)正向的伊藤積分,而dB積分項(xiàng)是一個(gè)倒向的伊藤積分.

        容易驗(yàn)證Zu(t)∈R是如下隨機(jī)微分方程的解:

        (3)

        給定如下的目標(biāo)函數(shù):

        (4)

        其中Eu是定義在概率空間(Ω,F,Pu)上的數(shù)學(xué)期望.

        假定如下條件成立:

        (H3):(i)函數(shù)l:[0,T]×Rn×Rn×m×Rk→R和Φ:Rn→R關(guān)于y、z都是連續(xù)可微的;

        (ii) |ly|+|lz|≤c(1+|y|+|z|),|Φy|≤c(1+|y|).

        現(xiàn)在構(gòu)建最優(yōu)控制問(wèn)題(P):尋找一個(gè)控制u*(·)∈Uad[0,T]使得:

        (5)

        任意滿足上述等式的u*(·)∈Uad[0,T]都稱(chēng)為一個(gè)最優(yōu)控制,對(duì)應(yīng)的(y*(·),z*(·))稱(chēng)為最優(yōu)軌道,(y*(·),z*(·),u*(·))稱(chēng)為一個(gè)最優(yōu)序?qū)?

        由上可知,目標(biāo)函數(shù)(4)可重述為:

        Φ(yu(0))}.

        (6)

        所以原始的最優(yōu)控制問(wèn)題(P)等價(jià)于在方程(1)和(3)的條件下最小化(6)式.

        2 相關(guān)狀態(tài)變量的估計(jì)

        假設(shè)(y*(·),z*(·),u*(·))是上述最優(yōu)控制問(wèn)題的一個(gè)最優(yōu)解.由于控制區(qū)域非凸,所以引入如下的針狀變分,對(duì)任意的u(·)∈Uad[0,T]和0<ε

        其中Eε∈[0,T]是一個(gè)可測(cè)集合且滿足|Eε|=ε(ε>0是任意小的).設(shè)(yε(·),zε(·))是對(duì)應(yīng)于擾動(dòng)控制uε(t)的狀態(tài)軌道.

        為了方便,引入如下記號(hào):

        φ*(·)=φ(·,y*(·),z*(·),u*(·)),
        φε(·)=φ(·,yε(·),zε(·),uε(·)),

        其中φ可以表示文中的函數(shù)f,g,l,h,fy,fz,gy,gz,ly,lz,hy,hz.

        定理1令ξε(t)=yε(t)-y*(t),ηε(t)=zε(t)-z*(t),則:

        證明由狀態(tài)方程(1)可得:

        z*(s)]dW(s).

        由引理1可知:

        u*(s))‖2ds.

        由條件(H1),(H2)和 Young 不等式,且注意到ξε(T)=0,可得:

        f(u(s))||ξε(s)|]ds+

        由條件(H2)和0<σ<1,可以選擇足夠大的M>0使得:

        其中λ>0.再由Gronwall不等式,可以得到上述結(jié)果.

        定理2設(shè)Zε(t)和Z*(t)是方程(3)分別對(duì)應(yīng)于控制變量uε(t)和u*(t)的解,則下式成立:

        E|Zε(t)-Z*(t)|2≤Cε.

        證明由方程(3)可知:

        對(duì)|Zε(t)-Z*(t)|2應(yīng)用伊藤公式,再結(jié)合條件(H2), (H3)和定理1可得:

        E|Zε(t)-Z*(t)|2≤

        h(s,y*(s),z*(s),u*(s))|2+|Zε(t)-

        Z*(s)|2|h(s,y*(s),z*(s),u*(s))|2]ds+Cε≤

        再由Gronwall不等式,顯然有E|Zε(t)-Z*(t)|2≤Cε成立.

        3 變分方程及相關(guān)變量的估計(jì)

        下面引入如下的變分方程:

        (7)

        (8)

        由上述條件可知方程(7)和方程(8)分別存在唯一的適定解(x(t),r(t))∈M2([0,T);Rn)×M2([0,T];Rn×m)和Z1(t)∈M2([0,T];R),0≤t≤T.

        定理3設(shè)(x(t),r(t))和Z1(t)分別是方程(7)和(8)的解,則:

        用類(lèi)似定理1和定理2的方法證明.

        定理4設(shè)條件(H1)~(H3)成立,則:

        證明由狀態(tài)方程(1)和變分方程(7)可知:

        由引理1,對(duì)|yε(t)-y*(t)-x(t)|2用推廣的伊藤公式,有:

        y*(s),z*(s),u*(s))-fyx(s)-fzr(s)-(f(uε(s))-

        f(u*(s)))](yε(t)-y*(t)-x(t))ds+

        u*(s))-gyx(s)-gzr(s)-(g(uε(s))-

        g(u*(s)))]‖2ds.

        由條件(H1)~(H3)和定理1、定理3,化簡(jiǎn)得:

        Cε2,

        其中λ>0.再由Gronwall不等式知上述前兩個(gè)不等式成立.用同樣的方法可證明第3個(gè)不等式.

        4 變分不等式的探討

        前面給出了狀態(tài)方程、變分方程和相關(guān)估計(jì)量的計(jì)算,最后研究變分不等式.

        由于假設(shè)u*(·)是一個(gè)最優(yōu)控制,因此對(duì)任意的擾動(dòng)控制uε(·)有J(uε(·))≥J(u*(·))成立, 因此:

        進(jìn)而:

        E(Φ(yε(0))-Φ(y*(0)+x(0)))+

        E(Φ(y*(0)+x(0))-Φ(y*(0))).

        由條件(H3)、定理1~定理4可得:

        l(uε(t))-l(u*(t)))]dt+E[Φy(y*(0))x(0)]+Cε.

        由上式知,此時(shí)變分不等式僅僅是ε的同階無(wú)窮小,而要進(jìn)一步求出最大值原理,必須要得到變分不等式是ε的高階無(wú)窮小.由此可知,在隨機(jī)系統(tǒng)下,求得非凸控制區(qū)域下的最大值原理將變得非常困難.而為了得到更進(jìn)一步的結(jié)論,通常會(huì)將目標(biāo)函數(shù)進(jìn)行二階泰勒展開(kāi),并將狀態(tài)方程進(jìn)行二階變分,將相關(guān)變量進(jìn)行四階估計(jì).而此時(shí)又需要構(gòu)造二階變分方程和二階伴隨方程,這是一個(gè)非常復(fù)雜的過(guò)程,將在后面的工作中進(jìn)一步研究.

        猜你喜歡
        研究
        FMS與YBT相關(guān)性的實(shí)證研究
        2020年國(guó)內(nèi)翻譯研究述評(píng)
        遼代千人邑研究述論
        視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        關(guān)于遼朝“一國(guó)兩制”研究的回顧與思考
        EMA伺服控制系統(tǒng)研究
        基于聲、光、磁、觸摸多功能控制的研究
        電子制作(2018年11期)2018-08-04 03:26:04
        新版C-NCAP側(cè)面碰撞假人損傷研究
        關(guān)于反傾銷(xiāo)會(huì)計(jì)研究的思考
        焊接膜層脫落的攻關(guān)研究
        電子制作(2017年23期)2017-02-02 07:17:19
        可免费观看的av毛片中日美韩| 综合无码一区二区三区四区五区| 亚洲先锋影院一区二区| 亚洲国产人成自精在线尤物| 亚洲最大免费福利视频网| 久久综合狠狠色综合伊人| 日韩我不卡| 国产在线看不卡一区二区| 亚洲老熟妇愉情magnet| 国产精品女同一区二区免| 一本大道熟女人妻中文字幕在线| 日本一卡2卡3卡四卡精品网站| 国产欧美va欧美va香蕉在线观| 日本视频一区二区二区| 熟妇人妻无乱码中文字幕av| 国产顶级熟妇高潮xxxxx| 国产欧美日韩网站| 视频一区视频二区亚洲| 久久人人爽人人爽人人片av高请| 亚洲av无码精品色午夜| 日本高清一区二区三区水蜜桃 | 日韩av无卡无码午夜观看| 亚洲本色精品一区二区久久| 亚洲第一最快av网站| 男人扒开女人双腿猛进女人机机里| 青青青草国产熟女大香蕉| 男女av免费视频网站| 伊人激情av一区二区三区| 国产极品美女高潮抽搐免费网站| 免费av在线视频播放| 久久久久99精品成人片欧美| 亚洲精品无码久久久久| 九九99久久精品在免费线97| 男男啪啪激烈高潮无遮挡网站网址 | 婷婷色国产精品视频二区| 免费操逼视频| 亚洲AV秘 无码一区二p区三区 | 国产一二三四2021精字窝| 人人妻人人澡人人爽欧美一区九九| 手机看片久久国产免费| 91精品啪在线看国产网站|