姜 彬
(南通航運(yùn)職業(yè)技術(shù)學(xué)院 管理信息系, 江蘇 南通 226000)
?
偏微分方程最優(yōu)控制中的變分迭代法應(yīng)用
姜彬
(南通航運(yùn)職業(yè)技術(shù)學(xué)院 管理信息系, 江蘇 南通226000)
首先使用極大值原理得到偏微分方程問(wèn)題的最優(yōu)性條件,然后使用變分迭代法求解Hamilton-Pontryagin方程,實(shí)現(xiàn)了偏微分方程最優(yōu)控制問(wèn)題的準(zhǔn)確快速求解。結(jié)合兩個(gè)最優(yōu)控制的經(jīng)典實(shí)例,對(duì)模型和算法進(jìn)行了仿真實(shí)驗(yàn),證明了該方法的可行性和有效性。
變分迭代法; 偏微分方程; 最優(yōu)控制; 極大值原理
有很多實(shí)際的工業(yè)生產(chǎn)過(guò)程中的優(yōu)化模型本質(zhì)上是偏微分方程的最優(yōu)控制問(wèn)題。常微分方程的最優(yōu)控制問(wèn)題已經(jīng)有了較為成熟的求解方法,而偏微分方程的最優(yōu)控制問(wèn)題由于計(jì)算復(fù)雜,偏微分方程往往不存在解析解等困難,在常微分方程里邊常見(jiàn)的經(jīng)典分析方法不能夠完全適用[1]。因此,對(duì)偏微分方程最優(yōu)控制問(wèn)題的研究顯得很有意義。
基于常微分方程的最優(yōu)控制問(wèn)題已經(jīng)有了很多有效的方法來(lái)進(jìn)行求解,例如變分法、極大值原理、動(dòng)態(tài)規(guī)劃[2-4]等。對(duì)于偏微分方程的最優(yōu)控制,文獻(xiàn)[5]提出了基于Hamilton-Pontryagin方程的求解方法,文獻(xiàn)[6-8]通過(guò)導(dǎo)出偏微分方程的對(duì)偶方程,給出該類(lèi)問(wèn)題的最優(yōu)性條件。雖然這些方法理論上可以應(yīng)用,但往往由于數(shù)值求解的計(jì)算復(fù)雜性,使這些方法有很大的局限性。今年以來(lái)變分迭代法被廣泛地應(yīng)用到偏微分方程的求解中,文獻(xiàn)[9]提出了一種變分迭代方式。文獻(xiàn)[10]證明了變分迭代法的解可以收斂于精確解。文獻(xiàn)[11]將傳統(tǒng)的參數(shù)攝動(dòng)法和變分迭代法相結(jié)合,給出了一種改進(jìn)的變分迭代公式。
文中在全面研究了變分迭代法理論的基礎(chǔ)上,從工業(yè)生產(chǎn)過(guò)程中抽象出一類(lèi)偏微分方程最優(yōu)控制問(wèn)題,先推導(dǎo)出Hamilton-Pontryagin方程,在此基礎(chǔ)上采用變分迭代法來(lái)求解原偏微分方程和對(duì)偶的偏微分方程,并采用了參數(shù)的方法來(lái)表示偏微分方程的初始解和邊界條件。實(shí)驗(yàn)表明,該方法能夠快速地逼近偏微分方程的真實(shí)解,從而簡(jiǎn)化了計(jì)算過(guò)程。
我們考慮如下的偏微分方程最優(yōu)控制問(wèn)題:
(1)
初始條件為:
(2)
邊界條件為:
(3)
末端條件為
(4)
在一些問(wèn)題中,末端條件也可以是自由的,根據(jù)所討論問(wèn)題不同會(huì)有一些小的變化,這里討論更加一般的問(wèn)題。
上面偏微分方程最優(yōu)控制問(wèn)題中,u(x,t)是控制量,y(x,t)是狀態(tài)變量,yt(x,t),yx(x,t),yxx(x,t)分別表示狀態(tài)變量對(duì)時(shí)間的導(dǎo)數(shù)、對(duì)空間的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)。r是一個(gè)常數(shù),表示對(duì)控制量懲罰的大小。α0,α1,β0,β1分別是常數(shù)。
對(duì)式(1)分析可知,我們希望在t∈[0,T],x∈[0,L]時(shí),狀態(tài)量y(x,t)能夠盡量接近設(shè)定值yd,同時(shí)對(duì)控制量進(jìn)行一定的懲罰。式(2)和式(3)分別是偏微分方程的初始條件和邊界條件。式(4)是終點(diǎn)約束。
根據(jù)極大值原理可以得出該最優(yōu)控制問(wèn)題最優(yōu)解的必要條件。由極大值原理分析該問(wèn)題可得到如下結(jié)論:
(5)
式中:p(x,t)——對(duì)偶狀態(tài),可以由對(duì)偶方程得出。
極小化該哈密頓函數(shù),即可得到最優(yōu)解。
如果假設(shè)最優(yōu)的控制律滿(mǎn)足如下的函數(shù)表達(dá)式:
(6)
那么可知:
(7)
最優(yōu)的控制律和對(duì)偶狀態(tài)還滿(mǎn)足以下的對(duì)偶方程約束:
(8)
邊界條件為:
(9)
初始條件為:
(10)
式(8)的兩個(gè)偏微分方程,一個(gè)是原問(wèn)題的偏微分方程,另一個(gè)是對(duì)偶的偏微分方程,可以看到它們很相似,但也有不同對(duì)偶方程有著自己的邊界條件和初始條件,對(duì)偶方程和原方程互相耦合在一起。所以,在求解的時(shí)候必須同時(shí)求解原方程和對(duì)偶方程。因此,要想利用最優(yōu)性條件求解該問(wèn)題就必須求解原偏微分方程和對(duì)偶的偏微分方程。
2.1變分迭代法
近年來(lái)對(duì)變分迭代法的研究很多,該方法被廣泛的用來(lái)求解偏微分方程取得了很好的效果。我們要使用變分迭代法來(lái)求解原偏微分方程和對(duì)偶偏微分方程??紤]如下的一個(gè)偏微分方程:
(11)
式中:Lt,Lx——微分算子;
N——非線(xiàn)性算子;
f(x,t)——普通的非線(xiàn)性函數(shù)。
由此,我們給出如下的變分迭代法的迭代公式:
(12)
上式中等式右邊第二項(xiàng)是校正項(xiàng),λ是拉格朗日乘子,可以由變分理論最佳確定,yk是對(duì)微分方程解的第k次迭代時(shí)的近似。該方法通過(guò)給定一個(gè)初始解y0(x,t),然后通過(guò)不斷的迭代去修正這個(gè)初始解來(lái)逼近真解。函數(shù)y(x,t)的改變量為自變函數(shù)的變分,可以用δy(x,t)表示。
如式(12)是常見(jiàn)的變分迭代法的公式,但對(duì)于復(fù)雜的偏微分方程,該方法往往收斂速度較慢,甚至無(wú)法收斂到最優(yōu)解。文中基于迭代優(yōu)化的思想提出了雙層結(jié)構(gòu)的變分迭代公式??紤]如下偏微分方程:
(13)
(14)
其中
由此可以得出,迭代表達(dá)式為
(15)
同時(shí)對(duì)其兩邊求變分,可以得到修正之后的表達(dá)式:
(16)
對(duì)式(16)兩邊同時(shí)求變分可知
(17)
由此可得拉格朗日乘子的駐值條件
(18)
令初始條件
(19)
由此可知,近似解yk(x,t)能夠通過(guò)迭代公式完全確定,最后可以確定該偏微分方程的近似解為:
(20)
2.2算法流程
首先要求解原偏微分方程和對(duì)偶偏微分方程,即式(8),根據(jù)式(16)可以給出如下的迭代表達(dá)式:
(21)
(22)
方程的近似解式(17)和式(18)必須驗(yàn)證初始條件、邊界條件、橫截條件和最終狀態(tài)條件是否滿(mǎn)足。因此,提出了選擇這些零的近似作為獨(dú)立變量的多項(xiàng)式函數(shù)z和t,涉及未知參數(shù)被強(qiáng)加邊界和橫截條件。值得注意的是變分迭代法收斂到近似解選擇為零的近似,但所需的迭代次數(shù)達(dá)到這樣的精度取決于所選的零級(jí)近似[13]。
(23)
迭代次數(shù)也與所選最終的終止條件有關(guān),在這里我們選擇這樣的一個(gè)終止條件。
(24)
式中:ε——一個(gè)可以自由確定的小數(shù),可根據(jù)經(jīng)驗(yàn)來(lái)給定。
由此,給出變分迭代法求解該偏微分方程最優(yōu)控制問(wèn)題的算法流程:
1)令k=1,選擇初始解y0(x,t)和λx(τ)=λp(τ)=1。
2)依據(jù)變分迭代的公式,即式(17)和式(18)來(lái)計(jì)算出yk(x,t)和pk(x,t)。
3)檢驗(yàn)yk(x,t)和pk(x,t)是否滿(mǎn)足邊界條件和初始條件,若不滿(mǎn)足,則返回步驟2)繼續(xù)修正迭代yk(x,t)和pk(x,t);若滿(mǎn)足,則進(jìn)入下一步。
給出一個(gè)具體的偏微分方程最優(yōu)控制問(wèn)題,該問(wèn)題是一個(gè)經(jīng)典的控制問(wèn)題,我們使用變分迭代法來(lái)求解。
考慮如下的最優(yōu)控制問(wèn)題:
r[u(x,t)]2dxdt
(25)
由此可得,該最優(yōu)控制的哈密頓函數(shù)為:
(26)
由式(26)可知該問(wèn)題的極值條件為
(27)
由式(27)可知
(28)
將式(28)代入式(26)可得
(29)
由對(duì)偶方程的表達(dá)式可知:
(30)
邊界條件為
(31)
初始條件為
(32)
使用變分迭代法來(lái)求解原偏微分方程和對(duì)偶偏微分方程,由變分迭代法的公式,即式(21)和式(22)可得:
(33)
(34)
對(duì)上式兩邊同時(shí)求變分可得:
(35)
(36)
對(duì)上式整理可得:
(37)
(38)
又因?yàn)?/p>
我們可得
(39)
由此可以得出關(guān)于拉格朗日乘子的約束:
(40)
由此可以解出λx(τ)=λp(τ)=1,將上式代入式(33)和式(34)中,可得
(41)
(42)
迭代所求的解必須滿(mǎn)足初始條件和邊界條件,對(duì)偶狀態(tài)也要滿(mǎn)足相應(yīng)的約束,由此可以對(duì)其進(jìn)行參數(shù)化處理。
(43)
經(jīng)過(guò)兩次迭代,可以得到如下的結(jié)果:
(44)
迭代初始條件和邊界條件可得:
(45)
將邊界條件代入式(44),由此可以解得參數(shù):
(46)
因此可得其近似解為
(47)
近似的最優(yōu)控制
(48)
由此計(jì)算出適應(yīng)值函數(shù)為:
(49)
之后的迭代過(guò)程與前面是一樣的過(guò)程,下面直接給出第6步迭代的結(jié)果,此時(shí)已經(jīng)得到了最優(yōu)解。
(50)
(51)
表1 適應(yīng)值函數(shù)迭代變化過(guò)程
由表1分析可知,適應(yīng)值的變化量是在逐步減少的,當(dāng)小于預(yù)先設(shè)定值時(shí),該算法終止,即得出最優(yōu)解。
讓我們考慮如下的最優(yōu)控制問(wèn)題
(52)
考慮如下約束
由此可得該問(wèn)題的哈密頓函數(shù)為:
(53)
由此得出狀態(tài)方程,協(xié)態(tài)方程和它們的邊界條件為:
x(x-1)p(x,t)=0
(54)
由此給出迭代的表達(dá)式為:
(55)
(56)
同理可知,我們還是要檢驗(yàn)該方程是否滿(mǎn)足初始條件和邊界條件。若該解滿(mǎn)足微分方程的初始條件和邊界條件,則可以對(duì)其進(jìn)行參數(shù)化表示:
(57)
該問(wèn)題通過(guò)變分迭代法迭代5步即得到最優(yōu)解,適應(yīng)值函數(shù)迭代變化過(guò)程見(jiàn)表2。
表2 適應(yīng)值函數(shù)迭代變化過(guò)程
由表2分析可知,適應(yīng)值的變化量是在逐步減少的,當(dāng)小于預(yù)先設(shè)定值時(shí),該算法終止,即得出最優(yōu)解。
最優(yōu)狀態(tài)量隨時(shí)間空間的分布如圖1所示。
圖1 最優(yōu)狀態(tài)量變化圖
由圖1分析可知,最優(yōu)的狀態(tài)量能夠很好地跟蹤我們給出的設(shè)定值。
對(duì)偶狀態(tài)量隨時(shí)間空間的分布如圖2所示。
圖2 最優(yōu)對(duì)偶狀態(tài)量變化圖
由圖2分析可知,最優(yōu)的對(duì)偶狀態(tài)量能夠滿(mǎn)足初始條件和邊界條件。
最優(yōu)的控制量隨時(shí)間和空間的分布如圖3所示。
圖3 控制量變化圖
由圖3分析可知,最優(yōu)的控制量隨著時(shí)間的增大控制量要相應(yīng)的增大,來(lái)達(dá)到最優(yōu)的控制目標(biāo)。
采用變分迭代法解決偏微分方程的最優(yōu)控制問(wèn)題。先由經(jīng)典的極大值原理導(dǎo)出該問(wèn)題的最優(yōu)性條件,即Hamilton-Pontryagin方程導(dǎo)出最優(yōu)性條件,然后給出適當(dāng)?shù)倪吔绾蜋M截性條件。為了求解這些方程,我們使用了全新的變分迭代法進(jìn)行求解。
采用對(duì)近似解析解不斷迭代校正的方法來(lái)通過(guò)多項(xiàng)式函數(shù)逼近真實(shí)解。并且文中由兩個(gè)應(yīng)用實(shí)例說(shuō)明了該方法的有效性。下一步的研究方向是如何改進(jìn)變分迭代法,使得該方法的收斂速度加快,能夠在較快的時(shí)間內(nèi)收斂到真實(shí)解。
[1]EugeniuszZieniuk,Dominik.Parametricintegralequationssystemsin2Dtransientheatconductionanalysis[J].InternationalJournalofHeatandMassTransfer,2014,78(12):571-587.
[2]譚拂曉,劉德榮,關(guān)新平,等.基于微分對(duì)策理論的非線(xiàn)性控制回顧與展望[J].自動(dòng)化學(xué)報(bào),2014,40(1):1-15.
[3]HYe,FLiu,VAnh,etal.Maximumprincipleandnumericalmethodforthemulti-termtime-spaceRiesz-Caputofractionaldifferentialequations[J].AppliedMathematicsandComputation,2014,227(15):531-540.
[4]孫勇,張卯瑞,梁曉玲.求解含復(fù)雜約束非線(xiàn)性最優(yōu)控制問(wèn)題的改進(jìn)Gauss偽譜法[J].自動(dòng)化學(xué)報(bào),2013,39(5):672-678.
[5]程建鋒,董新民,薛建平,等.基于Gauss偽譜法的飛機(jī)最優(yōu)目標(biāo)瞄準(zhǔn)控制[J].計(jì)算機(jī)應(yīng)用,2013,33(11):3291-3295.
[6]Penalty.MPQImethodforconstrainedparabolicoptimalcontrolproblems[J].InternationalJournalofComputerScience,2014,2(12):635-648.
[7]劉西林,王澤文,邱淑芳.基于Priwitt算子的偏微分方程圖像去噪模型[J].計(jì)算機(jī)應(yīng)用,2013,32(12):3385-3388.
[8]郝巖,許建樓.迭代重加權(quán)的小波變分修復(fù)模型[J].電子與信息學(xué)報(bào),2013,35(12):2916-2920.
[9]AndrejCherkaev.Variationalmethodforoptimalmultimaterialcompositesandoptimaldesign[J].InternationalJournalofEngineeringScience,2014,83(12):162-173.
[10]AsgharGhorbani,JafarSaberi-Nadjafi.AneffectivemodificationofHe’svariationaliterationmethod[J].NonlinearAnalysisRealWorldApplications,2009,10(5):2828-2833.
[11]陳學(xué)松,劉富春.一類(lèi)非線(xiàn)性動(dòng)態(tài)系統(tǒng)基于強(qiáng)化學(xué)習(xí)的最優(yōu)控制[J].控制與決策,2013,12(3):20-23.
[12]汪友明,吳青,王文慶.偏微分方程的算子自定義小波解耦算法研究[J].計(jì)算機(jī)仿真,2013,30(2):261-264.
[13]SAKhuri,ASayfy.Variationaliterationmethod:Green’sfunctionsandfixedpointiterationsperspective[J].AppliedMathematicsLetters,2014,32(10):28-34.
Variation iteration method in optimal control ofpartialdifferentialequations
JIANG Bin
(Department of Management & Information Technology, Nantong Vocation & Technical Shipping College, Nantong 226000, China)
Themaximumprincipleisusedtogettheoptimalconditionsofpartialdifferentialequation,andthenvariationiterationmethodisappliedtosolvetheHamilton-Pontryaginequation.Withtwoclassicalexamplesofoptimalcontrol,themathematicalmodelandalgorithmsimulationshowthatitiseffectiveandfeasible.
variationiterationmethod;partialdifferentialequations;optimalcontrol;maximumprinciple.
2016-05-10
江蘇省教育科學(xué)“十二五”規(guī)劃重點(diǎn)資助課題(蘇教科規(guī)領(lǐng)[2015]1號(hào)); 南通航運(yùn)職業(yè)技術(shù)學(xué)院院級(jí)課題(2013HYJY/18)
姜彬(1980-),男,漢族,江蘇如皋人,南通航運(yùn)職業(yè)技術(shù)學(xué)院講師,碩士,主要從事人工智能與智能系統(tǒng)方向研究,E-mail:jiangb_nt@163.com.
10.15923/j.cnki.cn22-1382/t.2016.4.08
TP273
A
1674-1374(2016)04-0348-08