陳 琦,王中原,常思江,舒敬榮
(1.南京理工大學(xué)能源與動(dòng)力工程學(xué)院,江蘇南京210094;2.陸軍軍官學(xué)院二系,安徽合肥230031)
求解非光滑最優(yōu)控制問題的自適應(yīng)網(wǎng)格優(yōu)化
陳 琦1,王中原1,常思江1,舒敬榮2
(1.南京理工大學(xué)能源與動(dòng)力工程學(xué)院,江蘇南京210094;2.陸軍軍官學(xué)院二系,安徽合肥230031)
針對(duì)傳統(tǒng)直接配點(diǎn)法在求解非光滑最優(yōu)控制問題時(shí)存在離散誤差大、精度低的問題,提出了一種自適應(yīng)直接配點(diǎn)法。利用局部分段插值多項(xiàng)式逼近最優(yōu)解,將最優(yōu)控制問題離散為非線性規(guī)劃問題,并給出了離散誤差估計(jì)方法,根據(jù)離散誤差的大小確定區(qū)間內(nèi)節(jié)點(diǎn)的加密量,提出了自適應(yīng)網(wǎng)格優(yōu)化算法,利用該算法將大部分節(jié)點(diǎn)配置在非光滑區(qū)域以降低離散誤差。最后通過仿真算例將所提算法與傳統(tǒng)直接配點(diǎn)法和文獻(xiàn)中的擬譜自適應(yīng)算法分別進(jìn)行比較,驗(yàn)證了所提算法的高精度和有效性。
最優(yōu)控制問題;非光滑;直接配點(diǎn)法;網(wǎng)格優(yōu)化;自適應(yīng)算法
近年來,最優(yōu)控制問題的求解引起了人們的廣泛關(guān)注,在實(shí)際的應(yīng)用中,許多最優(yōu)控制問題往往是不光滑的,例如狀態(tài)受約束的非對(duì)稱航天器最優(yōu)控制問題[1]、月球著陸問題[2]、橋式吊車最優(yōu)控制問題[3]等。在文獻(xiàn)[1]研究的非對(duì)稱航天器最優(yōu)控制問題中,原本光滑的最優(yōu)解在對(duì)其中一個(gè)角速度施加不等式約束后,相應(yīng)的控制力矩會(huì)出現(xiàn)不光滑現(xiàn)象。文獻(xiàn)[2]研究了在月球著陸過程中的燃料最優(yōu)控制問題,其數(shù)值仿真表明,在存在推力約束的條件下,控制量會(huì)存在切換現(xiàn)象。文獻(xiàn)[3]研究了橋式吊車的最優(yōu)控制問題,由于對(duì)控制量施加了上下界約束,導(dǎo)致最終的狀態(tài)量不光滑且控制量不連續(xù)。
針對(duì)非光滑最優(yōu)控制問題,國(guó)內(nèi)外學(xué)者進(jìn)行了大量的研究,并提出了較多的方法。文獻(xiàn)[4-5]提出了hp自適應(yīng)偽譜法,設(shè)計(jì)了一種多重區(qū)間分解策略,通過判斷離散誤差的分布情況,來確定區(qū)間分割點(diǎn)位置及子區(qū)間內(nèi)的配點(diǎn)數(shù)。文獻(xiàn)[6]采用hp自適應(yīng)偽譜法研究了無人作戰(zhàn)飛機(jī)的軌跡規(guī)劃問題。文獻(xiàn)[7]同樣以hp自適應(yīng)偽譜法為基礎(chǔ)對(duì)N脈沖軌道進(jìn)行了優(yōu)化設(shè)計(jì)。為了進(jìn)一步提高h(yuǎn)p自適應(yīng)偽譜法對(duì)非光滑問題的求解效率,文獻(xiàn)[8]提出了分段點(diǎn)最佳化思想,提高了分段點(diǎn)收斂至不光滑點(diǎn)的速度。文獻(xiàn)[9]以Chebyshev偽譜法為基礎(chǔ),引入方波脈沖函數(shù),提出了一種復(fù)合Chebyshev有限差分法,該算法具有使用方便、精度高等優(yōu)勢(shì)。文獻(xiàn)[10]提出了一種分段擬譜法,通過設(shè)置分點(diǎn),將時(shí)間區(qū)域在非光滑區(qū)域進(jìn)行劃分,獲得了較高的求解精度。文獻(xiàn)[11]以Chebyshev偽譜法為基礎(chǔ)提出了一種自適應(yīng)算法,通過計(jì)算相鄰2個(gè)配置點(diǎn)上數(shù)值解導(dǎo)數(shù)之差,來確定新分點(diǎn)的位置,從而提高了算法的精度。上述方法針對(duì)求解非光滑問題所做的改進(jìn)均以偽譜法為基礎(chǔ),偽譜法作為一種全局離散方法,存在諸如微分矩陣計(jì)算量大、離散后的非線性規(guī)劃問題(nonlinear programming problem,NLP)的雅克比矩陣較為稠密等缺點(diǎn)[12-13],且隨著節(jié)點(diǎn)數(shù)目的增加,這些缺點(diǎn)會(huì)更加突出。相比于偽譜法,直接配點(diǎn)法作為一種局部離散方法,其本身無需計(jì)算微分矩陣,主要采用分段插值多項(xiàng)式近似狀態(tài)變量和控制變量,因此離散后的NLP規(guī)模很小,雅克比矩陣也更為稀疏,求解效率很高[12-13],近年來得到了廣泛的應(yīng)用[14-17]。但該方法的計(jì)算精度低于偽譜法,且精度降低在求解非光滑最優(yōu)控制問題時(shí)更為突出。若能對(duì)該方法進(jìn)行改進(jìn),在保證計(jì)算效率高的同時(shí),盡可能地降低離散誤差,使其具有和偽譜法相當(dāng)?shù)挠?jì)算精度,那么對(duì)于擴(kuò)大該算法的使用范圍將非常有意義。
有關(guān)直接配點(diǎn)法的改進(jìn),文獻(xiàn)[18-19]提出了密度函數(shù)法,以密度函數(shù)來量化狀態(tài)量和控制量的劇烈變化程度,并以此為基準(zhǔn)重新分配離散節(jié)點(diǎn)。在密度函數(shù)選取合適的條件下,該方法可較快地將非光滑區(qū)域進(jìn)行節(jié)點(diǎn)加密。然而針對(duì)不同的問題,選取合適的密度函數(shù)并不容易。文獻(xiàn)[20-21]均以小波多尺度分析的方法構(gòu)建了相應(yīng)的節(jié)點(diǎn)調(diào)整策略。該方法主要以小波系數(shù)的幅值來確定非光滑區(qū)域,基于小波系數(shù)和二分點(diǎn)的對(duì)應(yīng)關(guān)系,確定下一次迭代步所使用的節(jié)點(diǎn)并進(jìn)行序列優(yōu)化。與以上方法類似,本文也是通過調(diào)整離散節(jié)點(diǎn)的位置來提高求解精度。但在非光滑區(qū)域位置的確定方式上,不同于密度函數(shù)或是小波系數(shù)的方法,本文給出了一種離散誤差的估計(jì)公式,然后根據(jù)該公式得到的離散誤差的大小來確定非光滑區(qū)域的位置,構(gòu)造了一種自適應(yīng)網(wǎng)格更新策略,使節(jié)點(diǎn)能夠根據(jù)離散誤差的大小自動(dòng)調(diào)整,從而避免了密度函數(shù)的挑選以及較為復(fù)雜的小波推導(dǎo)過程,在保證計(jì)算效率的基礎(chǔ)上,提高了直接配點(diǎn)法對(duì)非光滑最優(yōu)控制問題的求解精度,以期為求解非光滑最優(yōu)控制問題提供一種新的思路。最后通過數(shù)值仿真并與文獻(xiàn)中其他算法的對(duì)比驗(yàn)證了所提算法的準(zhǔn)確性和有效性。
考慮一般Bolza型最優(yōu)控制問題:
式中,狀態(tài)變量x(t)∈Rn;控制變量u(t)∈Rm;f為動(dòng)力學(xué)函數(shù);e為終端約束函數(shù);h為路徑約束函數(shù);t0和tf分別為初始和終端時(shí)間;Φ為終端性能指標(biāo)函數(shù);L為性能指標(biāo)被積函數(shù)。
在區(qū)間[t0,tf]內(nèi),將連續(xù)的時(shí)間等分為N段,三階Hermite-Simpson方法通過構(gòu)造3次插值多項(xiàng)式近似子區(qū)間內(nèi)的狀態(tài)變量,記第k個(gè)子區(qū)間為[tk,tk+1](k=0,1,…,N-1),該區(qū)間內(nèi)的3次插值多項(xiàng)式可表示為
邊界條件為
記hk=tk+1-tk,fk=f[x(tk),u(tk),tk],fk+1=f[x(tk+1),u(tk+1),tk+1],Hermite-Simpson方法還需要利用區(qū)間中點(diǎn)處的信息,為此令利用邊界條件及區(qū)間中點(diǎn)處的導(dǎo)數(shù)信息,可得
從式(4)解出a(k)0,a(k)1,a(k)2和a(k)3并帶入到式(2)
將tk+1處的邊值條件帶入式(5)
記xk=x(tk),xk+1=x(tk+1),由式(6)可得
式(7)即為Hermite-Simpson defect向量,該向量構(gòu)成了離散形式的系統(tǒng)微分方程約束。令,其中,式(1)中性能指標(biāo)函數(shù)中的積分項(xiàng)利用復(fù)合Simpson公式求解,這樣連續(xù)的最優(yōu)控制問題式(1)便可在節(jié)點(diǎn)處轉(zhuǎn)換為離散格式為
式中,k=0,…,N-1。從式(8)可看出,連續(xù)的無限維最優(yōu)控制問題被離散為一般的NLP問題,對(duì)于該問題,可采用非線性最優(yōu)化算法進(jìn)行求解。此外,在轉(zhuǎn)換過程中加入了一個(gè)松弛因子δ,該因子的引入在一定程度上保證了離散后的NLP問題可行解的集合是非空的。
由于直接配點(diǎn)法將時(shí)間區(qū)域進(jìn)行了N等分,因此便產(chǎn)生了均勻分布的離散節(jié)點(diǎn),這些節(jié)點(diǎn)不會(huì)根據(jù)離散信息而改變,當(dāng)最優(yōu)控制問題在某些區(qū)域內(nèi)變化劇烈甚至產(chǎn)生不光滑現(xiàn)象時(shí),這種均勻節(jié)點(diǎn)的配置方式將會(huì)產(chǎn)生較大的離散誤差,如果能在這些區(qū)域內(nèi)適當(dāng)增加節(jié)點(diǎn)的數(shù)目,那么可有效地減小離散誤差。
2.1 離散誤差的估計(jì)
節(jié)點(diǎn)更新算法需要利用離散誤差的信息,然而在一般情況下,最優(yōu)控制問題的解事先是未知的,因此離散誤差的大小只能采用特殊的方法進(jìn)行估計(jì),本小節(jié)主要給出離散誤差的估計(jì)公式。求解式(8)得到每個(gè)節(jié)點(diǎn)上的狀態(tài)量xi及其導(dǎo)數(shù)值=fi。為了充分利用節(jié)點(diǎn)上的數(shù)值及其導(dǎo)數(shù)信息,構(gòu)造Hermite插值函數(shù)(t)近似狀態(tài)量x(t),有
式中,Ns為節(jié)點(diǎn)個(gè)數(shù);αi,βi(i=1,2,…,Ns)為Hermite插值基函數(shù)。每個(gè)插值基函數(shù)為2 Ns-1次多項(xiàng)式,并滿足如下條件[18]
式中,Ci(t)為3次B-樣條函數(shù)的基。
考慮區(qū)間[tk,tk+hk],根據(jù)系統(tǒng)微分方程,可知
式(13)的計(jì)算需要準(zhǔn)確的狀態(tài)量x(t)和控制量u(t),但這些均未知。為此,利用上文的和u)來近似求解x(tk+hk),有
對(duì)式(16)兩邊取絕對(duì)值
定義區(qū)間[tk,tk+hk]上的絕對(duì)局部離散誤差
式中
δi,k表示第i個(gè)狀態(tài)量在第k區(qū)間內(nèi)的離散誤差。進(jìn)而可定義最大相對(duì)局部離散誤差
2.2 節(jié)點(diǎn)增加量的確定
設(shè)εtol為預(yù)先設(shè)定的誤差閾值,且,那么需對(duì)第k個(gè)區(qū)間內(nèi)的節(jié)點(diǎn)進(jìn)行加密處理,設(shè)增加的節(jié)點(diǎn)數(shù)為M′k,增加節(jié)點(diǎn)后的離散誤差為。為盡可能提高算法效率,令,因此得
式中,p為離散算法的計(jì)算精度。對(duì)于本文的Hermite-Simpson方法,對(duì)應(yīng)p=4.0[22]。求解式(21)可得區(qū)間k內(nèi)需增加的節(jié)點(diǎn)數(shù)為
考慮到M′k為整數(shù),且過大的M′k會(huì)使離散后的NLP產(chǎn)生稠密的雅克比矩陣,加劇求解難度,為此對(duì)M′k進(jìn)行如下處理:
式中,M1為預(yù)先設(shè)定的常數(shù),用于限制M′k的增長(zhǎng)幅值。
2.3 自適應(yīng)網(wǎng)格更新算法步驟
自適應(yīng)網(wǎng)格更新算法步驟如下。
步驟1 初始化。給定正整數(shù)M0,M1,Nmaxiter以及Niter=1;設(shè)置εtol的值,并在區(qū)間[t0,tf]內(nèi)均勻布置M0個(gè)節(jié)點(diǎn)。
步驟2 求解NLP問題。采用直接配點(diǎn)法在節(jié)點(diǎn)上離散最優(yōu)控制問題式,得到NLP問題,利用內(nèi)點(diǎn)法(interior point optimization,IPOPT)[23]求解該問題,得到xN和uN。
步驟3 估計(jì)離散誤差。根據(jù)式(9)和式(13),構(gòu)造插值函數(shù)?x(t)和?u(t)近似xN和uN,結(jié)合式(18)~式(20)求解每個(gè)區(qū)間內(nèi)的離散誤差。
(2)節(jié)點(diǎn)更新次數(shù)未達(dá)到最大值,即Niter<。
則根據(jù)式(23)計(jì)算M′k個(gè)節(jié)點(diǎn)加入到區(qū)間k中,否則不增加節(jié)點(diǎn),循環(huán)本步操作以遍歷k值。
3.1 能量最優(yōu)控制問題
為了驗(yàn)證本文所提算法的準(zhǔn)確性,本小節(jié)采用該算法求解文獻(xiàn)[24]中具有解析解的非光滑最優(yōu)控制問題:
自適應(yīng)直接配點(diǎn)法的計(jì)算參數(shù)取為M0=5,M1=5,=10,εtol=1×10-5,δ=1×10-10。該最優(yōu)控制問題的解析解為
由解析解可看出,控制量在t=0.3和t=0.7處出現(xiàn)不光滑現(xiàn)象。圖1分別將自適應(yīng)算法和采用均勻節(jié)點(diǎn)的傳統(tǒng)直接配點(diǎn)法的數(shù)值計(jì)算結(jié)果與解析結(jié)果進(jìn)行了對(duì)比,從中可以明顯地發(fā)現(xiàn),由自適應(yīng)算法求解出的控制量在邊界點(diǎn)及t=0.3和t=0.7點(diǎn)均能很好地逼近解析解,而傳統(tǒng)直接配點(diǎn)法則產(chǎn)生了較大的誤差。圖2為狀態(tài)變量的對(duì)比結(jié)果,可以發(fā)現(xiàn)在t=0.3和t=0.7附近,自適應(yīng)算法配置了較多的節(jié)點(diǎn),且節(jié)點(diǎn)處的狀態(tài)變量的值與解析解十分吻合,而傳統(tǒng)直接配點(diǎn)法則不能較好地逼近解析解。
圖1 控制量的數(shù)值解與解析解對(duì)比
圖2 狀態(tài)量的數(shù)值解與解析解的對(duì)比
圖3為每步迭代過程中的節(jié)點(diǎn)配置情況,從中可以看出,自適應(yīng)算法在迭代的過程中能夠自動(dòng)地增加兩端及t=0.3和t=0.7附近的節(jié)點(diǎn)數(shù)目,對(duì)比圖1可知,自適應(yīng)算法所增加節(jié)點(diǎn)的位置正是傳統(tǒng)算法不能較好逼近真值的區(qū)域,這說明自適應(yīng)算法能夠自動(dòng)識(shí)別出離散誤差較大的局域,并對(duì)其進(jìn)行加密節(jié)點(diǎn)處理,這一措施可以有效地提高求解精度。圖4對(duì)比了2種算法的收斂效果,從中可以看出,當(dāng)節(jié)點(diǎn)數(shù)目為30時(shí),自適應(yīng)算法的最大離散誤差為10-4,而傳統(tǒng)算法的離散誤差仍大于3×10-4,若使其誤差接近當(dāng)10-4,所需節(jié)點(diǎn)數(shù)為50個(gè),但此時(shí)自適應(yīng)算法的離散誤差已經(jīng)小于10-5,可見自適應(yīng)算法的收斂速度要明顯快于傳統(tǒng)算法,并且隨著節(jié)點(diǎn)數(shù)的增加,這種差異愈發(fā)明顯。從以上分析可得出,在同樣節(jié)點(diǎn)數(shù)目的情況下,通過合理地安排節(jié)點(diǎn)的配置可以有效地降低離散誤差。以上的仿真對(duì)比結(jié)果驗(yàn)證了本文所提算法在處理非光滑最優(yōu)控制問題時(shí)的準(zhǔn)確性,這為今后算法的有效使用提供了依據(jù)。
圖3 每步迭代過程中的節(jié)點(diǎn)配置
圖4 算法收斂過程
3.2 航天器最優(yōu)控制問題
選取文獻(xiàn)[1]中的航天器最優(yōu)控制問題,采用本文的算法進(jìn)行求解有
式中,ω1(t),ω2(t)和ω3(t)為航天器角速度;I1,I2和I3為航天器轉(zhuǎn)動(dòng)慣量;u1,u2和u3為控制變量。計(jì)算參數(shù)εtol=1×10-6,其他參數(shù)的選取與前文一致。
計(jì)算結(jié)果如圖5~圖9及表1所示。圖5為狀態(tài)量變化曲線,可見求解得到的結(jié)果滿足約束條件,同時(shí)可看出,對(duì)ω1(t)施加約束后,自適應(yīng)算法將大部分節(jié)點(diǎn)配置在靠近約束的區(qū)域。圖6~圖8為最優(yōu)控制量變化曲線,為了驗(yàn)證本文算法的正確性,圖中將自適應(yīng)算法和傳統(tǒng)算法求解的控制量分別與文獻(xiàn)[1]中的結(jié)果分別進(jìn)行了對(duì)比。從圖6可看出,控制量u1在t=40s附近產(chǎn)生了不光滑現(xiàn)象,自適應(yīng)算法與傳統(tǒng)算法所得的結(jié)果均能吻合文獻(xiàn)[1]中的結(jié)果。圖7和圖8分別為u2和u3變化曲線,從中可以看出,自適應(yīng)算法所得的結(jié)果與文獻(xiàn)[1]中的結(jié)果相符,但是傳統(tǒng)算法得到的結(jié)果則不能吻合文獻(xiàn)[1]中的結(jié)果,產(chǎn)生了較大的偏差。由此驗(yàn)證了自適應(yīng)算法的求解精度要高于傳統(tǒng)算法。
圖5 狀態(tài)變量變化曲線
圖6 控制變量u1變化曲線
圖7 控制變量u2變化曲線
圖8 控制變量u3變化曲線
圖9 自適應(yīng)算法和傳統(tǒng)算法計(jì)算誤差對(duì)比(N=28)
表1 本文算法與文獻(xiàn)[11]算法對(duì)比
圖9為在同樣節(jié)點(diǎn)數(shù)目的情況下(28個(gè)),2種算法計(jì)算誤差的對(duì)比曲線??梢钥闯觯瑐鹘y(tǒng)方法使用了均勻分布的離散節(jié)點(diǎn),且在端點(diǎn)及t=40s附近產(chǎn)生了較大的離散誤差。而自適應(yīng)算法采用非均勻的節(jié)點(diǎn)配置方式,將大部分節(jié)點(diǎn)設(shè)置在t=40s附近,極大地降低了離散誤差,從而驗(yàn)證了本文算法的高精度。
針對(duì)該航天器最優(yōu)控制問題,文獻(xiàn)[11]以自適應(yīng)擬譜法進(jìn)行了求解。為了進(jìn)一步考察本文所提的自適應(yīng)直接配點(diǎn)法在每步迭代過程中的性能,表1將本文方法在求解航天器最優(yōu)控制問題時(shí)的每步迭代結(jié)果與文獻(xiàn)[11]中的迭代結(jié)果進(jìn)行了對(duì)比。從中可看出,本文算法需迭代7次,大于文獻(xiàn)[11]中的5次迭代,但所需的節(jié)點(diǎn)數(shù)目卻由176個(gè)減小為28個(gè),降低了84.1%,節(jié)點(diǎn)數(shù)目的降低有助于減小離散后的NLP的規(guī)模,從而提高優(yōu)化求解效率。此外,從表1也可看出,在相同迭代次數(shù)時(shí),本文方法得到的目標(biāo)值要比文獻(xiàn)[11]中得到的目標(biāo)值大,這是由于雖然迭代過程中節(jié)點(diǎn)位置在不斷地調(diào)整,數(shù)量也在不斷地增加,但整體來講其數(shù)量還是偏少的(迭代7步后節(jié)點(diǎn)數(shù)才達(dá)到17),位置也不是最優(yōu)的,而且直接配點(diǎn)法本身的離散精度也要低于擬譜法。因此,在節(jié)點(diǎn)數(shù)目偏少且位置并非最優(yōu)的情況下,其得到的目標(biāo)值便大于文獻(xiàn)[11]中得到的目標(biāo)值。但是這種情況在后續(xù)的迭代中得到了改善,從表1中可看出,從第6步開始,隨著節(jié)點(diǎn)數(shù)目的增加及節(jié)點(diǎn)位置的優(yōu)化,目標(biāo)值在不斷減小,最終得到了比文獻(xiàn)[11]更小的目標(biāo)值,這表明了本文算法在求解精度上具有一定的優(yōu)勢(shì)。
本文對(duì)非光滑最優(yōu)控制問題的數(shù)值解法進(jìn)行了研究,提出了一種自適應(yīng)直接配點(diǎn)法。通過構(gòu)造分段多項(xiàng)式近似狀態(tài)變量和控制變量,將最優(yōu)控制問題離散為非線性規(guī)劃問題,并給出了離散誤差的估計(jì)方法及節(jié)點(diǎn)加密量的計(jì)算公式,根據(jù)離散誤差的大小自適應(yīng)地配置節(jié)點(diǎn)。該算法能夠自動(dòng)地確定出最優(yōu)控制問題中的非光滑區(qū)域,并對(duì)其進(jìn)行加密處理,能較好地解決傳統(tǒng)直接配點(diǎn)法計(jì)算精度有限、收斂速度過慢等問題。此外,通過將數(shù)值算例的結(jié)果與已有文獻(xiàn)中的擬譜自適應(yīng)算法進(jìn)行比較,驗(yàn)證了所提算法僅需較少的節(jié)點(diǎn)便可獲得相當(dāng)?shù)挠?jì)算精度。本文算法具有一定的通用性,可為此類問題的求解提供參考。
[1]Jaddu H.Direct solution of nonlinear optimal control problems using quasi linearization and Chebyshev polynomials[J].Journal of the Franklin Institute,2002,339(4/5):479-498.
[2]Shamsi M.A modified pseudospectral scheme for accurate solution of bang-bang optimal control problems[J].Optimal Control Application and Methods,2011,32(6):668-680.
[3]Ross I M,F(xiàn)ahroo F.A direct method for solving nonsmooth optimal control problems[C]∥Proc.of the International Federation of Automatic Control World Conference,2002:3860-3864.
[4]Darby C L,Hager W W,Rao A V.An hp-adaptive pseudospectral method for solving optimal control problems[J].Optimal Control Application and Methods,2010,32(4):476-502.
[5]Darby C L,Hager W W,Rao A V.Direct trajectory optimization using a variable low-order adaptive pseudospectral method[J].Journal of Spacecraft and Rockets,2011,48(3):433-445.
[6]Liu H M,Ding D L,Huang C Q,et al.UCAV low observable attacking trajectory planning based on adaptive pseudospectral method[J].Systems Engineering and Electronics,2013,35(1):78-84.(劉鶴鳴,丁達(dá)理,黃長(zhǎng)強(qiáng),等.基于自適應(yīng)偽譜法的UCAV低可探測(cè)攻擊軌跡規(guī)劃研究[J].系統(tǒng)工程與電子技術(shù),2013,35(1):78-84.)
[7]Han W H,Yang X,Jiang M Z.Optimal design of N-impulse trajectories based on hp-adaptive pseudospectral method[J].Systems Engineering and Electronics,2013,35(12):2566-2571.(韓威華,楊新,姜萌哲.基于hp自適應(yīng)偽譜法的N脈沖軌道優(yōu)化設(shè)計(jì)[J].系統(tǒng)工程與電子技術(shù),2013,35(12):2566-2571.)
[8]Liu Y B,Zhu H W,Huang X N,et al.Optimal mesh segmentation algorithm for pseudospectral methods for non-smooth optimal control problems[J].Systems Engineering and Electronics,2013,35(11):2396-2399.(劉淵博,朱恒偉,黃小念,等.偽譜法求解非光滑最優(yōu)控制問題的網(wǎng)格優(yōu)化[J].系統(tǒng)工程與電子技術(shù),2013,35(11):2396-2399.)
[9]Marzban H R,Hoseini S M.A composite Chebyshev finite difference method for nonlinear optimal control problems[J].Communication in Nonlinear Science and Numerical Simula-
tion,2013,18(6):1347-1361.
[10]Zhang W.A numerical method for solving nonsmooth optimal control problems[J].Applied Mathematics Journal of Chinese Universities,2009,24(2):207-220.(張穩(wěn).非光滑最優(yōu)控制問題的一種數(shù)值解法[J].高校應(yīng)用數(shù)學(xué)學(xué)報(bào),2009,24(2):207-220.)
[11]Qin T H,Ma H P.Adaptive algorithm for weakly discontinuous solutions of optimal control problems[J].Control and Decision,2013,28(2):313-316.(秦廷華,馬和平.最優(yōu)控制問題弱間斷解的一個(gè)自適應(yīng)算法[J].控制與決策,2013,28(2):313-316.)
[12]Huntington G T,Rao A V.Comparison of global and local collocation methods for optimal control[J].Journal of Guidance,Control,and Dynamics,2008,31(2):432-436.
[13]Huntington G T,Rao A V.A Comparison between global and local orthogonal collocation methods for solving optimal control problems[C]∥Proc.of the AIAA American Control Conference,2007:1950-1957.
[14]Herman A L,Conway B A.Direct optimization using collocation based on high-order Gauss-Lobatto quadrature rules[J].Journal of Guidance,Control,and Dynamics,1996,19(3):592-599.
[15]Hull D G.Conversion of optimal control problems into parameter optimization problems[J].Journal of Guidance,Control,and Dynamics,1997,20(1):57-60.
[16]Tu L H,Yuan J P,Luo J J,et al.Lunar soft landing rapid trajectory optimization using direct collocation method[J].Chinese Space Science and Technology,2008,(4):19-24.(涂梁輝,袁建平,羅建軍,等.基于直接配點(diǎn)法的月球軟著陸軌道快速優(yōu)化[J].中國(guó)空間科學(xué)技術(shù),2008,(4):19-24.)
[17]Geiger B R,Horn J F,Delullo A M,et al.Optimal path planning of UAVs using direct collocation with nonlinear programming[C]∥Proc.of the AIAA Guidance,Navigation,and Control Conference and Exhibit,2006:1-13.
[18]Zhao Y M,Tsiotras P.A density-function based mesh refinement algorithm for solving optimal control problems[C]∥Proc.of the AIAA Infotech and Aerospace Conference,2009.
[19]Zhao Y M,Tsiotras P.Density functions for mesh refinement in numerical optimal control[J].Journal of Guidance,Control,and Dynamics,2011,34(1):271-277.
[20]Jain S,Tsiotras P.Trajectory optimization using multiresolution techniques[J].Journal of Guidance,Control,and Dynamics,2008,31(5):1424-1436.
[21]Feng Z W,Zhang Q B,Tang Q G,et al.Node adaptive refinement for trajectory optimization based on second-generation wavelets[J].Journal of Aerospace Power,2013,28(7):1659-1665.(豐志偉,張青斌,唐乾剛,等.基于二代小波的軌跡優(yōu)化節(jié)點(diǎn)自適應(yīng)加密[J].航空動(dòng)力學(xué)報(bào),2013,28(7):1659-1665.)
[22]Kress R.Numerical analysis[M].New York:Wiley,1998.
[23]Wachter A,Biegler L T.On the implementation of a primaldual interior point filter line search algorithm for large-scale nonlinear programming[J].Mathematical Programming,2006,106(1):25-57.
[24]Benson D A.A Gauss pseudospectral transcription for optimal control[D].Cambridge:Massachusetts Institute of Technology,2005.
E-mail:qiychan@126.com
王中原(1958-),男,研究員,博士,主要研究方向?yàn)轱w行器飛行控制理論與技術(shù)。
E-mail:zywang@njust.edu.cn
常思江(1983-),男,講師,博士,主要研究方向?yàn)閺椉w行與控制技術(shù)。
E-mail:ballistics@126.com
舒敬榮(1974-),男,講師,博士,主要研究方向?yàn)橥鈴椀缹W(xué)。
E-mail:shujr1974@126.com
Adaptive mesh refinement for solving non-smooth optimal control problems
CHEN Qi1,WANG Zhong-yuan1,CHANG Si-jiang1,SHU Jing-rong2
(1.School of Energy and Power Engineering,Nanjing University of Science and Technology,Nanjing 210094,China;2.Department 2,Army Officer Academy of PLA,Hefei 230031,China)
Due to the large discrete errors and low accuracy of the conventional direct collocation method for solving non-smooth optimal control problems,an adaptive direct collocation method is presented.The optimal control problem is transcribed into a nonlinear programming problem by using local piecewise interpolation polynomials to approximate the optimal solution.The estimation method of discrete errors is also presented,and an adaptive mesh refinement algorithm is used to refine the grid by adding nodes to the segments in which the optimal solution is non-smooth,the algorithm is repeated until a user-specified error tolerance is met.Finally,the simulation results demonstrate the utility and efficiency of the proposed method by comparing it with the conventional direct collocation method and the adaptive pseudospectral algorithm respectively.
optimal control problem;non-smooth;direct collocation method;mesh refinement;adaptive algorithm
TP 273.1
A
10.3969/j.issn.1001-506X.2015.06.23
陳 琦(1989-),男,博士研究生,主要研究方向?yàn)轱w行器軌跡優(yōu)化、制導(dǎo)與控制。
1001-506X(2015)06-1377-07
2014-07-14;
2014-10-23;網(wǎng)絡(luò)優(yōu)先出版日期:2014-11-20。
網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20141120.2110.009.html
國(guó)家自然科學(xué)基金(11272356);中國(guó)博士后科學(xué)基金(2013M541676)資助課題