柴琴琴,林雙杰,林瓊斌
(1.福州大學電氣工程與自動化學院,福建福州350116; 2.福州大學先進控制技術(shù)研究中心,福建福州350116)
時滯系統(tǒng)終端時間參數(shù)優(yōu)化控制
柴琴琴1,2,林雙杰1,林瓊斌1
(1.福州大學電氣工程與自動化學院,福建福州350116; 2.福州大學先進控制技術(shù)研究中心,福建福州350116)
針對時滯系統(tǒng)終端時間優(yōu)化控制問題,提出一種基于參數(shù)化的數(shù)值求解方法.首先將優(yōu)化控制向量用分段常數(shù)函數(shù)來近似;然后引入時間轉(zhuǎn)換方法將未知切換時間點和未知終端時間映射到新時間域的固定時間點上,從而將原未知時域的時間最優(yōu)控制問題近似為固定時域的非線性規(guī)劃問題;最后采用全聯(lián)通粒子群算法求解.資源再生系統(tǒng)優(yōu)化控制問題的仿真結(jié)果表明所提方法是有效的.
時滯系統(tǒng);終端時間最優(yōu);控制參數(shù)化
隨著社會經(jīng)濟的發(fā)展,時間長短成了衡量化工、生物、制藥、工業(yè)制造等過程和企業(yè)效益的重要因素[1-4],時間最優(yōu)控制問題也成了亟需解決的現(xiàn)實問題.時間最優(yōu)控制問題通常可描述為在滿足一定狀態(tài)變量約束的條件下,尋找最優(yōu)控制變量和終端時間,使得目標函數(shù)值最優(yōu).這類優(yōu)化控制問題很難采用極大值原理求解獲得解析解,只能采用數(shù)值方法來求解.常用的策略是首先用罰函數(shù)策略或Lagrange乘子處理約束條件,將約束優(yōu)化控制問題轉(zhuǎn)化為無約束優(yōu)化控制問題;再將時間進行網(wǎng)格劃分,在離散化時間區(qū)間上采用控制參數(shù)化方法將控制向量用分段函數(shù)來近似,其中分段函數(shù)參數(shù)代替原來的控制變量成為待求解的優(yōu)化變量.至此,原帶約束的時間優(yōu)化控制問題轉(zhuǎn)化為以在終端時間和分段函數(shù)參數(shù)為優(yōu)化變量的高維非線性規(guī)劃問題.然而,未知終端時間仍給近似非線性規(guī)劃問題的求解帶來了困難,為此,文[5-7]提出控制參數(shù)化增強轉(zhuǎn)換方法,把未知控制時間和(或)分段函數(shù)切換點時刻均映射到一個新時間尺度的固定時間點上,從而將終端時間未知的優(yōu)化控制問題轉(zhuǎn)化為終端時間已知的優(yōu)化控制問題,然后采用現(xiàn)有的優(yōu)化方法進行求解.該方法已成功應用于求解化工、航天等過程的時間優(yōu)化控制問題[8-9].此外,文[10]針對復雜約束的最優(yōu)控制問題提出一種分階方法來求解時間優(yōu)化控制問題.然而上述方法主要針對非時滯系統(tǒng)設計,實際系統(tǒng)普遍含有時滯,現(xiàn)有數(shù)值求解方法在求解時滯系統(tǒng)時間優(yōu)化控制問題方面具有局限性.為此,研究如何將參數(shù)化控制方法應用于求解時滯系統(tǒng)的時間優(yōu)化問題.
考慮如下時滯系統(tǒng):
其中:T>0為未知終端時間;x∈Rn為狀態(tài)向量;x(t-α)∈Rn為滯后的狀態(tài)向量;α為給定的時滯時間; u(t)∈Rm為系統(tǒng)未知控制向量;f∈Rn為給定的非線性系統(tǒng)函數(shù);φ為0時刻以前系統(tǒng)狀態(tài)函數(shù).假定函數(shù)f為連續(xù)可微函數(shù),且φ為二次連續(xù)可微函數(shù).
假定系統(tǒng)(1)~(2)滿足以下約束:
式中:Tmin、Tmax分別為未知終端時間變化的最小值、最大值;bi、ci,i=1,…,m,分別為第i個未知控制變化的最小值和最大值;gl為第l個狀態(tài)約束條件;Φl為給定非線性函數(shù).則終端時間優(yōu)化控制問題可描述為:
問題(P).給定系統(tǒng)(1)~(2),尋找滿足約束(3)~(5)的最優(yōu)終端時間T和控制參數(shù)u使如下性能指標最優(yōu):
式中:Φ0為給定非線性函數(shù),且式(5)、(6)中Φl具有如下統(tǒng)一形式,其中第一項表示終值項,第二項為積分項.
01N-1Niki=1,…,m為第i個控制變量在第k個區(qū)間段的分段時間函數(shù)高度;χ為指示函數(shù),當t∈[τi-1,τi)時,
令σN=[σ1,…,σN]T,表示分段數(shù)為N時近似的分段函數(shù)高度矩陣,其中σk=[σ1k,…,σmk]T.
針對終端時間未知的問題,令:
首先將控制參數(shù)u在時間域[0,T]上用僅在分段點處可能不連續(xù)的分段常數(shù)函數(shù)來近似,該分段常數(shù)函數(shù)的高度值僅在分段點處發(fā)生改變.假定時間域[0,T]被均勻劃分為N段,則有:
其中:θ>0是未知的時間尺度參數(shù).顯然當N為已知時,原未知的時間域[0,T]映射到了以s表示的新時間尺度上的固定時間域[0,N]上.則時間轉(zhuǎn)換后的控制變量為:
將式(9)~(10)代入原系統(tǒng)方程(1)~(2)中,有:
原系統(tǒng)約束條件(3)~(5)變?yōu)?
目標函數(shù)轉(zhuǎn)化為:
則自由終端時間控制問題(P)可近似為參數(shù)優(yōu)化控制問題(P1).給定的系統(tǒng)(11)~(12),尋找合適的分段數(shù)N,滿足約束(13)~(15)的最優(yōu)時間尺度參數(shù)θ和控制參數(shù)σN最小化目標函數(shù)(16).
顯然分段數(shù)目N的選取會影響求解效率及控制結(jié)果,理論上當N→+∞時問題(P1)的最優(yōu)解將會收斂到原問題(P)的最優(yōu)解[11],然而實際計算過程中不可能使得N→+∞.一方面,分段數(shù)目N可以通過優(yōu)化方法來選取,考慮到分段數(shù)目N為整數(shù),而時間及控制參數(shù)為正實數(shù),若是一起進行優(yōu)化,則優(yōu)化問題將為一個混合整數(shù)動態(tài)規(guī)劃問題,求解困難.此外,隨著N值增加,優(yōu)化問題維數(shù)成倍增長,實際過程中N往往不大.因此,在數(shù)值計算過程中,采用分層優(yōu)化方法,外層優(yōu)化分段數(shù)N,當N為已知時,內(nèi)層求解問題(P1)的優(yōu)化變量σN*、θ*,轉(zhuǎn)外層優(yōu)化.重復上述過程直到目標函數(shù)值的變化滿足精度為止.對每個給定分段數(shù)N,近似優(yōu)化控制問題(P1)是一系列子空間上的參數(shù)優(yōu)化選擇問題,可采用數(shù)學規(guī)劃方法或啟發(fā)式算法求解.然而經(jīng)過參數(shù)化處理后,原問題的未知積分時間隱含在了近似時間優(yōu)化控制問題的時滯非線性系統(tǒng)中,使得時滯變?yōu)榱宋粗?因此,目標函數(shù)對未知參數(shù)的梯度信息不僅與目標函數(shù)有關(guān),還與時滯系統(tǒng)有關(guān),很難直接采用導數(shù)法則求得.另一方面,粒子群算法具有簡單、快速及全局收斂等特點,已成功應用于許多高維約束優(yōu)化問題的求解,針對維數(shù)災難問題本研究將采用具有啟發(fā)性的粒子群算法求解內(nèi)層優(yōu)化控制問題.
3.1 全聯(lián)通粒子群算法
粒子群算法中將候選解叫做粒子,所有粒子的集合稱作種群.粒子群算法中粒子通過對自身經(jīng)驗和社會經(jīng)驗(種群經(jīng)驗)的學習不斷調(diào)整自己的位置和速度,從而更新種群直到找到最優(yōu)結(jié)果為止.考慮到基本粒子群算法中粒子對單一鄰域內(nèi)最優(yōu)粒子經(jīng)驗過分看重而導致重要信息丟失、甚至早熟的缺點,文[12]提出全聯(lián)通粒子群算法(fully informed particle swarm optimization,F(xiàn)IPSO).該算法中粒子的速度和位置按下式進行更新:
其中:p表示粒子群算法尋優(yōu)過程中的第p次迭代;q,q=1,…,M表示種群中粒子編號,M為種群大小; λ=0.729 8為自身學習因子;ψ=ψ1+…+ψβ為鄰域?qū)W習因子,β為粒子的鄰域粒子個數(shù);υp,q、Xp,q分別表示第p次迭代過程中第q個粒子的速度和位置,滿足邊界約束:
Pwq表示第q個粒子從鄰域中獲得的綜合信息其中:ωd∈[0,1]為權(quán)重系數(shù);Pd,q為第q個粒子鄰域中第d個粒子的個體歷史最優(yōu)位置
3.2 基于FIPSO的近似問題求解
粒子群算法只能用來求解僅帶優(yōu)化變量邊界約束的約束優(yōu)化問題,即只能處理邊界約束條件(14),對于含有復雜等式約束或狀態(tài)約束的近似參數(shù)選擇問題無法直接求解.為此,引入罰函數(shù)方法將狀態(tài)約束條件和其它約束條件轉(zhuǎn)化為目標函數(shù)的懲罰項,從而使優(yōu)化問題轉(zhuǎn)化為FIPSO可以求解的形式.則問題(P1)可近似為全聯(lián)通粒子群算法近似求解問題(P2).給定的系統(tǒng)(11)~(12),尋找合適的分段數(shù)N及滿足約束(13)~(14)的最優(yōu)時間尺度參數(shù)θ和控制參數(shù)σN最小化如下目標函數(shù):
式中:ρl,l=1,…,r為給定的較大值正數(shù),表示對違反第r個約束的優(yōu)化變量的懲罰.
對于給定的N,基于FIPSO的近似問題求解,按如下步驟進行:
步驟1.給定粒子群算法參數(shù):種群大小M、學習因子、權(quán)重因子、粒子鄰域、終止條件.
步驟2.初始化滿足式(13)~(14)種群PM、各個粒子速度和鄰域;令個體粒子歷史最優(yōu)位置矩陣等于初始種群PM.對種群中的每個粒子執(zhí)行步驟3.
步驟3.從s=0到s=N求解系統(tǒng)方程(11)~(12)獲得狀態(tài)向量x槇;代入公式(19)中求目標函數(shù)值.
步驟4.與歷史最優(yōu)解相比更新個體粒子的歷史最優(yōu)位置和種群最優(yōu)位置.若種群最優(yōu)解對應的目標函數(shù)值滿足要求或者迭代次數(shù)達到則停止優(yōu)化轉(zhuǎn)步驟6,否則轉(zhuǎn)步驟5.
步驟5.按式(17)更新粒子速度和位置獲得新的種群,當粒子速度或位置超過約束(18)時取其邊界值.按步驟3求對應的目標函數(shù)值;轉(zhuǎn)步驟4.
步驟6.保存得到的最優(yōu)解為σN*、θ*,對應的目標函數(shù)值為J(N,σN*,θ*)、θ*,最優(yōu)解X*;增加分段數(shù)為N/.若分段數(shù)為N與N/所對應的目標函數(shù)值變化量小于精度要求則停止計算,否則轉(zhuǎn)步驟2.
其中:x為生物(魚類)總質(zhì)量,kt;u為開采或捕撈力度,kt.漁業(yè)資源再生優(yōu)化控制問題就是要在維持或超過當前資源規(guī)模的前提下,避免過度捕撈,在最短的時間內(nèi)控制捕撈力度使得效益最大化.即在滿足如下資源約束條件:x(t)≥2,u(t)≥0,0.6≤T≤20(t∈[0,T])的基礎上,最小化代價方程[13]為:
考慮如下漁業(yè)資源再生變化模型[13-14]:
式(22)中第一項為終端時間相關(guān)目標函數(shù),第二項為效益相關(guān)函數(shù)[14].
采用第3節(jié)的方法近似處理后的優(yōu)化控制問題可描述為問題(P3).給定系統(tǒng):
式中:ρ為懲罰系數(shù).
采用Matlab編制求解程序,懲罰系數(shù)ρ=105.FIPSO參數(shù)選擇為:種群為30,迭代次數(shù)2 000次,鄰域中粒子數(shù)為6個,權(quán)重為1/6.當分段數(shù)N分別取2、4、5、8、9、10時,得到的最優(yōu)目標函數(shù)分別為-11.158、-17.491、-25.679、-25.976、-26.160、-26.160.從該結(jié)果可看出,隨著分段數(shù)的增加,目標函數(shù)值減少明顯,當N≥9時,目標函數(shù)值變化小于0.001,達到預設精度要求,因此停止優(yōu)化.N=9時,對應的最優(yōu)時間為T=12.10,目標函數(shù)最優(yōu)值為J=-26.16,狀態(tài)變量和控制向量如圖1和圖2所示.與文[13]結(jié)果T=12.24,J=-26.146相比,雖然采用參數(shù)化方法獲得的目標函數(shù)與文[13]的結(jié)果差不多,但最優(yōu)控制時間更短.此外,從圖1和圖2中可看出控制參數(shù)的變化幅值不大,隨著時間的增長系統(tǒng)有趨于穩(wěn)定的趨勢.
研究一類時變時滯系統(tǒng)終端時間優(yōu)化問題,即針對給定時滯系統(tǒng)尋找合適的終端時間和控制向量使目標函數(shù)最小.針對時滯系統(tǒng)時間最優(yōu)問題難直接求解的問題,提出基于控制參數(shù)化方法和全連通粒子群算法的數(shù)值近似求解方法,并用資源可再生優(yōu)化控制過程的時間優(yōu)化控制問題驗證了所提方法的有效性.
[1]王龍耀,王嵐.頭孢菌素C過濾過程中總過濾時間的優(yōu)化與控制[J].化工學報,2013,64(9):3 256-3 261.
[2]劉澤明,張青斌,豐志偉,等.柔性空間結(jié)構(gòu)時間-燃料多目標優(yōu)化控制研究[J].宇航學報,2010,31(3):724-728.
[3]程國卿,胡金高.限速伺服系統(tǒng)的近似時間最優(yōu)控制方案[J].西安電子科技大學學報(自然科學版),2015(1):180-186.
[4]YEBI A,AYALEW B.Optimal layering time control for stepped-concurrent radiative curing process[J].Journal of Manufacturing Science and Engineering,2015,137(1):011020(1-10).
[5]雷陽,李樹榮,張強,等.基于非均勻參數(shù)化的自由終端時間最優(yōu)控制問題求解[J].系統(tǒng)科學與數(shù)學,2012,32(3): 277-287.
[6]李國棟,劉興高.一種求解最優(yōu)控制問題的變時間節(jié)點控制向量參數(shù)化方法[J].化工學報,2015,66(2):161-167.
[7]LI R,TEO K L,WONG K H,et al.Control parameterization enhancing transform for optimal control of switched systems[J].Mathematical and Computer Modelling,2006,43(11/12):1 393-1 403.
[8]CHAI Q,LOXTON R,TEO K L,et al.A max-min control problem arising in gradient elution chromatography[J].Industrial and Engineering Chemistry Research,2012,51(17):6 137-6 144.
[9]郭尚生,楊榮軍,王良明.非均勻參數(shù)化方法在彈道優(yōu)化中的應用[J].彈道學報,2013,25(1):37-41.
[10]張兵,杜文莉,顏學峰,等.時間最短控制問題求解的分級優(yōu)化策略[J].華東理工大學學報(自然科學版),2007,33 (1):100-103.
[11]TEO K L,GOH C J,WONG K H.A unified computational approach to optimal control problems[M].Essex:Longman Scientific and Technical Publisher,1991:471-486.
[12]MENDES R,KENNEDY J,NEVES J.The fully informed particle swarm:simpler,maybe better[J].IEEE Transactions on Evolutionary Computation,2004,8(3):204-210.
[13]BOCCIA A,F(xiàn)ALUGI P,MAURER H,et al.Free time optimal control problems with time delays[C]//Proceedings of the 52nd IEEE Conference on Decision and Control.Firenze:IEEE Publisher,2013:520-525.
[14]GOLLMANN L,KEM D,MAURER H.Optimal control problems with delays in state and control variables subject to mixed control-state constraints[J].Optimal Control Applications&Methods,2009,30(30):341-365.
(責任編輯:沈蕓)
Final time optimal control for time delay systems using control vector parameterization
CHAI Qinqin1,2,LIN Shuangjie1,LIN Qiongbin1
(1.College of Electrical Engineering and Automation,F(xiàn)uzhou University,F(xiàn)uzhou,F(xiàn)ujian 350116,China; 2.Research Center for Advanced Process Control,F(xiàn)uzhou University,F(xiàn)uzhou,F(xiàn)ujian 350116,China)
A class of final time optimal control problem for time delay systems is considered.A numerical solving method base on control vector parameterization is proposed.In this method,firstly,the control variables are approximated by piecewise constant functions.Then time scaling transformation is used to map the unknown final time and control switching times to fixed time points in a new time horizon.For this,the original final time optimal control problem on an unknown time interval is approximated by a series of nonlinear programming problems on a fix time interval.Finally,a fully informed particle swarm optimization method is then used to solve the approximated problem.Numerical results on a renewable resource optimal control problem demonstrate the effectiveness of the proposed method.
time delay system;final time optimal;control vector parameterization
TP13
A
10.7631/issn.1000-2243.2016.06.0779
1000-2243(2016)06-0779-05
2015-10-26
柴琴琴(1985-),講師,主要從事復雜過程建模、優(yōu)化控制技術(shù)研究,qq.chai@fzu.edu.cn
福建省自然科學基金資助項目(2016J05154);福建省科技重大基金資助項目(2013Y4003);福州大學人才基金資助項目(XRC-1353)