金 奎,孫明軒
(浙江工業(yè)大學(xué) 信息工程學(xué)院,浙江 杭州 310023)
輸入限幅下的迭代學(xué)習(xí)控制
金 奎,孫明軒
(浙江工業(yè)大學(xué) 信息工程學(xué)院,浙江 杭州 310023)
基于Lyapunov-like方法,提出在有限作業(yè)區(qū)間上實(shí)現(xiàn)跟蹤的帶限幅的迭代學(xué)習(xí)控制器設(shè)計(jì).針對(duì)含有非參數(shù)化及部分參數(shù)化不確定性的非線(xiàn)性系統(tǒng),設(shè)計(jì)魯棒迭代學(xué)習(xí)控制器,但該方法不要求已知不確定特性的范數(shù)界.針對(duì)參數(shù)化不確定非線(xiàn)性系統(tǒng),設(shè)計(jì)自適應(yīng)迭代學(xué)習(xí)控制器.在系統(tǒng)滿(mǎn)足有界輸入有界狀態(tài)(BIBS)假設(shè)條件及控制輸入飽和限幅作用下,統(tǒng)一對(duì)上述三類(lèi)系統(tǒng)進(jìn)行分析.理論分析結(jié)果表明:該方案可保證閉環(huán)系統(tǒng)中所有變量的有界性,并且跟蹤誤差能夠在整個(gè)作業(yè)區(qū)間上收斂到零,實(shí)現(xiàn)完全跟蹤.仿真驗(yàn)證了該算法的有效性.
迭代學(xué)習(xí)控制;輸入限幅;有界輸入有界狀態(tài)
迭代學(xué)習(xí)控制(ILC)適于有限區(qū)間[0,T]上完成重復(fù)作業(yè)的被控對(duì)象,利用系統(tǒng)先前的控制經(jīng)驗(yàn)和輸出誤差修正當(dāng)前的控制作用,使系統(tǒng)在[0,T]上實(shí)現(xiàn)輸出完全跟蹤期望的控制任務(wù)[1].二十多年來(lái),因其能達(dá)到常規(guī)反饋控制所不能的控制品質(zhì),已越來(lái)越多地受到人們的關(guān)注.早期的迭代學(xué)習(xí)控制理論以壓縮映像方法進(jìn)行收斂性分析.近年來(lái)興起的基于Lyapunov-like方法的學(xué)習(xí)控制,能有效結(jié)合其他主流控制方法.到目前為止,已發(fā)表文獻(xiàn)大多要求非線(xiàn)性不確定動(dòng)態(tài)特性能夠被參數(shù)化.Sadegh N 和 Kuc T 等[2-3]較早引入 Lyapunov-like函數(shù),將滿(mǎn)足全局Lipschitz連續(xù)條件放寬為局部Lipschitz連續(xù)條件;French M等[4]則采用微分學(xué)習(xí)律處理常參數(shù)擾動(dòng),被學(xué)習(xí)參數(shù)前一次的終值與后一次初值相同,此方法又被稱(chēng)為自適應(yīng)迭代學(xué)習(xí)控制;Dixon W E 等[5]針對(duì)一類(lèi)周期系統(tǒng),基于 Lyapunov-like函數(shù)設(shè)計(jì)重復(fù)控制律分析系統(tǒng)的穩(wěn)定性與收斂性;Sun Ming-xuan等[6]研究了重復(fù)學(xué)習(xí)控制,它不要求初始定位操作,也不要求被學(xué)習(xí)量滿(mǎn)足周期性要求,回避了迭代學(xué)習(xí)控制中初始定位誤差問(wèn)題;陳為勝等[7]針對(duì)周期時(shí)滯非線(xiàn)性參數(shù)化系統(tǒng)設(shè)計(jì)自適應(yīng)學(xué)習(xí)控制方案.但對(duì)于非參數(shù)化不確定非線(xiàn)性系統(tǒng)的學(xué)習(xí)控制研究成果不多.Xu Jian-xin等[8]設(shè)計(jì)變結(jié)構(gòu)迭代學(xué)習(xí)控制,保證了系統(tǒng)的有界性與收斂性,但所設(shè)計(jì)的控制器中包含符號(hào)函數(shù);Ham C等[9]基于Lyapunov直接方法設(shè)計(jì)魯棒迭代學(xué)習(xí)控制;文[10]利用狀態(tài)反饋線(xiàn)性化的方法研究其在無(wú)限時(shí)間區(qū)間上周期作業(yè)的跟蹤控制問(wèn)題;陳彭年等[11]提出了跟蹤周期信號(hào)的自適應(yīng)控制律,保證閉環(huán)系統(tǒng)所有信號(hào)有界和跟蹤誤差趨于零;劉麗等[12]利用控制器中的魯棒部分保證系統(tǒng)穩(wěn)定性,利用學(xué)習(xí)控制部分有效消除系統(tǒng)跟蹤誤差.
實(shí)際中,執(zhí)行器飽和特性廣泛存在,它在很大程度上影響著控制系統(tǒng)的性能,甚至破壞系統(tǒng)的穩(wěn)定性.特別對(duì)于迭代學(xué)習(xí)控制系統(tǒng),信號(hào)沿迭代軸的積分特性以及一些不可重復(fù)性因素存在,使得執(zhí)行器飽和特性對(duì)控制系統(tǒng)性能的影響尤為突出.因此,對(duì)輸入進(jìn)行限幅對(duì)改善系統(tǒng)的性能是非常有必要的.Xu Jian-xin等[13]針對(duì)控制輸入矩陣已知的非線(xiàn)性不確定系統(tǒng),設(shè)計(jì)帶飽和的迭代學(xué)習(xí)控制器,實(shí)現(xiàn)系統(tǒng)完全跟蹤;孫明軒等[14]針對(duì)較為廣泛的一類(lèi)在有限作業(yè)區(qū)間上重復(fù)運(yùn)行的非線(xiàn)性系統(tǒng),提出重復(fù)學(xué)習(xí)控制方法,分別針對(duì)部分限幅和完全限幅學(xué)習(xí)兩種情形,證明系統(tǒng)的有界性和收斂性.
基于Lyapunov-like方法,分別針對(duì)非參數(shù)化,部分參數(shù)化及參數(shù)化三種情形,設(shè)計(jì)魯棒迭代學(xué)習(xí)控制器及自適應(yīng)迭代學(xué)習(xí)控制器,其中所給出的魯棒迭代學(xué)習(xí)律不需利用非參數(shù)化不確定特性的范數(shù)界.在假定系統(tǒng)有界輸入有界狀態(tài)下,考慮帶限幅的控制輸入,將控制輸入限制在一預(yù)先給定的范圍內(nèi),從而使得系統(tǒng)的狀態(tài)保持有界.所設(shè)計(jì)的帶輸入限幅的迭代學(xué)習(xí)控制器,既保證了閉環(huán)系統(tǒng)的有界性,同時(shí)實(shí)現(xiàn)了在有限區(qū)間[0,T]上完全跟蹤.
考慮下述輸入限幅下不確定非線(xiàn)性時(shí)變系統(tǒng),即
式中:k為系統(tǒng)運(yùn)行的重復(fù)次數(shù);xk(t)=[x k,1(t),x k,2(t),…,x k,n(t)]T∈Rn為可測(cè)系統(tǒng)狀態(tài);uk(t)∈R1為限幅的控制輸入,其幅值可預(yù)先給定;f(xk(t),t),g(xk(t),t)∈R1為未知的光滑非線(xiàn)性連續(xù)函數(shù).
考慮系統(tǒng)在區(qū)間[0,T]上重復(fù)作業(yè).給定的期望軌跡xd(t)=[x d,1(t),x d,2(t),…,x d,n(t)]T∈Rn有界,它滿(mǎn)足
理想控制輸入ud(t)在預(yù)定的限幅范圍內(nèi).記各個(gè)狀態(tài)分量誤差ei,k(t)=x d,i(t)-x k,i(t),i=1,2,…,n狀態(tài)誤差為
要實(shí)現(xiàn)的控制目標(biāo)是尋找合適的控制輸入uk(t),使得在其作用下的狀態(tài)誤差ek(t)在整個(gè)作業(yè)區(qū)間[0,T]上收斂于零.為方便敘述,將略寫(xiě)函數(shù),例如,f k(t)=f(xk(t),t),f d(t)=f(xd(t),t).
引入誤差函數(shù)為
其中:αi(i=1,2,…,m,αm=1)為 Hurwitz系數(shù),記α=[α1,α2,…,αm-1,1]T.
對(duì)于系統(tǒng)(1),我們作如下假設(shè):
假設(shè)1 在每次迭代開(kāi)始時(shí),系統(tǒng)滿(mǎn)足初始定位條件xk(0)=xd(0).
假設(shè)2 系統(tǒng)滿(mǎn)足BIBS條件.
假設(shè)3 控制輸入矩陣g k(t)關(guān)于xk(t)滿(mǎn)足局部Lipschitz條件
定義標(biāo)量a的飽和函數(shù)為
式中,a*為飽和函數(shù)的幅值.
為更好地分析系統(tǒng)收斂性,首先給出關(guān)于飽和函數(shù)的性質(zhì)P1.
P1 對(duì)于等式ν=sat(μ)+d,滿(mǎn)足
性質(zhì)P1的證明可參見(jiàn)文獻(xiàn)[13]性質(zhì)2.
注2 實(shí)際系統(tǒng)的能量總是有限的,會(huì)滿(mǎn)足有界輸入有界狀態(tài)這一條件.
假設(shè)2可得系統(tǒng)的有界性.本節(jié)分別針對(duì)含非參數(shù)化,部分參數(shù)化及參數(shù)化不確定性的非線(xiàn)性系統(tǒng)進(jìn)行討論,給出了在輸入限幅下迭代學(xué)習(xí)控制的收斂性證明.
為更好分析閉環(huán)系統(tǒng)的收斂性,給出如下引理.
引理 對(duì)于系統(tǒng)狀態(tài)誤差ek及誤差函數(shù)σk,滿(mǎn)足不等式
證明可參見(jiàn)文獻(xiàn)[15]引理3.該引理將狀態(tài)誤差與誤差函數(shù)聯(lián)系起來(lái),從而為系統(tǒng)的性能分析帶來(lái)方便.
假設(shè)4f k(t)滿(mǎn)足局部Lipschitz條件.
本小節(jié)包含假設(shè)1-4.根據(jù)假設(shè)2,存在未知常數(shù)l f>0,滿(mǎn)足
根據(jù)式(3),并對(duì)誤差指標(biāo)函數(shù)σk進(jìn)行求導(dǎo),得
選取被學(xué)習(xí)量為ud(t),通過(guò)不斷對(duì)理想控制輸入進(jìn)行學(xué)習(xí),使得系統(tǒng)的跟蹤誤差收斂于零.為此,提出以下學(xué)習(xí)律為
假設(shè)5fk可被參數(shù)化,fk=,未知函數(shù)φk滿(mǎn)足局部Lipschitz條件,且時(shí)變函數(shù)θ 的上界為θ*.
本小節(jié)包含假設(shè)1-3.根據(jù)假設(shè)5,存在未知常數(shù)lφ>0,滿(mǎn)足
類(lèi)似地,系統(tǒng)的控制輸入為
本小節(jié)包含假設(shè)1-3及假設(shè)6,根據(jù)式(4)得逆系統(tǒng)方程,得
定理 對(duì)于系統(tǒng)(1),給定期望軌跡(2),當(dāng)滿(mǎn)足結(jié)論C1時(shí),系統(tǒng)狀態(tài)誤差在區(qū)間[0,T]上收斂于零,即
針對(duì)f k(t)非參數(shù)化與g k(t)非參數(shù)化及f k(t)參數(shù)化與g k(t)非參數(shù)化情形下,設(shè)計(jì)全飽和的魯棒迭代學(xué)習(xí)控制器,使得輸出限定在預(yù)先設(shè)定的幅值u*范圍內(nèi);而在f k(t)參數(shù)化及(t)參數(shù)化中,分別對(duì)兩被學(xué)習(xí)參數(shù)采取限幅措施,將輸出限定在范圍內(nèi).實(shí)際中,運(yùn)行系統(tǒng)的執(zhí)行器都會(huì)受到飽和限制.因此,在設(shè)計(jì)控制器時(shí),考慮控制輸入飽和限幅,可確保控制系統(tǒng)性能.
選取一單級(jí)倒立擺系統(tǒng)作為被控對(duì)象.倒立擺的動(dòng)態(tài)方程[16]為
式中:xk,1,xk,2分別為擺的角位移和角速度;g=9.8 m/s2為重力加速度;mc為小車(chē)的質(zhì)量;m為擺的質(zhì)量;l為擺長(zhǎng)的一半;uk為小車(chē)的推力(控制輸入);Δfk為該系統(tǒng)的干擾部分.控制目標(biāo)是使系統(tǒng)輸出yk在[0,2π]內(nèi)跟蹤上目標(biāo)y d=0.1sin(t).選取,mc=1 kg,m=0.1 kg,l=1 m及干擾部分d=sin(t).
采用控制律式(17),對(duì)該系統(tǒng)進(jìn)行仿真,記指標(biāo)J k=supt∈[0,T]|σk|.為使指標(biāo)Jk≤0.001,系統(tǒng)需經(jīng)過(guò)k=13次迭代.參數(shù)u*和γ1分別為5和10,系統(tǒng)初值xk(0)=[0,0.1]T.
圖1-3為系統(tǒng)在式(17)的仿真結(jié)果.圖1表明,指標(biāo)Jk隨著迭代次數(shù)增加而減小;由圖2知,在第13次迭代時(shí),系統(tǒng)輸出誤差δy k=y(tǒng) d-y k精度的數(shù)量級(jí)達(dá)到10-5;圖3為第13次迭代時(shí)系統(tǒng)的控制輸入;由仿真結(jié)果表明:指標(biāo)Jk關(guān)于k單調(diào)遞減,且在第13次迭代時(shí)系統(tǒng)的跟蹤誤差精度數(shù)量級(jí)達(dá)到10-5,從而可得收斂性結(jié)論(limk→∞ek(t)=0,t∈[0,2π]);系統(tǒng)的控制輸入被限制于預(yù)先設(shè)定的范圍內(nèi)(-5~5).仿真結(jié)果與理論分析結(jié)果相符,表明所提方法是可行的.
圖1 輸入限幅下的迭代學(xué)習(xí)控制的J k軌跡Fig.1 Performance index Jk by iterative learning control with input saturation
基于Lyapunov-like方法設(shè)計(jì)了帶飽和限幅的魯棒和自適應(yīng)迭代學(xué)習(xí)控制器.分別針對(duì)含有非參數(shù)化,部分參數(shù)化及參數(shù)化不確定特性的非線(xiàn)性系統(tǒng),討論了限幅學(xué)習(xí)下系統(tǒng)的穩(wěn)定性與收斂性..所提方法要求系統(tǒng)滿(mǎn)足BIBS假設(shè)條件,如何放松這一假設(shè)條件是一個(gè)需要進(jìn)一步研究的問(wèn)題.我們只研究了帶飽和限幅的迭代學(xué)習(xí)問(wèn)題,如何將結(jié)論推廣到重復(fù)控制及重復(fù)學(xué)習(xí)控制中也是我們今后的工作之一.
[1]ARIMOTO S,KAWAMURA S,MIYAZAKI F.Bettering operation of robotics by learning[J].Journal of Robotic Systems,1984,1(2):123-140.
[2]SADEGH N,HOROWITZ R,KAO W W,TOMIZUKA M.A unified approach to design of adaptive and repetitive controllers for robotic manipulators[J].ASME Journal of Dynamic Systems,1990,112(4):618-629.
[3]KUC T,NAM K,LEE J.An iterative learning control of robot manipulators[J].IEEE Journal of Robotics and Automation,1990,6(7):835-841.
[4]FRENCH M,ROGERS E.Nonlinear iterative learning by an adapative Lyapunov technique[J].International of Control,2000,73(11):840-850.
[5]DIXON W E,ZERGEROGLU E,DAWSON D M,et al.Repetitive learning control:a Lyapunov-based approach[J].IEEE Transactions on Robotics,2002,32(4):538-545.
[6]SUN Ming-xuan,GE S S.Adaptive repetitive learning control of robotic manipulators without the requirement for initial repositioning[J].IEEE Transactions on Robotics,2006,22(3):563-568.
[7]陳為勝,王元亮,李俊民.周期時(shí)變時(shí)滯非線(xiàn)性參數(shù)化系統(tǒng)的自適應(yīng)學(xué)習(xí)控制[J].自動(dòng)化學(xué)報(bào),2008,34(12):1556-1560.
[8]XU Jian-xin,QüZhi-hua.Robust iterative learning control for a class of nonlinear systems[J].Automatica,1998,34(8):983-988.
[9]HAM C,QüZhi-hua,Kaloust J.Nonlinear learning control for a class of nonlinear systems[J].Automatica,2001,37(3):419-428.
[10]MARINO R,TOMEI P.An iterative learning control for aclass of partially feedback linearizable systems[J].IEEE Transactions on Automatic Control,2009,54(8):1991-1996..
[11]陳彭年,秦化淑.不確定非線(xiàn)性系統(tǒng)的周期信號(hào)自適應(yīng)跟蹤[J].系統(tǒng)科學(xué)與數(shù)學(xué),2009,29(10):1343-1352.
[12]劉麗,孫明軒.不確定時(shí)變系統(tǒng)的魯棒學(xué)習(xí)控制算法[J].控制理論與應(yīng)用,2010,27(3):323-328.
[13]XU Jian-xin,TAN Ying,LEE T H.Iterative learning control design based on composite energy function with input saturation[J].Automatica,2004,40:1371-1377.
[14]孫明軒,王鄲維,陳彭年.有限區(qū)間非線(xiàn)性系統(tǒng)的重復(fù)學(xué)習(xí)控制[J].中國(guó)科學(xué),2010,40(3):433-444.
[15]XU Jian-xin,CAO Wen-jun.On functional approximation of the equivalent control using learning variable structure control[J].IEEE Transactions on Automatic Control,2002,47(5):997-1006.
[16]CHIEN J C.A combined adaptive law for fuzzy iterative learning control of nonlinear systems with varying control tasks[J].IEEE Transactions on Automatic Control,2008,16(1):40-50.
Iterative learning control with input saturation
JIN Kui,SUN Ming-xuan
(College of Information Engineering,Zhejiang University of Technology,Hangzhou 310023,China)
Based on Lyapunov-like approach,an iterative learning controller with input saturaiton for tracking in the limited time interval is proposed.For a class of nonlinear systems with nonparametric and partially parametric uncertainties,a robust iterative learning controller is designed.But this method does not require the known of the uncertain norm bounds.An adaptive iterator learning controller is designed for the nonlinear system with parametric uncertainties.The three kinds of systems above are analyzed under the systems to meet the bounded input bounded state(BIBS)assumptions and limiting the role of control input saturation.The results show that the proposed learning algorithm can guarantee boundedness of all variables in closedloop system.The tracking error can be guaranteed to converge to zero over entire time interval and perfect tracking can be achieved.The simulation result shows the algorithm is effective.
iterative learning control;input saturation;bounded input bounded state
TP391.41
A
1006-4303(2011)05-0579-07
2010-04-28
國(guó)家自然科學(xué)基金資助項(xiàng)目(60474041,60874041)
金 奎(1985-),男,浙江嵊州人,碩士研究生,研究方向?yàn)榈鷮W(xué)習(xí)控制,E-mail:zjszjk@163.com.通信作者:孫明軒教授,E-mail:mxsun@zjut.edu.cn.
book=5,ebook=113
(
劉 巖)