基于邊界層的一類不確定系統(tǒng)的迭代學(xué)習(xí)控制*
李向陽田森平
(華南理工大學(xué) 自動(dòng)化科學(xué)與工程學(xué)院, 廣東 廣州 510640)
摘要:針對(duì)一類具有任意初態(tài)和非周期有界擾動(dòng)的不確定非線性時(shí)變系統(tǒng),提出一種基于邊界層的迭代學(xué)習(xí)控制方法,將邊界層設(shè)計(jì)成一個(gè)具有剩余寬度的指數(shù)衰減函數(shù),通過邊界層把任意初態(tài)問題轉(zhuǎn)換為零初值迭代學(xué)習(xí)問題.針對(duì)周期和非周期不確定性擾動(dòng),分別設(shè)計(jì)周期項(xiàng)的學(xué)習(xí)律和非周期項(xiàng)的邊界學(xué)習(xí)律,然后在此基礎(chǔ)上給出了迭代學(xué)習(xí)控制算法.文中給出了相關(guān)定理,并應(yīng)用類Lyapunov方法給出了定理的詳細(xì)證明.仿真結(jié)果表明,所提出的算法是有效的,軌跡跟蹤誤差能收斂到邊界層.
關(guān)鍵詞:不確定系統(tǒng);迭代學(xué)習(xí)控制;初始狀態(tài)問題;邊界層;類Lyapunov方法
中圖分類號(hào):TP273
doi:10.3969/j.issn.1000-565X.2015.03.016
文章編號(hào):1000-565X(2015)03-0111-10
收稿日期:2014-09-29
基金項(xiàng)目:* 國家自然科學(xué)基金資助項(xiàng)目(61403142); 教育部博士點(diǎn)基金資助項(xiàng)目(20120172110026); 華南理工大學(xué)中央高校基本科研業(yè)務(wù)專項(xiàng)資金資助項(xiàng)目-博士啟動(dòng)項(xiàng)目(2014ZB0028)
作者簡介:黃道平(1961-),男,博士,教授,主要從事故障診斷、軟測量研究.E-mail: audhuang@scut.edu.cn
在迭代學(xué)習(xí)控制(ILC)的研究中,往往要求每次迭代的系統(tǒng)初始狀態(tài)和期望軌跡的初值一致[1],但是在實(shí)際應(yīng)用時(shí),每次迭代學(xué)習(xí)不可避免地存在初始誤差,迭代學(xué)習(xí)控制的初始值問題是迭代學(xué)習(xí)控制研究的基本問題.解決初始值問題的方法有初始控制量校正和初始期望軌跡校正等.初始控制量校正方法又可分為壓縮映射方法[2-6]和類Lyapunov方法[7-8].初始期望軌跡校正的方法是在較小的初始時(shí)間區(qū)間上設(shè)計(jì)一段從零初始值到期望軌跡的過渡軌跡[4,9],過渡軌跡之后采用原來的期望軌跡.近年來,基于邊界層的初值問題解決方法也得到關(guān)注[10-11],基于邊界層的方法能兼顧跟蹤誤差的控制精度和初始過渡過程的控制量大小,方便實(shí)際應(yīng)用.
實(shí)際的被控對(duì)象往往是非線性時(shí)變的,除了有周期不確定項(xiàng)外,還有非周期擾動(dòng).對(duì)于周期不確定項(xiàng),如果它滿足線性參數(shù)化條件,即不確定項(xiàng)可分解為一個(gè)與狀態(tài)無關(guān)的未知時(shí)變函數(shù)和一個(gè)與狀態(tài)有關(guān)的已知時(shí)變函數(shù)的乘積的形式,則可以應(yīng)用自適應(yīng)迭代學(xué)習(xí)方法來求解[9,12-17].如果周期不確定項(xiàng)不滿足線性參數(shù)化條件,則不能直接應(yīng)用上述自適應(yīng)迭代學(xué)習(xí)控制方法來求解,文獻(xiàn)[18]應(yīng)用模糊系統(tǒng)建模的方法把系統(tǒng)不確定項(xiàng)建模為滿足上述線性參數(shù)化形式,再采用自適應(yīng)迭代學(xué)習(xí)控制方法求解,同時(shí)建模誤差采用魯棒控制的方法來克服.對(duì)于系統(tǒng)不確定項(xiàng)不滿足線性參數(shù)化條件的迭代學(xué)習(xí)控制問題,文中提出一種直接對(duì)系統(tǒng)不確定項(xiàng)進(jìn)行學(xué)習(xí)的迭代學(xué)習(xí)控制算法;另一方面,對(duì)于非周期擾動(dòng),一般擾動(dòng)的界是有限的[18],根據(jù)該特點(diǎn),提出了一種適合對(duì)非周期擾動(dòng)的界進(jìn)行學(xué)習(xí)的迭代學(xué)習(xí)控制方法.
1問題的提出
考慮如下2-D形式表示的不確定非線性時(shí)變系統(tǒng)的迭代學(xué)習(xí)控制:
?
(1)
假設(shè)1期望軌跡r1(t)在工作區(qū)間t∈[0,T]有n階導(dǎo)數(shù),且有
(2)
假設(shè)2f和b在r的鄰域D(r∈D?Rn)上有界且滿足局部Lipschitz連續(xù)條件,且b的符號(hào)保持不變.設(shè)x1、x2和x為D中系統(tǒng)任意狀態(tài),則有:
(3)
(4)
(5)
(6)
式中,Lf、fM、Lb、bm和bM為適當(dāng)正數(shù).
假設(shè)3d為任意非周期有界擾動(dòng),有
(7)
式中dM(t)為擾動(dòng)的界.
假設(shè)4xi(0,k)為系統(tǒng)狀態(tài)的任意初始值,即?i∈[1,n],xi(0,k)≠ri(0),ri(0)為期望軌跡的初始值,但有x(0,k)∈D.
定義跟蹤誤差為
ei(t,k)=xi(t,k)-ri(t)
(8)
則系統(tǒng)(1)的迭代學(xué)習(xí)控制問題是一個(gè)具有非零初始誤差和周期不確定性以及非周期擾動(dòng)的迭代學(xué)習(xí)控制問題.
由式(8)可以定義滑動(dòng)面S(t,k)為
(9)
式中:e=(e1,e2,…,en)T,為誤差向量;c=(c1,c2,…,cn)T,為Hurwitz多項(xiàng)式的系數(shù)向量,且取cn=1.由Hurwitz多項(xiàng)式的性質(zhì)有,當(dāng)S(t,k)有界收斂時(shí),ei(t,k)也有界收斂.由式(9)有
(10)
對(duì)于系統(tǒng)(1)的迭代學(xué)習(xí)控制,有初始值擾動(dòng)和任意非周期有界擾動(dòng),為此引入邊界層方法來克服其擾動(dòng).
針對(duì)系統(tǒng)(1)的非零初始誤差,設(shè)計(jì)如下時(shí)變邊界層函數(shù):
S(t,k)+φ(t,k),S(t,k)<-φ(t,k)
(11)
式中,S(0,k)為滑動(dòng)面函數(shù)的初始值,φ(t,k)為
(12)
式中:α>0,為衰減因子;δ>0,為跟蹤容許誤差.由式(11)所定義的修正滑動(dòng)面Sφ(t,k)滿足零初始條件,即有
Sφ(0,k)=0
(13)
由式(11)有Sφ(t,k)的導(dǎo)數(shù)為
(14)
式中Iδ(S(0,k))為示性函數(shù),定義為
(15)
在上述邊界層基礎(chǔ)上可以設(shè)計(jì)系統(tǒng)(1)的迭代學(xué)習(xí)控制算法.
為實(shí)現(xiàn)對(duì)非周期擾動(dòng)d(t,k)界的限幅學(xué)習(xí),定義如下飽和函數(shù)
(16)
(17)
對(duì)于式(16)的飽和函數(shù),有如下引理1.
(18)
證明分3種情況證明.
證畢.
對(duì)于系統(tǒng)(1)的控制增益b(t,x),實(shí)際中總是可以對(duì)其獲得一個(gè)粗略的估計(jì),可以以此為基礎(chǔ)進(jìn)行控制算法設(shè)計(jì).
假設(shè)5系統(tǒng)(1)的b(t,x)有一個(gè)符號(hào)相同的估計(jì)b0(t,x),且b0(t,x)同樣滿足式(5)和式(6).
對(duì)式(11)邊界層,設(shè)計(jì)如下限幅學(xué)習(xí)律實(shí)現(xiàn)對(duì)d(t,k)邊界的學(xué)習(xí):
(19)
對(duì)系統(tǒng)(1)中f(t,x)和b(t,x)的迭代學(xué)習(xí),定義如下綜合函數(shù):
(20)
并設(shè)計(jì)如下學(xué)習(xí)律對(duì)其進(jìn)行學(xué)習(xí):
v2(t,k)=v2(t,k-1)+γ2Sφ(t,k)
(21)
式中,γ2>0,為學(xué)習(xí)增益.
(22)
(23)
在上述式(19)和式(21)學(xué)習(xí)律基礎(chǔ)上,設(shè)計(jì)如下控制律對(duì)系統(tǒng)(1)進(jìn)行迭代學(xué)習(xí)控制:
(24)
式中,β≥0,為控制律的反饋增益.
2.3收斂定理及其證明
基于式(19)和式(21)的學(xué)習(xí)律和式(24)的控制律有定理1.
定理1對(duì)于系統(tǒng)(1)的迭代學(xué)習(xí)控制,在時(shí)間區(qū)間t∈[0,T]上進(jìn)行迭代學(xué)習(xí)控制,在滿足假設(shè)1-5前提下,采用式(19)和式(21)的學(xué)習(xí)律和式(24)的控制律,可以實(shí)現(xiàn)所要求的控制精度,即有下列結(jié)論.
(1)Sφ(t,k)有界,且有下式成立:
(25)
(2)S(t,k)有界,且有下式成立:
(26)
證明由式(10)和式(1)有
(27)
由式(14)有
(28)
結(jié)合式(27)和式(28)有
(29)
把式(24)的控制量代入式(29)并整理有
(30)
(31)
由式(12)有
(32)
考慮到式(32),由式(30)有
(33)
定義V(t,k)為如下類Lyapunov函數(shù)[19-21]:
(34)
式中,
(35)
先證明ΔV(t,k)的單調(diào)性,然后證明Sφ(t,k)的收斂性.由式(33)有
ΔV(t,k)=V(t,k)-V(t,k-1)=
(36)
式中,
把式(33)帶入Part0,并考慮零初始條件有
(37)
對(duì)Part1應(yīng)用(a-q)2-(a-h)2=-(q-h)2-2(q-h)(a-q)(式中a、q、h為實(shí)數(shù))有
由學(xué)習(xí)律式(19),上式中第2個(gè)積分的被積函數(shù)可化為
對(duì)上式應(yīng)用引理1有
把上式代入Part1有
(38)
對(duì)Part2應(yīng)用(a-q)2-(a-h)2=-(q-h)2-
2(q-h)(a-q)有
把學(xué)習(xí)律(21)代入上式Part2中有
(39)
把式(37)-(39)代入式(36)有
(40)
式中,
(41)
Part4可以化簡為
(42)
式(41)右邊取絕對(duì)值并考慮式(22)有
(43)
考慮到式(42)和式(43),由式(40)有
(44)
選取
(45)
則由式(44)有
(46)
由于b0與b具有相同的符號(hào),因此ΔV(t,k)是隨k遞減的.
下面證明Sφ(t,k)的收斂性.先證明V(t,1)有界,V(t,k)第1次迭代值為
V(t,1)=ΔV(t,1)+V(t,0).
把式(36)中k=1的情況帶入上式,并采用獲得式(44)的推導(dǎo)方法可得
(47)
當(dāng)滿足式(45)時(shí),由式(47)和定義式(34)有
(48)
(49)
由于V(t,k)有界和收斂,則Sφ(t,k)也有界和收斂,從而e(t,k)和u(t,k)都有界和收斂.
由于
V(t,k)=(V(t,k)-V(t,k-1))+…+
(V(t,2)-V(t,1))+V(t,1),
重復(fù)應(yīng)用式(46)有
對(duì)上式兩邊取極限有
(50)
(51)
因此,根據(jù)式(15)有
即式(25)和式(26)成立.
證畢.
關(guān)于定理1的說明如下:
(1)隨著迭代次數(shù)增加,定理1的迭代學(xué)習(xí)控制算法是把滑動(dòng)面誤差曲線S控制在邊界層[-φ,φ]內(nèi).φ(t,k)可以采用不同的形式,選擇δ>0,一方面可以避免計(jì)算過程中出現(xiàn)的數(shù)值不穩(wěn)定,另一方面可以減少控制量的抖動(dòng).
(2)在應(yīng)用定理1時(shí),不要求像自適應(yīng)迭代學(xué)習(xí)控制那樣要求f(t,x)和b(t,x)滿足參數(shù)化條件,而且只需通過試驗(yàn)數(shù)據(jù)對(duì)b(t,x)進(jìn)行粗略估計(jì),甚至可以直接根據(jù)式(6)取其邊界之間的常數(shù),如sgn(b(t,x))(bm+bM)/2,控制算法自動(dòng)通過迭代學(xué)習(xí)補(bǔ)償未建模部分;當(dāng)b(t,x)的估計(jì)誤差較大時(shí),從式(45)可以看出,需要較大的反饋增益β才能保證時(shí)間域穩(wěn)定性.
(3)從定理1的證明過程中可以看出,只要γ1>0和γ2>0即可保證迭代域的收斂性,但是較大的γ1和γ2具有較快的收斂速度.為保證周期擾動(dòng)的學(xué)習(xí)速度快于非周期擾動(dòng)的學(xué)習(xí)速度,實(shí)際中可以選擇γ2>20γ1,這樣可使控制更加光滑和節(jié)能.
3仿真研究
考慮如下的二階非線性不確定系統(tǒng)[18]:
(52)
式中:
(53)
(54)
d(t,k)=d1sinω1+d2cosω2
(55)
其中,d1=rand,d2=rand,ω1=5rand,ω2=5rand.
式(52)-(55)中,x1(t,k)和x2(t,k)分別為倒立擺的角位移和角速度,g為重力加速度,mc為小車的質(zhì)量,m為擺的質(zhì)量,l為擺的半長度,u為擺的作用力.采用與文獻(xiàn)[18]相同的參數(shù)進(jìn)行仿真,取mc=1,m=0.1,l=1,rand為輸出為0~1之間的隨機(jī)函數(shù).期望軌跡為
(56)
系統(tǒng)狀態(tài)初值為
(57)
圖1 J 1隨迭代次數(shù)k的變化規(guī)律 Fig.1 J 1 versus iterations k
圖2 S(t,k)與φ(t,k)隨時(shí)間的變化規(guī)律 Fig.2 S(t,k) and φ(t,k) versus time
圖3 第10次迭代后的r 1和x 1 Fig.3 r 1 and x 1 at the 10th iteration
圖4 第10次迭代后的r 2和x 2 Fig.4 r 2and x 2 at the 10th iteration
圖5 第10次迭代后的控制輸入u Fig.5 Control input u at the 10th iteration
仿真結(jié)果表明,隨著迭代次數(shù)的增加,系統(tǒng)軌跡的跟蹤誤差迅速減少,經(jīng)過10次迭代后的滑動(dòng)誤差完全在邊界層以內(nèi),得到了滿意的效果.對(duì)比文獻(xiàn)[18]的圖1可以看出,文中方法具有更快的收斂速度.
4結(jié)語
文中提出了一種適合任意初始條件和任意有界干擾的基于邊界層的不確定系統(tǒng)的迭代學(xué)習(xí)控制方法,給出了相關(guān)算法定理,并應(yīng)用類Lyapunov方法給出了詳細(xì)證明,該算法不要求系統(tǒng)的不確定項(xiàng)滿足線性參數(shù)化條件,只需了解不確定部分的粗略估計(jì)和變化范圍,估計(jì)誤差通過迭代學(xué)習(xí)自動(dòng)補(bǔ)償.仿真結(jié)果表明,文中提出的算法是有效的,比要求系統(tǒng)不確定項(xiàng)滿足線性參數(shù)化條件的自適應(yīng)迭代學(xué)習(xí)控制方法具有更好的適用性.
參考文獻(xiàn):
[1]TianSen-ping,XieSheng-li,FuYu-li.Fastalgorithmofiterativelearningcontrol[J].JournalofSouthChinaUniversityofTechnology:NaturalScienceEdition,2002,30(5):37-40.
田森平,謝勝利,傅予力.一種新的迭代學(xué)習(xí)控制快速算法[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2002,30(5):37-40.
[2]PorterB,MohamedSS.Iterativelearningcontrolofpartiallyirregularmultivariableplantswithinitialimpulsiveaction[J].InternationalJournalofSystemsScience,1991,22(3):447-454.
[3]LeeHS,BienZ.Studyonrobustnessofiterativelearningcontrolwithnon-zeroinitialerror[J].InternationalJournalofControl,1996,64(3):345-359.
[4]孫明軒,黃寶健.迭代學(xué)習(xí)控制[M].北京:國防工業(yè)出版社,1999.
[5]ParkKH.Anaverageoperator-basedPD-typeiterativelearningcontrolforvariableintialstateerror[J].IEEETransactionsonAutomaticControl,2005,50(6):865-869.
[6]阮小娥,趙建永.具有初始狀態(tài)不確定性的非線性系統(tǒng)脈沖補(bǔ)償?shù)鷮W(xué)習(xí)控制[J].控制理論與應(yīng)用,2012,29(8):993-1000.
RuanXiao-e,ZhaoJian-yong.Pulsecompensatediterativelearningcontroltononlinearsystemswithinitialstateuncertainty[J],ControlTheory&Applications,2012,29(8):993-1000.
[7]SunMing-xuan,WangDan-wei.Iterativelearningcontrolwithinitialrectifyingaction[J],Automatica,2002,38(7):1177-1182.
[8]LiXD,ChowTWS,HoJKL,etal.Iterativelearningcontrolwithinitialrectifyingactionfornonlinearcontinuoussystems[J].IETControlTheoryandApplicaition,2009,3(1):49-55.
[9]孫明軒,嚴(yán)求真.迭代學(xué)習(xí)控制系統(tǒng)的誤差跟蹤設(shè)計(jì)方法[J].自動(dòng)化學(xué)報(bào),2013,39(3):251-262.
SunMing-xuan,YanQiu-zhen.Errortrackingofiterativelearningcontrolsystems[J].ActaAutomaticaSinica,2013,39(3):251-262.
[10]ChienChiang-ju,HsuChun-te,YaoChia-yu.Fuzzysystem-basedadaptiveiterativelearningcontrolfornonli-nearplantswithinitialstateerrors[J].IEEETransactionsonFuzzySystems,2004,12(5):724-732.
[11]何熊熊,秦貞華,張端.基于邊界層的不確定機(jī)器人自適應(yīng)迭代學(xué)習(xí)控制[J].控制理論與應(yīng)用,2012,29(8):1090-1093.
HeXiong-xiong,QinZhen-hua,ZhangDuan.Adaptiveiterativelearningcontrolforuncertainrobotbasedonboundarylayer[J].ContorlTheory&Applications,2012,29(8):1090-1093.
[12]YinChenkun,XuJian-xin,HouZhongsheng.AnILCschemeforaclassofnonlinearsystemswithtime-varyingparameterssubjecttosecond-orderinternalmodel[C]∥ProceedingsofJoint48thIEEEConferenceonDecisionandControland28thChineseControlConference.Shanghai:IEEE,2009:452-457.
[13]YinChenkun,XuJian-xin,HouZhongsheng.Ahigh-orderinternalmodelbasediterativelearningcontrolfornonlinearsystemswithtime-iteration-varyingparameters[J].IEEETransactionsonAutomaticControl,2010,55(11):2665-2670.
[14]朱勝,孫明軒,何熊熊.嚴(yán)格反饋非線性時(shí)變系統(tǒng)的迭代學(xué)習(xí)控制[J].自動(dòng)化學(xué)報(bào),2010,36(3):454-458.
ZhuSheng,SunMing-Xuan,HeXiong-Xiong.Iterativelearningcontrolofstrict-feedbacknonlineartime-varyingsystems[J].ActaAutomaticaSinica,2010,36(3):454-458.
[15]XuJX,YanR.Oninitialconditionsiniterativelearningcontrol[J].IEEETransactionsonAutomaticControl,2005,50(9):1349-1354
[16]ParkBH,KuntY,LeeJS.Adaptivelearningcontrolofuncertainroboticsystems[J].InternationalJournalofControl,1996,65(5):725-744.
[17]XuJian-xin.Recentadvancesiniterativelearningcontrol[J].ActaAutomaticaSinica,2005,31(1):132-142.
[18]ChienChiang-ju.Acombinedadaptivelawforfuzzyite-rativelearningcontrolofnonlinearsystemswithvaryingcontroltasks[J].IEEETransactionsonFuzzySystems,2008,16(1):40-51.
[19]XuJian-xin,XuJing.Oniterativelearningfromdifferenttrackingtasksinthepresenceoftime-varyinguncertainties[J].IEEETransactionsonSystems,Man,andCybernetics-PartB:Cybernetics,2004,34(1):589-597.
[20]ChiRonghu,HouZhongsheng,XuJianxin.AdaptiveILCforaclassofdiscrete-timesystemswithiteration-varyingtrajectoryandrandominitialcondition[J].Automatica,2008,44(8):2207-2213.
[21]XuJian-xin,YingTan.Acompositeenergyfunction-basedlearningcontrolapproachfornonlinearsystemswithtime-varyingparametricuncertainties[J].IEEETransactionsonAutomaticControl,2002,47(11):1940-1945.
BoundaryLayer-BasedIterativeLearningControlforaClassof
UncertainSystems
Li Xiang-yangTian Sen-ping
(SchoolofAutomationScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510640,Guangdong,China)
Abstract:For a class of uncertain nonlinear time-varying systems with arbitrary initial states and aperiodic bounded disturbance, an iterative learning control (ILC) method on the basis of boundary layer is presented. In this me-thod, boundary layer is designed as a decaying exponential function with residual width, the arbitrary initial state problem of ILC is transformed into a zero initial state problem by the designed boundary layer, and learning laws of periodic and aperiodic terms are designed for periodic and aperiodic disturbances, respectively. On the basis of these two laws, an ILC algorithm is presented, and the corresponding theorem is given with detail proof through Lyapunov-like approach. Simulated results show that the proposed algorithm is effective and is capable of converging trajectory tracking errors to boundary layer.
Keywords:uncertainsystem;iterativelearningcontrol;initialstateproblem;boundarylayer;Lyapunov-likeapproach
Foundationitems:SupportedbytheNationalNaturalScienceFoundationofChina(NSFC) (61403142)andthePh.D.ProgramsFoundationofMinistryofEducationofChina(20120172110026)
?通信作者: 邱禹(1988-),男,博士生,主要從事故障診斷研究.E-mail:qy-zq1988@163.com