陳建勇,孫明軒
(1.浙江工業(yè)大學(xué)信息工程學(xué)院,浙江杭州 310023;2.溫州科技職業(yè)學(xué)院信息技術(shù)學(xué)院,浙江溫州 325000)
迭代學(xué)習(xí)控制(iterative learning control,ILC)適用于處理具有重復(fù)運(yùn)行特點(diǎn)的被控對象,是一種具備學(xué)習(xí)能力的高級控制技術(shù).它以跟蹤誤差調(diào)整被學(xué)習(xí)信號,不斷修正控制輸入,使得受控對象在整個作業(yè)區(qū)間上實(shí)現(xiàn)對參考信號的完全跟蹤.迭代學(xué)習(xí)控制方法要求系統(tǒng)滿足嚴(yán)格重置條件,即每次迭代作業(yè)開始時刻的系統(tǒng)狀態(tài)與期望狀態(tài)初值保持一致.然而,受復(fù)位精度的限制,系統(tǒng)初態(tài)與期望初態(tài)不一致往往是存在的,這會降低閉環(huán)系統(tǒng)的跟蹤精度.因此,初值問題是迭代學(xué)習(xí)控制領(lǐng)域需要解決的一個基本問題.目前,基于Lyapunov綜合方法設(shè)計(jì)初態(tài)任意情形下的學(xué)習(xí)控制器是值得研究的課題,并已得到一些解決方案.文[1]針對一類模糊系統(tǒng),引入時變邊界層.由于邊界層隨時間單調(diào)遞減,且收斂于零,則被邊界層限定的跟蹤誤差也趨于零.文[2]利用時變邊界層考慮了純反饋系統(tǒng)的初態(tài)誤差問題.文[3]提出初始修正吸引子概念,利用吸引子達(dá)到完全實(shí)際跟蹤.文[4]利用變期望軌跡法,提出了D型、PD型和PID型學(xué)習(xí)算法,在迭代域上解決了參考軌跡慢時變的情況.文[5]構(gòu)造了一種期望誤差軌跡,首次提出誤差跟蹤設(shè)計(jì)方法.相比于變期望軌跡法,它不用每次迭代時重新設(shè)計(jì)初始段軌跡,只需要保證期望誤差軌跡初值與實(shí)際誤差軌跡初值一致即可,有利于拓寬學(xué)習(xí)控制方法的應(yīng)用范圍.
人們在設(shè)計(jì)自適應(yīng)控制器或自適應(yīng)學(xué)習(xí)控制器時,為了增強(qiáng)系統(tǒng)的魯棒性,往往對控制輸入或參數(shù)估計(jì)采取限幅手段,比如飽和函數(shù)或投影算子.然而,僅僅對控制輸入或參數(shù)估計(jì)限幅是不夠的,出于對設(shè)備運(yùn)行安全方面的考慮,需要采取措施對位移-速度等系統(tǒng)狀態(tài)進(jìn)行約束.近年來,受重構(gòu)Lyapunov函數(shù)思想的啟發(fā),障礙李雅普諾夫函數(shù)(barrier Lyapunov function,BLF)的約束控制方法因其無需知道系統(tǒng)的精確解而被廣泛用來解決系統(tǒng)狀態(tài)和系統(tǒng)輸出的約束問題.文[6]針對含狀態(tài)約束的Brunovsky標(biāo)準(zhǔn)型系統(tǒng),首次以約束區(qū)間為定義域構(gòu)造了Lyapunov函數(shù)并結(jié)合使用反推技術(shù).文[7]給出了BLF函數(shù)的嚴(yán)格定義并研究了嚴(yán)格反饋輸出受約束系統(tǒng)的控制問題.在已有的文獻(xiàn)中,學(xué)者們已經(jīng)提出了BLF 函數(shù)的3 種主要類型,包括對數(shù)型[8-9]、積分型[10-11]以及正切型[12-13].文[14]首次提出一種新的障礙Lyapunov函數(shù):二次分式型BLF函數(shù)(quadratic-fraction BLF,QFBLF),用于學(xué)習(xí)控制器設(shè)計(jì).文[15]考慮非參數(shù)不確定系統(tǒng)的學(xué)習(xí)控制問題,利用QFBLF函數(shù)設(shè)計(jì)控制器,實(shí)現(xiàn)控制過程中的狀態(tài)約束.盡管基于BLF思路解決系統(tǒng)狀態(tài)和系統(tǒng)輸出的約束問題已經(jīng)有了一些研究成果,仍需要進(jìn)一步深入探討.
本文討論一類嚴(yán)格反饋非線性系統(tǒng)的誤差約束跟蹤學(xué)習(xí)控制問題.擬構(gòu)造BLF函數(shù)的兩種形式:二次分式型對稱BLF函數(shù)和二次分式型非對稱BLF函數(shù)來分別設(shè)計(jì)控制器.分析表明,兩種控制方案均能實(shí)現(xiàn)跟蹤誤差囿于預(yù)設(shè)的界內(nèi),進(jìn)而實(shí)現(xiàn)迭代過程中對系統(tǒng)狀態(tài)的約束.
考慮在時間區(qū)間[0,T]上重復(fù)運(yùn)行的嚴(yán)格反饋非線性系統(tǒng):
式中:k(=1,2,…)表示重復(fù)作業(yè)次數(shù);xi,k∈R為系統(tǒng)狀態(tài)且分別為系統(tǒng)輸入和系統(tǒng)輸出;θ∈Rn是未知參數(shù);是已知光滑函數(shù),記給定[0,T]上的參考信號r1(t),滿足1≤i≤n,且存在常數(shù)Mi,使得|ri(t)|≤Mi.
本文的控制目標(biāo)是,設(shè)計(jì)學(xué)習(xí)控制器uk,使得迭代學(xué)習(xí)過程中跟蹤誤差囿于預(yù)設(shè)的界內(nèi),以實(shí)現(xiàn)系統(tǒng)狀態(tài)約束;經(jīng)過足夠多次迭代,實(shí)現(xiàn)系統(tǒng)輸出在指定作業(yè)區(qū)間上對參考信號的完全跟蹤.
為表達(dá)簡便,在不引起混淆之處,文中略去函數(shù)的時間自變量.
為了克服系統(tǒng)初態(tài)誤差的不確定性,定義如下函數(shù)[5]:
其中:ek,εk是關(guān)于時間t的函數(shù);是構(gòu)造的期望函數(shù),它包含用來表示誤差衰減性態(tài)的函數(shù)ξ(t).對于ξ(t)的表達(dá)式,應(yīng)是一連續(xù)可導(dǎo)的單調(diào)遞減函數(shù),且滿足:1)ξ(0)=1;2)ξ(t)=0,?t∈[t1,T],t1>0;3)ξ(j)(t1)=0,j=1,2.由條件1)和式(2)可知:εk(t)在t=0時,滿足εk(0)=0,?k.
對于式(2),若ek代表誤差函數(shù),相應(yīng)的可看作期望誤差軌跡(函數(shù)),它將在下一節(jié)的控制器設(shè)計(jì)中起到重要作用.
為了設(shè)計(jì)約束學(xué)習(xí)控制器的需要,這里先給出二次分式型BLF函數(shù)的兩種形式,具體如下:
1) 二次分式型對稱BLF函數(shù)的典型形式為
其中b >0.應(yīng)用BLF函數(shù)(3)時,需假定實(shí)現(xiàn)時系統(tǒng)所受到的各種干擾無法使得|εk|>b,否則會導(dǎo)致系統(tǒng)發(fā)散.
2) 二次分式型非對稱BLF函數(shù)的典型形式為
其中:b1>0,b2>0,且b1/=b2.
針對系統(tǒng)(1),本節(jié)應(yīng)用對稱BLF函數(shù)(3),并結(jié)合反推技術(shù)來設(shè)計(jì)控制器:從步驟1到步驟n-1設(shè)計(jì)虛擬控制器αi,k;步驟n設(shè)計(jì)控制器uk.系統(tǒng)中的未知參數(shù)采用積分學(xué)習(xí)律進(jìn)行估計(jì).控制器具體設(shè)計(jì)過程如下:
定義狀態(tài)誤差
其中α0,k=0.
假設(shè)1存在已知的常數(shù)ηi滿足
一般地,重復(fù)作業(yè)系統(tǒng)的復(fù)位點(diǎn)不一定與期望初態(tài)一致,但復(fù)位點(diǎn)落在以期望初態(tài)為中心的某一鄰域內(nèi),這一點(diǎn)是可以被允許的,因此假設(shè)1是合理的.
步驟1迭代運(yùn)行時,系統(tǒng)初態(tài)誤差一般是存在的,定義跟蹤誤差
取虛擬控制
取如下對稱BLF函數(shù):
對V1,k求導(dǎo),并將式(11)代入,得
步驟i(2≤i≤n-1) 類似于步驟1,定義跟蹤誤差
對εi,k求導(dǎo),得
取虛擬控制
取如下對稱BLF函數(shù):
對Vi,k求導(dǎo),將式(17)代入并化簡,得
由于
式(19)重寫為
步驟n定義跟蹤誤差
對εn,k求導(dǎo),得
設(shè)計(jì)控制律
以及積分學(xué)習(xí)律
將式(23)代入式(22),得
取如下對稱BLF函數(shù):
對Vn,k求導(dǎo),并將式(24)-(25)代入,得
假設(shè)2對?k,當(dāng)t=0時,
定理1非線性系統(tǒng)(1),滿足假設(shè)1-2,采用控制律(23)以及積分學(xué)習(xí)律(24),則系統(tǒng)有以下性質(zhì):
i) 系統(tǒng)中所有信號有界,且
ii) 保證迭代過程中,|εi,k|<bi成立,同時系統(tǒng)狀態(tài)有界約束始終滿足.
證i) 變量有界性和系統(tǒng)收斂性.
根據(jù)假設(shè)2 可知‖εk(0)‖2=0≤‖εk(T)‖2,這里εk=[ε1,kε2,k… εn,k]T.由式(26),得
把式(27)代入式(29),并重復(fù)式(29)k次,得
ii) 系統(tǒng)狀態(tài)的有界約束.
根據(jù)式(27),在各次迭代過程中,有|εi,k|<bi.首先證明x1,k的有界約束.由于ξ1的單調(diào)遞減性,由式(7)并結(jié)合假設(shè)1可知因?yàn)閞1的有界性,可得
證畢.
由定理1可以看出,運(yùn)用本節(jié)構(gòu)造的二次分式型對稱BLF函數(shù),通過將εi,k囿于預(yù)設(shè)的界內(nèi),以實(shí)現(xiàn)對狀態(tài)的約束.
被控對象中,系統(tǒng)狀態(tài)約束不總是對稱的,更多的是以非對稱約束形式存在.因此,設(shè)計(jì)合適的非對稱BLF函數(shù)更有實(shí)際作用.針對系統(tǒng)(1),本節(jié)應(yīng)用非對稱BLF函數(shù)(4),并結(jié)合反推技術(shù)來設(shè)計(jì)控制器.系統(tǒng)中的未知參數(shù)采用微分-差分學(xué)習(xí)律進(jìn)行估計(jì).控制器具體設(shè)計(jì)過程如下:
需要聲明的是,本節(jié)控制器設(shè)計(jì)過程中使用到的一些變量標(biāo)記及其含義與第3.1節(jié)的相同,此處不再重復(fù)描述,本節(jié)只寫出一些不相同的變量.
步驟1令
取虛擬控制
將式(34)代入式(9),得
取如下非對稱BLF函數(shù):
式中 δ∈[0,1).對V1,k求導(dǎo),并將式(35)代入,得
步驟i(2≤i≤n-1) 令
取虛擬控制
其中v2,k=0,而vi,k的設(shè)計(jì)類似于上一節(jié)的它的表達(dá)式將在下面給出.將式(38)代入式(15),得
取如下非對稱BLF函數(shù):
對Vi,k求導(dǎo),并將式(39)代入,得
要使βi,k=0,則vi,k的表達(dá)式如下:
由于
式(41)重寫為
步驟n 令
設(shè)計(jì)控制律
以及微分-差分學(xué)習(xí)律
將式(44)代入式(22),得
取如下非對稱BLF函數(shù):
對Vn,k求導(dǎo),并將式(45)-(46)代入,得
定理2非線性系統(tǒng)(1),滿足假設(shè)1-2,采用控制律(44)以及微分-差分學(xué)習(xí)律(45),則系統(tǒng)有以下性質(zhì):
i) 系統(tǒng)中所有信號有界,且
ii) 保證迭代過程中,-bi1<εi,k<bi2成立,同時系統(tǒng)狀態(tài)有界約束始終滿足.
證i) 變量有界性和系統(tǒng)收斂性.
選擇第k次的障礙Lyapunov泛函為
連續(xù)2次迭代周期的差分為
將式(48)代入式(51),得
令t=T,重復(fù)式(52)k次,并結(jié)合Lk(T)的非負(fù)性,得
因?yàn)長1(T)有界,則由于閉環(huán)系統(tǒng)中的所有參數(shù)保持有界,可以得出是有界的.由于其導(dǎo)數(shù)一致有界,在區(qū)間[0,T]上利用Barbalat引理,可知=0.
ii) 系統(tǒng)狀態(tài)的有界約束.
由定理2中第i)部分證明可知,在各次迭代過程中,有-bi1<εi,k<bi2.現(xiàn)在證明本定理中的狀態(tài)有界約束,步驟類似于定理1中第ii)部分的證明過程.由于x1,k=可得到其中:由于xi,k=同樣可以證明,其中:證畢.
可以看出,運(yùn)用本節(jié)構(gòu)造的二次分式型非對稱BLF函數(shù),通過將εi,k囿于預(yù)設(shè)的界內(nèi),間接地實(shí)現(xiàn)對狀態(tài)的約束.
綜上,本文通過引入期望誤差軌跡來解決迭代學(xué)習(xí)系統(tǒng)的初值問題,且期望誤差軌跡的設(shè)計(jì)方法簡單.構(gòu)造了二次分式型BLF函數(shù)的兩種典型形式來分別設(shè)計(jì)控制器.由定理1-2的分析和證明部分可以看出,跟蹤誤差在迭代過程中囿于預(yù)設(shè)的界內(nèi),從而實(shí)現(xiàn)對系統(tǒng)狀態(tài)的有界約束.
為驗(yàn)證所提算法的有效性,考慮如下二階嚴(yán)格反饋非線性系統(tǒng):
取i=1,2,當(dāng)t∈[0,t1]時,
根據(jù)對稱BLF函數(shù)和非對稱BLF函數(shù)這兩種情形,分別進(jìn)行仿真:
1) 對稱BLF函數(shù)情形.
設(shè)定|x1,k|<1.61和|x2,k|<6.78以及b1=0.01,b2=0.5.采用控制律(23)以及積分學(xué)習(xí)律(24),迭代20次后,仿真結(jié)果如圖1-4所示.
圖1 情形1下的x1(t)及其期望軌跡r1(t)Fig.1 x1(t)and its desired trajectory r1(t)in Case 1
圖2 情形1下的控制輸入Fig.2 Control input in Case 1
圖3 情形1下的e1(t)和期望誤差軌跡Fig.3 e1(t)and the desired error trajectory in Case 1
圖4 情形1下的誤差性能指標(biāo)JkFig.4 Error performance index Jk in Case 1
2) 非對稱BLF函數(shù)情形.
設(shè)定
采用控制律(44)以及微分-差分學(xué)習(xí)律(45),迭代20次后,仿真結(jié)果如圖5-8所示.
圖5 情形2下的x1(t)及其期望軌跡r1(t)Fig.5 x1(t)and its desired trajectory r1(t)in Case 2
圖6 情形2下的控制輸入Fig.6 Control input in Case 2
圖7 情形2下的e1(t)和期望誤差軌跡Fig.7 e1(t)and the desired error trajectory in Case 2
圖8 情形2下的誤差性能指標(biāo)JkFig.8 Error performance index Jk in Case 2
圖1和圖5表明,由t=0.2起系統(tǒng)輸出完全跟蹤上參考信號;圖3和圖7表明,本文提出的兩種控制方案都能夠在任意初值下,使得狀態(tài)誤差在整個作業(yè)區(qū)間上實(shí)現(xiàn)對期望誤差軌跡的精確跟蹤;圖4和圖8可以看出在迭代過程中,|ε1,k(t)|,t∈[0,T]被約束于[0,b1]區(qū)間內(nèi).
為了比較,采用無約束學(xué)習(xí)控制
以及積分學(xué)習(xí)律
進(jìn)行仿真,期望誤差軌跡的構(gòu)造及各參數(shù)值選取同前.圖9是控制律(55)作用下,|ε1,k|隨迭代次數(shù)變化的情況.可以看出,無約束學(xué)習(xí)控制策略不能保證Jk≤b1.
圖9 無約束學(xué)習(xí)控制下的Jk收斂過程Fig.9 The convergence performance of Jk without BLF
本文給出一類嚴(yán)格反饋非線性系統(tǒng)的學(xué)習(xí)控制算法.文中構(gòu)造兩種形式簡單的二次分式型BLF函數(shù),并結(jié)合反推技術(shù)分別進(jìn)行控制器設(shè)計(jì),保證系統(tǒng)狀態(tài)在各次迭代中受到約束.為了解決初值問題,引入期望誤差軌跡,實(shí)現(xiàn)系統(tǒng)輸出在預(yù)指定區(qū)間上精確跟蹤參考信號.