李國軍,韓一士,陳東杰,許中石
(浙江警察學(xué)院公共基礎(chǔ)部,浙江 杭州310053)
迭代學(xué)習(xí)控制(Iterative learning control,簡稱ILC)適用于在有限區(qū)間作重復(fù)操作的場合,通過利用上一次的控制輸入和輸出誤差來產(chǎn)生當(dāng)前次的控制輸入,以便改進(jìn)輸出效果,經(jīng)過多次迭代以后,系統(tǒng)能夠?qū)崿F(xiàn)完全無誤差跟蹤[1-2].由于設(shè)計(jì)簡單,在線計(jì)算量小并且具有動態(tài)特性,所以ILC被應(yīng)用于工業(yè)機(jī)器人控制,化工過程控制等場合.
有限時(shí)間控制(Finite time control,簡稱FTC)方法雖然能夠在有限時(shí)間內(nèi)讓跟蹤誤差趨于零,但它不能抑制確定性擾動.ILC通過多次迭代學(xué)習(xí)以后,能夠完全抑制時(shí)間軸上的確定性擾動.
應(yīng)用ILC方法時(shí),要求每次的初始定位誤差必須等于零或者某個固定值,但這在實(shí)際中不可能做到,因此這種嚴(yán)格的要求限制了ILC的應(yīng)用,也決定著在整個控制過程中不可能做到完全無誤差跟蹤.實(shí)際應(yīng)用時(shí)只能做到在某個指定區(qū)間實(shí)現(xiàn)實(shí)際完全跟蹤(Practical complete tracking,簡稱PCT).在PCT情形下,放松了對初始定位條件的限制,而且PCT允許每次迭代時(shí)初始狀態(tài)各不相同.
為了實(shí)現(xiàn)PCT,很多學(xué)者做了大量有益的工作[3?23].目前的解決方法主要分為兩類,一類是壓縮映射方法,另一類是Lyapunov-like方法.在壓縮映射方法研究過程中,文[5]討論了初始定位誤差對于系統(tǒng)跟蹤性能的影響.通過對系統(tǒng)魯棒性的分析,作者認(rèn)為跟蹤誤差收斂至初始狀態(tài)誤差的某個鄰域,而且該鄰域的半徑和初始定位的誤差大小成正比.因此,要想提高跟蹤性能,必須提高初始定位的準(zhǔn)確度.在固定初態(tài)誤差下,如果利用脈沖函數(shù),系統(tǒng)能夠?qū)崿F(xiàn)完全跟蹤.但在實(shí)際中,脈沖函數(shù)是不存在的,所以這種完全跟蹤也是不可能實(shí)現(xiàn)的.文[6]和[7]指出,在固定初態(tài)誤差(誤差不為零)情形下,迭代學(xué)習(xí)方法能夠?qū)崿F(xiàn)漸近跟蹤,讓誤差漸近收斂于零.文[8-9]提出了一種基于固定初態(tài)誤差的修正方法,能夠在指定區(qū)間上實(shí)現(xiàn)完全跟蹤.對于具有高相對階的系統(tǒng).文[10]提出了一種修正方法,在完成對初態(tài)誤差的修正以后,能夠確保系統(tǒng)達(dá)到完全跟蹤.針對非線性連續(xù)系統(tǒng).文[11]提出了一種針對任意初態(tài)的修正方法,但這種方法不能完全修正初始誤差,而且只適用于一階系統(tǒng).
在收斂性分析過程中,Lyapunov-like方法帶來了很大的方便,并且也取得了一些成果[12?26].目前最流行的Lyapunov-like 方法是時(shí)變邊界層方法和吸引子方法.文[15]引入邊界層的概念,由于邊界層隨著時(shí)間單調(diào)收斂至零,所以在邊界層限定下的控制誤差也漸近收斂至零,但此方法只能漸近跟蹤,達(dá)不到完全跟蹤.文[18-20]利用吸引子達(dá)到了實(shí)際完全跟蹤.對于一類離散時(shí)變不確定系統(tǒng),文[21]提出了一種針對任意初態(tài)和時(shí)變軌跡的離散自適應(yīng)ILC方法,能夠確保系統(tǒng)沿著迭代軸漸近收斂,沿著時(shí)間軸在指定區(qū)間內(nèi)逐點(diǎn)收斂.對于可參數(shù)化非線性系統(tǒng),文[22]解決了非一致性軌跡問題,并引入了復(fù)合能量函數(shù),給收斂性分析帶來了方便.對于帶有時(shí)變迭代參數(shù)的不確定系統(tǒng),文[23]利用內(nèi)模控制方法設(shè)計(jì)參數(shù)學(xué)習(xí)律,確保系統(tǒng)收斂.對于一類反饋可線性化系統(tǒng),文[24]提出了一種狀態(tài)反饋ILC,實(shí)現(xiàn)了漸近跟蹤.但是當(dāng)控制增益受狀態(tài)影響時(shí),文中沒有提出解決方法.在假定控制增益有上下界和不確定部分可參數(shù)化的情形下,文[25]提出了一種帶反饋的ILC方法解決了此類問題.
目前,在任意初態(tài)下實(shí)現(xiàn)實(shí)際完全跟蹤的算法都是基于Lyapunov-like方法.本文提出了一種基于壓縮映射的迭代學(xué)習(xí)算法,該算法在任意初態(tài)下,能夠確保系統(tǒng)收斂并且可以實(shí)現(xiàn)PCT性能,最后通過一個例子驗(yàn)證了該方法的有效性.
考慮下述線性定常系統(tǒng)
其中,t ∈[0,T]是有限時(shí)間;k= 1,2,···表示迭代次數(shù);xi,k(t)∈Rn(i= 1或2),yk(t)∈Rr,uk(t)∈Rm,(相應(yīng)可以簡寫為xi,k,uk,yk)分別表示第k次迭代的系統(tǒng)狀態(tài),控制輸入和輸出向量.A,B,C是合適維數(shù)的系統(tǒng)參數(shù)矩陣,并且B右可逆.
設(shè)yd(t)(簡寫為yd)是給定的期望軌跡,設(shè)x1,d(t)和x2,d(t)(相應(yīng)簡寫為x1,d和x2,d)是給定的期望狀態(tài),ek(t)=yd ?yk表示第k次輸出誤差.
假設(shè)2.1初始狀態(tài)x1,k(0)隨機(jī),x2,k(0)=x2,d(0),并且狀態(tài)x1,k(t)和x2,k(t)可測.
本文研究的情形可以對應(yīng)于實(shí)際受控對象處于靜止?fàn)顟B(tài)(速度誤差為零),但有位移誤差的情形.
本節(jié)的任務(wù)是設(shè)計(jì)一個控制算法,使得系統(tǒng)(2.1)能夠在指定時(shí)間內(nèi)跟蹤上期望軌跡.為此,我們提出下面的控制律.
式中,
其中,h是預(yù)先給定的時(shí)間常量,為B的右逆.
事實(shí)上,控制律中的函數(shù)Θ(t)并不唯一,但必須滿足下面的性質(zhì).
性質(zhì)3.1對于函數(shù)Θ(t),當(dāng)積分上限滿足t ∈[h,T]時(shí),有
證
注3.1這個定理表明,每一個Θ(t)函數(shù),在經(jīng)過2次積分以后有類似于脈沖函數(shù)的作用.在實(shí)際中,脈沖函數(shù)是不存在的,因此可以用這樣一個函數(shù)來代替脈沖函數(shù).
這一節(jié)著重分析系統(tǒng)(2.1)在應(yīng)用控制律(3.1)以后的收斂性.在分析之前,先引入下面的定義和引理.
定義4.1函數(shù)x(t)的λ范數(shù)‖x(t)‖λ按如下方式定義.
其中‖·‖是按以下方式定義的某種范數(shù).如果Z(t)是一個n維向量并且Z(t)=(z1(t),··· ,zn(t))T,那么如果Z(t)是一個矩陣函數(shù)并且Z(t) ={zij} ∈Rm×n,那么關(guān)于λ范數(shù),有下面的引理.
引理4.1
引理4.2設(shè)級數(shù)bk滿足下列條件,
如果0≤ρ<1,那么
上節(jié)提出的控制律(3.1)中,引入了初始修正函數(shù)Θ(t),關(guān)于初始修正有下面的定理.
鄉(xiāng)鎮(zhèn)衛(wèi)生院吊了一夜鹽水的英,第二天一早就稀里糊涂地被救護(hù)車送到縣人民醫(yī)院。她被帶到婦科檢查室,一個年輕女醫(yī)生走進(jìn)來,叫她脫掉褲子。英開始沒有聽清楚,女醫(yī)生又說了一遍,英站在那里不知所措。女醫(yī)生又大聲說了一遍,英明白后開始手忙腳亂地解開褲子,可能因?yàn)檫^于緊張,也可能因?yàn)橛昧μ?,褲子的紐扣散了,叮當(dāng)一聲掉落在地板上。英彎腰撿了好幾次才撿起,像愛護(hù)寶貝一樣,將扣子放進(jìn)了褲兜里。年輕女醫(yī)生瞧了瞧英,緊接著將戴手套的手伸向她下身。英有些猝不及防,還從來沒有人這樣看過自己下半身,更不用說用手不停地去觸摸。
定理4.1如果初始狀態(tài)是任意有限值,CB??赡?并且存在一個矩陣Γ滿足
那么修正控制律(3.1)能夠讓系統(tǒng)(2.1)跟蹤上期望軌跡,并且在區(qū)間t ∈[h,T]上,能夠達(dá)到一致性跟蹤.
證為了方便書寫,記
在控制律(3.1)的作用下,當(dāng)t ∈[0,h],假定軌跡
可實(shí)現(xiàn),即對于下面的系統(tǒng)當(dāng)x?2,d(0)=x2,d(0)時(shí),存在控制量u?d(t) 使得輸出為˙y?d(t).
對于系統(tǒng)(2.1),應(yīng)用控制律(3.1)可得
在上式兩端同時(shí)乘以矩陣C,可得
所以當(dāng)t ∈[0,h]并且‖I ?CBΓ‖<1時(shí),根據(jù)引理4.2可知,
也就是說,在[0,h]上一致收斂于0.
當(dāng)t=h時(shí),根據(jù)Θ(t)函數(shù)的性質(zhì)有
同理,當(dāng)t ∈[0,h]時(shí),可得
在上式兩端同時(shí)乘以矩陣C,可得
同樣假設(shè)下面的軌跡
可實(shí)現(xiàn),即當(dāng)系統(tǒng)(2.1)存在任意初始偏差x?1,d(0)≠ x1,d(0)時(shí),存在控制量u?d(t) 使得輸出為yd?(t).相應(yīng)的虛擬系統(tǒng)如下
該系統(tǒng)相應(yīng)的誤差記為e?k(t)=y?d(t)?yk(t).
由式(4.11)和(4.12)可得
同理,當(dāng)‖I ?CB?!?1時(shí),根據(jù)引理4.2,可得
同樣,當(dāng)t=h時(shí),根據(jù)Θ(t)函數(shù)的性質(zhì)有
根據(jù)上面的推導(dǎo)結(jié)果可知,當(dāng)t=h并且k →∞時(shí),有yk(t)=yd(t)成立,也就是說,相應(yīng)地誤差為零,系統(tǒng)處于理想狀態(tài).
當(dāng)t ∈(h,T]時(shí),對于任意的xi,k+1(t)?xi,k(t),i=1,2,有
當(dāng)i=1時(shí),在上式的兩端同時(shí)乘以矩陣C,并取λ范數(shù),根據(jù)引理4.1可得
當(dāng)λ足夠大,并且‖I ?CBΓ‖<1時(shí),根據(jù)引理4.2可得
當(dāng)i=2時(shí),用同樣的方法能夠得到下面的結(jié)果,
而且,如果對式(4.17)的兩端取導(dǎo)數(shù)后再乘以矩陣C,并通過整理可得到下面的2-D模型.
對于上述的2-D模型,如果A,B,C為矩陣,可根據(jù)下面的線性矩陣不等式得到Γ(詳情見文[26]).
其中,Ar=A,Br=BΓ,Cr=CA,Dr=I ?CBΓ,上標(biāo)T表示轉(zhuǎn)置,P為對稱正定陣.
考慮如下二階系統(tǒng)
該系統(tǒng)的作業(yè)區(qū)間為[0,1],狀態(tài)修正區(qū)間為[0,0.2].系統(tǒng)的跟蹤軌跡為系統(tǒng)運(yùn)行之前初始狀態(tài)為x1,k(0)=0.5rand(rand產(chǎn)生0到1之間的隨機(jī)數(shù)值),x2,k(0)=0,仿真中迭代次數(shù)為15次.
圖5.1中,點(diǎn)線代表期望軌跡,虛線,點(diǎn)劃線與細(xì)實(shí)線分別代表第13,14和15次的實(shí)際軌跡(圖5.2和此相同).從圖中可以看出控制律(3.1) 在t= 0.2 時(shí)完成狀態(tài)修正,完全跟蹤上期望軌跡.
圖5.3和圖5.4中,虛線,點(diǎn)劃線與細(xì)實(shí)線分別代表第13,14和15次的實(shí)際跟蹤誤差.
圖5.1 期望軌跡yd和實(shí)際軌跡yk
圖5.2 期望狀態(tài)軌跡˙yd和實(shí)際狀態(tài)軌跡˙yk
圖5.3 各次迭代實(shí)際跟蹤誤差ek(t)
圖5.4 各次迭代實(shí)際跟蹤狀態(tài)誤差˙ek(t)
圖5.5 相應(yīng)的控制量uk(t)
圖5.5中,虛線,點(diǎn)劃線與細(xì)實(shí)線分別代表第13,14和15次的實(shí)際控制量.從圖中可以看出,在修正狀態(tài)x1,k(t)時(shí),需要很大的控制量.考慮到控制量的限制,一般要求修正時(shí)間不能太短.
上面的仿真驗(yàn)證了本文所提算法對于線性定常系統(tǒng)而言,不僅能夠完成初始狀態(tài)誤差修正,而且能夠在指定區(qū)間達(dá)到一致性跟蹤.
本文討論了線性定常系統(tǒng)存在任意初態(tài)誤差的迭代學(xué)習(xí)控制問題,借助壓縮映射手段,提出了一種帶修正因子的控制策略.在控制過程中,控制算法首先在指定時(shí)間內(nèi)修正初態(tài)誤差.當(dāng)修正好所有的狀態(tài)誤差后,系統(tǒng)能夠達(dá)到無誤差跟蹤.而且本文也從理論和實(shí)踐兩方面驗(yàn)證了此算法的有效性.