王守勤,賀興時(shí),耿 燕
(西安工程大學(xué) 理學(xué)院,陜西 西安 710048)
迭代學(xué)習(xí)控制(iterative learning control, ILC)是一種具有學(xué)習(xí)功能的高效控制方法,適用于具有重復(fù)運(yùn)動(dòng)特性的控制系統(tǒng)[1-2]。ILC通過(guò)學(xué)習(xí)先前迭代時(shí)的輸入信息和誤差情況,更新進(jìn)入下一次迭代的控制輸入,在有限時(shí)間內(nèi)實(shí)現(xiàn)輸出軌跡與期望軌跡的偏差趨于零[3-4]。自ARIMOTO等提出迭代學(xué)習(xí)控制理論后,引起了研究者的廣泛關(guān)注[5]。為達(dá)到滿意的控制效果,通常假設(shè)輸入與輸出間的參數(shù)矩陣是已知且不變的。然而在實(shí)際運(yùn)行過(guò)程中,參數(shù)矩陣是未知且變化的[6-8]。為處理這種參數(shù)不確定的情況,學(xué)者們開(kāi)始從自適應(yīng)角度來(lái)設(shè)計(jì)迭代學(xué)習(xí)控制策略,從而形成了自適應(yīng)迭代學(xué)習(xí)控制(adaptive iterative learning control,AILC)理論[9-11]。
一方面,傳統(tǒng)的D-型(derivative-type)、P-型(proportional-type)及最優(yōu)ILC要求期望軌跡在系統(tǒng)運(yùn)行過(guò)程中沿著迭代方向嚴(yán)格重復(fù)[12-15]。期望軌跡作為系統(tǒng)跟蹤的參考對(duì)象,其性能很大程度上影響了系統(tǒng)跟蹤的難易程度。在跟蹤過(guò)程中,由于噪聲、環(huán)境、氣候等因素,會(huì)出現(xiàn)輸出跟蹤難度大、軌跡偏移等問(wèn)題。如何解決軌跡偏移問(wèn)題并提高系統(tǒng)的跟蹤性能,是一項(xiàng)極具挑戰(zhàn)性的難題,目前這方面的研究甚少。文獻(xiàn)[16]針對(duì)含有未知不確定參數(shù)的非重復(fù)線性離散系統(tǒng),提出一種迭代學(xué)習(xí)控制策略,實(shí)現(xiàn)了系統(tǒng)的跟蹤任務(wù)。然而,算法的收斂條件仍依賴于系統(tǒng)參數(shù)矩陣的對(duì)角元素的精確信息。文獻(xiàn)[17]研究了迭代學(xué)習(xí)控制系統(tǒng)在期望軌跡偏移時(shí)的輸出跟蹤問(wèn)題,提出一種魯棒自適應(yīng)迭代學(xué)習(xí)控制算法。但是,只有當(dāng)所有系統(tǒng)參數(shù)都收斂時(shí),才能實(shí)現(xiàn)該算法的收斂性。文獻(xiàn)[18]通過(guò)最優(yōu)化目標(biāo)函數(shù)設(shè)計(jì)ILC控制器,給出了一種自適應(yīng)迭代學(xué)習(xí)算法處理期望軌跡批量變化問(wèn)題。然而文章所描述的期望軌跡依賴于參數(shù)矩陣的精確信息。如果文獻(xiàn)[16-18]中的系統(tǒng)參數(shù)信息未知或不可用,那么所設(shè)計(jì)的ILC策略將失去意義。不僅系統(tǒng)的收斂性條件無(wú)法滿足,而且系統(tǒng)輸出對(duì)偏移的期望軌跡的跟蹤也無(wú)法實(shí)現(xiàn)。另一方面,D-型、P-型等傳統(tǒng)的ILC控制策略的收斂性條件都依賴于精確的系統(tǒng)模型參數(shù)(或矩陣)。值得注意的是,最優(yōu)ILC算法不僅收斂性條件依賴于精確的模型信息,學(xué)習(xí)控制律的構(gòu)建也依賴于精確的模型信息。
本文針對(duì)參數(shù)未知的單輸入、單輸出離散時(shí)變系統(tǒng),分析ILC算法在期望軌跡偏移的情況下的魯棒性能。首先,通過(guò)最小化實(shí)際輸出與估計(jì)輸出之間的誤差設(shè)計(jì)參數(shù)自適應(yīng)算法;其次,將估計(jì)的系統(tǒng)下三角參數(shù)矩陣和偏移的軌跡信息引入到ILC算法的構(gòu)建中。最后通過(guò)數(shù)值仿真驗(yàn)證所提AILC算法的有效性。
考慮下述單輸入、單輸出的線性離散時(shí)變系統(tǒng):
(1)
式中:TN-1={0,1,…,N-1},TN={1,2,…,N};k∈N+,為系統(tǒng)迭代運(yùn)行的次數(shù);t為離散時(shí)間;uk(t)∈R和yk(t)∈R分別為系統(tǒng)的單輸入和單輸出向量;xk(t)∈Rn為系統(tǒng)的狀態(tài)向量;A(t)、b(t)和c(t)分別為具有恰當(dāng)維數(shù)的參數(shù)矩陣。為了方便文章的敘述與說(shuō)明,將系統(tǒng)的期望軌跡設(shè)為rk(t),隨著迭代次數(shù)的增加而發(fā)生變化。
為了進(jìn)一步的討論,將輸入uk(t)、輸出yk(t)用超向量形式表示,即
yk=(yk(1),yk(2),…,yk(N))T
uk=(uk(0),uk(1),…,uk(N-1))T
因此,系統(tǒng)(1)可改寫為
yk=Puk
(2)
式中:矩陣P是由A(t)、b(t)和c(t)形成的下三角參數(shù)矩陣,即
記為
將矩陣P中的下三角部分用不同維數(shù)的向量pi∈Ri表示,即
p1=p11,p2=(p21,p22)T,…,
pN=(pN1,pN2,…,pNN)T
綜上所述,系統(tǒng)(2)可轉(zhuǎn)換成向量形式:
(3)
由于系統(tǒng)參數(shù)信息未知,導(dǎo)致參數(shù)矩陣P和向量pi未知。然而,傳統(tǒng)的P-型、D-型ILC算法的收斂性條件依賴于部分參數(shù)信息。本文考慮利用參數(shù)矩陣P的估計(jì)信息代替精確值,減少ILC收斂或魯棒性條件對(duì)參數(shù)信息的依賴性。
假設(shè)rk=(r(1)+Δrk(1),r(2)+Δrk(2),…,r(N)+Δrk(N))T是具有不確定性的期望軌跡,迭代學(xué)習(xí)控制的目標(biāo)是產(chǎn)生控制輸入序列{uk+1}驅(qū)動(dòng)系統(tǒng)(2)(或者(3)),使得輸出軌跡隨著迭代次數(shù)的增加盡可能快地跟蹤上期望軌跡rk。為了進(jìn)一步討論,考慮如下假設(shè)成立:
假設(shè)1參數(shù)矩陣P是非奇異的。
假設(shè)2參數(shù)矩陣P是有界的。
假設(shè)3期望軌跡rk是有界的。因此,存在常數(shù)h,使得?k∈N+,有‖rk‖2≤h成立。
(4)
(5)
式中:μ>0,是權(quán)重因子。
(6)
(7)
引理1[19]A、B、R、Y和X分別是適當(dāng)維數(shù)的矩陣。若矩陣A、B和R都是非奇異的,A-1已知,且已知矩陣B=A+XRY,則矩陣B-1可由式(8)獲取:
B-1=A-1-A-1X(R-1+YA-1X)-1YA-1
(8)
根據(jù)引理1,易得
(9)
(10)
(11)
針對(duì)自適應(yīng)迭代學(xué)習(xí)控制系統(tǒng)的軌跡偏移問(wèn)題,考慮通過(guò)目標(biāo)函數(shù)(12)獲取迭代學(xué)習(xí)控制策略:
(12)
對(duì)目標(biāo)函數(shù)(12)關(guān)于uk+1求偏導(dǎo),并令偏導(dǎo)數(shù)為零,得到控制輸入的更新策略為
uk+1=uk+(PTP)-1PTζk=uk+P-1ζk
(13)
式中:ζk=rk+1-yk。
(14)
(15)
(16)
對(duì)式(15)兩邊同時(shí)取2-范數(shù),并將式(16)代入其中,可得
(17)
(18)
根據(jù)式(17)和(18),可得
(19)
將式(19)依次迭代進(jìn)行下去,可得
(20)
證明根據(jù)跟蹤誤差的定義ek=rk-yk,可得
(21)
(22)
在式(22)兩側(cè)取2-范數(shù),可得
(23)
由假設(shè)3可知,?i∈{1,2,…,k},存在正整數(shù)N1,當(dāng)k>N1時(shí),有
‖Δri‖2=‖ri-ri-1‖2≤2h
(24)
(25)
(26)
式中:0 由定理1的結(jié)論可知,存在正整數(shù)l,當(dāng)k-m>N2時(shí),有 (27) 利用范數(shù)不等式性質(zhì)及式(27),可得 (28) (29) 根據(jù)式(25)、(26)和式(29),當(dāng)k-m>max{N1,N2}時(shí),有 (30) 式中:d1+d2 將式(24)、(30)代入式(23),可得 (31) 從而當(dāng)k→∞時(shí),可得 (32) 因此輸出誤差ek是有界的。 為了分析所設(shè)計(jì)的自適應(yīng)迭代學(xué)習(xí)控制算法在軌跡偏移問(wèn)題中的有效性,考慮利用文獻(xiàn)[20]的一個(gè)線性離散系統(tǒng)的實(shí)例進(jìn)行仿真。該線性SISO離散系統(tǒng)模型描述為 (33) 式中:t∈TN,t的最大值為N=200。選取迭代變化的期望軌跡為 (34) 式中:m(k)是在區(qū)間[-0.03,0.03]上均勻分布且迭代變化的隨機(jī)數(shù)。m(k)的迭代變化情況如圖1所示。 圖 1 隨機(jī)變量m(k)的迭代變化 為了更清晰明了地展示本文所描述的AILC方案的效果,考慮將其與經(jīng)典的P-ILC算法(35)的跟蹤性能 uk+1=uk+γek (35) 進(jìn)行比較。式中:ek為輸出誤差;γ為學(xué)習(xí)增益。圖2為本文所設(shè)計(jì)的AILC算法與學(xué)習(xí)增益γ=0.2和γ=0.5的P-ILC算法的跟蹤誤差對(duì)比結(jié)果。 圖 2 AILC與P-ILC的‖ek‖2對(duì)比 從圖2可以看出:隨著迭代次數(shù)k的增加,跟蹤誤差的范數(shù)都是逐漸減小并趨于零。值得注意的是,AILC曲線下降的速率最快。表明相對(duì)于γ=0.2和γ=0.5的P-ILC算法,本文設(shè)計(jì)的AILC算法的跟蹤性能更好。 圖3(a)和圖3(b)分別描述了具有軌跡偏移的自適應(yīng)迭代學(xué)習(xí)控制算法的第二次輸出和第六次輸出情況。從圖3可以發(fā)現(xiàn):雖然期望軌跡沿著迭代軸不規(guī)律變化,但隨著迭代次數(shù)的增加,仍然能夠在有限時(shí)間區(qū)間內(nèi)實(shí)現(xiàn)系統(tǒng)輸出對(duì)期望軌跡的完美跟蹤。體現(xiàn)了本文所設(shè)計(jì)AILC算法的有效性。 (a) AILC算法的第二次輸出 圖4展示了AILC算法的跟蹤誤差隨時(shí)間軸和迭代軸的三維變化圖像。從圖4可以發(fā)現(xiàn),跟蹤誤差逐漸減小并趨于零。進(jìn)一步說(shuō)明了本文所設(shè)計(jì)AILC算法的有效性。 圖 4 具有軌跡偏移的AILC算法的跟蹤誤差 針對(duì)軌跡偏移的迭代學(xué)習(xí)控制系統(tǒng),通過(guò)設(shè)計(jì)參數(shù)自適應(yīng)更新算法解決參數(shù)未知的問(wèn)題。利用參數(shù)矩陣的估計(jì)信息和軌跡偏移的期望軌跡信息設(shè)計(jì)自適應(yīng)迭代學(xué)習(xí)控制算法。通過(guò)理論分析證明了參數(shù)估計(jì)誤差的有界性,保證系統(tǒng)跟蹤誤差有界且具有較好的跟蹤精度。仿真實(shí)驗(yàn)證明了本文的自適應(yīng)迭代學(xué)習(xí)控制策略在軌跡偏移時(shí)的有效性。4 數(shù)值模擬
5 結(jié) 語(yǔ)