陳 強(qiáng) 陳凱杰 施卉輝 孫明軒
迭代學(xué)習(xí)控制(Iterative learning control,ILC)能夠通過利用上一次的迭代經(jīng)驗(yàn)進(jìn)行學(xué)習(xí),不斷優(yōu)化控制器和提高控制性能,最終實(shí)現(xiàn)有限區(qū)間內(nèi)對期望軌跡的完全跟蹤,已廣泛應(yīng)用于機(jī)械臂等執(zhí)行重復(fù)任務(wù)的被控對象[1-5].經(jīng)典迭代學(xué)習(xí)控制方法主要基于壓縮映射方法進(jìn)行穩(wěn)定性分析,包括D 型、P 型和PD 型學(xué)習(xí)算法[6-9].近來,基于Lyapunov理論的自適應(yīng)迭代學(xué)習(xí)控制(Adaptive iterative learning control,AILC) 方法[10-14]相繼提出,能夠通過對不確定系統(tǒng)參數(shù)的自適應(yīng)迭代學(xué)習(xí),間接優(yōu)化控制器和提高控制性能.
經(jīng)典ILC 方法一般要求系統(tǒng)初值嚴(yán)格重置于期望軌跡初始點(diǎn),即每次迭代過程中,系統(tǒng)初值需與期望軌跡的初值保持一致[15-17].然而,在機(jī)械臂等實(shí)際系統(tǒng)中,由于受環(huán)境因素和定位精度等影響,該初值一致條件一般難以滿足.因此,如何放寬初值一致條件是ILC 研究的熱點(diǎn)問題之一,現(xiàn)有的方法主要包括時(shí)變邊界層法[18],狀態(tài)修正方法[19-20]等.文獻(xiàn)[19]對迭代學(xué)習(xí)控制系統(tǒng)在5 種初值情況下的收斂性能分別進(jìn)行了分析,并利用初值信息和期望軌跡構(gòu)建新的期望軌跡.文獻(xiàn)[20]采用三角函數(shù)提出一種新型期望軌跡函數(shù)放寬解決初值一致條件,通過設(shè)計(jì)過渡軌跡銜接每次迭代的初始點(diǎn)與期望軌跡.然而,由于過渡軌跡接入點(diǎn)處的位置及其導(dǎo)數(shù)與期望軌跡相關(guān),因此,狀態(tài)修正方法在每次迭代時(shí)往往需要設(shè)計(jì)不同的過渡軌跡.在此基礎(chǔ)上,文獻(xiàn)[21]提出一種誤差跟蹤方法,通過設(shè)計(jì)期望誤差軌跡和迭代學(xué)習(xí)控制器,保證誤差軌跡沿預(yù)設(shè)的期望誤差軌跡收斂.與狀態(tài)修正方法比較,誤差跟蹤方法的期望誤差軌跡設(shè)置不依賴期望狀態(tài)軌跡,且期望誤差軌跡接入點(diǎn)的位置及其導(dǎo)數(shù)可以簡單設(shè)置為零[22-23].
此外,由于機(jī)械臂等實(shí)際系統(tǒng)中往往存在系統(tǒng)約束、安全限制和信息丟失等問題,導(dǎo)致迭代學(xué)習(xí)控制器的設(shè)計(jì)過程中每次迭代長度發(fā)生變化,稱為ILC 不等長問題.例如,康復(fù)訓(xùn)練機(jī)械臂由于患者體力不足或者力量不足,可能使迭代長度未到達(dá)指定迭代長度就提前終止.目前,已有國內(nèi)外學(xué)者對ILC 不等長問題進(jìn)行了研究.文獻(xiàn)[24-25]針對離散時(shí)間線性系統(tǒng)的ILC 不等長問題,構(gòu)造迭代平均算子,通過利用往次迭代信息更新控制信號,證明了跟蹤誤差期望值能夠收斂到零,但控制器設(shè)計(jì)中要求已知迭代長度概率分布,且未對跟蹤誤差方差進(jìn)行討論.文獻(xiàn)[26]考慮迭代長度概率分布未知的情況,給出變迭代長度下P 型學(xué)習(xí)律的設(shè)計(jì)方法,并證明跟蹤誤差在均方意義上的收斂性.然而,該工作并未考慮外部干擾的影響.文獻(xiàn)[27]考慮帶有干擾和測量噪聲的一類離散時(shí)間線性系統(tǒng),提出基于改進(jìn)型迭代平均算子的迭代學(xué)習(xí)控制方法,并在2 自由度機(jī)械臂實(shí)驗(yàn)平臺上驗(yàn)證該方法的有效性.文獻(xiàn)[24-27]考慮的系統(tǒng)均為離散時(shí)間線性系統(tǒng),控制器設(shè)計(jì)一般基于壓縮映射方法,當(dāng)前迭代的信息并未充分利用.
針對一類非線性連續(xù)系統(tǒng)的ILC 不等長問題,文獻(xiàn)[28]設(shè)計(jì)虛擬誤差變量補(bǔ)償未運(yùn)行部分信息,并通過重新定義復(fù)合能量函數(shù),證明當(dāng)?shù)螖?shù)趨向無窮時(shí),系統(tǒng)輸出能夠?qū)崿F(xiàn)對期望軌跡的完全跟蹤.文獻(xiàn)[29]通過引入指標(biāo)函數(shù),使得當(dāng)前迭代中只對最相鄰的同一時(shí)刻信息進(jìn)行學(xué)習(xí),并構(gòu)建改進(jìn)型復(fù)合能量函數(shù)證明變迭代長度情況下系統(tǒng)狀態(tài)的收斂性.文獻(xiàn)[24-25]能夠有效解決非線性連續(xù)系統(tǒng)的ILC 不等長問題,但控制器設(shè)計(jì)仍需滿足初值一致條件.由于許多實(shí)際系統(tǒng)中ILC 初值問題和不等長問題同時(shí)存在,因此文獻(xiàn)[24-29]的工作無法直接應(yīng)用于解決任意初態(tài)下的軌跡跟蹤問題.近來,文獻(xiàn)[30]針對機(jī)械臂軌跡跟蹤中的ILC 初值問題和不等長問題,提出狀態(tài)修正方法放寬初值一致條件,并證明變迭代長度下系統(tǒng)誤差的 L2范數(shù)收斂性.然而,狀態(tài)修正方法在每次迭代時(shí)往往需要重新設(shè)計(jì)過渡軌跡,導(dǎo)致計(jì)算量較大.
基于以上討論,本文研究任意初態(tài)下的機(jī)械臂軌跡跟蹤問題,提出一種變長度誤差跟蹤迭代學(xué)習(xí)控制方法.針對ILC 初值問題,構(gòu)造與期望軌跡無關(guān)的雙曲余弦期望誤差軌跡,使得迭代初始值可任意設(shè)置,放寬經(jīng)典迭代學(xué)習(xí)控制的初值一致條件.與現(xiàn)有的狀態(tài)修正方法相比,修正期望誤差軌跡僅需已知實(shí)際誤差初值及其導(dǎo)數(shù)兩個(gè)條件,且期望誤差軌跡表達(dá)式在每次迭代時(shí)無需重新設(shè)計(jì).不同于現(xiàn)有的誤差跟蹤方法[21-23],本文設(shè)計(jì)的期望誤差軌跡只需設(shè)置一個(gè)常數(shù)項(xiàng),使得誤差軌跡設(shè)計(jì)更加簡便.針對ILC 不等長問題,構(gòu)造虛擬誤差變量構(gòu)建誤差補(bǔ)償機(jī)制,用于補(bǔ)償未運(yùn)行區(qū)間的誤差信息,放寬迭代長度不變的限制條件.與文獻(xiàn)[28-30]相比,本文提出一種全限幅迭代學(xué)習(xí)控制方法,能夠有效避免參數(shù)估計(jì)值因逐點(diǎn)收斂導(dǎo)致上下界不固定的問題,確保機(jī)械臂關(guān)節(jié)位置誤差在整個(gè)迭代區(qū)間上跟蹤期望誤差軌跡.
考慮n階自由度的剛性機(jī)械臂,其動態(tài)方程為[30]
其中,k=1,2,3,···,表示迭代次數(shù),q1,k ∈Rn,q2,k ∈Rn,2,k ∈Rn分別表示關(guān)節(jié)位置、關(guān)節(jié)速度和關(guān)節(jié)加速度,M(q1,k)∈Rn×n為對稱正定的慣性矩陣,C(q1,k,q2,k)∈Rn×n為向心-科里奧利矩陣,G(q1,k)∈Rn為重力矩陣,dk ∈Rn表示包括系統(tǒng)模型不確定性和外部擾動在內(nèi)的有界干擾,滿足||dk||≤,為一未知正常數(shù),τk ∈Rn表示系統(tǒng)控制輸入.
機(jī)械臂系統(tǒng)(1)具有如下性質(zhì):
性質(zhì) 1[2].矩陣(q1,k)-2C(q1,k,q2,k) 是斜對稱矩陣,即對任意向量x∈Rn,xT[(q1,k)-2C(q1,k,q2,k)]x=0成立.
性質(zhì) 2[2].對于任意向量q,∈Rn和任意的已知向量v,Rn,存在一個(gè)未知的時(shí)變參數(shù)向量θ ∈Rm,使得
其中W(q,,v,)∈Rn×m,是一個(gè)回歸矩陣.
在控制器設(shè)計(jì)和穩(wěn)定性分析之前,給出引理1.
引理 1[13].給定標(biāo)量a和b,滿足<a <,則有以下不等式成立
本文控制目標(biāo)為針對任意初態(tài)下機(jī)械臂系統(tǒng)(1),設(shè)計(jì)迭代學(xué)習(xí)控制器τk,使得當(dāng)?shù)螖?shù)k趨向于無窮時(shí),關(guān)節(jié)位置q1,k(t) 能夠在指定區(qū)間[Δ,Tk] 跟蹤期望軌跡qd(t),即當(dāng)k→∞時(shí),有1,k →0,t ∈[Δ,Tk]成立.
經(jīng)典的迭代學(xué)習(xí)控制器設(shè)計(jì)一般要求系統(tǒng)滿足初值一致條件[15-17]
對?k成立.然而在實(shí)際運(yùn)行中,由于機(jī)械臂定位誤差以及外部干擾等問題存在,條件(5)一般難以滿足.因此,本文構(gòu)造一種不依賴于期望軌跡的期望誤差軌跡,以放寬初值一致條件(5).
如圖1 所示,期望誤差軌跡是由誤差過渡軌跡和恒為零的軌跡銜接而成,且期望誤差軌跡的設(shè)計(jì)需要滿足以下條件[21]
圖1 期望誤差軌跡Fig.1 Desired error trajectory
上述對期望誤差軌跡的設(shè)計(jì)不要求系統(tǒng)狀態(tài)滿足初值嚴(yán)格一致條件(5),而只要求被設(shè)計(jì)的過渡軌跡滿足條件(6)和(7).其中,式 (6)是為了保證期望誤差軌跡能夠銜接誤差初值和接入點(diǎn),=1,k(0)表示期望誤差軌跡初值與實(shí)際誤差初值相等.式 (7)則是為了保證期望誤差軌跡在初始點(diǎn)和接入點(diǎn)處光滑可導(dǎo),可以保證期望誤差軌跡在初始點(diǎn)光滑可導(dǎo),=0 則保證期望誤差軌跡在接入點(diǎn)t=Δ 時(shí)刻光滑可導(dǎo).
根據(jù)式(6)和式(7),本文構(gòu)造一種新的雙曲余弦型期望誤差軌跡,表達(dá)式為
其中,Δ 表示接入點(diǎn)時(shí)刻,(t) 表示誤差過渡軌跡,具體表達(dá)形式為
為了使設(shè)計(jì)的期望誤差軌跡滿足條件(6),常數(shù)a的取值可根據(jù)確定,即滿足cosh(aΔ)=2.通過計(jì)算可得因此,a的取值只與預(yù)先設(shè)定的接入點(diǎn)時(shí)間 Δ 有關(guān).由式 (9)可以看出,本文在期望誤差初始值和零誤差點(diǎn)之間構(gòu)造光滑連續(xù)的誤差過渡軌跡(t),相當(dāng)于為機(jī)械臂軌跡跟蹤控制安排一個(gè)理想的誤差收斂過渡過程,然后設(shè)計(jì)控制器,使得機(jī)械臂系統(tǒng)的實(shí)際位置誤差跟蹤這個(gè)“安排的誤差收斂過渡過程”,最終實(shí)現(xiàn)機(jī)械臂位置軌跡快速且精確跟蹤期望軌跡的控制目標(biāo).
由式(8)和圖1 可以發(fā)現(xiàn),期望誤差軌跡在整個(gè)期望區(qū)間 [ 0,T] 連續(xù)可導(dǎo),當(dāng)狀態(tài)誤差實(shí)現(xiàn)對期望誤差軌跡的完全跟蹤時(shí),關(guān)節(jié)位置q1,k能在指定區(qū)間 [ Δ,T] 完全跟蹤上給定的期望軌跡qd.
狀態(tài)修正方法[19-20,30]也是解決初值問題的方法之一.為了解決任意初值的跟蹤問題,狀態(tài)修正方法對期望軌跡進(jìn)行修正,設(shè)計(jì)過渡軌跡連接每次迭代初始位置和期望軌跡,如圖2 所示.修正后的期望軌跡為[19]
圖2 狀態(tài)修正軌跡Fig.2 State rectifying trajectory
其中,qr,k(t)=A0t3+A1t2+A2t+A3是狀態(tài)過渡軌跡:
軌跡(10)保證了過渡軌跡能光滑地接入期望狀態(tài)軌跡.然而,參數(shù)A0和A1依賴于接入點(diǎn)的期望狀態(tài)軌跡信息qd(Δ) 和(Δ).由于系統(tǒng)初值q1,k(0) 和1,k(0) 隨迭代次數(shù)變化,當(dāng)期望狀態(tài)軌跡發(fā)生變化時(shí),參數(shù)A0~A3需要重新計(jì)算,導(dǎo)致計(jì)算量較大.不同,本文通過構(gòu)造一種新的雙曲余弦型過渡軌跡
注 1.文獻(xiàn)[23]采用的是多項(xiàng)式形式的誤差過渡軌跡,表達(dá)式為
對比式(9)和式(11)的誤差過渡軌跡可以看出,兩種形式的參數(shù)設(shè)計(jì)雖然都與期望軌跡無關(guān),但是本文設(shè)計(jì)的雙曲余弦形式過渡軌跡函數(shù)只含一個(gè)常數(shù)項(xiàng)a,設(shè)計(jì)更加簡單.
本文考慮機(jī)械臂的變長度問題,即實(shí)際運(yùn)行時(shí)間Tk隨迭代次數(shù)變化的問題.此時(shí),系統(tǒng)可能會遇到Tk >T和Tk ≤T兩種情況.針對Tk >T的情況,可以發(fā)現(xiàn)在期望迭代長度 [ 0,T] 內(nèi)的數(shù)據(jù)已經(jīng)滿足下次迭代所需數(shù)據(jù)的要求,而 (T,Tk] 之間的數(shù)據(jù)由于超過期望迭代長度,無需參與下次迭代更新,因而可以直接舍棄.本文集中討論Tk ≤T的情況,即實(shí)際迭代長度在期望迭代長度之內(nèi).當(dāng)t ∈(Tk,T]時(shí),系統(tǒng)已經(jīng)完成本次迭代,控制器不再參與系統(tǒng)運(yùn)行,但參數(shù)更新律仍需將上次的迭代信息記錄到未運(yùn)行區(qū)間,使得每次迭代都能是最相鄰有效的更新信息.定義Tmin和Tmax為Tk中最小和最大的迭代長度,則本文針對 Δ<Tmin≤Tk ≤Tmax=T情況設(shè)計(jì)控制器.
假設(shè) 1[28].Tk是一個(gè)隨機(jī)變量,它的概率分布函數(shù)為
其中,P[·] 表示概率,0≤p(t)≤1 為一個(gè)連續(xù)函數(shù).
注 2.假設(shè)1 描述了Tk的分布情況,從式(12)可得,FTk(Tmin)=0 和FTk(Tmax)<1.其中,前者意味著當(dāng)t∈[0,Tmin) 時(shí),由于Tk ≥Tmin,因而系統(tǒng)會繼續(xù)運(yùn)行;后者則意味著迭代長度Tk有一定概率滿足Tk=Tmax,即系統(tǒng)有一定概率運(yùn)行至最大迭代長度,進(jìn)而保證在迭代次數(shù)趨于無窮時(shí),Tk=Tmax的情況可以出現(xiàn)無窮次.此外,由于控制器和參數(shù)學(xué)習(xí)律的設(shè)計(jì)與Tk的概率分布函數(shù)無關(guān),因此,假設(shè)1 中Tk的概率分布函數(shù)無需提前已知,假設(shè)1 可適用于大部分實(shí)際系統(tǒng).
由于運(yùn)行到t=Tk時(shí)刻,系統(tǒng)會回到初始狀態(tài)進(jìn)行下一次迭代,因此,在本次迭代中系統(tǒng)不包含(Tk,T]時(shí)刻的跟蹤信息.與已有文獻(xiàn)使用零補(bǔ)償信息的方式不同[24-25],本文利用Tk時(shí)刻的誤差值補(bǔ)償未運(yùn)行部分的誤差信息,設(shè)計(jì)如下虛擬誤差變量
其中,αk=αk(t) 為虛擬控制器,具體設(shè)計(jì)將在第3.2 節(jié)中詳細(xì)描述.
注 3.當(dāng)t∈(Tk,T] 時(shí),z1,k和z2,k的跟蹤信息是通過誤差補(bǔ)償機(jī)制人為補(bǔ)全的,而非系統(tǒng)實(shí)際運(yùn)行過程中產(chǎn)生的誤差信號.該部分補(bǔ)充的信息只用于穩(wěn)定性分析,并不用于系統(tǒng)控制器和參數(shù)學(xué)習(xí)律設(shè)計(jì).
為了保證變迭代長度情況下的穩(wěn)定性,以下控制器和學(xué)習(xí)律的設(shè)計(jì)基于t∈[0,Tk] 和t ∈(Tk,T]兩種情況進(jìn)行討論.
1 )情形1:t ∈[0,Tk]
步驟 1.構(gòu)造Lyapunov 函數(shù)
對式(15)進(jìn)行求導(dǎo),可得
設(shè)計(jì)虛擬控制器為
其中,c1>0 是正常數(shù).
將虛擬控制器(17)代入式(16),則有
步驟 2.構(gòu)造Lyapunov 函數(shù)
對式(19)求導(dǎo),可得
根據(jù)性質(zhì)1 和性質(zhì)2,式(20)可以簡化為
其中,Wk ∈Rn×m為第k次迭代時(shí)的回歸矩陣,n表示機(jī)械臂的自由度,m表示時(shí)變參數(shù)向量θ的維數(shù).
因此,設(shè)計(jì)實(shí)際控制器τk為
當(dāng)t∈[0,Tk] 時(shí),設(shè)計(jì)參數(shù)和的全限幅學(xué)習(xí)律為
將控制器(22)代入式(21),可得
2 )情形2:t ∈(Tk,T]
當(dāng)t∈(Tk,T] 時(shí),實(shí)際系統(tǒng)已經(jīng)完成本次迭代運(yùn)行,所以無需加入控制器.但是,參數(shù)學(xué)習(xí)律仍然需要保留上一次的迭代信息,此時(shí)全限幅學(xué)習(xí)律設(shè)計(jì)為
由以上分析可知,在t∈(Tk,T] 時(shí)無需設(shè)計(jì)控制器,且學(xué)習(xí)律(26)和(27)中并未包含z1,k,z2,k的相關(guān)信息.因此,虛擬誤差變量z1,k,z2,k在t ∈(Tk,T]時(shí)并不影響控制器和參數(shù)學(xué)習(xí)律的設(shè)計(jì).
注 4.與已有迭代平均算子[24]方法相比,本文設(shè)計(jì)的學(xué)習(xí)律(26)和(27)能不斷保存上一迭代時(shí)刻的參數(shù)信息,為之后的參數(shù)學(xué)習(xí)保存最近一次相同時(shí)刻的迭代信息,使得每次學(xué)習(xí)律都是根據(jù)最相鄰一次的迭代信息進(jìn)行,因此能夠充分利用以往迭代中的信息.
注 5.本文采用全限幅學(xué)習(xí)律(23),(24),(26)和(27),避免參數(shù)估計(jì)值因逐點(diǎn)收斂導(dǎo)致上下界不固定的情況,使得參數(shù)估計(jì)值(t)、(t) 受到固定大小的飽和限幅.部分限幅學(xué)習(xí)律[10]也能保證參數(shù)估計(jì)值的有界性,但是由于部分限幅學(xué)習(xí)律中存在未限幅項(xiàng),導(dǎo)致參數(shù)估計(jì)值的界并不是固定的值.
定理 1.針對任意初態(tài)的n自由度機(jī)械臂(1),在假設(shè)1 的前提下,設(shè)計(jì)實(shí)際控制器(22)和參數(shù)學(xué)習(xí)律(23),(24),(26)和(27),使得當(dāng)?shù)螖?shù)趨向無窮時(shí),實(shí)現(xiàn)關(guān)節(jié)位置誤差1,k在 [ Δ,Tk] 區(qū)間上以概率1 收斂.
證明.設(shè)計(jì)復(fù)合能量函數(shù)如下:
1 )證明Ek隨迭代次數(shù)單調(diào)遞減.
當(dāng)t∈[0,Tk] 時(shí),定義δEk=Ek-Ek-1,則有
式(29)中,V1,k+V2,k-V1,k-1-V2,k-1可以進(jìn)一步寫為
根據(jù)(b-a)T(b-a)-(c-a)T(c-a)=2(bc)T(b-a)-(b-c)T(b-c)和引理1,有
同理,可得
將式(30)~ (32)代入式(29),可得
故當(dāng)t∈[0,Tk] 時(shí),Ek隨迭代次數(shù)單調(diào)遞減.當(dāng)t ∈(Tk,T]時(shí),根據(jù)積分的分段可加性,式(28)可改寫為
定義δ?1,k=?1,k(t)-?1,k-1(t),根據(jù)式(13)~(15)和式(19),有
與式(29)~ (33)的證明過程類似,可得
由式(37) 可知,為證明Ek在t∈[0,T] 上隨迭代次數(shù)單調(diào)遞減,只需證明δ?2,k=?2,k(t)-?2,k-1(t)≤0成立.由全限幅學(xué)習(xí)律(26) 和(27),可得
由式(38) 可知,δ?2,k=0 成立,進(jìn)而可得當(dāng)t ∈(Tk,T] 時(shí),有δ?1,k ≤0 且δ?2,k=0 成立,因此,δEk(t)≤0 仍成立.綜上所述,Ek在 [ 0,T] 區(qū)間上任意時(shí)刻的值隨迭代次數(shù)增加而單調(diào)遞減.
2 ) 證明k=0 時(shí),E0(t) 在 [ 0,T] 是有界的.
當(dāng)t∈[0,Tk] 時(shí),對式(39)求導(dǎo),可得
因此,E0(t)≤E0(0)+TkL <∞是一個(gè)有界函數(shù),即E0(t) 在 [ 0,Tk] 是有界的.
綜上所述,E0(t) 在 [ 0,T] 上是有界的.根據(jù)1)和2)兩部分的證明結(jié)果,可以得到如下結(jié)論:
由于E0(t) 有界且 0≤Ek(t)≤E0(t),可得
為了更直觀地說明z1,k采取 L2范數(shù)形式以概率1 收斂至0,引入滿足伯努利分布的隨機(jī)變量γk(t),取值分別為0 或1.當(dāng)γk(t)=1,意味著在第k次迭代的t時(shí)刻系統(tǒng)仍在運(yùn)行,即t≤Tk;當(dāng)γk(t)=0,意味著在第k次迭代的t時(shí)刻系統(tǒng)已經(jīng)停止運(yùn)行,即Tk <t.由假設(shè)1 可知,γk(t)=1 發(fā)生的概率為q(t)=P(γk(t)=1)=P(t ≤Tk)=1-P(Tk <t)=1-FTk(t),且q(T)>0 意味著系統(tǒng)有概率運(yùn)行至最大迭代長度.由此,可以將z1,k寫成另一種形式,即
迭代次數(shù)趨向無窮時(shí),根據(jù)式(43)和式(44),可得
注 6.根據(jù)式(17)和式(22)可知,如果控制器的參數(shù)c1和c2選取過大,則導(dǎo)致高增益控制;如果控制參數(shù)選取過小,則會減慢誤差收斂速度.學(xué)習(xí)律(23)和(24)的學(xué)習(xí)增益η,γ選取過小,會導(dǎo)致迭代學(xué)習(xí)控制的學(xué)習(xí)速率下降;但如果選取過大,則可能出現(xiàn)不必要的振蕩,甚至導(dǎo)致系統(tǒng)狀態(tài)發(fā)散.
考慮一個(gè) 2 自由度機(jī)械臂系統(tǒng),其表達(dá)式為[30]
方法1 (M1).本文提出的誤差跟蹤迭代學(xué)習(xí)控制方法,包括控制器(17),(22)和學(xué)習(xí)律(23),(24).
控制器(22)中的回歸矩陣Wk如下所示:
方法2 (M2).機(jī)械臂自適應(yīng)控制方法,其虛擬控制器和實(shí)際控制器分別設(shè)計(jì)為
仿真中系統(tǒng)初值設(shè)置為隨機(jī)變量q1,k(0)=[1+0.5rand(1),0.5+0.4rand(1)]T,設(shè)置每次的迭代長度Tk均勻分布在 [ 4,5] s,期望迭代長度為Tmax=5 s,期望軌跡給定為qd=[0.2cos(0.5πt),0.1sin(πt)+0.1cos(πt)]T.
仿真結(jié)果如圖3~ 11 所示.圖3 和圖4 分別描述關(guān)節(jié)位置q11,k和q12,k對期望軌跡qd1和qd2的跟蹤效果.其中,q11,1,q11,10,q11,30分別表示在第1 次、第10 次和第30 次迭代后的機(jī)械臂第1 個(gè)關(guān)節(jié)位置的輸出;q12,1,q12,10,q12,30則分別表示在第1 次、第10 次和第30 次迭代后的機(jī)械臂第2 個(gè)關(guān)節(jié)位置的輸出.由圖3 和圖4 可知,在任意初始狀態(tài)下,經(jīng)過足夠多的迭代以后,本文所提的變長度誤差跟蹤迭代學(xué)習(xí)控制方法能夠?qū)崿F(xiàn)關(guān)節(jié)位置在指定區(qū)間跟蹤期望軌跡,且在經(jīng)過30 次迭代之后,兩個(gè)關(guān)節(jié)位置的跟蹤精度均優(yōu)于第1 次和第10 次迭代的跟蹤精度.圖5 和圖6 分別表示兩個(gè)關(guān)節(jié)位置誤差對期望誤差軌跡的跟蹤情況,可以發(fā)現(xiàn)兩個(gè)關(guān)節(jié)位置誤差在整個(gè)迭代長度內(nèi)沿期望誤差軌跡收斂.此外,在t=0.5 s 后,本文所提方法能夠保證機(jī)械臂兩個(gè)關(guān)節(jié)位置誤差均收斂至零點(diǎn)附近,這與前述理論分析結(jié)果保持一致.圖7 描述了性能指標(biāo)avg(‖z1,k(t)‖) 以及Jmax隨迭代次數(shù)的變化趨勢.由圖7 可知,隨著迭代次數(shù)的增加,本文所提方法能夠有效提高跟蹤誤差的收斂性能.
圖3 關(guān)節(jié)位置 q11,k 和期望位置信號qd1Fig.3 Joint position q11,k and desired position signal qd1
圖4 關(guān)節(jié)位置 q12,k 和期望位置信號qd2Fig.4 Joint position q12,k and desired position signal qd2
圖5 誤差軌跡 11,k 和期望誤差軌跡,kFig.5 Error trajectory 11,k and desired error trajectory ,k
圖6 誤差軌跡 12,k 和期望誤差軌跡,kFig.6 Error trajectory 12,k and desired error trajectory ,k
圖7 性能指標(biāo)Fig.7 Performance index
圖8 和圖9 分別表示M1 和M2 兩種控制方法下關(guān)節(jié)位置q11,k和q12,k對期望軌跡qd1和qd2的跟蹤效果.圖10 和圖11 表示兩種控制方法下關(guān)節(jié)位置誤差的收斂過程.由圖8~ 11 可知,在本文提出的M1 控制方法下,關(guān)節(jié)位置q11,k和q12,k的跟蹤速度更快,跟蹤性能得到較大提升,誤差收斂速度也更快,使得誤差能夠在指定區(qū)間內(nèi)跟蹤給定的期望誤差軌跡.圖3~ 11 的仿真結(jié)果表明,針對任意初始狀態(tài)下機(jī)械臂軌跡跟蹤問題,本文提出的變長度誤差跟蹤迭代學(xué)習(xí)控制方法能夠?qū)崿F(xiàn)關(guān)節(jié)位置誤差在指定區(qū)間收斂到零點(diǎn),保證關(guān)節(jié)位置在指定區(qū)間內(nèi)跟蹤給定期望軌跡.
圖8 關(guān)節(jié)位置 q11,k 跟蹤性能對比Fig.8 The comparison of joint position q11,k tracking performance
圖9 關(guān)節(jié)位置 q12,k 跟蹤性能對比Fig.9 The comparison of joint position q12,k tracking performance
圖10 關(guān)節(jié)位置誤差 11,30 收斂過程對比Fig.10 The comparison of the error 11,30 convergence processes
圖11 關(guān)節(jié)位置誤差 12,30 收斂過程對比Fig.11 The comparison of the error 12,30 convergence processes
針對機(jī)械臂迭代學(xué)習(xí)控制方法的初值與不等長問題,本文提出一種變長度誤差跟蹤迭代學(xué)習(xí)控制方法.為放寬系統(tǒng)的初值一致條件,利用雙曲余弦函數(shù)構(gòu)造期望誤差軌跡,該期望誤差軌跡只需設(shè)計(jì)一個(gè)與期望軌跡無關(guān)的常數(shù)項(xiàng),使得誤差軌跡形式較為簡單和直觀.針對ILC 不等長問題,定義虛擬跟蹤變量構(gòu)建誤差補(bǔ)償機(jī)制,補(bǔ)償未運(yùn)行區(qū)間的誤差信息,并在此基礎(chǔ)上設(shè)計(jì)迭代學(xué)習(xí)控制器,保證關(guān)節(jié)位置在指定區(qū)間上跟蹤給定的期望軌跡.此外,設(shè)計(jì)全限幅學(xué)習(xí)律,保證參數(shù)估計(jì)值的有界性.仿真結(jié)果驗(yàn)證了本文所提控制方法的有效性.