董中華,陳鵬飛,李亞龍
(蘭州理工大學 機電工程學院,甘肅 蘭州 730050)
機械臂是一種多輸入、多輸出且具有時變性、時滯性和高度耦合性的復雜非線性系統(tǒng)[1]。機器臂系統(tǒng)的不確定性可能會導致依據(jù)該模型構(gòu)造的控制器性能降低,甚至不穩(wěn)定。在控制器設計時,很多控制策略都會有局限性,這將會對機械臂系統(tǒng)輸出跟蹤期望軌跡的實現(xiàn)帶來巨大影響。因此機械臂系統(tǒng)中存在不確定項難以避免地會導致系統(tǒng)的性能大大降低[2]。神經(jīng)網(wǎng)絡應用在機械臂運動控制中,可以處理機械臂系統(tǒng)模型中的不確定性,還能對它進行實時控制[3]。
由于徑向基神經(jīng)網(wǎng)絡結(jié)構(gòu)簡單,具有較強的泛化性能,近年來,很多人對RBF神經(jīng)網(wǎng)絡在機械臂控制的方向進行了研究,極大地推動了機械臂的RBF神經(jīng)網(wǎng)絡控制發(fā)展的進程。一些研究人員運用RBF神經(jīng)網(wǎng)絡的特性做出了自適應控制[4-5]。其中一部分研究人員在此基礎上結(jié)合魯棒控制,形成神經(jīng)網(wǎng)絡魯棒自適應控制[6-7]。一些研究人員將RBF神經(jīng)網(wǎng)絡控制和模糊控制相結(jié)合,結(jié)合二者的優(yōu)點組成模糊神經(jīng)網(wǎng)絡控制[8-9]。隨著現(xiàn)代智能優(yōu)化算法的興起,如遺傳算法(GA)、進化策略(ES)和粒子群算法(PSO)等,一些研究人員使用GA優(yōu)化神經(jīng)網(wǎng)絡的參數(shù),并設計了GA-RBF神經(jīng)網(wǎng)絡控制[10-11]。而PSO相對于GA而言,不需要編碼,沒有交叉和變異操作,粒子只是通過內(nèi)部速度進行更新,因此原理更簡單、參數(shù)更少、實現(xiàn)更容易。一些研究人員使用PSO結(jié)合RBF神經(jīng)網(wǎng)絡在預測方面的研究很深入,但在機械臂控制方面不多。文獻[12-13]僅在自校正控制和逆運動方面進行了研究。
本文在文獻[11]的GA-RBF控制方法中得到啟發(fā),采用了另一種現(xiàn)代智能算法(PSO)來替代GA,設計了PSO-RBF控制方法。
由于機械臂的每個關(guān)節(jié)就是一個輸入,也是一個輸出,而且關(guān)節(jié)與關(guān)節(jié)之間又存在著擾動,耦合關(guān)系復雜。所以機械臂的系統(tǒng)模型很難精確獲得。通常是用它的靜止模型作為名義模型,再通過反饋進行自適應調(diào)節(jié),以達到精確的軌跡跟蹤控制。
假設被控對象為n關(guān)節(jié)機械臂,其動態(tài)方程為:
(1)
(2)
在計算力矩控制法中,采用名義模型,設計控制律為
(3)
將式(2)代入式(1),可得誤差系統(tǒng)為
(4)
在實際工程中,f(·)通常是未知的,需要估計f(·)并對其補償。利用RBF神經(jīng)網(wǎng)絡逼近任意非線性函數(shù)的特性逼近f(·),并對其進行補償,就可以達到想要的控制效果。
采用RBF網(wǎng)絡逼近f(·),其算法為
(5)
y=wTh(x)
(6)
其中:x是RBF神經(jīng)網(wǎng)絡的輸入;w是神經(jīng)網(wǎng)絡的權(quán)值;h=[h1,h2,…,hm]T是高斯函數(shù)的輸出。
給定一個很小的數(shù)ε使得RBF逼近公式(3)中的f(·),有如下公式:
(7)
定義逼近誤差為
(8)
當逼近誤差η無限趨近于0,則系統(tǒng)的不確定項被有效地逼近,通過補償可以保證準確的控制。
粒子群優(yōu)化算法屬于進化算法的一種,和模擬退火算法相似,它也是從隨機解出發(fā),通過迭代尋找最優(yōu)解。
首先,粒子群算法將優(yōu)化問題的解當作搜索空間中的一只鳥,在搜索的空間中以一定的速度飛行,速度大小根據(jù)它自身以及同伴的飛行經(jīng)驗進行動態(tài)調(diào)整。鳥被想象成為一個沒有質(zhì)量和體積的粒子,第i個速度粒子在n維空間里的位置表示為向量xi=(xi1,xi2,…,xin),飛行速度表示為向量vi=(vi1,vi2,…,vin)。每個粒子都有一個由被優(yōu)化函數(shù)所決定的適應值,而且知道自己到目前為止所發(fā)現(xiàn)的最好位置xpi=(xpi1,xpi2,…,xpin)。此外,每個粒子還知道到目前為止鄰域粒子所發(fā)現(xiàn)的最好位置xg=(xg1,xg2,…,xgn)。PSO算法是一種基于迭代的優(yōu)化算法,第t1次迭代時,粒子將根據(jù)自身的經(jīng)驗和同伴的經(jīng)驗來決定下一步運動速度和位置?;綪SO算法的粒子位置和速度的更新公式如下:
vij(t+1)=wvij(t)+c1r1[xpij(t)-xij(t)]+c2r2[xgi(t)-xij(t)]
(9)
xij(t+1)=xij(t)+vij(t+1)
(10)
其中:w為慣性權(quán)重;c1和c2為學習因子;r1和r2為服從均勻分布U(0,1)的隨機數(shù);i=1,2,…,N,j=1,2,…,N,N為粒子規(guī)模。
在已知初始輸入范圍的條件下,運用PSO算法優(yōu)化出最佳的網(wǎng)絡權(quán)值w。取代優(yōu)化參數(shù)向量n為個體粒子,PSO算法每次迭代得到的參數(shù)值為
nm=wTm=1,2,…,S
(11)
其中S為粒子種群規(guī)模。
不確定性誤差為公式(8),采用不確定項的逼近誤差作為參數(shù)選擇的最小目標函數(shù),設計個體適應度函數(shù)為
(12)
粒子群算法更新RBF權(quán)值的流程圖如圖1所示。
圖1 粒子群優(yōu)化算法流程圖
在設計好PSO優(yōu)化RBF參數(shù)的流程圖后,PSO-RBF神經(jīng)網(wǎng)絡自適應控制系統(tǒng)如圖2所示。
圖2 PSO-RBF神經(jīng)網(wǎng)絡自適應控制系統(tǒng)框圖
根據(jù)制定好的PSO-RBF神經(jīng)網(wǎng)絡自適應控制系統(tǒng)和參考文獻[13],針對式(1)設計如下控制器:
(13)
將式(13)代入式(1),整理可得
(14)
(15)
這是一個標準的現(xiàn)代控制理論方程。
設計Lyapunov函數(shù)來驗證其穩(wěn)定性:
(16)
其中γ>0。
對V求導,整理可得
(17)
為了和文獻[13]中的結(jié)果進行比較,運用文獻中的自適應率
(18)
(19)
由上述的已知條件可得
(20)
其中λmin和λmax分別是矩陣Q的最小特征值和矩陣P的最大特征值。
(21)
由式(21)可得出結(jié)論,增大Q的特征值或減小P的特征值可以提高x的收斂效果。
本控制是在RBF神經(jīng)網(wǎng)絡控制的基礎上,通過粒子群算法優(yōu)化了控制效果,引入文獻[13]中的二連桿機械臂作為被控對象進行仿真對比。
被控對象為雙關(guān)節(jié)機械臂如圖3所示,其動力學方程為
各項參數(shù)參考文獻[13]。
圖3 雙關(guān)節(jié)機械臂示意圖
設關(guān)節(jié)角度和關(guān)節(jié)角速度的期望跟蹤指令為
仿真中,采用控制律式(14)和自適應律式(18),控制參數(shù)取
采用粒子群優(yōu)化算法對RBF神經(jīng)網(wǎng)絡中的權(quán)值w進行優(yōu)化,在優(yōu)化工程中,粒子群優(yōu)化算法的參數(shù)為:迭代次數(shù)T=100,種群規(guī)模S=50,粒子維數(shù)D=10。學習因子c1=c2=0.5。
仿真結(jié)果如圖4-圖7所示。
圖4 關(guān)節(jié)1和關(guān)節(jié)2的軌跡跟蹤
圖5 關(guān)節(jié)1和關(guān)節(jié)2的角速度跟蹤
圖6 關(guān)節(jié)1和關(guān)節(jié)2的軌跡跟蹤誤差
圖7 關(guān)節(jié)1和關(guān)節(jié)2的速度跟蹤誤差
從圖4和圖5分析得出,PSO- RBF神經(jīng)網(wǎng)絡控制的軌跡和速度與理想的軌跡和速度基本吻合,而且與RBF神經(jīng)網(wǎng)絡控制相比,PSO-RBF的軌跡更快地吻合理想軌跡。
從圖6和圖7可以看出,關(guān)節(jié)1軌跡吻合快將近4s,關(guān)節(jié)2軌跡吻合快將近2s。這表明PSO-RBF神經(jīng)網(wǎng)絡自適應控制實現(xiàn)了二連桿機械臂的高精度軌跡控制效果。通過和RBF控制方法對比,PSO-RBF神經(jīng)網(wǎng)絡自適應控制方法能夠確保關(guān)節(jié)1和關(guān)節(jié)2的不確定項誤差在一個更小的收斂領(lǐng)域,這說明該方法能更快逼近系統(tǒng)不確定項,保證控制系統(tǒng)在更短時間獲得補償并提高性能。
1)RBF神經(jīng)網(wǎng)絡控制能夠在部分未確定機械臂模型參數(shù)的情況下獲得較好的軌跡跟蹤性能。而用PSO優(yōu)化后的RBF神經(jīng)網(wǎng)絡控制可以獲得更好的軌跡跟蹤性能。
2)通過和RBF神經(jīng)網(wǎng)絡自適應控制相比,PSO-RBF神經(jīng)網(wǎng)絡自適應控制系統(tǒng)能夠在更短時間內(nèi)吻合理想控制軌跡,且控制穩(wěn)定,提高了控制性能。