周景雷
(菏澤學(xué)院機電工程系,菏澤274015)
不確定性機器人的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制
周景雷
(菏澤學(xué)院機電工程系,菏澤274015)
針對一類不確定性機器人軌跡跟蹤問題,提出了一種神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制。首先利用反饋控制技術(shù)把基于拉格朗日方程的多關(guān)節(jié)機器人動力學(xué)模型轉(zhuǎn)化成二階系統(tǒng)。其次,將神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方法和所轉(zhuǎn)化的二階系統(tǒng)相結(jié)合,找到了一種新方法來研究機器人系統(tǒng),該方法是應(yīng)用RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制思想來設(shè)計控制器,所設(shè)計的控制器能夠保證機器人的實際運動軌跡漸近無誤差地跟蹤給定的期望軌跡。最后,以兩關(guān)節(jié)機器人系統(tǒng)為例,給出其仿真試驗結(jié)果。
不確定性;機器人;神經(jīng)網(wǎng)絡(luò);自適應(yīng)控制;漸近穩(wěn)定
機器人系統(tǒng)是一類時變、強耦合和高度非線性的動力學(xué)系統(tǒng),并且存在著大量的不確定性因素,因而想獲得機器人的精確數(shù)學(xué)模型是不可能的。
近些年來基于機器人的智能控制受到控制領(lǐng)域的廣泛關(guān)注,提出了很多非線性補償控制方法[1-4]。文獻[3]采用了自適應(yīng)控制方法,能夠通過在線估計未知參數(shù),并且根據(jù)其估計值修正控制策略,然而其設(shè)計的控制器有著變結(jié)構(gòu)的形式,這樣必然會存在"抖振"現(xiàn)象。文獻[4]采用了神經(jīng)網(wǎng)絡(luò)控制,雖然在逼近區(qū)域內(nèi)利用神經(jīng)網(wǎng)絡(luò)其到了補償作用,能夠克服變結(jié)構(gòu)的“抖振”,但最大的問題是如何得到準(zhǔn)確的在線訓(xùn)練數(shù)據(jù)和怎樣解決實時控制差的問題。這兩種智能控制都有著一定的問題,于是人們開始將自適應(yīng)控制和神經(jīng)網(wǎng)絡(luò)控制結(jié)合起來[5-6]。文獻[5]將這種結(jié)合應(yīng)用到了空間機器人上,這不具有一般性;文獻[6]在自適應(yīng)控制和神經(jīng)網(wǎng)絡(luò)控制的基礎(chǔ)上又增加了迭代學(xué)習(xí)控制,這雖然有助于提高控制的精度和穩(wěn)定性,但是這必然增加了難度,不宜操作。同時,上述文獻均未將基于拉格朗日方程的機器人動力學(xué)模型,轉(zhuǎn)化成一個比較簡單的、易于控制的模型。
考慮到上述不足之處,本文提出一種神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制,將其直接應(yīng)用到帶有外界干擾的不確定機器人系統(tǒng)當(dāng)中去。首先將基于拉格朗日方程的機器人動力學(xué)模型轉(zhuǎn)化成二階系統(tǒng),這是一狀態(tài)空間模型,于是可以利用現(xiàn)代控制理論對其進行控制。
然后,采用了神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方案,通過李雅普諾夫穩(wěn)定性分析設(shè)計了控制器和自適應(yīng)調(diào)整律,很好地保證了實際運動軌跡漸近無誤差地跟蹤給定的期望軌跡。
基于拉格朗日方程的n關(guān)節(jié)機器人動力學(xué)模型可由下面二階非線性向量微分方程來描述
對于外界不確定性干擾需要滿足假設(shè):假設(shè)外界不確定性干擾f有界。
令
式(3)中,Kv,Kp為選定的正定增益陣,分別可理解為微分和比例增益。為簡便起見,下文設(shè)它們都為對角陣。
由式(2)~(3)得到系統(tǒng)誤差動態(tài)方程
如果再令d=M-1(q)f,則得到更簡單的狀態(tài)方程
上式中,u為外界控制輸入量,d包含了外界不確定性干擾。再令x=[]T,x1=q,x2=˙q,則機器人系統(tǒng)就可以寫成
式(4)中,f(x)=-Kv˙q-Kpq,假設(shè)其未知,因為我們是不知道實際運動軌跡的,目的就是控制實際軌跡跟蹤給定的期望軌跡qb,所以這樣的假設(shè)是可以的。根據(jù)d=M-1(q)f中M(q)的有界性和對外界干擾f所做的假設(shè)知,有‖d‖≤d0,d0為已知的正常數(shù)。
我們再定義跟蹤誤差e=q-qd,顯然,qd二階連續(xù)可導(dǎo)。那么對于系統(tǒng)(4)的控制目的,就是設(shè)計外界控制輸入u,使實際軌跡qd漸近地跟蹤給定期望軌跡e,也即跟蹤誤差e趨于零。
上式中,cji∈R2n和σji(j=1,2)分別表示第i個基函數(shù)的中心向量和寬度。cji和σji是可調(diào)的參數(shù),在實際工程應(yīng)用上,為了數(shù)學(xué)上處理方便,可以根據(jù)對象的一些信息,將它們的取值固定,不過有時也利用局部訓(xùn)練技術(shù)來獲取它們的值[7]。
下面給出2個假設(shè)。
這里要注意:(A1)所說的是神經(jīng)網(wǎng)絡(luò)估計誤差的能力,已經(jīng)證明了只要加權(quán)矩陣也就是神經(jīng)元的個數(shù)足夠多,那么網(wǎng)絡(luò)估計誤差會變得任意小[8]。
我們采用徑向基(RBF)神經(jīng)網(wǎng)絡(luò)來估計未知函數(shù) ,其估計^f(x)為
這里^θ是網(wǎng)絡(luò)加權(quán)矩陣θ的估計。下面我們要設(shè)計網(wǎng)絡(luò)加權(quán)的自適應(yīng)修正律來保證這種網(wǎng)絡(luò)性能的一定要求。向量?(x)是高斯型函數(shù),其第i個元素分別有如下數(shù)學(xué)表示形式
為了下面的需要,我們在這里先定義一個開關(guān)函數(shù)
其中,星號表示一個任意的標(biāo)量。
再給出一個引理:設(shè)a,c∈Rn為列向量,D∈Rn×n為方陣,則有a′Dc=tr(D′ac′)。
對于系統(tǒng)(4),我們選取如下控制律
式(5)中,
隨著大數(shù)據(jù)的廣泛應(yīng)用和新技術(shù)的層出不窮,智慧城市建設(shè)得到有序推進,創(chuàng)新融合理念深入人心。作為公共文化服務(wù)機構(gòu),圖書館如何在自動化、數(shù)字化、智能化的基礎(chǔ)上,順應(yīng)時代發(fā)展要求,開展圖書館智慧化建設(shè);如何以讀者需求為導(dǎo)向,建立智慧化的信息系統(tǒng),提高館員工作效率和資源利用率,是當(dāng)前我們圖書館人應(yīng)該思考的課題。新一代智慧圖書館信息系統(tǒng)的建設(shè)面臨著諸多不確定性,比如技術(shù)進步、社會環(huán)境變化等,但可以確定的是,智慧化、復(fù)合型是新一代智慧圖書館信息系統(tǒng)的重要特征,也是圖書館轉(zhuǎn)型與超越的必然要求。
這里,α,β∈Rn×n為正定增益矩陣,在一般情況下為了解耦方便,都取它們?yōu)閷顷?。sgn(e1)為一列向量,其中的每一個元素sgni(e1i)都滿足上面定義的開關(guān)函數(shù)。e1為定義的濾波誤差[9],有e1=[P2P3]S,S=[eT˙eT]T。[P2P3]為下面李雅普諾夫方程(9)的解P的一部分
把式(5)~(7)代入式(4),得誤差狀態(tài)方程
式(8)中
其中
矩陣A是穩(wěn)定矩陣[10],于是,對于下面的李雅普諾夫方程,總存在正定解P
選擇如下的權(quán)矩陣修正算法
式(9)中,η為正常數(shù),作為自適應(yīng)律。很容易得出下面的結(jié)論:考慮系統(tǒng)(4)和上述所做的假設(shè),如果控制器由式(5)~(6)組成,權(quán)矩陣由式(10)來調(diào)節(jié),那么跟蹤誤差e漸近收斂到0點。
證明,我們構(gòu)造如下李雅普諾夫函數(shù)
進一步,把修正法則(10)帶入上式并根據(jù)引理得
根據(jù)式(7)以及(A1)和對d所做的有界性的限定,容易證明下面的不等式成立
對于第i個分量,設(shè)e1i>0,有
同理,當(dāng)e1i=0,不等式(11)仍然成立。并容易得知,當(dāng)e1i=0,不等式(11)變成了等式。因此,不等式(11)總是成立的,于是
這樣我們就證明了李雅普諾夫函數(shù) 是單調(diào)遞減的,那么就可以得出閉環(huán)系統(tǒng)是全局漸近穩(wěn)定的,也就是當(dāng)t→∞有S→0,那么跟蹤誤差e和它的導(dǎo)數(shù)˙e也都漸近收斂于0。
下面以兩關(guān)節(jié)機器人為例來驗證我們的控制方法,這種機器人機械臂的結(jié)構(gòu)圖及參數(shù):連桿質(zhì)量m1,m2(kg)連桿長度l1,l2(m)角坐標(biāo)q1,q2(rad)如圖1所示。
圖1 兩關(guān)節(jié)機器人Fig.1 The t wo-link robot
動力學(xué)模型(1)中的參數(shù)為
這里q=[q1,q2]T,ci=cos(qi),si=sin(qi),i=1,2。
為了仿真簡便,我們簡單的取各參數(shù)值如下m1=1(kg),m2=10(kg),l1=l2=1(m),初始坐標(biāo)選為q1(0)=q2(0)=-0.5,˙q1(0)=˙q2(0)=0,外界干擾f=[0.5cos(t) 0.5sin(t)]T,期望軌跡qd1=0.5cos t,qd2=0.5sin t,a0=4I2,a1=2I2。
選擇2×20×1的RBF神經(jīng)網(wǎng)絡(luò)來估計f(x)=-Kv˙q-Kpq,Kq,Kv=Kp=I2。選取加權(quán)矩陣的初值為^θ(0),寬度σ=0.2,中心ci在(-0.2,0.2)任意選擇。仿真圖如圖2所示。圖2中,點劃線表示的是實際軌跡,實線表示期望軌跡。從仿真圖中,我們可以看出,經(jīng)過很短的時間,實際軌跡就與期望軌跡重合了,這說明我們的理論可行。
圖2 軌跡曲線Fig.2 Track curve
本文根據(jù)狀態(tài)空間中的李雅普諾夫思想來設(shè)計權(quán)矩陣修正律和控制器,對機器人系統(tǒng)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器進了研究,其思路清晰,設(shè)計簡單。所設(shè)計的控制器很好地保證了機器人系統(tǒng)的穩(wěn)定性,使機器人的實際運動軌跡漸近無誤差地跟蹤給定的期望軌跡。
[1]Ham C,Qu Z,Johnson R.Robust f uzzy control for robot manipulators[J].IEE Peoceedings on Control Theory and Application,2000,147(2):212-216.
[2]Jin M L,Lee J,Chang P H,et al.Practical nonsingular ter minal sliding-mode control of robot manipulators for high-accuracy tracking control[J].IEEE Transactions on Industrial E-lectronics,2009,56(9):3593-3601.
[3]Su H H,Li C F.A fully adaptive decentralized control of robot manipulators[J].Automatica,2006,42(5):1761-1767.
[4]張文輝,齊乃明,尹洪亮.不確定機器人的神經(jīng)網(wǎng)絡(luò)軌跡控制[J].自動化與儀表,2010,30(5):22-25.
[5]謝箭,劉國良,顏世佐,等.基于神經(jīng)網(wǎng)絡(luò)的不確定性空間機器人自適應(yīng)控制方法研究[J].宇航學(xué)報,2010,31(1):123-129.
[6]王躍靈,沈書坤,王洪斌.不確定機器人的自適應(yīng)神經(jīng)網(wǎng)絡(luò)迭代學(xué)習(xí)控制[J].武漢理工大學(xué)學(xué)報,2009,31(24):135-139.
[7]Sanner R M,Sloting J J E.Gaussian net wor ks for direct adaptive control[J].IEEE Transactions on Neural,Networ ks,1992,3(6):837-863.
[8]Chen B S,Lee T S,F(xiàn)eng J H.A nonlinear H∞control design in robotic systems under parameter perturbation and external disturbance[J].International Journal of Control,1994,59(2):439-461.
[9]Niu Y G,Zou Y,Yang C W.Neural net work-based adaptive tracking control for a class of nonlinear systems[J].Control Theory and Applications,2001,18(3):461-464.
[10]周景雷,張維海.一種機器人軌跡的魯棒跟蹤控制[J].控制工程,2007,14(3):336-339.
Adaptive Control for Uncertain Robot Based on Neural Net work
ZHOU Jinglei
(Department of Machine and Electronic,Heze College,Heze 274015,China)
A kind of neural net work adaptive control for a sort of uncertain robotic system is presented.First,the multi-joint robotic dynamical model based on the lagrange equation istransf or med into a two-order system via feedback control technique.Then,combine the two-order system with the neural net work adaptive control,finding out a new way to study the robotic systems.This way is to use the RBF neural net work adaptive control methods to design the controller,which can guarantee the actual tracks of robot asymptotically tail after the given desired tracks without any error.At last,take a two-joint robot as an example and give its simulation results.
uncertain;robot;neural net work;adaptive control;asymptotically stable
TP242
A
1007-7383(2011)03-0390-04
2011-01-23
山東省自然科學(xué)基金項目(ZR2009GZ001)
周景雷(1981-),男,碩士,研究方向為機器人控制、魯棒控制。