張文輝,馬 靜,高九州
(1.哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱150001;2.東北農(nóng)業(yè)大學(xué)工程學(xué)院,哈爾濱150001)
基于多層感知器神經(jīng)元的空間柔性機器人位置跟蹤控制*
張文輝1,馬 靜2,高九州1
(1.哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱150001;2.東北農(nóng)業(yè)大學(xué)工程學(xué)院,哈爾濱150001)
針對基體位置及姿態(tài)均不受控的自由漂浮柔性空間機器人軌跡跟蹤問題,提出了一種前饋多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)控制策略.建立了末端柔性的自由漂浮基機器人的耦合動力學(xué)模型,再利用MLP神經(jīng)網(wǎng)絡(luò)良好的逼近能力來自適應(yīng)補償非線性柔性臂的逆動力學(xué)模型,其誤差代價函數(shù)由PID控制器提供,權(quán)重及閥值的調(diào)整采用改進(jìn)的BP反傳算法.最后通過仿真比較詳細(xì)分析了所提方案的工作機理及對非線性強耦合系統(tǒng)控制的有效性.
多層感知器神經(jīng)網(wǎng)絡(luò);逆??刂?;PID控制;BP算法
柔性臂由于質(zhì)量輕、速度快等一系列優(yōu)點逐漸引起了學(xué)術(shù)界的廣泛興趣.但空間柔性機器人系統(tǒng)為非完整動力學(xué)系統(tǒng),存在著強烈的動力學(xué)耦合作用[1-3],從而導(dǎo)致空間柔性機器人在運動過程中出現(xiàn)振動,在運動結(jié)束時產(chǎn)生殘余振動,影響控制性能.由于傳統(tǒng)的動力學(xué)控制方法已不能滿足空間柔性機器人動力學(xué)控制的要求,為消除這些非線性因素的影響,目前自適應(yīng)控制、模糊控制等先進(jìn)的控制策略[4-7]已應(yīng)用到柔性空間機器人跟蹤控制中.
由于模糊控制無需知道被控制對象的精確數(shù)學(xué)模型,且控制器結(jié)構(gòu)簡單,并具有學(xué)習(xí)能力,因而在空間控制領(lǐng)域的應(yīng)用日益廣泛,已取得了一定成果.文獻(xiàn)[4-5]提出了的一種模糊控制方案用于空間柔性臂,模糊規(guī)則通過自適應(yīng)律來調(diào)整,達(dá)到了較好的控制效果,但由于模糊規(guī)則的獲取需要先驗的專家知識,且過多的模糊規(guī)則將造成較大的將計算量,因而很難應(yīng)用于工程實際.文獻(xiàn)[6]考慮到柔性空間機器人在自由漂浮模式下動力學(xué)模型難以準(zhǔn)確得到,并且容易受到非線性不確定性的影響,因而采用自適應(yīng)控制策略,獲得了較好的控制效果,但自適應(yīng)控制律的獲得需要參數(shù)線性化及回歸矩陣的確定,因此需要大量計算,影響了實時性.
本文針對基體的位置及姿態(tài)均不受控的漂浮柔性空間機器人,提出了一種改進(jìn)BP算法的前饋多層感知器神經(jīng)網(wǎng)絡(luò)逆??刂撇呗?利用 MLPNN良好的逼近能力來自適應(yīng)補償非線性柔性臂的逆動力學(xué)模型.仿真結(jié)果詳細(xì)分析了所提方案的工作機理及對非線性強耦合系統(tǒng)控制的有效性.
由剛性桿B1及柔性桿B2組成的柔性漂浮空間機器人系統(tǒng)結(jié)構(gòu)如圖1所示.設(shè) O1在O0x0軸上與O0的距離為l0,OB1沿 O1x1的長度為 a,Bi沿 Oixi的長度為li(i=1,2),載體質(zhì)量為m0,慣量矩陣為I0,B1為剛性桿,質(zhì)量為m1,慣量矩陣為 I1.
圖1 柔性臂漂浮基空間機器人
B2為柔性桿,必然會在運動過程中產(chǎn)生形變,將其視為一段 Euler-Bernoulli梁處理,設(shè)其密度為ρ,柔性梁的彈性位移u的模態(tài)函數(shù)展開表示為
式中,φi(x2)為柔性桿第i階模態(tài)函數(shù),qi(t)為與φi(x2)對應(yīng)的模態(tài)坐標(biāo),n為截斷項數(shù).
由于不考慮重力的作用,整個系統(tǒng)重力勢能為零,且柔性機器人為線彈性變形,故系統(tǒng)總勢能 U等于柔性連桿的彎曲應(yīng)變能.系統(tǒng)遵守對(OXY)的動量守恒及相對O點的動量矩守恒.設(shè)系統(tǒng)的初始動量、動量矩均為0,即有˙rc=rc=0.
由材料力學(xué)相關(guān)理論,系統(tǒng)彈性勢能為
式中,E為抗彎剛度,設(shè)α、θ1及θ2分別為載體姿態(tài)及機器人各個關(guān)節(jié)的相對轉(zhuǎn)角,在以α、θ1、θ2、q1及q2為廣義坐標(biāo)的情況下,設(shè)系統(tǒng)的總動能為T,則系統(tǒng)的拉氏函數(shù)為
應(yīng)用拉格朗日方程可得
其中,L是系統(tǒng)的拉格朗日函數(shù),qi為系統(tǒng)的廣義坐標(biāo),Qi為廣義坐標(biāo)qi相對應(yīng)的廣義力.
結(jié)合式(3)~(4),經(jīng)過推導(dǎo)和整理,可以得到如下空間剛?cè)釞C器人系統(tǒng)的非線性動力學(xué)方程:
其中 θ=[θ1θ2]T,q=[q1q2]T.D為 4 ×4 正定對稱廣義質(zhì)量陣.H為4×1哥氏力、離心力和彈性力的列陣.τ=[τ1τ20 0]T為控制力矩.
文中定義 φ=[θTqT]T為增廣輸入向量,φd=[qT]T為增廣的期望關(guān)節(jié)角,采用擴展系統(tǒng)的增廣變量輸入法.則可以得出系統(tǒng)誤差向量e=φd-φ=[0],這里 eθ=θd-θ.
在式(5)不存在未建模動態(tài)及外界擾動的情況下,下面的控制器(6)可以保證系統(tǒng)的穩(wěn)定性.
這里定義Kp、Kd為反饋增益矩陣.
在實際中,空間柔性機器人的模型很難精確得到,只能建立估計模型.設(shè)估計模型為.對于估計模型,則控制律設(shè)計為
這里將控制律式(7)代入控制律式(6)中,得
為解決空間柔性機器人非線性動力學(xué)模型的誤差影響,這里考慮采用多層感知器神經(jīng)網(wǎng)絡(luò)(MLPNN)來對柔性空間機器人的逆動力學(xué)模型進(jìn)行逼近.
前饋多層感知器神經(jīng)網(wǎng)絡(luò)是大量具有神經(jīng)元級的聯(lián)層網(wǎng)絡(luò),同一層的所有神經(jīng)元通過單向分支連接鄰近層的所有神經(jīng)元,分支或連接僅能向一個方向,即“前饋方向”傳遞信息,已經(jīng)證明只要有足夠的神經(jīng)元,它就能以任意精度逼近非線性函數(shù).
圖2 多層感知器神經(jīng)網(wǎng)絡(luò)
由柔性空間機器人非線性動力學(xué)模型(5)得
柔性空間機器人的MLP網(wǎng)絡(luò)逆??刂葡到y(tǒng)如圖3所示,這里控制輸入τ由PID反饋控制器τPD和MLP神經(jīng)網(wǎng)絡(luò)逆模學(xué)習(xí)控制器τNN組成.
設(shè)計PID反饋控制器為
MLP神經(jīng)網(wǎng)絡(luò)控制器設(shè)計為
其中,w為神經(jīng)網(wǎng)絡(luò)連接權(quán)值,b為神經(jīng)網(wǎng)絡(luò)節(jié)點閥值.則
控制系統(tǒng)結(jié)構(gòu)如圖3所示.
圖3 神經(jīng)網(wǎng)絡(luò)逆??刂葡到y(tǒng)
由圖3中可以看出隨著τNN對逆動力學(xué)模型學(xué)習(xí)的進(jìn)行,τPD越來越小.
由此可以定義MLP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)誤差δ為
為保證實時性,便于工程應(yīng)用,本文采用一種改進(jìn)的BP算法來完成包括網(wǎng)絡(luò)參數(shù)的更新訓(xùn)練,使學(xué)習(xí)誤差趨于0為實際網(wǎng)絡(luò)輸出向量,yd為網(wǎng)絡(luò)期望輸出向量.
這里設(shè)前向神經(jīng)網(wǎng)絡(luò)有M層,每層輸入輸出關(guān)系為
采用反向傳播算法,則前向網(wǎng)絡(luò)連接權(quán)值及閥值的修正公式為
通過上述前饋多層感知器神經(jīng)元的參數(shù)更新算法,在線邊學(xué)習(xí)邊控制,MLPNN將逐漸建立比較精確的空間柔性機器人的系統(tǒng)逆模型.
空間柔性機器人系統(tǒng)的慣性參數(shù)為l0=0.6m,l1=l2=1.2m,a=1m;各分體質(zhì)量或密度 m0=50kg,m1=5kg,ρ=0.6kg/m;均勻彎曲剛度為 E=360N·m2.各分體中心慣量矩 I0=35kg·m2,I1=0.8kg·m2.從泰勒的角度來看,忽略高階模態(tài),僅取前兩項,柔性空間機器人兩關(guān)節(jié)期望的軌跡為
θ1d=1+0.2cos(πt) ;θ2d=1+0.2sin(πt);控制器增益 Kp=diag{20,20} ,Kd=diag{30,30};神經(jīng)網(wǎng)絡(luò)參數(shù)為λ=0.25,η=0.7;初始值分別取為 θ1(0)=θ2(0)=1.
圖4 本文的軌跡跟蹤情形圖
圖5 本文的關(guān)節(jié)速度跟蹤誤差圖
而由圖4可以看出,所設(shè)計的MLP神經(jīng)網(wǎng)絡(luò)的逆模PID控制器能在較短時間(t=2s)內(nèi)快速跟蹤期望軌跡,同時由圖5看出,角速度跟蹤誤差在2s后也收斂為0,說明多層感知器神經(jīng)元能夠較好控制非線性強耦合的空間柔性機器人系統(tǒng).
針對自由漂浮的柔性空間機器人系統(tǒng)的關(guān)節(jié)位置跟蹤問題,提出了一種改進(jìn)BP算法的前饋多層感知器神經(jīng)網(wǎng)絡(luò)逆??刂撇呗?利用多層感知前饋神經(jīng)網(wǎng)絡(luò)良好的逼近能力來自適應(yīng)補償非線性柔性臂的逆動力學(xué)模型,神經(jīng)網(wǎng)絡(luò)的誤差代價函數(shù)由傳統(tǒng)的PID控制器提供,權(quán)值及閥值的調(diào)整采用改進(jìn)的BP反傳算法.仿真說明了所提方案的有效性,對于非線性強耦合系統(tǒng)能夠獲得較高控制精度.
[1]Farzaneh A,Talebi H A,Rajnikant V P.A stable neural network-based observer with application to flexiblejointmanipulators[J].IEEE Trans on Neural Networks,2006,17(1):118-129
[2]Dubowsky S ,Papadopoulos E G.The kinematics, dynamics and control of free-flying space robotic systems[J].IEEE Trans on Robotics and Automation, 1993,9(5):531-543
[3]Amor J,William A.Experimental study on active vibration control of a single-Link flexible manipulator using tools of fuzzy logic and neural networks[J].IEEE Trans on Instrumentation and Measurement, 2005, 54(3):1200-1208
[4]Green A,Sasiadek JZ.Adaptive control of a flexible robot using fuzzy logic[C].AIAA Guidance, Navigation,and Control Conference and Exhibit, Providence, Aug.16-19,2004
[5]張曉東,賈慶軒,孫漢旭,等.空間機器人柔性關(guān)節(jié)軌跡控制研究[J].宇航學(xué)報,2008,29(6):1865-1869
[6]Chen L.Adaptive and robust composite control of coordinated motion of space robot system with prismatic joint[C].The 4thWorld Congress on Intelligent Control and Automation, Shanghai,2002
Position Tracking Control for Space Flexib le Robot Based on M u ltilayer Percep tual Neural Network
ZHANG Wenhui1,MA Jing2, GAO Jiuzhou1
(1.School of Aerospace,Harbin Institute of Technology,Harbin 150001,China; 2.Department of Engineering,Northeast Agriculture University, Harbin 150001,China)
The problem of trajectory tracking for freefloating space robotwith flexible manipulators are considered.An improved multilayer perceptual neural network(MLPNN)inverse-model control algorithm based on the BP algorithm is proposed in this paper.High order liberation modal is ignored based on the assumed modalmethod,Lagrange principle and momentum con-
servation.The MLPNN based controller is used to adaptively learn and compensate the inverse-dynamics model of robot,neural network parameters can be adaptively adjusted on line,and the improved BP algorithm is adopted to learn rules.Error cost function is provided by PID controller.The controller improves the control accuracy and the asymptotic convergence of tracking error.The simulation results show that the presented controller has important value.
multilayer perceptual neural network; inverse-modal control; PID control; BP algorithm
TP242
A
1674-1579(2011)01-0059-04
10.3969/j.issn.1674-1579.2011.01.013
*中國航天科技聯(lián)合創(chuàng)新基金(CAST-HIT09C01)資助項目.
2010-09-15
張文輝(1980—),男,河南人,博士研究生,研究方向為空間機器人智能控制 (e-mail:hit-zwh@126.com).