王 頔,李正斌,張庭亮
(安陽工學(xué)院 電子信息與電氣工程學(xué)院,河南 安陽 455000)
基于BP神經(jīng)網(wǎng)絡(luò)的機(jī)械臂軌跡控制研究
王頔,李正斌,張庭亮
(安陽工學(xué)院 電子信息與電氣工程學(xué)院,河南 安陽 455000)
針對(duì)六自由度機(jī)械臂耦合性強(qiáng)、時(shí)變、非線性等性能,基于拉格朗日動(dòng)力學(xué)建模方法,文章采用BP神經(jīng)網(wǎng)絡(luò)逼近模型,實(shí)現(xiàn)高精度軌跡跟蹤。該方法根據(jù)六自由度機(jī)械臂本體采集的數(shù)據(jù)進(jìn)行黑箱辨識(shí)建模解耦,建模過程采用BP神經(jīng)網(wǎng)絡(luò)逼近,提升建模精度、簡化建模過程。針對(duì)解耦后的系統(tǒng),還需建立PID閉環(huán)控制器進(jìn)一步實(shí)現(xiàn)軌跡跟蹤控制。仿真及實(shí)驗(yàn)結(jié)果表明,基于BP神經(jīng)網(wǎng)絡(luò)的PID控制器能夠改善系統(tǒng)的魯棒性和穩(wěn)定性,并有效抑制抖動(dòng)。
BP神經(jīng)網(wǎng)絡(luò);六自由度機(jī)械臂;軌跡跟蹤控制
六自由度機(jī)械臂是典型的多輸入多輸出系統(tǒng),具有時(shí)變、強(qiáng)耦合、非線性的特性[1-2]。工業(yè)機(jī)械臂工況復(fù)雜,現(xiàn)場存在大量不可控干擾,采用比例積分微分(Proportion Integral Differential,PID)控制難以達(dá)到平滑控制,跟蹤過程中超調(diào)較大,且易出現(xiàn)抖動(dòng)、控制失效等問題。為了實(shí)現(xiàn)高精度、快速的軌跡跟蹤[3-4],采用神經(jīng)網(wǎng)絡(luò)逼近預(yù)測模型。將預(yù)測模型力矩輸出作為反饋量與實(shí)際力矩比較,建立PID反饋控制回路,改善軌跡跟蹤效果。神經(jīng)網(wǎng)絡(luò)具有大規(guī)模存儲(chǔ)、結(jié)構(gòu)并行等特點(diǎn),具有較強(qiáng)的函數(shù)逼近能力和分類功能。
六自由度機(jī)械臂具有時(shí)變、強(qiáng)耦合、非線性等特性,精確的動(dòng)力學(xué)模型難以得到,傳統(tǒng)的PID無法實(shí)現(xiàn)快速、平穩(wěn)跟蹤[5-6]。本文將BP神經(jīng)網(wǎng)絡(luò)控制方法與傳統(tǒng)PID結(jié)合,利用BP神經(jīng)網(wǎng)絡(luò)在線學(xué)習(xí)能力,辨識(shí)六自由度機(jī)械臂模型,從而保證獲得良好的跟蹤效果。
六自由度機(jī)械臂為串聯(lián)結(jié)構(gòu),根據(jù)其結(jié)構(gòu)特點(diǎn),綜合考慮摩擦、擾動(dòng)、重力項(xiàng)等因素[7],采用拉格朗日方法,求取其動(dòng)力學(xué)模型。各個(gè)關(guān)節(jié)以“絕對(duì)編碼器電機(jī)+精密諧波減速器”為傳動(dòng)作順時(shí)針和逆時(shí)針的旋轉(zhuǎn)。根據(jù)D-H方法得到機(jī)器人坐標(biāo)系。θ1,θ2,θ3,θ4,θ5,θ6分別表示各個(gè)關(guān)節(jié)繞z軸的旋轉(zhuǎn)角度,l1,l2,l3,l4,l5,l6表示各連桿的長度,xyz是選取的基坐標(biāo)系。六自由度機(jī)械臂的D-H參數(shù)如表1所示。
表1 機(jī)器人的參數(shù)
根據(jù)這些參數(shù)可得到各個(gè)關(guān)節(jié)之間的變換陣為:
根據(jù)上式可以得到六自由度機(jī)械臂的動(dòng)力學(xué)模型為:
式中:D(q)∈Rn×n是慣量矩陣,V(q,q·)∈Rn×1表示向心力和哥氏力作用項(xiàng),G(q)∈Rn×1是重力項(xiàng),τ為作用于各關(guān)節(jié)上的慣性主動(dòng)力。
BP神經(jīng)網(wǎng)絡(luò)為具有單隱層的3層前饋式網(wǎng)絡(luò)結(jié)構(gòu),分別由輸入層、隱層和輸出層構(gòu)成。神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元組成的網(wǎng)絡(luò),每一個(gè)神經(jīng)元均可視為多輸入單輸出的系統(tǒng)[8-9]。當(dāng)神經(jīng)元j有多個(gè)輸入xi(i=1,2,…,m)和單個(gè)輸出yj時(shí),輸入和輸出的關(guān)系可表示為:
其中,其中j為閾值,wij為從神經(jīng)元i到神經(jīng)元j的連接權(quán)重因子,f(sj)為傳遞函數(shù)[10]。采用BP神經(jīng)網(wǎng)絡(luò)逼近預(yù)測模型,首先要分析六自由度機(jī)械臂的結(jié)構(gòu)特征及控制特點(diǎn)。為了保證辨識(shí)數(shù)據(jù)的可靠性及有效性,辨識(shí)數(shù)據(jù)在六自由度機(jī)械臂本體的驅(qū)動(dòng)過程中采集,激勵(lì)信號(hào)為頻率和幅值不斷發(fā)生變化的類正弦信號(hào)。由于機(jī)械臂運(yùn)動(dòng)過程是耦合的、非線性的,此處采集數(shù)據(jù)過程中采用白噪聲信號(hào)作為輸入,會(huì)使得輸出信號(hào)變化過大,有時(shí)候系統(tǒng)無法及時(shí)響應(yīng),影響辨識(shí)效果。
由于6個(gè)機(jī)械臂處于聯(lián)動(dòng)狀態(tài),且各軸耦合性強(qiáng),辨識(shí)模型時(shí)僅采集單個(gè)機(jī)械臂的信號(hào),必然會(huì)降低系統(tǒng)模型的準(zhǔn)確性。因此,解析求解機(jī)械臂動(dòng)力學(xué)模型時(shí),對(duì)每軸的訓(xùn)練均采集6個(gè)軸的位置信號(hào),即位置、速度、加速度,以軸5為例得到訓(xùn)練樣本如表2所示。其中,將機(jī)械臂控制過程中采集的100組數(shù)據(jù)作為辨識(shí)數(shù)據(jù),其中前70組作為辨識(shí)預(yù)測模型的訓(xùn)練樣本,m=80,后30組為訓(xùn)練集,測試訓(xùn)練效果。
表2 軸5的訓(xùn)練樣本
采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,首先需要根據(jù)所要擬合的非線性系統(tǒng)的特征和系統(tǒng)的輸入輸出參數(shù)來確定神經(jīng)元數(shù)目[11]。試驗(yàn)表明,能夠通過增加隱含層神經(jīng)元數(shù)目來提高網(wǎng)絡(luò)的誤差精度[12-13]。這種方法的訓(xùn)練效果比觀察層數(shù)更容易觀察和調(diào)整,且從結(jié)構(gòu)實(shí)現(xiàn)上來說,增加神經(jīng)元數(shù)目要比增加隱含層數(shù)目簡單許多,因而,在一般情況下,應(yīng)該優(yōu)先考慮增加隱含層中的神經(jīng)元數(shù)目來提高網(wǎng)絡(luò)的精度[14]。六自由度機(jī)械臂系統(tǒng)輸入層有4個(gè)神經(jīng)元,輸出層有一個(gè)神經(jīng)元。設(shè)置迭代次數(shù)為100,學(xué)習(xí)率為0.1,目標(biāo)值為0.03。即當(dāng)系統(tǒng)MSE小于目標(biāo)值0.03時(shí),訓(xùn)練結(jié)束,建模過程實(shí)現(xiàn)。BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)目可采用經(jīng)驗(yàn)公式法、最小二乘法等方法確定。經(jīng)過分析比較可知,該系統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為4—8—1,即輸入層有4個(gè)節(jié)點(diǎn),隱含層有8個(gè)節(jié)點(diǎn),輸出層有1個(gè)節(jié)點(diǎn)。仿真輸出如圖1—2所示。
圖1 BP網(wǎng)絡(luò)實(shí)際輸出與預(yù)測輸出的比較
圖2 BP網(wǎng)絡(luò)預(yù)測相對(duì)誤差
分析圖1—2可知,BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出能夠跟蹤實(shí)際輸出的走勢(shì),各關(guān)節(jié)力矩輸出能夠由BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測輸出,且輸出誤差在控制容許誤差范圍內(nèi),且最終MSE小于目標(biāo)值0.03,六自由度機(jī)械臂動(dòng)力學(xué)模型是收斂穩(wěn)定的。根據(jù)上述建模過程,依次對(duì)六自由度機(jī)械臂模型的6個(gè)軸建模,得到6個(gè)預(yù)測模型輸出[15]。
根據(jù)六自由度機(jī)械臂系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)辨識(shí)的動(dòng)力學(xué)模型之間的輸入輸出關(guān)系,采用結(jié)構(gòu)正向建模的建模方法,辨識(shí)采用串—并聯(lián)型結(jié)構(gòu),采用PID作為閉環(huán)控制器最終得到六自由度機(jī)械臂系統(tǒng)的控制結(jié)構(gòu)如圖3所示。
圖3 系統(tǒng)控制結(jié)構(gòu)圖
根據(jù)圖4所示的控制結(jié)構(gòu)搭建控制模型,結(jié)合六自由度機(jī)械臂本體采集的位置參數(shù),對(duì)六自由度機(jī)械臂跟蹤效果進(jìn)行驗(yàn)證?;诒倔w實(shí)驗(yàn)結(jié)果如下,圖4為軌跡跟蹤實(shí)時(shí)輸出效果,a為基于BP神經(jīng)網(wǎng)絡(luò)辨識(shí)的PID控制效果,b為常規(guī)PID控制效果。初始角度為90°,期望值為70°,在40s時(shí)加入持續(xù)2s的50 000 Pulse的干擾信號(hào),關(guān)節(jié)5位姿調(diào)節(jié)效果如圖4所示。
圖4 跟蹤效果比較
綜合上述分析可知,為了實(shí)現(xiàn)六自由度工業(yè)機(jī)械臂高精度、平穩(wěn)、高效的軌跡跟蹤,采用BP辨識(shí)的PID控制策略可以實(shí)現(xiàn)更好的控制效果。
針對(duì)六自由度工業(yè)機(jī)械臂軌跡跟蹤的控制問題,考慮到系統(tǒng)具有時(shí)變、建模不確定性等因素,且實(shí)際工業(yè)應(yīng)用中難以避免的擾動(dòng)、未建模態(tài)等不確定性,文章提出了基于BP神經(jīng)網(wǎng)絡(luò)辨識(shí)建模解耦的控制方法。采用BP辨識(shí)建立動(dòng)力學(xué)模型,解決了強(qiáng)耦合帶來的控制難題。仿真結(jié)果表明能夠較好地逼近控制量,減小輸入控制力矩與實(shí)際控制力矩的誤差,進(jìn)一步改善控制效果?;贐P神經(jīng)網(wǎng)絡(luò)的控制策略應(yīng)用于六自由度機(jī)械臂本體位姿控制實(shí)驗(yàn)中,由實(shí)驗(yàn)結(jié)果可知,該控制系統(tǒng)具有較好的魯棒性和控制精度,同時(shí)能夠抑制抖動(dòng)。
[1]孫兵,朱大奇,鄧志剛.開架水下機(jī)器人生物啟發(fā)離散軌跡跟蹤控制[J].控制理論與應(yīng)用,2013(4):454-462.
[2]劉國榮,張揚(yáng)名.移動(dòng)機(jī)器人軌跡跟蹤的模糊PID-P型迭代學(xué)習(xí)控制[J].電子學(xué)報(bào),2013(8):1536-1541.
[3]柯文德,彭志平,蔡則蘇,等.仿人機(jī)器人相似性運(yùn)動(dòng)軌跡跟蹤控制研究[J].自動(dòng)化學(xué)報(bào),2014(11):2404-2413.
[4]王保防,張瑞雷,李勝,等.基于軌跡跟蹤車式移動(dòng)機(jī)器人編隊(duì)控制[J].控制與決策,2015(1):176-180.
[5]龐海龍,馬保離.不確定輪式移動(dòng)機(jī)器人的任意軌跡跟蹤[J].控制理論與應(yīng)用,2014(3):285-292.
[6]郭振鋒,金國光,暢博彥,等.剛—柔性機(jī)械臂動(dòng)力學(xué)建模及其動(dòng)力學(xué)特性研究[J].天津工業(yè)大學(xué)學(xué)報(bào),2013(1):70-74.
[7]金國光,尉靜嫻,劉艷茹,等.剛—柔耦合機(jī)械臂動(dòng)力學(xué)建模及其振動(dòng)抑制研究[J].天津工業(yè)大學(xué)學(xué)報(bào),2014(6):65-69.
[8]羅建春,晁勤,羅洪,等. 基于LVQ-GA-BP神經(jīng)網(wǎng)絡(luò)光伏電站出力短期預(yù)測[J]. 電力系統(tǒng)保護(hù)與控制,2014(13):89-94.
[9]禹建麗,卞帥. 基于BP神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷模型[J]. 系統(tǒng)仿真學(xué)報(bào),2014(6):1343-1349.
[10]袁曉玲,施俊華,徐杰彥. 基于BP神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電短期出力預(yù)測[J]. 可再生能源,2013(7):11-16.
[11]喬冰琴,常曉明. 改進(jìn)粒子群算法在BP神經(jīng)網(wǎng)絡(luò)擬合非線性函數(shù)方面的應(yīng)用[J]. 太原理工大學(xué)學(xué)報(bào),2012(5):558-563.
[12]王衛(wèi)兵,楊傳香,王偉,等.改進(jìn)BP算法解耦熱網(wǎng)控制器的設(shè)計(jì)與仿真[J].哈爾濱理工大學(xué)學(xué)報(bào),2012(2):58-62.
[13]羅宇鋒,李敏捷,劉云龍,等.微機(jī)械陀螺解耦控制技術(shù)的研究[J].計(jì)算機(jī)仿真,2015(4):295-299.
[14]程啟明,程尹曼,汪明媚,等.球磨機(jī)混合優(yōu)化前向神經(jīng)網(wǎng)絡(luò)PID解耦控制系統(tǒng)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2010(2):54-59.
[15]李界家,劉岱巖,祝嬋楠.基于神經(jīng)網(wǎng)絡(luò)的變風(fēng)量空調(diào)解耦控制[J].沈陽建筑大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(1):187-192.
Research on trajectory tracking control of manipulator based on BP neural network
Wang Di, Li Zhengbin, Zhang Tingliang
(Electronic Information and Electrical Engineering College of Anyang Institute of Technology, Anyang 455000, China)
Aiming at the characteristics that strong coupling, time-varying, nonlinear of six degree of freedom(6-DOF)manipulator and on the basis of Lagrange dynamics modeling method, the BP neural network approximation model is adopted to realize high precision trajectory tracking in this paper. The method carried out the identifcation modeling and decoupling of black box according to the the data gathered from 6-DOF manipulator noumenon. The BP neural network approximation is adopted to improve the modeling accuracy and simplify the process. PID closed-loop controller is built for the decoupled systems to further implement the trajectory tracking control. The simulation and experimental results show that the PID controller based on BP neural network can improve robustness, and effciently attenuate the chattering.
BP neural network; 6-DOF manipulator; trajectory tracking control
王頔(1988— ),女,河南安陽,碩士,助教;研究方向:機(jī)器人技術(shù)與智能控制。