柳子然, 戴梓健, 岳程斐,*, 王培基, 曹喜濱
(1. 哈爾濱工業(yè)大學(xué)航天學(xué)院, 黑龍江 哈爾濱 150001;2. 哈爾濱工業(yè)大學(xué)(深圳)空間科學(xué)與應(yīng)用技術(shù)研究院, 廣東 深圳 518055)
近年來(lái),人類探索宇宙、利用空間資源的腳步不斷加快,提出了一系列長(zhǎng)遠(yuǎn)計(jì)劃,如空間太陽(yáng)能電站[1]、深空軌道站[2]等,以空間機(jī)器人為代表的在軌服務(wù)航天器能夠?qū)崿F(xiàn)在軌制造、裝配等功能,具有廣闊的應(yīng)用前景。但是,傳統(tǒng)方法通常在關(guān)節(jié)空間中獨(dú)立地進(jìn)行規(guī)劃和控制設(shè)計(jì),不能直觀地反映任務(wù)空間中的情況,難以勝任日益復(fù)雜的在軌操控需求。因此,直接在任務(wù)空間中進(jìn)行控制器設(shè)計(jì)能夠緊密圍繞具體任務(wù)開展,日益受到重視[3]。
針對(duì)地面機(jī)器人的任務(wù)空間控制器設(shè)計(jì)已有廣泛研究。文獻(xiàn)[4]首先提出了操作空間控制(operation space control, OCS)方法,利用關(guān)節(jié)空間狀態(tài)與任務(wù)空間狀態(tài)的映射關(guān)系,將常用的關(guān)節(jié)空間機(jī)器人動(dòng)力學(xué)方程轉(zhuǎn)換到任務(wù)空間,再基于反饋線性化得到的線性模型設(shè)計(jì)了比例-微分(proportional derivative,PD)控制器并拓展到冗余機(jī)械臂中。Hogan等[5]則利用阻抗控制思想,設(shè)計(jì)了笛卡爾阻抗控制器,利用阻抗控制思想建立末端接觸力與末端運(yùn)動(dòng)間的關(guān)系,并在任務(wù)空間設(shè)計(jì)控制器實(shí)現(xiàn)期望末端運(yùn)動(dòng)。近幾年來(lái),任務(wù)空間控制的研究逐漸擴(kuò)展到漂浮基機(jī)器人中。Lippiello等[6]等推導(dǎo)了帶有一條3自由度(degree of freedom, DOF)機(jī)械臂的無(wú)人機(jī)的動(dòng)力學(xué)方程,并設(shè)計(jì)了笛卡爾阻抗控制器處理接觸力和系統(tǒng)運(yùn)動(dòng)間的關(guān)系;Wang等[7]在任務(wù)空間中對(duì)雙臂空間機(jī)器人的抓捕任務(wù)進(jìn)行描述,并設(shè)計(jì)了滑??刂破饕詫?shí)現(xiàn)基座和末端對(duì)期望狀態(tài)的精確跟蹤。雖然以O(shè)CS為代表的任務(wù)空間控制策略不需要在位置層計(jì)算逆運(yùn)動(dòng)學(xué),但是仍然需要在動(dòng)力學(xué)轉(zhuǎn)換階段計(jì)算雅克比矩陣的逆及導(dǎo)數(shù),在雅克比矩陣不確定或者不滿秩的情況下難以直接應(yīng)用[8]。此外,此類方法缺乏對(duì)空間機(jī)器人工作中可能遇到的約束的處理能力。
模型預(yù)測(cè)控制(model predictive control, MPC)在處理多約束優(yōu)化控制問題上具有顯著優(yōu)勢(shì),因此在機(jī)器人、無(wú)人機(jī)等領(lǐng)域得到了成功的應(yīng)用[9]。徐楊等[10]對(duì)無(wú)人車的路徑規(guī)劃和跟蹤控制進(jìn)行統(tǒng)一建模,利用MPC實(shí)現(xiàn)無(wú)人車輛的避障控制。在空間機(jī)器人方面,宗立軍等[11]著重研究了自由漂浮空間機(jī)器人避障問題,將關(guān)節(jié)限制、避障要求統(tǒng)一描述為不等式約束,基于MPC提出了混合整數(shù)預(yù)測(cè)控制方法。同時(shí),MPC也為解決機(jī)器人的任務(wù)空間控制問題提供了思路。針對(duì)機(jī)器人交互過程中的安全性約束,Nubert等[12]將傳統(tǒng)分離的規(guī)劃層和反饋控制層融合,設(shè)計(jì)了MPC器,在任務(wù)空間實(shí)現(xiàn)了機(jī)械臂末端對(duì)設(shè)定點(diǎn)的精確跟蹤;Rybus等[13]設(shè)計(jì)了非線性MPC(nonlinear MPC, NMPC),實(shí)現(xiàn)了平面自由漂浮空間機(jī)器人對(duì)任務(wù)空間軌跡的直接跟蹤;Shi等[14]對(duì)雙臂空間機(jī)器人的任務(wù)空間動(dòng)力學(xué)模型進(jìn)行了線性化,并在此基礎(chǔ)上設(shè)計(jì)MPC,實(shí)現(xiàn)了基座姿態(tài)與機(jī)械臂運(yùn)動(dòng)的協(xié)同控制。然而,作為一種基于模型的控制算法,MPC的控制精度與模型精度息息相關(guān),同時(shí)MPC本身的計(jì)算量較大,必須盡量權(quán)衡模型精度和計(jì)算復(fù)雜度,以滿足實(shí)時(shí)性要求。
高斯過程(Gaussian process,GP)回歸作為一種常用的非參數(shù)化貝葉斯回歸方法,需要求解的超參數(shù)較少,因此對(duì)樣本數(shù)據(jù)量的需求較小,能夠滿足空間機(jī)器人、無(wú)人機(jī)等非線性系統(tǒng)在工作過程中的快速、精確建模需求,已被引入MPC框架并得到了成功應(yīng)用。Torrente等[15]等利用GP對(duì)無(wú)人機(jī)運(yùn)動(dòng)過程中的高速風(fēng)阻進(jìn)行建模并部署到MPC控制器中,利用實(shí)驗(yàn)證明了GP-MPC的有效性;Woolfrey等[16]利用GP估計(jì)了運(yùn)動(dòng)基座對(duì)機(jī)械臂末端位姿的擾動(dòng),并利用MPC實(shí)現(xiàn)了末端對(duì)期望軌跡的跟蹤。但隨著樣本維度和分布范圍的增加,GP的計(jì)算復(fù)雜度顯著上升[17]。為此,Leen等[18]提出了高斯混合模型(Gaussian mixture models, GMM),也稱為高斯混合過程,通過對(duì)樣本集分組且每組樣本僅對(duì)應(yīng)一個(gè)GP來(lái)降低每個(gè)GP的運(yùn)算量,同時(shí)能夠自動(dòng)適應(yīng)多模態(tài)的樣本集。Liu等[19]利用GMM的思想訓(xùn)練得到了3DOF自由漂浮空間機(jī)器人模型;陳友東等[20]通過機(jī)械臂抓取實(shí)驗(yàn)演示了GMM相對(duì)于GP的優(yōu)勢(shì)。
針對(duì)空間機(jī)器人基座和末端對(duì)期望軌跡的直接、精確跟蹤問題,考慮其工作過程中的模型不確定性和物理約束,本文提出了一種基于GMM和MPC(GMM-MPC)的空間機(jī)器人任務(wù)空間控制方法。與文獻(xiàn)[13-14]等相比,考慮了基座受控的空間機(jī)器人在任務(wù)空間跟蹤過程中受到的物理約束并利用NMPC進(jìn)行優(yōu)化求解;同時(shí)利用高斯混合過程對(duì)空間機(jī)器人的模型不確定性進(jìn)行補(bǔ)償和修正,相比于基于單GP(single GP, SGP)的GP-MPC進(jìn)一步減輕了計(jì)算負(fù)擔(dān)。
本文主要內(nèi)容安排如下:在第1節(jié)中首先建立了空間機(jī)器人標(biāo)稱模型,并利用GMM進(jìn)行修正,以應(yīng)對(duì)實(shí)際工作過程中的模型不確定性;第2節(jié)將建立的空間機(jī)器人修正模型應(yīng)用于MPC框架內(nèi),考慮了空間機(jī)器人基座的推力分配問題,實(shí)現(xiàn)了空間機(jī)器人任務(wù)空間的軌跡跟蹤控制;第3節(jié)通過仿真驗(yàn)證了提出算法的有效性;最后在第4節(jié)對(duì)全文內(nèi)容進(jìn)行了總結(jié)。
本文研究所針對(duì)的空間機(jī)器人如圖1所示,由單剛體衛(wèi)星基座和n條剛性機(jī)械臂構(gòu)成。為了方便描述空間機(jī)器人的位置和姿態(tài),建立了以下坐標(biāo)系:∑I為慣性系;∑B是空間機(jī)器人的基座系,原點(diǎn)位于基座質(zhì)心,跟隨基座運(yùn)動(dòng);∑e1~∑en為第1~第n條臂的末端坐標(biāo)系,以描述空間機(jī)器人在任務(wù)空間/笛卡爾空間的運(yùn)動(dòng)。此外,針對(duì)第m個(gè)關(guān)節(jié)定義有關(guān)節(jié)坐標(biāo)系∑jm,以描述各機(jī)械臂在關(guān)節(jié)空間的運(yùn)動(dòng)情況。
圖1 空間機(jī)器人示意圖
對(duì)于配有n條機(jī)械臂,每條臂擁有m個(gè)自由度,平臺(tái)配置L個(gè)噴氣推力器的多臂航天器,給出其運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)的簡(jiǎn)要表述。
首先,根據(jù)機(jī)械臂末端與關(guān)節(jié)、基座狀態(tài)的映射關(guān)系,得到空間機(jī)器人末端位姿的描述形式:
(1)
對(duì)位姿信息進(jìn)行求導(dǎo)并整理得到空間機(jī)器人末端執(zhí)行器的線速度和角速度、基座的線速度和角速度以及關(guān)節(jié)角速度之間的關(guān)系為
(2)
(3)
式中:JB為基座與各機(jī)械臂末端之間的雅克比矩陣;JM為空間機(jī)器人各臂與末端之間的雅克比矩陣。
在運(yùn)動(dòng)學(xué)模型的基礎(chǔ)上,考慮基座受控情況下,關(guān)節(jié)空間中的機(jī)器人標(biāo)稱動(dòng)力學(xué)方程:
(4)
式中:HB,HM,HBM分別為空間機(jī)器人基座慣量矩陣、機(jī)械臂連桿的慣量矩陣、基座與機(jī)械臂各連桿耦合慣量矩陣;CB,CM分別為基座和機(jī)械臂的非線性項(xiàng);u0,uq分別為空間機(jī)器人基座和機(jī)械臂各關(guān)節(jié)作用的控制力和力矩。
整理得到狀態(tài)空間表達(dá)式:
(5)
(6)
由此得到基座控制力和力矩與噴氣推力器推力間的關(guān)系:
F0=CIBAT
(7)
式中:CIB為基座本體系到慣性系的轉(zhuǎn)換矩陣;T=[T1,T2,…,TL]T為噴氣推力器推力。
最后,為了便于將動(dòng)力學(xué)模型應(yīng)用在離散時(shí)間控制算法中,設(shè)定采樣時(shí)間Δt,將連續(xù)的空間機(jī)器人動(dòng)力學(xué)方程轉(zhuǎn)化為離散時(shí)間模型,在當(dāng)前k時(shí)刻測(cè)量值的基礎(chǔ)上實(shí)現(xiàn)對(duì)未來(lái)k+N時(shí)刻系統(tǒng)狀態(tài)的預(yù)測(cè):
(8)
空間機(jī)器人在實(shí)際工作過程中,相比于標(biāo)稱模型,會(huì)受到如測(cè)量誤差、關(guān)節(jié)摩擦等因素的影響,其實(shí)際動(dòng)力學(xué)模型應(yīng)為
Xk+1=Xk+δt·fnom(Xk,uk)+dk=ftrue(Xk,uk,δt)
(9)
式中:dk表示由于擾動(dòng)產(chǎn)生的空間機(jī)器人干擾力矩。
為此,本文利用GMM對(duì)空間機(jī)器人所受干擾力矩進(jìn)行估計(jì)補(bǔ)償,如圖2所示。
圖2 基于GMM的擾動(dòng)訓(xùn)練(左)和估計(jì)(右)方法示意圖
GMM在GP的基礎(chǔ)上,為了加快訓(xùn)練和預(yù)測(cè)速度,不再使用單一的GP假設(shè),而是采用期望最大化(expectation-maximization, EM)算法對(duì)GMM模型進(jìn)行訓(xùn)練,在訓(xùn)練樣本聚類得到的M個(gè)子集基礎(chǔ)上,對(duì)每個(gè)子集服從的高斯變量進(jìn)行回歸,最后在預(yù)測(cè)時(shí),對(duì)各子集對(duì)應(yīng)的局部預(yù)測(cè)值進(jìn)行融合得到最終預(yù)測(cè)值。
GMM假設(shè)樣本數(shù)據(jù)服從高斯混合分布,即包含A組樣本數(shù)據(jù)的輸入x,其概率密度分布函數(shù)為
(10)
式中:M為樣本子集個(gè)數(shù);πi為混合系數(shù),代表樣本來(lái)源于第i個(gè)高斯分量的概率;p(x|μi,Σi)代表由第i個(gè)高斯分量生成樣本的概率;{μi,Σi}為高斯混合過程的超參數(shù),其中μi代表均值向量,Σi代表協(xié)方差矩陣。
與GP的訓(xùn)練類似,GMM的訓(xùn)練過程即超參數(shù){μi,Σi}和混合系數(shù)πi的求解過程。EM算法作為一種超參數(shù)求解的有效算法,核心思想類似最大似然估計(jì)或極大后驗(yàn)概率估計(jì)。主要過程分為兩部分:期望步驟(expection-step,簡(jiǎn)稱E步驟)和最大化步驟(maximization-step, 簡(jiǎn)稱M步驟),兩部分迭代進(jìn)行。其中,E步驟利用M步驟估計(jì)的參數(shù){πi,μi,Σi}計(jì)算第a個(gè)樣本來(lái)自第i個(gè)高斯分量的后驗(yàn)概率ri:
(11)
M步驟通過E步驟計(jì)算得出的訓(xùn)練樣本的后驗(yàn)概率ri,通過極大化對(duì)數(shù)似然函數(shù)更新模型參數(shù):
(12)
其次,針對(duì)每一組高斯分量進(jìn)行回歸預(yù)測(cè)。擾動(dòng)估計(jì)結(jié)果來(lái)自第i個(gè)高斯分量的后驗(yàn)概率為
(13)
(14)
式中:{xi,yi}是第i個(gè)高斯分量對(duì)應(yīng)的訓(xùn)練數(shù)據(jù);x*是測(cè)試數(shù)據(jù);σy是量測(cè)噪聲;Ki,K*i,K**i分別為訓(xùn)練數(shù)據(jù)之間、訓(xùn)練數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)之間以及預(yù)測(cè)數(shù)據(jù)之間的協(xié)方差,具體計(jì)算方式根據(jù)協(xié)方差函數(shù),也稱為核函數(shù)的形式確定。平方指數(shù)核是一種最常見的核函數(shù),由于其連續(xù)可微而便于在NMPC過程中進(jìn)行雅克比計(jì)算[17]:
(15)
式中:σf和l稱為超參數(shù),其求解一般通過最大似然估計(jì)實(shí)現(xiàn):
(16)
(17)
為了實(shí)現(xiàn)空間機(jī)器人在任務(wù)空間中的軌跡跟蹤問題,同時(shí)應(yīng)對(duì)實(shí)際工作過程中出現(xiàn)的驅(qū)動(dòng)器輸入飽和等約束以及模型失配,如圖3所示,本文首先提出了基于GMM的NMPC,然后考慮了操作過程中空間機(jī)器人基座噴氣推力器推力分配方法。
圖3 GMM-MPC示意圖
(18)
式中:Qr,Qt分別代表控制誤差和輸入懲罰項(xiàng)的加權(quán)矩陣;Xinit,ξinit分別為優(yōu)化初始時(shí)刻采樣得到的空間機(jī)器人關(guān)節(jié)空間和任務(wù)空間狀態(tài);umax,umin分別對(duì)應(yīng)控制輸入的上下限;N代表預(yù)測(cè)步數(shù),通過對(duì)時(shí)域T進(jìn)行離散化得到,即N=T/dt。
通過選擇合適的控制器參數(shù),包括Δt,N,Qr,Qt,求解上述優(yōu)化控制問題,得到未來(lái)N個(gè)時(shí)刻的控制量U=[uk,uk+1,…,uk+N-1]T,僅將k時(shí)刻控制量uk作為系統(tǒng)輸入。
對(duì)于所提的MPC問題,考慮到計(jì)算量和實(shí)時(shí)性的要求,利用CasADi[22]和ACADOS[23]進(jìn)行求解。其主要思路是首先利用多重打靶將其轉(zhuǎn)化為非線性二次優(yōu)化問題,再利用實(shí)時(shí)迭代策略下的序列二次規(guī)劃進(jìn)行求解。
空間機(jī)器人基座運(yùn)動(dòng)所需的控制力和力矩由基座配置的噴氣推力器產(chǎn)生。對(duì)于GMM-MPC求解得到的控制量uk,需要將其中基座的控制量u0分配并轉(zhuǎn)化成對(duì)應(yīng)激活推力器的控制指令。為此,本文構(gòu)造了如下的優(yōu)化問題以解決推力分配問題:
(19)
式中:Tlb,Tub代表推力器的推力飽和約束。
通過求解上述優(yōu)化問題,得到了每個(gè)推力器的推力數(shù)值,在提供基座控制需求的同時(shí),滿足能量消耗最少和推力飽和約束。但是,求解得到的是在[Tlb,Tub]間的任意大小的值,而常用的星載冷氣推進(jìn)器一般只能提供最大推力與零推力兩種模式。因此,為了滿足實(shí)際推力器的“開-關(guān)”控制模式,通過脈沖寬度調(diào)制(pulse-width modulation,PWM)方法將連續(xù)推力轉(zhuǎn)換為每個(gè)推力器開機(jī)時(shí)間:
(20)
最后,考慮推力器的最小開機(jī)時(shí)間Δtc,得到最終的推力器驅(qū)動(dòng)指令:
(21)
首先,介紹仿真所用的空間機(jī)器人系統(tǒng)構(gòu)型及參數(shù)??紤]到三維多臂機(jī)器人系統(tǒng)自由度較高,應(yīng)用所提出算法求解復(fù)雜,同時(shí)為了后續(xù)在實(shí)驗(yàn)室已有硬件基礎(chǔ)上進(jìn)行實(shí)驗(yàn),本文以一個(gè)平面空間機(jī)器人模型進(jìn)行仿真,著重驗(yàn)證算法的有效性而避免對(duì)計(jì)算量的討論。其仿真構(gòu)型如圖4所示。
空間機(jī)器人模型每個(gè)連桿的質(zhì)心位于連桿的中心處;慣性系初始時(shí)刻與機(jī)器人基座系重合,其慣性參數(shù)如表1所示。由于僅考慮空間機(jī)器人的平面運(yùn)動(dòng),因此提供驅(qū)動(dòng)的8個(gè)噴氣推力器沿xB-yB平面布置,即γl=0,?l=1,2,…,8,具體的推力器構(gòu)型參數(shù)見表2,其中[xTl,yTl]T代表推力器安裝位置,βl代表指向角度。
表1 空間機(jī)器人慣性參數(shù)
表2 推力器構(gòu)型參數(shù)
為了驗(yàn)證本文提出算法的有效性,給定空間機(jī)器人初始狀態(tài)ξ0=[0,0,0,0,0,0]T,跟蹤參考軌跡為
(22)
式中:tn=t/tf,tf代表期望運(yùn)動(dòng)時(shí)間;ξ1,ξf分別為期望軌跡的起始狀態(tài)和末狀態(tài)。
同時(shí),在軌跡跟蹤的過程中,為了讓仿真結(jié)果盡可能地貼合現(xiàn)實(shí)情況,參考文獻(xiàn)[17,24]引入兩種形式的模型不確定性:第1種由連桿長(zhǎng)度、質(zhì)量、轉(zhuǎn)動(dòng)慣量等參數(shù)誤差產(chǎn)生,但本文中并非一一對(duì)其進(jìn)行考慮,而是將其集總為中模型參數(shù)的偏差,即將H和C與真值的相對(duì)誤差設(shè)置為30%;第2種為周期性擾動(dòng):
(23)
為了實(shí)現(xiàn)第3.2節(jié)中描述的仿真任務(wù)場(chǎng)景,設(shè)計(jì)了GMM-MPC控制器進(jìn)行仿真研究,并將仿真結(jié)果與標(biāo)準(zhǔn)MPC控制器以及SGP結(jié)果進(jìn)行對(duì)比,驗(yàn)證本文設(shè)計(jì)方法的有效性和優(yōu)越性,仿真所用參數(shù)見表3。
表3 仿真參數(shù)
在仿真開始之前,利用標(biāo)準(zhǔn)MPC控制器跟蹤一系列期望軌跡,建立包含1 400組[x,y]的數(shù)據(jù)集,其中1 300組用于訓(xùn)練得到GMM,100組用于進(jìn)行模型的性能測(cè)試。訓(xùn)練和測(cè)試結(jié)果如圖5~圖7所示。其中圖5(a)和圖5(b)分別描述了訓(xùn)練得到的高斯混合模型在測(cè)試集上的一步預(yù)測(cè)結(jié)果,可以看出GMM能夠有效地估計(jì)擾動(dòng)對(duì)于空間機(jī)器人基座和關(guān)節(jié)的影響,即使對(duì)于基座角度和輕質(zhì)關(guān)節(jié)處產(chǎn)生的大幅變動(dòng)也有較好的估計(jì)效果。為了量化并對(duì)比GMM估計(jì)結(jié)果,計(jì)算了均方根誤差(root mean square error, RMSE):
圖5 GMM測(cè)試結(jié)果
(24)
為了避免偶然性,計(jì)算得到5次預(yù)測(cè)的平均RMSE為[0.014 6,0.001 9,0.054 9,0.068 0,0.087 5]。圖6進(jìn)一步說(shuō)明了訓(xùn)練樣本數(shù)量與估計(jì)結(jié)果,即平均RMSE的關(guān)系,可以看出訓(xùn)練樣本過少時(shí)估計(jì)效果較差,提供更多的訓(xùn)練樣本可以盡可能地提高精度,但是訓(xùn)練和預(yù)測(cè)過程將更加漫長(zhǎng)。因此在500~600左右可以實(shí)現(xiàn)理想的精度,同時(shí)不消耗過多計(jì)算資源。最后比較了GMM與SGP的估計(jì)結(jié)果,如圖7所示,可以看出相同樣本數(shù)量情況下GMM比SGP精度有著明顯改善。隨著樣本數(shù)量的提升,SGP精度提升明顯。
圖6 GMM估計(jì)結(jié)果與訓(xùn)練樣本間的關(guān)系
圖7 GMM與SGP結(jié)果對(duì)比
最后,針對(duì)空間機(jī)器人的期望軌跡跟蹤問題,分別設(shè)計(jì)了基于標(biāo)準(zhǔn)MPC和部署了訓(xùn)練得到的GMM的GMM-MPC進(jìn)行實(shí)時(shí)仿真,以驗(yàn)證提出方法的有效性,仿真結(jié)果如圖8所示。對(duì)于沒有進(jìn)行不確定性補(bǔ)償?shù)臉?biāo)準(zhǔn)MPC控制器,其預(yù)測(cè)使用的標(biāo)稱動(dòng)力學(xué)模型與實(shí)際動(dòng)力學(xué)模型存在明顯差異,導(dǎo)致預(yù)測(cè)時(shí)域內(nèi)的系統(tǒng)狀態(tài)估計(jì)值與實(shí)際值不符,進(jìn)而影響控制信號(hào)求解。由于MPC本身具有一定的魯棒性,因此雖然圖11中所示的標(biāo)準(zhǔn)MPC跟蹤誤差仍存在收斂趨勢(shì),但在30 s時(shí)依然出現(xiàn)震蕩,收斂時(shí)間長(zhǎng),控制性能較差。
圖8 空間機(jī)器人期望軌跡
而GMM作為一種有效的數(shù)據(jù)驅(qū)動(dòng)非線性系統(tǒng)建模方法,能夠?qū)δP筒淮_定性進(jìn)行較為精確的補(bǔ)償。由圖9和圖10可以看出,基于GMM-MPC的空間機(jī)器人控制器在5 s以內(nèi)控制誤差即收斂到0,與如圖11所示的標(biāo)準(zhǔn)MPC跟蹤情況相比,有了明顯的改善,特別是針對(duì)末端狀態(tài)的控制,由于擾動(dòng)累積和基座/機(jī)械臂質(zhì)量比的影響,末端處模型不確定性較大,在標(biāo)準(zhǔn)MPC控制器作用下,相較于基座控制性能更差,但在GMM-MPC作用下其性能得到了有效提升。
圖9 GMM-MPC跟蹤結(jié)果
圖10 GMM-MPC跟蹤誤差
圖11 標(biāo)準(zhǔn)MPC跟蹤誤差
但同時(shí)可以注意到,圖9、圖10所示的跟蹤結(jié)果相比期望軌跡仍然存在一些偏差,這一方面是由于噴氣推力器存在死區(qū)特性,更主要的原因在于GP,包括GMM,其長(zhǎng)期預(yù)測(cè)能力有限,因此在測(cè)試集上估計(jì)效果較好,但是在仿真應(yīng)用中,隨著MPC預(yù)測(cè)時(shí)域的增長(zhǎng),GP的估計(jì)精度會(huì)有所下滑[19]。
整個(gè)任務(wù)過程中的推力器激活情況如圖12、圖13所示,初始階段由于軌跡跟蹤誤差較大,部分推力器激活時(shí)間較長(zhǎng)。由于需要抑制模型不確定性和機(jī)械臂運(yùn)動(dòng)的影響,以及推力器存在死區(qū)特性,隨著跟蹤誤差逐漸收斂,推力器激活時(shí)間減短,但不會(huì)完全關(guān)閉。
圖12 推力器T1-T4啟動(dòng)情況
圖13 推力器T5-T8啟動(dòng)情況
本文針對(duì)空間機(jī)器人的任務(wù)空間軌跡跟蹤控制問題,提出了一種基于高斯混合過程的MPC方法。首先,利用MPC解決了空間機(jī)器人基座和末端位姿對(duì)設(shè)定點(diǎn)的直接跟蹤,同時(shí)滿足輸入飽和等實(shí)際物理約束。為了解決預(yù)測(cè)過程中由于模型不確定性帶來(lái)的干擾,利用預(yù)實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練得到高斯混合過程以估計(jì)標(biāo)稱動(dòng)力學(xué)的誤差,并部署到MPC框架中。最后,考慮到空間機(jī)器人基座的驅(qū)動(dòng)形式,設(shè)計(jì)了噴氣推力器的推力分配方法。仿真結(jié)果表明,相比于SGP,GMM需要樣本更少、預(yù)測(cè)效果更好,本文提出的基于高斯混合過程的MPC方法能夠有效地實(shí)現(xiàn)空間機(jī)器人對(duì)任務(wù)空間參考軌跡的跟蹤,保證任務(wù)成功完成的同時(shí)更加直觀、簡(jiǎn)便。