孫俊,張世杰*,馬也,楚中毅
1.哈爾濱工業(yè)大學(xué) 航天學(xué)院,哈爾濱 150001
2.上海航天控制技術(shù)研究所 上海市空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 201109 3.北京航空航天大學(xué) 儀器科學(xué)與光電工程學(xué)院,北京 100083
空間非合作目標(biāo)慣性參數(shù)的Adaline網(wǎng)絡(luò)辨識(shí)方法
孫俊1,2,張世杰1,*,馬也3,楚中毅3
1.哈爾濱工業(yè)大學(xué) 航天學(xué)院,哈爾濱 150001
2.上海航天控制技術(shù)研究所 上海市空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 201109 3.北京航空航天大學(xué) 儀器科學(xué)與光電工程學(xué)院,北京 100083
空間在軌操作中,航天器在對(duì)空間非合作目標(biāo)的抓捕行動(dòng)常常導(dǎo)致航天器本體的姿態(tài)和空間軌跡發(fā)生變化。為克服空間非合作目標(biāo)對(duì)航天器本體動(dòng)力學(xué)、運(yùn)動(dòng)學(xué)的影響,使控制系統(tǒng)做出精準(zhǔn)及時(shí)的姿控策略調(diào)整,確保航天器正常在軌工作和軌跡姿態(tài)的高精度,需對(duì)抓捕的非合作目標(biāo)的慣性參數(shù)進(jìn)行辨識(shí)。針對(duì)傳統(tǒng)辨識(shí)方法依賴廣義逆求解導(dǎo)致的辨識(shí)過程運(yùn)算量大,且數(shù)值容易產(chǎn)生劇烈振蕩,造成辨識(shí)結(jié)果不穩(wěn)定等不足,采用基于歸一化最小均方(NLMS)準(zhǔn)則的Adaline神經(jīng)網(wǎng)絡(luò)方法進(jìn)行空間非合作目標(biāo)慣性參數(shù)的辨識(shí)。首先,基于動(dòng)量守恒理論建立抓捕后的航天器—機(jī)械臂—空間非合作目標(biāo)系統(tǒng)模型;然后將辨識(shí)方程的系數(shù)矩陣作為網(wǎng)絡(luò)的輸入和輸出,空間非合作目標(biāo)的慣性參數(shù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練權(quán)重,基于迭代步長可變的NLMS準(zhǔn)則實(shí)現(xiàn)對(duì)目標(biāo)慣量參數(shù)的快速、準(zhǔn)確辨識(shí);最后,在構(gòu)造的ADAMS/MATLAB聯(lián)合仿真平臺(tái)上進(jìn)行了驗(yàn)證。仿真結(jié)果表明,基于NLMS準(zhǔn)則的Adaline神經(jīng)網(wǎng)絡(luò)是一種快速、準(zhǔn)確辨識(shí)目標(biāo)慣量參數(shù)的有效方法。
航天器;非合作目標(biāo);慣性參數(shù);神經(jīng)網(wǎng)絡(luò);辨識(shí)
在軌服務(wù)技術(shù)一直是空間技術(shù)中十分重要且競爭激烈的領(lǐng)域。在軌服務(wù)關(guān)鍵技術(shù)中[1],無人參與的空間作業(yè)不但能夠保障宇航員空間作業(yè)的安全,且大大降低了操作成本,因而成為了在軌服務(wù)技術(shù)的發(fā)展潮流。無人參與的空間作業(yè)主要是通過空間機(jī)器人智能操作(捕獲,對(duì)接,移動(dòng),控制)代替人工作業(yè),來保證航天器的正常工作??臻g機(jī)器人(機(jī)械臂)對(duì)空間非合作目標(biāo)的在軌操作中,由抓捕任務(wù)中機(jī)械臂運(yùn)動(dòng)導(dǎo)致的航天器本體的動(dòng)力學(xué)、運(yùn)動(dòng)學(xué)等特性的改變,致使航天器本體的在軌姿態(tài)和空間軌跡發(fā)生變化。這對(duì)軌道和姿態(tài)精度要求極高的在軌航天器控制系統(tǒng)提出了嚴(yán)峻的挑戰(zhàn)。為了使姿態(tài)軌道控制系統(tǒng)做出精準(zhǔn)的控制策略,保證航天器正常在軌運(yùn)行,需要首先對(duì)所抓捕的空間非合作目標(biāo)的慣性參數(shù)進(jìn)行快速準(zhǔn)確辨識(shí)。
對(duì)空間目標(biāo)物慣性參數(shù)的辨識(shí)一直是空間非合作目標(biāo)抓捕系統(tǒng)的關(guān)鍵技術(shù)之一[2]。由于在太空環(huán)境下,機(jī)器人常常處于自由飛行或自由漂?。?]狀態(tài),航天器基座不固定,航天器本體和非合作目標(biāo)產(chǎn)生強(qiáng)烈的耦合關(guān)系[4],無法測(cè)量非合作目標(biāo)獨(dú)立的動(dòng)力學(xué)、運(yùn)動(dòng)學(xué)信息;在抓捕空間非合作目標(biāo)的過程中,由于其質(zhì)心未知,無法對(duì)未知物本身進(jìn)行受力分析,也即無法通過對(duì)目標(biāo)物單獨(dú)施加外力的辦法來實(shí)現(xiàn)對(duì)目標(biāo)質(zhì)量和質(zhì)心的測(cè)量,地面上對(duì)物體慣性參數(shù)的測(cè)量辦法到了空間就會(huì)變得失效。因此,針對(duì)空間參數(shù)辨識(shí)的強(qiáng)耦合、非線性等特點(diǎn),需要采用系統(tǒng)的辨識(shí)方法,即將空間非合作目標(biāo)看作航天器本體—機(jī)械臂—空間非合作目標(biāo)這三者組成系統(tǒng)的一部分,通過分析系統(tǒng)的整體特性和可量測(cè)(航天器本體、機(jī)械臂)信息來求解未知部分即空間非合作目標(biāo)的特性。
航天器本體—機(jī)械臂—空間非合作目標(biāo)組成的系統(tǒng)在自由漂浮狀態(tài)下所受外力遠(yuǎn)遠(yuǎn)小于系統(tǒng)相互作用的內(nèi)力,滿足系統(tǒng)動(dòng)量守恒和系統(tǒng)內(nèi)力和、內(nèi)力矩和始終恒定等條件。由于系統(tǒng)的動(dòng)量守恒,可通過列寫系統(tǒng)線角動(dòng)量守恒方程來求解非合作目標(biāo)的慣性參數(shù);由于系統(tǒng)的內(nèi)力和、內(nèi)力矩和始終恒定,也可通過列寫系統(tǒng)的牛頓—?dú)W拉方程來求解非合作目標(biāo)的慣性參數(shù)。在太空微重力的環(huán)境下,力和力矩傳感器的信噪比相對(duì)較低,對(duì)于測(cè)量物體的力學(xué)信息常常無法滿足精度要求。而基于動(dòng)量守恒原理的參數(shù)辨識(shí)只需測(cè)量系統(tǒng)速度信息而無需知道系統(tǒng)的加速度和力等信息,因而逐漸成為空間參數(shù)辨識(shí)的基本原理。
在國內(nèi)外對(duì)空間目標(biāo)物慣性參數(shù)的研究中[5-13],Yoshisada等 詳 細(xì) 闡 述 了 基 于 兩 大 原 理(動(dòng)量守恒方程、牛頓—?dú)W拉方程)的空間非合作目標(biāo)慣性參數(shù)辨識(shí)方案[5],并通過構(gòu)造線性辨識(shí)方程求其廣義逆解來辨識(shí)目標(biāo)物的慣性參數(shù)。Roberto和Gerhard利用牛頓—?dú)W拉方程并通過使用加速度計(jì)測(cè)量來辨識(shí)空間非合作目標(biāo)的慣性參數(shù)[6],由于加速度計(jì)的使用,限制了其辨識(shí)精度。Thai等采用線動(dòng)量守恒和改進(jìn)的(增量式)角動(dòng)量守恒方程來辨識(shí)空間非合作目標(biāo)的慣性參數(shù)[7],但依然采取偽逆運(yùn)算的方法求解。郭琦和洪炳镕基于動(dòng)量守恒原理提出了雙臂四自由度空間機(jī)器人捕捉非合作目標(biāo)的參數(shù)辨識(shí)[8]。田富洋等利用動(dòng)量守恒原理辨識(shí)空間非合作目標(biāo)的慣性參數(shù)[9],且通過初步理論分析得出參數(shù)可辨識(shí)的條件:空間機(jī)器人至少包含3個(gè)自由度(3個(gè)機(jī)械臂)依次獲得初始速度。金磊和徐世杰基于動(dòng)量守恒原理提出了全增量式(線動(dòng)量和角動(dòng)量)的辨識(shí)方程[10],但辨識(shí)過程只選取3個(gè)時(shí)間點(diǎn)的測(cè)量信息,對(duì)量測(cè)數(shù)據(jù)的準(zhǔn)確性要求較高。張鵬基于觸覺信息對(duì)空間非合作目標(biāo)進(jìn)行參數(shù)辨識(shí)[11],然而觸碰激勵(lì)的控制范圍是一個(gè)亟待解決的難題。以上對(duì)非合作目標(biāo)慣性參數(shù)的辨識(shí)[5-13],大多通過構(gòu)造辨識(shí)方程并求其廣義逆解(偽逆解)或通過遞推式最小二乘(Recursive Least Square,RLS)準(zhǔn)則求解非合作目標(biāo)的慣性參數(shù)。求解過程所涉及到的求逆運(yùn)算不但增大了辨識(shí)過程的計(jì)算量,且當(dāng)輸入信號(hào)的自適應(yīng)相關(guān)矩陣失去正定特性,還將引起算法的發(fā)散[14],使辨識(shí)過程的數(shù)值產(chǎn)生劇烈振蕩,造成辨識(shí)結(jié)果的不穩(wěn)定,這對(duì)于要求實(shí)時(shí)精確的姿態(tài)軌道控制而言是無法接受甚至是必須避免的。這方面,陳恩偉等[15]曾利用牛頓—?dú)W拉方程并構(gòu)造神經(jīng)網(wǎng)絡(luò)進(jìn)行了地面固定基座機(jī)械臂末端操作物慣性參數(shù)的辨識(shí),并為解決實(shí)際應(yīng)用中獲取樣本難和實(shí)時(shí)性差等問題提供了一種有效的參考途徑,但為確保網(wǎng)絡(luò)訓(xùn)練法則的收斂,需要同時(shí)使兩個(gè)關(guān)節(jié)做加速運(yùn)動(dòng)并保證末端操作物獨(dú)立的力和力矩信息可測(cè)。
神經(jīng)網(wǎng)絡(luò)由于其并行處理、自學(xué)習(xí)及自適應(yīng)能力等特點(diǎn),在模式識(shí)別、系統(tǒng)辨識(shí)等領(lǐng)域有著廣泛應(yīng)用。包括自適應(yīng)線性元件(Adaline)、反向傳播(BP)、徑向基函數(shù)(RBF)、霍普菲爾(Hopfield)等在內(nèi)的神經(jīng)網(wǎng)絡(luò)參數(shù)辨識(shí),不但能夠有效處理線性時(shí)不變系統(tǒng)問題,對(duì)于非線性時(shí)變過程也有著良好的逼近性能。其中,BP、RBF等網(wǎng)絡(luò)主要適用多隱層多輸入、多輸出網(wǎng)絡(luò)的學(xué)習(xí)?;谧钚【剑↙east Mean Square,LMS)算法的Adaline網(wǎng)絡(luò)(多輸入、單輸出)是一種單隱層前饋神經(jīng)網(wǎng)絡(luò),具有網(wǎng)絡(luò)結(jié)構(gòu)簡單,計(jì)算量小,可通過更換自適應(yīng)算法方便地改善其性能[16-18]等優(yōu)點(diǎn)因而得到大量應(yīng)用。
為實(shí)現(xiàn)對(duì)目標(biāo)物慣量參數(shù)的快速、準(zhǔn)確辨識(shí),本文首先基于動(dòng)量守恒理論建立抓捕后的航天器—機(jī)械臂—空間非合作目標(biāo)系統(tǒng)模型,然后構(gòu)造Adaline網(wǎng)絡(luò)[19],將辨識(shí)方程的系數(shù)矩陣作為網(wǎng)絡(luò)的輸入和輸出,非合作目標(biāo)的慣性參數(shù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練權(quán)重,基于迭代步長可變的歸一化最小均方(Normalized Least Mean Square,NLMS)準(zhǔn)則實(shí)現(xiàn)對(duì)目標(biāo)慣量參數(shù)的快速、準(zhǔn)確辨識(shí)。最后,在構(gòu)造的ADAMS/MATLAB聯(lián)合仿真平臺(tái)上進(jìn)行了驗(yàn)證,仿真結(jié)果表明,基于NLMS準(zhǔn)則的Adaline網(wǎng)絡(luò)是一種快速、準(zhǔn)確辨識(shí)目標(biāo)慣量參數(shù)的有效方法。
圖1所示為機(jī)械臂對(duì)空間非合作目標(biāo)捕獲后形成的航天器本體—n自由度(DOF)機(jī)械臂—非合作目標(biāo)系統(tǒng)。不失一般性,假設(shè)航天器本體處于空間自由漂浮狀態(tài),忽略微重力等外力作用。其中,非合作目標(biāo)被捕獲后與機(jī)械臂末端操作器固連成一體,即末端固連物,其慣性參數(shù)未知。
圖1 航天器—機(jī)械臂—非合作目標(biāo)系統(tǒng)Fig.1 System composed of spacecraft,manipulator and uncooperative target
圖1中:ΣI為慣性坐標(biāo)系,ΣB為航天器本體坐標(biāo)系,Σi為連桿i(i=1,2,…,n)的本體坐標(biāo)系(設(shè)置在關(guān)節(jié)i上,建系方式遵循 D-H 規(guī)則[20]),ΣU為末端操作器本體坐標(biāo)系(設(shè)置在關(guān)節(jié)n上);pB為航天器本體系原點(diǎn)在慣性系中的空間矢量;rB為航天器本體質(zhì)心在慣性系中的空間矢量;aB為航天器固連本體系原點(diǎn)到航天器本體質(zhì)心的位置矢量,bB為航天器本體質(zhì)心到關(guān)節(jié)1的位置矢量;pi為連桿i本體系原點(diǎn)在慣性系中的空間矢量;ri為連桿i質(zhì)心在慣性系中的空間矢量;ai為連桿i本體坐標(biāo)原點(diǎn)到連桿i質(zhì)心的位置矢量;bi為連桿i質(zhì)心到關(guān)節(jié)i+1的位置矢量;aU為末端操作器本體系原點(diǎn)到末端固連物質(zhì)心(末端操作器與空間非合作目標(biāo)固連后的質(zhì)心)的位置矢量;pU為末端操作器本體系原點(diǎn)在慣性系中的空間矢量;rU為末端固連物質(zhì)心在慣性系中的空間矢量; θi為在辨識(shí)過程中關(guān)節(jié)i的電機(jī)驅(qū)動(dòng)角速度信號(hào);ωB為航天器本體角速度;ωi為連桿i的角速度;ωU為末端固連物的角速度。
根據(jù)運(yùn)動(dòng)學(xué)關(guān)系可得以下數(shù)學(xué)關(guān)系:
以上各物理量符號(hào)均為空間三維矢量,且每一個(gè)公式中的各物理量需轉(zhuǎn)換到同一坐標(biāo)系下(慣性或本體坐標(biāo)系)運(yùn)算。
對(duì)于所要辨識(shí)的非合作目標(biāo)慣性參數(shù)具體包括非合作目標(biāo)(末端固連物)的質(zhì)量mU,質(zhì)心矢量aU= [aUxaUyaUz]T,慣量參數(shù)矢量I=[IxxIxyIxzIyyIyzIzz]T。
航天器在捕獲空間非合作目標(biāo)過程中(捕獲前的接近;捕獲中的碰撞、抓取等動(dòng)作;捕獲后形成末端固連物)始終保持航天器—機(jī)械臂—非合作目標(biāo)這個(gè)系統(tǒng)的線動(dòng)量、角動(dòng)量恒定。因而針對(duì)抓捕任務(wù)完成后系統(tǒng)的線動(dòng)量、角動(dòng)量進(jìn)行分析。
如圖1所示,系統(tǒng)的線動(dòng)量為
式中:P為系統(tǒng)總線動(dòng)量矢量;mB為航天器本體質(zhì)量;mi為連桿i的質(zhì)量;mU為末端固連物質(zhì)量。
現(xiàn)假設(shè)系統(tǒng)中mB、mi(i=1,2,…,n-1)已知或可量測(cè),且機(jī)械臂在捕獲行動(dòng)前的系統(tǒng)線動(dòng)量為零,即P=0,則有PK為系統(tǒng)線動(dòng)量可量測(cè)(已知)部分;由式(8)和式(9)可知,ωU、 pU可量測(cè)。同時(shí),式(13)可寫成矩陣形式為
式中
式(14)實(shí)現(xiàn)了非合作目標(biāo)慣性參數(shù)與系統(tǒng)可量測(cè)信息的線性化分離,并可寫成辨識(shí)方程式(15):
式中:
其中:A1(3×4)、b1(3×1)為可量測(cè)信息組成的矩陣和矢量;x1為空間非合作目標(biāo)的待辨識(shí)參數(shù)mU和aU= [aUxaUyaUz]T組 成 的 矢 量。式(15)為非合作目標(biāo)質(zhì)量和質(zhì)心的辨識(shí)方程。
同理,系統(tǒng)角動(dòng)量定義為L,且L=0,則
式中:IB為航天器本體相對(duì)于其質(zhì)心的慣性張量;Ii為連桿i相對(duì)于其質(zhì)心的慣性張量,可量測(cè);IU為末端固連物相對(duì)于其質(zhì)心的慣性張量。
由式(12)與式(16)以及L=0,可得
令
式中:LK為系統(tǒng)角動(dòng)量可量測(cè)(已知)部分。則
式(16)轉(zhuǎn)化為慣性參數(shù)與系統(tǒng)可量測(cè)信息的線性公式為
式中:
aU由式(15)可得。
即通過系統(tǒng)線角動(dòng)量守恒及數(shù)學(xué)公式變換,式(18)可寫成辨識(shí)方程式為
其中:A2(3×6)、b2(3×1)為可量測(cè)信息組成的矩陣和矢量;x2為空間非合作目標(biāo)的待辨識(shí)參數(shù)I=[IxxIxyIxzIyyIyzIzz]T組成的矢量。式(20)為非合作目標(biāo)慣量參數(shù)的辨識(shí)方程。
通過依次求解式(15)、式(20),非合作目標(biāo)的10個(gè)慣性參數(shù)得到了完整辨識(shí)。
式(15)、式(20)可劃歸為線性方程Ax=b。由于式(15)、式(20)為不定方程,無法直接求得方程的解析值。為避免廣義逆求解計(jì)算復(fù)雜度高等不足,本文通過系統(tǒng)不同運(yùn)動(dòng)狀態(tài)下的有限組(A,b)時(shí)間序列來訓(xùn)練所構(gòu)造的Adaline神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)權(quán)重逐漸收斂到非合作目標(biāo)慣性參數(shù)的真值。
不失一般性,系數(shù)矩陣A為M×N矩陣,b為M×1列向量,x為待辨識(shí)慣性參數(shù)向量。由方程
可得
式中:A(k)為矩陣A 的第k 行行向量;b(k)為向量b的第k個(gè)元素。
構(gòu)造如圖2所示的Adaline神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)輸入為A(k),輸入節(jié)點(diǎn)個(gè)數(shù)為系數(shù)矩陣A的列數(shù);網(wǎng)絡(luò)期望輸出為b(k),實(shí)際輸出為y,輸出偏差為e;隱層節(jié)點(diǎn)輸出為t,節(jié)點(diǎn)偏置為d。根據(jù)Adaline網(wǎng)絡(luò)的特性[14],隱層節(jié)點(diǎn)的激活函數(shù)f(t)=t。
圖2 Adaline構(gòu)造示意圖Fig.2 Structure of Adaline network
為計(jì)算方便,節(jié)點(diǎn)偏置d設(shè)置為0。即
式中:w= [w1w2… wN]T。
對(duì)比式(22)、式(24),非合作目標(biāo)的慣性參數(shù)向量x成為了網(wǎng)絡(luò)訓(xùn)練中所要訓(xùn)練的權(quán)重矢量w,對(duì)網(wǎng)絡(luò)權(quán)值的訓(xùn)練即是對(duì)慣性參數(shù)的辨識(shí)。將可量測(cè)的l組(A,b)逐一拆解成M 組(A(k),b(k)),并將此l×M 組(A(k),b(k))作為訓(xùn)練集來訓(xùn)練Adaline網(wǎng)絡(luò),使網(wǎng)絡(luò)的權(quán)值矢量w=[w1
w2… wN]T隨著訓(xùn)練次數(shù)的增加最終收斂到慣性參數(shù)的真值。
系統(tǒng)運(yùn)動(dòng)過程產(chǎn)生的多組(A,b)會(huì)存在不同程度的相關(guān)性,而一般意義的LMS準(zhǔn)則極易導(dǎo)致辨識(shí)結(jié)果無法收斂到最優(yōu)值、極易陷入局部最小、甚至辨識(shí)結(jié)果發(fā)散等問題。因此為增大訓(xùn)練集(A,b)的無關(guān)性,提高網(wǎng)絡(luò)權(quán)值的收斂速度和準(zhǔn)確性,保證權(quán)值收斂到慣性參數(shù)的理論值,本文的網(wǎng)絡(luò)訓(xùn)練采用基于NLMS準(zhǔn)則[21]的自適應(yīng)算法。具體步驟如下:
1)將已采集到并連續(xù)生成的有限時(shí)間序列(A,b)元素在訓(xùn)練集中隨機(jī)編號(hào),并按編號(hào)順序訓(xùn)練Adaline網(wǎng)絡(luò)。即通過隨機(jī)選取順序生成的訓(xùn)練元素(A,b)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
2)根據(jù)LMS算法[21]可得
式中:w(p)為網(wǎng)絡(luò)第p次訓(xùn)練權(quán)值向量;μ為權(quán)值迭代步長;e(p)為網(wǎng)絡(luò)期望輸出與實(shí)際輸出的
通過以上神經(jīng)網(wǎng)絡(luò)的構(gòu)造,可得
式中:tr(R)為R 的跡。
而迭代步長可變的NLMS準(zhǔn)則中[21],有偏差;u(p)為網(wǎng)絡(luò)第p次輸入向量。本文中,u=A(k)。
一般意義的LMS算法穩(wěn)定性取決于迭代步長μ(常值)和輸入向量的自相關(guān)矩陣R[21]。
且算法穩(wěn)定的充要條件為
且算法收斂條件為α∈(0,2),β∈(0,1)。
即NLMS與一般意義的LMS相比,其收斂條件只與算法的步長調(diào)整因子α、β的取值范圍有關(guān),與輸入信號(hào)u(n)的自相關(guān)程度無關(guān),且迭代步長根據(jù)輸入信號(hào)的取值不同而變化,使得NLMS有著更快的收斂速度,從而在處理存在不同程度相關(guān)性的(A,b)過程中能夠得到更準(zhǔn)確的收斂結(jié)果。
仿真過程采取ADAMS/MATLAB聯(lián)合仿真來實(shí)現(xiàn)。首先,利用ADAMS軟件平臺(tái)建立后抓捕的航天器本體—3DOF機(jī)械臂—空間非合作目標(biāo)的動(dòng)力學(xué)模型,其中關(guān)節(jié)1、關(guān)節(jié)2、關(guān)節(jié)3的電機(jī)驅(qū)動(dòng)方向在空間慣性系下正交,如圖3所示。系統(tǒng)模型的實(shí)際動(dòng)力學(xué)信息見表1,表1中:Link 0為航天器本體,Link 3+為末端固連物(Link 3與非合作目標(biāo)固連在一起),表1中未列出的數(shù)據(jù)分量在實(shí)際模型中為零。
圖3 ADAMS構(gòu)建的系統(tǒng)動(dòng)力學(xué)模型Fig.3 System dynamic model established by ADAMS
表1 系統(tǒng)模型慣性和尺寸參數(shù)(3DOF機(jī)械臂)Table 1 Geometric and inertial parameters of space robot model with 3-DOF manipulator
辨識(shí)過程中需要測(cè)知航天器本體相對(duì)于慣性系的線速度、角速度和轉(zhuǎn)角(計(jì)算不同坐標(biāo)轉(zhuǎn)換的旋轉(zhuǎn)矩陣)。通過ADAMS軟件中仿真?zhèn)鞲衅鳎ú蓸宇l率為100Hz)的使用,將所需運(yùn)動(dòng)學(xué)信息逐一導(dǎo)出至 MATLAB/SIMULINK 平臺(tái)中。MATLAB/SIMULINK通過式(2)~式(10)以及表1的數(shù)據(jù)來解算各連桿和各關(guān)節(jié)的運(yùn)動(dòng)學(xué)信息,并以此構(gòu)造辨識(shí)矩陣(A,b)。最后通過MATLAB/SIMULINK建立Adaline神經(jīng)網(wǎng)絡(luò)并進(jìn)行網(wǎng)絡(luò)的訓(xùn)練,實(shí)現(xiàn)對(duì)非合作目標(biāo)慣性參數(shù)的辨識(shí)。ADAMS軟件建立的動(dòng)力學(xué)模型中各關(guān)節(jié)的動(dòng)摩擦系數(shù)υd為0.3,靜摩擦系數(shù)υs為0.5,靜摩擦轉(zhuǎn)換速度Vs為0.1rad·s-1。即[22]
式中:nf為驅(qū)動(dòng)關(guān)節(jié)運(yùn)動(dòng)過程受到的摩擦力矩;fN為關(guān)節(jié)所受正壓力;槇θi為關(guān)節(jié)i驅(qū)動(dòng)后相對(duì)于Σi的實(shí)際角速度。此外,為確保算法的收斂性以及辨識(shí)精度,本文通過仿真對(duì)比得到收斂條件下的參數(shù)設(shè)置(式(27)和式(28)):NLMS算法中,α設(shè)置為1.8,β設(shè)置為0.9;而對(duì)一般意義的LMS算法,μ設(shè)置為0.001。網(wǎng)絡(luò)初始權(quán)重可隨機(jī)選取,在仿真中初始權(quán)重均設(shè)置為w0=[1(1)1(2)… 1(N)]T。
值得指出的是,仿真中為獲得系統(tǒng)不同運(yùn)動(dòng)狀態(tài)下產(chǎn)生的矩陣(A,b),需要對(duì)機(jī)械臂上的各個(gè)關(guān)節(jié)施加驅(qū)動(dòng)信號(hào),從而使捕獲后的固連系統(tǒng)產(chǎn)生不同的運(yùn)動(dòng)狀態(tài)。為保證關(guān)節(jié)運(yùn)動(dòng)前后對(duì)航天器本體的位姿擾動(dòng)最小,驅(qū)動(dòng)過程采用周期信號(hào),驅(qū)動(dòng)時(shí)間為信號(hào)的整周期倍數(shù)。即分別對(duì)關(guān)節(jié)1、2、3依次驅(qū)動(dòng)100s,總共驅(qū)動(dòng)300s,驅(qū)動(dòng)信號(hào)均為頻率0.2Hz,幅值為1的余弦波角加速度信號(hào)。
各關(guān)節(jié)驅(qū)動(dòng)信號(hào)如表2所示,t代表各關(guān)節(jié)施加驅(qū)動(dòng)的時(shí)間。
表2 各關(guān)節(jié)驅(qū)動(dòng)信號(hào)Table 2 Actuating signals of joints
NLMS與LMS兩種算法的辨識(shí)誤差對(duì)比如表3所示,辨識(shí)結(jié)果如圖4所示。從表3和圖4中可以看出,基于NLMS的辨識(shí)誤差均在±0.25%之內(nèi),且辨識(shí)結(jié)果較穩(wěn)定;而基于迭代步長固定的LMS辨識(shí)誤差相對(duì)較大且穩(wěn)定性不如NLMS算法。通過圖4還可以看出,兩種算法下的辨識(shí)結(jié)果均收斂至某一固定值,其中LMS隨著網(wǎng)絡(luò)迭代過程逐漸陷入了局部最小值,并沒有收斂到慣性參數(shù)的理論值,而NLMS在相同的網(wǎng)絡(luò)輸入輸出下收斂至理論值,這說明NLMS對(duì)于相關(guān)程度較大的網(wǎng)絡(luò)輸入輸出數(shù)據(jù)仍能保持很好的收斂效果。在上述仿真研究的基礎(chǔ)上,根據(jù)式(1)、式(2),進(jìn)一步研究測(cè)量誤差等干擾對(duì)辨識(shí)的影響,即對(duì)慣性系下的量測(cè)量 pB、ωB與航天器本體相對(duì)于慣性系的轉(zhuǎn)角添加均值為0,標(biāo)準(zhǔn)差為σ的高斯白噪聲,其中,σ取為信號(hào)幅值的1%。
表3 兩種算法的辨識(shí)結(jié)果Table 3 Simulation results of two algorithms
圖4 辨識(shí)結(jié)果(290-300s)Fig.4 Identification results(290-300s)
通過Adaline網(wǎng)絡(luò)對(duì)含有噪聲信息的矩陣(A,b)進(jìn)行參數(shù)辨識(shí),由于噪聲的干擾,為確保算法的收斂性,迭代步長參數(shù)調(diào)整如下:
NLMS:α設(shè)置為0.45,β設(shè)置為1(質(zhì)量、質(zhì)心辨識(shí),式(15));α設(shè)置為0.01,β設(shè)置為1(慣性張量辨識(shí),式(20))。
LMS:μ設(shè)置為0.000 8(質(zhì)量、質(zhì)心辨識(shí),式(15));μ設(shè)置為0.001(慣性張量辨識(shí),式(20))。
辨識(shí)結(jié)果對(duì)比如表4,NLMS與LMS兩種算法的辨識(shí)誤差對(duì)比如圖5所示,辨識(shí)結(jié)果對(duì)比見表4。從圖5和表4可以看出,各項(xiàng)參數(shù)受到測(cè)量噪聲的影響,辨識(shí)精度均有不同程度的下降,且噪聲對(duì)慣性參數(shù)的影響較大。無論怎樣,基于NLMS算法的參數(shù)辨識(shí)隨著對(duì)網(wǎng)絡(luò)訓(xùn)練的結(jié)束而完成,其結(jié)果仍大大優(yōu)于迭代步長固定的LMS算法,除個(gè)別參數(shù)外,基于NLMS算法的辨識(shí)誤差均小于5%。
圖5 包含量測(cè)噪聲的辨識(shí)結(jié)果(290-300s)Fig.5 Identification results with noise(290-300s)
表4 包含噪聲信息的辨識(shí)結(jié)果Table 4 Simulation results with noise
值得特別指出的是,通過對(duì)比式(15)、式(20)可以看出,由于式(20)需同時(shí)辨識(shí)6個(gè)參數(shù),而式(15)只需同時(shí)辨識(shí)4個(gè)參數(shù),且待辨識(shí)參數(shù)的增多使辨識(shí)方程各參數(shù)間的耦合性增大,因而辨識(shí)結(jié)果受噪聲干擾的程度更大,有待于在后續(xù)的研究工作中進(jìn)一步深入分析和探討。
本文基于航天器—機(jī)械臂—空間非合作目標(biāo)組合系統(tǒng)的動(dòng)力學(xué)模型和動(dòng)量守恒原理,通過構(gòu)建基于NLMS準(zhǔn)則的Adaline網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)空間非合作目標(biāo)慣性參數(shù)的快速準(zhǔn)確辨識(shí),且呈現(xiàn)以下特點(diǎn)。
1)Adaline網(wǎng)絡(luò)通過自適應(yīng)算法具有自適應(yīng)能力,因此不需要獲取空間非合作目標(biāo)慣性參數(shù)的先驗(yàn)信息。仿真中只需要將辨識(shí)方程的系數(shù)矩陣分別作為網(wǎng)絡(luò)的輸入、輸出,待辨識(shí)慣性參數(shù)作為網(wǎng)絡(luò)的權(quán)值,并通過對(duì)權(quán)值的訓(xùn)練,即可實(shí)現(xiàn)對(duì)慣性參數(shù)的辨識(shí)。
2)在網(wǎng)絡(luò)的自適應(yīng)算法中,通過仿真對(duì)比LMS與NLMS對(duì)空間非合作目標(biāo)慣性參數(shù)的辨識(shí),理想情況下本文方法的辨識(shí)誤差在±0.25%之內(nèi)。進(jìn)一步考慮量測(cè)噪聲的影響,除個(gè)別參數(shù)外,本文方法的辨識(shí)誤差均小于5%,結(jié)果驗(yàn)證了迭代步長可變的NLMS準(zhǔn)則不僅降低了對(duì)輸入數(shù)據(jù)相關(guān)性的要求,更在辨識(shí)精度等方面相對(duì)LMS有較大幅度提高。
后續(xù)工作將著眼于NLMS準(zhǔn)則中α、β參數(shù)的最優(yōu)選取問題;其次還應(yīng)對(duì)航天器本體的擾動(dòng)控制做深入的研究,即在對(duì)空間非合作目標(biāo)參數(shù)辨識(shí)的同時(shí),通過對(duì)機(jī)械臂各關(guān)節(jié)施加最優(yōu)驅(qū)動(dòng)信號(hào)來消除辨識(shí)過程對(duì)航天器本體的擾動(dòng)。
[1] 崔乃剛,王平,郭繼峰,等.空間在軌服務(wù)技術(shù)發(fā)展綜述[J].宇航學(xué)報(bào),2007,28(4):805-811.CUI N G,WANG P,GUO J F,et al.A review of on-orbit servicing[J].Journal of Astronautics,2007,28(4):805-811(in Chinese).
[2] 蔡洪亮,高永明,邴啟軍,等.國外空間非合作目標(biāo)抓捕系統(tǒng)研究現(xiàn)狀與關(guān)鍵技術(shù)分析[J].裝備指揮技術(shù)學(xué)院學(xué)報(bào),2010,21(6):71-77.CAI H L,GAO Y M,BING Q J,et al.The research status and key technology analysis of foreign non-cooperative target in space capture system[J].Journal of the Academy of Equipment Command &Technology,2010,21(6):71-77(in Chinese).
[3] STEVEN D,EVANGELOS P.The kinematics dynamics,and control of free-flying and free-floating space robotic systems[J].IEEE Transactions on Robotics and Automation,1993,9(5):531-543.
[4] 盧偉,耿云海,陳雪芹,等.在軌服務(wù)航天器對(duì)目標(biāo)的相對(duì)位置和姿態(tài)耦合控制[J].航空學(xué)報(bào),2011,32(5):857-865.LU W,GENG Y H,CHEN X Q,et al.Coupled control of relative position and attitude for on-orbit servicing spacecraft with respect to target[J].Acta Aeronautica et Astronautica Sinica,2011,32(5):857-865(in Chinese).
[5] YOSHISADA M,KEI S,MITSUHIRO O.Parameter identification of unknown object handled by free-flying space robot[J].Journal of Guidance,Control,and Dynamics,1994,17(3):488-494.
[6] ROBERTO L,GERHARD H.Modeling and experimental design for the on-orbit inertial parameter identification of free-flying space robots[C]/International Design Engineering Technical Conferences and Computersand Information in Engineering Conference,2005:1-10.
[7] THAI CHAU N H,INNA S.Adaptive reactionless motion and parameter identification[J].Journal of Guidance,Control,and Dynamics,2013,36(2):404-414.
[8] 郭琦,洪炳镕.雙臂四自由度空間機(jī)器人捕捉未知目標(biāo)的參數(shù)辨識(shí)[J].機(jī)器人,2005,27(6):512-516.GUO Q,HONG B R.Parameter identification of unknown object handled by a dual-arm four-degree-of-free-dom space robot[J].Robot,2005,27(6):512-516 (in Chinese).
[9] 田富洋,吳洪濤,趙大旭,等.在軌空間機(jī)器人參數(shù)辨識(shí)研究[J].中國空間科學(xué)技術(shù),2010(1):10-17.TIAN F Y,WU H T,ZHAO D X,et al.Parameter identification of orbital free-floating space robot[J].Chinese Space Science and Technology,2010(1):10-17(in Chinese).
[10] 金磊,徐世杰.空間機(jī)器人抓取未知目標(biāo)的質(zhì)量特性參數(shù)辨識(shí)[J].宇航學(xué)報(bào),2012,33(11):1570-1576.JIN L,XU S J.Inertial parameter identification of unknown object captured by a space robot[J].Journal of Astronautics,2012,33(11):1570-1576(in Chinese).
[11] 張鵬.基于觸覺的空間非合作目標(biāo)慣性參數(shù)辨識(shí)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013.ZHANG P.Research on identification of inertial parameters of non-cooperative target with touch[D].Harbin:Harbin Institute of Technology,2013(in Chinese).
[12] 王明,黃攀峰,常海濤.非合作目標(biāo)航天器質(zhì)量特性參數(shù)辨識(shí)[J].飛行力學(xué),2014,32(6):536-540.WANG M,HUANG P F,CHANG H T.Identification of mass characteristic parameters for non-cooperative target spacecraft[J].Flight Dynamics,2014,32(6):536-540(in Chinese).
[13] 吳倩.空間非合作目標(biāo)慣性參數(shù)辨識(shí)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014:1-21.WU Q.Research on identification of inertial parameters of non-cooperative target[D].Harbin:Harbin Institute of Technology,2014:1-21(in Chinese).
[14] 耿妍,張端金.自適應(yīng)濾波算法綜述[J].信息與電子工程,2008,6(4):315-320.GENG Y,ZHANG D J.Survey of adaptive filtering algorithms[J].Information and Electronic Engineering,2008,6(4):315-320(in Chinese).
[15] 陳恩偉,劉正士,干方建.機(jī)器人末端臂慣性參數(shù)辨識(shí)的人工神經(jīng)網(wǎng)絡(luò)方法[J].中國機(jī)械工程,2006,17(3):268-271.CHEN E W,LIU Z S,GAN F J.Application of ANN method in inertial parameter identification of the end effector of robot[J].Chinese Journal of Mechanical Engineering,2006,17(3):268-271(in Chinese).
[16] SARITA N,MILAN B,DASH P K.Estimation of time varying signal parameters using an improved Adaline learning algorithm[J].International Journal of Electronics and Communications,2014,68(2):115-129.
[17] MOHAMMED Q,PARAG K,VINOD K.Artificial-neural-network-based phase-locking scheme for active power filters[J].IEEE Transactions on Industrial Electronics,2014,61(8):3857-3866.
[18] HAMID S,ALI B,DJAFFAR O A,et al.ADALINE approach for induction motor mechanical parameters identification[J].Mathematics and Computers in Simulation,2013,90:86-97.
[19] WIDROW B,LEHR M A.30years of adaptive neural networks perception,madaline,and back propagation[J].Proceedings of the IEEE,1990,78(9):1415-1442.
[20] 金萬敏,萬坤華.機(jī)器人動(dòng)力學(xué)建模[J].東南大學(xué)學(xué)報(bào),1993,23(A06):19-26.JIN W M,WAN K H.The dynamic modeling in robots[J].Journal of Southeast University,1993,23(A06):19-26(in Chinese).
[21] 李寧.LMS自適應(yīng)濾波算法的收斂性能研究與應(yīng)用 [D].哈爾濱:哈爾濱工程大學(xué),2009.LI N.Convergence performance analysis and applications of the adaptive least mean square(LMS)algorithm[D].Harbin:Harbin Engineering University,2009 (in Chinese).
[22] Basic ADAMS full simulation training guide.Version12.0[EB/OL].[2015-09-01].http/www.a(chǎn)dams.com.
Adaline network-based identification method of inertial parameters for space uncooperative targets
SUN Jun1,2,ZHANG Shijie1,* ,MA Ye3,CHU Zhongyi3
1.School of Astronautics,Harbin Institute of Technology,Harbin 150001,China 2.Shanghai Key Laboratory of Space Intelligent Control Technology,Shanghai Institude of Spaceflight Control Technology,Shanghai 201109,China 3.School of Instrument Science and Opto-electronics Engineering,Beihang University,Beijing 100083,China
During the operation in space,the spacecraft's attitude and trajectory are often affected by capturing the uncooperative target.In order to overcome the influence of uncooperative target on the dynamics and kinematics of spacecraft and ensure the high-precision attitude control strategy to be made and normal in-orbit condition,aprocess of identifying the inertial parameters of uncooperative targets should be accommodated.In order to avoid a large amount of computation induced by generalized inverse operation of traditional method in the identification process,which also causes severe vibration and unstability to numerical results,an Adaline neural network identification method based on normalized least mean square(NLMS)criterion is adopted.First of all,a system model composed of spacecraft,manipulator and uncooperative target is established based on the theory of momentum conservation.Then the weight parameters of the neural network representing the inertial parameters of uncooperative target are trained by the coefficient matrix of the identification equation as the input and output of the neural network via algorithm of NLMS with variable iterative step,and a fast and accurate process of identification is achieved.Finally,an ADAMS/MATLAB co-simulation platform is established,on which the proposed identification method is verified.The simulation results show that the Adaline neural network based on NLMS criterion is a fast and accurate method for identifying the target's inertia parameters.
spacecraft;uncooperative target;inertial parameter;neural network;identification
2015-09-07;Revised:2015-09-30;Accepted:2015-12-22;Published online:2016-01-06 15:41
URL:www.cnki.net/kcms/detail/11.1929.V.20160106.1541.004.html
s:National Natural Science Foundation of China(51375034,61327809);Shanghai Aerospace Science and Technology Innovation Fundation(SAST2015-075)
V441
A
1000-6893(2016)09-2799-10
10.7527/S1000-6893.2015.0349
2015-09-07;退修日期:2015-09-30;錄用日期:2015-12-22;網(wǎng)絡(luò)出版時(shí)間:2016-01-06 15:41
www.cnki.net/kcms/detail/11.1929.V.20160106.1541.004.html
國家自然科學(xué)基金 (51375034,61327809);上海航天科技創(chuàng)新基金 (SAST2015-075)
*通訊作者.Tel.:0451-86414117-8409 E-mail:sjzhang@hit.edu.cn
孫俊,張世杰,馬也,等.空間非合作目標(biāo)慣性參數(shù)的Adaline網(wǎng)絡(luò)辨識(shí)方法[J].航空學(xué)報(bào),2016,37(9):27992-808.SUN J,ZHANG S J,MA Y,et al.Adaline networkb-ased identification method of inertial parameters for space uncooperative targets[J].Acta Aeronautica et Astronautica Sinica,2016,37(9):27992-808.
孫俊 男,博士研究生,高級(jí)工程師。主要研究方向:航天器導(dǎo)航與控制。
Tel:021-24183325
E-mail:sjlovedh@hotmail.com
張世杰 男,博士,教授,博士生導(dǎo)師。主要研究方向:小衛(wèi)星技術(shù)。
Tel:0451-86414117-8409
E-mail:sjzhang@hit.edu.cn
馬也 男,碩士研究生。主要研究方向:空間機(jī)器人及航天器控制技術(shù)。
Tel:010-82339013
E-mail:2763251585@qq.com
楚中毅 男,博士,副教授。主要研究方向:空間機(jī)器人及航天器控制技術(shù)。
Tel:010-82339013
E-mail:chuzy@buaa.edu.cn
*Corresponding author.Tel.:0451-86414117-8409 E-mail:sjzhang@hit.edu.cn