,, ,,
(哈爾濱工業(yè)大學機器人技術與系統(tǒng)國家重點實驗室,黑龍江 哈爾濱 150001)
雙足跳躍機器人的適應性CPG運動控制
王婷婷,査富生,郭偉,李滿天,孫立寧
(哈爾濱工業(yè)大學機器人技術與系統(tǒng)國家重點實驗室,黑龍江 哈爾濱 150001)
生物學實驗表明,生物體跑、跳等節(jié)律運動是由位于脊髓中的CPG產生的[1]。CPG是一種由多個神經元構成的神經網絡,可生成一系列節(jié)律性輸出用于生物行走運動的控制[2]。而當神經網絡或生物肢體受到損傷時,CPG可通過網絡參數與神經元連接的調整,生成新的運動模式以維持軀體的運動[3]。
針對機器人在環(huán)境中的適應性問題,研究者們做出了不同的研究[4-6]。雙足機器人在運動過程中,可能由于故障和損傷等情況,使其中一足的運動受到限制,無法繼續(xù)跳躍。針對這種情況,在建立可變結構CPG運動控制機制的基礎上,通過時間延遲響應環(huán)節(jié)的添加使控制系統(tǒng)能夠響應機器人自身狀態(tài)的改變,從而在突發(fā)狀況下及時地改變系統(tǒng)的運動模式輸出,以維持機器人的運動。
雙足跳躍機器人結構模型如圖1所示。機器人由2個相同的肢體腿A與腿B構成,每個肢體具有1個與軀體相連的轉動關節(jié),及腿部上的1個直線彈簧關節(jié)。轉動關節(jié)由其上的力矩驅動器控制,而直線彈簧關節(jié)可由其上的直線驅動器壓縮。
雙足跳躍機器人通過兩腿交替著地完成跳躍運動。當機器人正常運動時,每一肢體均接收其對側肢體的實時狀態(tài)以生成跳躍運動,即腿A著地與將要著地時,腿B隨之收縮以避免與地面碰撞,而腿A結束1個著地周期后,腿B隨之伸長,以準備下次著地。由于機器人雙腿為對稱結構,以機器人的1條腿為例,其幾何參數如圖2所示。
圖1 雙足跳躍機器人結構
圖2 機器人的幾何參數
機器人單足的跳躍運動過程分為著地相與擺動相。在著地過程中,機器人通過轉動關節(jié)處的驅動器輸出扭矩,維持機器人軀體與腿部的夾角τ以及器人軀體的平衡,并通過腿部彈簧處的直線驅動器動作,通過直線彈簧長度l的改變補充系統(tǒng)在跳躍過程中損耗的能量;在飛行相中通過機器人著地角θ的調節(jié),來控制機器人的前進速度??刂葡到y(tǒng)通過控制轉動關節(jié)與腿部彈簧處的驅動器輸出,維持機器人的穩(wěn)定跳躍。
當雙足跳躍機器人正常運動時,機器人的每一肢體均同時感知并接收自身與對側肢體的運動狀態(tài),以此決定關節(jié)的運動輸出。而當一側肢體發(fā)生故障或受到限制,無法參與運動時,需要CPG控制系統(tǒng)改變自身的連接與結構方式,從兩足的跳躍控制結構轉換為單足的跳躍控制結構,且要求此時機器人單足能夠在缺乏對側肢體運動狀態(tài)反饋的情況下,獨立地控制單肢體繼續(xù)維持跳躍運動。
基于此運動控制要求,建立了可變結構的CPG控制結構,如圖3所示。可變結構的雙足CPG控制結構由2個對稱的控制單元組成,分別負責機器人腿A與腿B的運動控制。每個控制單元由4個神經元構成,分別接收來自自身運動狀態(tài)的刺激性輸入、來自對側肢體的刺激與抑制性輸入。當一側的控制單元出現故障時,另一側的控制單元可獨立控制其所對應的機器人肢體,維持穩(wěn)定的跳躍運動。
當機器人一側肢體損壞或故障時,控制機制面臨的第2個問題是傳感信息的缺失。傳感信息對機器人的穩(wěn)定運動具有重要的意義,通過對傳感信息的接收與處理,機器人可響應自身運動狀態(tài)及與環(huán)境交互狀態(tài)的變化,生成穩(wěn)定的運動。當雙足機器人正常跳躍時,機器人雙足交替著地,其與環(huán)境的交互狀態(tài)呈周期性變化,控制系統(tǒng)在周期性傳感信息的激勵下,生成兩足交替的節(jié)律性運動;而當機器人一足損壞或受到限制時,周期性的傳感信息反饋受到破壞,為維持機器人的穩(wěn)定跳躍運動,需對維持運動的控制單元所接收的傳感信息進行調整與補償。
圖3 可變結構CPG控制機制
在可變結構的CPG運動控制機制中增加了時間延遲響應環(huán)節(jié)T,以補償突發(fā)情況對機器人傳感信息反饋的影響。此時間延遲響應環(huán)節(jié)分別通過刺激性連接與其所對應的機器人肢體相連,同時受到對側肢體的抑制。當機器人穩(wěn)定跳躍時,此環(huán)節(jié)由于受到對側肢體的抑制作用并不參與運動的控制,因此,其對機器人控制機制的刺激性作用以虛線表示。而當對側肢體無法正常發(fā)送反饋信息時,此環(huán)節(jié)被激活,并代替對側肢體發(fā)放刺激性脈沖以維持機器人的穩(wěn)定跳躍運動。
跳躍機器人在運動過程中,較難提前預知地面的高度與地形環(huán)境,而需要根據傳感信息實時地感知地面狀態(tài),并根據傳感信息迅速產生響應,調整機器人的運動以適應環(huán)境。根據此控制需求,選擇Hopfield模型[7]構建CPG神經元網絡。此神經元模型可快速響應超過其閾值的傳感信息,迅速上升并達到峰值,其數學模型為:
(1)
yi為神經元膜電壓;τi為時間常數;Ri為神經元傳導的阻尼系數;xj為神經元接收的第j個反饋信息;σ(xj)為外界激勵對神經元的作用強度;ωji為第j個反饋信息對第i個神經元的作用系數,為常數;Θj為反饋信息xj作用的閾值。此神經元模型可快速對超出神經元閾值的反饋信號作出響應并達到峰值,從而輸出運動控制指令。
根據可變結構的CPG控制結構對神經元模型的需求,在Hopfield模型中對外界反饋項進行了調整,添加了神經元之間的網絡抑制參數,并引入了時間延遲響應環(huán)節(jié)。以腿A為例,建立神經元網絡模型為:
(2)
yBi為相對應于腿A第i個神經元的腿B的第i神經元輸出;ωji為腿A所對應的神經網絡中,第j個神經元對第i個神經元的作用系數;Ii為反饋項;xn為外界反饋項;Θn為xn所對應的閾值;T(A)為腿A神經元所接收的時延響應環(huán)節(jié)激勵,由時間延遲環(huán)節(jié)fA與對側抑制環(huán)節(jié)組成。fA的表達式為:
(3)
tA為常數,可由實驗標定。在系統(tǒng)所建立的控制結構中,機器人每一足所對應的神經元網絡由4個神經元構成,故i,j=1,2,3,4。通過李雅普諾夫穩(wěn)定性方法,考察此神經網絡連接系數的取值范圍,并在此基礎上根據可變結構控制機制對神經網絡連接系數取值的要求,得到四神經元之間的連接矩陣為:
(4)
通過神經元之間連接矩陣,對側足傳感信息以及時延響應環(huán)節(jié)的添加,此神經元網絡能夠在對側肢體正常運動時與對側肢體交互抑制,生成穩(wěn)定的節(jié)律性交替運動;而在對側肢體受到限制或發(fā)生故障時,能夠在時間延遲響應環(huán)節(jié)與自身網絡的刺激、抑制作用連接下,控制機器人單足維持穩(wěn)定的跳躍運動。
在此神經元網絡中,神經元1與神經元2接收機器人足與地面的接觸力信息,當接觸力超過閾值時,產生響應并激活神經元3與神經元4的運動。神經元3,4接收機器人腿部彈簧的力信息,并與神經元1,2的信息調控輸出節(jié)律性的動作信號,神經元3,4的輸出為神經元網絡的最終輸出。
此神經元網絡可模擬生物CPG生成節(jié)律性輸出信號,用于控制機器人的動作時序,而機器人關節(jié)驅動器對這些運動命令的執(zhí)行,則通過簡單的運動神經元的構建來實現。其中,機器人軀體與肢體相連接部分的轉動關節(jié),其輸出為力矩。以腿A為例,轉動關節(jié)運動神經元的模型為:
(5)
φ為機器人腿與軀體的夾角;α為機器人軀體傾角;φd為轉動關節(jié)運動的目標角,y3=1時,φd=0,而y4=1時,φd的值可根據機器人的目標速度由實驗標定;k1,k2為反饋信息的作用系數,為大于零的常數,其值可由實驗標定。腿A直線彈簧所對應的驅動器,其運動輸出為:
(6)
Δl為機器人運動過程中腿部彈簧的最大壓縮量;Δld為壓縮量的目標值;k3,k4為大于零的常數,k4為反饋信息的作用系數,其值可由實驗標定。
為驗證控制方法的有效性,在ADAMS中建立雙足機器人的虛擬樣機,并利用Matlab/Simulink建立了相對應的控制機制,通過聯(lián)合仿真對此控制方法進行驗證。相平面軌跡如圖4所示。
圖4 相平面軌跡
由圖4可以看出,機器人在2種運動狀態(tài)下,其在相平面上的軌跡均收斂于一個穩(wěn)定的極限環(huán)。實驗結果表明,控制機制能夠在2種狀態(tài)下控制機器人實現穩(wěn)定的跳躍運動。在受限運動狀態(tài)下,機器人軀體傾角與角速度振蕩的范圍均大于在正常運動狀態(tài)下的振蕩范圍。這是由于機器人運動受限的一側肢體對機器人的運動存在影響,機器人單足需要同時克服機器人軀體與對側足的轉動慣性影響以維持機器人軀體的穩(wěn)定跳躍。
考察突發(fā)狀況對機器人運動的影響,首先考察機器人的運動節(jié)律能否在突發(fā)狀態(tài)下維持穩(wěn)定,通過機器人與地面的接觸狀態(tài)考察其運動節(jié)律的變化,實驗結果如圖5所示。圖5中,實線與虛線分別為機器人腿A與腿B與地面的接觸力,令機器人腿B在t=6 s時刻自由度受到限制。由圖5可以看出,在6 s之前,機器人雙腿交替接觸地面,且兩足與地面的支持力相等,而在6 s之后,腿B無法參與運動,而此時腿A仍可維持機器人的穩(wěn)定跳躍運動,且其節(jié)律、接觸力峰值保持不變。實驗結果表明,系統(tǒng)提出的控制機制可在機器人一足無法參與運動的情況下,繼續(xù)維持穩(wěn)定的跳躍運動節(jié)律。
圖5 機器人與地面的接觸狀態(tài)
進一步考察在此運動機制的控制下,突發(fā)狀態(tài)對機器人其他運動參數的影響。由于機器人被限制在XY平面內運動,共有沿X軸、沿Y軸、繞Z軸3個方向的自由度。因此,分別對機器人在3個自由度上的運動進行考察,實驗結果如圖6所示。
圖6 機器人3個自由度上的運動
觀察t=6 s以后機器人的運動,可以看出,機器人的跳躍高度基本維持不變,而前進速度在機器人切換至單足跳躍后,有一個較小的下降,其幅度值約為0.003 m/s。機器人的軀體傾角在切換至單足運動后,其振蕩范圍加大,由0.005 rad上升至0.01 rad左右,但仍可維持穩(wěn)定振蕩。實驗結果表明,所提出的控制機制可在突發(fā)狀況下,控制機器人在3個自由度方向上生成穩(wěn)定運動,從而維持機器人的穩(wěn)定跳躍。
模擬生物神經網絡原理建立了一種新的適應性CPG運動控制機制。利用Hopfield神經元數學模型構建CPG神經網絡模型,建立了能夠快速響應傳感信息變化,實時調整機器人運動節(jié)律的運動控制結構;模擬生物神經元響應機制,通過時間延遲響應環(huán)節(jié)的建立,實現了CPG神經網絡對機械結構故障等突發(fā)情況的感知;在此基礎上,進一步通過對生物神經元受到損傷時自恢復特性的模擬,利用時間延遲響應環(huán)節(jié)對神經元連接系數矩陣的調整,實現了機器人在損壞和自由度受限等情況下的穩(wěn)定運動。為進一步提高機器人的適應能力,需要進一步完善的工作有:根據神經網絡對突發(fā)狀態(tài)的感知,在調節(jié)機器人連接系數矩陣的基礎上進一步實現關節(jié)運動軌跡的調節(jié),增加運動的柔順性與適應能力。
[1] Delcomyn F.Neural basis of rhythmic behavior in animals[J].Science,1980,210:492-498.
[2] Brembs B.Operant conditioning in invertebrates[J].Current Opinion in Neurobiology,2003,13(6):710-717.
[3] Rossignol S.Locomotion and its recovery after spinal injury[J].Current Opinion in Neurobiology,2000,10(6):708-716.
[4] Kimura H,Fukuoka Y,Cohen A H.Adaptive dynamic walking of a quadruped robot on natural ground based on biological concepts[J].International Journal of Robotics Research,2007,26(5):475-490.
[5] Taga G,Yamaguchi Y,Shimizu H.Self organized control of bipedal locomotion by neural oscillators in unpredictable environment[J].Biological Cybernetics,1991,65(3):147-159.
[6] Zhang X,E M,Zeng X,et al.Adaptive walking of a quadrupedal robot based on layered biological reflexes[J].Chinese Journal of Mechanical Engineering,2012,25(4):654-664.
[7] Gallagher J C,Beer R D,Espenschied K S,et al.Application of evolved locomotion controllers to a hexapod robot[J].Robotics and Autonomous Systems,1996,19(1):95-103.
Adaptive Motion Control of a Biped Jumping Robot Based on CPG
WANGTingting,ZHAFusheng,GUOWei,LIMantian,SUNLining
(State Key Laboratory of Robotics and System,Harbin Institute of Technology,Harbin 150001,China)
為解決雙足跳躍機器人在突發(fā)狀況下的適應性控制問題,依據生物中樞模式發(fā)生器(CPG)運動控制原理,建立了可變結構的CPG運動控制機制;模擬生物神經網絡的自重構特性,在運動控制機制中添加了時間延遲響應環(huán)節(jié),用于突發(fā)狀況的判斷與調節(jié)。在機器人肢體突發(fā)故障或運動受到限制時,此機制可通過對自身狀態(tài)的感知自發(fā)地調整神經網絡結構,以繼續(xù)維持穩(wěn)定的運動。最后,在仿真平臺上驗證了此控制機制在正常行走與肢體自由度突然受到限制2種情況下的控制效果。
雙足機器人;適應性控制;CPG;跳躍運動控制
For solving the adapt control problem of biped hopping robot in unexpected situations,we build a CPG control mechanism which is able to change its control structure according to robot motion status simulating the CPG control mechanism in animals.Imitating the self-reconfigurable feature of animal control mechanism,a time-delayed response link is added to this control mechanism,for judging and adjusting the robot motion under unexpected situations.When the limbs of robot suddenly fails or the motion of robot limb is restricted,this control mechanism can spontaneously adjust the structure of neural network according to perception of the robot motion status,and maintain stable hopping motion.Finally,this control mechanism is studied on a simulation platform under two situations:normal hopping and hopping when one robot limb suddenly fails.
biped robot;adaptive motion control;CPG;control of jumping motion
2014-01-15
國家自然科學基金資助項目(61175107,60901074);機器人技術與系統(tǒng)國家重點實驗室自主課題(SKLRS200801B,SKLRS201204B)
TP242.6
A
1001-2257(2014)07-0056-04
王婷婷(1984-),女,黑龍江克東人,博士研究生,研究方向為仿生機器人。