劉雪飛,張文昌,吳 航,陳 煒*
(1.天津理工大學(xué)機械工程學(xué)院天津市先進機電系統(tǒng)設(shè)計與智能控制重點實驗室,天津 300382;2.天津理工大學(xué)機械工程學(xué)院機電工程國家級實驗室教學(xué)示范中心,天津 300382;3.軍事科學(xué)院系統(tǒng)工程研究院衛(wèi)勤保障技術(shù)研究所,天津 300161)
災(zāi)害救援環(huán)境復(fù)雜多變,傳統(tǒng)的人力方式給救援人員帶來巨大的生理和心理壓力,采用智能機器人手段代替人力方式是未來重要的發(fā)展方向。救援機器人按照運動機構(gòu)形式分為輪式、履帶式和腿足式。然而,在復(fù)雜地形環(huán)境中,輪式和履帶式救援機器人的適應(yīng)能力和靈活性較低,很難完成復(fù)雜的現(xiàn)場救援任務(wù)。而腿足式救援機器人結(jié)構(gòu)靈活、適應(yīng)能力強,可以提高救援現(xiàn)場的作業(yè)效率。腿足式救援機器人主要分為仿生串聯(lián)和并聯(lián)結(jié)構(gòu)形式[1],運動特點是足端與地面的接觸不連續(xù),可以選擇合適的立足點,躲避障礙,但也導(dǎo)致了其運動失衡的問題。因此,應(yīng)采用高效合理的控制算法實現(xiàn)腿足式救援機器人的穩(wěn)定運動,提高偵察和救援效率,保障后送傷員安全。高效合理的控制算法將成為腿足式救援機器人處理應(yīng)急事件的重要技術(shù)手段。本文以腿足式救援機器人的模型控制算法、仿生控制算法和機器學(xué)習(xí)控制算法為主要內(nèi)容進行綜述,重點介紹這3種控制算法的研究現(xiàn)狀、優(yōu)缺點和發(fā)展趨勢。
穩(wěn)定的運動狀態(tài)是腿足式機器人需要解決的首要問題,學(xué)者們也針對此問題展開了深入研究,并且取得了較大的研究進展。起初是圍繞機器人的結(jié)構(gòu)特點展開研究,總結(jié)出了模型控制算法,其中包括穩(wěn)態(tài)判據(jù)控制算法、虛擬模型控制算法(virtual model control,VMC)、彈簧倒立擺控制算法(spring-loaded inverted pendulum,SLIP)[2];隨著各種學(xué)科的不斷發(fā)展,仿生控制算法被提出,將計算機科學(xué)和生物學(xué)有效地結(jié)合在一起[3],使腿足式機器人可以靈活運動,達到了仿生效果;僅有靈活的運動能力并不能應(yīng)對復(fù)雜環(huán)境中的突發(fā)情況,因此,將機器學(xué)習(xí)控制算法作為腿足式機器人的高層控制,以應(yīng)對復(fù)雜環(huán)境中的突發(fā)情況。3種控制算法的發(fā)展及應(yīng)用,豐富了腿足式機器人的運動模式,提高了機器人的執(zhí)行效率。
模型控制算法是腿足式機器人的基本控制算法,即底層控制算法。首先,根據(jù)機器人物理樣機的尺寸和質(zhì)量參數(shù)確定運動學(xué)或動力學(xué)模型;其次,建立機器人足部運動參數(shù)和力/力矩的關(guān)系方程式;最后,求解模型中的參數(shù),得到驅(qū)動系統(tǒng)的實際控制量。根據(jù)模型控制算法的應(yīng)用方式,分為穩(wěn)態(tài)判據(jù)控制算法、虛擬模型控制算法和彈簧倒立擺控制算法。
其中,穩(wěn)態(tài)判據(jù)控制算法是模型控制算法中較為經(jīng)典的算法,由Vukobratovic等[3]提出,虛擬模型控制算法和彈簧倒立擺控制算法均由穩(wěn)態(tài)判據(jù)控制算法演化而來,保證機器人質(zhì)心總是落在支撐足端構(gòu)成的多邊形內(nèi)部,實現(xiàn)機器人穩(wěn)定運動。隨著計算機控制技術(shù)的發(fā)展,McGhee等[4-5]結(jié)合穩(wěn)態(tài)判據(jù)控制算法研制了世界上首臺采用計算機控制的腿足式機器人Phony Pony,精確描述了腿足式救援機器人的靜態(tài)步態(tài)數(shù)學(xué)模型和腿部的擺動順序,提高了機器人在平整地形上的流暢度和穩(wěn)定性,但是穩(wěn)態(tài)判據(jù)控制算法只適用于平整地形環(huán)境,對復(fù)雜地形的適應(yīng)性較低,而虛擬模型控制算法和彈簧倒立擺控制算法的提出,彌補了穩(wěn)態(tài)判據(jù)控制算法對復(fù)雜地形適應(yīng)性低的不足。
1.1.1 穩(wěn)態(tài)判據(jù)控制算法
腿足式救援機器人在救援現(xiàn)場需要穩(wěn)定的運動狀態(tài),需要保證機器人質(zhì)心的垂直投影必須在支撐足端所組成的多邊形內(nèi)部,將質(zhì)心垂直投影與支撐足端所形成的多邊形的位置關(guān)系作為腿足式機器人穩(wěn)定運動的判據(jù),稱其為穩(wěn)定性判據(jù)。目前,國內(nèi)外應(yīng)用較為廣泛的穩(wěn)定性判據(jù)包括零力矩點判據(jù)(zero moment point,ZMP)[6-9]、能量穩(wěn)定裕度判據(jù)(energy stability margin,ESM)[10]和動態(tài)穩(wěn)定裕度判據(jù)(dynamic stability margin,DSM)[11]。
穩(wěn)態(tài)判據(jù)控制算法的共同特點是規(guī)劃好機器人足端運動軌跡和質(zhì)心的位移,簡化機器人控制,明確機器人運動規(guī)律,但是降低了機器人的流暢度和運動速度。早在1995年就有學(xué)者關(guān)注了這個問題,普渡大學(xué)機器人實驗室的學(xué)者Pack等[12]將動態(tài)穩(wěn)定裕度判據(jù)和A*搜索法結(jié)合,使機器人可以選擇合理的立足點,提高了運動的穩(wěn)定性。A*搜索法如圖1所示。但是機器人在運動時卡頓嚴重,流暢度較低,執(zhí)行效率嚴重下降,產(chǎn)生這種問題是因為沒考慮到能量消耗。日本東京工業(yè)大學(xué)福島實驗室在此問題的基礎(chǔ)上提出方向歸一化能量穩(wěn)定裕度判據(jù)算法[13],此算法可以提高機器人的外部干擾能力和流暢性。波士頓動力公司在研究腿足式機器人初期,為使機器人站立穩(wěn)定,大量應(yīng)用此算法在機器人身上。但是應(yīng)用此算法的前提是低速無擾動,因此穩(wěn)態(tài)判據(jù)控制算法更適用于對運動速度要求低的場合。
上海交通大學(xué)高峰教授的團隊基于前述理論研發(fā)了2款腿足式救援機器人,第一款為帶腰仿生六足機器人,如圖2(a)所示[14]。在這款機器人的控制方面應(yīng)用了能量穩(wěn)定裕度判據(jù)算法,提高了機器人的穩(wěn)定性并改善了能耗問題,可用于野外環(huán)境探測與作業(yè),代替救援人員攜帶檢測設(shè)備進入事故發(fā)生地點,探測災(zāi)后環(huán)境,搬運救災(zāi)物資等。第二款為“六爪章魚”機器人,如圖2(b)所示,團隊同樣將能量穩(wěn)定裕度判據(jù)算法應(yīng)用在機器人的控制方面,使移動自如的“六足”具有良好的復(fù)雜環(huán)境適應(yīng)能力,可在核輻射、水下和火災(zāi)等極端環(huán)境下完成搬運、搜索、探測和救援作業(yè)等任務(wù)[15]。這2款腿足式救援機器人融合了上述理論,在實際的應(yīng)用和測試中都展現(xiàn)出令人滿意的效果。
圖1 A*搜索法[12]
圖2 救援機器人
1.1.2 虛擬模型控制算法
虛擬模型控制算法由Pratt等[16]在《虛擬模型控制:兩足行走的直觀方法》一文中首先提出,主要原理是在機器人外部連接虛擬的彈簧和阻尼等,算出機器人機構(gòu)平衡時的虛擬力,再通過功能關(guān)系求出機器人的關(guān)節(jié)力。Pratt等[16]在Spring Turkey機器人樣機上應(yīng)用了虛擬模型控制算法,在實驗過程中展現(xiàn)出滿意的結(jié)果,然而虛擬模型的盲目應(yīng)用也會導(dǎo)致控制算法失效。意大利理工學(xué)院高級機器人實驗室Winkler團隊將虛擬模型控制算法應(yīng)用于HyQ四足機器人上[17],并在模型上新增加了向前反饋扭矩傳感器,提高了機器人系統(tǒng)的精度和高度順從性,避免了側(cè)向沖擊的干擾。
國內(nèi)在此方面也開展了研究。山東大學(xué)的劉斌等[18]提出一種基于虛擬模型控制算法的腿足式機器人緩沖策略,在Scalf-2機器人上得到了驗證,如圖3所示,通過假想的彈簧阻尼系統(tǒng)驅(qū)動機器人按照預(yù)期的軌跡運動,為足式機器人的抗沖擊能力提供了控制基礎(chǔ),增加了機器人運動的穩(wěn)定性。Scalf-2為腿足式機器人,質(zhì)量為120 kg,可承擔質(zhì)量75 kg,全速運動時速度達到3 km/h,應(yīng)用緩沖策略后可以在冰雪環(huán)境和復(fù)雜山地環(huán)境下運送救援物資,減輕救援人員負擔。北京理工大學(xué)和北京交通大學(xué)在前述基礎(chǔ)上,提出了基于虛擬模型控制的動態(tài)平衡控制和抗干擾控制算法[19],并在如圖4所示的四足機器人上得到驗證,增強了四足機器人的魯棒性、地形適應(yīng)性和動態(tài)平衡性。但是,無論是虛擬模型控制算法還是傳統(tǒng)動力學(xué)控制算法都需要建立精確的力學(xué)模型,如果機器人本體結(jié)構(gòu)及其所應(yīng)用的環(huán)境復(fù)雜,其模型也隨之復(fù)雜,給控制算法的研究工作增添了挑戰(zhàn)性。
圖3 山東大學(xué)研制的Scalf-2機器人[18]
圖4 北京理工大學(xué)和北京交通大學(xué)研制的四足機器人[19]
1.1.3 彈簧倒立擺控制算法
彈簧倒立擺控制算法的靈感來源于對足式動物運動的觀察,此算法是由Geyer等[20]最先提出,分別應(yīng)用到人體運動和腿足式機器人運動控制方面,彈簧倒立擺模型如圖5所示。被廣泛熟知的波士頓動力公司的大狗機器人[21]除采用液壓缸和柴油發(fā)動機等硬件作為驅(qū)動部分外,在腿部控制方面結(jié)合了彈簧倒立擺控制算法的思想,被成功地應(yīng)用到救援物資的運輸中。但是此控制算法的數(shù)學(xué)模型是非線性模型,不存在解析解,為求解帶來了困難。為此,英國比爾肯特大學(xué)的研究員在原模型的基礎(chǔ)上引入阻尼,如圖6所示,推導(dǎo)出了一個高精度的近似解析解模型[22],并且引入了額外的校正來補償由重力引起的非對陣角動量影響,經(jīng)測試表明該方法在阻尼顯著的情況下產(chǎn)生的平均誤差低于2%,明顯提高了近似解析解的精度。
圖5 彈簧倒立擺模型[20]
目前國內(nèi)對彈簧倒立擺控制算法的研究也逐漸成熟,華中科技大學(xué)在考慮到三維環(huán)境中受到外部擾動的情形后,提出了彈簧-負載倒立擺三維動態(tài)平衡控制算法[23],提升了原算法的抗擾動性,擴展了彈簧-倒立擺控制算法的應(yīng)用范圍。哈爾濱工業(yè)大學(xué)將此算法應(yīng)用到了雙足機器人模型上,并在此基礎(chǔ)上研究了線性倒立擺模型預(yù)測控制算法[24],使足式機器人驅(qū)動執(zhí)行力增強、負載剛度提高,因此在大型起重設(shè)備無法進入救援現(xiàn)場時,可應(yīng)用此款足式機器人完成救援現(xiàn)場的起重工作,緩解救援人員的操作壓力。哈爾濱工業(yè)大學(xué)提出的線性倒立擺模型概念,主要優(yōu)勢在于使動力學(xué)模型線性化,求解出解析解;考慮了偏航角動量問題,減緩了機器人足端與地面之間的碰撞。
圖6 彈簧-阻尼倒立擺模型[22]
如果只在接收簡單的、低維度的輸入信號的情況下,控制系統(tǒng)能夠產(chǎn)生高維度、有節(jié)奏的輸出信號,將為控制腿足式機器人帶來很大方便。學(xué)者們也從生物神經(jīng)學(xué)方面得到了靈感,提出仿生控制的概念,即有脊椎和無脊椎動物體內(nèi)存在一種可以產(chǎn)生節(jié)奏性信號的神經(jīng)回路,可以在不接收節(jié)律信號輸入的情況下產(chǎn)生節(jié)律性的神經(jīng)活動。學(xué)者們從此種仿生角度探尋出新的腿足式機器人控制方法,其中廣為關(guān)注的是基于中樞模式發(fā)生器的控制算法(central pattern generators,CPG)[25],此類算法基本分為兩類[26]:一類是以Matsuoka控制算法為代表的神經(jīng)元算法模型,另一類是以Hopf控制算法為代表的非線性振蕩算法模型。
Venkataraman[27]首次把CPG應(yīng)用到六足機器人步態(tài)生成和控制方面,成功實現(xiàn)了機器人腿部節(jié)律運動的控制,由于首次研究只關(guān)注了節(jié)律信號的生成,所以運動的生成比較簡單。為生成自適應(yīng)性運動,CPG產(chǎn)生的節(jié)律信號應(yīng)該更具有合適的頻率、相位,而日本科學(xué)家Matsuoka[28]于1985年提出的Matsuoka控制算法初步解決了上述問題,這也使CPG首次模型化,為后續(xù)CPG的改進和其他CPG數(shù)學(xué)模型的提出提供了依據(jù)。Matsuoka控制算法在腿足式機器人控制方面具有2個特點:第一,可以產(chǎn)生穩(wěn)定的節(jié)奏模式,系統(tǒng)在受到瞬態(tài)擾動后可以迅速恢復(fù)其正常的節(jié)律;第二,Matsuoka控制算法通常具有一些控制參數(shù)(如驅(qū)動信號),允許調(diào)節(jié)運動,如速度和方向甚至步態(tài)類型。因此,正確調(diào)節(jié)算法參數(shù),使高級別控制器直接產(chǎn)生多維命令,簡化了控制命令。然而,此類Matsuoka控制算法參數(shù)繁多,增加了調(diào)參難度,限制了所需形狀節(jié)律信號的產(chǎn)生,降低了在復(fù)雜環(huán)境中運動的適應(yīng)性。
為解決這一問題,中南大學(xué)王勇團隊提出了一個新的Matsuoka控制算法改進框架[29],將模型的重心輸出轉(zhuǎn)化成一個標準化的極限環(huán),并將極限環(huán)與機器人反饋相結(jié)合,進行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)生成所需信號。通過機器人自適應(yīng)全方位行走控制實驗,表明該改進的算法框架明顯提高了機器人行走的適應(yīng)性,如圖7所示。雖然此研究改善了Matsuoka控制算法信號的生成問題,但增加了控制過程步驟,同時增加了機器人硬件匹配的難度。除Matsuoka控制算法外,還有Hopf控制算法、Van der Pol控制算法和Toda-Rayleigh控制算法[30-32],這3種算法的優(yōu)勢在于理論參數(shù)簡潔,實用性強。波蘭羅茲理工大學(xué)分別采用這3種控制算法研究了八足機器人的腿部運動和受力問題[如圖8(a)所示],并提出一種新的正弦控制算法模型,通過機器人能量的消耗方式評估4種中樞模式發(fā)生器;經(jīng)仿真實驗發(fā)現(xiàn)相頻特性影響Hopf控制算法、Van der Pol控制算法和Toda-Rayleigh控制算法的振幅和頻率,而對新提出的正弦控制算法只影響振蕩的頻率[33]。新提出的算法結(jié)合八足機器人本身小巧靈活的特點,在救援前期的偵察工作中能發(fā)揮重要作用,為工作人員提供現(xiàn)場實際情況,提高救援效率。
圖7 機器人適應(yīng)性行走試驗[29]
構(gòu)建完整的CPG網(wǎng)絡(luò)是靈活控制足式機器人不可或缺的步驟,也是亟待解決的實際問題。哈爾濱工業(yè)大學(xué)從模擬生物CPG網(wǎng)絡(luò)出發(fā),構(gòu)建了一種較為完善的多層CPG網(wǎng)絡(luò),使CPG整體簡單、結(jié)構(gòu)清晰[34],并驗證了多層CPG網(wǎng)絡(luò)的可行性。浙江大學(xué)在研究多足式機器人控制時采用了這種CPG網(wǎng)絡(luò),并在此基礎(chǔ)上提出一種基于強化學(xué)習(xí)的模態(tài)控制器自整定法,解決了大部分CPG應(yīng)用的局部性和CPG的不完整性[35],并將自整定法應(yīng)用到六足機器人上,如圖8(b)所示,其中由18個伺服電動機作為驅(qū)動元件,3個電動機為一組,分布在6條三自由度的串聯(lián)腿上,使機器人有較高的自由度,同時,配備了外部相機來跟蹤機器人并提供反饋信息,使其在崎嶇不平的地形中可以像蜘蛛一樣順暢通過,為現(xiàn)場救援、地形勘測帶來了福音。但是,強耦合性是CPG不可避免的問題,調(diào)整腿部相位時容易產(chǎn)生較大影響。由此可見,CPG更適合于對周圍環(huán)境變化較小的機器人控制系統(tǒng)。
圖8 多足機器人模型
機器學(xué)習(xí)是人工智能的核心,在腿足式機器人領(lǐng)域的主要應(yīng)用是對機器人進行模擬控制,不斷學(xué)習(xí)和積累經(jīng)驗,提高腿足式機器人的運動性能。目前,機器學(xué)習(xí)各種網(wǎng)絡(luò)模型均采用了BP(back propagation)算法,即誤差后向傳播算法[36],最早是由Werbos[37]在1974年的博士論文中首次論證,但當時沒有引起較大的重視;1982年加州理工學(xué)院的物理學(xué)家Hopfield[38]提出著名的Hopfield模型理論,解決了旅行商[39]問題,推動了人工智能的快速發(fā)展;1986年在Rumelhart等[40]的努力下,BP算法被再次優(yōu)化,并廣泛應(yīng)用于升級網(wǎng)絡(luò)的訓(xùn)練中。如今,機器學(xué)習(xí)控制算法開發(fā)均采用了1986年經(jīng)典的BP算法思想,但是由于此算法在執(zhí)行過程中采用弱監(jiān)督學(xué)習(xí)的方式,缺乏認知性控制,所以存在不易學(xué)習(xí)、容易陷入決策困難等問題[41-43]。
為解決上述問題,加州大學(xué)Peng等[43]提出一種由數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)控制算法,用于訓(xùn)練模型的控制策略,通過對Atlas機器人的行走、奔跑、后空翻和側(cè)踢等復(fù)雜動作的實驗,展現(xiàn)出此算法可以提高機器人的整體性,如圖9所示。機器學(xué)習(xí)使機器人模型從零開始學(xué)習(xí),無形中增加了機器人的控制難度和研制周期,而且基于機器學(xué)習(xí)算法的腿足式機器人的研究主要局限于仿真環(huán)境。如果機器學(xué)習(xí)算法能夠?qū)崿F(xiàn)無模型化,那么在一系列具有挑戰(zhàn)性的控制任務(wù)中都能提高救援機器人的決策性和感知性,而且能解決容易陷入決策困難的問題。如前所述,對于腿足式機器人的學(xué)習(xí)控制局限于仿真環(huán)境,搭建的仿真環(huán)境雖然很嚴格,但是都與真實的環(huán)境有一定的差異,致使在仿真環(huán)境中開發(fā)的學(xué)習(xí)策略在真實環(huán)境下可應(yīng)用的概率很小。Google的Tan等[44]實現(xiàn)了學(xué)習(xí)策略從仿真環(huán)境到現(xiàn)實環(huán)境的遷移,如圖10所示,解決了腿足式機器人控制方法從仿真環(huán)境到真實環(huán)境的轉(zhuǎn)移問題。Lee等[45]在仿真環(huán)境中直接學(xué)習(xí)真實環(huán)境中的運動,這一思路大大提高了學(xué)習(xí)速度。
圖9 模型技能訓(xùn)練實驗[43]
圖10 算法遷移試驗[44]
國內(nèi)對機器學(xué)習(xí)控制算法的理論研究較少,更多體現(xiàn)在此控制算法的實際應(yīng)用中。目前,騰訊公布了在腿足式機器人研究方面的新進展:四足移動機器人Jamoca,如圖11(a)所示[46]。Jamoca本體質(zhì)量70 kg,長1 m、寬0.5 m、站高0.75 m。騰訊Robotics X實驗室在機器人本體之上,基于機器學(xué)習(xí)控制技術(shù),為Jamoca打造了一個能應(yīng)對復(fù)雜環(huán)境的智能大腦,這個大腦使Jamoca能行走、小跑和跳躍,并賦予了它自主定位和避障的能力。除騰訊外,國內(nèi)宇樹科技研發(fā)的萊卡狗[47],如圖11(b)所示,是國內(nèi)首個腿足式機器人,質(zhì)量僅22 kg,但其自行研發(fā)的電動機系統(tǒng)能輸出高達18 kW的瞬時功率,功率密度比一般跑車高將近1倍,這是萊卡狗強大動態(tài)性能的基礎(chǔ)。另外,萊卡狗可以完全擺脫外部供電,自帶電池一次充電可以支持2~3 h的行走。今后,在救援方面可以應(yīng)用這2款機器人完成地形勘探和信息搜索工作,提高偵察救援工作效率。
圖11 基于機器學(xué)習(xí)的四足機器人
腿足式機器人經(jīng)過十幾年的發(fā)展,在結(jié)構(gòu)上逐漸完善,煥然一新的結(jié)構(gòu)也層出不窮,與這些結(jié)構(gòu)相匹配的控制算法也層見疊出,不斷優(yōu)化和改進。這些控制算法在腿足式機器人控制方面已經(jīng)取得了一定成效,但是在面對不同環(huán)境的情況下也是各有利弊,基本集中在算法的復(fù)雜程度、計算時長、所需數(shù)據(jù)量的多少以及對機器人的控制效果等方面。下面將針對3種算法的特點分別闡述優(yōu)缺點,詳見表1。
表1 各算法特點對比
模型控制算法是腿足式機器人研究中的基本控制算法,應(yīng)用較為廣泛。模型控制算法優(yōu)勢如下:(1)具有精確的模型,可以很好地控制機器人的運動規(guī)律;(2)參數(shù)都有精確的物理含義,可以實現(xiàn)精確的實時控制;(3)可控性強,易于理解。模型控制算法的不足之處就在于它需要具體模型,建模過程困難,求解煩瑣,計算量大,對研究的硬件設(shè)備有較高的要求,而且模型多為復(fù)雜的微分方程,求解結(jié)果不唯一,有時模型可能無解,這些都給建立控制系統(tǒng)帶來了麻煩。所以模型控制算法更適用于機構(gòu)模型簡單的機器人。
仿生控制算法的提出開啟了機器人仿生控制的大門,這種控制算法的優(yōu)點如下:(1)不需要精確的模型;(2)只需產(chǎn)生低維信號,就可以對機器人關(guān)節(jié)進行控制。此算法也有不足之處,仿生模型產(chǎn)生信號是無量綱的,沒有具體的物理意義,與機器人結(jié)構(gòu)的關(guān)聯(lián)性較弱,需要對信號進行后期處理,而且仿生模型具有強耦合性,容易引起腿部控制的干擾。仿生控制算法更適用于模型復(fù)雜和模型所處環(huán)境變化不大的控制系統(tǒng)。
機器學(xué)習(xí)控制算法是目前研究的熱點,是人工智能的核心問題,也是未來腿足式機器人深化研究的大方向。機器學(xué)習(xí)控制算法的優(yōu)點如下:(1)對于模型中難以確定的參數(shù),可以通過機器人的學(xué)習(xí)進行調(diào)整;(2)機器學(xué)習(xí)控制算法可以使機器人不斷學(xué)習(xí)和積累經(jīng)驗,做出相對靈活的動作;(3)機器人可以通過機器學(xué)習(xí)控制算法,從仿真環(huán)境中直接學(xué)習(xí),在真實環(huán)境中實現(xiàn)大部分人類很難做到的高難度動作,提高機器人整體的運動性能。但是這些都需要大量的數(shù)據(jù)存儲空間和強大的配套硬件設(shè)備,對機器人訓(xùn)練需要海量數(shù)據(jù),大大增加了計算時間,而且對于多維度、結(jié)構(gòu)復(fù)雜的腿足式機器人,機器學(xué)習(xí)控制算法很難保證控制的實時性。所以機器學(xué)習(xí)控制算法主要應(yīng)用在對實時性要求不高的機器人運動規(guī)劃場合。
目前在移動式機器人控制領(lǐng)域,腿足式救援機器人控制已經(jīng)取得了一些進展,現(xiàn)有的救援機器人技術(shù)也在不斷完善,為了能更好地將腿足式救援機器人投入到救援工作中,多控制算法融合、控制算法高效規(guī)劃等關(guān)鍵性技術(shù)應(yīng)該是未來腿足式機器人控制技術(shù)發(fā)展的側(cè)重點。
由于災(zāi)后或戰(zhàn)后救援,腿足式救援機器人需要處理一些復(fù)雜的任務(wù),單一運動控制算法難以滿足任務(wù)對機器人運動精度的要求。此外,盡管不同控制算法在機器人不同運動控制問題上均有一些優(yōu)勢,但也存在一定程度的不足。因此,通過結(jié)合多種運動控制算法,可以有效整合各自算法的優(yōu)勢,彌補各自的不足,從而為腿足式救援機器人運動控制精度提供保障,國內(nèi)外目前也都在考慮這方面的技術(shù)問題。
近幾年,腿足式救援機器人的運動控制算法規(guī)劃方法主要停留在先運動后應(yīng)對的思想上,即在運動過程中,機器人會按照預(yù)先規(guī)定的軌跡運動,隨后根據(jù)感知反饋信息對突發(fā)情況進行反應(yīng)和適應(yīng)。當機器人在復(fù)雜地形運動時,一種更加高效的方法是直接根據(jù)當前環(huán)境預(yù)先生成相應(yīng)的運動軌跡,再利用前述的控制策略應(yīng)對運動過程中的偏差和地形不確定性,即先規(guī)劃后應(yīng)對的思想。因此,需要對腿足式救援機器人基于地形的全身運動規(guī)劃算法進行研究。
隨著腿足式機器人技術(shù)的不斷成熟,腿足式救援機器人控制算法得到了快速發(fā)展,并取得了一定成果,但各國的腿足式救援機器人控制算法與全智能化控制算法的理念相比還存在一定的距離,主要體現(xiàn)在運動算法的規(guī)劃方面。為了更好地實現(xiàn)偵察救援和機器人的強自主適應(yīng)性,腿足式救援機器人控制算法應(yīng)朝著根據(jù)當前環(huán)境實時規(guī)劃運動軌跡的方向發(fā)展,并結(jié)合5G技術(shù)提高信息傳輸效率以應(yīng)對地形的不確定性。未來,隨著控制算法不斷優(yōu)化,智能技術(shù)不斷更新,腿足式救援機器人會被廣泛應(yīng)用到偵察救援等復(fù)雜的工作領(lǐng)域。