丁 偉,張 峰,宋 敏,崔 龍,王宏偉,劉釗銘,繆 磊
(1. 沈陽(yáng)工程學(xué)院自動(dòng)化學(xué)院,沈陽(yáng) 110136;2. 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,沈陽(yáng) 110169)
撲翼飛行機(jī)器人通過機(jī)器人機(jī)翼?yè)鋭?dòng)拍打空氣產(chǎn)生的反作用力提供推力和升力,并通過飛行機(jī)器人尾翼和側(cè)翼的位置偏移來調(diào)節(jié)機(jī)身的運(yùn)動(dòng)方向[1]。撲翼飛行機(jī)器人能夠完成垂直升降、懸停和滑翔等高難度運(yùn)動(dòng),具有較高的運(yùn)動(dòng)靈活性和敏捷性。撲翼飛行機(jī)器人相較于固定翼飛行機(jī)器人和旋翼飛行機(jī)器人,具有體積小、隱蔽性高和機(jī)動(dòng)性強(qiáng)等多方面的優(yōu)勢(shì)。
隨著仿生學(xué)、機(jī)械制造、微納米加工、空氣動(dòng)力學(xué)和智能控制等技術(shù)的進(jìn)一步發(fā)展,飛行機(jī)器人的研究引起越來越廣泛的關(guān)注,仿生撲翼飛行機(jī)器人技術(shù)也得到了進(jìn)一步的發(fā)展和提升[2]。微型化、智能化、集成化和集群化成為飛行機(jī)器人的發(fā)展趨勢(shì)和方向,飛行機(jī)器人能夠模仿鳥類和昆蟲的飛行方式,靈活地完成低空偵察、監(jiān)控以及搜索等任務(wù)。
國(guó)內(nèi)外研究團(tuán)隊(duì)己在仿生撲翼飛行機(jī)器人的飛行機(jī)理[3]、動(dòng)力學(xué)分析[4-5]、撲翼機(jī)械結(jié)構(gòu)設(shè)計(jì)[6-10]、飛行控制方法[11-14]和機(jī)器人視覺[15]等方面取得了大量研究成果。其中,國(guó)外對(duì)撲翼飛行機(jī)器人開展研究較早,較多機(jī)構(gòu)進(jìn)行了撲翼飛行機(jī)器人系統(tǒng)的設(shè)計(jì)和研發(fā)工作。
2005 年,美國(guó)AeroVironment 公司開發(fā)的仿蜂鳥撲翼飛行機(jī)器人“Nano Hummingbird[16]”質(zhì)量約19 g,翼展約17 cm,能夠持續(xù)飛行11 min。
德國(guó)Festo 公司研制的一款翼展為50 cm 的仿生蝴蝶“eMotion Butterflies[17]”。其機(jī)翼骨架采用碳纖維材料,通過兩個(gè)獨(dú)立的伺服電機(jī)進(jìn)行機(jī)翼驅(qū)動(dòng)與控制。
美國(guó)麻省理工學(xué)院的“Phoenix[18]”。寬大的柔性翼利用碳纖維棒構(gòu)成了一個(gè)三角形的結(jié)構(gòu),可提供300 W 的強(qiáng)大升力。該仿生撲翼飛行機(jī)器人可實(shí)現(xiàn)水平穩(wěn)定飛行,速度大約為4 m/s,能夠攜帶GPS 等多種傳感器。但其控制系統(tǒng)有待完善,只能以手持方式起飛,無法完成復(fù)雜飛控動(dòng)作。
國(guó)內(nèi)關(guān)于撲翼飛行機(jī)器人的相關(guān)研究起步較晚,但自2000 年以來也取得了一定的發(fā)展和進(jìn)步[19-21]。
北京航空航天大學(xué)孫茂等[22]專注于空氣動(dòng)力學(xué)相關(guān)原理研究,并揭示了昆蟲飛行時(shí)的非定??諝鈩?dòng)力機(jī)理。
西北工業(yè)大學(xué)[23-24]研制的“信鴿”仿鴿撲翼飛行機(jī)器人采用碳纖維材料搭建骨架,利用聚酯薄膜聚合物作為翼膜,翼展50 cm,質(zhì)量220 g,續(xù)航時(shí)間30 min。其在控制飛行方面,可實(shí)現(xiàn)自主起飛和航行,飛行機(jī)器人具有一定的抗風(fēng)能力,可應(yīng)用于救援和偵察等實(shí)際現(xiàn)場(chǎng)。
上海交通大學(xué)[25]研究了基于仿昆蟲飛行模式的數(shù)學(xué)建模,選取光刻膠SU-8 作為結(jié)構(gòu)材料,采用微機(jī)電加工技術(shù),設(shè)計(jì)了仿昆蟲微型撲翼飛行機(jī)器人。
北京科技大學(xué)[26]設(shè)計(jì)了“USTB-Dove”仿鳥撲翼飛行機(jī)器人,翼展70 cm,質(zhì)量220 g,可以通過手控或自控方式實(shí)現(xiàn)穩(wěn)定飛行,續(xù)航時(shí)間為40 min。
從整體來看,國(guó)內(nèi)對(duì)于仿生撲翼飛行機(jī)器人的研究成果相對(duì)集中在理論研究方面,實(shí)物實(shí)驗(yàn)平臺(tái)的搭建相對(duì)較少,仍具有較大的進(jìn)步空間。
飛行機(jī)器人集群編隊(duì)是指飛行機(jī)器人集群根據(jù)不同的任務(wù)需求,構(gòu)成一定的幾何形態(tài)來協(xié)作執(zhí)行任務(wù),同時(shí)對(duì)環(huán)境具有感知能力,能作出適應(yīng)性動(dòng)態(tài)調(diào)整行為的多智能體系統(tǒng)。
群體模型通常來自自然界和生物集群,如鳥群、蟻群、獸群、魚群和粒子群等。集群智能系統(tǒng)由一群簡(jiǎn)單的個(gè)體組成,個(gè)體按照相關(guān)規(guī)則在彼此之間進(jìn)行信息交互,智能體也可以與環(huán)境進(jìn)行信息交互。群體智能在數(shù)量上表現(xiàn)為多數(shù)量,在群體層面表現(xiàn)為分散化、去中心化和自組織的群體特征。
總體來說,飛行機(jī)器人集群編隊(duì)研究?jī)?nèi)容主要包括集群構(gòu)型設(shè)計(jì)與切換、控制與保持、路徑跟蹤、障礙規(guī)避等協(xié)作行為。飛行機(jī)器人集群編隊(duì)的研究仍處于探索階段。
集群系統(tǒng)比人工系統(tǒng)具有更優(yōu)越的自主性、協(xié)調(diào)性和智能性。隨著飛行任務(wù)復(fù)雜度的提升,對(duì)撲翼飛行機(jī)器人在大區(qū)域中執(zhí)行任務(wù)時(shí)的機(jī)動(dòng)性、快速性和效率等性能提出了更高的要求,單撲翼機(jī)器人較難實(shí)現(xiàn)。在面對(duì)遠(yuǎn)距離、大環(huán)境信息量和高能量消耗等復(fù)雜任務(wù)時(shí),撲翼飛行機(jī)器人集群具有感知信息量大、節(jié)省時(shí)間、作業(yè)效率高、群體能量消耗少和隱蔽性好等多方面優(yōu)勢(shì),如圖1所示。
圖1 撲翼飛行機(jī)器人的技術(shù)優(yōu)勢(shì)Fig.1 Technical advantages of flapping-wing flying robot
仿生撲翼飛行機(jī)器人是以飛行鳥類為仿生對(duì)象,在仿生撲翼機(jī)器人集群飛行方面也需要從鳥類進(jìn)化的集群機(jī)理中得到啟發(fā)。通過陣型變換提升撲翼飛行機(jī)器人集群的搜索能力和環(huán)境避障能力,可以提升集群的任務(wù)執(zhí)行力。所以,撲翼飛行機(jī)器人集群在遠(yuǎn)距離軍事偵察、大范圍環(huán)境監(jiān)測(cè)、長(zhǎng)時(shí)間災(zāi)難監(jiān)測(cè)等軍事或民用領(lǐng)域具有廣泛的應(yīng)用前景。
綜上所述,對(duì)仿生撲翼飛行機(jī)器人集群控制的研究,能夠很好地解決撲翼飛行機(jī)器人集群陣型選擇和變換的問題。利用集群控制,實(shí)現(xiàn)撲翼飛行機(jī)器人集群大范圍搜索、低空偵察和目標(biāo)覆蓋等復(fù)雜應(yīng)用任務(wù)。
現(xiàn)階段,由于固定翼飛行機(jī)器人和旋翼飛行機(jī)器人的控制技術(shù)發(fā)展相對(duì)成熟,集群編隊(duì)控制主要集中于上述兩類飛行機(jī)器人。相比之下,撲翼飛行機(jī)器人具有獨(dú)特的功能優(yōu)勢(shì)以及良好的仿生性能,其集群編隊(duì)作為一門前沿發(fā)展科學(xué),具有廣闊的應(yīng)用前景。
2014 年,匈牙利羅蘭大學(xué)Tamas Vicsek 團(tuán)隊(duì)[27]借鑒生物集群行為機(jī)理,在通信延遲、GPS丟失等情況下,利用10 架四旋翼飛行機(jī)器人完成了障礙物躲避、陣型穩(wěn)定保持和多目標(biāo)跟蹤等多項(xiàng)任務(wù)。2015 年,美國(guó)海軍研究院Timothy Chung團(tuán)隊(duì)[28]實(shí)現(xiàn)了50 余架固定翼飛行機(jī)器人的集群編隊(duì)飛行,利用無線自組織網(wǎng)絡(luò)進(jìn)行信息交互和共享。2018 年,美國(guó)國(guó)防預(yù)先研究計(jì)劃局設(shè)立的“小精靈”項(xiàng)目[29]通過集群內(nèi)部的信息收集與傳遞,協(xié)同破壞敵方防御系統(tǒng),執(zhí)行情報(bào)偵察與電子干擾攻擊等破壞性任務(wù)。
飛行機(jī)器人編隊(duì)飛行的主要目標(biāo)是驅(qū)動(dòng)飛行機(jī)器人形成并保持固定陣型,其控制方法主要分為長(zhǎng)機(jī)-僚機(jī)方法、基于行為方法、虛擬結(jié)構(gòu)方法和一致性方法。
傳統(tǒng)的長(zhǎng)機(jī)-僚機(jī)方法主要由長(zhǎng)機(jī)跟蹤預(yù)設(shè)軌跡,僚機(jī)與長(zhǎng)機(jī)保持相對(duì)位置跟隨長(zhǎng)機(jī)飛行。美國(guó)賓夕法尼亞大學(xué)Desai 團(tuán)隊(duì)[30]提出的長(zhǎng)機(jī)-僚機(jī)改進(jìn)控制方案通過以上技術(shù)實(shí)現(xiàn)了無人飛行機(jī)器人在非GPS 定位環(huán)境中的集群編隊(duì)飛行?;谛袨榉椒ㄊ且环N通過定義飛行機(jī)器人幾種基本控制行為并對(duì)其進(jìn)行執(zhí)行和優(yōu)化的編隊(duì)控制方法。北京航空航天大學(xué)段海濱團(tuán)隊(duì)[31]提出了一種基于鴿群層級(jí)群聚特性的集群控制方法,并通過多無人飛行機(jī)器人對(duì)該集群控制方法進(jìn)行了仿真驗(yàn)證。國(guó)防科技大學(xué)王祥科團(tuán)隊(duì)[32]針對(duì)大規(guī)模固定翼無人機(jī)集群的編隊(duì)控制問題,提出了一種分層分組控制方法,并通過100 架固定翼無人機(jī)集群的全流程數(shù)值仿真,驗(yàn)證了集群控制方法的有效性。西北工業(yè)大學(xué)符小衛(wèi)團(tuán)隊(duì)[33]針對(duì)切換拓?fù)浣Y(jié)構(gòu)下的集群編隊(duì)控制問題,設(shè)計(jì)了只需個(gè)別無人機(jī)獲取虛擬長(zhǎng)機(jī)信息也能保證集群連通性的編隊(duì)控制算法,并進(jìn)行了仿真實(shí)驗(yàn),驗(yàn)證了算法的有效性。日本慶應(yīng)大學(xué)Kuriki 教授團(tuán)隊(duì)[34]結(jié)合模型預(yù)測(cè)控制和一致性控制方法,成功進(jìn)行了無人飛行機(jī)器人自主防碰撞的編隊(duì)飛行實(shí)驗(yàn)。
以上幾種飛行機(jī)器人集群控制方法各有其特點(diǎn)和適應(yīng)場(chǎng)合,基于行為的控制方法符合人工智能的發(fā)展思路,設(shè)計(jì)合理的機(jī)器人集群行為,可有效實(shí)現(xiàn)集群的智能控制。
根據(jù)無人機(jī)的資源利用和作戰(zhàn)任務(wù)不同,飛行機(jī)器人集群的任務(wù)通常分為以下三類:(1)訪問任務(wù);(2)打擊任務(wù);(3)察打一體任務(wù)。其中,訪問任務(wù)具體包括三種任務(wù)類型:(1)覆蓋任務(wù);(2)搜尋作業(yè);(3)評(píng)估任務(wù)。
無人機(jī)群訪問任務(wù)是在滿足偵測(cè)設(shè)備與能量約束的情況下,通過對(duì)機(jī)器人集群進(jìn)行合理的任務(wù)分配,有效搜索、覆蓋或評(píng)估訪問目標(biāo), 實(shí)現(xiàn)訪問收益最大化的過程。飛行機(jī)器人集群覆蓋任務(wù)是對(duì)局部目標(biāo)進(jìn)行連續(xù)監(jiān)視和對(duì)特定區(qū)域的探測(cè)搜尋[35]。根據(jù)任務(wù)的執(zhí)行策略不同,可以將其歸類為行為式覆蓋和非行為式覆蓋[36]。行為式覆蓋策略是基于某種飛行機(jī)器人行為,優(yōu)化各機(jī)器人的方向和飛行時(shí)間,以實(shí)現(xiàn)對(duì)任務(wù)區(qū)域最大化覆蓋的目的,如圖2所示。
圖2 飛行機(jī)器人覆蓋任務(wù)的優(yōu)化策略Fig.2 Optimization strategy of flying robot covering tasks
搜索覆蓋率就是飛行機(jī)器人在搜索過程中覆蓋的區(qū)域面積與區(qū)域總面積的比值。搜索覆蓋率可按搜索面積或搜索點(diǎn)來進(jìn)行計(jì)算,如圖2(a)所示。圖中,將飛行機(jī)器人需要覆蓋的面積進(jìn)行網(wǎng)格化的處理,得到了6 × 10 個(gè)網(wǎng)格單元,飛行機(jī)器人從初始點(diǎn)(1,1)開始進(jìn)行基于行為的巡航覆蓋,直到完成覆蓋任務(wù),停止于坐標(biāo)點(diǎn)(3,9),共對(duì)6 × 10 網(wǎng)格區(qū)域的42 個(gè)子區(qū)域進(jìn)行了巡檢覆蓋。因此,基于行為的覆蓋策略,其搜索覆蓋率為42/60 × 100% = 70%。而以豎“一”字形編隊(duì)通過搜索覆蓋區(qū)域,其覆蓋率為編隊(duì)覆蓋區(qū)域/總搜索面積,覆蓋率為6/60 ×100%=10%。
避障通過率就是飛行機(jī)器人編隊(duì)在面對(duì)寬敞或狹窄等不同飛行通道環(huán)境的情況下,其飛行編隊(duì)根據(jù)自身隊(duì)形實(shí)現(xiàn)的障礙環(huán)境通過飛機(jī)數(shù)量與總飛機(jī)數(shù)量的比值。如圖3 所示,飛行機(jī)器人編隊(duì)以豎“一”字形編隊(duì)通過最大通過寬度為一架飛行機(jī)器人的障礙環(huán)境時(shí),其障礙通過率為100%,而當(dāng)飛行機(jī)器人編隊(duì)以橫“一”字形編隊(duì)通過最大通過寬度為一架飛行機(jī)器人的障礙環(huán)境時(shí),其障礙通過率為1/5 × 100%=20%。因此,可以看出,基于行為的覆蓋搜索策略有較高的搜索效率。
圖3 飛行機(jī)器人集群編隊(duì)隊(duì)形變換和飛行任務(wù)場(chǎng)景示意圖Fig.3 Schematic diagram of formation transformation and flight mission scenario of flying robot cluster
針對(duì)開放的非結(jié)構(gòu)化的區(qū)域進(jìn)行環(huán)境監(jiān)測(cè),飛行機(jī)器人集群可利用單機(jī)間的信息交互和合作,達(dá)到監(jiān)測(cè)區(qū)域的動(dòng)態(tài)變化,形成快速響應(yīng)。對(duì)于空間搜尋、區(qū)域覆蓋與監(jiān)測(cè)等任務(wù),機(jī)器人集群都是非常好的解決方法。
雁群每年會(huì)隨著季節(jié)變化而進(jìn)行大規(guī)模遷徙,在遷徙過程中,雁群會(huì)以“V”字陣型或“一”字陣型進(jìn)行編隊(duì)排布,在保持穩(wěn)定隊(duì)形基礎(chǔ)上,借助集群陣型提升群體的障礙通過性和飛行效率。
單架撲翼飛行機(jī)器人在執(zhí)行長(zhǎng)距離偵察、巡邏以及多目標(biāo)搜索等任務(wù)時(shí),通常會(huì)出現(xiàn)續(xù)航不足的問題。利用雁陣的不同隊(duì)形,可實(shí)現(xiàn)撲翼飛行機(jī)器人集群的大范圍空間搜索、巡檢和覆蓋任務(wù),“一”字陣型有利于提升集群的障礙通過率和安全性,“人”字和“V”字陣型有利于提升集群巡檢的搜索覆蓋率,提升巡檢任務(wù)的作業(yè)效率,如圖3所示。
2.1.1 單仿生撲翼飛行機(jī)器人模型與控制
為方便仿生撲翼飛行機(jī)器人模型建模和控制器設(shè)計(jì),在假設(shè)地面坐標(biāo)系為慣性坐標(biāo)系的條件下,通過拉格朗日建模方法,可以得到仿生撲翼飛行機(jī)器人的非線性動(dòng)力學(xué)模型
式中,qi=[qtiT,qriT]T=[xiyiziαiβiγi]T表示撲翼飛行機(jī)器人的位置及姿態(tài)狀態(tài)向量。
L表示一個(gè)使等式成立的矩陣。旋轉(zhuǎn)矩陣RIB=(RIB)-1=CB2C21C1I通過三個(gè)旋轉(zhuǎn)矩陣得到
式中,χ,α,γ表示機(jī)體坐標(biāo)系下的姿態(tài)信息量。
在主要考慮撲翼飛行機(jī)器人位置跟蹤的情況下,通過將式(1)進(jìn)行分解可得位置回路動(dòng)力學(xué)模型
qt=[x,y,z]T表示撲翼飛行機(jī)器人在慣性坐標(biāo)系下的位置向量,τt表示位置控制輸入量。
2.1.2 仿生撲翼飛行機(jī)器人編隊(duì)陣型排布與集群模型
陣型切換思想主要源于大雁長(zhǎng)途遷徙現(xiàn)象:雁群在整個(gè)遷徙過程中,會(huì)以“V”字陣型飛行實(shí)現(xiàn)整體能量?jī)?yōu)化,同時(shí)也會(huì)根據(jù)環(huán)境變化隨時(shí)改變?nèi)后w陣型,可將雁陣變換思想應(yīng)用于撲翼飛行機(jī)器人集群,以提升飛行機(jī)器人集群的巡檢能力和效率。
按照“V”字陣型排布,第三排的撲翼飛行機(jī)器人與第一排的撲翼飛行機(jī)器人之間的橫向距離為πb/2,縱向距離為4b,垂直距離不變,對(duì)應(yīng)的最大升力和阻力變化量分別為ΔL'= 0.0113 N 和ΔD'= 0.0018 N。
由于ΔL'?ΔL以及ΔD'?ΔD,在陣型分析過程中只考慮前排撲翼飛行機(jī)器人對(duì)其最近后排撲翼飛行機(jī)器人的影響。前排飛行的撲翼飛行機(jī)器人產(chǎn)生的翼尖渦流方向主要為機(jī)翼的正后方,同排飛行的撲翼飛行機(jī)器人之間的橫向距離為πb/2,其對(duì)應(yīng)的升阻力變化值同樣遠(yuǎn)小于ΔL和ΔD,如圖4所示。
圖4 撲翼飛行機(jī)器人集群編隊(duì)陣型Fig.4 Flapping wing flying robot cluster formation
在穩(wěn)定飛行情況下,通過拉格朗日建模方法,可以得到仿生撲翼飛行機(jī)器人集群位置回路的非線性動(dòng)力學(xué)模型
式中,qi=[qtiT,qriT]T=[xiyiziαiβiγi]T表示第i個(gè)撲翼飛行機(jī)器人的位置向量,Mti表示慣性矩陣,Gti=[0,0,-mig]T表示第i個(gè)撲翼飛行機(jī)器人的重力向量,τti=[τix,τiy,τiz]T表示第i個(gè)撲翼飛行機(jī)器人的控制輸入量,uti表示第i個(gè)撲翼飛行機(jī)器人在翼尖渦流影響下受到的額外升阻力向量,當(dāng)i為“長(zhǎng)機(jī)”時(shí)uti=0,F(xiàn)ti=[-Fxi,F(xiàn)yi,F(xiàn)zi]T表示第i個(gè)撲翼飛行機(jī)器人在三軸方向所受到的阻力、側(cè)向力與升力。第i個(gè)撲翼飛行機(jī)器人的旋轉(zhuǎn)矩陣RiBI通過式(3)~(5)所示的三個(gè)旋轉(zhuǎn)矩陣得到。在此僅考慮偏航角γ為統(tǒng)一變化值,橫滾角χ和俯仰角α為固定值的情況。
2.2.1 仿生運(yùn)動(dòng)行為綜述
仿生學(xué)誕生于上個(gè)世紀(jì)60 年代,仿生技術(shù)是在研究生物體、生命系統(tǒng)等結(jié)構(gòu)與功能原理的基礎(chǔ)上,根據(jù)這些生命特征原理形成的先進(jìn)技術(shù)和應(yīng)用。
生物行為就是具有某些特征的生物動(dòng)作序列和集合。而機(jī)器人行為與生物行為類似,通過仿生運(yùn)動(dòng)行為控制將機(jī)器人的特征行為進(jìn)行精確的建模和應(yīng)用。
在20 多年的發(fā)展過程中,多機(jī)器人編隊(duì)控制形成了多種具有代表性的研究方法[37-41],包括領(lǐng)航-跟隨法、基于行為的方法、人工勢(shì)場(chǎng)法和虛擬結(jié)構(gòu)法等?;谛袨榈姆椒ㄝ^為形象并易于理解,在機(jī)器人導(dǎo)航、編隊(duì)與協(xié)作、機(jī)器人足球和人機(jī)交互等方面獲得了廣泛的應(yīng)用。
上世紀(jì)80 年代,美國(guó)麻省理工學(xué)院的Rodney Brooks[42]提出了機(jī)器人行為控制方法和包容式的體系結(jié)構(gòu),將行為引入到機(jī)器人研究中。2004 年,Naffin等在協(xié)作、通信、運(yùn)動(dòng)、編隊(duì)保持和傳感等方面為多機(jī)器人編隊(duì)設(shè)計(jì)了16 種行為,以執(zhí)行和完成編隊(duì)任務(wù)[43]。2009 年,Ray 等為多機(jī)器人編隊(duì)設(shè)計(jì)的分布式行為選擇機(jī)制,取決于編隊(duì)開始時(shí)處于領(lǐng)航者地位的機(jī)器人的初始狀態(tài)[44]。
在國(guó)內(nèi),經(jīng)過多年的積累,也形成了一系列的多撲翼飛行機(jī)器人集群編隊(duì)控制算法的研究成果[45-51]。2021 年,北京航空航天大學(xué)段海濱等研究了鴿群導(dǎo)航行為模型,探索了信鴿歸巢多種復(fù)雜行為學(xué)的內(nèi)在機(jī)理。信鴿歸巢導(dǎo)航過程呈現(xiàn)出了三個(gè)階段:(1)Map-and-Compass 階段,信鴿處于高熵狀態(tài),對(duì)應(yīng)依靠地圖羅盤的導(dǎo)航行為;(2)Leg Length 階段,信鴿處于中熵狀態(tài),對(duì)應(yīng)飛行中重定向期間的導(dǎo)航行為;(3)Immediate Home階段,信鴿處于低熵狀態(tài),對(duì)應(yīng)鴿子在鴿房附近快速歸巢的行為。
2.2.2 仿生運(yùn)動(dòng)行為控制核心思想和理論模型
仿生行為控制的核心思想就是把底層的具體運(yùn)動(dòng)細(xì)節(jié)交給執(zhí)行機(jī)構(gòu),控制系統(tǒng)高層只負(fù)責(zé)整體運(yùn)動(dòng)規(guī)劃。在傳統(tǒng)的遙操作機(jī)器人控制系統(tǒng)中,期望軌跡在機(jī)器人核心控制器中生成,并對(duì)期望軌跡采樣,以對(duì)機(jī)器人進(jìn)行實(shí)時(shí)的運(yùn)動(dòng)控制,對(duì)于操作者來說工作量較大。
基于仿生運(yùn)動(dòng)行為的控制系統(tǒng)架構(gòu)不再傳輸離散的軌跡采樣點(diǎn)和基礎(chǔ)數(shù)據(jù),而是直接傳輸參數(shù)化的軌跡函數(shù)。參數(shù)化的軌跡函數(shù),是指利用變換函數(shù),把軌跡映射到一些定義的運(yùn)動(dòng)行為函數(shù)上,通過對(duì)行為函數(shù)的線性組合就可以還原參考軌跡。通信系統(tǒng)只需要傳輸幾個(gè)運(yùn)動(dòng)行為函數(shù)參數(shù),即可實(shí)現(xiàn)軌跡控制。在這種架構(gòu)下,通信傳輸量將大幅下降而控制精度卻能夠得到保證。
仿生運(yùn)動(dòng)行為控制框架的系統(tǒng)結(jié)構(gòu)如圖5 所示。仿生行為控制字母表中的行為函數(shù)為二元組f=(v,γ)T的形式,允許每個(gè)行為函數(shù)在一個(gè)任意長(zhǎng)的時(shí)間段內(nèi)執(zhí)行。在仿生行為控制系統(tǒng)結(jié)構(gòu)中,機(jī)器人控制器可進(jìn)行路徑規(guī)劃和機(jī)器人的軌跡生成,并通過仿生行為生成器生成仿生行為序列。隨后,將運(yùn)動(dòng)行為序列發(fā)送給運(yùn)動(dòng)行為解析器,以控制機(jī)器人執(zhí)行機(jī)構(gòu),來完成機(jī)器人的路徑規(guī)劃和作業(yè)任務(wù)。
圖5 仿生運(yùn)動(dòng)行為控制理論框架的控制系統(tǒng)結(jié)構(gòu)Fig.5 Control system configuration of BCBC framework
在仿生運(yùn)動(dòng)行為控制框架下,用運(yùn)動(dòng)機(jī)對(duì)機(jī)器人系統(tǒng)進(jìn)行建模,用以描述機(jī)器人在離散時(shí)間接收仿生運(yùn)動(dòng)行為命令并產(chǎn)生連續(xù)運(yùn)動(dòng)的特征。仿生運(yùn)動(dòng)行為控制的模型稱為運(yùn)動(dòng)狀態(tài)機(jī)模型,就是生成從狀態(tài)空間到輸出空間的映射關(guān)系模型,其狀態(tài)方程為
式中,x,y和u為時(shí)間變量的矢量函數(shù),G為矩陣,h和k是矢量空間之間的映射。
二元組(fi,ψi)稱為“行為函數(shù)”,由這些二元組構(gòu)成的集合稱為“字母表”。機(jī)器人控制程序表示為由字母表中的行為函數(shù)構(gòu)成的符號(hào)串的形式。如果運(yùn)動(dòng)機(jī)的初始狀態(tài)為x0=x(t0),在接收到符號(hào)串(f1,ψ1,T1)(f2,ψ2,T2)…(fn,ψn,Tn)后,其運(yùn)動(dòng)規(guī)律可以描述為
式中,u、x、y均是時(shí)間t的函數(shù)。u是連續(xù)輸入控制函數(shù)。x是n維系統(tǒng)狀態(tài)函數(shù)。y是一個(gè)系統(tǒng)輸出函數(shù)。k是狀態(tài)反饋。
(f1,ψ1)行為函數(shù)含義實(shí)例說明如下:
當(dāng)飛行機(jī)器人以前進(jìn)方向趨近于期望直線時(shí),飛行機(jī)器人方位角θ將趨向于期望直線的角度β,行為函數(shù)(f1,ψ1)中相應(yīng)的符號(hào)定義為
式中,v0為常數(shù),k1和k2是控制增益常數(shù),β為給定直線的傾角。
ψ1是定義在機(jī)器人輸出空間上的函數(shù),取值為整數(shù)值,即ψ1:Y->Z,用于確定下一采樣周期內(nèi)將要執(zhí)行的行為函數(shù)相對(duì)于當(dāng)前行為函數(shù)的位置。
(f2,ψ2)和(f3,ψ3)的符號(hào)定義和函數(shù)說明參考(f1,ψ1)。根據(jù)以上行為函數(shù)的定義,可以得到實(shí)現(xiàn)飛行機(jī)器人位姿鎮(zhèn)定的運(yùn)動(dòng)字母表
將一個(gè)連續(xù)系統(tǒng)分段表示,然后將每一段用參數(shù)化的運(yùn)動(dòng)行為函數(shù)(f,ψ)表達(dá),就可以用一串離散的符號(hào)序列來驅(qū)動(dòng)一個(gè)連續(xù)系統(tǒng)。在仿生行為控制框架下,從初始時(shí)刻開始,仿生運(yùn)動(dòng)行為編譯器接收到一個(gè)運(yùn)動(dòng)行為函數(shù)的序列,隨后編譯器將這個(gè)序列翻譯成分段映射。仿生行為過程用運(yùn)動(dòng)行為函數(shù)表達(dá),將行為構(gòu)成的符號(hào)串用于運(yùn)動(dòng)規(guī)劃。
微型撲翼飛行機(jī)器人實(shí)驗(yàn)系統(tǒng)由飛行機(jī)器人本體和地面控制單元兩大部分組成。撲翼飛行機(jī)器人機(jī)身本體系統(tǒng)由高強(qiáng)度碳纖維機(jī)身、X 型翼、機(jī)載微型電路板、微型電機(jī)和傳動(dòng)機(jī)構(gòu)等組部件構(gòu)成。
撲翼飛行機(jī)器人集成了MEMS 工藝的仿生彈性翼,X 型翼在工程上較易實(shí)現(xiàn),可實(shí)現(xiàn)翅翼單自由度上、下?lián)鋭?dòng)。撲翼飛行機(jī)器人翼展14 cm,可連續(xù)穩(wěn)定飛行13 min 以上,質(zhì)量?jī)H有6 g,如圖6(a)所示。飛行機(jī)器人機(jī)身可安裝陀螺儀等傳感器,可實(shí)現(xiàn)撲翼飛行機(jī)器人的自平穩(wěn)飛行、轉(zhuǎn)彎和避障等飛行功能。
圖6 撲翼飛行機(jī)器人結(jié)構(gòu)及地面控制站和圖傳單元Fig.6 Flapping-wing flying robot structure, ground control station and image transmission unit
地面控制單元裝置包括接收天線、線路放大器、計(jì)算機(jī)等結(jié)構(gòu)組部件。撲翼飛行機(jī)器人地面控制單元如圖6(b)所示,其控制手柄包括四個(gè)方向按鍵和加減速按鍵,通過天線將控制單元的數(shù)據(jù)級(jí)和行為級(jí)指令發(fā)送給撲翼機(jī)器人,同時(shí)可將撲翼機(jī)器人狀態(tài)信息和機(jī)器人視覺信息回傳給地面控制單元。地面控制和接收單元主要用來接收機(jī)器人機(jī)載信息和視覺傳感器實(shí)時(shí)回傳的信息,并將數(shù)據(jù)和信息進(jìn)行記錄和存儲(chǔ)。
撲翼飛行機(jī)器人單機(jī)可利用機(jī)載視覺進(jìn)行導(dǎo)航,撲翼飛行機(jī)器人的載荷可達(dá)5 g。圖傳模塊利用模擬圖傳,頻率為5.8 GHz,質(zhì)量?jī)H為2 g,可實(shí)現(xiàn)圖片與視頻的高速、高帶寬傳輸。撲翼飛行機(jī)器人的載荷能力完全能夠承載圖傳單元等載荷。導(dǎo)航實(shí)驗(yàn)方面,在室內(nèi)進(jìn)行撲翼飛行機(jī)器人三機(jī)的初步編隊(duì)飛行實(shí)驗(yàn),三機(jī)編隊(duì)飛行利用地面控制器來對(duì)三撲翼飛行機(jī)器人進(jìn)行飛行機(jī)器人本體驗(yàn)證和編隊(duì)初步驗(yàn)證。
撲翼飛行機(jī)器人實(shí)驗(yàn)環(huán)境如圖7所示,利用兩根豎桿和桿連接線纜來模擬線纜巡檢任務(wù)和作業(yè)環(huán)境。通過設(shè)計(jì)實(shí)驗(yàn),以七架撲翼飛行機(jī)器人編隊(duì)為實(shí)驗(yàn)研究對(duì)象,在集群編隊(duì)“人”字形到“V”字形的轉(zhuǎn)換、“人”字形到“一”字形的轉(zhuǎn)換、編隊(duì)避障與掉頭控制和編隊(duì)手動(dòng)控制與仿生行為控制等多種情況下進(jìn)行實(shí)驗(yàn)研究,以驗(yàn)證仿生集群行為控制方法的有效性。
圖7 微型撲翼飛行機(jī)器人集群飛行實(shí)驗(yàn)Fig.7 Cluster flight experiment of micro flapping-wing flying robot
飛行機(jī)器人編隊(duì)的“人”字形定義為飛行機(jī)器人頭機(jī)處于飛行方向的中間最前列,其他飛行機(jī)器人在頭機(jī)的側(cè)后方依次后向排列,如圖4 所示為人字形排列。而“V”字形排列為飛行機(jī)器人編隊(duì)頭機(jī)處于飛行方向的中間最后列,其他飛行機(jī)器人在頭機(jī)的側(cè)前方向依次排列,為“人”字形排列的反方向陣型。橫“一”字形為多飛行機(jī)器人沿著飛行方向并行飛行。豎“一”字形為多飛行機(jī)器人沿著飛行方向前后跟隨飛行,形成豎向排列的陣型。
飛行機(jī)器人在X、Y和Z三維空間進(jìn)行軌跡運(yùn)動(dòng)。飛行機(jī)器人的控制方式是給定了機(jī)器人的初始位置、機(jī)器人的運(yùn)動(dòng)速度和空間控制角度,飛行機(jī)器人即可進(jìn)行飛行軌跡運(yùn)動(dòng)。飛行過程中,可根據(jù)飛行機(jī)器人的位置、姿態(tài)和算法進(jìn)行編隊(duì)調(diào)整,以完成飛行機(jī)器人的作業(yè)任務(wù)。
微型撲翼飛行機(jī)器人飛行實(shí)驗(yàn)如圖7所示,外圈藍(lán)色虛線為飛行機(jī)器人編隊(duì)的飛行軌跡方向曲線,實(shí)驗(yàn)以三個(gè)撲翼飛行機(jī)器人為三角形編隊(duì),形成了三角形飛行機(jī)器人編隊(duì)的陣型,如圖7 中藍(lán)色三角形隊(duì)形所示。撲翼飛行機(jī)器人的行為就是具有相似特征的機(jī)器人動(dòng)作集合,如平面圓形飛行等,并且機(jī)器人行為與運(yùn)動(dòng)行為函數(shù)符號(hào)相對(duì)應(yīng)。通過對(duì)多撲翼飛行機(jī)器人集群編隊(duì)特點(diǎn)進(jìn)行分析,結(jié)合鴿群三階段歸巢行為模型,將撲翼飛行機(jī)器人導(dǎo)航過程分為:(1)第一階段——高熵自然羅盤導(dǎo)航階段;(2)第二階段——中熵重定向?qū)Ш叫袨殡A段;(3)第三階段——低熵狀態(tài)快速歸巢行為階段。設(shè)計(jì)十一個(gè)行為函數(shù)和字母表對(duì)飛行機(jī)器人編隊(duì)進(jìn)行控制,其仿生集群行為函數(shù)如表1所示。
表1 飛行機(jī)器人空間運(yùn)動(dòng)的仿生集群行為函數(shù)表Table 1 Function table of BCBC for flying robot space motion
實(shí)驗(yàn)地面平臺(tái)的控制方式采用基礎(chǔ)行為集合:上、下、左、右,基于作業(yè)任務(wù)分析的機(jī)器人集群特征行為集合:編隊(duì)“V”字形變換f5、編隊(duì)避障f9、編隊(duì)掉頭運(yùn)動(dòng)f10、編隊(duì)隊(duì)形保持f11…。(f1,ψ1)、(f2,ψ2)、(f3,ψ3)、(f4,ψ4)…中,f為機(jī)器人運(yùn)動(dòng)狀態(tài)控制函數(shù),ψ為機(jī)器人運(yùn)動(dòng)切換函數(shù)。
通過以上撲翼飛行機(jī)器人的行為規(guī)劃,可實(shí)現(xiàn)撲翼機(jī)器人的智能行為控制,無需根據(jù)撲翼機(jī)器人的飛行狀態(tài)和飛行環(huán)境實(shí)時(shí)發(fā)送控制命令,通過基于仿生運(yùn)動(dòng)行為控制的智能控制策略可大量節(jié)省控制器實(shí)時(shí)控制的負(fù)荷,大量減少底層位置控制的壓力,基于集群行為的智能控制方法為人處于控制閉環(huán)的機(jī)器人遙操作提供了有力的控制解決方案。
撲翼飛行機(jī)器人機(jī)身上裝有微型陀螺儀用來記錄撲翼飛行機(jī)器人的姿態(tài)數(shù)據(jù)。飛行機(jī)器人陀螺儀的數(shù)據(jù)采用了四元數(shù)法,記錄數(shù)據(jù)如表2所示。
表2 撲翼飛行機(jī)器人陀螺儀數(shù)據(jù)表Table 2 Flapping-wing flying robot gyro data sheet
根據(jù)撲翼飛行機(jī)器人陀螺儀的姿態(tài)數(shù)據(jù),可以更多了解飛行機(jī)器人集群的姿態(tài)信息和數(shù)據(jù)信息,為撲翼飛行機(jī)器人集群控制提供了更多的硬件保證和數(shù)據(jù)支持。
利用豎桿和橫桿作為實(shí)驗(yàn)場(chǎng)地的飛行標(biāo)記點(diǎn)位,實(shí)驗(yàn)的目的是利用三撲翼飛行機(jī)器人的三角形編隊(duì)變換來驗(yàn)證撲翼機(jī)編隊(duì)變換,以形成初步編隊(duì)變換驗(yàn)證數(shù)據(jù)并進(jìn)行數(shù)據(jù)分析。以地面桿作為標(biāo)記點(diǎn),利用地面控制臺(tái)對(duì)飛行編隊(duì)進(jìn)行加速和行為控制,實(shí)現(xiàn)正三角撲翼機(jī)器人編隊(duì)向倒三角飛行機(jī)器人編隊(duì)的陣型轉(zhuǎn)換。
根據(jù)以上仿生行為函數(shù)的定義和規(guī)劃,設(shè)計(jì)以下一些仿真實(shí)驗(yàn)來驗(yàn)證基于雁陣變換的撲翼飛行機(jī)器人集群行為控制的有效性。飛行機(jī)器人編隊(duì)軌跡生成實(shí)驗(yàn)是仿真軟件實(shí)驗(yàn),本實(shí)驗(yàn)考慮將撲翼飛行機(jī)器人簡(jiǎn)化為三維智能體點(diǎn),重點(diǎn)研究編隊(duì)的軌跡規(guī)劃、編隊(duì)軌跡和編隊(duì)通過率及避障等后續(xù)問題。
(1)“人”字形—V字形轉(zhuǎn)換
七個(gè)撲翼飛行機(jī)器人分別從各自的初始位置[七個(gè)坐標(biāo)點(diǎn):(4,4);(4,0);(0,4);(4,2);(2,4);(4,-2);(-2,4)]出發(fā),機(jī)器人的運(yùn)動(dòng)方向?yàn)榕cXOY平面呈45°的直線方向。然后,給七個(gè)撲翼飛行機(jī)器人發(fā)送隊(duì)形轉(zhuǎn)換行為函數(shù)指令,七個(gè)撲翼機(jī)器人經(jīng)過隊(duì)形轉(zhuǎn)換后,變成倒三角隊(duì)形,由原來的“人”字形編隊(duì)變?yōu)椤癡”字形編隊(duì)隊(duì)形。隨后發(fā)送隊(duì)形轉(zhuǎn)換行為函數(shù)結(jié)束命令,七個(gè)撲翼機(jī)器人繼續(xù)以“V”字形進(jìn)行勻速直線運(yùn)動(dòng),如圖8所示。
圖8 基于仿生集群行為控制的“人”字形轉(zhuǎn)換“V”字形運(yùn)動(dòng)行為空間軌跡圖Fig.8 Space trajectory of “V” type movement behavior of “herringbone” type transformation based on BCBC
(2)“人”字形-橫“一”字形轉(zhuǎn)換
七個(gè)撲翼機(jī)器人分別從各自的初始位置出發(fā),機(jī)器人的運(yùn)動(dòng)方向?yàn)榕cXOY平面呈45°的直線方向。隨后,給撲翼飛行機(jī)器人編隊(duì)發(fā)送仿生運(yùn)動(dòng)行為控制指令,撲翼機(jī)器人編隊(duì)進(jìn)行隊(duì)形變換,變?yōu)闄M“一”字形隊(duì)形。隨后,撲翼機(jī)編隊(duì)繼續(xù)進(jìn)行勻速直線運(yùn)動(dòng),如圖9所示。
圖9 基于仿生集群行為控制的“人”字形轉(zhuǎn)換橫“一”字形運(yùn)動(dòng)行為空間軌跡圖Fig.9 Space trajectory of “herringbone” type transformation “一” type movement behavior controlled by BCBC
由七個(gè)撲翼飛行機(jī)器人組成的集群編隊(duì)分別從初始位置出發(fā),沿與XOY平面呈45°的平面勻速飛行。隨后給撲翼機(jī)編隊(duì)發(fā)送仿生編隊(duì)行為變換指令,撲翼機(jī)編隊(duì)在調(diào)整成橫“一”字形后,集體旋轉(zhuǎn)90°,隊(duì)形變?yōu)樨Q“一”字形編隊(duì)。隊(duì)形調(diào)整結(jié)束后,以豎“一”字形繼續(xù)進(jìn)行勻速直線運(yùn)動(dòng),如圖10所示。
圖10 基于仿生集群行為控制的“人”字形轉(zhuǎn)換橫“一”字形運(yùn)動(dòng)行為空間軌跡圖Fig.10 Spatial trajectory of “herringbone” type transformation horizontal “一” type movement behavior controlled by BCBC
如圖9所示,飛行機(jī)器人編隊(duì)以“人”字形通過最大通過寬度為一架飛行機(jī)器人的狹窄障礙通道時(shí),其障礙通過率為14%。而“人”字形的飛行機(jī)器人編隊(duì)搜索覆蓋率較高,可達(dá)到70%以上。所以,飛行機(jī)器人編隊(duì)控制的策略是:在進(jìn)行搜索覆蓋任務(wù)的情形下,以“人”字形編隊(duì)可提升覆蓋率;而在通過狹窄通道任務(wù)情形下,以豎“一”字形編隊(duì)方式,可大大提升障礙通過率,如圖10所示。
(3)集群避障與掉頭行為
由七個(gè)撲翼機(jī)器人組成的集群編隊(duì)由初始位置出發(fā),沿與XOY平面呈45°的平面運(yùn)動(dòng),如圖11 所示。隨后給撲翼機(jī)編隊(duì)發(fā)送編隊(duì)避障行為指令,集群編隊(duì)在調(diào)整為橫“一”字形后,以90°角向下集體運(yùn)動(dòng),以完成90°角集群避障行為。
圖11 基于仿生集群行為控制的集群避障行為和掉頭行為空間軌跡圖Fig.11 Space trajectory of obstacle avoidance behavior and turning behavior of the cluster based on BCBC
隨后給撲翼機(jī)器人編隊(duì)發(fā)送編隊(duì)掉頭行為指令,集群在調(diào)整為橫“一”字形后,以掉頭180°角反向運(yùn)動(dòng),以完成集群掉頭避障行為,如圖11所示。
(4)編隊(duì)手動(dòng)控制比較
通過將實(shí)驗(yàn)的集群手動(dòng)控制方式和仿生集群行為控制方式進(jìn)行對(duì)比來觀察其缺點(diǎn)和優(yōu)點(diǎn)。以手柄控制器控制的手動(dòng)控制方式,操作者通過視覺進(jìn)行實(shí)時(shí)判斷,手動(dòng)控制地面控制器存在抖動(dòng)現(xiàn)象,飛行機(jī)器人飛行軌跡同樣存在隨機(jī)抖動(dòng)。因此,飛行機(jī)器人編隊(duì)軌跡存在抖動(dòng)和軌跡非連續(xù)運(yùn)動(dòng)的不足,如圖12(a)所示,抖動(dòng)軌跡放大如圖12(b)所示。抖動(dòng)尺寸范圍為0.1~0.4 cm,抖動(dòng)呈現(xiàn)隨機(jī)分布,均值在0.1~0.2 cm,運(yùn)動(dòng)范圍在0~20 cm,在1cm 的范圍之內(nèi)抖動(dòng)有1~7 次左右,也呈現(xiàn)隨機(jī)狀態(tài)。因此,抖動(dòng)幅度占總運(yùn)動(dòng)幅度比率12%左右。飛行機(jī)器人抖動(dòng)相對(duì)較小,在可控范圍之內(nèi)。
圖12 基于手動(dòng)控制與仿生集群行為控制的飛行機(jī)器人編隊(duì)的空間運(yùn)動(dòng)軌跡對(duì)比圖Fig.12 Comparison of space motion trajectory of flying robot formation based on manual control and BCBC
手控方式需要操作者進(jìn)行實(shí)時(shí)判斷和操控,操作者工作量大且較易疲勞。而在仿生集群行為控制方式下,利用機(jī)器人半智能行為級(jí)指令進(jìn)行編隊(duì)控制,操作者只需進(jìn)行編隊(duì)監(jiān)控和少量編隊(duì)指令交互即可,大量節(jié)省了操作者的工作量,并且控制軌跡平滑,如圖12(c)所示。因此,基于仿生集群行為控制的多飛行機(jī)器人集群控制方法有明顯的算法優(yōu)勢(shì)。
通過以上集群編隊(duì)“人”字形到“V”字形的轉(zhuǎn)換、“人”字形到“一”字形的轉(zhuǎn)換、編隊(duì)避障與掉頭控制和編隊(duì)手動(dòng)控制與仿生行為控制的多種情況的實(shí)驗(yàn)比較和驗(yàn)證,基于仿生集群行為控制的多撲翼飛行機(jī)器人集群控制方法,能夠有效地完成飛行機(jī)器人集群編隊(duì)控制的作業(yè)任務(wù)。
本文提出了基于雁陣變換的多微型撲翼飛行機(jī)器人集群編隊(duì)行為控制方法。針對(duì)多撲翼飛行機(jī)器人實(shí)驗(yàn)任務(wù)定義了多個(gè)編隊(duì)行為控制函數(shù),實(shí)現(xiàn)了飛行機(jī)器人編隊(duì)的隊(duì)形轉(zhuǎn)換和避障行為控制。并以多撲翼飛行機(jī)器人搭建了實(shí)驗(yàn)平臺(tái)系統(tǒng),通過“人”字形、“V”字形、“一”字形等典型雁陣陣型轉(zhuǎn)換、編隊(duì)避障掉頭和手動(dòng)控制等多種情況下的實(shí)驗(yàn)驗(yàn)證,最終驗(yàn)證了基于雁陣變換的多微型撲翼飛行機(jī)器人集群行為控制方法的可行性和有效性。與傳統(tǒng)的撲翼飛行機(jī)器人實(shí)時(shí)控制相比,控制工作量大幅降低。下一步的研究工作主要集中在以下兩個(gè)方面:(1)將蟻群、魚群等群體智能算法應(yīng)用于撲翼飛行機(jī)器人集群控制;(2)將機(jī)器人的視覺感知和環(huán)境建模應(yīng)用于撲翼飛行機(jī)器人集群,朝著群體智能和智能機(jī)器人集群感知的方向發(fā)展。