陳國(guó)春,毛新軍,楊 碩,沈宇婷,趙偉偉,張少波
(1.國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院;2.國(guó)防科技大學(xué)復(fù)雜系統(tǒng)軟件工程重點(diǎn)實(shí)驗(yàn)室,湖南長(zhǎng)沙 410073;3.中國(guó)科學(xué)院國(guó)家空間科學(xué)中心,北京 100190;4.中國(guó)科學(xué)院大學(xué),北京 100039;5.中國(guó)電子科技集團(tuán)公司第五十四研究所,河北 石家莊 050000;6.湖南科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,湖南 湘潭 411201)
與單無人機(jī)執(zhí)行任務(wù)相比,多無人機(jī)協(xié)同執(zhí)行任務(wù)通過多機(jī)多傳感器進(jìn)行多方位信息感知,從而獲得對(duì)環(huán)境狀態(tài)更全面的認(rèn)知[1];通過將總?cè)蝿?wù)分解成多個(gè)子任務(wù),并合理分配給多個(gè)無人機(jī)執(zhí)行,從而簡(jiǎn)化了任務(wù)復(fù)雜度,提高了任務(wù)執(zhí)行效率[2];通過自組織方法及時(shí)替換故障無人機(jī),以保證任務(wù)的正常執(zhí)行,提高了系統(tǒng)魯棒性[3]。因此,軍事和民用領(lǐng)域廣泛應(yīng)用多無人機(jī)協(xié)同執(zhí)行任務(wù),如軍事偵察[4-6]、目標(biāo)檢測(cè)[7-8]等。在任務(wù)執(zhí)行過程中,無人機(jī)群通常需要保持特定的空間結(jié)構(gòu)以滿足任務(wù)要求。因而快速形成符合任務(wù)要求的空間結(jié)構(gòu),對(duì)提高多無人機(jī)的任務(wù)執(zhí)行效率具有重要意義。
本文以多無人機(jī)協(xié)同對(duì)單目標(biāo)定位作為任務(wù),至少需要4 架不在同一平面上的無人機(jī),且4 架無人機(jī)到目標(biāo)點(diǎn)的距離相等。根據(jù)數(shù)學(xué)原理,這4 架無人機(jī)在以目標(biāo)點(diǎn)為中心、某一常數(shù)值為半徑的球面上。因此,這4 架無人機(jī)可唯一確定球心的位置,即目標(biāo)點(diǎn)位置,如圖1 所示。4 架無人機(jī)(UAV1~UAV4)到目標(biāo)點(diǎn)距離相等的問題可等價(jià)于兩組3 架無人機(jī)(UAV1~UAV3、UAV2~UAV4)到目標(biāo)點(diǎn)距離相等的問題。所以,為簡(jiǎn)化問題,將其轉(zhuǎn)換為如何使3架無人機(jī)到目標(biāo)點(diǎn)距離相等,也即目標(biāo)點(diǎn)在經(jīng)過3 個(gè)無人機(jī)組成的三角形外接圓圓心且與該圓平面垂直的直線上。
Fig.1 Spatial structure of four UAVs with equal distance to the target point圖1 4 架無人機(jī)到目標(biāo)點(diǎn)距離相等的空間結(jié)構(gòu)
文獻(xiàn)[9]、[10]中指出,距離目標(biāo)點(diǎn)越遠(yuǎn),信號(hào)強(qiáng)度越弱,且對(duì)于同一目標(biāo),測(cè)得信號(hào)強(qiáng)度相等的點(diǎn)到目標(biāo)點(diǎn)距離相等,則問題等價(jià)于如何使3 架無人機(jī)到目標(biāo)點(diǎn)的信號(hào)強(qiáng)度相等。由于實(shí)際信號(hào)在強(qiáng)度測(cè)量時(shí)存在誤差,信號(hào)強(qiáng)度很難絕對(duì)精確,因此問題可等價(jià)于如何使3 架無人機(jī)到目標(biāo)點(diǎn)信號(hào)強(qiáng)度的差值不超過滿足條件要求的閾值。
針對(duì)上述問題與挑戰(zhàn),本文以多無人機(jī)目標(biāo)定位為任務(wù),將無人機(jī)群抽象為一個(gè)發(fā)散式的多智能體系統(tǒng),形成基于多智能體的多無人機(jī)系統(tǒng)模型?;谠撃P?,本文提出多智能體自組織協(xié)同方法,該方法采用三邊極差收斂算法,以快速形成各無人機(jī)到目標(biāo)點(diǎn)距離相等的空間結(jié)構(gòu)。
已有研究中關(guān)于單無人機(jī)對(duì)單目標(biāo)點(diǎn)的定位,需要較多的位置與角度信息,如無人機(jī)到目標(biāo)點(diǎn)的方位角、俯仰角,以及無人機(jī)與目標(biāo)距離、無人機(jī)自身位置坐標(biāo)等[11],測(cè)量方法較為復(fù)雜,且定位結(jié)果存在累積誤差[12]。因此,當(dāng)前主流工作圍繞多無人機(jī)協(xié)同定位展開。
多無人機(jī)協(xié)同定位相關(guān)工作主要采用以下幾種方法:Leader-Follower 方法[13-16]、基于個(gè)體行為的方法[17-18]與人工勢(shì)場(chǎng)法[19-21]。這些方法各有優(yōu)勢(shì)與不足。Leader-Follower 方法能較好地維持空間結(jié)構(gòu),但該其過于依賴Leader的可靠性。如文獻(xiàn)[13]提出將無人機(jī)群的中心位置作為一個(gè)虛擬Leader,有效解決了Leader 可能出現(xiàn)故障的問題,但存在難以實(shí)時(shí)計(jì)算出無人機(jī)群中心位置的問題?;趥€(gè)體行為的方法事先設(shè)定無人機(jī)行為規(guī)則,系統(tǒng)內(nèi)各無人機(jī)可根據(jù)任務(wù)指令采取相應(yīng)行為模式,但這種分布式控制方法難以實(shí)現(xiàn)群體行為,即難以形成所需的空間結(jié)構(gòu)。如文獻(xiàn)[17]使用該方法實(shí)現(xiàn)了在環(huán)境未知且有障礙物情況下的集群控制。人工勢(shì)場(chǎng)法能有效避免無人機(jī)間的碰撞,但在形成空間結(jié)構(gòu)過程中可能陷入局部最小值,無法形成所需的空間結(jié)構(gòu)。如文獻(xiàn)[19]綜合考慮速度狀態(tài)信息、動(dòng)態(tài)安全距離等要素,修正了傳統(tǒng)人工勢(shì)場(chǎng)法,效果較好。但這些方法都沒有將無人機(jī)群視為一個(gè)整體,未充分利用多無人機(jī)相互協(xié)同配合完成任務(wù),沒有體現(xiàn)無人機(jī)群的群體智能性。
本文利用多無人機(jī)協(xié)同的優(yōu)勢(shì)和多智能體建模的特點(diǎn),將無人機(jī)群抽象為一個(gè)發(fā)散式的多智能體系統(tǒng),提出多智能體的自組織協(xié)同方法。該方法采用三邊極差收斂算法,以快速形成各無人機(jī)到目標(biāo)點(diǎn)距離相等的空間結(jié)構(gòu)。
無人機(jī)作為獨(dú)立的行為主體,有其相應(yīng)的屬性及行為,如自身狀態(tài)信息屬性、飛行行為、定位行為等;能根據(jù)指令采取相應(yīng)行為,具有一定的自主性;能通過機(jī)間通信鏈路進(jìn)行信息交流,實(shí)現(xiàn)局部通信。多無人機(jī)系統(tǒng)可根據(jù)任務(wù)需求進(jìn)行任務(wù)分配,并通過相互之間的信息交流實(shí)現(xiàn)無人機(jī)間的協(xié)調(diào)與協(xié)作,將個(gè)體自主性演化為群體智能性。本文將多智能體技術(shù)引入到多無人機(jī)系統(tǒng)建模過程中,將單個(gè)無人機(jī)建模為一個(gè)智能體,通過智能體對(duì)單個(gè)無人機(jī)屬性及行為進(jìn)行模擬,并使智能體與智能體之間、智能體與環(huán)境之間進(jìn)行信息交互,實(shí)現(xiàn)智能體之間的相互協(xié)調(diào)與協(xié)作,形成基于多智能體的多無人機(jī)系統(tǒng)模型,如圖2 所示。通過對(duì)未知環(huán)境下的無人機(jī)群進(jìn)行建模仿真,評(píng)估與分析自組織行為在多無人機(jī)空間結(jié)構(gòu)形成過程中的影響。本文以多無人機(jī)目標(biāo)定位任務(wù)為背景,以快速形成任務(wù)要求的空間結(jié)構(gòu)為目的,提出一種基于多智能體的多無人機(jī)自組織系統(tǒng)模型。
Fig.2 Multi-UAV system models圖2 多無人機(jī)系統(tǒng)模型
無人機(jī)作為具有一定自主性的獨(dú)立行為主體,被抽象為智能體。作為多智能體系統(tǒng)中的基本組成單元,該智能體由五元組Agent=
(1)State={Normal,Abnormal}表示Agent的可選狀態(tài)集合,由無人機(jī)電量、無人機(jī)是否處于正常工作中等因素來確定。如果電量過低或無人機(jī)工作異常,State為Abnormal,表示無人機(jī)不可使用。
(2)Position表示Agent的位置,即無人機(jī)在地理坐標(biāo)系下的三維坐標(biāo)。
(3)PosInfo表示Agent所在位置的信號(hào)強(qiáng)度信息。
(4)NeighborInfo表示其他Agent的相關(guān)信息。Agent通過機(jī)間通信獲取其他Agent所在位置的信號(hào)強(qiáng)度,并將其以列表形式保存在NeighborInfo中。
(5)Action表示Agent可執(zhí)行活動(dòng)的集合,包括移動(dòng)(Move)、懸停(Standby)、返回基地(Return),即Action={Move,Standby,Return}。
將無人機(jī)抽象為智能體,則具有通信能力的無人機(jī)群可抽象為多智能體,并建立多智能體模型。通過智能體對(duì)環(huán)境的感知理解,采用多智能體系統(tǒng)自組織方法實(shí)現(xiàn)智能體之間的相互協(xié)調(diào)與協(xié)作,從而實(shí)現(xiàn)無人機(jī)群整體行為的一致性。無人機(jī)群的多智能體模型可定位為一個(gè)四元組:UAV-MAS=
(1)Agents={agent1,...,agentn}表示無人機(jī)群中有n個(gè)無人機(jī),被抽象為n個(gè)智能體。
(2)TargetPos表示目標(biāo)點(diǎn)被定位后的坐標(biāo)值,如果還未定位完成,該值為空。
(3)MissionState表示是否已完成對(duì)目標(biāo)點(diǎn)的定位。該值初始為False,表示定位還未完成;定位完成后該值為True,并將目標(biāo)定位結(jié)果賦值給TargetPos。
(4)Mechanism表示該無人機(jī)群采用何種方法形成定位所需的空間結(jié)構(gòu)。
在初始條件下,各無人機(jī)到目標(biāo)點(diǎn)距離不等,但無人機(jī)之間通過機(jī)間通信鏈路進(jìn)行的信息交互使得無人機(jī)彼此知道其所在位置的信號(hào)強(qiáng)度。無人機(jī)群通過自組織方式減小不同無人機(jī)到目標(biāo)點(diǎn)距離的差值,如圖3 所示。
Fig.3 Schematic diagram of UAVs position movement圖3 無人機(jī)群位置移動(dòng)示意圖
多無人機(jī)自組織協(xié)同方法流程如圖4 所示。
要使各無人機(jī)到目標(biāo)點(diǎn)距離相等,即通過移動(dòng)無人機(jī)使得各無人機(jī)所在位置的信號(hào)強(qiáng)度相近,信號(hào)強(qiáng)度相差最大的二者信號(hào)強(qiáng)度之差小于可接受的誤差閾值。當(dāng)該條件不被滿足時(shí),各無人機(jī)選擇已知的最大信號(hào)強(qiáng)度與最小信號(hào)強(qiáng)度平均值作為最佳信號(hào)強(qiáng)度,自主選擇其最佳飛行方向,使得其信號(hào)強(qiáng)度變化逐漸接近最佳信號(hào)強(qiáng)度。如此,最大信號(hào)強(qiáng)度會(huì)不斷減小,最小信號(hào)強(qiáng)度不斷增大,最終達(dá)到一個(gè)平衡的臨界值,使得所有無人機(jī)的信號(hào)強(qiáng)度相近,即到目標(biāo)點(diǎn)的距離近似相等,從而滿足目標(biāo)定位任務(wù)的空間結(jié)構(gòu)要求。
取無人機(jī)群中各無人機(jī)及目標(biāo)點(diǎn)的初始位置為任務(wù)區(qū)域Domain中的點(diǎn),任務(wù)執(zhí)行時(shí)刻表示為T={t0,t1,…,ti,…,tn},0 ≤i≤n?;诙嘀悄荏w的多無人機(jī)系統(tǒng)模型可抽象為UAV-MAS=
Fig.4 Process of multi-UAV self-organization collaboration method圖4 多無人機(jī)自組織協(xié)同方法流程
記agentk在ti時(shí)刻測(cè)得的信號(hào)強(qiáng)度為,任務(wù)要求信號(hào)強(qiáng)度極差不能超過deltas,則任務(wù)條件為max()-min() 算法1 三邊極差收斂算法 輸入:無人機(jī)群初始位置,如無人機(jī)agentk的初始位置為;無人機(jī)agentk在ti時(shí)刻測(cè)得的信號(hào)強(qiáng)度為。 輸出:滿足信號(hào)強(qiáng)度極差小于誤差要求閾值時(shí)的無人機(jī)群位置,如無人機(jī)agentk的最終位置為(agtkx,agtky,agtkz)。 本文通過模擬實(shí)驗(yàn)驗(yàn)證所提出的自組織協(xié)同方法應(yīng)用于無人機(jī)群形成特定空間結(jié)構(gòu)過程的高效性,即驗(yàn)證該方法是否能形成符合條件的特定空間結(jié)構(gòu)并優(yōu)于其他方法。 本文設(shè)計(jì)模擬環(huán)境為1000m × 1000m × 1000m 的 未知區(qū)域。其中,無人機(jī)數(shù)量為3 架,隨機(jī)對(duì)其位置進(jìn)行初始化。為了模擬環(huán)境的不確定性,目標(biāo)位置也是隨機(jī)生成。如圖5 所示,圖中無人機(jī)初始位置分別為圓形、正方形、三角形所在位置,目標(biāo)初始位置為五角星所在位置。 無人機(jī)群通過機(jī)間通信,使得所有無人機(jī)都能獲取各無人機(jī)所在位置的信號(hào)強(qiáng)度。采用自組織協(xié)同方法,最終使3 個(gè)無人機(jī)到目標(biāo)點(diǎn)的信號(hào)強(qiáng)度相近,即形成3 個(gè)無人機(jī)到目標(biāo)點(diǎn)距離近似相等的空間結(jié)構(gòu)。將無人機(jī)群運(yùn)動(dòng)軌跡從開始到結(jié)束由淺至深進(jìn)行繪制,如圖6 所示。 Fig.5 Initial position of target and UAVs圖5 目標(biāo)及無人機(jī)群初始位置 Fig.6 Movement trajectory of UAVs圖6 無人機(jī)群運(yùn)動(dòng)軌跡 無人機(jī)在飛行過程中以勻速運(yùn)動(dòng),以多無人機(jī)協(xié)同過程中的單個(gè)無人機(jī)飛行路程為橫坐標(biāo),無人機(jī)所在位置的信號(hào)強(qiáng)度為縱坐標(biāo),繪制無人機(jī)群信號(hào)強(qiáng)度變化圖,如圖7所示。由圖7 可知,無人機(jī)間的信號(hào)強(qiáng)度差距越來越小,最終3 個(gè)無人機(jī)的信號(hào)強(qiáng)度相近,形成了到目標(biāo)點(diǎn)距離近似相等的空間結(jié)構(gòu)。 Fig.7 Variation of signal intensity of UAVs圖7 無人機(jī)群信號(hào)強(qiáng)度變化 本文對(duì)無人機(jī)自組織協(xié)同方法進(jìn)行30 次模擬實(shí)驗(yàn),統(tǒng)計(jì)每次模擬實(shí)驗(yàn)中無人機(jī)群形成空間結(jié)構(gòu)所需的單個(gè)無人機(jī)飛行最大路程。同樣的,對(duì)于每次模擬實(shí)驗(yàn),也采用已有的成熟編隊(duì)控制方法,即Leader-Follower 方法,將信號(hào)強(qiáng)度最大和最小的兩架無人機(jī)作為Follower,剩下一架無人機(jī)作為L(zhǎng)eader、Follower 朝與Leader 信號(hào)強(qiáng)度相近的方向靠近,使得無人機(jī)間的信號(hào)強(qiáng)度差值逐漸減小。圖8 展示了兩種方法在每次實(shí)驗(yàn)中需要的最大飛行路程。 Fig.8 Comparison of the maximum flight distance required by Leader-Follower and self-organizing collaborative methods圖8 Leader-Follower 與自組織協(xié)同方法所需的最大飛行路程對(duì)比 由圖8 可得,本文提出的自組織協(xié)同方法可更快地形成所需的空間結(jié)構(gòu),提高了任務(wù)完成效率。自組織協(xié)同方法平均需要的路程為235.1m,Leader-Follower 方法平均需要的路程為271.3m,相比之下自組織協(xié)同方法減少了13.34%的飛行路程。結(jié)果表明,自組織協(xié)同方法有效提升了空間結(jié)構(gòu)形成效率。 無人機(jī)群可抽象為一個(gè)發(fā)散式的多智能體系統(tǒng),應(yīng)用基于多智能體的自組織協(xié)同方法,各無人機(jī)通過機(jī)間通信鏈路進(jìn)行信息交互,獲取其他無人機(jī)所在位置的信號(hào)強(qiáng)度,并根據(jù)三邊極差收斂算法自主選擇最佳飛行方向,快速形成各無人機(jī)到目標(biāo)點(diǎn)距離相等的空間結(jié)構(gòu)。經(jīng)過模擬實(shí)驗(yàn)驗(yàn)證,該算法相比Leader-Follower 方法,最大飛行路程減少了13.34%,有效提升了空間結(jié)構(gòu)形成效率。 下一步將在該方法基礎(chǔ)上繼續(xù)進(jìn)行擴(kuò)展研究,包括以下幾個(gè)研究方向:①將無人機(jī)群自組織協(xié)同方法應(yīng)用于真實(shí)無人機(jī)及實(shí)際環(huán)境中,驗(yàn)證自組織協(xié)同方法的高效性;②研究當(dāng)某架無人機(jī)發(fā)生故障時(shí),如何協(xié)調(diào)其他可用無人機(jī)配合繼續(xù)完成任務(wù);③研究如何使用多無人機(jī)同時(shí)協(xié)同對(duì)多個(gè)目標(biāo)進(jìn)行定位。4 實(shí)驗(yàn)與分析
4.1 實(shí)驗(yàn)設(shè)計(jì)
4.2 結(jié)果分析
5 結(jié)語(yǔ)