張旭 賈磊磊 李玲
[摘要]多機(jī)器人追捕一逃跑問題一直是人工智能研究的一個(gè)典型問題。當(dāng)存在多個(gè)機(jī)器人時(shí),他們可以通過實(shí)時(shí)通信和協(xié)商來提高追捕效率,即機(jī)器人協(xié)調(diào)合作問題。因此,多機(jī)器人圍捕問題具有一定的代表性,已成為目前研究多個(gè)智能體合作與協(xié)調(diào)系統(tǒng)的理想研究平臺(tái)。本文通過對(duì)多機(jī)器人圍捕問題的研究與分析,采用模糊控制的圍捕協(xié)調(diào)策略,成功的完成了圍捕任務(wù)。
[關(guān)鍵詞]多機(jī)器人;圍捕;模糊控制;協(xié)調(diào)策略
0引言
近年來,多機(jī)器人系統(tǒng)研究因其自身的復(fù)雜性和并行性,以及廣泛的應(yīng)用領(lǐng)域,受到越來越多專家和學(xué)者的關(guān)注。多機(jī)器人協(xié)調(diào)與對(duì)抗是多機(jī)器人系統(tǒng)研究中的基本問題,而多機(jī)器人圍捕問題是多機(jī)器人系統(tǒng)研究的一個(gè)典型問題。隨著機(jī)器人技術(shù)的不斷發(fā)展。多機(jī)器人系統(tǒng)的研究成果已經(jīng)廣泛應(yīng)用于工業(yè)、航天、軍事和民用服務(wù)業(yè)等各個(gè)領(lǐng)域。多機(jī)器人圍捕是指在多機(jī)器人追捕過程中,不僅要順利完成追逃任務(wù),同時(shí)在特定的條件下保持一定的追捕隊(duì)形實(shí)現(xiàn)最終的一種“包圍”狀態(tài)Ⅲ。能夠有效應(yīng)用于多機(jī)器人圍捕問題的協(xié)調(diào)策略,經(jīng)過簡(jiǎn)化后同樣能夠適用于一般的追捕任務(wù)。因此,本文主要針對(duì)多機(jī)器人圍捕問題的協(xié)調(diào)策略進(jìn)行分析研究,更加具有典型的意義。
本文主要討論的多機(jī)器人圍捕問題是基于局部信息感知的,即在追捕過程中,雙方并不能完全感知周圍的所有信息。因?yàn)樵趯?shí)際應(yīng)用中,追逃雙方往往不能完全探測(cè)到周圍的復(fù)雜地形以及對(duì)抗雙方的實(shí)時(shí)位置信息。
1基于虛擬力預(yù)測(cè)的逃逸機(jī)器人策略
文中主要討論多機(jī)器人圍捕單機(jī)器人的策略分析問題,對(duì)于單個(gè)逃逸者而言,在速度固定的情況下,需要躲避所有的追捕者以防止被圍捕,因此只需要討論對(duì)抗策略,不涉及自身的協(xié)調(diào)問題。根據(jù)圖1分析可知,距離逃逸者最近的追捕者pk對(duì)逃逸者的威脅最大,反之距離越遠(yuǎn)的追捕者對(duì)逃逸者的威脅越小。根據(jù)每個(gè)追捕者與逃跑者的位置距離的遠(yuǎn)近,設(shè)置反比例權(quán)系數(shù),對(duì)于逃逸者當(dāng)前的虛擬目標(biāo)點(diǎn)預(yù)測(cè)計(jì)算如圖1所示。
根據(jù)傳感器反饋的位置信息,找出距離逃逸者最遠(yuǎn)的追捕者i,其距離逃逸者的距離設(shè)為depi,令它對(duì)逃逸者的威脅系數(shù)設(shè)為λd,即距離最大的追捕者相對(duì)于逃逸者的反矢量距離,則其他追捕者對(duì)逃逸者的威脅分別取為(仿真中令λd=3):
(1)
(2)
則求得逃逸者到虛擬目標(biāo)的矢量為:
(3)
由式(3)結(jié)合當(dāng)前逃逸者的位置可得到逃逸者的虛擬目標(biāo)點(diǎn)pgoal。若最終無法找到合適的逃逸者的虛擬目標(biāo)點(diǎn),即沒有可以選擇的可行方向,或者逃逸機(jī)器人與每個(gè)追捕機(jī)器人之間的距離均小于某一確定閾值時(shí),則圍捕任務(wù)結(jié)束。
2基于模糊控制的追捕機(jī)器人協(xié)調(diào)策略
模糊集合理論的概念是L.A.Zadeh教授在1965年在Information&Control雜志中首次提出,隨后得到了不斷的擴(kuò)展與完善,逐漸由數(shù)學(xué)領(lǐng)域應(yīng)用推廣到工業(yè)及信息等領(lǐng)域的應(yīng)用。模糊邏輯控制就是在模糊集合的應(yīng)用與發(fā)展中提出的一個(gè)新的分析方法及控制策略。
在本文中。假設(shè)一共有三個(gè)圍捕機(jī)器人。通過模糊邏輯進(jìn)行分析,對(duì)每一個(gè)追捕機(jī)器人的每一步運(yùn)動(dòng)方向及夾角進(jìn)行控制,通過實(shí)時(shí)在線檢測(cè)。每一步確定距離逃逸者最近的追捕機(jī)器人為pk,距離最近的追捕機(jī)器人在追捕過程中直接奔向逃跑者的下一步的虛擬目標(biāo)點(diǎn)。此時(shí)對(duì)于追捕機(jī)器人pk而言,其每一步的追捕效率是最高的。對(duì)于其它兩個(gè)距離逃逸者較遠(yuǎn)的追捕機(jī)器人,采用模糊邏輯控制,來確定其每一步的運(yùn)動(dòng)方向。即對(duì)于除pk以外的兩個(gè)追捕機(jī)器人,輸入為每一個(gè)追捕機(jī)器人與pk的夾角大小,輸出為追捕機(jī)器人的追捕運(yùn)動(dòng)的方向角。以逃跑機(jī)器人為中心,實(shí)時(shí)檢測(cè)任意一個(gè)追捕機(jī)器人與pk的夾角大小θ1(θ1是指追捕機(jī)器人與p。之間較小的小于180~的夾角)。將θ1量化為三個(gè)論域(0°,90°),(60°,120°),(90°,180°),并按照一定的隸屬度關(guān)系使論域與模糊變量{?。╯),中(M),大(L)}湘對(duì)應(yīng)。
進(jìn)一步的,通過解模糊來確定兩個(gè)追捕機(jī)器人每一步的運(yùn)動(dòng)方向及夾角θ2。將θ2量化為三個(gè)論域:(擴(kuò)大與pk夾角即反向旋轉(zhuǎn)60°),(不旋轉(zhuǎn)即保持原有運(yùn)動(dòng)方向)和(縮小與pk夾角即正向旋轉(zhuǎn)60°),并按照一定的隸屬度關(guān)系使該論域與模糊變量的三個(gè)語言取值{F,Z,N}相對(duì)應(yīng)。
三個(gè)追捕者最終的運(yùn)動(dòng)狀態(tài)為追上逃跑者,同時(shí)呈120°夾角包圍逃跑者的狀態(tài),此時(shí)追捕任務(wù)結(jié)束。
模糊控制規(guī)則如下:
規(guī)則1:if θ1 is S then θ2 is F;
規(guī)則2:if θ1 is M then θ2 is Z;
規(guī)則3:if θ1 is L then θ2 is N……
3確定障礙物環(huán)境中機(jī)器人運(yùn)動(dòng)方向
本文仿真環(huán)境為mobotsim軟件,該軟件包含傳感器信息,可以自由定義傳感器個(gè)數(shù)。本文在分析研究過程中,選擇傳感器的個(gè)數(shù)為三個(gè),設(shè)定傳感器的有效范圍為三米。當(dāng)傳感器的當(dāng)前測(cè)量返回值為3時(shí),說明此傳感器探測(cè)到障礙物的距離為3m或當(dāng)前狀態(tài)下障礙物相距相對(duì)較遠(yuǎn)沒有探測(cè)到障礙物,因此默認(rèn)3m以外的障礙物對(duì)機(jī)器人的影響忽略不計(jì)。
根據(jù)當(dāng)前追捕機(jī)器人與逃逸機(jī)器人分別的傳感器輸入測(cè)量值的大小,按照一定的比例,對(duì)避障行為與追逃雙方根據(jù)圍捕策略確定的運(yùn)動(dòng)方向進(jìn)行矢量和計(jì)算,最后確定各個(gè)追逃機(jī)器人的每一步的最終運(yùn)動(dòng)方向,
根據(jù)“木桶原理”,對(duì)于任意一個(gè)機(jī)器人的三個(gè)傳感器輸入值,找出其最小值設(shè)為λmin,λmin∈(0,3m)。根據(jù)λmin值的大小,進(jìn)而分別確定圍捕任務(wù)時(shí)目標(biāo)策略與避障策略的權(quán)系數(shù)ω1和ω2,其中ω1+ω2=1。當(dāng)λmin∈(0,1)時(shí),ω1取值為0.2,ω2取值為0.8;當(dāng)λmin∈[1,2]時(shí),ω1取值為0.4,ω2取值為0.6;當(dāng)λmin∈(2,3)時(shí),ω1取值為0.8,ω2取值為0.2。設(shè)任意時(shí)刻機(jī)器人根據(jù)目標(biāo)選擇運(yùn)動(dòng)方向的轉(zhuǎn)角為θF,避障策略的轉(zhuǎn)角為θZ,則機(jī)器人每一步最終的運(yùn)動(dòng)方向角θ為:
θ=ω1θF-ω2θZ (4)
4設(shè)置追捕者優(yōu)先級(jí)
在圍捕過程中,若追捕機(jī)器人追捕速度遠(yuǎn)大于逃逸者的速度,或者多個(gè)機(jī)器人運(yùn)動(dòng)到障礙物較復(fù)雜且距離較近區(qū)域時(shí),根據(jù)當(dāng)前的策略選擇運(yùn)動(dòng)方向后,由于追捕機(jī)器人之間的互相影響,可能會(huì)導(dǎo)致兩個(gè)追捕者停滯運(yùn)動(dòng)而導(dǎo)致最終的圍捕失敗的結(jié)果。由于傳感器的感應(yīng)范圍限制在0到3m之間,因此當(dāng)機(jī)器人的運(yùn)動(dòng)速度過大時(shí),可能會(huì)造成雙方位置距離較小的狀態(tài),或是此時(shí)若兩邊存在類似對(duì)稱的障礙物,則可能陷入局部極小永遠(yuǎn)無法繼續(xù)運(yùn)動(dòng)。而且,當(dāng)機(jī)器人的速度過大時(shí),對(duì)仿真的有效性驗(yàn)證也有影響,且在一定程度上會(huì)影響避障和路徑選擇策略的效果。因此本文在仿真時(shí)選擇比較接近的追逃機(jī)器人速度,即盡量保證追捕者與逃逸者在速度上不存在優(yōu)劣,以便更加直觀有效的對(duì)追逃協(xié)調(diào)策略的性能進(jìn)行驗(yàn)證。
同時(shí),在多機(jī)器人圍捕過程中,對(duì)追捕機(jī)器人分別設(shè)置優(yōu)先級(jí)別,設(shè)RI>R2>R3(1、2、3為仿真中機(jī)器人的編號(hào)),即1號(hào)追捕機(jī)器人優(yōu)先級(jí)最高,3號(hào)優(yōu)先級(jí)最小。若是出現(xiàn)了上述可能的陷入局部運(yùn)動(dòng)失敗的情況,根據(jù)優(yōu)先級(jí)判斷,優(yōu)先級(jí)別高的機(jī)器人根據(jù)當(dāng)前策略繼續(xù)前進(jìn),優(yōu)先級(jí)別較低的機(jī)器人稍作停頓,等待下一周期策略選擇后再繼續(xù)運(yùn)動(dòng),這樣就能夠在不影響策略整體效果的情況下及時(shí)的轉(zhuǎn)化僵局保證圍捕任務(wù)的順利進(jìn)行。
5仿真實(shí)驗(yàn)
本文的仿真環(huán)境為mobotsim移動(dòng)機(jī)器人仿真軟件,仿真環(huán)境為用網(wǎng)格表示的二維坐標(biāo)平面,其中一個(gè)單位網(wǎng)格表示實(shí)際lm的距離。除初始位置不同外,各個(gè)機(jī)器人的其它性能參數(shù)均相同,即追捕機(jī)器人與逃逸機(jī)器人分別具有相同的傳感器探測(cè)范圍,大小體積相等。
基于模糊控制的多機(jī)器人圍捕仿真結(jié)果如圖3所示。由圖可知,仿真結(jié)果達(dá)到了良好的協(xié)調(diào)圍捕效果,同時(shí)驗(yàn)證了本文中所研究圍捕策略的有效性及穩(wěn)定性。
[責(zé)任編輯:楊玉潔]