亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于模糊與虛擬力預(yù)測(cè)的多機(jī)器人圍捕問題研究

2017-05-18 15:23:40張旭賈磊磊李玲

科技視界 2016年19期

關(guān)鍵詞：模糊控制

張旭　賈磊磊　李玲

[摘要]多機(jī)器人追捕一逃跑問題一直是人工智能研究的一個(gè)典型問題。當(dāng)存在多個(gè)機(jī)器人時(shí)，他們可以通過實(shí)時(shí)通信和協(xié)商來提高追捕效率，即機(jī)器人協(xié)調(diào)合作問題。因此，多機(jī)器人圍捕問題具有一定的代表性，已成為目前研究多個(gè)智能體合作與協(xié)調(diào)系統(tǒng)的理想研究平臺(tái)。本文通過對(duì)多機(jī)器人圍捕問題的研究與分析，采用模糊控制的圍捕協(xié)調(diào)策略，成功的完成了圍捕任務(wù)。

[關(guān)鍵詞]多機(jī)器人；圍捕；模糊控制；協(xié)調(diào)策略

0引言

近年來，多機(jī)器人系統(tǒng)研究因其自身的復(fù)雜性和并行性，以及廣泛的應(yīng)用領(lǐng)域，受到越來越多專家和學(xué)者的關(guān)注。多機(jī)器人協(xié)調(diào)與對(duì)抗是多機(jī)器人系統(tǒng)研究中的基本問題，而多機(jī)器人圍捕問題是多機(jī)器人系統(tǒng)研究的一個(gè)典型問題。隨著機(jī)器人技術(shù)的不斷發(fā)展。多機(jī)器人系統(tǒng)的研究成果已經(jīng)廣泛應(yīng)用于工業(yè)、航天、軍事和民用服務(wù)業(yè)等各個(gè)領(lǐng)域。多機(jī)器人圍捕是指在多機(jī)器人追捕過程中，不僅要順利完成追逃任務(wù)，同時(shí)在特定的條件下保持一定的追捕隊(duì)形實(shí)現(xiàn)最終的一種“包圍”狀態(tài)Ⅲ。能夠有效應(yīng)用于多機(jī)器人圍捕問題的協(xié)調(diào)策略，經(jīng)過簡(jiǎn)化后同樣能夠適用于一般的追捕任務(wù)。因此，本文主要針對(duì)多機(jī)器人圍捕問題的協(xié)調(diào)策略進(jìn)行分析研究，更加具有典型的意義。

本文主要討論的多機(jī)器人圍捕問題是基于局部信息感知的，即在追捕過程中，雙方并不能完全感知周圍的所有信息。因?yàn)樵趯?shí)際應(yīng)用中，追逃雙方往往不能完全探測(cè)到周圍的復(fù)雜地形以及對(duì)抗雙方的實(shí)時(shí)位置信息。

1基于虛擬力預(yù)測(cè)的逃逸機(jī)器人策略

文中主要討論多機(jī)器人圍捕單機(jī)器人的策略分析問題，對(duì)于單個(gè)逃逸者而言，在速度固定的情況下，需要躲避所有的追捕者以防止被圍捕，因此只需要討論對(duì)抗策略，不涉及自身的協(xié)調(diào)問題。根據(jù)圖1分析可知，距離逃逸者最近的追捕者p_k對(duì)逃逸者的威脅最大，反之距離越遠(yuǎn)的追捕者對(duì)逃逸者的威脅越小。根據(jù)每個(gè)追捕者與逃跑者的位置距離的遠(yuǎn)近，設(shè)置反比例權(quán)系數(shù)，對(duì)于逃逸者當(dāng)前的虛擬目標(biāo)點(diǎn)預(yù)測(cè)計(jì)算如圖1所示。

根據(jù)傳感器反饋的位置信息，找出距離逃逸者最遠(yuǎn)的追捕者i，其距離逃逸者的距離設(shè)為d_{ep_i}，令它對(duì)逃逸者的威脅系數(shù)設(shè)為λ_d，即距離最大的追捕者相對(duì)于逃逸者的反矢量距離，則其他追捕者對(duì)逃逸者的威脅分別取為（仿真中令λ_d=3）：

（1）

（2）

則求得逃逸者到虛擬目標(biāo)的矢量為：

（3）

由式（3）結(jié)合當(dāng)前逃逸者的位置可得到逃逸者的虛擬目標(biāo)點(diǎn)p_goal。若最終無法找到合適的逃逸者的虛擬目標(biāo)點(diǎn)，即沒有可以選擇的可行方向，或者逃逸機(jī)器人與每個(gè)追捕機(jī)器人之間的距離均小于某一確定閾值時(shí)，則圍捕任務(wù)結(jié)束。

2基于模糊控制的追捕機(jī)器人協(xié)調(diào)策略

模糊集合理論的概念是L.A.Zadeh教授在1965年在Information&Control雜志中首次提出，隨后得到了不斷的擴(kuò)展與完善，逐漸由數(shù)學(xué)領(lǐng)域應(yīng)用推廣到工業(yè)及信息等領(lǐng)域的應(yīng)用。模糊邏輯控制就是在模糊集合的應(yīng)用與發(fā)展中提出的一個(gè)新的分析方法及控制策略。

在本文中。假設(shè)一共有三個(gè)圍捕機(jī)器人。通過模糊邏輯進(jìn)行分析，對(duì)每一個(gè)追捕機(jī)器人的每一步運(yùn)動(dòng)方向及夾角進(jìn)行控制，通過實(shí)時(shí)在線檢測(cè)。每一步確定距離逃逸者最近的追捕機(jī)器人為p_k，距離最近的追捕機(jī)器人在追捕過程中直接奔向逃跑者的下一步的虛擬目標(biāo)點(diǎn)。此時(shí)對(duì)于追捕機(jī)器人p_k而言，其每一步的追捕效率是最高的。對(duì)于其它兩個(gè)距離逃逸者較遠(yuǎn)的追捕機(jī)器人，采用模糊邏輯控制，來確定其每一步的運(yùn)動(dòng)方向。即對(duì)于除p_k以外的兩個(gè)追捕機(jī)器人，輸入為每一個(gè)追捕機(jī)器人與p_k的夾角大小，輸出為追捕機(jī)器人的追捕運(yùn)動(dòng)的方向角。以逃跑機(jī)器人為中心，實(shí)時(shí)檢測(cè)任意一個(gè)追捕機(jī)器人與p_k的夾角大小θ₁（θ₁是指追捕機(jī)器人與p。之間較小的小于180～的夾角）。將θ₁量化為三個(gè)論域（0°，90°），（60°，120°），（90°，180°），并按照一定的隸屬度關(guān)系使論域與模糊變量{?。╯），中（M），大（L）}湘對(duì)應(yīng)。

進(jìn)一步的，通過解模糊來確定兩個(gè)追捕機(jī)器人每一步的運(yùn)動(dòng)方向及夾角θ₂。將θ₂量化為三個(gè)論域：（擴(kuò)大與p_k夾角即反向旋轉(zhuǎn)60°），（不旋轉(zhuǎn)即保持原有運(yùn)動(dòng)方向）和（縮小與p_k夾角即正向旋轉(zhuǎn)60°），并按照一定的隸屬度關(guān)系使該論域與模糊變量的三個(gè)語言取值{F，Z，N}相對(duì)應(yīng)。

三個(gè)追捕者最終的運(yùn)動(dòng)狀態(tài)為追上逃跑者，同時(shí)呈120°夾角包圍逃跑者的狀態(tài)，此時(shí)追捕任務(wù)結(jié)束。

模糊控制規(guī)則如下：

規(guī)則1：if θ₁ is S then θ₂ is F；

規(guī)則2：if θ₁ is M then θ₂ is Z；

規(guī)則3：if θ₁ is L then θ₂ is N……

3確定障礙物環(huán)境中機(jī)器人運(yùn)動(dòng)方向

本文仿真環(huán)境為mobotsim軟件，該軟件包含傳感器信息，可以自由定義傳感器個(gè)數(shù)。本文在分析研究過程中，選擇傳感器的個(gè)數(shù)為三個(gè)，設(shè)定傳感器的有效范圍為三米。當(dāng)傳感器的當(dāng)前測(cè)量返回值為3時(shí)，說明此傳感器探測(cè)到障礙物的距離為3m或當(dāng)前狀態(tài)下障礙物相距相對(duì)較遠(yuǎn)沒有探測(cè)到障礙物，因此默認(rèn)3m以外的障礙物對(duì)機(jī)器人的影響忽略不計(jì)。

根據(jù)當(dāng)前追捕機(jī)器人與逃逸機(jī)器人分別的傳感器輸入測(cè)量值的大小，按照一定的比例，對(duì)避障行為與追逃雙方根據(jù)圍捕策略確定的運(yùn)動(dòng)方向進(jìn)行矢量和計(jì)算，最后確定各個(gè)追逃機(jī)器人的每一步的最終運(yùn)動(dòng)方向，

根據(jù)“木桶原理”，對(duì)于任意一個(gè)機(jī)器人的三個(gè)傳感器輸入值，找出其最小值設(shè)為λ_min，λ_min∈（0，3m）。根據(jù)λ_min值的大小，進(jìn)而分別確定圍捕任務(wù)時(shí)目標(biāo)策略與避障策略的權(quán)系數(shù)ω₁和ω₂，其中ω₁+ω₂=1。當(dāng)λ_min∈（0，1）時(shí)，ω₁取值為0.2，ω₂取值為0.8；當(dāng)λ_min∈[1，2]時(shí)，ω₁取值為0.4，ω₂取值為0.6；當(dāng)λ_min∈（2，3）時(shí)，ω₁取值為0.8，ω₂取值為0.2。設(shè)任意時(shí)刻機(jī)器人根據(jù)目標(biāo)選擇運(yùn)動(dòng)方向的轉(zhuǎn)角為θ_F，避障策略的轉(zhuǎn)角為θ_Z，則機(jī)器人每一步最終的運(yùn)動(dòng)方向角θ為：

θ=ω₁θ_F-ω₂θ_Z （4）

4設(shè)置追捕者優(yōu)先級(jí)

在圍捕過程中，若追捕機(jī)器人追捕速度遠(yuǎn)大于逃逸者的速度，或者多個(gè)機(jī)器人運(yùn)動(dòng)到障礙物較復(fù)雜且距離較近區(qū)域時(shí)，根據(jù)當(dāng)前的策略選擇運(yùn)動(dòng)方向后，由于追捕機(jī)器人之間的互相影響，可能會(huì)導(dǎo)致兩個(gè)追捕者停滯運(yùn)動(dòng)而導(dǎo)致最終的圍捕失敗的結(jié)果。由于傳感器的感應(yīng)范圍限制在0到3m之間，因此當(dāng)機(jī)器人的運(yùn)動(dòng)速度過大時(shí)，可能會(huì)造成雙方位置距離較小的狀態(tài)，或是此時(shí)若兩邊存在類似對(duì)稱的障礙物，則可能陷入局部極小永遠(yuǎn)無法繼續(xù)運(yùn)動(dòng)。而且，當(dāng)機(jī)器人的速度過大時(shí)，對(duì)仿真的有效性驗(yàn)證也有影響，且在一定程度上會(huì)影響避障和路徑選擇策略的效果。因此本文在仿真時(shí)選擇比較接近的追逃機(jī)器人速度，即盡量保證追捕者與逃逸者在速度上不存在優(yōu)劣，以便更加直觀有效的對(duì)追逃協(xié)調(diào)策略的性能進(jìn)行驗(yàn)證。

同時(shí)，在多機(jī)器人圍捕過程中，對(duì)追捕機(jī)器人分別設(shè)置優(yōu)先級(jí)別，設(shè)RI>R2>R3（1、2、3為仿真中機(jī)器人的編號(hào)），即1號(hào)追捕機(jī)器人優(yōu)先級(jí)最高，3號(hào)優(yōu)先級(jí)最小。若是出現(xiàn)了上述可能的陷入局部運(yùn)動(dòng)失敗的情況，根據(jù)優(yōu)先級(jí)判斷，優(yōu)先級(jí)別高的機(jī)器人根據(jù)當(dāng)前策略繼續(xù)前進(jìn)，優(yōu)先級(jí)別較低的機(jī)器人稍作停頓，等待下一周期策略選擇后再繼續(xù)運(yùn)動(dòng)，這樣就能夠在不影響策略整體效果的情況下及時(shí)的轉(zhuǎn)化僵局保證圍捕任務(wù)的順利進(jìn)行。

5仿真實(shí)驗(yàn)

本文的仿真環(huán)境為mobotsim移動(dòng)機(jī)器人仿真軟件，仿真環(huán)境為用網(wǎng)格表示的二維坐標(biāo)平面，其中一個(gè)單位網(wǎng)格表示實(shí)際lm的距離。除初始位置不同外，各個(gè)機(jī)器人的其它性能參數(shù)均相同，即追捕機(jī)器人與逃逸機(jī)器人分別具有相同的傳感器探測(cè)范圍，大小體積相等。

基于模糊控制的多機(jī)器人圍捕仿真結(jié)果如圖3所示。由圖可知，仿真結(jié)果達(dá)到了良好的協(xié)調(diào)圍捕效果，同時(shí)驗(yàn)證了本文中所研究圍捕策略的有效性及穩(wěn)定性。

[責(zé)任編輯：楊玉潔]