高子璇,張國富,2,3,4,蘇兆品,2,3,4,李 磊
(1.合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 合肥 230601;2.大數(shù)據(jù)知識工程教育部重點(diǎn)實(shí)驗(yàn)室(合肥工業(yè)大學(xué)),安徽 合肥 230601;3.智能互聯(lián)系統(tǒng)安徽省實(shí)驗(yàn)室(合肥工業(yè)大學(xué)),安徽 合肥 230009;4.工業(yè)安全應(yīng)急技術(shù)安徽省重點(diǎn)實(shí)驗(yàn)室(合肥工業(yè)大學(xué)),安徽 合肥 230601)
隨著機(jī)器人在軍事、工業(yè)領(lǐng)域中的應(yīng)用,機(jī)器人追逃問題[1-2]已成為人工智能和機(jī)器人領(lǐng)域中的研究熱點(diǎn)之一,其研究類型主要分為對單逃逸者的追逃問題和對多逃逸者的追逃問題。自Isaacs[3]為兩個(gè)參與者制定追逃策略以來,對單追捕-單逃逸者之間的博弈進(jìn)行了詳細(xì)的研究。單追捕-單逃逸者的情況是一個(gè)零和博弈,可以用著名的貝爾曼方程[4]的擴(kuò)展來解決。Jia等[5]提出用連續(xù)時(shí)間馬爾可夫決策過程(CTMDP)來解決一個(gè)追擊者和一個(gè)逃逸者的追逃問題中的不確定性。Pan等[6]提出了一種基于區(qū)域的中繼追擊方案,在追捕的過程中可以更換主動追擊者,來使追擊時(shí)間縮短。Kokolakis等[7]提出了一種基于關(guān)鍵強(qiáng)化學(xué)習(xí)(RL)的算法用于在線學(xué)習(xí),并在有限時(shí)間內(nèi)學(xué)習(xí)追擊策略,從而實(shí)現(xiàn)對逃逸者的有限時(shí)間捕獲。
在多追捕-單逃逸者的追逃問題中,Lin等[8]研究了一類線性二次多追捕-單逃逸者微分對策,逃逸者實(shí)施傳統(tǒng)的反饋納什策略,而追捕者基于最佳可實(shí)現(xiàn)性能指標(biāo)的新概念實(shí)施納什策略。Kumkov等[9]為對象組的沖突互動制定了特殊的公式和方法來解決對象太多時(shí)相位向量的維數(shù)很高時(shí)帶來的困難。
近年來,現(xiàn)代交互多智能體系統(tǒng)推動了對多追捕-多逃逸者追逃問題的研究,該研究涉及到圍捕任務(wù)的分配,主要解決如何分配若干個(gè)機(jī)器人進(jìn)行協(xié)同圍捕逃逸者的問題。圍捕機(jī)器人在障礙物環(huán)境下的實(shí)時(shí)移動大多采用人工勢場法[10]等來確定。在多追捕-多逃逸者的追逃問題的研究中,Stipanovic等[11]通過將水平集函數(shù)定義為玩家的目標(biāo)來確定確保捕獲或規(guī)避的條件,提供了一種在具有多個(gè)參與者的追逃游戲中設(shè)計(jì)保證捕獲或保證規(guī)避策略的方法。胡俊和朱慶保[12]為圍捕任務(wù)的分配設(shè)計(jì)了一種“協(xié)商分配法”,李瑞珍[13]沿用了“協(xié)商分配法”并應(yīng)用于全方位的圍捕系統(tǒng)中,但并沒有在逃逸機(jī)器人數(shù)量較多的情境下進(jìn)行更深入的實(shí)驗(yàn)與研究。徐望寶等[14-15]提出了一種基于人工力矩的自組織圍捕方法,并設(shè)計(jì)了一種圍捕機(jī)器人吸引點(diǎn)基于局部信息的確定與調(diào)整方法;文獻(xiàn)[16]提出了一種鏈陣方法,計(jì)算復(fù)雜度高,圍捕團(tuán)隊(duì)數(shù)目可以不相同并且可以隨時(shí)加入或退出,在圍捕者改變圍捕目標(biāo)后,圍捕效率不夠理想。高曉陽[17]提出了一種分配原則,使圍捕機(jī)器人依次選擇離自己最近的圍捕點(diǎn),喪失了對所有機(jī)器人一視同仁的公平性。張紅強(qiáng)等[18]提出了一種基于圍捕者面對多目標(biāo)中心方向180度范圍內(nèi)的兩最近鄰進(jìn)行任務(wù)分配的分配方法,減少運(yùn)動距離和能量消耗。
Lopez等[19]設(shè)計(jì)了一種規(guī)則,圍捕者先選擇距離自己最近的圍捕點(diǎn),如果兩個(gè)圍捕者有相同的最接近的逃逸者,將距離最短的圍捕者的目標(biāo)更改為其第二個(gè)最近的逃逸者,可以解決任務(wù)分配沖突的問題。陳銘治和朱大奇[20]將每個(gè)圍捕者到逃逸者的預(yù)估時(shí)間編為矩陣,根據(jù)圍捕一個(gè)逃逸者所需圍捕者的數(shù)目計(jì)算該逃逸者被圍捕所需的最短總時(shí)間,圍捕者優(yōu)先圍捕具有最小預(yù)估時(shí)間的逃逸者。
需要指出的是,上述已有研究大都采用距離優(yōu)先分配的策略,在逃逸者數(shù)量較多的情況下,難以實(shí)現(xiàn)圍捕任務(wù)的均衡分配,降低了系統(tǒng)圍捕的效率。為此,該文在總結(jié)和分析前人工作的基礎(chǔ)上,構(gòu)建了一種全方向的群機(jī)器人逃逸圍捕任務(wù)分配數(shù)學(xué)模型,然后基于遺傳算法和多種群協(xié)同進(jìn)化提出了一種多逃逸者圍捕任務(wù)分配算法,設(shè)計(jì)了相應(yīng)的編碼方式、交叉和變異策略。最后,在開發(fā)的群機(jī)器人逃逸圍捕仿真平臺上測試了算法的有效性。
群機(jī)器人多逃逸者圍捕問題設(shè)定在二維受限環(huán)境,有m個(gè)圍捕機(jī)器人,用Q={q1,q2,…,qm}表示;有n個(gè)逃逸機(jī)器人,用P={p1,p2,…,pn}表示。對每個(gè)逃逸機(jī)器人pi(i=1,2,…,n),存在一個(gè)以逃逸者當(dāng)前位置為中心,感知距離r為半徑建立的安全域,如圖1所示。在安全域邊界上設(shè)定e個(gè)均勻分布的圍捕點(diǎn),每個(gè)圍捕點(diǎn)由一個(gè)圍捕機(jī)器人完成,當(dāng)該逃逸機(jī)器人周圍的所有圍捕點(diǎn)均被圍捕機(jī)器人占領(lǐng)時(shí),認(rèn)為該逃逸機(jī)器人被圍捕成功,所有逃逸機(jī)器人均被圍捕成功時(shí),停止追逃行為,判定群機(jī)器人圍捕系統(tǒng)圍捕成功。
圖1 安全域及Fk示意圖
將每一個(gè)逃逸機(jī)器人看作一個(gè)圍捕任務(wù),則共有n個(gè)任務(wù),設(shè)任務(wù)集為S={S1,S2,…,Sn},由圖1可知,每個(gè)任務(wù)由e個(gè)圍捕者共同完成。則圍捕點(diǎn)的集合為{Si1,Si2,…,Sie},即任務(wù)Si對應(yīng)圍捕點(diǎn)集合{Si1,Si2,…,Sie}。
假設(shè)圍捕機(jī)器人qk(k=1,2,…,m)所對應(yīng)的圍捕點(diǎn)為Sij(i=1,2,…,n;j=1,2,…,e),qk到Sij的距離Fk如圖1所示,并表示為公式1。
(1)
其中,(xk,yk),(xij,yij)分別為圍捕機(jī)器人qk和對應(yīng)圍捕點(diǎn)Sij在地圖中對應(yīng)的坐標(biāo)。
該文設(shè)計(jì)了一種基于多種群協(xié)同進(jìn)化遺傳算法來求解群機(jī)器人多逃逸者圍捕任務(wù)的分配問題。為了保持種群的多樣性,先初始化生成D個(gè)不同的編碼組合,在每個(gè)組合里再將任務(wù)集合S進(jìn)行合適的分組,一組代表一個(gè)種群,通過多種群協(xié)同進(jìn)化的方式得到最終的分配方案,算法流程如圖2所示。
圖2 基于多種群協(xié)同進(jìn)化的任務(wù)分配算法流程
多種群協(xié)同進(jìn)化遺傳算法的過程如下:
(1)隨機(jī)生成D個(gè)不同的編碼組合,在這些組合里,任務(wù)集順序保持一致,圍捕者集合的順序隨機(jī)生成。
(2)將每一個(gè)組合中的編碼按同樣的分組方式對編碼進(jìn)行劃分分組,來保持合適的編碼長度。
(3)分組后的每一組為一個(gè)獨(dú)立的種群,每個(gè)種群同時(shí)進(jìn)行各自的初始化和交叉、變異、選擇等操作。
(4)將每個(gè)種群選擇的最優(yōu)解按分組順序進(jìn)行組合,得到最終解。
(5)每個(gè)組合均可得到一個(gè)最終解,再選擇D個(gè)組合中的最優(yōu)解作為文中算法所得到的分配方案。該分配方案的適應(yīng)度函數(shù)值的大小即為本次算法最終得到的目標(biāo)函數(shù)值。
第h(h=1,2,…,L)組的個(gè)體編碼如圖3所示,每一個(gè)編碼表示種群中的一個(gè)個(gè)體。第一行表示任務(wù)Sha(a=1,2,…,w),第二行表示圍捕者qhb(b=1,2,…,ew)。
圖3 第h組個(gè)體編碼示意圖
Sha(a=1,2,…,w)為任務(wù)集S中按順序排序分配到各組中的任務(wù),qhb(b=1,2,…,ew)為圍捕者集合Q中隨機(jī)選取的不重復(fù)圍捕者。所有組的任務(wù)組合起來為一個(gè)完整的任務(wù)集S,所有組的圍捕者組合起來為一個(gè)完整的圍捕者集合Q,如公式2所示。
(2)
每一組的任務(wù)和圍捕者均不會重復(fù),即對L組中任意的兩組h1和h2,都有如下約束條件:
?h1,h2∈{1,2,…,L}{Sh11,Sh12,…,Sh1w}∩{Sh21,Sh22,…,Sh2w}=?
?h1,h2∈{1,2,…,L}{qh11,qh12,…,qh1ew}∩{qh21,qh22,…,qh2ew}=?
(3)
L個(gè)種群相互獨(dú)立,各自進(jìn)行交叉變異選擇的過程,互不干擾。
為了保持種群個(gè)體多樣性,首先生成D個(gè)不同的組合,其中第一行編碼為任務(wù)集S的順序排列,第二行編碼為圍捕者集合Q的隨機(jī)亂序排列。將生成的長序列劃分為L個(gè)任務(wù)組,一組代表一個(gè)種群,每個(gè)種群由第二行編碼的染色體信息形成Z個(gè)不同的個(gè)體,表示圍捕任務(wù)的第一行編碼初始化后保持不變。
圍捕機(jī)器人完成全部圍捕任務(wù)所耗費(fèi)的步長往往由距離圍捕點(diǎn)最遠(yuǎn)的圍捕機(jī)器人所決定,對于群機(jī)器人多逃逸者圍捕的任務(wù)而言,任務(wù)分配的目標(biāo)是使該距離越小越好,因此設(shè)定適應(yīng)度函數(shù)Fit為該編碼個(gè)體中Fk的最大值。
Fit=max(Fk),k=1,2,…,ew
(4)
適應(yīng)度函數(shù)越小,圍捕效果越好,在選擇過程中選擇適應(yīng)度函數(shù)值更小的個(gè)體來進(jìn)行下一次的交叉和變異。
如圖4所示,對每一個(gè)種群中所有個(gè)體各進(jìn)行下述操作:
圖4 交叉示意圖
相鄰兩個(gè)父代個(gè)體兩兩為一組進(jìn)行交叉,每個(gè)父代個(gè)體均選擇頭部作為交叉點(diǎn);
設(shè)定Cr∈[0,1]為交叉概率,c←rand(0,1),若滿足c≤Cr,則在其中的一個(gè)父代個(gè)體中隨機(jī)選中一段基因位,然后插入到另一個(gè)父代個(gè)體的頭部,另一個(gè)父代個(gè)體也選擇相同位置的相同長度的基因段進(jìn)行相同的操作;
按照所需的基因位長度ew從前到后對重復(fù)或多余的基因進(jìn)行剔除。
在文中的編碼方式下,每個(gè)個(gè)體的基因位都是唯一且不可隨意缺失的,只可移動位置。僅用普通的交叉算法使兩個(gè)父代個(gè)體相互交換產(chǎn)生新個(gè)體,會導(dǎo)致個(gè)體中基因位的缺失或重復(fù),因此采用上述交叉模式既可以保證這一編碼特性,又可為種群提供不同的基因位置組合。
對每個(gè)父代個(gè)體和交叉產(chǎn)生的子代個(gè)體進(jìn)行變異操作。以個(gè)體C為例,Cu和Cv分別表示個(gè)體C的第u個(gè)和第v個(gè)基因位,u為個(gè)體中除v以外的隨機(jī)位置,Gr←rand(0,1),g∈[0,1]為變異概率。若滿足g≤Gr,則互換Cu和Cv:
(5)
將初始種群與交叉變異后的進(jìn)化種群組合在一起,按照適應(yīng)度函數(shù)值由小到大進(jìn)行排序,選取Z個(gè)最佳個(gè)體組成新的初始種群繼續(xù)進(jìn)化,達(dá)到所設(shè)定的迭代次數(shù)G時(shí)停止進(jìn)化。這樣,每一代都保留了種群中的優(yōu)良個(gè)體,促使種群持續(xù)探索更好的解。
機(jī)器人圍捕過程如下:
step1:構(gòu)建圍捕地圖環(huán)境,隨機(jī)生成障礙物和各機(jī)器人,相互之間不重合,并獲取位置坐標(biāo)。
step2:根據(jù)逃逸者的坐標(biāo)生成期望圍捕點(diǎn)。
step3:用多種群協(xié)同進(jìn)化遺傳算法選擇最優(yōu)任務(wù)分配策略。
step4:各圍捕機(jī)器人通過人工勢場法確定運(yùn)動方向。
step5:每行走一步,更新各機(jī)器人位置信息。
step6:判斷所有圍捕機(jī)器人是否到達(dá)對應(yīng)的圍捕點(diǎn),若是,則圍捕成功,圍捕結(jié)束;若否,則繼續(xù)進(jìn)行圍捕。
基于Java語言在Windows 10環(huán)境下開發(fā)了一個(gè)群機(jī)器人多逃逸者圍捕仿真平臺,如圖5所示。所有機(jī)器人在二維平面內(nèi)運(yùn)動,撞到邊界則更換運(yùn)動方向,目標(biāo)機(jī)器人的運(yùn)動方向設(shè)為隨機(jī)。目標(biāo)安全域半徑r設(shè)為20,設(shè)定6個(gè)圍捕機(jī)器人圍捕1個(gè)逃逸機(jī)器人。在受限的地圖環(huán)境中,因?yàn)樘右菡哂肋h(yuǎn)逃離不出地圖邊界,因此將圍捕者速度設(shè)為和逃逸者速度相等,設(shè)置所有機(jī)器人的運(yùn)動步長t為4。在設(shè)定好機(jī)器人的初始位置和障礙物的位置后,打開仿真平臺會在界面上顯示每個(gè)個(gè)體的位置,其中小圓形表示圍捕者,小三角形表示逃逸者,障礙物用大圓形和大三角形表示。然后各機(jī)器人開始運(yùn)動,待圍捕完成時(shí),整個(gè)平臺所有個(gè)體暫停運(yùn)動,結(jié)束圍捕。
圖5 仿真平臺中圍捕過程示意圖
以8個(gè)逃逸者為例,來演示仿真平臺從初始化生成到全部圍捕任務(wù)結(jié)束的過程,即n=8,m=48。障礙物個(gè)數(shù)設(shè)為10,隨機(jī)生成在地圖中,并不與機(jī)器人位置重合。其中圓形障礙物5個(gè),三角形障礙物5個(gè)。當(dāng)所有逃逸機(jī)器人均被圍住時(shí),所有機(jī)器人才停止運(yùn)動,圍捕結(jié)束,圍捕過程如圖5所示。
為了驗(yàn)證所提算法的有效性,結(jié)合第三節(jié)中的仿真平臺,首先給出初始參數(shù)設(shè)置,然后對比分析所提算法在目標(biāo)函數(shù)上的優(yōu)勢,最后將設(shè)計(jì)的多種群協(xié)同優(yōu)化遺傳算法與算法1和算法2進(jìn)行深入的對比分析。
對于多種群協(xié)同優(yōu)化算法而言,不同參數(shù)的選取對其效果有著至關(guān)重要的影響。選取逃逸者數(shù)量n為16,且每組實(shí)驗(yàn)都保證除所要探求的參數(shù)不同,其他完全相同,每組均做30組實(shí)驗(yàn)求取目標(biāo)函數(shù)平均值。表1表示每組任務(wù)數(shù)w、種群個(gè)體數(shù)Z和初始化時(shí)生成的編碼組合數(shù)D對實(shí)驗(yàn)結(jié)果的影響,表2表示交叉概率Cr、變異概率Gr對實(shí)驗(yàn)結(jié)果的影響。
表1 不同參數(shù)下的目標(biāo)函數(shù)均值
表2 不同交叉、變異概率下的目標(biāo)函數(shù)均值
種群個(gè)體數(shù)和編碼組合數(shù)過多也會增加算法計(jì)算量和復(fù)雜度,綜合考慮,每組的任務(wù)數(shù)目w設(shè)為4,種群個(gè)體數(shù)Z設(shè)為100,編碼組合數(shù)D設(shè)為10,交叉概率Cr設(shè)為0.9,變異概率Gr設(shè)為0.3較為合適。
圖6表示在逃逸者數(shù)量n為16時(shí),執(zhí)行一次多種群協(xié)同優(yōu)化算法的收斂曲線,在迭代次數(shù)達(dá)到200時(shí)算法進(jìn)入非常穩(wěn)定的狀態(tài),因此將遺傳算法的最大迭代次數(shù)G設(shè)為200。
圖6 收斂曲線
為了保證實(shí)驗(yàn)的合理性,在不同的逃逸機(jī)器人數(shù)量下,分別做10組不同的機(jī)器人初始坐標(biāo)下的實(shí)驗(yàn),記錄目標(biāo)函數(shù)的值,每組記錄30組數(shù)據(jù),比較3種算法的效果。表3給出了3種算法在不同測試實(shí)例下的目標(biāo)函數(shù)值(均值±標(biāo)準(zhǔn)差)。
表3 不同分配算法下的目標(biāo)函數(shù)值(均值±標(biāo)準(zhǔn)差)
可以看出,在不同逃逸者數(shù)量的9個(gè)實(shí)例上,文中算法相比其他算法均獲得了更小的目標(biāo)函數(shù)值,可見文中算法能極大地縮短圍捕機(jī)器人到對應(yīng)圍捕點(diǎn)的移動距離。標(biāo)準(zhǔn)差的大小隨著n的增加逐漸降低,是因?yàn)殡S著逃逸者數(shù)目的增加,在有限的地圖環(huán)境里各個(gè)機(jī)器人的分布逐漸密集,在每個(gè)區(qū)域內(nèi)的機(jī)器人數(shù)量逐漸均衡,每種算法對不同初始坐標(biāo)下的機(jī)器人所產(chǎn)生的目標(biāo)函數(shù)越來越接近。
算法2整體差于算法1與文中算法,在逃逸機(jī)器人數(shù)量為2時(shí),算法1與文中算法形成的分配策略的目標(biāo)函數(shù)差異不明顯。隨著n的增加,文中算法的優(yōu)勢逐漸體現(xiàn)出來,在逃逸者數(shù)目較多的情況下,文中算法能生成一個(gè)更優(yōu)的分配策略,其對應(yīng)的目標(biāo)函數(shù)值相比于其他兩個(gè)算法均較小。
以捕獲所有逃逸者時(shí)圍捕者的移動步數(shù)為指標(biāo),對于組建追捕團(tuán)隊(duì)采取文中算法和算法1、算法2來測試3種策略對圍捕結(jié)果的影響。
4.3.1 障礙物對圍捕步數(shù)的影響
設(shè)置逃逸者數(shù)量為8,進(jìn)行兩組實(shí)驗(yàn),一組是固定障礙物數(shù)量為10,在障礙物位置越來越擁堵的情況下進(jìn)行10次實(shí)驗(yàn),結(jié)果如圖7(a)所示;另一組是障礙物數(shù)量從6增加到16,進(jìn)行10次實(shí)驗(yàn),結(jié)果如圖7(b)所示。每次實(shí)驗(yàn)的圍捕步數(shù)由30次不同機(jī)器人初始坐標(biāo)下的實(shí)驗(yàn)結(jié)果取均值來獲得。
圖7 障礙物對圍捕步數(shù)的影響
實(shí)驗(yàn)結(jié)果表明,在障礙物更擁堵的情況下,在某些機(jī)器人行走到該障礙物區(qū)域時(shí),機(jī)器人的避障行為增多,機(jī)器人移動的步數(shù)會略微增加,但障礙物的位置對實(shí)驗(yàn)結(jié)果并不會造成很大的影響,文中算法仍占優(yōu)勢。隨著障礙物數(shù)量的增加,3種算法下圍捕機(jī)器人的移動步數(shù)均會略微增加,是因?yàn)檎系K物數(shù)量越多,機(jī)器人進(jìn)行的繞行就越多,會增加機(jī)器人的移動步數(shù)。
4.3.2 不同逃逸者數(shù)量下的圍捕步數(shù)對比
對不同逃逸者數(shù)量n,在相同障礙物數(shù)量和位置下,采取人工勢場法[10]避障,分別做10組不同機(jī)器人初始坐標(biāo)下的圍捕實(shí)驗(yàn),每組運(yùn)行30次求均值,記錄圍捕機(jī)器人的最大移動步數(shù)。圖8給出了對應(yīng)的結(jié)果。
圖8 采用人工勢場法,不同測試實(shí)例下的圍捕步數(shù)
文中算法在逃逸者數(shù)量從4增加到14的情況下,能夠有效縮短圍捕機(jī)器人系統(tǒng)的最大圍捕步數(shù)。算法1和算法2在本質(zhì)上都是一種貪婪算法,其主要通過最小化圍捕機(jī)器人與目標(biāo)的距離來實(shí)現(xiàn)分配。貪婪行為機(jī)制使其行為選擇是為了使自己的利益獲得最大,團(tuán)隊(duì)成員之間沒有協(xié)作,這樣形成的分配策略非常不均衡。文中的任務(wù)分配策略通過遺傳算法綜合判斷和選擇不同團(tuán)隊(duì)可能性,形成合理的追捕團(tuán)隊(duì),并考慮團(tuán)隊(duì)成員之間相互協(xié)調(diào),提高捕獲效率。相比算法1和算法2,文中算法考慮了團(tuán)隊(duì)協(xié)作,避免了分配策略不均衡導(dǎo)致整體圍捕效率降低的問題,表現(xiàn)更優(yōu)。
以上仿真實(shí)驗(yàn)證明,文中算法在不同初始化環(huán)境和不同障礙物勢態(tài)下均有優(yōu)勢,完成同樣的圍捕任務(wù)下,與算法1相比圍捕步數(shù)差最高可達(dá)約60步,與算法2相比圍捕步數(shù)差最高可達(dá)約90步,有效地提高了圍捕效率。在完成圍捕任務(wù)所耗費(fèi)的步數(shù)上比算法1最多降低了約15%,圍捕效率最大提高了約18%;比算法2最多降低了約20%,圍捕效率最大提高了約25%。
該文研究群機(jī)器人協(xié)同圍捕多逃逸者問題,提出了一種基于多種群協(xié)同進(jìn)化的多逃逸者圍捕任務(wù)分配算法,根據(jù)該算法對目標(biāo)函數(shù)進(jìn)行優(yōu)化,在理論上通過計(jì)算目標(biāo)函數(shù)值來證明該算法的有效性,在仿真實(shí)驗(yàn)中通過對圍捕步數(shù)的比較證明該算法的可行性,并在不同的仿真環(huán)境中進(jìn)行實(shí)驗(yàn),證明該算法的通用性。該算法實(shí)現(xiàn)了圍捕任務(wù)的均衡分配,提高了整個(gè)群機(jī)器人圍捕系統(tǒng)的圍捕效率。在今后的研究工作中,如果障礙物不是靜止而是處于運(yùn)動狀態(tài),該如何避障進(jìn)行路徑規(guī)劃,這將是下一步研究的重點(diǎn)內(nèi)容。