易嗣力 華南師范大學(xué)
在當(dāng)代機器人應(yīng)用領(lǐng)域中,多機器人系統(tǒng)路徑規(guī)劃一直屬于關(guān)鍵性問題,不但要把單體機器人路徑規(guī)劃任務(wù)處理好,而且對多個機器人間的系統(tǒng)合作問題也需要處理。對此量子博弈論在其中就發(fā)揮了重要作用。
對策率即所謂的博弈論,屬于運籌學(xué)的重要分支,在現(xiàn)代教學(xué)中也屬重要教學(xué)內(nèi)容。博弈論主要對擁有個體競爭特征的一些現(xiàn)象進(jìn)行研究,并且,把競爭體之間的關(guān)系用公式的形式表述出來,判斷研究,并對其實際行為與理想行為等進(jìn)行優(yōu)化。通過在多機器人系統(tǒng)內(nèi)應(yīng)用,有著合作與競爭的關(guān)系存在于機器人個體之間,所以,可以通過相互博弈的雙方來看待它,所以,我們可以從博弈論出發(fā),規(guī)劃多機器人系統(tǒng)路徑。
在當(dāng)代移動機器人應(yīng)用中,路徑規(guī)劃屬于其中的一個重要的問題,到目前為止,研究成果在不斷增多,并且,多機器人可以在很多復(fù)雜的環(huán)境下進(jìn)行路徑規(guī)劃。按照多樣化的規(guī)劃內(nèi)容,進(jìn)行多途徑的設(shè)計規(guī)劃,例如,規(guī)劃局部路徑與規(guī)劃全局路徑,按照工作環(huán)境判斷能否跟著時間而改變,還可以分為動態(tài)路徑規(guī)劃以及靜態(tài)路徑規(guī)劃。
而在增加了工作任務(wù)難度以及環(huán)境復(fù)雜度以后,在某種程度上擴大了多機器人系統(tǒng)的應(yīng)用,而且,在當(dāng)前形勢下,多機器人系統(tǒng)的路徑規(guī)劃已經(jīng)成為了熱點研究問題。在動態(tài)的空間中,要求集體與單個機器人間能夠互相合作,所以,多機器人簡單的避障與協(xié)調(diào)前進(jìn)是多機器人路徑規(guī)劃的難點,在研究實施路徑規(guī)劃時期發(fā)展空間也很大
我們從博弈論入手,制定規(guī)劃路徑的方案,我們可以用一個整體來看待多機器人系統(tǒng),也就是想任務(wù)目標(biāo)點處發(fā)展所有機器人,這樣認(rèn)定為路徑規(guī)劃完全完成,只有部分或者一個完成,不可以視為完成了整體。在規(guī)劃路徑時,規(guī)定機器人間既不能和其他機器人相撞,也不能和障礙物碰撞到一起。因此,我們可以這樣定義最優(yōu)解,在有障礙物的環(huán)境內(nèi)規(guī)劃各個機器人的運行路徑,規(guī)定每方間要系統(tǒng)工作,從而用最少的時間將機器人運送到目的地。
我們可以按照以下步驟設(shè)計博弈模型:
第一、用博弈的N個參與者來定義數(shù)量為N的機器人。而且,是在參與游戲者之間形成的博弈關(guān)系,然而,我們應(yīng)該在整體的角度內(nèi)控制路徑的最優(yōu)解。所以,我們需要用博弈參與者來看待各個機器人,而不可用整體的眼光看待它。
第二、各個參與方都有屬于自身的方法空間,含有自身可行的方法行為。并且盡量選擇最短的路徑,幾乎不會有困難選擇的情況發(fā)生。就選擇困難而言指的是有太多的可以選擇策略,造成參與者有著較長的選擇時間,或者在選擇的死循環(huán)內(nèi)無法掙脫從,從而造成無法正確的選擇。
第三、收益函數(shù)的建立。參與方選擇的策略行為和所獲取利益的映射關(guān)系即為收益函數(shù),在向此問題內(nèi)深入,即為選擇的機器人可行性路徑和達(dá)到目標(biāo)任務(wù)時間大小的映射。
第四、參與方的自利情況。當(dāng)前我們所見到的機器人可以說越來越智能化,所以,固化其路徑時也會變的也來越復(fù)雜,所以,對于機器人的自利性必須要認(rèn)真的進(jìn)行考慮,也就參與者總是按照本身最大的收益進(jìn)行執(zhí)行的。因此,對于參與方的自利因素必須要進(jìn)行充分的考慮。因為自利性的存在就會誘發(fā)相應(yīng)的沖突,造成最優(yōu)的個體沖突出現(xiàn),這是要進(jìn)行展開相應(yīng)的博弈,然后將某個參與方的最優(yōu)放棄掉,從而將整體最優(yōu)創(chuàng)造出來。
第五、設(shè)立約束條件。因為在規(guī)劃路徑時不可將障礙物穿過,因此,可以清晰的界定可視圖內(nèi)的約束條件,而且,保證各個路徑不可從障礙物穿過,應(yīng)該及時避開。
第六、建立數(shù)學(xué)模型。為例在博弈問題基礎(chǔ)上規(guī)劃多機器人路徑,首先應(yīng)該將此博弈問題的數(shù)學(xué)模型建立起來。
建立環(huán)境地圖:
在平面直角坐標(biāo)系XOY中防止多機器人工作環(huán)境,然后利用坐標(biāo)標(biāo)準(zhǔn)出各個機器人的位置。用(x,y)表示工作環(huán)境中任意一個點的坐標(biāo),然后坐標(biāo)變化第i個機器人的路徑,用xioiyi表示新的坐標(biāo),其中,機器人的i的起始點用此坐標(biāo)原點表示,m為目標(biāo)點,其中,目標(biāo)點m和起始點i的連線用xi軸表示。平均劃分m,其中,xij(j=1,2...m-1)為等分點坐標(biāo),直線Lij經(jīng)過點Xij且與xi軸垂直,并且,把點pij設(shè)置在Lij軸上,并且用Yij記做該點和Xij的距離,這樣在整個工作環(huán)境中我們就可以通過(Xij,Yij)表示第i個機器人的第j個路徑點。
第七、注意的事項分析。在規(guī)劃多機器人路徑時,洪不會自利的智能體來看待機器人,刨除機器人的理性和自利性。在規(guī)劃的路徑中將理性智能化機器人作為嚴(yán)重重點,所以,必須要時刻關(guān)注它的自利性與理性特征,更多對個體意志進(jìn)行表達(dá),從而就會導(dǎo)致有很多復(fù)雜的內(nèi)容出現(xiàn)在機器人路徑規(guī)劃工作中,不斷加大其協(xié)調(diào)難度,計算變的更加復(fù)雜。此種強烈表現(xiàn)個體意志性與理性的博弈參與方,將會把本身收益最大的策略行為選擇出來,從而更好的完成相應(yīng)的目標(biāo)任務(wù)。個體最優(yōu)表現(xiàn)在博弈中,并不能代表具有最優(yōu)化的集體,所以,應(yīng)該科學(xué)的在兩者之間展開權(quán)衡和選擇,然而因為博弈參與者的自利性與理性存在,所以,往往在納什均衡中促使參與者運行和工作,這樣更改起來也會比較困難,從而會產(chǎn)生較多的問題。為了實現(xiàn)集體與個體利益的統(tǒng)一,我們可以基于經(jīng)典博弈展開拓展,把相應(yīng)的量子博弈模型建立起來,從而達(dá)到集體利益與個體利益統(tǒng)一的目的,從而把經(jīng)典博弈內(nèi)無法處理的問題有效的解決掉。
我們從路徑劃分入手對多機器人研究領(lǐng)域的重要性問題進(jìn)行了研究分析,并且對此問題的重要研究內(nèi)容進(jìn)行了芻議,通過與發(fā)展現(xiàn)狀相結(jié)合,選擇出最優(yōu)的算取方式,與量子博弈論的學(xué)習(xí)研究相結(jié)合,在對大量文獻(xiàn)進(jìn)行閱讀的前提下,對量子博弈論下多機器人路徑規(guī)劃的內(nèi)容進(jìn)行了細(xì)致的剖析,并且,對理性與自利性下博弈論的發(fā)展內(nèi)容進(jìn)行了分析,從而為更好研究人員在實際工作中提供一定的理論與技術(shù)支撐。