廖列法,李浩瀚,李 帥,朱合隆,李志軍
1.江西理工大學(xué) 信息工程學(xué)院,江西 贛州 341000
2.斯旺西大學(xué) 工程學(xué)院,英國 威爾士 斯旺西SA1 8EN
隨著工業(yè)和互聯(lián)網(wǎng)等高新技術(shù)的發(fā)展,逐漸出現(xiàn)一種可以靈活運動的機(jī)器,該機(jī)器能夠應(yīng)對實時對抗的復(fù)雜環(huán)境[1],這種近似于人類那樣的活動方式和基本職能的產(chǎn)物逐漸出現(xiàn)——機(jī)器人[2]。隨后又出現(xiàn)人工智能,好似給機(jī)械化的機(jī)器安裝上一顆靈活的大腦,使其逐漸在各個領(lǐng)域都能大展宏圖,更甚者比人類還出色。足球機(jī)器人[3]系統(tǒng)的研究涉及非常廣泛的領(lǐng)域[4],包括機(jī)械電子學(xué)、機(jī)器人學(xué)、傳感器信息融合、智能控制、通訊、計算機(jī)視覺、計算機(jī)圖形學(xué)、人工智能[5]等,吸引了世界各國的廣大科學(xué)研究人員和工程技術(shù)人員的積極參與。
足球機(jī)器人是一個多智能體,本身就是多種科技的集合體,對多個學(xué)科來說都有很高的研究價值[6],這是針對于個體本身來說。但是,它們又是同樣的復(fù)刻體,是有許多相似的“活動”,又可以組成一個團(tuán)隊。不單單局限于個體本身的各個智能模塊的研究,還可以上升到整個團(tuán)隊之間的研究。例如:競爭與協(xié)作等復(fù)雜的關(guān)系研究。足球機(jī)器人可以運用人工智能等先進(jìn)科技技術(shù),模擬現(xiàn)實中的運動員比賽模式,演繹一場非常精彩的機(jī)器人足球比賽。足球機(jī)器人比賽中涉及多領(lǐng)域研究方法,通過機(jī)器人比賽,可以很好的促進(jìn)思想的交流,引進(jìn)新的技術(shù).相關(guān)專家學(xué)者也以足球機(jī)器人的控制為研究對象,對其進(jìn)行深入研究,產(chǎn)生了一些較為成熟的理論和應(yīng)用。
足球機(jī)器人在運動過程中會受到障礙物的干擾和足球態(tài)勢的隨機(jī)性等因素的影響,導(dǎo)致足球機(jī)器人的避障性能不好,需要對其進(jìn)行智能控制設(shè)計,同時也要考慮它們的能耗問題。為了提高足球機(jī)器人的智能控制能力,研究足球機(jī)器人的優(yōu)化控制方法,在足球機(jī)器人的設(shè)計和比賽優(yōu)化中具有重要意義。
競爭在自然界和社會中廣泛存在[7]。在不同類型的競爭中,“贏者通吃”是指個體在群體中相互競爭[8]的現(xiàn)象,只有輸入最高的個體保持激活狀態(tài),其余個體均被抑制。這種類型的競爭的例子包括中央主干的主導(dǎo)增長,視覺系統(tǒng)中通過神經(jīng)元之間的贏者通吃競爭的對比增益[9],皮層決策競爭[10],基于競爭的多機(jī)器人協(xié)調(diào)控制[11]等。
盡管上面所舉例說明的許多現(xiàn)象都表現(xiàn)出相同的贏家通吃比賽,但是它們可能有不同的基本原則負(fù)責(zé)動態(tài)進(jìn)化。除了分布式存儲和高速并行處理的特點之外,神經(jīng)網(wǎng)絡(luò)可以很容易地通過硬件來實現(xiàn),并且已經(jīng)被廣泛應(yīng)用于各個領(lǐng)域,包括競爭現(xiàn)象[12]。例如,文獻(xiàn)[13]中介紹的N種類Lotka-Volterra 模型,交互式地插入Fitzhugh-Nagumo模型。
APF[14]方法是由Khatib 率先提出的,剛開始只是為了解決機(jī)械手臂在移動抓取物體的時候,能夠不碰到工作臺。但是后來人們發(fā)現(xiàn),這個方法在移動機(jī)器人上也有很好的效果。能產(chǎn)生出非常平滑的運行軌跡。人工勢場法就是在已知起點、終點和障礙物位置的情況下,構(gòu)建一個人工勢場來模仿這種作用機(jī)制。人工勢場法的優(yōu)點在于,它其實是一種反饋控制策略,對控制和傳感誤差有一定的魯棒性。
人工勢場法簡單實用,有良好的實時性結(jié)構(gòu),在實時避障和平滑的軌跡控制方面得到廣泛的應(yīng)用。它的基本思想是將機(jī)器人在周圍環(huán)境中的運動,設(shè)計成一種抽象的人造引力場中的運動,目標(biāo)點對移動機(jī)器人產(chǎn)生“引力”,障礙物對移動機(jī)器人產(chǎn)生“斥力”,最后通過求合力來控制移動機(jī)器人的運動。目標(biāo)機(jī)器人受力分析如圖1所示。
圖1 機(jī)器人受力分析圖
這個算法里面最主要的就是引力勢場和斥力勢場的設(shè)計。傳統(tǒng)方式的設(shè)計。利用勢函數(shù)U來建立人工勢場。勢(場)函數(shù)是一種可微函數(shù),空間中某點處勢函數(shù)值的大小,代表了該點的勢場強(qiáng)度。最簡單的勢函數(shù)是引力/斥力勢函數(shù)。
某點p處的勢函數(shù)U(p) 表達(dá)為引力勢和斥力勢之和:
最常見的引力勢函數(shù)表達(dá)如下:
其中,ζ為代表增益,d(p,pgoal)為當(dāng)前點p到目標(biāo)點pgoal之間的距離。
常見的斥力勢函數(shù)表示如下:
其中,D(p)為點p與其最近障礙物之間的距離,η為斥力增益,Q*為障礙物的作用距離閾值,大于此距離的障礙物不會產(chǎn)生斥力影響。
WTA 模型中的輸入值就是兩坐標(biāo)點之間的坐標(biāo),輸出值是機(jī)器人的速度矢量,包括速度標(biāo)量和速度方向。這些正是機(jī)器人進(jìn)行路徑規(guī)劃的基本條件和必要條件。而APF路徑規(guī)劃法簡單實用,有良好的實時性結(jié)構(gòu),操作簡單,實際操作性強(qiáng)。最重要的是,勢場法里最多的必要值也是兩點間的距離。這就有良好的互通性,操作步驟和數(shù)據(jù)也類似。通過改進(jìn)的算法,也大大提高了效率,避免了大多的弊端,使路徑更平滑,也使運動過程更加完整。
按照上述的思想,總體過程分兩步,分別采用對應(yīng)的策略來進(jìn)行問題的求解,總體流程圖如圖2所示。
圖2 運動過程流程圖
在足球機(jī)器人系統(tǒng)中,其運行環(huán)境是部分己知、部分未知,含有靜態(tài)和動態(tài)障礙物的環(huán)境,且是個時刻變化的競爭性動態(tài)環(huán)境。足球機(jī)器人運動場地圖3所示。
圖3 足球場場景圖
如圖3,描述的是足球機(jī)器人的比賽場地。雙方各派出11 個足球機(jī)器人,在規(guī)定的場地上進(jìn)行足球比賽。所有的比賽環(huán)境都是在理想的狀態(tài)下進(jìn)行的,不考慮過多的人為和其他自然力量的影響。這里說明一下比賽過程,大致分為兩個關(guān)鍵部分:第一個部分,比賽開始時,雙方都靜止在各自的場地中。等待比賽指令的傳達(dá),雙方運動員去搶足球。當(dāng)某一方成功搶到足球時,就控制足球向?qū)Ψ角蜷T運動[15]。過程中會遇到對方球員的阻撓,成功越過障礙,到達(dá)對方球門,贏得比賽。否則,球會到達(dá)對方的隊員,再重復(fù)上述過程,直至某一方獲得勝利,比賽結(jié)束。
整個比賽過程,其實是由許多小分部組成,每個過程都不可或缺,共同構(gòu)成足球機(jī)器人智能控制體系。足球機(jī)器人和足球都屬于不確定性障礙物,它們的形狀確定,但位置不確定,而且可能是靜態(tài)的或者是動態(tài)的,對這些障礙物的避障[16]是研究的重點和難點。
踢球是機(jī)器人足球比賽中一個最基本的動作,它是指機(jī)器人快速運動到球的位置,從而將球推出去。避障是機(jī)器人足球比賽中一個重要的動作,它是指機(jī)器人控球運動過程中,躲避出現(xiàn)的障礙,使其成功到達(dá)目標(biāo)點。
本文研究的是單個足球機(jī)器人的運動,多個機(jī)器人間的競爭關(guān)系。比賽通常來說是一個動態(tài)的過程,在一個動態(tài)的系統(tǒng)中,如果每個組成部分都是無序的,不按照一定的規(guī)則來有序地進(jìn)行,那么就會出現(xiàn)相應(yīng)的一些問題。道路上車輛不遵守交通規(guī)則,就會出現(xiàn)交通事故;自然萬物如果不遵守達(dá)爾文進(jìn)化論,就會出現(xiàn)畸形,給人們帶來難以估量的后果。所以要遵守規(guī)則,在足球機(jī)器人中這個規(guī)則就是控制策略。
足球機(jī)器人運動過程中路徑的規(guī)劃也是智能機(jī)器人的一個重要的課題,是機(jī)器人智能性的一個重要體現(xiàn)。在靜態(tài)環(huán)境和動態(tài)環(huán)境下進(jìn)行路徑規(guī)劃與實時避障是解決機(jī)器人應(yīng)用的一個非常重要的問題,而動態(tài)不確定環(huán)境下的機(jī)器人路徑規(guī)劃則是實際研究與應(yīng)用的一個重點和難點。在足球機(jī)器人中,路徑規(guī)劃[17-18]的目的主要有兩個:一是為了完成制定的動作;二是為了躲避障礙并且實現(xiàn)安全平穩(wěn)的運行。
足球機(jī)器人的路徑規(guī)劃有些顯著的特點。
(1)復(fù)雜性:機(jī)器人足球系統(tǒng)是一個實時的、動態(tài)的復(fù)雜多機(jī)器人系統(tǒng)[19]。在這種動態(tài)時變環(huán)境中,機(jī)器人路徑規(guī)劃非常復(fù)雜,且需要很大的計算量。
(2)隨機(jī)性:機(jī)器人足球是一個充滿對抗的復(fù)雜環(huán)境,對方機(jī)器人的運動是難以預(yù)測的,動態(tài)障礙物的出現(xiàn)也帶有隨機(jī)性。
(3)多約束:機(jī)器人的運動存在幾何約束和物理約束。幾何約束是指機(jī)器人的形狀制約,而物理約束是指機(jī)器人的速度和加速度。
(4)多目標(biāo):機(jī)器人運動過程中路徑性能[20]要求存在多種目標(biāo),如路徑最短,時間最優(yōu),安全性能最好,能源消耗最小。但它們之間往往存在沖突。實現(xiàn)起來比較困難了。
足球機(jī)器人的比賽是一個多人參與的競技體育運動,比賽過程中,機(jī)器人處于不斷運動,不時的變化著運動狀態(tài),是一個在連續(xù)時間內(nèi)不斷變化的過程。這樣時間和運動狀態(tài)之間就不是單純的線形關(guān)系,時間和運動狀態(tài)之間就沒有了必要的聯(lián)系,屬于非線性關(guān)系。機(jī)器人畢竟不能像人類那樣擁有發(fā)達(dá)的大腦,可以自由機(jī)敏的控制自己的行為。如果繼續(xù)按照原先設(shè)定的程序,那么很可能就事倍功半。不僅阻礙自己的隊友,還會無形的幫助對方。所以,需要有一個相對可靠的策略來控制機(jī)器人的行為。
傳統(tǒng)方法是需要所有隊員都去追趕足球,最終只有一個機(jī)器人搶到足球,這樣,其他沒有搶到足球的機(jī)器人的能量就浪費掉。按上述方法,只允許離得最近的機(jī)器人去追趕足球,節(jié)省了許多不必要的能量開支。紅色部分就是采用新的策略來進(jìn)行搶球的,其余藍(lán)色的機(jī)器人就不會去搶奪足球。搶球示意圖如圖4所示。
圖4 機(jī)器人搶球過程圖
本文中將采用WTA(Winner-Take-All)輔助競爭模型,來描述這種在連續(xù)時間非線性的競爭關(guān)系。足球運動時,離每一個機(jī)器人的距離都不一樣,且為了更方便快捷的控制足球運動,需要找到一個離足球最有優(yōu)勢(距離最近)的隊員來控制足球[21]。并且,足球是一個運動的物體,可以看成一個動態(tài)的系統(tǒng),而且距離足球最有優(yōu)勢的運動員也在無時無刻的變化。這就需要找出最具有優(yōu)勢的隊員來進(jìn)行控制,從而達(dá)到更具有效率。
下面將介紹WTA競爭模型的建立以及針對模型本身的基本分析。
一組中有n個機(jī)器人,那么它的第m個機(jī)器人有以下的動態(tài)過程。v和s表示的都是向量。下述式子是一個常微分方程模型。
其中vm∈? 表示第m個機(jī)器人的速度狀態(tài),sm∈? 代表的是機(jī)器人所處的位置與足球之間距離的倒數(shù),并且sm≥0。對于m≠q時,有sm≠sq。表示狀態(tài)向量的歐幾里得范數(shù),而v=[v1,v2,…,vn]T。c0∈? ,c0≥0 是一個比例因子。
通過疊加所有足球機(jī)器人的狀態(tài),動態(tài)方程可以寫成如下緊湊形式:
其中v=[v1,v2,…,vn]T,而s=[s1,s2,…,sn]T,操作符°代表分量乘法,s°v=[s1v1,s2v2,…,snvn]T。
對于這個模型可以直觀地解釋了正反饋與負(fù)反饋的結(jié)果。請注意方程(2)中的項c0smvm提供了狀態(tài)變量vm的正反饋,當(dāng)sm≥0 時,項-c0‖v‖2vm提供負(fù)反饋。對于第m個機(jī)器人,如果sm=‖v‖2,保持該值。如果sm <‖v‖2,則正反饋小于負(fù)反饋,狀態(tài)值衰減為零。相反,如果sm >‖v‖2,則正反饋大于負(fù)反饋,并且狀態(tài)值傾向于盡可能地增大直到‖v‖2的增加超過了sm。特別是對于獲勝者來說,即第k?個機(jī)器人,對于所有m≠k?保持sk?>sm。在這種情況下,當(dāng)sm <‖v‖2時所有機(jī)器人都有負(fù)面的反饋,并且保持減少值直到‖v‖2減少到值sk,否則,當(dāng)sk稍微大于‖v‖2(對于稍微大于,意思是sk>‖v‖2>sm其中l(wèi)表示具有第二大狀態(tài)值的機(jī)器人),只有贏家有一個正反饋并且狀態(tài)值在增加,而其他所有機(jī)器人都是負(fù)反饋并且保持減少直到‖v‖2等于sk。在這種選擇性的正負(fù)反饋機(jī)制下,贏家最終保持活躍在值sk?=‖v‖2而失敗者被抑制為零。
足球機(jī)器人搶到足球之后,控制足球朝對方的球門運動,最終使球到達(dá)對方的球門。基于比賽的機(jī)制,對方一定會去阻攔控球方的行動。對于控球方而言,對方就成為了障礙物,想要贏得比賽就得想方設(shè)法越過障礙物。前提肯定不能破壞對方機(jī)器人,這樣就不能體現(xiàn)“體育精神”,因此要找到合適的路徑規(guī)避這些障礙物。為了快捷的解決這些問題,本文將采用APF路徑規(guī)劃方法來解決機(jī)器人間的避障問題[22]。
傳統(tǒng)的APF算法簡單、快捷,有良好的實時性,在路徑規(guī)劃這一方面應(yīng)用廣泛,但也存在一些問題,為了解決這些已有的問題,進(jìn)行了如下的改進(jìn)。
(1)對于碰到障礙物的問題,可以通過修正引力函數(shù)來解決,避免距離過大導(dǎo)致引力過大。經(jīng)過修改的引力函數(shù)如下:
上式增加了范圍限定。d*goal給定了一個閾值限定了目標(biāo)和物體之間的距離,本文中取半個機(jī)器人大小。對應(yīng)的梯度也就是引力相應(yīng)變成:
(2)斥力勢函數(shù)的改進(jìn):現(xiàn)有斥力勢函數(shù)的取值,取決于當(dāng)前點與最近障礙物的距離。在這樣的設(shè)計中,如果當(dāng)前點與兩個障礙物等距,可能會造成機(jī)器人在障礙物間的中線上來回跳動。對此,可以重新定義斥力勢函數(shù)為當(dāng)前點與最近的障礙物點之間的距離,即不考慮障礙物本身的坐標(biāo)位置,只要障礙物上的某點離當(dāng)前點最近,就以此距離定義斥力勢函數(shù)。目標(biāo)點附近有障礙物導(dǎo)致目標(biāo)不可達(dá)的問題,引入一種新的斥力函數(shù)。
這里在原有斥力場的基礎(chǔ)上,加上了目標(biāo)和物體距離的影響,(n是正整數(shù),本文中取值為2)物體靠近目標(biāo)時,雖然斥力場要增大,但是距離在減少,所以在一定程度上可以起到對斥力場的拖拽作用,相應(yīng)斥力變成:
(3)局部極小值問題:人工勢場法有時候會遇到局部極小值問題。在局部極小值點,雖然梯度為零,但并沒有真正到達(dá)終點。對這樣的情況,一般引入抽樣規(guī)劃的思想,在局部最小值處加入一個擾動或回溯,以跳出局部極小值,也可以通過引入時間參數(shù)來消除局部最小值的問題。
通過改進(jìn)斥力函數(shù)和引力函數(shù)的方法,提高了算法的可實用性和效率。給定相應(yīng)的限制條件,使機(jī)器人不會因為引力過大斥力較小的情況下撞到障礙物;也不會因為斥力非常大引力非常小的情況下,機(jī)器人無法到達(dá)目標(biāo)點。引入隨機(jī)擾動,減少機(jī)器人會由于斥力、引力相近而引起的震蕩。
3.1.1 贏者通吃實驗
在本小節(jié)中,將通過仿真實驗來說明機(jī)器人動態(tài)產(chǎn)生的贏者通吃現(xiàn)象。考慮兩個方面:一個是靜態(tài)競爭,即輸入值s是不變的;一個是動態(tài)競爭,即輸入s是隨時間變化的。
(1)靜態(tài)競爭
對于靜態(tài)競爭問題,即剛開始比賽過程,雙方都處于靜止?fàn)顟B(tài)。輸入值s不隨著時間變化。在實驗中,規(guī)定有11 個機(jī)器人,即n=11。輸入值s在0 和1 之間隨機(jī)生成,而狀態(tài)值v在?1 和1 之間變化。在仿真中,為了使過程更方便、簡單,選取c0=1。然后在MATLAB中進(jìn)行仿真。
(2)動態(tài)競爭
在這一部分,需要考慮具有時變輸入的情景,即輸入值隨著時間變化。為了使結(jié)果加速收斂,考慮一個比較大的比例因子c0=1 000,分別考慮對于m=1,2,3,4,sm(t)=1+sin( 2π(t+0.25m))的4 個值。初始狀態(tài)值v0是在?1和1之間隨機(jī)產(chǎn)生。4個輸入值和狀態(tài)變量的絕對值繪制在結(jié)果圖中。
3.1.2 避障過程場景模擬實驗
將整個比賽場地虛擬成一個有力存在的場地,把力分為引力和斥力,根據(jù)比賽的進(jìn)行,場上隊員會發(fā)生變化,因而整個力場中各部分的受力情況也會發(fā)生變化。在足球機(jī)器人的周圍,分布著環(huán)狀的虛擬力場,各環(huán)用環(huán)帶顏色深度和環(huán)的斥力系數(shù)來表示,各個足球機(jī)器人之間表現(xiàn)為排斥力。
下面將介紹APF 算法的執(zhí)行流程。如前文介紹,足球機(jī)器人的動力來自于各個主要作用力的合力。遠(yuǎn)方的球門作為機(jī)器人的目標(biāo)點,提供巨大的引力,而機(jī)器人控球過程中遇到敵方機(jī)器人的阻礙就是斥力,兩種力通過矢量結(jié)合成合力,提供動力使機(jī)器人運動到距離目標(biāo)點更近的下一步位置,然后重復(fù)此操作,最終達(dá)到目標(biāo)點即可。目標(biāo)點條件就是合力為零的時候,如果不做此限制,機(jī)器人會一直運動。APF 算法流程圖如圖5所示。
圖5 APF算法流程圖
這一部分實驗將用Python 編程語言來驗證。首先設(shè)置實驗區(qū)域窗口的大小,確保每次實驗都在固定的范圍內(nèi)進(jìn)行,也起到了實驗的嚴(yán)謹(jǐn)性。然后設(shè)置機(jī)器人初始位置和目標(biāo)點位置坐標(biāo),定義中心點的大小,即運動過程中的動態(tài)足球機(jī)器人;包括中心點的顏色、大小等等。接下來設(shè)置障礙物,也同樣包括坐標(biāo)點、大小、顏色等等;為了使虛擬更加現(xiàn)實,需要在障礙物周圍設(shè)置均勻變化的環(huán)繞。再然后畫出中心點引力、斥力和合成力,最后,中心點根據(jù)理論公式方法做出軌跡路線。
為了使實驗更具科學(xué)性,本文將采用多組實驗數(shù)據(jù)進(jìn)行驗證。設(shè)置多組障礙物點的坐標(biāo)位置,模擬球場上出現(xiàn)的多種陣型,也使實驗更加的貼近于實際應(yīng)用。實驗依次準(zhǔn)備三組數(shù)據(jù),這三組數(shù)據(jù)都是在目標(biāo)點坐標(biāo)不變的情況,在應(yīng)用場景中就是指對方球門的位置不變,始終是個定植,也能更好地對應(yīng)現(xiàn)實場景,只考慮單一變量,即障礙物位置(見表1)。
表1 障礙物坐標(biāo)表
(1)按照上一節(jié)的WTA 模型實驗步驟,得到如圖6所示運行結(jié)果。
圖6 靜態(tài)競爭結(jié)果圖
圖中橫坐標(biāo)代表迭代時間,縱軸是輸出值,代表機(jī)器人隨時間變化的狀態(tài)。線條是平滑的曲線,不同顏色的曲線代表不同的機(jī)器人,其狀態(tài)在同一坐標(biāo)系中隨著時間變化而變化。
如圖6 運行結(jié)果顯示多次迭代之后第5 個機(jī)器人(即輸入值最大的)達(dá)到最大值,最接近1,屬于勝利者。其他的都收斂到0,屬于失敗者,它們的活動將受到限制,不會與勝利者再產(chǎn)生競爭。
實驗結(jié)果顯示,輸入值s 的初始值s_5=0.722 9 是最大值,通過前面介紹的模型計算出的結(jié)果才能最接近1,達(dá)到最大值。初始值最大,則其倒數(shù)最小,對應(yīng)足球機(jī)器人比賽中,就是機(jī)器人和足球的距離最近。離球最近的機(jī)器人先去踢球,其他的就原地待命,不會影響控球機(jī)器人的運動,使整個團(tuán)隊看起來井然有序。這樣做符合前期的預(yù)想,可以節(jié)省足球機(jī)器人的能量,也減少了因為搶球過程中碰撞造成機(jī)器人本身的損傷。
(2)按照動態(tài)競爭實驗步驟執(zhí)行,得到如圖7 的運行結(jié)果。
圖中橫坐標(biāo)表示的是時間,縱坐標(biāo)從上到下依次為輸入值s、機(jī)器人1 的狀態(tài)值、機(jī)器人2 的狀態(tài)值、機(jī)器人3的狀態(tài)值、機(jī)器人4的狀態(tài)值。最上面第一幅圖是4個機(jī)器人輸入值s 隨時間變化的曲線圖,下面4 幅圖是以第一幅圖為基礎(chǔ),利用第一幅圖得到的某一時刻的輸入值來計算出輸出值。從圖中可以清晰看出,能夠?qū)崟r找出最大的獲勝者,也達(dá)到了預(yù)期的猜想。足球機(jī)器人在運動過程中,只要知道機(jī)器人與足球之間的距離,就能隨時找到勝利者,更容易的去搶足球。雙方也不會造成比賽過程中的混亂場景,加快搶到球的幾率。
圖7 動態(tài)競爭結(jié)果圖
(3)根據(jù)上述實驗方法,進(jìn)行了實驗,為了使實驗過程的變化更加的清晰,從動態(tài)場景中選取具有代表性的幾張動態(tài)圖進(jìn)行展示.實驗結(jié)果如圖8所示。
圖8中,漸變色的紅色區(qū)域是障礙物所在位置以及周圍存在的“力場”,顏色的深淺代表力大的強(qiáng)弱。右上角的藍(lán)色圓點代表最終的目標(biāo)位置,中間帶有許多不同顏色的箭頭的藍(lán)色實心點是目標(biāo)點,即控球的足球機(jī)器人,帶箭頭的線代表不同的受力。
這6張圖都是選在同一障礙物坐標(biāo)位置的6個不同關(guān)鍵過程的圖形,可以更加直接地了解目標(biāo)點的運動過程,也能可以更加清楚地看到目標(biāo)點運動過程的受力變化,真正實現(xiàn)一個動態(tài)時變的過程。
分別對障礙物坐標(biāo)進(jìn)行不同的設(shè)置,根據(jù)目標(biāo)點運動軌跡的坐標(biāo)點畫出散點圖,并與經(jīng)典算法進(jìn)行對比實驗,結(jié)果如圖9~11所示。
圖中藍(lán)色曲線代表的是足球機(jī)器人的最終路徑,紅色的漸變圓是障礙物的影響力,顏色深淺代表障礙物力的大??;紅色線代表是經(jīng)典算法得到的路徑,綠色線代表改進(jìn)后的算法得到的路徑。圖9 是針對能否碰到障礙物做的對比仿真圖,通過改進(jìn)之后機(jī)器人能夠繞開障礙物,不會因為引力太大直接撞到障礙物停止運動。圖10描述的是目標(biāo)機(jī)器人能否到達(dá)最終球門,通過改進(jìn)之后機(jī)器人可以到達(dá)最終球門,不會造成路徑的不完整。圖11 描述的是兩種算法的震蕩程度的對比,通過改進(jìn)之后,震蕩程度減小了很多,也使路徑更加平滑。
圖8 運動過程分解圖
圖9 能否碰到障礙物結(jié)果對比圖
圖10 能否到達(dá)目標(biāo)位置結(jié)果對比圖
圖11 振蕩幅度結(jié)果對比圖
這幾張圖的結(jié)果是由于障礙物坐標(biāo)的不同而形成的,因為障礙物形成的區(qū)域不同,障礙物對機(jī)器人的斥力也就不同,即使目標(biāo)點對機(jī)器人產(chǎn)生的引力相同,也會由于合力的不同從而產(chǎn)生不同的路線。從圖中可以看出,機(jī)器人針對不同的障礙物布局,可以智能地采取合適的路線進(jìn)行有效躲避,成功到達(dá)目標(biāo)點位置,避免了與對方的“摩擦”,從而也減少了機(jī)器人昂貴的維修費用,其簡單實用,能更便捷地達(dá)到目的。
本文描述的是足球機(jī)器人運動的運動過程,較傳統(tǒng)方式更加完整。通過WTA連續(xù)時間非線性輔助競爭模型來解決多機(jī)器人爭奪足球的過程,相比傳統(tǒng)的方式,能夠?qū)崟r找出離足球最有優(yōu)勢的機(jī)器人,搶先控制球,也能節(jié)省非必要的機(jī)器人的能耗。然后在躲避其他機(jī)器人的過程中,采用改進(jìn)的APF 路徑規(guī)劃算法,成功有效地躲避障礙,找出合適的路線,成功到達(dá)目標(biāo)球門。實驗結(jié)果也驗證了猜想,使理論更加嚴(yán)謹(jǐn),也為將來更智能化的足球機(jī)器人運動過程研究提供了基礎(chǔ)。