高江徽 魯力群 李輝
摘 要:在AGV(Automated Guided Vehicle)運(yùn)行過程中,建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)周圍環(huán)境的智能移動(dòng)體的運(yùn)動(dòng)軌跡進(jìn)行綜合動(dòng)態(tài)預(yù)測(cè)和評(píng)估,結(jié)合納什均衡理論建立移動(dòng)機(jī)器人運(yùn)動(dòng)決策模型,使得AGV在運(yùn)行過程中建立類人判斷的能力即考慮AGV和其他移動(dòng)智能體的相對(duì)位置的關(guān)系,對(duì)其他的移動(dòng)智能體的預(yù)測(cè)價(jià)值可以有效的評(píng)估。文章通過構(gòu)建動(dòng)態(tài)博弈模型求解灰色碰撞概率,可以高效的為AGV防撞提供合理的參考。
關(guān)鍵詞:AGV;BP神經(jīng)網(wǎng)絡(luò);預(yù)測(cè);灰色碰撞概率
中圖分類號(hào):U467? 文獻(xiàn)標(biāo)識(shí)碼:A ?文章編號(hào):1671-7988(2020)03-226-04
前言
移動(dòng)機(jī)器人AGV(Automated Guided Vehicle)運(yùn)動(dòng)在復(fù)雜的環(huán)境下存在著諸多的問題,無法有效的判斷其他移動(dòng)智能體的運(yùn)動(dòng)意圖、無法根據(jù)周圍的環(huán)境進(jìn)行導(dǎo)航方法的轉(zhuǎn)變。為了解決上述問題,陳海燕[1]將進(jìn)行協(xié)作的機(jī)器人個(gè)體看成具備自治能力的移動(dòng)智能體,然而并沒有解決機(jī)器人在運(yùn)行中適應(yīng)環(huán)境的問題。李洋[2]人提出將博弈論應(yīng)用于多機(jī)器人目標(biāo)追蹤中,這種方法是基于各個(gè)智能體都建立通訊的基礎(chǔ)上,無法應(yīng)用于人與移動(dòng)機(jī)器人共存的環(huán)境下。
為了解決上述問題,本文提出基于BP神經(jīng)網(wǎng)絡(luò)的AGV防撞避讓評(píng)估方法。本方法利用預(yù)測(cè)價(jià)值判斷避免過度主動(dòng)跟蹤、不需要建立通訊和計(jì)算博弈雙方納什均衡點(diǎn)的位置及其灰色碰撞概率,為移動(dòng)機(jī)器人的決策提供參考,可以在不失去預(yù)測(cè)準(zhǔn)確性的前提下,計(jì)算量大幅度下降。
1 防撞方法模型描述
在AGV運(yùn)行過程中,由于外界環(huán)境的影響,總是需要進(jìn)行一系列的決策,來保證移動(dòng)機(jī)器人平穩(wěn)有效的運(yùn)行。AGV的一次決策過程分為兩個(gè)階段:預(yù)測(cè)分析階段和評(píng)估階段。在預(yù)測(cè)分析階段,AGV通過自身攜帶的傳感器計(jì)算自身位置和環(huán)境中其他物體位置的關(guān)系等進(jìn)而分析自身與其他物體的碰撞可能性;在評(píng)估階段,分析他們的運(yùn)動(dòng)軌跡作出價(jià)值評(píng)估,當(dāng)價(jià)值比較低時(shí),對(duì)移動(dòng)機(jī)器人運(yùn)動(dòng)意圖干擾較小,可不作考慮;當(dāng)價(jià)值比較高時(shí)即對(duì)移動(dòng)機(jī)器人運(yùn)動(dòng)意圖干擾比較大時(shí),作為監(jiān)控預(yù)測(cè)對(duì)象,并且建立預(yù)測(cè)對(duì)象和移動(dòng)機(jī)器人的博弈模型,通過基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建灰色碰撞概率模型來為AGV防撞避讓提供參考依據(jù)。
2 移動(dòng)智能體軌跡預(yù)測(cè)及價(jià)值評(píng)估
2.1 基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型
移動(dòng)機(jī)器人AGV自身通過搭載的傳感器可以對(duì)周圍的智能移動(dòng)體或人進(jìn)行目標(biāo)檢測(cè)和跟蹤以及運(yùn)動(dòng)數(shù)據(jù)讀取。在完成傳感器的數(shù)據(jù)獲取之后,利用AGV搭載的上位工控機(jī)對(duì)獲取來的數(shù)據(jù)進(jìn)行融合并去除冗余數(shù)據(jù)。為了方便模型的建立與計(jì)算方便,我們把智能體歸為一類,以不同的編號(hào)表示不同的移動(dòng)體。選取數(shù)據(jù)集中的方向、速度、加速度、橫向偏移為建模因子,對(duì)每個(gè)因子建立BP[3]神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)每個(gè)因子變化來完成軌跡預(yù)測(cè),在實(shí)際的計(jì)算中可以簡(jiǎn)化為對(duì)坐標(biāo)點(diǎn)位的預(yù)測(cè)。
2.2 各影響因子的BP神經(jīng)網(wǎng)絡(luò)建立
BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,其結(jié)構(gòu)包含三層網(wǎng)絡(luò)結(jié)構(gòu):輸入層、隱含層和輸出層[4]。BP神經(jīng)網(wǎng)絡(luò)一共分為三層,第一層為輸入層,由信號(hào)源節(jié)點(diǎn)Xk(n=1,2,3…n)組成;第二層為隱藏層Hk(n=1,2,3…n),隱藏層中神經(jīng)元的變換函數(shù)非負(fù)線性函數(shù),該函數(shù)是局部相應(yīng)函數(shù),要設(shè)置相應(yīng)的隱藏層神經(jīng)元個(gè)數(shù);第三層為輸出層Yk(n=1,2,3…n),是對(duì)輸入模式做出的響應(yīng),輸出層是對(duì)線性權(quán)進(jìn)行調(diào)整,采用的是線性優(yōu)化策略,學(xué)習(xí)速度較快。
慣性評(píng)估,是處于軌跡預(yù)測(cè)之前的階段,是在基于瞬時(shí)狀態(tài)下,以一小段時(shí)間為周期,對(duì)未來位置的趨勢(shì)進(jìn)行的整體性評(píng)估,從宏觀來衡量AGV與其他移動(dòng)智能體的關(guān)系。如圖4所示,A為AGV,B為其他移動(dòng)智能體,A的速度為v0,B的速度為v1,則他們的相對(duì)速度為?v,且?v與相對(duì)位移方向存在夾角β。當(dāng)β>0時(shí),在宏觀慣性預(yù)測(cè)下不具備碰撞的條件,然而AGV在實(shí)際中,并不是以一個(gè)運(yùn)動(dòng)的點(diǎn)存在,而是一個(gè)有相當(dāng)體積的物體存在,考慮預(yù)測(cè)數(shù)值本身的細(xì)微誤差,因此有必要設(shè)置一個(gè)安全圓距離。
如圖5所示,給AGV設(shè)置安全圓距離r,當(dāng)夾角β=θ0時(shí),慣性運(yùn)動(dòng)軌跡與安全距離圓相切,令θ0為臨界干擾角。當(dāng)β>θ0時(shí),宏觀上不具備碰撞的條件,即預(yù)測(cè)價(jià)值較低;當(dāng)β≤θ0時(shí),宏觀上具備碰撞的條件,即預(yù)測(cè)價(jià)值較高。
3 灰色碰撞概率求解
基于上文中已經(jīng)對(duì)其他移動(dòng)智能體進(jìn)行了價(jià)值評(píng)估和預(yù)測(cè),接下來需要對(duì)潛在的碰撞點(diǎn)和碰撞概率進(jìn)行求解,為AGV的決策提供依據(jù)。關(guān)于博弈在對(duì)于碰撞概率和碰撞位置,是逆向求解的結(jié)果。在周期預(yù)測(cè)時(shí)間T中,對(duì)于預(yù)測(cè)價(jià)值高的移動(dòng)智能體進(jìn)行了BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè),在周期T中取n個(gè)時(shí)間節(jié)點(diǎn),可以得到預(yù)測(cè)點(diǎn)位置Pi (i=1,2,3…n);假設(shè)一個(gè)周期總的移動(dòng)位移為lzong,每個(gè)內(nèi)移動(dòng)的距離為li (i=1,2,3…n),有
,設(shè)真實(shí)的點(diǎn)位置為Ci (i=1,2,3…n),作第i個(gè)時(shí)間節(jié)點(diǎn)真實(shí)位置與預(yù)測(cè)位置的絕對(duì)值差?li,在求解納什平衡位置之前,需要對(duì)數(shù)據(jù)集的數(shù)據(jù)進(jìn)行概率評(píng)價(jià)處理。由前文所述的部分,設(shè)
為近域系數(shù),將bi組成的數(shù)據(jù)集計(jì)為數(shù)據(jù)集H,以數(shù)據(jù)集H作為歷史數(shù)據(jù)集,建立基于時(shí)間序列的BP預(yù)測(cè)模型,預(yù)測(cè)未來的近域系數(shù)。
由上述部分,可以歸納出:
式中:?li為第i個(gè)時(shí)間節(jié)點(diǎn)真實(shí)位置與預(yù)測(cè)位置的絕對(duì)值差,bt為t時(shí)刻的近域系數(shù),lzong為一個(gè)周期內(nèi)總的位移距離,lt,t+1為t,t+1時(shí)刻的距離差。
對(duì)于納什平衡的計(jì)算過程,通過對(duì)移動(dòng)智能體歷史數(shù)據(jù)的推演得到t時(shí)刻的預(yù)測(cè)位置,根據(jù)移動(dòng)智能體的近域系數(shù)進(jìn)行預(yù)測(cè),得到t時(shí)刻的bt。
當(dāng)t時(shí)刻,AGV的既定規(guī)劃路徑和安全域產(chǎn)生重合時(shí),發(fā)生博弈[6],雙方存在對(duì)路徑的使用的矛盾,即發(fā)生碰撞。按照各自利益最大化原則,即既定規(guī)劃路徑和安全區(qū)域圓的初始焦點(diǎn)位置是博弈雙方的納什均衡位置。
有了納什均衡的位置,可以求解灰色碰撞概率。即在t時(shí)刻,AGV按照既定路徑運(yùn)行時(shí)發(fā)生碰撞的概率即灰色碰撞概率為:
??????????????????????????????????????? (3)
式中:bt為近域系數(shù)。
在AGV的實(shí)際運(yùn)行中,可以設(shè)定一個(gè)限定的概率值η,當(dāng)P<η,AGV可以適當(dāng)冒險(xiǎn),增加博弈帶來的風(fēng)險(xiǎn);反之,AGV可以通過提前加速、減速或繞行改變既定規(guī)劃路線,來規(guī)避碰撞帶來的損失。
4 算例驗(yàn)證
本次算例模擬場(chǎng)景選取T型路口,如圖6所示,由4個(gè)移動(dòng)智能體和AGV構(gòu)成,使用計(jì)速器模擬數(shù)據(jù)采集,并對(duì)數(shù)據(jù)進(jìn)行處理,作為數(shù)據(jù)的基礎(chǔ)庫(kù)。AGV由X前往Y,通過4個(gè)移動(dòng)智能體隨意走動(dòng),來進(jìn)行算例驗(yàn)證。這里的驗(yàn)證設(shè)計(jì)并沒有真正的AGV存在,算例驗(yàn)證是為了說明相對(duì)位置與時(shí)間的關(guān)系對(duì)防撞評(píng)估造成的影響。
由圖6,經(jīng)過慣性預(yù)測(cè)和價(jià)值評(píng)估,只有4號(hào)移動(dòng)智能體的預(yù)測(cè)價(jià)值更大,本文一秒為30時(shí)刻,取42個(gè)時(shí)刻為預(yù)測(cè)時(shí)間段的歷史數(shù)據(jù)集,以7個(gè)時(shí)刻為一個(gè)周期,預(yù)測(cè)AGV接下來7個(gè)時(shí)刻的橫縱坐標(biāo)的位置,經(jīng)過BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)得的橫縱坐標(biāo)預(yù)測(cè)結(jié)果,如圖7和圖8所示。4號(hào)移動(dòng)智能體橫坐標(biāo)值的維持在5.1-5.15m,縱坐標(biāo)的變化區(qū)間在7.6-8.5m,預(yù)測(cè)效果較為平滑。
經(jīng)過對(duì)4號(hào)移動(dòng)智能體進(jìn)行價(jià)值評(píng)估和軌跡點(diǎn)預(yù)測(cè),接下來需要對(duì)潛在的碰撞點(diǎn)的碰撞概率進(jìn)行求解,為AGV的避讓決策提供依據(jù)。其近域系數(shù)如圖9所示。以前42個(gè)時(shí)刻(6個(gè)時(shí)刻周期)為近域系數(shù)的歷史數(shù)據(jù)集,得到接下來7個(gè)時(shí)刻下每一時(shí)刻對(duì)應(yīng)位置的碰撞灰色碰撞概率。AGV可以利用此種方法通過加速、減速和繞行,甚至停止運(yùn)行來減少碰撞的可能性。
圖9? 碰撞概率預(yù)測(cè)圖
5 結(jié)論
(1)通過構(gòu)建BP神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)移動(dòng)智能體進(jìn)行初步計(jì)算,有效地檢驗(yàn)預(yù)測(cè)模型的有效性,進(jìn)而獲取較為理想的
近域系數(shù)。
(2)通過對(duì)目標(biāo)移動(dòng)智能體的慣性軌跡預(yù)測(cè)與預(yù)測(cè)價(jià)值判斷,忽略預(yù)測(cè)價(jià)值較低的其他移動(dòng)智能體,有效地減少了不必要的計(jì)算量,使得AGV運(yùn)行更為高效。
(3)利用近域系數(shù)組成的歷史數(shù)據(jù)集,構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,得到移動(dòng)機(jī)器人在既定路徑軌跡t時(shí)刻的灰色碰撞概率,為AGV的運(yùn)動(dòng)避讓提供參考。
(4)不足之處在于,對(duì)于非線性位置關(guān)系的長(zhǎng)期預(yù)測(cè),不具有良好的魯棒性。
參考文獻(xiàn)
[1] 陳海燕.基于博弈論的多機(jī)器人個(gè)性化協(xié)作研究[D].中南大學(xué), 2003.
[2] 李洋.基于合作博弈論的社會(huì)化多機(jī)器人協(xié)作方法研究[D].上海大學(xué),2015.
[3] 吳微,陳維強(qiáng),劉波.用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)股票市場(chǎng)漲跌[C]// Optimi -zation Method, Econophysics & Risk Management-proceedings of Ccast.2001.
[4] 李萍,曾令可,稅安澤等.基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)系統(tǒng)的設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用與軟件, 2008(04):155-156+190.
[5] 吳微,陳維強(qiáng),劉波.用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)股票市場(chǎng)漲跌[J].大連理工大學(xué)學(xué)報(bào),2001(01):12-18.
[6] 張菁,何友,彭應(yīng)寧等.基于神經(jīng)網(wǎng)絡(luò)和人工勢(shì)場(chǎng)的協(xié)同博弈路徑規(guī)劃[J].航空學(xué)報(bào),2019(3):223-233.