吳 濤 張 泰
井下探測(cè)機(jī)器人運(yùn)動(dòng)控制與局部路徑規(guī)劃
吳 濤1 張 泰2
1西安石油大學(xué)地球科學(xué)與工程學(xué)院 2長(zhǎng)慶油田第三輸油處
井下探測(cè)機(jī)器人主要是在出現(xiàn)井下安全事故時(shí)進(jìn)入事故現(xiàn)場(chǎng),獲取井下?tīng)顩r信息。其控制系統(tǒng)包括決策控制層、傳感及信息處理層、動(dòng)作執(zhí)行層等三大層次。井下探測(cè)機(jī)器人局部路徑規(guī)劃選擇Q—learning算法。機(jī)器人借助自身所配置的專(zhuān)屬傳感器可以主動(dòng)收集探測(cè)工作所需要的所有數(shù)據(jù),并以所收集到的環(huán)境數(shù)據(jù)為依據(jù)對(duì)工作環(huán)境做出判斷,在此基礎(chǔ)之上提出規(guī)避障礙物的最佳方案。
井下探測(cè)機(jī)器人;運(yùn)動(dòng)控制;局部路徑規(guī)劃;模型
井下探測(cè)機(jī)器人主要是在出現(xiàn)井下安全事故時(shí)進(jìn)入事故現(xiàn)場(chǎng),獲取井下?tīng)顩r信息。在其開(kāi)展探測(cè)的過(guò)程中會(huì)涉及大量數(shù)據(jù)處理分析工作[1],單純依賴(lài)某種類(lèi)型機(jī)器人無(wú)法實(shí)現(xiàn),對(duì)井下探測(cè)機(jī)器人混合型控制系統(tǒng)進(jìn)行深入分析和研究具有重要現(xiàn)實(shí)意義。
1.1 控制系統(tǒng)
為了更好地滿(mǎn)足油田井下事故情況探測(cè)需求,機(jī)器人控制系統(tǒng)應(yīng)具備良好的環(huán)境判斷力、決策規(guī)劃力以及環(huán)境適應(yīng)力,因此井下探測(cè)機(jī)器人應(yīng)配置環(huán)境傳感器、操作狀態(tài)傳感器以及導(dǎo)航信息傳感器等傳感設(shè)備,以及能夠?qū)崿F(xiàn)信息融合、決策及運(yùn)動(dòng)控制的計(jì)算機(jī)。其控制系統(tǒng)包括決策控制層、傳感及信息處理層、動(dòng)作執(zhí)行層等三大層次。
1.2 機(jī)器人姿態(tài)控制
井下探測(cè)機(jī)器人在運(yùn)行過(guò)程中必須確保姿態(tài)平穩(wěn)性及高效性,借助其姿態(tài)運(yùn)動(dòng)學(xué)模型,能夠獲取機(jī)器人運(yùn)行姿態(tài)信息,以該信息為依據(jù)來(lái)評(píng)價(jià)判斷機(jī)器人運(yùn)行狀態(tài)的平穩(wěn)性。機(jī)器人運(yùn)行姿態(tài)穩(wěn)定性評(píng)價(jià)主要包括靜態(tài)穩(wěn)定性及動(dòng)態(tài)穩(wěn)定性?xún)煞矫妫渲徐o態(tài)穩(wěn)定性主要從幾何層面進(jìn)行評(píng)價(jià)[2],而動(dòng)態(tài)穩(wěn)定性主要從能量層面進(jìn)行評(píng)價(jià)。機(jī)器人井下探測(cè)操作的姿態(tài)控制及路徑規(guī)劃主要以其姿態(tài)穩(wěn)定性評(píng)價(jià)結(jié)果為依據(jù)。
依據(jù)邏輯規(guī)則規(guī)劃?rùn)C(jī)器人行為,動(dòng)作解析器所發(fā)出的解析命令傳輸?shù)絼?dòng)作執(zhí)行器,由后者負(fù)責(zé)具體執(zhí)行。油田井下探測(cè)機(jī)器人行為協(xié)調(diào)控制過(guò)程如圖1所示。
圖1 井下探測(cè)機(jī)器人行為協(xié)調(diào)控制過(guò)程
行為協(xié)調(diào)邏輯規(guī)則的作用是對(duì)激活基本行為作出判斷,該評(píng)價(jià)機(jī)制主要是以環(huán)境傳感器所收集到的油田井下環(huán)境數(shù)據(jù)為依據(jù)的。行為協(xié)調(diào)邏輯規(guī)則可以歸結(jié)為以下6點(diǎn):①在實(shí)現(xiàn)既定目標(biāo)的情況下,全部行為則被禁止;②在機(jī)器人自身并未出現(xiàn)傾斜的情況下,姿態(tài)控制行為、越障行為以及路徑規(guī)劃行為也不會(huì)被啟動(dòng);③在機(jī)器人自身傾角出現(xiàn)較為明顯的波動(dòng)情況下,越障行為及路徑規(guī)劃行為是被禁止的;④在機(jī)器人自身傾角存在,但并未發(fā)生較為顯著變化的情況之下,路徑規(guī)劃行為是被禁止的,此時(shí)會(huì)對(duì)坡道子行為進(jìn)行調(diào)取;⑤如果機(jī)器人依據(jù)所收集的相關(guān)數(shù)據(jù)判斷存在地形顯著變化的情況,驅(qū)動(dòng)行為及路徑規(guī)劃行為被禁止;⑥機(jī)器人探測(cè)到障礙的情況下,越障行為被禁止。
2.1 算法選擇
井下探測(cè)機(jī)器人局部路徑規(guī)劃選擇Q—learning算法[3]。使用Q—learning算法環(huán)境模型并非必備條件,其規(guī)劃主要是借助異步動(dòng)態(tài)法來(lái)實(shí)現(xiàn),簡(jiǎn)單的說(shuō),Q—learning算法在不具備初始條件的前提下依然能夠取得決定決策。使用Q—learning算法無(wú)需過(guò)多地關(guān)注環(huán)境模型,只需要在確定可以實(shí)現(xiàn)迭代運(yùn)算的Q函數(shù)下便可以進(jìn)行優(yōu)化。此處的Q函數(shù)可以在既定條件St之下,執(zhí)行動(dòng)作αt,并且之后會(huì)默認(rèn)依據(jù)最優(yōu)動(dòng)作序列完成強(qiáng)化值計(jì)算。Q—learning算法公式表達(dá)式為
之所以選擇Q—learning算法來(lái)進(jìn)行井下探測(cè)機(jī)器人局部路徑優(yōu)化設(shè)計(jì),主要是考慮到該算法可以在初始環(huán)境不明確的情況之下,借助算法優(yōu)化來(lái)確保探測(cè)機(jī)器人花費(fèi)最短的時(shí)間完成路徑優(yōu)化。
2.2 局部路徑規(guī)劃
選擇Q—learning算法開(kāi)展井下探測(cè)機(jī)器人路徑規(guī)劃,探測(cè)機(jī)器人在處于實(shí)際環(huán)境時(shí)可以主動(dòng)收集相關(guān)環(huán)境數(shù)據(jù),從而最大限度地確保環(huán)境數(shù)據(jù)與實(shí)際吻合度,有效避免了因?qū)Τ跏辑h(huán)境數(shù)據(jù)進(jìn)行更新所付出的費(fèi)用。機(jī)器人借助自身所配置的專(zhuān)屬傳感器可以主動(dòng)收集探測(cè)工作所需要的所有數(shù)據(jù),并以所收集到的環(huán)境數(shù)據(jù)為依據(jù)對(duì)工作環(huán)境做出判斷,在此基礎(chǔ)之上提出規(guī)避障礙物的最佳方案。對(duì)于一般的障礙物而言,井下探測(cè)機(jī)器人要成功規(guī)避需依靠通常具有八個(gè)方向的測(cè)距傳感器,環(huán)境數(shù)據(jù)借助這些傳感器向核心芯片進(jìn)行傳輸,由后者負(fù)責(zé)計(jì)算障礙物與機(jī)器人的距離,并以該計(jì)算結(jié)果為依據(jù),推導(dǎo)出安全路徑。
井下探測(cè)機(jī)器人主要是用來(lái)對(duì)較為復(fù)雜的油田井下環(huán)境數(shù)據(jù)進(jìn)行收集,在實(shí)踐操作當(dāng)中,機(jī)器人會(huì)根據(jù)具體工作的地形環(huán)境來(lái)選擇最適宜的行為方式,但對(duì)于地形較為復(fù)雜的環(huán)境而言,就需要組合使用數(shù)種行為方式。依據(jù)邏輯規(guī)則規(guī)劃?rùn)C(jī)器人行為便會(huì)生成數(shù)個(gè)基本行為所構(gòu)成的動(dòng)作,動(dòng)作解析器所發(fā)出的解析命令傳輸?shù)絼?dòng)作執(zhí)行器,由后者負(fù)責(zé)具體執(zhí)行。
[1]李曉鵬.煤礦探測(cè)機(jī)器人空間建模分析及避障路徑規(guī)劃[J].煤炭科學(xué)技術(shù),2013,12(1):123-124.
[2]田海波,馬宏偉,魏娟.礦井搜救機(jī)器人移動(dòng)系統(tǒng)的研究與發(fā)展[J].機(jī)床與液壓,2012,45(10):234-235.
[3]Oscar Castillo,Leonardo Trujillo,Patricia Melin.Multiple Objective Genetic Algorithms for Path-planning Optimization in Autonomous Mobile Robots[J].Soft Computing,2007,45(3):56-57.
(欄目主持 楊 軍)
10.3969/j.issn.1006-6896.2014.3.016
基金論文:黑龍江省教育廳科學(xué)技術(shù)研究項(xiàng)目(12511006)(12531075);863計(jì)劃項(xiàng)目(2012AA061303)。