梁聰聰,焦國太,張 可,陳建文
(中北大學機電工程學院,山西 太原 030051)
傳統(tǒng)的雷場一旦部署就無法調(diào)整,在現(xiàn)代多種掃雷手段面前,已經(jīng)達不到理想的封鎖效果。為解決上述問題,智能自修復雷場中各個地雷不但具有自主移動能力,而且具有目標識別、定位和通信能力,一旦雷場因作戰(zhàn)消耗或敵方掃雷出現(xiàn)缺口,雷場能判斷缺口,根據(jù)相應(yīng)的修復策略自主移動地雷填補缺口,重新恢復對作戰(zhàn)區(qū)域的封鎖[1]。
目前自修復雷場系統(tǒng)由美國幾家公司共同研究,美國Sandia公司采取的修復策略為蜂窩式修復,該方案最終達到的理想效果是節(jié)點之間為無縫分布,即兩節(jié)點間的距離為期望距離,多節(jié)點組成期望的分布結(jié)構(gòu),但該方案要使封鎖區(qū)域所有節(jié)點連續(xù)多次跳躍才能達到期望分布。美國SAIC公司提出多模式修復的策略,根據(jù)節(jié)點掌握雷場缺口信息的多少來采用不同的修復策略。當雷場缺口信息全部可知時,采用缺口定位模式;當雷場缺口信息部分可知時,采用鄰居節(jié)點修復模式;當雷場缺口信息很少或不可知時,采用隨機跳動修復模式。該方案對缺口信息有依賴性,對缺口的信息融合有較高要求[1]。
針對雷場多次跳躍引起的修復效率問題,本文引入智能代理(Agent)體系,提出基于智能Agent的雷場自修復策略。
智能Agent是代表一切具有智能(無論自然智能,還是人工智能)的實體的一個抽象名詞,因此,它可描述機器人、智能設(shè)備、智能軟件等。智能Agent置身于某種環(huán)境中,通過傳感器感知環(huán)境,通過效應(yīng)器作用于環(huán)境。智能gent不能在環(huán)境中單獨存在,而要與多個智能Agent在同一環(huán)境中協(xié)同工作,協(xié)同的手段是相互通信,但每個智能Agent都是主動、自治地工作。它具有以下四個特征:1)自治性,A-gent可以在沒有人或其他Agent直接干預的情況下運作,而且對自己的行為和內(nèi)部狀態(tài)有某種控制能力;2)社會性,Agent和其他Agent通過某種A-gent語言進行信息交流;3)反應(yīng)性,Agent能夠理解周圍的環(huán)境,并對環(huán)境的變化作出實時響應(yīng);4)能動性,Agent不僅簡單地對環(huán)境作出反應(yīng),也能夠通過接受某些啟動信息,表現(xiàn)出有目的的行為[2]。
“黑板模型”是一種已經(jīng)被廣泛使用的協(xié)調(diào)方法,并且相應(yīng)的技術(shù)已較為成熟。黑板系統(tǒng)采用合適的結(jié)構(gòu)支持分布式問題求解。在多Agent系統(tǒng)中,黑板提供公共工作區(qū),Agent可以交換信息、數(shù)據(jù)和知識?!昂诎迥P汀敝饕伞昂诎濉?、知識源和控制機構(gòu)三大部分組成,結(jié)構(gòu)如圖1所示。
圖1 黑板模型圖Fig.1 Blackboard model
1)黑板
所謂“黑板”,就是一個分層的全局工作區(qū)(或稱全局數(shù)據(jù)庫)。它用來存儲初始數(shù)據(jù)、中間結(jié)果和最終結(jié)果。整個黑板被分為若干層,每一層用于描述領(lǐng)域問題的某一類信息。高層信息可以看作是下層信息的抽象(或整體),反之,下層信息可以看作是上層信息的實例(或部分)。
2)知識源
所謂知識源,就是一個知識模塊。黑板結(jié)構(gòu)中具有多個知識源,每個知識源能用來完成某些特定的解題功能。知識源可以表示完成過程、規(guī)則集或邏輯斷言等形式。知識源之間互相獨立,它們只能通過黑板進行通訊和互相調(diào)用。
3)控制機構(gòu)
控制機構(gòu)是求解問題的推理機構(gòu),由監(jiān)督程序和調(diào)度程序組成。監(jiān)督程序時刻注視著黑板狀態(tài),根據(jù)黑板狀態(tài)采用某種策略選擇合適的知識源。調(diào)度程序通過選擇所謂“聚焦”來優(yōu)先使用隊列中最重要、最有希望的知識源來執(zhí)行[3]。
多Agent系統(tǒng)已獲得十分廣泛的應(yīng)用,涉及機器人協(xié)調(diào)、過程控制、遠程通信等。移動機器人系統(tǒng),其協(xié)調(diào)十分重要。機器人足球比賽是一種典型的協(xié)調(diào)多Agent系統(tǒng)。在比賽中,多機器人系統(tǒng)利用全局信息、知識和技能,通過多Agent系統(tǒng)協(xié)調(diào)作用,合作完成單機器人無法獨立完成的復雜任務(wù)[3]。
針對目前雷場修復策略下修復能力有限問題,本文引入智能Agent體系,分析缺口狀態(tài)并進行有針對性的修復。采用“黑板模型”進行缺口信息的融合,提高信息融合效率。當偵測到雷場有缺口產(chǎn)生時,封鎖區(qū)域通過“缺口黑板”進行缺口信息融合,修復算法依據(jù)節(jié)點在缺口中的位置給出各節(jié)點的運動公式。這一過程各個節(jié)點均相當于一個智能Agent,并與其他節(jié)點實時交流修復進程,多節(jié)點共同協(xié)作完成修復任務(wù)。
在研究雷場自修復策略前,對雷場各地雷節(jié)點作如下假設(shè):1)假設(shè)每個地雷可以實時確定自己的雷場坐標;2)假設(shè)地雷節(jié)點基于扇區(qū)接受它周圍地雷的無線電信號,設(shè)定每個地雷具有6個探測扇區(qū),地雷接受探測扇區(qū)內(nèi)所有的地雷節(jié)點信號,通過地雷坐標和雷場結(jié)構(gòu)模型分析出“鄰居”節(jié)點,地雷與“鄰居”節(jié)點建立連接,將其納入雷場網(wǎng)絡(luò),并通過“鄰居”節(jié)點與其他節(jié)點進行通信;3)假設(shè)每個地雷靠跳躍移動,在其6個方向上有6個微型火箭(一種跳躍機構(gòu),包括可控的火藥點火裝置),這樣在雷場范圍內(nèi),地雷節(jié)點在有限的方向上具有可控的移動能力[4]。
在雷場中,每個地雷節(jié)點都是一個智能Agent,它能探測到周圍節(jié)點的變化,并能判斷出缺口大小和方位。每個節(jié)點探測到的是缺口的部分信息,通過與其他節(jié)點交換缺口信息并進行信息融合,Agent節(jié)點可知缺口的輪廓和方位,并分析缺口模型,確定自己在缺口中的位置,最后根據(jù)相應(yīng)的修復策略進行修復。在分析雷場修復環(huán)境的基礎(chǔ)上,本文提出了一種以自修復算法驅(qū)動Agent動作的雷場Agent節(jié)點模型(見圖2)。
圖2 策略驅(qū)動的Agent節(jié)點結(jié)構(gòu)框圖Fig.2 Agent node frame
通信與協(xié)作是實現(xiàn)多個Agent地雷節(jié)點之間進行協(xié)同修復工作的關(guān)鍵。各個Agent地雷節(jié)點之間的通信是通過Agent間的交互來實現(xiàn)。目前智能Agent的通信及協(xié)作方式,基本上可以分為“黑板模型”和“消息傳遞”兩種方式:第一類是廣播通信形式,屬同步消息傳遞,把消息放在廣泛可取的黑板上,每個Agent均可以向黑板發(fā)送消息,也可以從黑板讀取信息;第二類是消息傳遞通信方式,屬于異步消息傳遞,即一個Agent可以向一個或多個Agent發(fā)送消息,采用點對點的傳遞方式。
根據(jù)雷場的結(jié)構(gòu)及通信方式,本文中的地雷Agent節(jié)點采取“消息傳遞”與 “黑板模型”相結(jié)合的通信機制。雷場主體通信采用“消息傳遞”的點對點傳遞方式,當出現(xiàn)缺口時,缺口邊界節(jié)點建立“缺口黑板模型”來存放缺口信息,各邊界節(jié)點對“缺口黑板模型”進行缺口信息的融合及更新,并將“缺口黑板模型”傳遞給其周圍的邊界節(jié)點。當“缺口黑板模型”遍歷整個缺口邊界的節(jié)點后,“黑板模型”便掌握了缺口的邊界信息,最后將信息告知缺口邊界的各個節(jié)點(見圖3)。
圖3 節(jié)點的通信機制Fig.3 Node communication mechanism
雷場的修復算法以節(jié)點最少移動來減少能耗為原則對缺口進行修復,即在封鎖住缺口的前提下,以節(jié)點的移動次數(shù)最小和移動距離最短為原則。修復后的節(jié)點應(yīng)與雷場建立連接,以通知缺口的修復情況。針對雷場的點對點通信方式,移動后的修復節(jié)點應(yīng)與最近的雷場節(jié)點保持在雷場通信距離l內(nèi)(雷場封鎖邊長),以便與雷場進行通信。因此,在矩形缺口區(qū)域內(nèi),按雷場結(jié)構(gòu)和通信距離進行斜線封鎖 (見圖4)。
圖4 修復策略圖Fig.4 Repair strategy
“缺口黑板模型”經(jīng)信息融合之后便可計算出缺口的縱向深度L和橫向?qū)挾萕(L>W(wǎng)),修復算法依據(jù)L和W 計算出修復位置的坐標。雷場坐標采用第一象限,選取邊界節(jié)點為基點,通過迭代依次計算出個修復位置的坐標。
當n=NW時,修復斜線已經(jīng)到達缺口邊界,計算出此時的修復坐標(xn,yn),選取與此坐標誤差最小的一個邊界節(jié)點的坐標來代替(xn,yn),進行誤差校正。并采用式(2)進行反向修復。
當n為NW的整數(shù)倍時,就進行一次修復坐標的誤差校正和式(1)、式(2)的交替選?。ㄒ妶D5)。
圖5 修復位置坐標計算原理圖Fig.5 Coor dinate calculate principle
當雷場出現(xiàn)缺口時,缺口邊界各Agent節(jié)首先進行橫向修復并建立“缺口黑板模型”,“缺口黑板模型”在信息融合后把缺口的全局信息提供給修復算法,修復算法計算出修復位置坐標后,通過“缺口黑板模型”傳遞給各缺口邊界節(jié)點并進行修復。修復過程如圖6所示。
圖6 修復流程圖Fig.6 Repair flow chart
雷場修復能力仿真程序采用C++語言編寫。每個地雷節(jié)點用圓圈表示,分別編寫布雷、掃雷和修復函數(shù)來模擬雷場的修復過程。
雷場初始結(jié)構(gòu)分布是由大規(guī)模布撒來完成的。用于封鎖的兩個地雷間的距離小于等于兩倍的最小殺傷半徑,各個節(jié)點圍成等邊三角形封鎖,封鎖邊長為l。運行布雷函數(shù)來模擬布撒雷場結(jié)果(見圖7)。
圖7 初始雷場分布Fig.7 The initialize distributing of minefields
從圖7可以看出:每個節(jié)點周圍劃分出6個均等的扇區(qū),以封鎖邊長l為兩“鄰居”節(jié)點的距離,按照正六邊形結(jié)構(gòu)設(shè)定每個扇區(qū)內(nèi)只有一個“鄰居”節(jié)點,這樣節(jié)點在其所有探測扇區(qū)內(nèi)共可探測到6個“鄰居”節(jié)點,分別對6個方向進行封鎖。
掃雷程序運行后雷場被徹底掃通,出現(xiàn)掃雷通路。雷場被掃雷通路分為互不相連的兩部分(見圖8)。
圖8 掃雷后雷場分布Fig.8 Minefields distributing after mine sweeping
雷場被徹底掃通后,由于“缺口黑板模型”只掌握了缺口的縱向信息,因此被分開的兩部分雷場首先進行了探索修復與對方建立連接進而掌握缺口的橫向信息。
當運行修復程序后,被分割的兩部分雷場首先進行橫向探索修復與對方建立連接,通過信息融合掌握缺口的全局信息并計算缺口面積,橫向修復后的結(jié)果如圖9所示。
圖9 橫向探索修復Fig.9 Landscape orientation explore repair
從圖9可以看出:被截斷的兩部分雷場進行橫向探索修復時,首先把雷場缺口最底部的邊界節(jié)點激活,激活的兩個節(jié)點分別在各自的雷場內(nèi)尋找可用的修復節(jié)點進行橫向移動修復,當兩個方向的修復節(jié)點建立連接后橫向修復完成。
隨著修復函數(shù)的繼續(xù)運行,由修復公式計算出的修復位置坐標傳遞給各個邊界節(jié)點,距修復坐標最近的邊界節(jié)點尋找可用修復節(jié)點進行修復。修復后的雷場分布如圖10所示。
圖10 修復后雷場分布Fig.10 Minefields distributing after repairing
從圖10可以看出:缺口邊界各節(jié)點找到了合適的修復節(jié)點并進行了移動修復,勢必會對原雷場結(jié)構(gòu)造成影響,但不會對原封鎖區(qū)域的封鎖效果和通信能力造成功能性破壞。原封鎖區(qū)域通過相鄰節(jié)點的傳遞仍可以和其他節(jié)點進行通信,修復節(jié)點移動后的無雷方向仍被封鎖。
修復過程顯示,修復函數(shù)運行前,雷場共被掃去40顆雷,修復函數(shù)運行后,雷場僅向缺口區(qū)域移動了9顆雷進行封鎖,在保持雷場能夠進行有效封鎖和通信的基礎(chǔ)上,達到了移動次數(shù)最少,避免修復節(jié)點多次跳躍的目的。
本文提出了基于智能Agent的雷場自修復策略,該策略引入智能Agent體系,利用“缺口黑板模型”進行缺口信息融合,修復算法以節(jié)點最少移動為原則進行缺口修復。仿真結(jié)果表明:該修復策略能對缺口信息作出快速反應(yīng),進行全局規(guī)劃修復,避免了修復節(jié)點的多次跳躍??紤]到多次掃雷的情況,雷場不斷修復后的封鎖效能問題有待進一步研究。
[1]Tho msa W Altshuler.The self healing minefield program[EB/OL].[2011-09-20]http:// www.darpa.mil/ato/programs/SH M/index.ht ml.
[2]吳勝,王書芹.人工智能基礎(chǔ)與應(yīng)用[M].北京:電子工業(yè)出版社,2007.
[3]王宏生,孟國艷.人工智能及其應(yīng)用[M].北京:國防工業(yè)出版社,2009.
[4]秦棟澤,聶宏斌,陸世杰,等.自修復雷場自修復能力分析[J].中北大學學報,2009,30(2):143-146.QIN Dongge,NIE Hongbin,LU Shijie,et al.Analysis self-h(huán)ealing capacity of the self-h(huán)ealing minefield[J].Journal of North University of China,2009,30(2):143-146.