龐維建, 李 輝, 黃 謙, 李 朋, 馬賢明
(1. 軍事科學(xué)院, 北京 100091; 2. 北京航空工程技術(shù)研究中心, 北京 100076)
當(dāng)前,世界主要軍事強國都將無人系統(tǒng)研究置于重要的位置,尤其是具備自主能力的無人系統(tǒng)。能夠完成復(fù)雜任務(wù)的智能規(guī)劃和決策是自主能力的重要標(biāo)志。
在美軍的自主控制等級(autonomous control level,ACL)分級中,ACL7級以上為高級自主性,ACL7級的定義為“編隊?wèi)?zhàn)術(shù)目標(biāo)”。吳森堂提出的導(dǎo)彈自主編隊協(xié)同制導(dǎo)控制等級(cooperation guidance & control level for missile autonomous formation, CGCL)對最高級自主性——自主自治的定義為能夠進行“使命任務(wù)運籌和戰(zhàn)術(shù)任務(wù)動態(tài)規(guī)劃”。
“戰(zhàn)術(shù)目標(biāo)”和“使命任務(wù)”都是相對抽象的任務(wù)指令,這種任務(wù)指令往往僅明確了任務(wù)的目標(biāo)或者最終狀態(tài),而為了達到任務(wù)目標(biāo)應(yīng)該執(zhí)行哪些行動、如何執(zhí)行等任務(wù)規(guī)劃將由無人系統(tǒng)自主完成。
當(dāng)前,無人系統(tǒng)任務(wù)規(guī)劃的研究主要集中在任務(wù)分配和航跡/軌跡規(guī)劃兩個方面,將規(guī)劃問題看作組合優(yōu)化問題,在遺傳算法、粒子群算法、蟻群算法、多智能進化算法等智能算法的輔助下完成問題的求解。但是,從本質(zhì)上來看,任務(wù)分配屬于調(diào)度問題,解決的是誰去做的問題,航跡/軌跡規(guī)劃屬于運動規(guī)劃問題,解決的是如何去做的問題。對于一個任務(wù)來說,在解決怎么做和誰去做的問題之前,需要解決做什么的問題,這是任務(wù)規(guī)劃需要完成的工作。例如無人機偵察打擊任務(wù),無人機完成這個復(fù)合任務(wù)需要根據(jù)所處狀態(tài)判斷執(zhí)行起飛、機動到目標(biāo)區(qū)域、打開傳感器、搜索目標(biāo)、打擊目標(biāo)、評估打擊效果等子任務(wù)。這些子任務(wù)的規(guī)劃屬于符號規(guī)劃問題,但當(dāng)前無人系統(tǒng)自主處理和規(guī)劃這些子任務(wù)的能力還很弱,針對此類問題的研究也很少。
實現(xiàn)這種智能規(guī)劃能力的關(guān)鍵因素是知識和處理知識的能力。這意味著需要一種能夠形式化表示和處理戰(zhàn)場環(huán)境、作戰(zhàn)任務(wù)等知識的方法,使無人系統(tǒng)能夠獲取、表示和理解所需的戰(zhàn)場知識,并根據(jù)獲取的知識進行任務(wù)的智能規(guī)劃。
本體技術(shù)是一種形式化的知識表示方法,在服務(wù)型機器人和自動化領(lǐng)域具有比較深厚的研究基礎(chǔ),在自主規(guī)劃、抓取策略、智能空間認知等方面取得了大量的研究成果。軍事領(lǐng)域中,本體技術(shù)在戰(zhàn)場態(tài)勢表示與評估、多源信息融合、作戰(zhàn)計劃表示與校驗、決策支持等方面的應(yīng)用較為成熟,并逐步應(yīng)用到空間站短期規(guī)劃、生物恐怖事件救援任務(wù)決策、艦空導(dǎo)彈防空任務(wù)規(guī)劃中,促進了軍事任務(wù)規(guī)劃和決策智能化的發(fā)展。
近幾年來本體技術(shù)開始應(yīng)用于無人機、無人駕駛汽車和無人潛航器等領(lǐng)域中,在異構(gòu)知識庫集成、態(tài)勢表示與評估、智能決策、駕駛意圖預(yù)測等方面得到了有效應(yīng)用。
如何系統(tǒng)規(guī)范地存儲和表示戰(zhàn)場知識,使無人系統(tǒng)能夠根據(jù)人類指揮員的高層任務(wù)指令,快速地獲取戰(zhàn)場知識和作戰(zhàn)領(lǐng)域經(jīng)驗知識,自主完成任務(wù)規(guī)劃,并在執(zhí)行過程中進行任務(wù)的重規(guī)劃和智能決策,已經(jīng)成為一個新的研究領(lǐng)域。
本文首先對任務(wù)規(guī)劃領(lǐng)域的概念、方法和知識表示方法進行系統(tǒng)梳理,分析了任務(wù)規(guī)劃領(lǐng)域的發(fā)展方向,提出了基于本體的任務(wù)規(guī)劃框架。然后,介紹了本體在機器人自主化、軍事任務(wù)規(guī)劃領(lǐng)域的應(yīng)用情況,明確了本體在任務(wù)規(guī)劃中的作用,分析了當(dāng)前基于本體的任務(wù)規(guī)劃研究現(xiàn)狀和存在的問題,并提出若干重要的研究方向。最后,論述了無人系統(tǒng)任務(wù)規(guī)劃本體的構(gòu)建原則和關(guān)鍵能力指標(biāo)。
路徑/航跡規(guī)劃是在連續(xù)空間中規(guī)劃一條從起始點到終點的可行路徑,一般不考慮時間因素。無人機的航跡規(guī)劃、無人車的路徑規(guī)劃都屬于路徑/航跡規(guī)劃的范疇,是空間約束下的優(yōu)化問題。
軌跡規(guī)劃在跟蹤空間位置的同時,還需要對速度進行跟蹤。此外,軌跡規(guī)劃通常考慮三維場景,如機械臂的運動規(guī)劃通常是軌跡規(guī)劃,不僅要滿足空間約束,也要滿足時間約束。
路徑/航跡規(guī)劃和軌跡規(guī)劃統(tǒng)稱為運動規(guī)劃,其解決的是怎么做的問題。
任務(wù)規(guī)劃的定義有多種,但總體上來說,任務(wù)規(guī)劃是尋找使問題從初始狀態(tài)轉(zhuǎn)移到目標(biāo)狀態(tài)的一系列行動的過程。任務(wù)規(guī)劃主要解決做什么的問題,通過推理行動的結(jié)果,在一系列可能的行動中做出選擇。
調(diào)度是在一段時間內(nèi)為任務(wù)分配有限資源的問題。調(diào)度是一種特殊的情況,在這種情況下已經(jīng)選擇了行動,只留下分配這些任務(wù)的問題。調(diào)度通常被看作是任務(wù)規(guī)劃的子問題。
(1) 經(jīng)典任務(wù)規(guī)劃范式。斯坦福問題求解器(Stanford research institute problem solver, STRIPS)是第一個經(jīng)典任務(wù)規(guī)劃求解器,問題被描述為實現(xiàn)既定目標(biāo),提出了一種使用預(yù)先條件和效果表示可執(zhí)行行動的算子,稱為STRIPS算子。經(jīng)典任務(wù)規(guī)劃在早期人工智能研究中得到廣泛的應(yīng)用,但是這種方法沒有明確的時間模型,無法表示任務(wù)的資源消耗和需求,無法表征不確定信息,且只能指定達到的目標(biāo)。
(2) 分層任務(wù)網(wǎng)絡(luò)(hierarchical task network, HTN)。采用遞歸方法將高層任務(wù)擴展為底層任務(wù)。擴展過程由稱為“方法”的規(guī)則驅(qū)動,“方法”可以看作是從高層任務(wù)到部分有序任務(wù)網(wǎng)絡(luò)的映射以及行動約束集合。HTN最大的優(yōu)勢是可以通過設(shè)計“方法”來控制任務(wù)分解的過程,而在經(jīng)典的規(guī)劃方法中行動的條件和效果只是明確了什么情況下可以使用該行動。HTN規(guī)劃方法在實際問題中得到廣泛的應(yīng)用。
(3) 決策論規(guī)劃方法。決策論規(guī)劃方法將規(guī)劃問題建模為馬爾可夫決策過程,這種規(guī)劃方法中狀態(tài)的轉(zhuǎn)移是概率的,特別適用于處理不確定情況下的規(guī)劃問題。但是,馬爾可夫決策過程難以解決具有任務(wù)目標(biāo)的規(guī)劃問題。
(1) 任務(wù)規(guī)劃表示語言。規(guī)劃表示語言是實現(xiàn)任務(wù)規(guī)劃的第一步,STRIPS算子兼有規(guī)劃問題表示和操作的能力,實現(xiàn)了規(guī)劃問題的規(guī)范化表示,使規(guī)劃問題的求解更加方便。文獻[32]提出的體系結(jié)構(gòu)描述語言,是STRIPS的早期擴展版本,相對于STRIPS提高了表示能力,但是語義模糊沒有獲得廣泛的應(yīng)用。規(guī)劃領(lǐng)域定義語言(planning domain definition language,PDDL)是一種標(biāo)準(zhǔn)化的任務(wù)表示語言,也是最常用的描述語言。PDDL是一種純符號化方法描述規(guī)劃問題的語言,無法描述涉及導(dǎo)航等幾何計算的子問題。概率PDDL(probabilistic PDDL,PPDDL)是在PDDL語言的基礎(chǔ)上擴展而來,能夠以概率方式表示行動的結(jié)果,具備概率規(guī)劃能力。面向?qū)ο蟮囊?guī)劃語言,融合了面向?qū)ο缶幊痰膬?yōu)點,通過一個特定的接口,擴展了符號規(guī)劃結(jié)果的外部訪問特性。
(2) 任務(wù)規(guī)劃領(lǐng)域知識表示方法。Nau和Knoblock等開始了規(guī)劃領(lǐng)域建模的工作,并指出任務(wù)規(guī)劃中需要更好的知識建模方法和更豐富的規(guī)劃知識。文獻[38]和文獻[39]針對一般任務(wù)構(gòu)建了領(lǐng)域知識本體。Yolanda等人提出了一種聚焦計劃表示(plan semantic net,PLANET)的本體,是一種聚焦計劃表示的本體,通過將狀態(tài)和行動的推理區(qū)別化對待的框架,通過映射規(guī)則實現(xiàn)非形式化文本中的語義, PLANET定義了計劃上下文、目標(biāo)、行動和任務(wù),以及決策點等概念,并設(shè)計了聯(lián)合作戰(zhàn)空中任務(wù)指揮官本體、行動方針分析本體、對應(yīng)變反應(yīng)本體3種實用性的本體。但是,文獻[38-40]也指出本體存在粒度無法支撐應(yīng)用需要,缺少重要概念,沒有考慮時間等問題。針對早期本體存在的這些問題,Rajpathak等聚焦任務(wù)的形式化問題,形成了獨立于特定領(lǐng)域、應(yīng)用和推理方法的通用任務(wù)本體,明確了任務(wù)的初始狀態(tài)、目標(biāo)、計劃、行動、代理、參數(shù)、時間域、約束、前提、成本函數(shù)、方案標(biāo)準(zhǔn)和規(guī)劃模型等關(guān)鍵概念和準(zhǔn)則。值得注意的是,Enrico提出的本體模型是基于業(yè)務(wù)概念建模語言(operational conceptual modelling language, OCML),但是提供了從OCML轉(zhuǎn)換到網(wǎng)絡(luò)本體語言(ontology web language,OWL)的機制,而在2004年OWL成為萬維網(wǎng)聯(lián)盟的推薦標(biāo)準(zhǔn),并在之后成為比較重要和常用的本體建模語言。
(3) 不確定性知識表示方法。在現(xiàn)實世界中,特別是戰(zhàn)場環(huán)境中,無人系統(tǒng)面臨著處理大量不確定信息的情景,不確定性知識表示對于無人系統(tǒng)來說至關(guān)重要。當(dāng)前處理不確定知識的數(shù)學(xué)理論主要有:模糊邏輯、貝葉斯網(wǎng)絡(luò)、馬爾可夫邏輯網(wǎng)絡(luò)等。文獻[44]將模糊邏輯引入到本體中,使用OWL2實現(xiàn)了模糊本體,通過概率注釋方法表示信息的不確定性,能夠表示模糊數(shù)據(jù)類型、模糊概念、模糊修飾符等模糊本體元素。文獻[45]提出了一種從零開始構(gòu)建模糊本體開發(fā)方法,并基于這種方法構(gòu)建了一個海底環(huán)境的模糊本體。多實體貝葉斯網(wǎng)絡(luò)(multi-entities Bayesian network,MEBN)是貝葉斯網(wǎng)絡(luò)的擴展,使用實體集合及實體之間的各種關(guān)系來表征環(huán)境中的不確定性。基于MEBN理論實現(xiàn)的本體技術(shù),可以有效地解決推理問題,提高無人系統(tǒng)在任務(wù)執(zhí)行過程中的應(yīng)對能力,在欺詐檢測、海事預(yù)警等領(lǐng)域都有應(yīng)用,如圖1所示。
圖1 用于估計海洋污染緊急程度的MEBN模型Fig.1 MEBN model for estimating emergency level of marine pollution
隨著無人系統(tǒng)執(zhí)行能力的提升,現(xiàn)實中的復(fù)雜任務(wù)不能再孤立地考慮任務(wù)規(guī)劃和運動規(guī)劃,許多行動都具有邏輯上和空間上的依賴性,以何種順序執(zhí)行何種行動與該行動如何在物理世界中執(zhí)行密切相關(guān)。因此,需要研究集成了任務(wù)規(guī)劃和運動規(guī)劃的規(guī)劃技術(shù)。文獻[49]首次提出了任務(wù)&運動規(guī)劃(task and motion planning, TMP)的概念,并提出了相應(yīng)的測試集。TMP處理的不僅是空間優(yōu)化問題,而且需要進行邏輯域中的知識推理。文獻[50]首次將邏輯推理問題與空間搜索問題結(jié)合起來進行研究,提出了一種將任務(wù)規(guī)劃使用的基于符號的表示方法與運動規(guī)劃使用的數(shù)值表示方法鏈接起來的機制,規(guī)劃過程中不僅考慮符號約束,同時考慮空間約束。文獻[51]介紹了一種用于表示行動帶來的物理作用的“語義附件”,使規(guī)劃器能夠在運行時計算狀態(tài)變量的值,為符號規(guī)劃中判斷行動是否可行提供支持。文獻[35]提出了一種面向?qū)ο蟮囊?guī)劃語言,與“語義附件”的功能類似,旨在通過外部訪問為符號規(guī)劃器提供數(shù)值變量,實現(xiàn)涉及數(shù)值的規(guī)劃。文獻[52]將“流”作為運動規(guī)劃與PDDL語言之間的接口,實現(xiàn)了不限于特定領(lǐng)域的集成了數(shù)值計算模塊的規(guī)劃語言。
TMP概念中,任務(wù)規(guī)劃、運動規(guī)劃與知識之間存在著緊密的聯(lián)系,如圖2所示。
圖2 知識與TMP關(guān)系Fig.2 Relationship between knowledge and TMP
AlphaGo的成功掀起了連接主義人工智能研究的熱潮。但是隨著研究的深入,深度學(xué)習(xí)的脆弱性也逐漸被發(fā)現(xiàn)。文獻[55]中介紹了第三代人工智能的三空間模型,提出將感覺提升為感知(符號)時機器就具備理解和基于知識的推理能力。文獻[56]也指出智能決策的實現(xiàn)過程中,如何利用已有的知識是一個重要的問題??梢?具備自主性的無人系統(tǒng)任務(wù)規(guī)劃融合了知識推理與空間優(yōu)化的優(yōu)勢,符合下一代人工智能的發(fā)展方向。
因此,未來具備高度自主能力的無人系統(tǒng)任務(wù)規(guī)劃必然是融合了知識推理與空間優(yōu)化的復(fù)合體,可以稱之為基于本體的任務(wù)規(guī)劃。其框架如圖3所示。
圖3 基于本體的任務(wù)規(guī)劃框架Fig.3 Framework of ontology-based task planning
基于本體的任務(wù)規(guī)劃是知識推理與任務(wù)規(guī)劃的結(jié)合體,其內(nèi)涵可概括如下。
內(nèi)涵之一:基于知識實現(xiàn)任務(wù)規(guī)劃?;谥R意味著規(guī)劃可以充分利用經(jīng)驗信息,這種經(jīng)驗信息包含人類的任務(wù)經(jīng)驗、無人系統(tǒng)在歷次任務(wù)執(zhí)行過程中學(xué)習(xí)到的經(jīng)驗,以及在虛擬的仿真世界中學(xué)習(xí)到的經(jīng)驗?;谥R意味著無人系統(tǒng)的任務(wù)規(guī)劃具備了成長性和共享性的特征,能夠像人類一樣根據(jù)經(jīng)驗更好地完成某項任務(wù)。
內(nèi)涵之二:任務(wù)規(guī)劃與運動規(guī)劃的集成規(guī)劃框架。任務(wù)規(guī)劃的作戰(zhàn)行動序列生成、任務(wù)分配和航跡規(guī)劃三個階段本身具備高度的耦合性。在無人系統(tǒng)協(xié)同作戰(zhàn)問題領(lǐng)域中,這種信息的耦合更加緊密?;诒倔w的任務(wù)規(guī)劃立足于高層任務(wù)規(guī)劃,同時考慮任務(wù)規(guī)劃與運動規(guī)劃的融合,實現(xiàn)無人系統(tǒng)任務(wù)的智能規(guī)劃。
內(nèi)涵之三:通過對數(shù)據(jù)和信息的知識化提高智能水平。知識化的作用有兩個:一是便于信息和數(shù)據(jù)在無人系統(tǒng)之間的共享;二是結(jié)構(gòu)化的知識更便于解釋和推理。當(dāng)前受到廣泛關(guān)注的各種學(xué)習(xí)算法,本質(zhì)上是在學(xué)習(xí)一種知識。這些知識需要有一個規(guī)范的表示和交互方式,以支持各類無人系統(tǒng)進行查詢、共享和推理,提高智能的泛化性能。
本體技術(shù)在機器人和自動化領(lǐng)域得到了廣泛的關(guān)注,研究基礎(chǔ)也最為深厚。因為,相對于無人機等無人裝備來說,機器人的任務(wù)規(guī)劃需要組織和籌劃的行動更多,各行動之間也通常需要邏輯上的合理性和時間上的接續(xù)性。如對于送水服務(wù)來說,機器人需要完成移動到水杯位置、拿起水杯、移動到接水臺、按壓按鈕、松開按鈕、移動到顧客位置、遞送水杯等一系列行動,同時還需要獲取水杯位置、抓取策略、接水臺位置、顧客位置等知識信息,并處理水是否接滿這樣的模糊問題。
雖然,機器人任務(wù)規(guī)劃問題與無人機等無人作戰(zhàn)系統(tǒng)的任務(wù)規(guī)劃是不同的任務(wù)領(lǐng)域,但是兩者都需要解決行動的組織和籌劃問題,都面臨著任務(wù)的分解,以及知識的表示、共享和處理等問題。因此,本體在機器人任務(wù)智能規(guī)劃領(lǐng)域的研究對于解決無人系統(tǒng)智能規(guī)劃問題具有較大的參考價值。
RoboBrain是一個超大規(guī)模的機器人知識引擎,從互聯(lián)網(wǎng)和合作伙伴處獲取知識,并對這些知識進行整合,從而形成一個龐大的機器人知識引擎。該項目采用基于對象的數(shù)據(jù)庫進行知識的存儲,致力于實現(xiàn)一個機器人學(xué)習(xí)和共享知識的知識引擎,在人機交互、自然語言理解、機器人感知和任務(wù)規(guī)劃等領(lǐng)域中提高機器人的智能水平。由于該知識引擎過于龐大,實際應(yīng)用的效果并不理想,但該項目是較早開展機器人領(lǐng)域本體研究的項目之一。RoboBrain系統(tǒng)框架如圖4所示。
圖4 RoboBrain 系統(tǒng)框架圖Fig.4 RoboBrain system architecture
KnowRob是一種以行動為中心的任務(wù)本體模型。環(huán)境和任務(wù)知識以行動為中心進行組織可以使機器人能夠很容易地訪問其任務(wù)所需的知識。機器人觀察到的知識也會增加到知識本體中,從而能夠更好地適應(yīng)動態(tài)變化的環(huán)境。但是,KnowRob致力于提高個體機器人的自主性,對多個機器人協(xié)同任務(wù)關(guān)注較少。KnowRob使用OWL語言實現(xiàn)知識的表示,但是OWL語義比較淺,只能夠?qū)︻惡蛡€體之間的簡單關(guān)系進行定義和較少的推理。因此,KnowRob還引入了對Prolog語言的支持以提升其知識推理能力。
RoboEarth致力于為機器人建立一個進行知識交互和學(xué)習(xí)的互聯(lián)網(wǎng),以解決異構(gòu)機器人系統(tǒng)的信息重用和交互問題。其同樣采用OWL語言構(gòu)建世界模型,不僅定義了世界知識的要素,還定義了其中的關(guān)聯(lián)關(guān)系。采用RoboEarth進行任務(wù)規(guī)劃的機器人,在任務(wù)開始時,通過查詢算法請求需要的任務(wù)相關(guān)知識。如果當(dāng)前任務(wù)沒有執(zhí)行過,機器人可以記錄學(xué)習(xí)的過程,并將學(xué)習(xí)到的知識上傳到分布式的知識庫中,實現(xiàn)知識的共享。
文獻[61]提出一種為機器人提供空間智能的知識引擎。空間智能是指空間判斷能力。具備空間判斷能力的機器人能夠從不同角度和空間對物體進行可視化,能夠確定物體之間的空間關(guān)系并進行處理,其功能框架如圖5所示。在進行任務(wù)規(guī)劃時,機器人規(guī)劃器在本體和傳感器數(shù)據(jù)的支持下,自動處理空間信息和自然語言指令,不再需要像PDDL那樣進行復(fù)雜的語法定義。
圖5 具備空間智能的智能規(guī)劃流程圖Fig.5 Intelligent planning flow chart with spatial intelligence
開放式機器人本體(open robots ontology,ORO)是一種面向事件的知識存儲和推理平臺,該系統(tǒng)框架將來自不同來源的數(shù)據(jù),如傳感器、領(lǐng)域知識和人類輸入信息集成到一個統(tǒng)一的本體中,其研究側(cè)重于幫助機器人與人類互動,能夠使用Pellet進行簡單的推理。
感知與操作知識本體(perception and manipulation know-ledge,PMK)是一種面向自主機器人TMP的知識本體。利用OWL語言實現(xiàn),通過邏輯編程語言SWI-prolog加載OWL本體,實現(xiàn)知識的查詢。PMK還集成了認知模塊,可根據(jù)傳感器數(shù)據(jù)實現(xiàn)對環(huán)境的感知并向知識本體中添加實例。使該框架具備感知推理、特征推理、態(tài)勢推理和規(guī)劃推理能力。
機器人任務(wù)規(guī)劃本體(robot task planning ontology,RTPO)是一種室內(nèi)服務(wù)型機器人小型任務(wù)本體,使用OWL語言描述機器人的領(lǐng)域知識,并且設(shè)計了基于RTPO的任務(wù)規(guī)劃算法。RTPO分為3個部分:任務(wù)本體、環(huán)境本體和機器人本體。通過相應(yīng)的任務(wù)規(guī)劃算法,機器人可以自主完成指定的高層任務(wù)。
本體技術(shù)在知識表示和運用上的優(yōu)勢使其正逐漸應(yīng)用到無人潛航器、水下機器人、空間站短期任務(wù)規(guī)劃、無人駕駛汽車等自主化領(lǐng)域中。協(xié)作網(wǎng)絡(luò)中的智能網(wǎng)絡(luò)化水下機器人(smart and networking underwater robots in cooperation meshes,SWARMs),致力于實現(xiàn)不同制造商生產(chǎn)的水下機器人系統(tǒng)的協(xié)同作業(yè),使用網(wǎng)絡(luò)化本體技術(shù)解決了機器人交換異構(gòu)信息的問題。網(wǎng)絡(luò)化本體作為一種公共信息模型來表示不同領(lǐng)域的知識,并且為系統(tǒng)內(nèi)的知識共享提供支持。其知識本體主要由4部分組成:無人系統(tǒng)、任務(wù)和規(guī)劃、環(huán)境感知和認知、通信和網(wǎng)絡(luò)。在SWARMs中,無人平臺之間需要進行交換的信息都由本體定義,且支持不同的推理方式,如:本體推理、基于規(guī)則的推理和多實體貝葉斯網(wǎng)絡(luò)。SWARMs本體結(jié)構(gòu)如圖6所示。
圖6 SWARMs 本體結(jié)構(gòu)Fig.6 SWARMs ontology structure
文獻[24]提出了一種海洋無人潛航器智能控制架構(gòu),使用基于本體的動態(tài)規(guī)劃決策,實現(xiàn)了無人系統(tǒng)對復(fù)雜環(huán)境的適應(yīng),使復(fù)雜繁瑣的任務(wù)規(guī)劃決策得以由計算機自動完成。該本體是一種適用于海洋無人潛航器任務(wù)智能規(guī)劃和控制的領(lǐng)域知識本體。
文獻[67]將本體理論應(yīng)用于空間站短期任務(wù)規(guī)劃中的問題描述和數(shù)據(jù)交互共享,滿足了空間站短期任務(wù)規(guī)劃領(lǐng)域中的問題描述需求和數(shù)據(jù)交互共享需求,為解決空間站短期任務(wù)規(guī)劃提供了支持。
無人駕駛汽車場景建模和智能規(guī)劃與決策支持是本體的另一個重要的應(yīng)用領(lǐng)域。文獻[68]將本體應(yīng)用于交通場景描述中。首先,使用隱馬爾可夫模型(hidden Markov models, HMM)進行駕駛行為的學(xué)習(xí)。然后,并根據(jù)場景特征建立知識庫,確定模型策略并存儲先驗知識。最后,通過后驗概率和先驗概率實現(xiàn)對目標(biāo)車輛未來行為的預(yù)測。文獻[69]在基于本體的駕駛場景模型的基礎(chǔ)上,通過基于語義推理機制實現(xiàn)場景的多準(zhǔn)則評估和駕駛決策生成。
除上述對于基于本體的任務(wù)規(guī)劃方面的研究之外,在知識獲取、現(xiàn)實世界與本體的映射等方面的研究也開始受到關(guān)注。PMK本體通過集成感知模塊,實現(xiàn)了對物品和態(tài)勢的推理能力,陳志賢等人將本體技術(shù)應(yīng)用于復(fù)雜環(huán)境中機器人的自主規(guī)劃,提出了基于整合活動圖式的機器人任務(wù)規(guī)劃經(jīng)驗學(xué)習(xí)方法,所學(xué)習(xí)到的任務(wù)經(jīng)驗可以泛化應(yīng)用到同類任務(wù)的多情形自動規(guī)劃問題之中。李泚泚提出一種層次化物品知識自主構(gòu)建方法,實現(xiàn)了物品實例知識的自主構(gòu)建。
幾種典型的知識本體情況對比如表1所示??傮w來說,知識本體在任務(wù)規(guī)劃領(lǐng)域的應(yīng)用主要集中于室內(nèi)服務(wù)型機器人,在專業(yè)無人系統(tǒng),特別是無人作戰(zhàn)系統(tǒng)中的應(yīng)用還很少見。幾種本體中,小型化、專業(yè)化的本體技術(shù)應(yīng)用情況和表現(xiàn)要好于通用型的大規(guī)模本體。OWL是本體構(gòu)建首選的表示語言,此外,本體通常會根據(jù)需要搭配相應(yīng)的推理機,實現(xiàn)知識推理和應(yīng)用。
表1 典型無人系統(tǒng)本體情況對比
本體在軍事任務(wù)規(guī)劃領(lǐng)域有著深厚的研究歷史。較早的任務(wù)規(guī)劃本體,如PLANET就是基于軍事應(yīng)用背景研發(fā)的。本體技術(shù)在軍事領(lǐng)域的應(yīng)用已經(jīng)涉及到了戰(zhàn)場態(tài)勢表示與評估、作戰(zhàn)計劃表示與校驗等方面。這些應(yīng)用場景都是進行任務(wù)規(guī)劃不可或缺的知識來源,或者本身是任務(wù)規(guī)劃的一部分。
(1) 基于本體的態(tài)勢表示、感知與估計。早期的應(yīng)用研究停留在比較淺的層面,本體更像是一個規(guī)范化表示信息的數(shù)據(jù)庫,如文獻[73]提出了一種基于本體的發(fā)布訂閱系統(tǒng),能夠進行大量、連續(xù)的復(fù)雜語義查詢。文獻[21]構(gòu)建了基于本體的戰(zhàn)場態(tài)勢表示方法,通過本體實現(xiàn)態(tài)勢數(shù)據(jù)的統(tǒng)一規(guī)范表示和戰(zhàn)場態(tài)勢推理。文獻[74]提出了一種基于本體的態(tài)勢感知系統(tǒng)“BeAware!”,采用了基于規(guī)則的推理技術(shù)提高了系統(tǒng)的推理能力,貝葉斯網(wǎng)絡(luò)與本體的結(jié)合使態(tài)勢感知中大量的不確定性知識表示和推理問題得到了一定程度的解決。文獻[48]將本體技術(shù)用于可疑船只的屬性判斷中,基于MEBN實現(xiàn)多源信息融合。文獻[75]構(gòu)建了網(wǎng)絡(luò)威脅要素知識本體,并成功應(yīng)用于網(wǎng)絡(luò)威脅態(tài)勢推演與評估。文獻[76]將貝葉斯網(wǎng)絡(luò)與本體技術(shù)相結(jié)合,提高了態(tài)勢估計的準(zhǔn)確度。文獻[77]將本體與MEBN相結(jié)合用于無人作戰(zhàn)系統(tǒng)在不確定場景下的智能決策。
(2) 基于本體的計劃表示和評估。常識百科全書本體(enCYClopedia,CYC)是第一個常識知識庫,也經(jīng)常作為上位本體來構(gòu)建軍事領(lǐng)域本體,如作戰(zhàn)行動過程本體。核心計劃表示本體是九十年代美國國防部高級研究計劃局針對軍事領(lǐng)域提出的軍事計劃表示本體,能夠描述計劃、過程、行動等通用信息。文獻[81]構(gòu)建的本體將計劃看作是一系列的約束構(gòu)成的集合,實現(xiàn)了任務(wù)的層次化分解。共享計劃和行動表示本體是集成了多項本體研究的成果而建立的一種共享計劃本體,其計劃的表示更加規(guī)范和全面。聯(lián)合作戰(zhàn)空中任務(wù)指揮官本體是一種用于空軍戰(zhàn)役規(guī)劃的本體,并且在應(yīng)用中使用了基于知識的混合主動規(guī)劃方法。文獻[84]將本體用于作戰(zhàn)方案的表示和完整性評估。基于本體的計劃表示實現(xiàn)了特定領(lǐng)域規(guī)劃知識的表示,使機器能夠共享和重用現(xiàn)有的知識并進行復(fù)雜任務(wù)的規(guī)劃。但這種基于知識的規(guī)劃通常針對領(lǐng)域問題而專門設(shè)計的,不同領(lǐng)域之間具有不同的知識表示和描述方法,重用性很差。
(1) 基于領(lǐng)域知識實現(xiàn)任務(wù)智能規(guī)劃。未來戰(zhàn)場上異構(gòu)無人系統(tǒng)的大規(guī)模應(yīng)用,必然需要一個高效的任務(wù)規(guī)劃和管理機制,實現(xiàn)大規(guī)模無人作戰(zhàn)群體的高效智能任務(wù)規(guī)劃。知識本體能夠保存無人系統(tǒng)學(xué)習(xí)到的規(guī)劃參數(shù)或者作戰(zhàn)規(guī)則,并將之應(yīng)用于未來的任務(wù)中。此外,通過知識本體的支持,無人系統(tǒng)可以針對人類的高層指令自動完成行動序列的生成,并檢測任務(wù)是否可以達成,如文獻[26]和文獻[61]。
(2) 支持基于領(lǐng)域知識的任務(wù)重規(guī)劃。實際場景中,無人系統(tǒng)面臨越來越多的不確定性因素使無人系統(tǒng)很難通過一個固定的任務(wù)計劃完成任務(wù)的執(zhí)行,迫切需要任務(wù)重規(guī)劃技術(shù)的支持。當(dāng)前,領(lǐng)域知識在任務(wù)重規(guī)劃中發(fā)揮著重要的作用,文獻[85]構(gòu)建了軍事領(lǐng)域知識庫與規(guī)則庫,實現(xiàn)空中任務(wù)的重規(guī)劃,文獻[86]構(gòu)建了水下機器人任務(wù)本體并用于任務(wù)的重規(guī)劃。文獻[87]指出基于領(lǐng)域知識的任務(wù)重規(guī)劃方法,特別是通用化的知識庫是重要的研究方向。
(3) 支持知識共享。本體為不同無人系統(tǒng)提供一個進行知識共享的基礎(chǔ),對信息交互進行了規(guī)范,使各個無人系統(tǒng)學(xué)習(xí)到的知識可以通過網(wǎng)絡(luò)進行共享,如SWARMs本體。本體使無人系統(tǒng)之間的交互從信息交互的層面提升到知識交互的層面。通過作戰(zhàn)知識的積累和共享,可以啟發(fā)無人系統(tǒng)探究新型作戰(zhàn)模式。
(4) 支持基于知識推理的慎思型智能決策。例如,在文獻[88-89]中將人類實踐過程中形成的經(jīng)驗常識應(yīng)用于環(huán)境中車輛駕駛意圖的判斷上,并取得了良好的效果。本體是對知識的結(jié)構(gòu)化描述,包含了概念之間的語義關(guān)系,這種語義關(guān)系是實現(xiàn)理性決策的基礎(chǔ)。基于理性推理的決策具有可解釋性和穩(wěn)健性的特點。
(1) 本體構(gòu)建技術(shù)相對成熟,有大量可供參考的案例,既有針對一般任務(wù)的本體,也有針對領(lǐng)域任務(wù)的應(yīng)用本體。但是不同領(lǐng)域中的任務(wù)邏輯、知識需求、表示范圍等仍然有比較大的差別。本體技術(shù)在新的領(lǐng)域應(yīng)用仍需在領(lǐng)域知識表示方法和表示能力等方面進行大量的研究。本體技術(shù)在研究初期就與軍事問題緊密相關(guān),在軍事計劃表示、態(tài)勢分析中發(fā)揮了重要作用,但是本體在支持無人作戰(zhàn)系統(tǒng)的任務(wù)規(guī)劃方面還期待更加系統(tǒng)的研究。
(2) 行動學(xué)習(xí)能力成為新的研究熱點。任務(wù)本體的構(gòu)建通常需要領(lǐng)域?qū)<业膶iT知識,但是專家領(lǐng)域知識的有限性和現(xiàn)實世界的復(fù)雜性,使無人系統(tǒng)行為的抽象化越來越困難。這導(dǎo)致了當(dāng)前知識本體的構(gòu)建往往局限于比較簡單或者有限的場景,現(xiàn)實世界的領(lǐng)域本體模型往往很難開發(fā)和維護,因此人們在解決規(guī)劃問題時往往很少使用領(lǐng)域知識,而是采用效率低但更容易的方法,除了專門研究規(guī)劃問題的團體之外,對構(gòu)建領(lǐng)域知識模型的關(guān)注很低。文獻[90]對機器學(xué)習(xí)在行動模型和規(guī)劃知識的自動獲取方面的應(yīng)用進行了綜述,文獻[91]重點在行動模型學(xué)習(xí)方面進行而來綜述,并提出了研究的方向。行動模型的學(xué)習(xí)的輸入通常是一組行動序列,輸出則是PDDL等描述語言定義的行動模型。文獻[92]提出了一種從非符號輸入中學(xué)習(xí)一階符號表示的方法,學(xué)習(xí)到的一階符號可以直接作為規(guī)劃器的輸入,文獻中展示了從漢諾塔、抓取和方塊世界等經(jīng)典任務(wù)規(guī)劃問題的狀態(tài)空間中提取移動、拾取和放下等行動模型的方法。
(3) 領(lǐng)域知識本體應(yīng)用效果好,但仍存在異構(gòu)本體集成和通用本體的研究需求。領(lǐng)域知識本體應(yīng)用范圍有限,在開放場景中的效果不佳。因此,通用化的本體依然有需求的緊迫性,但是受限于當(dāng)前的技術(shù)水平,當(dāng)前的研究多從異構(gòu)本體的集成入手,解決實際應(yīng)用問題。
雖然對于任務(wù)規(guī)劃本體的研究已經(jīng)很多,但是如何將本體應(yīng)用到任務(wù)尤其是復(fù)雜任務(wù)中的研究尚處于起步階段。本體在機器人領(lǐng)域雖然取得了矚目的成果,但是仍存在很多未解決的問題。以知識為中心,可以分成前中后3個部分,未來重要的研究方向如下。
(1) 前端主要研究知識的獲取和認知問題,如從文本等結(jié)構(gòu)化的數(shù)據(jù)中析取知識、如何從人類的行為中學(xué)習(xí)到經(jīng)驗并使之經(jīng)驗化、如何實現(xiàn)環(huán)境的認知和與知識本體的邏輯接地等。文獻[95]在基于示教的任務(wù)規(guī)劃學(xué)習(xí)方面進行了研究。文獻[96]研究了家庭環(huán)境中的邏輯接地問題。文獻[90-91]分別從機器學(xué)習(xí)用于規(guī)劃知識自動定義和行動模型學(xué)習(xí)兩個方面進行了技術(shù)綜述,指出知識表示、學(xué)習(xí)算法、知識的應(yīng)用、現(xiàn)實世界的應(yīng)用等重要問題。
(2) 居于中心位置的知識建模與表示仍然存在許多難以解決的問題,如異構(gòu)本體的集成、大規(guī)模知識本體下的處理效率、更強的表示能力、不確定知識的表示等,以及支撐計劃重規(guī)劃的規(guī)則庫構(gòu)建與運用等。當(dāng)前知識表示語言表示能力有限,雖然各種拓展表示語言進行了功能的拓展,但是在描述現(xiàn)實世界,支撐復(fù)雜場景方面還需要進一步的研究。
(3) 后端主要研究知識的應(yīng)用,如何在知識本體支持下實現(xiàn)智能規(guī)劃和決策,需要將離散的符號規(guī)劃與連續(xù)的空間尋優(yōu)問題結(jié)合起來。然而,即使在機器人領(lǐng)域,這種融合仍僅是在比較淺顯的層面,知識對任務(wù)規(guī)劃的知識多是停留在知識查詢的層面,很少能夠體現(xiàn)出知識推理能力的作用。但是,隨著學(xué)術(shù)界對于第三代人工智能的探索和思考,符號主義與連接主義的集成符合未來的發(fā)展趨勢,無人系統(tǒng)的智能化研究也逐漸從底層的運動規(guī)劃上升到任務(wù)規(guī)劃層面,并呈現(xiàn)兩者高度融合的特點,基于本體的無人系統(tǒng)任務(wù)規(guī)劃屬于后端應(yīng)用問題,主要研究知識推理、任務(wù)規(guī)劃和決策等知識的應(yīng)用。
構(gòu)建無人系統(tǒng)任務(wù)規(guī)劃本體需要考慮多方面的因素,本節(jié)從應(yīng)用范圍和目標(biāo)、非功能性需求、功能性需求3個方面進行了闡釋。
進行任務(wù)規(guī)劃本體的構(gòu)建,首先需要明確本體的應(yīng)用范圍和應(yīng)達到的目標(biāo)。無人作戰(zhàn)系統(tǒng)的任務(wù)本體應(yīng)立足其應(yīng)用場景構(gòu)建領(lǐng)域知識本體,防止出現(xiàn)本體過于泛化,規(guī)模過于龐大而難以應(yīng)用的問題。無人作戰(zhàn)系統(tǒng)任務(wù)規(guī)劃本體應(yīng)完成兩個主要工作,一是清晰定義領(lǐng)域知識相關(guān)的概念;二是對概念之間的關(guān)系進行明確的定義。本體應(yīng)能描述異構(gòu)無人系統(tǒng)(如傳感器、執(zhí)行器等組件)及其工作的環(huán)境(如地形、威脅、障礙等戰(zhàn)場要素),并對無人系統(tǒng)之間必須交換的信息進行明確的定義。
互操作性、模塊化、可重用和可擴展是本體應(yīng)具備的非功能性特征。互操作性是滿足無人系統(tǒng)之間信息交換的基本條件;模塊化要求對本體元素之間的耦合性進行必要的解耦,有利于本體元素的靈活組合;重用性使本體各元素可以方便地應(yīng)用于不同的領(lǐng)域,或者能通過簡單的修改適應(yīng)新的場景;可擴展性是本體功能不斷成長,適應(yīng)更復(fù)雜場景的基本要求。
(1) 本體需包含任務(wù)計劃模型。支持任務(wù)規(guī)劃是本體的首要功能需求。首先,任務(wù)規(guī)劃本體應(yīng)能夠描述某個作戰(zhàn)任務(wù)中包含的確切行動,行動的前提條件和效果等;其次,能夠描述底層的任務(wù)分配、航跡規(guī)劃的任務(wù)信息,便于無人系統(tǒng)之間進行知識和共享,實現(xiàn)任務(wù)協(xié)同。此外,本體還應(yīng)能夠?qū)ψ尤蝿?wù)和作戰(zhàn)行動之間的協(xié)同配合關(guān)系,不同無人系統(tǒng)之間的協(xié)同關(guān)系進行描述。圖7展示了任務(wù)本體各主要域之間的關(guān)系。
圖7 無人作戰(zhàn)系統(tǒng)任務(wù)本體Fig.7 Mission ontology of unmanned system task
(2) 本體應(yīng)對無人系統(tǒng)的類別及其屬性能力進行清晰的定義。無人系統(tǒng)的屬性和能力是任務(wù)規(guī)劃的約束條件之一,無人系統(tǒng)在進行高層任務(wù)指令的解析中,需要在本體中查詢自身的屬性和能力是否滿足任務(wù)執(zhí)行的條件。當(dāng)使用基于能力的任務(wù)規(guī)劃方法時,也需要查詢自身能力以實現(xiàn)行動序列的生成。
(3) 本體應(yīng)能夠支持戰(zhàn)場環(huán)境建模。戰(zhàn)場環(huán)境信息是無人系統(tǒng)進行重規(guī)劃和智能決策,正確執(zhí)行任務(wù)的重要保證,無人系統(tǒng)任務(wù)本體應(yīng)能夠良好地定義和表示戰(zhàn)場環(huán)境信息,如高程、電磁輻射、風(fēng)速、氣象、威脅、目標(biāo)等。水下無人系統(tǒng)還應(yīng)對水下作戰(zhàn)環(huán)境信息進行表示,如鹽度、溫度、洋流等。另外,本體應(yīng)包含傳感器模型,并能夠利用傳感器信息進行環(huán)境空間的信息表示。
(4) 本體應(yīng)能夠支持不確定信息的表示和推理。戰(zhàn)場環(huán)境是一個動態(tài)環(huán)境,其中包含著大量的不確定性。任務(wù)本體應(yīng)能夠?qū)@些不確定性信息進行標(biāo)注并支持無人系統(tǒng)根據(jù)上下文數(shù)據(jù)進行知識推理?;诒倔w的知識推理過程如圖8所示。
圖8 知識推理過程示意圖Fig.8 Diagram of knowledge inference process
(1) 知識表示能力。知識表示能力是任務(wù)本體最重要的屬性,任務(wù)本體需要能夠表示兩種知識:一類是因果知識,如子任務(wù)之間的協(xié)調(diào)配合關(guān)系、不同無人系統(tǒng)之間的協(xié)調(diào)配合關(guān)系、規(guī)則化的軍事人員的作戰(zhàn)經(jīng)驗知識等;一類是關(guān)于戰(zhàn)場環(huán)境的世界知識,如目標(biāo)區(qū)域的位置,可能存在的威脅的位置、屬性和適用武器裝備等信息。此外,現(xiàn)實世界中充斥著不確定性,戰(zhàn)場環(huán)境中無人系統(tǒng)將面臨更加復(fù)雜的不確定性,能夠?qū)@些不確定性信息進行合理的表示是任務(wù)本體適應(yīng)復(fù)雜場景的重要基礎(chǔ)。
(2) 知識的快速檢索和分發(fā)能力。任務(wù)本體的基本功能之一是實現(xiàn)無人系統(tǒng)之間的信息共享。隨著任務(wù)本體的擴展和無人系統(tǒng)規(guī)模的擴大,其快速檢索問題將會逐漸突顯出來,對于較大規(guī)模的任務(wù)本體,需要設(shè)計合理的檢索算法和數(shù)據(jù)存儲結(jié)構(gòu),支持信息的快速檢索和分發(fā)。
(3) 推理能力。任務(wù)規(guī)劃過程中的作戰(zhàn)行動序列生成,故障應(yīng)對,任務(wù)重規(guī)劃等都需要根據(jù)存儲的知識進行推理。可采用已有的推理機完成知識推理,或者根據(jù)應(yīng)用領(lǐng)域設(shè)計適用性更好的推理機。在設(shè)計和構(gòu)建本體時也需要對知識元素的屬性進行合理的定義,以更好地支持推理。
本文對任務(wù)規(guī)劃問題進行了系統(tǒng)梳理,分析了無人系統(tǒng)任務(wù)規(guī)劃的發(fā)展趨勢,回顧了本體技術(shù)在機器人、無人系統(tǒng)、軍事任務(wù)規(guī)劃等領(lǐng)域的應(yīng)用情況,剖析了知識本體在提高無人系統(tǒng)任務(wù)自主性中的作用,提出了基于本體的任務(wù)規(guī)劃概念,對本體構(gòu)建原則和關(guān)鍵能力指標(biāo)進行了系統(tǒng)闡釋。知識能夠支持無人系統(tǒng)的任務(wù)規(guī)劃和決策制定,是無人系統(tǒng)自主能力提升的重要基礎(chǔ)。構(gòu)建無人系統(tǒng)任務(wù)規(guī)劃本體是無人系統(tǒng)適應(yīng)復(fù)雜戰(zhàn)場環(huán)境,提高自主性,減少人為干預(yù)的有效途徑。當(dāng)前,本體技術(shù)在知識推理和共享、簡單任務(wù)規(guī)劃、智能決策方面得到了應(yīng)用,但是對于非結(jié)構(gòu)化和開放環(huán)境下的知識表示、群體無人系統(tǒng)協(xié)同等方面還期待更多的研究成果。此外,戰(zhàn)場環(huán)境的不確定性帶來的不確定知識表示,融合和推理問題也是需要重點關(guān)注的領(lǐng)域。綜上所述,將本體引入無人系統(tǒng)任務(wù)規(guī)劃領(lǐng)域,圍繞著知識的獲取、表示和運用構(gòu)建智能化的任務(wù)規(guī)劃框架,對于提高無人系統(tǒng)自主化能力具有重要的作用。