亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深空探測(cè)器自主規(guī)劃技術(shù)研究進(jìn)展

        2021-07-02 04:26:38李朝玉朱圣英梁子璇尚海濱
        深空探測(cè)學(xué)報(bào) 2021年2期
        關(guān)鍵詞:規(guī)劃方法

        徐 瑞,李朝玉,朱圣英,王 棒,梁子璇,尚海濱

        (1.北京理工大學(xué) 宇航學(xué)院,北京 100081;2.深空自主導(dǎo)航與控制工信部重點(diǎn)實(shí)驗(yàn)室,北京 100081)

        引 言

        深空探測(cè)指人類對(duì)月球及以遠(yuǎn)的天體或空間環(huán)境開展的探測(cè)活動(dòng),作為人類航天活動(dòng)的重要方向和空間科學(xué)與技術(shù)創(chuàng)新的重要途徑,是當(dāng)前和未來航天領(lǐng)域的發(fā)展重點(diǎn)之一。由于深空探測(cè)任務(wù)具有探測(cè)目標(biāo)遠(yuǎn)、飛行時(shí)間長(zhǎng)等特點(diǎn),會(huì)出現(xiàn)上傳指令延遲、星體遮擋等問題,依靠地面測(cè)控站對(duì)探測(cè)器進(jìn)行遙測(cè)遙控的方式難以滿足探測(cè)器控制的實(shí)時(shí)性、魯棒性和安全性等要求。自主技術(shù)是保證探測(cè)器在深空環(huán)境下安全可靠運(yùn)行的關(guān)鍵技術(shù)之一,也是未來深空探測(cè)技術(shù)發(fā)展的重要方向,而自主規(guī)劃技術(shù)是實(shí)現(xiàn)探測(cè)器自主運(yùn)行的核心技術(shù)之一。

        自主規(guī)劃是人工智能領(lǐng)域較早的研究方向之一,可以追朔到1957年Newell和Simon的問題求解程序(General Problem Solution,GPS)、1969年Green的QA3系統(tǒng)。1971年Fike和Nilsson的STRIPS系統(tǒng)在智能規(guī)劃領(lǐng)域具有劃時(shí)代的意義[1],將狀態(tài)表示為命題的集合,通過操作集合中的命題來實(shí)現(xiàn)狀態(tài)的改變,其所采用與文字相關(guān)的術(shù)語至今仍被使用。為解決經(jīng)典規(guī)劃問題,如著色問題和航空貨物運(yùn)輸問題,學(xué)者們提出了多種形式規(guī)劃方法,包括前向狀態(tài)空間搜索、圖規(guī)劃、分層任務(wù)網(wǎng)規(guī)劃等。將規(guī)劃問題轉(zhuǎn)換為約束可滿足問題、命題可滿足問題等形式,利用已有的約束推理技術(shù)等進(jìn)行求解也是一種常用的規(guī)劃方法。然而,傳統(tǒng)規(guī)劃方法難處理具有時(shí)間、資源、參數(shù)等復(fù)雜約束關(guān)系的深空探測(cè)器規(guī)劃問題,因此,航天大國(guó)紛紛開展研究并取得一定的成果。

        自主規(guī)劃技術(shù)在20世紀(jì)90年代首次在深空探測(cè)任務(wù)中得到應(yīng)用和驗(yàn)證。在初期應(yīng)用中,探測(cè)器只有部分系統(tǒng)具有自主性,例如美國(guó)發(fā)射的“卡西尼號(hào)”(Cassini)探測(cè)器和“NEAR”探測(cè)器,在一定程度上減少了地面人員的任務(wù)操作。全局自主在“深空一號(hào)”(Deep Space One)探測(cè)器中得到了飛行驗(yàn)證[2],利用研制的“遠(yuǎn)程智能體”(Remote Agent)軟件系統(tǒng)實(shí)現(xiàn)了探測(cè)器自主任務(wù)管理、任務(wù)規(guī)劃、自主執(zhí)行、狀態(tài)監(jiān)測(cè)等,在1周的飛試驗(yàn)行中成功驗(yàn)證了其可靠性,可以在沒有地面干預(yù)的情況下完成自主任務(wù)規(guī)劃和運(yùn)行,其應(yīng)用大大降低了操作費(fèi)用。2003年,美國(guó)國(guó)家航空航天局(National Aeronautics and Space Administration,NASA)在地面采用MAPGEN(Mixed Initiative Activity Plan GENerator)規(guī)劃器對(duì)“火星探測(cè)漫游者”(Mars Exploration Rover,MER)任務(wù)中火星車科學(xué)設(shè)備進(jìn)行自主規(guī)劃和調(diào)度,并計(jì)劃在2020火星探測(cè)車實(shí)現(xiàn)星載自主調(diào)度,然而迫于進(jìn)度壓力,目前未能實(shí)現(xiàn)[3]。至今,NASA開發(fā)的自主調(diào)度與規(guī)劃環(huán)境系統(tǒng)(Automated Scheduling and Planning Environment,ASPEN)、可擴(kuò)展通用遠(yuǎn)程操作規(guī)劃框架(Extensible Universal Remote Operations Planning Architecture,EUROPA)和歐洲航天局(European Space Agency,ESA)開發(fā)的先進(jìn)規(guī)劃與調(diào)度框架(APSI)先后服務(wù)于“地球觀測(cè)一號(hào)”(Earth Observing One)、火星探測(cè)車等多個(gè)航天任務(wù)[4]。

        深空探測(cè)器自主規(guī)劃技術(shù)的研究對(duì)于未來的空間任務(wù)主要具有如下幾方面的意義[5]:

        1)減少地面干預(yù),降低探測(cè)器操作費(fèi)用以及對(duì)航天測(cè)控網(wǎng)絡(luò)的需求;

        2)應(yīng)對(duì)深空任務(wù)中的不確定性,增加任務(wù)執(zhí)行的可靠性;

        3)采用高級(jí)任務(wù)指令,增加地面與航天器系統(tǒng)的可交互性;

        4)通過規(guī)劃對(duì)系統(tǒng)的各種資源進(jìn)行合理分配和利用,提高任務(wù)的回報(bào);

        5)規(guī)劃系統(tǒng)可以靈活地運(yùn)用到今后的航天器的設(shè)計(jì)和研制中,縮短小型航天器的研制周期。

        深空探測(cè)器自主規(guī)劃技術(shù)的應(yīng)用將會(huì)給深空探測(cè)領(lǐng)域帶來革命性的變化,掌握該技術(shù)對(duì)促使我國(guó)空間以及航天技術(shù)水平的提高具有重要意義。

        本文明確了深空探測(cè)器自主規(guī)劃技術(shù)定義的基礎(chǔ)上,介紹了目前深空探測(cè)器自主規(guī)劃技術(shù)面臨的挑戰(zhàn),總結(jié)和分析了自主規(guī)劃中的關(guān)鍵技術(shù),并給出未來深空探測(cè)器自主規(guī)劃技術(shù)的發(fā)展方向。

        1 深空探測(cè)器自主規(guī)劃內(nèi)涵

        1.1 定義與內(nèi)涵

        深空探測(cè)器自主規(guī)劃技術(shù)是根據(jù)對(duì)空間環(huán)境的感知和認(rèn)識(shí)、探測(cè)器自身的能力和狀態(tài),利用計(jì)算機(jī)軟件技術(shù)、人工智能理論方法等,依據(jù)一段時(shí)間內(nèi)的任務(wù)目標(biāo),對(duì)若干可供選擇的動(dòng)作、可用資源、約束關(guān)系等進(jìn)行推理,自動(dòng)地生成一組時(shí)間有序的動(dòng)作序列,稱一個(gè)“規(guī)劃”(plan)。該規(guī)劃一旦執(zhí)行,便可以將探測(cè)器的狀態(tài)成功轉(zhuǎn)移到期望的目標(biāo)狀態(tài)[6]。

        深空探測(cè)器任務(wù)規(guī)劃問題Φ用一個(gè)五元組描述

        3)活動(dòng)的執(zhí)行最終結(jié)果狀態(tài)集合包含目標(biāo)集G。

        1.2 規(guī)劃技術(shù)面臨的挑戰(zhàn)

        由于深空探測(cè)器系統(tǒng)復(fù)雜、約束耦合、活動(dòng)并行、運(yùn)行環(huán)境不確知等特點(diǎn),傳統(tǒng)的自主任務(wù)規(guī)劃技術(shù)已無法適用于深空任務(wù)。深空探測(cè)器自主規(guī)劃問題面臨新的挑戰(zhàn)[7],其中包括以下幾個(gè)方面。

        1) 耦合時(shí)間約束。多數(shù)活動(dòng)必須在特定時(shí)間窗口進(jìn)行,比如通信活動(dòng)必須按照一定的順序執(zhí)行,同時(shí)部分活動(dòng)需要并行執(zhí)行。

        2)有限資源 。探測(cè)器的能量和存儲(chǔ)能力有限,資源需要在一定的時(shí)間區(qū)間內(nèi)進(jìn)行管理和分配,以保證探測(cè)器的安全運(yùn)行和任務(wù)的完成。

        3)復(fù)雜任務(wù)目標(biāo) 。需要實(shí)現(xiàn)的目標(biāo)較多且價(jià)值和重要性不同,應(yīng)進(jìn)行合理安排,得到最大的科學(xué)回報(bào)。同時(shí),部分規(guī)劃任務(wù)需要找到最短路徑或者燃耗最小的規(guī)劃序列來實(shí)現(xiàn)目標(biāo)。

        4)自主執(zhí)行不確定性。轉(zhuǎn)移到指定地點(diǎn)、完成維護(hù)操作或者裝配某結(jié)構(gòu)的時(shí)間具有不確定性。

        2 關(guān)鍵技術(shù)發(fā)展及分析

        2.1 自主規(guī)劃和執(zhí)行框架

        為了降低深空探測(cè)器對(duì)地面的依賴、提高探測(cè)器的自主性,自主任務(wù)規(guī)劃與執(zhí)行不可或缺。作為自主系統(tǒng)的關(guān)鍵部分,任務(wù)規(guī)劃為探測(cè)器未來一段時(shí)間內(nèi)的活動(dòng)序列做出決策;執(zhí)行系統(tǒng)按照該活動(dòng)序列驅(qū)動(dòng)探測(cè)器的執(zhí)行機(jī)構(gòu)實(shí)現(xiàn)不同功能,并將動(dòng)作完成情況和環(huán)境感知信息反饋給任務(wù)規(guī)劃。

        由于深空環(huán)境的不確知,探測(cè)器任務(wù)執(zhí)行存在復(fù)雜情況,簡(jiǎn)單地根據(jù)傳感器感知的信息而做出機(jī)械響應(yīng)的方式[8]并不適用。因此,基于決策和快速響應(yīng)的混合結(jié)構(gòu)被廣泛采用[9],主要存在如圖1所示的兩種自主規(guī)劃框架。在由決策層、執(zhí)行層和控制層組成的三層結(jié)構(gòu)中,決策層負(fù)責(zé)頂層任務(wù)規(guī)劃并將規(guī)劃結(jié)果傳給執(zhí)行層,同時(shí)接受返回的執(zhí)行情況并對(duì)異常做出重新決策;執(zhí)行層負(fù)責(zé)指令展開和執(zhí)行結(jié)果傳遞;控制層負(fù)責(zé)驅(qū)動(dòng)對(duì)應(yīng)的執(zhí)行機(jī)構(gòu)完成指定的動(dòng)作,并將動(dòng)作執(zhí)行情況傳回執(zhí)行層。“深空一號(hào)”的“遠(yuǎn)程智能體”采用的就是這樣的三層結(jié)構(gòu)。

        圖1 不同的自主規(guī)劃執(zhí)行框架圖Fig.1 Different automated architectures of planning and execution

        在三層結(jié)構(gòu)的基礎(chǔ)上,美國(guó)的噴氣推進(jìn)實(shí)驗(yàn)室(Jet Propulsion Laboratory,JPL)提出了由功能層和決策層組成的兩層控制框架CLARAty[10](Coupled Layer Architecture for Robotic Autonomy)。其中,決策層包含基于聲明型模型的規(guī)劃調(diào)度模塊和基于程序型模型的執(zhí)行模塊,根據(jù)任務(wù)要求生成探測(cè)器的規(guī)劃結(jié)果;功能層包含具體星上器件執(zhí)行動(dòng)作的指令序列,能夠預(yù)測(cè)各自的能源消耗信息并將其發(fā)送給決策層。類似地,CASPER(Continue Activity Scheduling Planning Execution and Replanning)[11]和CLEaR(Closed-Loop Execution and Recovery)[12]也將規(guī)劃調(diào)度和執(zhí)行都放入決策層,并在“勇氣號(hào)”(Spirit)等探測(cè)器上實(shí)現(xiàn)了應(yīng)用。

        考慮到深空探測(cè)器是由多子系統(tǒng)構(gòu)成的復(fù)雜系統(tǒng),在設(shè)計(jì)自主執(zhí)行框架時(shí),可以結(jié)合工程實(shí)際,采取如圖2所示的框架。其中,決策層中的任務(wù)監(jiān)控器接收地面控制中心制定的任務(wù)要求并進(jìn)行命令轉(zhuǎn)化,交由任務(wù)規(guī)劃器處理,同時(shí)接收處理后的規(guī)劃結(jié)果,控制活動(dòng)向執(zhí)行層傳達(dá);執(zhí)行層根據(jù)具體的指令要求,控制并協(xié)調(diào)功能層中不同模塊之間的執(zhí)行過程;功能層由姿態(tài)規(guī)劃、軌跡規(guī)劃、軌道設(shè)計(jì)等不同功能的模塊組成,根據(jù)指令要求具體計(jì)算探測(cè)器詳細(xì)的活動(dòng)參數(shù),并驅(qū)動(dòng)執(zhí)行機(jī)構(gòu)執(zhí)行。

        圖2 深空探測(cè)器自主規(guī)劃執(zhí)行框架設(shè)計(jì)Fig.2 Autonomous architectures design of planning and execution for the deep space probe

        無論采用何種自主規(guī)劃執(zhí)行框架,規(guī)劃和執(zhí)行都是相互聯(lián)系、彼此影響、共同作用,此時(shí),規(guī)劃器能夠根據(jù)深空探測(cè)器當(dāng)前的狀態(tài)信息和環(huán)境變化、執(zhí)行異常等突發(fā)事件,給出具體的決策方案,例如哈勃望遠(yuǎn)鏡任務(wù)規(guī)劃[13],太空飛船有效載荷規(guī)劃[14],基于ASPEN設(shè)計(jì)的航天器操作規(guī)劃[15]等,使探測(cè)器能在復(fù)雜動(dòng)態(tài)的環(huán)境中長(zhǎng)期穩(wěn)定地運(yùn)行[16]。

        2.2 任務(wù)規(guī)劃知識(shí)模型

        求解一個(gè)規(guī)劃問題首先需要用規(guī)劃知識(shí)描述語言對(duì)其進(jìn)行描述,將其轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的形式,從而被規(guī)劃器求解,因此規(guī)劃語言的發(fā)展是智能規(guī)劃技術(shù)發(fā)展的基礎(chǔ)。

        在規(guī)劃領(lǐng)域中,F(xiàn)ike和Nilsson引入了STRIPS操作符,可以很簡(jiǎn)單地對(duì)規(guī)劃進(jìn)行描述。其定義包括初始狀態(tài)、目標(biāo)狀態(tài)和動(dòng)作,其中動(dòng)作用前提條件和效果來表示,前提條件表示動(dòng)作執(zhí)行前必須滿足的條件,效果表示動(dòng)作執(zhí)行后可以保證為真的狀態(tài)。但隨著規(guī)劃技術(shù)的不斷發(fā)展,研究人員發(fā)現(xiàn)STRIPS的表達(dá)能力有限,無法滿足一些實(shí)際問題的建模需求,因此,Pednault在STRIPS的基礎(chǔ)上提出了動(dòng)作描述語言ADL(Action Description Language)[17],ADL語言繼承了STRIPS語言的知識(shí),并且放松了STRIPS語言的一些限制,增加了條件效果、量化效果等語言特征,使得規(guī)劃語言更加靈活,而且應(yīng)用范圍也更加廣泛。

        為了將規(guī)劃語言標(biāo)準(zhǔn)化,統(tǒng)一規(guī)劃語言的表示方法,McDermott于1998年提出了規(guī)劃領(lǐng)域定義語言(Planning Domain Definition Language,PDDL)[18],能夠表示STRIPS、ADL以及其他語言,現(xiàn)在已經(jīng)成為國(guó)際規(guī)劃大賽的標(biāo)準(zhǔn)語言,并且在規(guī)劃領(lǐng)域中有著廣泛的應(yīng)用。PDDL將規(guī)劃問題用領(lǐng)域文件和問題文件描述,從語法和語義的角度給出了規(guī)劃的定義,可以描述動(dòng)作類型、動(dòng)作參數(shù)類型以及條件效果和數(shù)值變化等。由于經(jīng)典規(guī)劃中認(rèn)為動(dòng)作是瞬時(shí)發(fā)生的,考慮到實(shí)際任務(wù)中存在的持續(xù)性動(dòng)作,PDDL2.1引入數(shù)值流、持續(xù)動(dòng)作及規(guī)劃評(píng)價(jià)標(biāo)準(zhǔn)[19],加強(qiáng)了語言表達(dá)能力,可以描述離散持續(xù)動(dòng)作、連續(xù)動(dòng)作等,突破了傳統(tǒng)規(guī)劃中動(dòng)作瞬時(shí)完成的假設(shè)。目前PDDL建模最常使用的版本為PDDL2.1。

        對(duì)于深空探測(cè)器而言,系統(tǒng)繁多,每個(gè)系統(tǒng)由許多原始的組件構(gòu)成,每個(gè)組件一次僅能執(zhí)行一個(gè)活動(dòng),許多組件都會(huì)限制活動(dòng)序列。每個(gè)活動(dòng)可能對(duì)它的開始時(shí)間、結(jié)束時(shí)間和區(qū)間都有絕對(duì)和相對(duì)的限制。而STRIPS類的語言表示具有時(shí)間、資源、互斥關(guān)系和并行性是很困難的。NASA在其開發(fā)的Europa平臺(tái)中基于DDL語言定義了新領(lǐng)域定義語言(New Domain Definition Language,NDDL)[20],該語言不區(qū)分狀態(tài)和動(dòng)作,利用區(qū)間和區(qū)間之間的約束以及時(shí)間線/活動(dòng)的表示方法來描述規(guī)劃問題。其組成包括類、變量、謂詞及規(guī)則。在經(jīng)典規(guī)劃領(lǐng)域,通常采用PDDL及其拓展語言描述模型,但對(duì)于復(fù)雜深空探測(cè)任務(wù),PDDL會(huì)有明顯不足,星上活動(dòng)相互約束,資源有限,NDDL這種基于約束的表達(dá)方法解決了這一問題,約束可以用來表示互斥關(guān)系、活動(dòng)前提條件和效果以及不同的資源類型等,表達(dá)更具靈活性。

        為避免生成在實(shí)際執(zhí)行過程中不合理的活動(dòng)序列,需要考慮深空探測(cè)任務(wù)中活動(dòng)間的約束關(guān)系,包括時(shí)間約束和資源約束。

        2.2.1 時(shí)間約束

        表1 時(shí)間區(qū)間關(guān)系表示Table 1 Time interval relation representation

        2.2.2 資源約束

        在實(shí)際任務(wù)中,探測(cè)器活動(dòng)除了要占用時(shí)間外,還需要消耗一定的資源,資源是對(duì)系統(tǒng)中能源和可用設(shè)備的描述,分為可重復(fù)資源和消耗性資源??芍貜?fù)資源在規(guī)劃動(dòng)作執(zhí)行時(shí)被占用,結(jié)束后返還。消耗性資源在被使用時(shí)容量減少,有些可以通過生產(chǎn)動(dòng)作進(jìn)行補(bǔ)充,例如太陽能電池充電;有些資源無法得到補(bǔ)充,例如推進(jìn)劑的消耗等。在規(guī)劃中將資源表示為一個(gè)三元組R=(N,T,Q),其中N為資源的名字,T為資源的類型,Q為資源的容量。

        2.3 任務(wù)規(guī)劃技術(shù)

        深空環(huán)境的不確知、任務(wù)復(fù)雜、時(shí)間資源約束耦合以及活動(dòng)并發(fā)性等特殊情況對(duì)任務(wù)規(guī)劃技術(shù)提出了更高的需求。因此在進(jìn)行深空探測(cè)器任務(wù)規(guī)劃技術(shù)研究時(shí),不僅要考慮任務(wù)活動(dòng)的選擇,也需要對(duì)時(shí)間和資源等進(jìn)行分配調(diào)度,傳統(tǒng)的任務(wù)規(guī)劃方法并不能同時(shí)進(jìn)行處理,發(fā)展適合深空探測(cè)領(lǐng)域的任務(wù)規(guī)劃技術(shù)是必要的。

        傳統(tǒng)的規(guī)劃系統(tǒng)一般分為輸入、規(guī)劃方法和輸出三部分組成。其中,輸入通常包括:?jiǎn)栴}空間的初始狀態(tài)、系統(tǒng)所要達(dá)到的目標(biāo)、可能實(shí)施的動(dòng)作[23]。而輸出則是滿足相關(guān)要求和約束的動(dòng)作序列。

        傳統(tǒng)的規(guī)劃方法存在著較難滿足和求解具有時(shí)間資源等約束的實(shí)際規(guī)劃問題。因此,從20世紀(jì)90年代開始,為了提高規(guī)劃效率和規(guī)劃能力,依次提出了約束可滿足規(guī)劃(Constraint Satisfaction Problem,CSP)[24]、分層任務(wù)網(wǎng)規(guī)劃[25]、概率論規(guī)劃[26]和時(shí)態(tài)規(guī)劃[27]4種廣泛應(yīng)用的方法。

        表2給出了當(dāng)前廣泛使用任務(wù)規(guī)劃方法的特點(diǎn)和局限性。針對(duì)深空探測(cè)任務(wù)規(guī)劃中的約束復(fù)雜等特殊問題,總結(jié)出了3種適用于深空探測(cè)的新任務(wù)規(guī)劃的方法:基于持續(xù)動(dòng)作的任務(wù)規(guī)劃、基于迭代修復(fù)的任務(wù)規(guī)劃和基于CSP的任務(wù)規(guī)劃,如表3所示。

        表2 任務(wù)規(guī)劃方法比較Table 2 Comparison of different mission planning methods

        表3 深空探測(cè)器適用任務(wù)規(guī)劃方法Table 3 Mission planning methods for dee space probe

        對(duì)于實(shí)際的深空探測(cè)任務(wù),其動(dòng)作有一定的執(zhí)行時(shí)間,因此采用基于持續(xù)動(dòng)作的規(guī)劃方法處理持續(xù)動(dòng)作、資源約束和有截至?xí)r間的任務(wù)目標(biāo)。該方法用一系列基于距離的啟發(fā)式來控制搜索,同時(shí)考慮了搜索的滿足和優(yōu)化兩個(gè)方面,以松弛時(shí)間規(guī)劃圖為基礎(chǔ)設(shè)計(jì)可納且高效的啟發(fā)式。對(duì)于滿足搜索和優(yōu)化搜索,分別提出了基于規(guī)劃質(zhì)量的啟發(fā)式和基于目標(biāo)完成時(shí)間和松弛圖的啟發(fā)式。該方法能夠解決深空探測(cè)器面臨的復(fù)雜時(shí)間資源等約束,但對(duì)規(guī)劃器的處理能力和求解效率都有一定要求。

        深空探測(cè)器各載荷間約束關(guān)系復(fù)雜耦合,基于CSP的規(guī)劃方法將規(guī)劃問題和調(diào)度問題統(tǒng)一編碼為約束形式,用約束可滿足技術(shù)求解。與經(jīng)典的約束可滿足規(guī)劃不同的是,實(shí)際深空探測(cè)任務(wù)中動(dòng)作有一定的持續(xù)時(shí)間,導(dǎo)致其規(guī)劃解的長(zhǎng)度不固定,通常采用定界分層方法,能夠有效的解決深空探測(cè)器載荷之間的復(fù)雜約束以及過耦合狀態(tài),并且快速實(shí)現(xiàn)規(guī)劃前對(duì)約束的預(yù)處理,但是由于在規(guī)劃過程中需要使用一致性對(duì)規(guī)劃相容性進(jìn)行判斷,剪枝方法不僅占用大量計(jì)算資源,一旦過度剪枝還會(huì)降低算法的效率。

        基于迭代修復(fù)的規(guī)劃方法采用時(shí)間線框架描述規(guī)劃知識(shí),能夠一定程度上滿足深空探測(cè)器任務(wù)規(guī)劃對(duì)時(shí)間約束的需求。該方法根據(jù)探測(cè)器當(dāng)前狀態(tài),添加滿足約束的活動(dòng),采用基于沖突修復(fù)的偏序規(guī)劃算法搜索求解,算法框架如圖3所示[28]。但是該搜索算法需要定義沖突類型,不同的沖突有其對(duì)應(yīng)的解決方法,對(duì)計(jì)算能力需求強(qiáng),且有時(shí)出現(xiàn)無解卻無法提前中斷搜索的情況,導(dǎo)致效率低下。

        2.4 任務(wù)重規(guī)劃/規(guī)劃修復(fù)

        在探測(cè)任務(wù)執(zhí)行過程中,若外界環(huán)境發(fā)生了變化[29](如火星車行進(jìn)過程中地形的改變)或者動(dòng)作執(zhí)行失敗[30](如太陽帆板未能展開),原規(guī)劃結(jié)果無法保證任務(wù)的順利完成。此時(shí),深空探測(cè)器需要利用任務(wù)重規(guī)劃/規(guī)劃修復(fù)技術(shù),根據(jù)執(zhí)行情況和自身能力綜合決策出新的規(guī)劃結(jié)果,以保障任務(wù)目標(biāo)的實(shí)現(xiàn)[31]。此外,對(duì)于超新星爆發(fā)、火山噴發(fā)等極具探測(cè)意義的突發(fā)事件,探測(cè)器能利用規(guī)劃修復(fù)技術(shù)在局部調(diào)整已有規(guī)劃結(jié)果,在不影響原任務(wù)目標(biāo)實(shí)現(xiàn)的基礎(chǔ)上,也能完成這些突發(fā)事件的探測(cè)[32]。

        任務(wù)重規(guī)劃技術(shù)放棄已有規(guī)劃結(jié)果,在任務(wù)執(zhí)行失敗的時(shí)候利用局部搜索、進(jìn)化算法、神經(jīng)網(wǎng)絡(luò)、約束可滿足問題求解等方法[33-35]決策出探測(cè)器在未來一段時(shí)間內(nèi)需要采取的操作。但由于星上計(jì)算資源有限、問題求解困難,任務(wù)重規(guī)劃難以在短時(shí)間內(nèi)給出合理可行的任務(wù)執(zhí)行方案。相反,規(guī)劃修復(fù)技術(shù)可充分利用已有的規(guī)劃結(jié)果,通過參數(shù)調(diào)整、動(dòng)作刪除、求精搜索等方法[36]自主生成一些中間的規(guī)劃修復(fù)目標(biāo),縮小問題求解規(guī)模,提高問題求解效率。盡管在理論上已經(jīng)證明規(guī)劃修復(fù)問題的復(fù)雜度不一定比重規(guī)劃的低[37-38],但大量實(shí)驗(yàn)結(jié)果表明規(guī)劃修復(fù)效率更高[39-40]。因此,在應(yīng)對(duì)任務(wù)執(zhí)行過程中的突發(fā)事件時(shí),探測(cè)器應(yīng)該優(yōu)先采用規(guī)劃修復(fù)方法做出快速?zèng)Q策。

        現(xiàn)有的規(guī)劃修復(fù)方法大致可以歸為5類[41]:規(guī)則匹配性、局部調(diào)整型、刪除/求精型、狀態(tài)轉(zhuǎn)移型,以及構(gòu)造新問題型。各類型所包含的典型方法、規(guī)劃器、處理類型及局限如表4所示。由于深空探測(cè)器任務(wù)執(zhí)行存在多子系統(tǒng)耦合的特點(diǎn),其活動(dòng)持續(xù)、并行且消耗資源。同時(shí),對(duì)于著陸下降、彗星環(huán)繞觀測(cè)等時(shí)間要求緊迫的任務(wù),規(guī)劃修復(fù)技術(shù)需要在更短時(shí)間內(nèi)快速給出合理可行的修復(fù)方案。此外,由于對(duì)探測(cè)目標(biāo)的認(rèn)知受限、空間環(huán)境的不確知以及設(shè)備損耗、太陽風(fēng)暴等突發(fā)事件難精準(zhǔn)預(yù)測(cè),規(guī)劃修復(fù)技術(shù)面臨著固有模型不適應(yīng)新的執(zhí)行環(huán)境、探測(cè)器未來狀態(tài)難預(yù)測(cè)、既定規(guī)劃的失效部分難確定等難題。因此,表4中的大部分規(guī)劃修復(fù)方法難以直接應(yīng)用到深空探測(cè)領(lǐng)域。

        表4 多種規(guī)劃修復(fù)方法的比較Table 4 Comparison of different plan repair methods

        為有效解決深空探測(cè)器規(guī)劃修復(fù)問題,一種解決方式是融合表3中的多項(xiàng)規(guī)劃修復(fù)技術(shù),為深空探測(cè)器提供高效求解規(guī)劃執(zhí)行失敗問題的方法。例如,已知執(zhí)行失敗類型處理和未知執(zhí)行失敗類型處理相結(jié)合的混合智能規(guī)劃修復(fù)方法。其中,針對(duì)已知執(zhí)行失敗類型的處理,可以事先在器上存儲(chǔ)修補(bǔ)規(guī)則,根據(jù)診斷后的失敗原因選擇對(duì)應(yīng)的修復(fù)策略完成規(guī)劃修復(fù);或基于已有的規(guī)劃歷史結(jié)果,組建規(guī)劃庫,指導(dǎo)現(xiàn)有規(guī)劃的修復(fù)。針對(duì)未知執(zhí)行失敗類型的處理,可以結(jié)合當(dāng)時(shí)的執(zhí)行環(huán)境,識(shí)別不再可用的動(dòng)作序列并將其刪除,然后采用目標(biāo)導(dǎo)向的智能搜索等方法求解修復(fù)方案;或提前通過狀態(tài)回退構(gòu)造規(guī)劃修復(fù)候補(bǔ)樹,便于快速找到修復(fù)方案。針對(duì)目標(biāo)變化或者失效規(guī)劃部分占比過大的情況,可以從原規(guī)劃結(jié)果中提取動(dòng)作信息或約束關(guān)系以增強(qiáng)領(lǐng)域信息,從而構(gòu)造新問題,再通過規(guī)劃器來完成修復(fù)方案求解。

        2.5 運(yùn)動(dòng)規(guī)劃技術(shù)

        深空探測(cè)任務(wù)約束復(fù)雜、姿態(tài)和軌道機(jī)動(dòng)頻繁,需要實(shí)現(xiàn)姿態(tài)和軌跡自主控制,因此通常根據(jù)當(dāng)前狀態(tài)生成姿態(tài)路徑或軌跡,在任務(wù)過程中進(jìn)行自主姿態(tài)規(guī)劃和軌跡規(guī)劃。

        2.5.1 深空探測(cè)姿態(tài)規(guī)劃

        深空探測(cè)中的姿態(tài)規(guī)劃主要用于完成對(duì)日定向、對(duì)地定向、小行星觀測(cè)等姿態(tài)機(jī)動(dòng)任務(wù),通過規(guī)劃出姿態(tài)路徑來指引姿態(tài)機(jī)動(dòng)。姿態(tài)機(jī)動(dòng)是深空探測(cè)器從一種姿態(tài)轉(zhuǎn)換到另一種姿態(tài)的再定向過程。姿態(tài)規(guī)劃能夠極大地減少姿態(tài)控制系統(tǒng)對(duì)復(fù)雜姿態(tài)控制方法的需求和依賴,可以使深空探測(cè)器具備更高層次的自主運(yùn)動(dòng)規(guī)劃和自主運(yùn)行能力。

        根據(jù)規(guī)劃目的可以將深空探測(cè)姿態(tài)規(guī)劃分為多約束可行姿態(tài)機(jī)動(dòng)規(guī)劃和多約束最優(yōu)姿態(tài)機(jī)動(dòng)規(guī)劃。前者的規(guī)劃目的是得到滿足多約束的安全的姿態(tài)機(jī)動(dòng)路徑,后者的規(guī)劃目的是綜合考慮各種約束的基礎(chǔ)上基于特定指標(biāo)實(shí)現(xiàn)姿態(tài)路徑優(yōu)化。

        1)多約束可行姿態(tài)機(jī)動(dòng)規(guī)劃

        多約束可行姿態(tài)機(jī)動(dòng)規(guī)劃統(tǒng)一考慮姿態(tài)指向和有界等多種約束,通過綜合求解得到姿態(tài)機(jī)動(dòng)路徑、角速度和控制力矩等信息。深空探測(cè)器在姿態(tài)機(jī)動(dòng)過程中會(huì)受到多種指向約束和有界約束的限制。這些姿態(tài)約束減小了深空探測(cè)器在三維姿態(tài)空間和姿態(tài)參數(shù)空間中的可行域,為姿態(tài)機(jī)動(dòng)問題的求解帶來了很大的困難。

        目前的多約束可行姿態(tài)機(jī)動(dòng)規(guī)劃方法主要有勢(shì)函數(shù)法、幾何方法、隨機(jī)規(guī)劃方法和非線性規(guī)劃方法。勢(shì)函數(shù)法的針對(duì)姿態(tài)指向禁忌約束來構(gòu)造排斥勢(shì)函數(shù),McInnes[42]通過對(duì)禁忌區(qū)域施加高勢(shì)能實(shí)現(xiàn)對(duì)指向約束的規(guī)避。幾何方法通常根據(jù)空間矢量的幾何關(guān)系得到姿態(tài)機(jī)動(dòng)可行解,Hablani[43]在單位球上定義排斥區(qū)域,通過求解兩個(gè)相關(guān)轉(zhuǎn)角得到理想的切線路徑。隨機(jī)規(guī)劃算法在隨機(jī)擴(kuò)展的過程中對(duì)當(dāng)前擴(kuò)展節(jié)點(diǎn)是否進(jìn)入障礙區(qū)進(jìn)行檢查,Xu等[44]在局部擴(kuò)展后用二次規(guī)劃方法求解,得到滿足多種約束的姿態(tài)機(jī)動(dòng)路徑。非線性規(guī)劃方法將姿態(tài)規(guī)劃轉(zhuǎn)換為非線性規(guī)劃問題,Kim等[45]將姿態(tài)指向約束轉(zhuǎn)化成二次凸約束的形式,從而得到滿足約束的非線性解。

        對(duì)于深空探測(cè)任務(wù)中,勢(shì)函數(shù)法對(duì)計(jì)算資源要求低,實(shí)時(shí)性好,但是只適合處理簡(jiǎn)單指向約束。幾何方法簡(jiǎn)單直觀,然而模型較為復(fù)雜,占用過多資源。隨機(jī)規(guī)劃算法對(duì)復(fù)雜多約束的情況具有較大的適應(yīng)能力,但是隨機(jī)算法具有很大的不確定性,在深空應(yīng)用中可靠性不足。非線性規(guī)劃方法將非凸約束凸化,約束處理能力強(qiáng),易于應(yīng)用。表5對(duì)勢(shì)函數(shù)法、幾何方法、隨機(jī)規(guī)劃算法和非線性規(guī)劃方法進(jìn)行了對(duì)比。

        表5 幾種方法的比較Table 5 Comparison of several methods

        2)多約束最優(yōu)姿態(tài)機(jī)動(dòng)規(guī)劃

        多約束最優(yōu)姿態(tài)機(jī)動(dòng)規(guī)劃引入能量消耗或機(jī)動(dòng)時(shí)間等優(yōu)化目標(biāo),在綜合考慮各種約束的基礎(chǔ)上進(jìn)一步實(shí)現(xiàn)目標(biāo)優(yōu)化。目前關(guān)于多約束最優(yōu)姿態(tài)機(jī)動(dòng)規(guī)劃問題的研究方法主要有元啟發(fā)式方法、線性松弛方法以及偽譜法等。

        元啟發(fā)式方法采用高層次的啟發(fā)式實(shí)現(xiàn)算法隨機(jī)性和局部搜索的平衡,Wu等[46]設(shè)計(jì)了角速度和時(shí)間的編碼方法,將時(shí)間最優(yōu)姿態(tài)路徑規(guī)劃問題轉(zhuǎn)換成中間節(jié)點(diǎn)尋優(yōu)的最優(yōu)化問題,進(jìn)而求出滿足約束的姿態(tài)機(jī)動(dòng)路徑。根據(jù)姿態(tài)規(guī)劃的搜索策略,將元啟發(fā)式方法做如圖4所示的分類。

        圖4 元啟發(fā)式方法的分類Fig.4 The classification of meta-heuristic methods

        線性松弛方法通過利用線性松弛技術(shù)確定最優(yōu)值的邊界來求解非凸二次約束二次規(guī)劃問題,Sun等[47]利用半定松弛方法將原來的非凸二次約束二次規(guī)劃問題轉(zhuǎn)化為半定規(guī)劃問題,并通過迭代秩最小化方法逐漸得到最優(yōu)解。偽譜法利用正交多項(xiàng)式來表示最優(yōu)解曲線,將原來的最優(yōu)控制問題轉(zhuǎn)化為求解正交多項(xiàng)式展開系數(shù)的非線性規(guī)劃問題。

        對(duì)于深空探測(cè)中的多約束最優(yōu)姿態(tài)機(jī)動(dòng)規(guī)劃,線性松弛方法主要針對(duì)能量最優(yōu)問題且計(jì)算效率較低,偽譜法并未考慮中間節(jié)點(diǎn)約束,元啟發(fā)式方法優(yōu)化效果較好,能夠得到低能量或短時(shí)間的姿態(tài)機(jī)動(dòng)路徑。

        2.5.2 深空探測(cè)軌跡規(guī)劃

        深空探測(cè)中軌跡規(guī)劃的目標(biāo)是根據(jù)深空探測(cè)器的位置信息及目標(biāo)飛行區(qū)域或目標(biāo)飛行點(diǎn)制定相應(yīng)的機(jī)動(dòng)策略,如探測(cè)器的機(jī)動(dòng)點(diǎn)、機(jī)動(dòng)時(shí)間及機(jī)動(dòng)大小等,并生成連接初始位置和目標(biāo)位置且滿足一系列工程約束的飛行軌跡,使得探測(cè)器能夠在不確定的環(huán)境下快速并安全抵達(dá)目標(biāo)位置。

        在深空中,有限的燃料和復(fù)雜未知的環(huán)境給軌跡規(guī)劃帶來了極大的挑戰(zhàn)。由于探測(cè)器所攜帶的燃料有限,且需要在有限的時(shí)間內(nèi)抵達(dá)目標(biāo)地點(diǎn),需要盡可能快速規(guī)劃出節(jié)省燃料的軌跡。而復(fù)雜未知的深空環(huán)境則對(duì)軌跡規(guī)劃的安全性提出了更高的要求。目前,軌跡規(guī)劃主要由連續(xù)優(yōu)化和離散搜索兩種方法解決以上面臨的兩種問題。其中,連續(xù)優(yōu)化主要根據(jù)飛行任務(wù)設(shè)置優(yōu)化指標(biāo),生成平滑軌跡,且約束越多越難求解。而離散搜索則通過節(jié)點(diǎn)拓展的方式搜索出軌跡經(jīng)過的節(jié)點(diǎn),所生成的軌跡不平滑,但約束越多越容易求解。

        連續(xù)優(yōu)化方法主要對(duì)探測(cè)器在軌跡規(guī)劃中的某些指標(biāo)進(jìn)行優(yōu)化。探測(cè)器在飛行中除了飛往指定目標(biāo)外,還需要考慮其他約束條件。在深空探測(cè)中,因?yàn)轱w行距離遠(yuǎn)、飛行時(shí)間長(zhǎng)等特點(diǎn),所以還需根據(jù)所攜帶的燃料數(shù)量考慮燃料消耗問題,或根據(jù)任務(wù)需求考慮飛行時(shí)間問題。連續(xù)優(yōu)化方法可以使得某些特定性能指標(biāo)達(dá)到最優(yōu)。因此,連續(xù)優(yōu)化方法也稱軌跡優(yōu)化方法。目前,連續(xù)優(yōu)化的主流方法有直接法、間接法、偽譜法和凸優(yōu)化方法等。

        直接法引入了時(shí)間離散網(wǎng)格,將控制變量或狀態(tài)變量離散化,將動(dòng)態(tài)的約束條件轉(zhuǎn)化為代數(shù)約束條件,通過將控制變量和狀態(tài)變量參數(shù)化,將優(yōu)化問題轉(zhuǎn)化為離散參數(shù)優(yōu)化問題,進(jìn)而利用優(yōu)化算法進(jìn)行問題求解。直接法可分為直接配點(diǎn)法和直接打靶法兩大類。直接配點(diǎn)法[48-49]將控制變量和狀態(tài)變量離散化,并將整個(gè)任務(wù)時(shí)間分成多段,每段的兩個(gè)端點(diǎn)稱為節(jié)點(diǎn),兩節(jié)點(diǎn)用多項(xiàng)式表示狀態(tài)變量隨時(shí)間的變化。直接打靶法僅將控制變量離散化,通過數(shù)值積分獲得狀態(tài)變量,從而求解出目標(biāo)函數(shù)。直接配點(diǎn)法與直接打靶法對(duì)狀態(tài)初始值的依賴度都較低,但相比之下直接配點(diǎn)法的精度較高。間接法的基本原理是最優(yōu)控制理論的極大值原理,將最優(yōu)控制問題轉(zhuǎn)換為兩點(diǎn)邊界問題或多點(diǎn)邊界問題進(jìn)行求解。間接法的精度較高,但對(duì)初始值的依賴度更高。而混合法則是將直接法和間接法相結(jié)合,利用最優(yōu)控制原理和非線性規(guī)劃的優(yōu)勢(shì),更有效地求取最優(yōu)解。表6對(duì)直接配點(diǎn)法、直接打靶法和間接法進(jìn)行了對(duì)比。

        表6 連續(xù)優(yōu)化方法的比較Table 6 Comparison of continuous optimization methods

        在一些深空探測(cè)任務(wù)中,探測(cè)器需要飛往某些特定的區(qū)域或避開一些危險(xiǎn)區(qū)域和障礙物,針對(duì)這一問題,離散搜索方法提供了可行的軌跡求解方法。離散搜索方法將軌跡分為多段求解,考慮各種路徑約束,將各節(jié)點(diǎn)連接形成一條完整的軌跡。目前應(yīng)用較多的離散搜索方法有圖解法、A*搜索法和Way-Points方法等。

        圖解法的每一條軌跡都由一組導(dǎo)航點(diǎn)插入,將軌跡投影到一個(gè)有向圖上[50],用有向圖中的點(diǎn)表示導(dǎo)航點(diǎn),在特定條件下在過渡點(diǎn)進(jìn)行轉(zhuǎn)移,每個(gè)過渡點(diǎn)都由一段弧連接,弧段在有向圖中表示為連接節(jié)點(diǎn)的有向線段。A*搜索法[51]定義了三維搜索空間并將空間劃分為多個(gè)不同節(jié)點(diǎn),將潛在的障礙物和危險(xiǎn)區(qū)域用基本幾何形狀或其組合表示,通過滿足一定的數(shù)學(xué)條件使某一段軌跡處于障礙物和危險(xiǎn)區(qū)域之外。Way-Points方法[52]就是先給定一系列航天器必須經(jīng)過的導(dǎo)航點(diǎn),再用導(dǎo)航點(diǎn)參數(shù)表示軌跡并對(duì)其優(yōu)化。離散搜索的方法在理論上可以確保收斂到全局最優(yōu)解,但需要對(duì)搜做空間進(jìn)行正確的離散化,且所生成的軌跡不是平滑的。圖5表示了離散搜索方法的基本原理。

        圖5 離散搜索方法圖示Fig.5 Diagram of discrete search methods

        2.6 科學(xué)觀測(cè)任務(wù)規(guī)劃

        深空科學(xué)觀測(cè)任務(wù)利用深空探測(cè)器對(duì)地球以外的空間和天體進(jìn)行觀測(cè),收集圖像、電磁信號(hào)等信息。其主要的特點(diǎn)是存在時(shí)間窗口約束,只有在時(shí)間窗口之內(nèi)才能觀測(cè)到目標(biāo),完成觀測(cè)任務(wù)。一些現(xiàn)有的規(guī)劃系統(tǒng)同時(shí)具備對(duì)地和深空目標(biāo)觀測(cè)任務(wù)的規(guī)劃能力,因此本文不著重區(qū)分觀測(cè)對(duì)象。

        觀測(cè)任務(wù)規(guī)劃方法按照航天器數(shù)量分為單星觀測(cè)任務(wù)規(guī)劃和多星觀測(cè)任務(wù)規(guī)劃。在多星觀測(cè)任務(wù)規(guī)劃中,按照規(guī)劃系統(tǒng)架構(gòu)又分為集中式規(guī)劃、分布式規(guī)劃和分散式規(guī)劃。集中式規(guī)劃容易造成單點(diǎn)失效或?qū)σ?guī)劃衛(wèi)星的計(jì)算壓力過大,因此更適合小規(guī)模多星系統(tǒng);分布式和分散式的規(guī)劃架構(gòu)具備充分利用多星計(jì)算資源、避免單點(diǎn)失效等優(yōu)點(diǎn),但需要平衡任務(wù)收益與通信代價(jià)。

        一類觀測(cè)任務(wù)規(guī)劃方法主要關(guān)注約束處理,包括活動(dòng)間邏輯約束和航天器時(shí)間資源約束,將觀測(cè)任務(wù)規(guī)劃問題抽象為約束滿足問題(CSP),采用的方法主要為基于規(guī)則的搜索、約束推理技術(shù)及迭代修復(fù)方法。

        法國(guó)航天局的Pleiades系列衛(wèi)星以的自動(dòng)化通用體系演示應(yīng)用平臺(tái)AGATA(Autonomy Generic Architecture -Test and Application)采用時(shí)間線上的約束網(wǎng)絡(luò)模型描述觀測(cè)規(guī)劃問題[53-54],構(gòu)建反應(yīng)型和慎重型任務(wù)相結(jié)合的規(guī)劃架構(gòu)[55],外部環(huán)境通過反應(yīng)型任務(wù)與慎重型任務(wù)交互,反應(yīng)型規(guī)劃采用啟發(fā)式搜索方法,慎重型采用迭代隨機(jī)貪婪搜索算法。

        美國(guó)噴氣推進(jìn)實(shí)驗(yàn)室的人工智能小組開發(fā)的自主規(guī)劃和調(diào)度環(huán)境(ASPEN)[56]采用狀態(tài)時(shí)間線模型和迭代修復(fù)規(guī)劃方法,具備時(shí)間資源約束處理能力。連續(xù)活動(dòng)調(diào)度規(guī)劃執(zhí)行和重規(guī)劃系統(tǒng)(CASPER)是ASPEN的軟實(shí)時(shí)星上規(guī)劃版本,能夠在環(huán)境變化或目標(biāo)變化后快速進(jìn)行重新規(guī)劃[57]。

        上述方法主要關(guān)注約束處理,還有一類觀測(cè)規(guī)劃方法不僅處理約束還力求最大化任務(wù)收益,以處理觀測(cè)目標(biāo)多而觀測(cè)資源有限的任務(wù)。其數(shù)學(xué)本質(zhì)是復(fù)雜的組合優(yōu)化問題,可建模為背包問題模型、圖論問題模型、整數(shù)規(guī)劃問題等。對(duì)此類觀測(cè)任務(wù)的規(guī)劃方法可分為精確算法和近似算法。動(dòng)態(tài)規(guī)劃、分支定價(jià)算法等精確算法對(duì)于復(fù)雜的問題需要大量計(jì)算時(shí)間,難以在多項(xiàng)式時(shí)間內(nèi)找到最優(yōu)解,因此實(shí)際中多采用近似算法在較短的時(shí)間內(nèi)找到最優(yōu)解或可接受的次優(yōu)解。近似算法包括貪婪搜索、禁忌搜索、模擬退火、遺傳算法及人工神經(jīng)網(wǎng)絡(luò)等。

        SPIKE[58]規(guī)劃調(diào)度軟件系統(tǒng)用于哈勃天文望遠(yuǎn)鏡的長(zhǎng)期任務(wù)調(diào)度,能夠生成包括多達(dá)5 000個(gè)(至少1 h)觀測(cè)活動(dòng)的多年調(diào)度。SPIKE同時(shí)采用了程序性搜索、基于規(guī)則的啟發(fā)式搜索和人工神經(jīng)網(wǎng)絡(luò)方法,不僅處理約束,也考慮觀測(cè)收益的優(yōu)化。

        在中歐合作的深空探測(cè)項(xiàng)目DSL(Discovering the Sky at the Longest Wavelengths)任務(wù)中,一個(gè)主探測(cè)器和8個(gè)子探測(cè)器繞月合作探測(cè)空間低頻信號(hào)。此項(xiàng)目采用分布式星上規(guī)劃算法,局部約束可滿足問題采用貪婪搜索方法,全局優(yōu)化采用分布式混合動(dòng)態(tài)變異遺傳算法(Distributed Hybrid Dynamic Mutation Genetic Algorithm,DHDMGA)[59]。針對(duì)該任務(wù)的星上任務(wù)自主重規(guī)劃問題[31],提出多目標(biāo)混合動(dòng)態(tài)變異遺傳算法(Multi-Objective Hybrid Dynamic Mutation Genetic Algorithm,MO-HDMGA)和重規(guī)劃方法結(jié)合的規(guī)劃模式。王沖等在分析多衛(wèi)星中心內(nèi)部特點(diǎn)及中心間關(guān)系的基礎(chǔ)上,建立數(shù)學(xué)模型并提出了多中心合作協(xié)同進(jìn)化算法[60]。趙凡宇對(duì)航天器多目標(biāo)觀測(cè)任務(wù)調(diào)度與規(guī)劃方法進(jìn)行研究[61],設(shè)計(jì)了基于蟻群算法的任務(wù)調(diào)度優(yōu)化方法。上述算法都屬于元啟發(fā)式算法,雖然能夠達(dá)到優(yōu)化收益的效果,但是算法復(fù)雜度較高且具有隨機(jī)性,并不適合計(jì)算資源有限,任務(wù)可靠性要求高的任務(wù)。

        南京航空航天大學(xué)的學(xué)者基于多智能體技術(shù)對(duì)多星觀測(cè)問題的規(guī)劃和重規(guī)劃進(jìn)行研究[62],采用基于合同網(wǎng)的二次任務(wù)分配策略和迭代重規(guī)劃策略,證明分布式算法比集中式多智能體算法有更高的效率和更優(yōu)的收益。針對(duì)DSL在有限通信條件下的規(guī)劃,設(shè)計(jì)了基于博弈理論的分布式和分散式的規(guī)劃方法[63],提出3種多星協(xié)商機(jī)制:基于效能的可反悔機(jī)制、烽火信號(hào)機(jī)制和基于廣播的機(jī)制。趙宇庭等提出具有私有性的分散式多探測(cè)器觀測(cè)任務(wù)規(guī)劃方法,設(shè)計(jì)基于雙邊匹配延遲接受策略的多智能體迭代協(xié)商機(jī)制,且在智能體內(nèi)時(shí)間資源約束處理中也加入了優(yōu)化策略,從規(guī)劃?rùn)C(jī)制和局部決策兩個(gè)層面提高任務(wù)收益。基于合同網(wǎng)、博弈理論、雙邊匹配等多智能體方法,優(yōu)化機(jī)制簡(jiǎn)潔,每個(gè)智能體內(nèi)部算法復(fù)雜度低,適合多探測(cè)器分布式任務(wù)規(guī)劃。

        隨著航天器數(shù)量的增長(zhǎng)和觀測(cè)任務(wù)復(fù)雜度的提高,地面管控資源越發(fā)緊缺,難以滿足觀測(cè)任務(wù)快速響應(yīng)的需求,星上自主觀測(cè)任務(wù)規(guī)劃將成為未來的發(fā)展方向。隨著未來星上計(jì)算能力的增強(qiáng),機(jī)器學(xué)習(xí)等對(duì)計(jì)算資源要求較高的人工智能方法也將成為觀測(cè)任務(wù)自主規(guī)劃的可選方案。

        3 深空探測(cè)器自主規(guī)劃技術(shù)發(fā)展趨勢(shì)

        3.1 自主規(guī)劃技術(shù)發(fā)展趨勢(shì)

        針對(duì)深空探測(cè)器自主規(guī)劃面臨的約束復(fù)雜、不確定性強(qiáng)和實(shí)時(shí)性要求高的特點(diǎn),自主規(guī)劃技術(shù)以滿足實(shí)際自主運(yùn)行需求為目標(biāo)不斷發(fā)展,從任務(wù)規(guī)劃、規(guī)劃修復(fù)和運(yùn)動(dòng)規(guī)劃等方面力求形成高層決策的自主管理系統(tǒng),保障探測(cè)器自主安全運(yùn)行,其發(fā)展趨勢(shì)為如下幾個(gè)方面。

        1)探測(cè)器由單一模型向多維度多尺度建模發(fā)展

        深空探測(cè)器系統(tǒng)復(fù)雜,單一的模型描述語言難以充分刻畫系統(tǒng)間的耦合約束條件。所以,需建立多維度、多尺度的規(guī)劃知識(shí)模型,既能夠提高規(guī)劃解的可行性,又能降低規(guī)劃算法的計(jì)算需求。

        2)探測(cè)器規(guī)劃向分布式群規(guī)劃發(fā)展

        針對(duì)多探測(cè)器分布式協(xié)同任務(wù)規(guī)劃需求,研究適用于深空探測(cè)任務(wù)的體系結(jié)構(gòu)和通信交互機(jī)制。充分利用器上計(jì)算資源、避免單點(diǎn)失效,快速應(yīng)對(duì)和響應(yīng)任務(wù)需求。

        3)預(yù)先規(guī)劃向復(fù)雜環(huán)境在線快速規(guī)劃發(fā)展

        深空探測(cè)任務(wù)過程中,未知的飛行環(huán)境、突發(fā)的科學(xué)目標(biāo)等會(huì)經(jīng)常導(dǎo)致預(yù)定規(guī)劃難以正常執(zhí)行。為了盡可能地完成任務(wù)目標(biāo),必須快速應(yīng)對(duì)和解決規(guī)劃失效的情況。所以,需要重點(diǎn)研究不確知環(huán)境下,預(yù)定規(guī)劃序列執(zhí)行失敗時(shí)的快速重規(guī)劃方法。

        4)單一目標(biāo)運(yùn)動(dòng)規(guī)劃向多約束多目標(biāo)運(yùn)動(dòng)規(guī)劃發(fā)展

        深空探測(cè)存在飛行環(huán)境復(fù)雜、姿態(tài)/軌跡約束多等問題,且星上資源有限。所以,需要考慮多約束下運(yùn)動(dòng)規(guī)劃技術(shù),并綜合各性能指標(biāo),兼顧機(jī)動(dòng)時(shí)間與能量消耗等條件,重點(diǎn)研究多約束多目標(biāo)下的運(yùn)動(dòng)規(guī)劃技術(shù)。

        3.2 自主規(guī)劃技術(shù)研究方向

        由于對(duì)時(shí)間資源等復(fù)雜約束的表達(dá)能力和有限計(jì)算資源下規(guī)劃處理能力的限制,自主規(guī)劃技術(shù)實(shí)際應(yīng)用目前處于前期探索和研究階段,僅在少數(shù)深空探測(cè)任務(wù)規(guī)劃中進(jìn)行了測(cè)試和試驗(yàn)??紤]到深空探測(cè)領(lǐng)域的系統(tǒng)耦合性、資源有限和約束復(fù)雜等特殊性質(zhì),從當(dāng)前亟需解決的問題和發(fā)展趨勢(shì)來看,建議在深空探測(cè)領(lǐng)域重點(diǎn)研究以下方向。

        1) 任務(wù)規(guī)劃與序列執(zhí)行協(xié)調(diào)配合框架研究

        隨著深空探測(cè)器對(duì)自主能力需求的逐步提高,自主規(guī)劃與序列執(zhí)行框架設(shè)計(jì)更加趨于復(fù)雜化、并行化和一體化。對(duì)于仍未實(shí)現(xiàn)的探測(cè)任務(wù)目標(biāo)或者重規(guī)劃/規(guī)劃修復(fù)任務(wù),自主任務(wù)規(guī)劃部分應(yīng)該在探測(cè)器當(dāng)前序列執(zhí)行的基礎(chǔ)上,結(jié)合當(dāng)前及未來一段時(shí)間內(nèi)的星載能源變化情況、各子系統(tǒng)的調(diào)度和健康狀況,給出合理可行的執(zhí)行方案;對(duì)于由環(huán)境變化、執(zhí)行異常、設(shè)備故障等引起的規(guī)劃失敗,序列執(zhí)行部分應(yīng)當(dāng)適時(shí)智能選取可執(zhí)行活動(dòng)繼續(xù)執(zhí)行,同時(shí)向自主任務(wù)規(guī)劃部分發(fā)送重規(guī)劃/規(guī)劃修復(fù)請(qǐng)求。自主規(guī)劃與序列執(zhí)行之間如何協(xié)調(diào)配合完成規(guī)劃–執(zhí)行–重規(guī)劃/規(guī)劃修復(fù)是未來值得探討的問題。

        2) 任務(wù)規(guī)劃模型中復(fù)雜約束表示方法研究

        任務(wù)規(guī)劃知識(shí)模型是自主規(guī)劃技術(shù)基礎(chǔ)并影響后續(xù)采用的規(guī)劃搜索技術(shù)。PDDL形式語言通過動(dòng)作、條件和效果將各狀態(tài)相關(guān)聯(lián),對(duì)時(shí)間、資源約束表達(dá)能力欠缺,大規(guī)劃規(guī)劃問題會(huì)呈現(xiàn)搜索空間大的特點(diǎn)。基于時(shí)間線的表達(dá)方式采用約束可滿足方法,復(fù)雜約束表達(dá)能力較強(qiáng),但后續(xù)規(guī)劃搜索效率有待提高。因此如何有效結(jié)合兩者優(yōu)勢(shì)對(duì)具有多約束的深空探測(cè)任務(wù)規(guī)劃模型進(jìn)行合理表示是當(dāng)前建模關(guān)鍵。

        3) 巨型搜索空間下高效規(guī)劃方法研究

        深空探測(cè)規(guī)劃問題具有大量并行活動(dòng)和資源約束等需要處理,搜索空間大,基于狀態(tài)空間規(guī)劃的啟發(fā)式規(guī)劃方法難以求解具有復(fù)雜約束規(guī)劃問題,且無法直接在基于時(shí)間線的規(guī)劃方法中使用。同時(shí),空間環(huán)境動(dòng)態(tài)不完全可觀測(cè),使得任務(wù)規(guī)劃過程需要考慮時(shí)間或資源等不確定性,給規(guī)劃方法帶來更大挑戰(zhàn)。因此,如何利用兩類任務(wù)規(guī)劃方法優(yōu)勢(shì)發(fā)展巨型搜索空間下高效規(guī)劃技術(shù)需要進(jìn)一步研究。

        4)不確定環(huán)境下自主任務(wù)重規(guī)劃/規(guī)劃修復(fù)技術(shù)研究

        隨著探測(cè)目標(biāo)距離的大幅度增加,深空環(huán)境的不確知性增強(qiáng),系統(tǒng)的長(zhǎng)期運(yùn)行可靠性降低,依賴于規(guī)劃知識(shí)模型的深空探測(cè)器自主任務(wù)重規(guī)劃/規(guī)劃修復(fù)技術(shù)的實(shí)用性受到極大挑戰(zhàn)。因此,匹配環(huán)境變化的自適應(yīng)規(guī)劃知識(shí)模型設(shè)計(jì)必定是自主任務(wù)重規(guī)劃/規(guī)劃修復(fù)研究的重點(diǎn)。此外,如何在有限的星載資源基礎(chǔ)上,考慮現(xiàn)有執(zhí)行序列對(duì)各子系統(tǒng)的調(diào)度,綜合活動(dòng)前提、執(zhí)行時(shí)間、消耗資源以及任務(wù)截止時(shí)間要求,快速給出次優(yōu)的解決方案,仍是研究重點(diǎn)。

        5)多約束下深空探測(cè)器最優(yōu)路徑快速規(guī)劃技術(shù)

        在深空探測(cè)的復(fù)雜環(huán)境下,探測(cè)器運(yùn)動(dòng)存在約束復(fù)雜、通信時(shí)延和燃料有限等問題,通常需要提高探測(cè)器的自主能力、減少機(jī)動(dòng)時(shí)間和燃料消耗。在引入機(jī)動(dòng)時(shí)間和燃料消耗等優(yōu)化目標(biāo)的條件下,運(yùn)動(dòng)規(guī)劃方法需要綜合考慮多種約束的基礎(chǔ)上進(jìn)一步實(shí)現(xiàn)目標(biāo)優(yōu)化,但是星上資源有限,優(yōu)化效率較低。因此,需要重點(diǎn)研究多約束下深空探測(cè)器最優(yōu)路徑快速規(guī)劃技術(shù),在提高算法的計(jì)算效率同時(shí)又能保持較好的機(jī)動(dòng)時(shí)間和燃料消耗優(yōu)化效果。

        6)分布式多智能體自主規(guī)劃技術(shù)

        隨著深空探測(cè)器任務(wù)復(fù)雜度和規(guī)模的提升,需要多探測(cè)器協(xié)作完成。分布式多智能體規(guī)劃具有充分利用多探測(cè)器的規(guī)劃能力、避免系統(tǒng)單點(diǎn)失效等優(yōu)點(diǎn),輔以合理的系統(tǒng)架構(gòu)、規(guī)劃協(xié)商模式及信息一致性策略,能提高規(guī)劃效率、提升系統(tǒng)可靠性,有益于多探測(cè)器系統(tǒng)長(zhǎng)期安全運(yùn)行。啟發(fā)式搜索、元啟發(fā)式算法、市場(chǎng)機(jī)制、博弈論、機(jī)器學(xué)習(xí)等理論都可作為分布式多智能體規(guī)劃的基礎(chǔ),但對(duì)于實(shí)際任務(wù),則需要選擇與場(chǎng)景需求和探測(cè)器能力相匹配的規(guī)劃方法,并結(jié)合任務(wù)特點(diǎn)進(jìn)行擴(kuò)展和改進(jìn)。

        4 結(jié) 論

        隨著計(jì)算機(jī)技術(shù)和人工智能相關(guān)領(lǐng)域的蓬勃發(fā)展,自主規(guī)劃技術(shù)解決現(xiàn)實(shí)深空探測(cè)器規(guī)劃問題逐漸成為可能,在自主規(guī)劃技術(shù)研究方面,已提出很多行之有效的規(guī)劃方法,在工程和空間技術(shù)領(lǐng)域也得到有效應(yīng)用。隨著航天任務(wù)復(fù)雜化、飛行距離越來越遠(yuǎn),自主規(guī)劃技術(shù)需求不斷增加,其已成為當(dāng)前空間自主技術(shù)領(lǐng)域研究的熱點(diǎn)。我國(guó)“天問一號(hào)”火星探測(cè)任務(wù)的成功實(shí)施,未來小行星探測(cè)、木星系探測(cè)等深空任務(wù)也在規(guī)劃論證中。我國(guó)深空探測(cè)領(lǐng)域迎來了前所未有的發(fā)展機(jī)遇,應(yīng)該把握機(jī)會(huì),著力突破深空探測(cè)關(guān)鍵技術(shù),開發(fā)具有自主知識(shí)產(chǎn)權(quán)的自主規(guī)劃系統(tǒng),推進(jìn)航天器自主化和智能化發(fā)展。

        猜你喜歡
        規(guī)劃方法
        發(fā)揮人大在五年規(guī)劃編制中的積極作用
        學(xué)習(xí)方法
        規(guī)劃引領(lǐng)把握未來
        快遞業(yè)十三五規(guī)劃發(fā)布
        商周刊(2017年5期)2017-08-22 03:35:26
        可能是方法不對(duì)
        多管齊下落實(shí)規(guī)劃
        十三五規(guī)劃
        華東科技(2016年10期)2016-11-11 06:17:41
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        迎接“十三五”規(guī)劃
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        亚洲国产精品久久人人爱| 国产精品亚洲一区二区三区妖精| 无码夜色一区二区三区| 欧美成人免费看片一区| 蜜桃精品国产一区二区三区| 草逼短视频免费看m3u8| 两个人看的www免费视频中文| 亚洲羞羞视频| 日本一区二区三区四区在线看| 国产亚洲成人精品久久久| 精品女同一区二区三区| 国产精品久久久久久久妇| 亚洲va中文字幕无码| 亚洲午夜精品久久久久久人妖| 中文字幕久久久久人妻无码 | 亚洲天堂二区三区三州| 男男啪啪激烈高潮cc漫画免费| 国产精品国产三级国av| yy111111少妇影院| 高清国产精品一区二区| 亚洲 欧美 偷自乱 图片| 九九久久精品无码专区| 国产一级三级三级在线视| av是男人的天堂免费| 久久久久久自慰出白浆| 中国猛少妇色xxxxx| 2021国产精品视频| 亚洲av高清在线一区二区三区| 精品国产一区二区三区三级| 亚洲精品一区久久久久久| 久久福利资源国产精品999| 午夜视频在线观看国产| 成人麻豆日韩在无码视频| 久久久精品2019免费观看| 国产在线高清无码不卡| 日本一区二区视频高清| 伊人久久大香线蕉亚洲五月天| 无码不卡免费一级毛片视频 | 精品无人区无码乱码大片国产| 亚洲综合久久精品少妇av| 把女人弄爽特黄a大片|