柳嘉潤,鞏慶海,翟雯婧
(1.宇航智能控制技術(shù)國家級(jí)重點(diǎn)實(shí)驗(yàn)室·北京·100854;2.北京航天自動(dòng)控制研究所·北京·100854)
智能自主技術(shù)作為未來顛覆性技術(shù)的重要內(nèi)容之一,已在美國多個(gè)公共智庫被提及和肯定。早在2013年9月,新美國安全中心發(fā)布了 《游戲規(guī)則改變者:顛覆性技術(shù)與美國國防戰(zhàn)略》一文,認(rèn)為智能自主系統(tǒng)是可能在軍事領(lǐng)域造成一系列革命性變革的五大技術(shù)之一[1]。2014年1月6日,美國雜志《原子科學(xué)家公報(bào)》發(fā)表了 《即將到來的軍事科技》,將無人系統(tǒng)、智能自主系統(tǒng)、網(wǎng)絡(luò)武器、3D打印技術(shù)和定向能武器作為未來10年可對(duì)美軍產(chǎn)生深遠(yuǎn)影響的五大新興技術(shù)領(lǐng)域。2014年2月和11月,美國 《國家利益》雜志2次刊文,提到了有知覺的無人飛行器、高超音速巡航導(dǎo)彈與全球快速打擊武器、空間武器、電磁軌道炮、超級(jí)隱身/量子隱身材等有望在未來數(shù)十年內(nèi)改變戰(zhàn)爭形態(tài)的五大裝備與技術(shù)。2015年5月、6月,美國NASA(National Aeronautics and Space Administration,國家航空航天局)和USAF(United States Air Force,美國空軍)分別發(fā)布了NASA 2015技術(shù)路線圖草案[2]和自主地平線計(jì)劃[3],進(jìn)一步闡述了航天、航空相關(guān)自主系統(tǒng)的發(fā)展方向和途徑。2017年7月,國務(wù)院印發(fā)了 《新一代人工智能發(fā)展規(guī)劃》,指出智能自主系統(tǒng)成為人工智能的發(fā)展重點(diǎn)[4]。要提升行業(yè)影響度、引領(lǐng)技術(shù)發(fā)展,同時(shí)滿足型號(hào)研制、專業(yè)發(fā)展、業(yè)務(wù)高效、軍民融合的多重需求,就必須大力發(fā)展適應(yīng)航天特點(diǎn)的智能自主技術(shù),尤其是控制與信息技術(shù)。
當(dāng)前,學(xué)術(shù)界、工業(yè)界對(duì)智能相關(guān)有很多定義和分類方法,尚未達(dá)成共識(shí)。中國人工智能學(xué)會(huì)李德毅院士等積極推動(dòng)智能科學(xué)與技術(shù)一級(jí)學(xué)科的設(shè)立,將智能技術(shù)分為腦認(rèn)知、機(jī)器感知與模式識(shí)別、自然語言處理與理解、知識(shí)工程、機(jī)器人與智能系統(tǒng)5個(gè)領(lǐng)域[5]。有觀點(diǎn)將人工智能的核心歸為數(shù)據(jù)、算法、計(jì)算能力三大部分,也有專家學(xué)者將人工智能的功能劃分為認(rèn)知、預(yù)測、決策、集成四類。
對(duì)無人系統(tǒng)而言,智能是指具備自動(dòng)地獲取和應(yīng)用知識(shí)的能力、思維與推理的能力、問題求解的能力和自動(dòng)學(xué)習(xí)的能力。是個(gè)體對(duì)客觀事物進(jìn)行合理分析、判斷及有目的地行動(dòng)和有效地處理周圍環(huán)境事宜的綜合能力。依靠飛行器實(shí)現(xiàn)智能化的飛行控制,是人工智能的高級(jí)階段,是難度較大的研究方向。
自主是指擁有感知、觀察、分析、交流、計(jì)劃、制定決策和行動(dòng)的能力,表示出無人系統(tǒng)自我管理的狀態(tài)和質(zhì)量。能自行做出選擇的系統(tǒng)可稱為自主系統(tǒng)。其要點(diǎn)是不依賴人而作選擇。
既智能、又自主的系統(tǒng),可稱為智能自主系統(tǒng)?;蛘哒f,智能自主系統(tǒng)是具備高等級(jí)智能性的自主系統(tǒng)。將智能自主系統(tǒng)的能力歸納為以下幾個(gè)方面。
(1)感知與理解 (Perception&Understanding)
感知是認(rèn)知心理學(xué)中一個(gè)基本概念,包括感覺和知覺。感覺是對(duì)客觀事物個(gè)別屬性的反映,知覺則是整體反映。理解則是比感知更復(fù)雜的一種信息處理能力,更為抽象,也含有較多主觀色彩。
感知與理解的具體應(yīng)用包括:PNT(Positioning,Navigation,and Timing,定位、導(dǎo)航授時(shí));對(duì)自主系統(tǒng)內(nèi)部狀態(tài)的感知;對(duì)自主系統(tǒng)周邊環(huán)境的感知;尋找突出特征,檢測異常或突發(fā)事件;對(duì)目標(biāo)的感知與識(shí)別;態(tài)勢(shì)感知;對(duì)數(shù)據(jù)的實(shí)時(shí)機(jī)載分析,對(duì)人類狀態(tài)、行為和意圖的理解與預(yù)測等方面。
(2)運(yùn)動(dòng)與操作 (Movement&Operation)
運(yùn)動(dòng)能力是指自主系統(tǒng)改變自身空間位置的能力,具有快速性、敏捷性、機(jī)動(dòng)性等特點(diǎn)。操作能力是指自主系統(tǒng)改變外部環(huán)境的能力,主動(dòng)地對(duì)外界環(huán)境施加影響,借此達(dá)到一定目的。它們都屬于執(zhí)行層面,需要通過控制來實(shí)現(xiàn)。
運(yùn)動(dòng)與操作的具體應(yīng)用包括:根據(jù)需要運(yùn)送物體;極端地形下的移動(dòng)性;地表之下的移動(dòng)性;極端條件下的交會(huì)和對(duì)接;捕獲和停靠小行星與非合作目標(biāo)接近甚至超過人類水平的車輛駕駛或飛行器駕駛;接近甚至超過人類水平的靈巧操作安全的運(yùn)動(dòng)與操作;各種運(yùn)動(dòng)的控制等方面。
(3)學(xué)習(xí)與適應(yīng) (Learning&Adaption)
學(xué)習(xí)是指通過對(duì)輸入的外界信息進(jìn)行處理,加工提煉后成為自身所掌握的知識(shí)。訓(xùn)練是一種常見的學(xué)習(xí)方法,例如自主學(xué)習(xí)、遷移學(xué)習(xí)是當(dāng)前熱點(diǎn)。適應(yīng)是主動(dòng)地調(diào)整或改變自身的參數(shù)、狀態(tài)甚至結(jié)構(gòu),改良自身的行為特征,以適應(yīng)任務(wù)、外部環(huán)境、內(nèi)部狀態(tài)的變化,通過調(diào)參、重構(gòu)、修復(fù)、自演化等,都能提升系統(tǒng)自身的知識(shí)、技巧、性能,增強(qiáng)系統(tǒng)在其他方面的能力,從而能更好地適應(yīng)環(huán)境、完成任務(wù)。
學(xué)習(xí)與適應(yīng)的具體應(yīng)用包括:從人類經(jīng)驗(yàn)或者其他機(jī)器人經(jīng)驗(yàn)中學(xué)習(xí)的系統(tǒng);對(duì)故障的適應(yīng)、隔離與修復(fù)、容錯(cuò)規(guī)劃、實(shí)時(shí)故障診斷和重規(guī)劃;基于學(xué)習(xí)成果的變參數(shù)、變結(jié)構(gòu)、變外形、變推力等方面。
(4)規(guī)劃與決策 (Planning&Decision-Making)
規(guī)劃是指計(jì)算一系列有序行動(dòng)的過程,能使世界由當(dāng)前狀態(tài)轉(zhuǎn)變?yōu)槠谕麪顟B(tài),最優(yōu)地分配資源,并滿足硬約束、優(yōu)化軟約束。決策是指做出決定或選擇,是一種在各種替代方案中考慮各項(xiàng)因素做出選擇的認(rèn)知、思考過程。規(guī)劃與決策是自主與自動(dòng)相區(qū)別的一個(gè)關(guān)鍵特征,體現(xiàn)了預(yù)先設(shè)定和隨機(jī)應(yīng)變的巨大區(qū)別。
規(guī)劃與決策的具體應(yīng)用包括:多關(guān)節(jié)機(jī)械臂/機(jī)械手實(shí)時(shí)路徑規(guī)劃;車輛、飛行器、探測器等載體實(shí)時(shí)路徑規(guī)劃;可動(dòng)態(tài)調(diào)節(jié)的任務(wù)規(guī)劃;戰(zhàn)術(shù)規(guī)劃與決策;滿足硬約束、優(yōu)化軟約束的資源分配等方面。
(5)溝通與協(xié)同 (Communication&Cooperative)
溝通是自發(fā)、主動(dòng)、有目的性的向其他主體傳遞信息。協(xié)同是指多個(gè)主體共同完成某一公共的目標(biāo),強(qiáng)調(diào)整體效益,不排除犧牲個(gè)體效益。溝通與協(xié)同是自主系統(tǒng)與其他主體進(jìn)行互動(dòng)的行為方式,是智能自主系統(tǒng)的高級(jí)屬性。
溝通與協(xié)同的具體應(yīng)用包括:信息摘要與報(bào)告;根據(jù)需要尋求指導(dǎo);人-機(jī)接口;完全沉浸式的遠(yuǎn)程呈現(xiàn);高效、安全、保密的通信;協(xié)同的感知與理解;協(xié)同的路徑規(guī)劃;協(xié)作中的學(xué)習(xí)、適應(yīng);異構(gòu)系統(tǒng)的協(xié)同等方面。
經(jīng)典控制系統(tǒng)是一個(gè)由傳感器、控制律、執(zhí)行機(jī)構(gòu)和被控對(duì)象構(gòu)成的閉環(huán)系統(tǒng),它處于特定的環(huán)境條件之下。經(jīng)典的控制系統(tǒng)與智能材料、智能認(rèn)知、智能規(guī)劃與決策、智能計(jì)算、智能通信等新興因素進(jìn)行有機(jī)結(jié)合,大大增強(qiáng)和擴(kuò)展了控制系統(tǒng)的能力,也就形成了智能控制系統(tǒng)。智能控制系統(tǒng)還可以與其他智能系統(tǒng),包括人類在內(nèi),發(fā)生信息交互,甚至可以實(shí)現(xiàn)智能從人向裝備的轉(zhuǎn)移。
圖1 從控制系統(tǒng)向智能自主系統(tǒng)的延伸
回顧控制理論的發(fā)展歷程,1932年,奈魁斯特 (H.Nyquist)關(guān)于反饋放大器穩(wěn)定性的論文,開創(chuàng)了定量分析的閉環(huán)控制理論。隨后,在空間技術(shù)發(fā)展的推動(dòng)下,控制理論得到了大發(fā)展。隨著計(jì)算機(jī)技術(shù)的發(fā)展,形成了智能控制理論和技術(shù)。電子信息科學(xué)技術(shù)與控制理論相結(jié)合,又使控制論向大系統(tǒng)理論發(fā)展,控制系統(tǒng)顯現(xiàn)出規(guī)模龐大、結(jié)構(gòu)復(fù)雜、因素眾多、功能綜合的特點(diǎn)。
隨著被控對(duì)象日益復(fù)雜,原有的控制器設(shè)計(jì)方法和手段單一、性能與可靠性低,已經(jīng)不能滿足控制系統(tǒng)的需求。因此,傳統(tǒng)的控制系統(tǒng)必將逐漸發(fā)展成理論體系完備的智能自主系統(tǒng)。
與其他應(yīng)用場景相比,航天智能自主系統(tǒng)有其自身特點(diǎn)。可歸納為:
(1)快速性或?qū)崟r(shí)性
航天任務(wù)對(duì)于快速性和實(shí)時(shí)性要求比其他系統(tǒng)更高,同時(shí),航天系統(tǒng)所面臨的問題更復(fù)雜、規(guī)模更大、層級(jí)更多,因此需要對(duì)航天智能自主系統(tǒng)有特殊的嚴(yán)格要求。
(2)可靠性與收斂性
在飛行器所處的特殊工作環(huán)境下,仍然要求確保系統(tǒng)的軟、硬件高可靠地實(shí)現(xiàn)期望功能。同時(shí),規(guī)劃、決策、控制等在線的算法,往往要求可靠地收斂。還要求系統(tǒng)對(duì)故障的容忍、吸收、化解能力更強(qiáng)。
(3)不確定性、不可預(yù)知性和對(duì)抗性
除了眾所周知的模型不確定性之外,主要是指航天智能自主系統(tǒng)所處的工作環(huán)境和所能獲取的原始信息,往往具有不確定性、不可預(yù)知性。在空間探索等場景下,還要求智能系統(tǒng)能在很少甚至沒有先驗(yàn)知識(shí)的前提下,完成探索任務(wù)。在軍事應(yīng)用場景下,非合作、強(qiáng)對(duì)抗的色彩更重,甚至還存在欺騙性信息。
結(jié)合航天場景,提出了一種基于信息流和知識(shí)流的系統(tǒng)框架,如圖2所示。
在環(huán)境與本體及目標(biāo)感知模塊中,被感知或被控對(duì)象為飛行環(huán)境、本體及打擊目標(biāo)。環(huán)境與本體及目標(biāo)感知模塊是智能控制系統(tǒng)的眼、耳,具有看、聽的功能。通過環(huán)境與本體及目標(biāo)感知獲取感知信息,通過動(dòng)態(tài)知識(shí)庫的配合與輔助完成感知信息處理與融合,并將相應(yīng)信息流轉(zhuǎn)化為知識(shí)流送入智能健康管理及智能規(guī)劃、決策與控制功能模塊。
智能健康管理模塊負(fù)責(zé)系統(tǒng)的故障檢測、識(shí)別、預(yù)示與自恢復(fù),向智能規(guī)劃、決策與控制模塊提供生存和健康狀態(tài)等信息,并在必要時(shí)輸出功能或系統(tǒng)重構(gòu)需求指令。
圖2 基于信息流與知識(shí)流的系統(tǒng)框架
智能規(guī)劃、決策與控制模塊是智能控制系統(tǒng)的大腦,具有信息處理和決策控制的功能。它由環(huán)境與本體及目標(biāo)感知、智能健康管理、動(dòng)態(tài)知識(shí)庫提供輸入信息,進(jìn)行信息加工和智能規(guī)劃、決策,分為任務(wù)級(jí)和軌跡級(jí)2個(gè)層級(jí),分別完成整個(gè)任務(wù)和自主執(zhí)行層面涉及的相應(yīng)工作。其中任務(wù)級(jí)側(cè)重多目標(biāo)、多約束、多任務(wù)的系統(tǒng)級(jí)規(guī)劃與決策,如任務(wù)目標(biāo)的選擇與調(diào)整,軌跡級(jí)則側(cè)重具體單項(xiàng)任務(wù)的規(guī)劃與控制,如飛行軌跡的規(guī)劃及最優(yōu)指令的生成。軌跡級(jí)通過信號(hào)流將操作、控制與執(zhí)行指令輸出到飛行器本體,對(duì)智能材料、智能結(jié)構(gòu)、本體環(huán)境等施加控制,構(gòu)成了先進(jìn)飛行器智能自主系統(tǒng)的整個(gè)閉環(huán)。
人機(jī)接口與動(dòng)態(tài)知識(shí)庫連接,是實(shí)現(xiàn)知識(shí)動(dòng)態(tài)更新和管控的手段之一,人的因素也通過人機(jī)接口引入到智能自主系統(tǒng)之中。
隨著控制與信息技術(shù)的發(fā)展、軍民融合的需要,智能自主系統(tǒng)已成為航天技術(shù)發(fā)展的戰(zhàn)略方向。相關(guān)的理論、方法、技術(shù)與產(chǎn)品,將顯著提升航天產(chǎn)品的智能化水平,實(shí)現(xiàn)顛覆性突破,推動(dòng)和牽引戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展??刂普撆c信息論是人工智能理論的前身和基礎(chǔ),覆蓋了系統(tǒng)工程中的所有環(huán)節(jié),對(duì)整個(gè)航天產(chǎn)品和產(chǎn)業(yè)的拉動(dòng)作用大,同時(shí)與結(jié)構(gòu)、材料等其他學(xué)科的關(guān)聯(lián)密切。航天控制的自主性強(qiáng),基礎(chǔ)相對(duì)較好,同時(shí)航天工程遇到的不確定因素多,需要控制與信息技術(shù)來解決。因此,控制與信息技術(shù)是拉動(dòng)整個(gè)航天智能技術(shù)發(fā)展的重要抓手。面對(duì)當(dāng)前態(tài)勢(shì),需要立足近年來開展智能控制相關(guān)工作的基礎(chǔ),擺正心態(tài),發(fā)揮合力,做實(shí)當(dāng)下,放眼未來,共同推動(dòng)航天智能自主技術(shù)的快速發(fā)展。