劉向東,劉海闊,杜長坤,3,田野,路平立,陳振
基于多智能體系統(tǒng)的多航天器編隊(duì)分布式姿態(tài)協(xié)同控制
劉向東1,劉海闊2,杜長坤2,3,田野1,路平立1,陳振1
(1.北京理工大學(xué) 自動化學(xué)院,北京 100081;2.北京理工大學(xué) 機(jī)電學(xué)院,北京 100081;3.北京理工大學(xué) 智能機(jī)器人與系統(tǒng)高精尖創(chuàng)新中心,北京 100081)
多航天器編隊(duì)飛行在深空探測及協(xié)同對地觀測等領(lǐng)域有著重要應(yīng)用,而多航天器的姿態(tài)跟蹤及協(xié)同控制技術(shù)作為其關(guān)鍵技術(shù)之一也引起了極大的關(guān)注。近年來,隨著分布式人工智能技術(shù)的發(fā)展,多智能體系統(tǒng)(MASs)受到了航天器控制領(lǐng)域?qū)W者的關(guān)注并將其應(yīng)用到多航天器編隊(duì)控制中。本文回顧了多智能體系統(tǒng)協(xié)同控制及其在多航天器編隊(duì)姿態(tài)協(xié)同控制中應(yīng)用的研究進(jìn)展。首先,從多航天器編隊(duì)不同控制需求出發(fā),分別從一致性跟蹤控制、有限時間控制、事件驅(qū)動控制方面,回顧了多智能體系統(tǒng)協(xié)同控制問題的進(jìn)展;其次,回顧了多航天器姿態(tài)協(xié)同控制在上述需求方面的研究進(jìn)展,并基于多智能體系統(tǒng)的協(xié)同控制理論,提出了相應(yīng)的分布式姿態(tài)協(xié)同控制策略。
多航天器編隊(duì);多智能體系統(tǒng);姿態(tài)控制;分布式協(xié)同控制
多航天器編隊(duì)飛行因其在深空探測和新一代太空望遠(yuǎn)鏡等任務(wù)中的應(yīng)用而引起了廣泛關(guān)注。同時,伴隨著分布式人工智能技術(shù)的發(fā)展,基于多智能體系統(tǒng)(Multi-Agent Systems,MASs)的分布式多航天器編隊(duì)控制技術(shù)被提出,并取得了長足發(fā)展,有效地彌補(bǔ)了集中式控制策略對全局信息依賴、魯棒性差以及容錯性低的缺點(diǎn)。MASs是利用智能體間信息交互組成的網(wǎng)絡(luò)化系統(tǒng),其主要利用互聯(lián)協(xié)調(diào)的多個小型系統(tǒng)替代大型復(fù)雜系統(tǒng),從而降低系統(tǒng)的復(fù)雜度,易于管理和控制。基于此,分布式多航天器編隊(duì)任務(wù)被定義為一組物理上分離的航天器,通過局部的信息交互,實(shí)現(xiàn)整體的協(xié)同并呈現(xiàn)出群體智能,這種體系結(jié)構(gòu)與單個航天器執(zhí)行任務(wù)相比具備多方面的優(yōu)勢。從系統(tǒng)靈活性來看,由于多航天器編隊(duì)的成員是獨(dú)立且互聯(lián)的,具有快速、動態(tài)地重新設(shè)計(jì)和配置的可能性,并將其用于各種任務(wù);從系統(tǒng)魯棒性來看,在單個元件或航天器發(fā)生故障的情況下,具有多個元件或航天器的系統(tǒng)通常能夠?qū)崿F(xiàn)全部或部分功能,擁有分布式體系結(jié)構(gòu)還意味著可以在不需要同時更換整個系統(tǒng)的情況下,對現(xiàn)有系統(tǒng)進(jìn)行部分升級或更換;從系統(tǒng)泛用性來看,多航天器編隊(duì)系統(tǒng)可完成比單個航天器更多且更高難度、更高要求的任務(wù),因?yàn)樵S多現(xiàn)代的航天任務(wù)要求系統(tǒng)里的各個單元必須協(xié)同、合作;從成本效益來看,由更小的部件組成的體系結(jié)構(gòu)的固有好處之一是成本低廉,因?yàn)槟K化小型衛(wèi)星的制造成本往往比系統(tǒng)級的大型衛(wèi)星更低。
本文將多航天器編隊(duì)問題納入MASs一致性控制理論框架中,進(jìn)行基于局部信息交互的分布式協(xié)同控制。在這套理論框架中,一個基本的假設(shè)是由于物理距離、硬件條件、外部干擾等限制,編隊(duì)中的每個個體很難與其他所有個體都保持良好的通信,因此每個個體僅能利用局部信息去完成整體的協(xié)同?;谏鲜鲈O(shè)計(jì)思想,本文系統(tǒng)地介紹了MASs一致性控制及其在多航天器編隊(duì)姿態(tài)協(xié)同控制中的研究和應(yīng)用。
MASs是分布式人工智能的重要分支,而協(xié)同控制是實(shí)現(xiàn)MASs協(xié)調(diào)合作的關(guān)鍵,其主要包括一致性、編隊(duì)、包含、聚合等協(xié)同控制任務(wù),其中一致性控制是MASs的一類基礎(chǔ)性協(xié)同問題,是解決其他協(xié)同問題的關(guān)鍵。MASs的一致性指在分布式控制協(xié)議的作用下,智能體之間通過信息交互,實(shí)現(xiàn)相關(guān)狀態(tài)量趨同。一致性算法最早被BERTSEKAS等[1]提出并用于解決分布式計(jì)算等問題,之后隨著Vicsek模型[2]的提出,學(xué)者們進(jìn)一步揭示了一致性算法的作用機(jī)理和實(shí)現(xiàn)條件[3-4],并引起了廣泛的關(guān)注。針對不同領(lǐng)域的應(yīng)用需求,許多不同類型的多智能體一致性協(xié)議被提出,本文將選取航天器協(xié)同控制中??紤]的控制性能、資源受限、控制結(jié)構(gòu)等因素分別從有限時間控制、事件驅(qū)動通信以及一致性跟蹤控制三個方面對多智能體一致性控制問題展開討論。
系統(tǒng)收斂速度、收斂精度都是實(shí)際工程應(yīng)用中評價算法性能的核心指標(biāo),按照收斂速度可以將一致性問題劃分為漸近一致性和有限時間一致性兩類。相較于漸近一致性,有限時間一致性具有快速收斂性、強(qiáng)魯棒性以及高控制精度等特點(diǎn),其目的是在限定時間內(nèi)使得系統(tǒng)狀態(tài)達(dá)到同步,更快實(shí)現(xiàn)一致?;诓煌愋偷幕?刂萍夹g(shù),文獻(xiàn)[12-15]針對積分器類型MASs提出了有限時間一致性控制策略;考慮到滑??刂破鞯姆沁B續(xù)性,文獻(xiàn)[16-20]基于加冪積分技術(shù)設(shè)計(jì)了連續(xù)的有限時間一致性控制策略;考慮到實(shí)際工程應(yīng)用中智能體動力學(xué)差異帶來的控制問題,DU等[21]在基于勢函數(shù)方法和加冪積分技術(shù)設(shè)計(jì)了分層控制器實(shí)現(xiàn)了異構(gòu)MASs的有限時間一致性控制。然而,上述策略對系統(tǒng)收斂時間的估計(jì)依賴于初始信息,當(dāng)系統(tǒng)初始信息難以獲取時將直接影響收斂時間估計(jì)精度,從而影響系統(tǒng)整體任務(wù)的進(jìn)行。針對此問題,固定時間能夠避免收斂時間估計(jì)對系統(tǒng)初始信息的依賴具有良好的靈活性,可提高控制策略在實(shí)際工程的應(yīng)用范圍。
信息交互是MASs協(xié)同的基礎(chǔ),在實(shí)現(xiàn)一致的過程中局部相鄰的智能體間將進(jìn)行頻繁的信息交互,而不同的信息交互方式對智能體的通信資源和網(wǎng)絡(luò)帶寬需求不同,并且會直接影響整體控制性能。事件驅(qū)動策略[22]作為一種按需采樣的通信方式,能夠根據(jù)智能體的需求進(jìn)行通信,從而避免錯過重要通信節(jié)點(diǎn)且減少不必要的通信交互,能夠更好地符合實(shí)際工程需求。YANG等[23]提出了基于時間函數(shù)的事件驅(qū)動觸發(fā)機(jī)制,為觸發(fā)誤差設(shè)計(jì)了隨時間指數(shù)收斂的觸發(fā)上界以調(diào)節(jié)智能體間的通信,只有當(dāng)智能體的觸發(fā)誤差累計(jì)并超過其觸發(fā)上界時才進(jìn)行通信,從而減少了智能體間的通信頻次;綜合考慮智能體的狀態(tài)演變對信息交互的影響,LIU等[24-26]設(shè)計(jì)了狀態(tài)相關(guān)的事件驅(qū)動觸發(fā)機(jī)制,能夠根據(jù)智能體間的一致情況調(diào)整通信頻次,從而提高整體控制性能,進(jìn)一步研究了有向圖下的有限時間一致性問題[20];考慮智能體間動力學(xué)的差異,LUI等[27]分別針對固定拓?fù)浜颓袚Q拓?fù)涞那闆r,結(jié)合內(nèi)模原理研究了異構(gòu)MASs的分布式輸出一致控制策略;此外,為了更好地平衡控制性能和通信頻次,LI等[28]通過引入新的動態(tài)變量設(shè)計(jì)了動態(tài)事件驅(qū)動策略,在靜態(tài)策略的基礎(chǔ)上進(jìn)一步減少了通信冗余。
一致性跟蹤控制采用主從式控制結(jié)構(gòu),將MASs劃分為領(lǐng)導(dǎo)者(核心智能體或參考信號)和跟隨者,其目的是通過智能體間的協(xié)同衍化在實(shí)現(xiàn)狀態(tài)一致的同時實(shí)現(xiàn)對領(lǐng)導(dǎo)者期望狀態(tài)的跟蹤??紤]通信拓?fù)鋵刂菩阅艿挠绊懀琋I等[23]分別研究了無向拓?fù)?、有向拓?fù)湟约扒袚Q拓?fù)湎戮€性MASs的一致性跟蹤問題;進(jìn)一步考慮非線性、外部擾動、參數(shù)不確定性以及通信延遲等因素的影響,文獻(xiàn)[24-27]分別研究了不同情況下的魯棒一致性跟蹤策略使得MASs在實(shí)現(xiàn)控制目標(biāo)的同時抑制干擾因素帶來的影響。然而,上述文獻(xiàn)僅考慮領(lǐng)導(dǎo)者無外部控制輸入的情況。值得注意的是,對于一致性跟蹤控制而言,領(lǐng)導(dǎo)者的動態(tài)起到了至關(guān)重要的作用,它決定了系統(tǒng)整體的最終一致動態(tài),因此領(lǐng)導(dǎo)者動態(tài)的靈活性和可調(diào)節(jié)性是實(shí)際工程應(yīng)用中實(shí)現(xiàn)多樣化任務(wù)所不可忽略的。針對該需求,考慮具有非零動態(tài)輸入的領(lǐng)導(dǎo)者,LI等[28]分別提出了非連續(xù)和連續(xù)的一致性跟蹤控制器,實(shí)現(xiàn)了MASs對期望信號的跟蹤,其中對于連續(xù)形式控制器僅能實(shí)現(xiàn)有界一致控制;WEN等[29]研究拓?fù)淝袚Q對此類一致性跟蹤控制的影響,并給出拓?fù)漶v留時間。
上述3類算法分別從收斂性能提升、通信能源節(jié)約以及系統(tǒng)動態(tài)靈活性等方面提高了多智能體協(xié)同控制在實(shí)際工程中的應(yīng)用范圍,且在一定程度上符合航天器編隊(duì)的實(shí)際控制需求。首先,在多航天器編隊(duì)對姿態(tài)的穩(wěn)定速度和指向精度等控制性能有著較高的要求時,尤其是面對高精度和高時效性的空間任務(wù)時,有限/固定時間姿態(tài)協(xié)同控制的研究就顯得尤為重要;其次,由于多航天器編隊(duì)系統(tǒng)多采用小型航天器,其搭載的計(jì)算和通信資源有限,因此資源節(jié)約型的事件驅(qū)動策略能夠更好地平衡有限的星載資源與頻繁的信息交互之間的矛盾,更能滿足實(shí)際需求;最后,利用分布式一致性跟蹤控制能夠更好地對MASs整體的動態(tài)進(jìn)行引導(dǎo),這一控制結(jié)構(gòu)能夠完美地匹配多航天器編隊(duì)相對姿態(tài)的保持以及對期望姿態(tài)信號的同步跟蹤等控制任務(wù)。因此,MASs的一致性算法可為多航天器編隊(duì)控制中的不同需求提供支持,并為提高多航天器編隊(duì)系統(tǒng)的自主性、可靠性以及可維護(hù)性奠定一定理論基礎(chǔ)。
多航天器協(xié)同被廣泛應(yīng)用于實(shí)際的任務(wù)場景,例如編隊(duì)飛行、協(xié)同圍捕、協(xié)同觀測等。在執(zhí)行一些具有復(fù)雜操作的任務(wù)時,如分布式合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)和三維立體成像等,編隊(duì)中每個航天器都需要精準(zhǔn)指向地球或其他星球上的某個位置來實(shí)現(xiàn)成像,這就必須確保每個航天器姿態(tài)都能快速到達(dá)預(yù)定的軌道位置并跟蹤上期望的姿態(tài)軌跡。滿足上述工程需求的其中一個難點(diǎn)在于,太空中的環(huán)境并非一成不變的,航天器也在沿著自身的軌道不斷運(yùn)動,因此,在進(jìn)行航天器姿態(tài)控制時會受到各種來自外部環(huán)境的干擾。例如,來自稀薄大氣的氣動力矩干擾,太陽產(chǎn)生的太陽光壓力矩干擾、微重力環(huán)境下的重力梯度力矩干擾等。這些干擾不僅會影響姿態(tài)跟蹤控制的精度,也會影響控制的收斂時間。雖然外部干擾造成的影響可能未必是負(fù)面的,但卻并不人為可控。而另一個難點(diǎn)在于,航天器之間相互通信帶來的一些衍生問題,比如通信帶寬受限等,使得每個航天器未必能獲取預(yù)期的鄰居信息以達(dá)成協(xié)同。此外,在一些要求高精度和時效性的空間任務(wù)中,需要研究抗干擾性強(qiáng)、具有魯棒性的航天器編隊(duì)高精度姿態(tài)協(xié)同控制算法,以滿足工程需要?;谇捌谠诙嘀悄荏w一致性控制方面的工作積累,針對多航天器的姿態(tài)協(xié)同跟蹤問題研究分布式協(xié)同控制策略。
值得注意的是,分布式姿態(tài)協(xié)同控制式(2)基于多智能體一致性控制協(xié)議的思想,充分利用航天器的相對姿態(tài)和相對角速度,實(shí)現(xiàn)跟隨者對領(lǐng)導(dǎo)者姿態(tài)的跟蹤,且弱化了外部擾動和未建模動態(tài)對控制性能的影響,具有一定的魯棒性。
有限時間控制方法在控制精度和收斂速度上均優(yōu)于傳統(tǒng)的漸近時間控制,因此,在一些要求高精度和時效性的空間任務(wù)中,多航天器編隊(duì)的有限時間姿態(tài)協(xié)同控制將是研究的重點(diǎn)。近年來,有較多的文獻(xiàn)研究了航天器編隊(duì)的有限時間姿態(tài)協(xié)同問題??紤]通信拓?fù)錇闊o向圖的情況,文獻(xiàn)[37-39]研究了有限時間姿態(tài)協(xié)同控制問題,通過分布式觀測器實(shí)現(xiàn)了角速度的估計(jì)從而解決了無角速度反饋的控制問題,并且分別基于加冪積分方法和齊次方法設(shè)計(jì)了有限時間姿態(tài)協(xié)同控制策略;考慮通信拓?fù)錇橛邢驁D的情況,文獻(xiàn)[40-41]分別基于快速非奇異終端滑模和齊次方法設(shè)計(jì)了有限時間姿態(tài)協(xié)同控制策略,其中文獻(xiàn)[40]利用自適應(yīng)技術(shù)抑制外部擾動、模型不確定性等不確定性因素對系統(tǒng)穩(wěn)定性的影響,文獻(xiàn)[41]利用分布式觀測器實(shí)現(xiàn)了角速度和期望姿態(tài)信號的估計(jì);LU等[42]針對存在模型不確定性和外部擾動的航天器編隊(duì)姿態(tài)協(xié)同問題,提出了一種基于改進(jìn)的快速終端滑模的分布式協(xié)同姿態(tài)跟蹤控制律,在加快收斂速度避免奇異性的同時保證了系統(tǒng)的有限時間穩(wěn)定性,并且基于改進(jìn)快速終端滑模和切比雪夫神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)了分布式有限時間姿態(tài)協(xié)同跟蹤控制器,避免了控制器對精確模型的依賴且實(shí)現(xiàn)了有限時間穩(wěn)定。固定時間控制作為有限時間控制的一種,其不僅具有快速收斂性、強(qiáng)魯棒性和高控制精度外還避免了收斂時間估計(jì)對航天器初始狀態(tài)的依賴,算法具有更好的靈活性和實(shí)用性。近年來,固定時間收斂的航天器姿態(tài)協(xié)同控制方法陸續(xù)受到學(xué)者們的關(guān)注[43-47]。考慮無向圖通信拓?fù)涞那闆r,文獻(xiàn)[43-46]設(shè)計(jì)了固定時間姿態(tài)協(xié)同控制策略,實(shí)現(xiàn)了航天器姿態(tài)的快速協(xié)同;考慮有向生成樹拓?fù)涞那闆r,文獻(xiàn)[47]研究了固定時間姿態(tài)協(xié)同控制問題,在無角速度反饋的情況下實(shí)現(xiàn)了固定時間姿態(tài)協(xié)同跟蹤控制,得出了最終有界的結(jié)論。
在本節(jié),考慮航天器間的通信拓?fù)錇橛邢虻那野豢糜邢蛏蓸?,將基于勢函?shù)設(shè)計(jì)一種固定時間分布式觀測器以實(shí)現(xiàn)在有限時間內(nèi)完成對領(lǐng)導(dǎo)者狀態(tài)的精確估計(jì),并設(shè)計(jì)一種改進(jìn)的非奇異固定時間滑模姿態(tài)跟蹤控制器,以實(shí)現(xiàn)多航天器編隊(duì)的有限時間姿態(tài)協(xié)同跟蹤,且避免系統(tǒng)收斂時間估計(jì)對航天器初值的依賴。
首先,為便于控制器設(shè)計(jì),將系統(tǒng)(1)轉(zhuǎn)化為如下形式:
最終,各個航天器在姿態(tài)跟蹤控制器的作用將快速收斂至領(lǐng)導(dǎo)者的狀態(tài),從而完成整個編隊(duì)的姿態(tài)協(xié)同,并得到如下結(jié)論。
本節(jié)以代數(shù)圖論和多智能體一致性理論為框架,設(shè)計(jì)了一種分布式固定時間觀測器,避免了跟隨者對領(lǐng)導(dǎo)者信息的依賴,降低了通信拓?fù)涞膹?fù)雜度。同時設(shè)計(jì)了固定時間跟蹤控制器,實(shí)現(xiàn)每個航天器對本地姿態(tài)觀測值的跟蹤控制,最終在有限時間內(nèi)與領(lǐng)導(dǎo)者形成協(xié)同。
航天器間的信息交互是實(shí)現(xiàn)協(xié)同控制的基礎(chǔ),考慮有限的星載資源和空間通信環(huán)境的不確定性,通過改進(jìn)航天器間通信機(jī)制,可以實(shí)現(xiàn)通信資源節(jié)約提高信息利用率,并保證協(xié)同任務(wù)的有效執(zhí)行以及航天器在軌任務(wù)周期。事件驅(qū)動通信機(jī)制可根據(jù)航天器間的需求進(jìn)行通信,通過設(shè)置通信觸發(fā)條件調(diào)整通信頻次,航天器僅在滿足觸發(fā)條件時與對應(yīng)的鄰居進(jìn)行一次信息交互,極大地節(jié)省了通信資源,經(jīng)過適當(dāng)設(shè)計(jì)的觸發(fā)機(jī)制也將不影響最終的控制效果,因此基于事件驅(qū)動策略的多航天器姿態(tài)協(xié)同控制近年來引起了學(xué)者們的關(guān)注[50-58]。LIU等[50]針對具有Lagrangian模型的航天器動力學(xué)系統(tǒng),研究了事件驅(qū)動姿態(tài)一致性控制策略,設(shè)計(jì)了狀態(tài)相關(guān)的事件驅(qū)動策略,實(shí)現(xiàn)了航天器間的完全間歇式通信,即控制器的更新和事件觸發(fā)條件的檢測均不依賴連續(xù)的鄰居信息;文獻(xiàn)[51]研究了多航天器的事件驅(qū)動-固定時間協(xié)同控制策略,分別針對固定和切換通信拓?fù)涞那闆r設(shè)計(jì)了事件驅(qū)動策略和固定時間姿態(tài)協(xié)同控制策略,利用間歇的信息交互實(shí)現(xiàn)了快速姿態(tài)協(xié)同;考慮外部干擾力矩、系統(tǒng)不確定性、執(zhí)行機(jī)構(gòu)故障等因素的影響,文獻(xiàn)[52-56]分別研究了基于事件驅(qū)動的魯棒姿態(tài)協(xié)同控制器和容錯姿態(tài)協(xié)同控制器;文獻(xiàn)[57]設(shè)計(jì)了基于事件驅(qū)動的非線性分布式觀測器來解決航天器姿態(tài)協(xié)同問題;文獻(xiàn)[58]針對航天器慣性參數(shù)未知的情況,基于自適應(yīng)控制方法和事件驅(qū)動機(jī)制,分別設(shè)計(jì)了狀態(tài)反饋和輸出反饋控制策略,實(shí)現(xiàn)了航體器姿態(tài)協(xié)同。
定理3 考慮具有姿態(tài)動力學(xué)(1)的多航天器編隊(duì)系統(tǒng),在分布式姿態(tài)協(xié)同控制器(5)和動態(tài)事件驅(qū)動策略(6)的作用下,若其參數(shù)滿足以下條件,則能夠使得多航天器在完全間歇的通信方式下實(shí)現(xiàn)姿態(tài)協(xié)同:
本節(jié)通過引入動態(tài)事件驅(qū)動機(jī)制調(diào)整航天器間的通信頻次,實(shí)現(xiàn)了全間歇式通信,即姿態(tài)協(xié)同控制器更新和事件觸發(fā)函數(shù)檢測均不依賴于連續(xù)的鄰居信息,并在此通信模式下設(shè)計(jì)了雙層結(jié)構(gòu)的分布式姿態(tài)協(xié)同控制策略,實(shí)現(xiàn)了通信資源節(jié)約型的多航天器姿態(tài)協(xié)同控制,提高了系統(tǒng)整體控制效能。
基于MASs的多航天器編隊(duì)協(xié)同控制技術(shù)是目前航天器智能控制領(lǐng)域的重要研究方向之一。隨著航天技術(shù)的發(fā)展,航天器編隊(duì)規(guī)模勢必會隨著任務(wù)需求而不斷擴(kuò)大,多航天器編隊(duì)將呈現(xiàn)集群態(tài)勢并擁有群體智能,且具有更高的靈活性、可靠性以及自組織性。航天器集群作為一個龐大且復(fù)雜的分布式空間系統(tǒng),擁有更加復(fù)雜的信息網(wǎng)絡(luò)且要求網(wǎng)絡(luò)具有較高的自組織性,同時也對協(xié)同控制技術(shù)提出了更高的要求。MASs將為航天器集群智系統(tǒng)的協(xié)同感知、群體行為自學(xué)習(xí)、自主管理等技術(shù)提供更好的協(xié)同基礎(chǔ),因此,如何將基于MASs的多航天器編隊(duì)協(xié)同控制技術(shù)進(jìn)一步應(yīng)用到更加復(fù)雜的航天器集群系統(tǒng)是未來航天器智能控制的一個重要研究方向,其主要面臨的問題包括3個方面。
航天器運(yùn)行環(huán)境復(fù)雜,其通信網(wǎng)絡(luò)易受環(huán)境干擾導(dǎo)致系統(tǒng)出現(xiàn)通信能力下降、信息不對稱等問題,由此,難免會出現(xiàn)網(wǎng)絡(luò)時滯、信息丟包以及網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化等現(xiàn)象,且各航天器受到的影響也有一定差異。研究如何更好地處理不對稱時滯、拓?fù)淝袚Q等問題將會是非常有意義的。
在協(xié)同控制問題中,控制系統(tǒng)的性能依賴于網(wǎng)絡(luò)通信,也與控制器有關(guān)。面對星載資源有限的航天器系統(tǒng),兼顧考慮系統(tǒng)通信網(wǎng)絡(luò)和控制器設(shè)計(jì),研究通信效率與系統(tǒng)性能間的關(guān)系,并實(shí)現(xiàn)網(wǎng)絡(luò)通信與控制性能的量化分析,具有重要理論和實(shí)際意義。此外,對于網(wǎng)絡(luò)通信方式而言,設(shè)計(jì)合理的事件驅(qū)動通信策略在實(shí)現(xiàn)降低系統(tǒng)通信頻次的同時保持一定控制性能,可有效提高系統(tǒng)整體效率;因此,如何綜合設(shè)計(jì)通信網(wǎng)絡(luò)、通信方式和控制器的問題還需進(jìn)一步的研究。
多智能體強(qiáng)化學(xué)習(xí)具有不依賴模型、自學(xué)習(xí)、數(shù)據(jù)驅(qū)動等特點(diǎn),基于多智能體強(qiáng)化學(xué)習(xí)的控制策略可根據(jù)控制效果的反饋信息自主學(xué)習(xí)并優(yōu)化策略知識,為實(shí)現(xiàn)未知環(huán)境下的多航天器協(xié)同決策控制提供了一種內(nèi)涵式的解決方法。因此,如何量化分析多智能體強(qiáng)化學(xué)習(xí)算法的在多航天器編隊(duì)控制的適用性,并進(jìn)一步分析強(qiáng)化學(xué)習(xí)數(shù)據(jù)模型參數(shù)對控制算法的影響,將有效提高多航天器編隊(duì)系統(tǒng)的智能化、自主化。
本文綜述了MASs一致性控制及其在多航天器編隊(duì)系統(tǒng)中的應(yīng)用,重點(diǎn)分析了多航天器魯棒姿態(tài)協(xié)同控制、固定時間協(xié)同姿態(tài)跟蹤控制以及事件驅(qū)動姿態(tài)協(xié)同控制三類控制策略,并給出了相應(yīng)的控制算法設(shè)計(jì),討論了各個算法的優(yōu)點(diǎn)和不足。最后討論了算法的應(yīng)用并對算法的未來發(fā)展進(jìn)行了展望。
[1] BERTSEKAS D, TSITSIKLIS J. Parallel and distributed computation: numerical methods[M]. Englewood Cliffs: Prentice-Hall, 1989.
[2] VICSEK T, CZIROK A, BEN-JACOB E, et al. Novel type of phase transitions in a system of self-driven particles[J]. Physical Review Letters, 1995, 75(6):1226-1229.
[3] JADBABAIE A, LIN J, MORSE A. Coordination of groups of mobile autonomous agents using nearest neighbor rules[J]. IEEE Transactions on Automatic Control, 2003, 48(6): 988-1001.
[4] OLFATI-SABER R, FAX J, MURRAY R. Consensus and cooperation in networked multi-agent systems[J]. Proceedings of the IEEE, 2007, 95(1): 215-233.
[5] YU S, LONG X. Finite-time consensus for second-order multi-agent systems with disturbances by integral sliding mode[J]. Automatica, 2015, 54: 158-165.
[6] FU J, WANG J. Robust finite-time containment control for high-order multi-agent systems with matched uncertainties under directed communication graphs[J]. International Journal of Control, 2016, 89(6): 1137-1151.
[7] WANG X, LI S, YU X, et al. Distributed active anti-disturbance consensus for leader-follower higher-order multi-agent systems with mismatched disturbances[J]. IEEE Transactions on Automatic Control, 2017, 62(11): 5795-5801.
[8] YU D, JI X. Finite-time containment control of perturbed multi-agent systems based on sliding-mode control[J]. International Journal of Systems Science, 2018, 49(2): 299-311.
[9] HUANG J, WEN C, WANG W, et al. Adaptive finite-time consensus control of a group of uncertain nonlinear mechanical systems[J]. Automatica, 2015, 51: 292-301.
[10] DU H, WEN G, CHEN G, et al. A distributed finite-time consensus algorithm for higher-order leaderless and leader-following multiagent systems[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 47(7): 1625-1634.
[11] LI G, WANG X, LI S. Finite-time output consensus of higher-order multiagent systems with mismatched disturbances and unknown state elements[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(12): 2571-2581.
[12] SHI S, FENG H, LIU W, et al. Finite-time consensus of high-order heterogeneous multi-agent systems with mismatched disturbances and nonlinear dynamics[J]. Nonlinear Dynamics, 2019, 96(2): 1317-1333.
[13] DU C, LIU X, REN W, et al. Finite-time consensus for linear multiagent systems via event-triggered strategy without continuous communication[J]. IEEE Transactions on Control of Network Systems, 2020, 7(1): 19-29.
[14] DU C, BIAN Y, LIU H, et al. Cooperative startup control for heterogeneous vehicle platoons: a finite-time output tracking-based approach[J]. IEEE Transactions on Control of Network Systems, 2021, 8(4): 1767-1777.
[15] DIMAROGONAS D, FRAZZOLI E, JOHANSSON K. Distributed event-triggered control for multi-agent systems[J]. IEEE Transactions on Automatic Control, 2012, 57(5):1291-1297.
[16] YANG D, REN W, LIU X, et al. Decentralized event-triggered consensus for linear multi-agent systems under general directed graphs[J]. Automatica, 2016, 69: 242-249.
[17] LIU X, DU C, LU P, et al. Distributed event-triggered feedback consensus control with state-dependent threshold for general linear multi-agent systems[J]. International Journal of Robust and Nonlinear Control, 2017, 27(15): 2589-2609.
[18] LIU X, DU C, LIU H, et al. Distributed event-triggered consensus control with fully continuous communication free for general linear multiagent systems under directed graph[J]. International Journal of Robust and Nonlinear Control, 2018, 28(1):132-143.
[19] LIU X, LIU H, DU C, et al. Distributed event-triggered consensus control for multiple Lur’e nonlinear systems under directed graph[J]. International Journal of Control, 2019, 92(2): 431-444.
[20] LIU X, LIU H, DU C, et al. Distributed event-triggered output consensus control for heterogeneous multi-agent system with general linear dynamics[J]. International Journal of Systems Science, 2017, 48(11):2415-2427.
[21] LIU X, LIU H, DU C, et al. Event-triggered output consensus for heterogeneous multi-agent systems with fixed and switching topologies[J]. International Journal of Robust and Nonlinear Control, 2019, 29(14):4681-4699.
[22] LI Y, LIU X, LIU H, et al. Distributed dynamic event-triggered consensus control for multi-agent systems under fixed and switching topologies[J]. Journal of the Franklin Institute, 2021, 358(8), 4348-4372.
[23] NI W, CHENG D. Leader-following consensus of multiagent systems under fixed and switching topologies[J]. Systems and Control Letters, 2010, 59(3): 209-217.
[24] WANG W, WEN C, HUANG J. Distributed adaptive asymptotically consensus tracking control of nonlinear multi-agent systems with unknown parameters and uncertain disturbances[J]. Automatica, 2017, 77: 133-142.
[25] AI X, YU J, JIA Z, et al. Adaptive robust consensus tracking for nonlinear second‐order multi‐agent systems with heterogeneous uncertainties[J]. International Journal of Robust and Nonlinear Control, 2017, 27(18): 5082-5096.
[26] SUBRAMANIAN K, MUTHUKUMAR P, JOO Y H. Leader-following consensus of nonlinear multiagent systems via reliable control with time-varying communication delay[J]. International Journal of Control, Automation and Systems, 2019, 17(2): 298-306.
[27] LUI D, PETRILLO A, SANTINI S. Leader tracking control for heterogeneous uncertain nonlinear multi-agent systems via a distributed robust adaptive PID strategy[J]. Nonlinear Dynamics, 2022, 108: 363-378.
[28] LI Z, LIU X, REN W, et al. Distributed tracking control for linear multiagent systems with a leader of bounded unknown input[J]. IEEE Transactions on Automatic Control, 2013, 58(2):518-523.
[29] WEN G, WANG P, YU X, et al. Pinning synchronization of complex switching networks with a leader of nonzero control inputs[J]. IEEE Transactions on Circuits and Systems Ⅰ: Regular Papers, 2019, 66(8): 3100-3112.
[30] MIN H, SUN F, GAO Z, et al. Decentralized adaptive attitude synchronization of spacecraft formation[J]. Systems and Control Letters, 2012, 61(1): 238-246.
[31] WU B, WANG D. Decentralized robust adaptive control for attitude synchronization under directed communication topology[J]. Journal of Guidance Control and Dynamics, 2011, 34(4):1275-1282.
[32] WU B, WANG D, POH E. Decentralized sliding-mode control for attitude synchronization in spacecraft formation[J]. International Journal of Robust and Nonlinear Control, 2013, 23(11): 1183-1197.
[33] YE D, ZHAO Y, LIU J, et al. A simple structure robust attitude synchronization with input saturation[J]. Journal of the Franklin Institute, 2017, 354(14): 6062-6077.
[34] SOFYALI A, JAFAROV E. Robust stabilization of spacecraft attitude motion under magnetic control through time-varying integral sliding mode[J]. International Journal of Robust and Nonlinear Control, 2019, 29(11): 3446-3468.
[35] YANG D, CHEN Z, LIU X. Distributed adaptive attitude tracking of multiple spacecraft with a leader of bounded unknown input[J]. International Journal of Control, Automation, and Systems, 2013, 11(5):1-9.
[36] YANG D, LIU X. Distributed robust attitude tracking of multiple spacecraft with disturbances and unmodelled dynamics[J]. Mathematical Problems in Engineering, 2015, 9: 941697.
[37] ZOU A, DE RUITER A, KUMAR K. Distributed finite time velocity free attitude coordination control for spacecraft formations[J]. Automatica, 2016, 67: 46-53.
[38] HU Q, ZHANG J, ZHANG Y. Velocity free attitude coordinated tracking control for spacecraft formation flying[J]. ISA Transactions, 2018, 73: 54-65.
[39] HUANG Y, MENG Z. Global finite-time distributed attitude synchronization and tracking control of multiple rigid bodies without velocity measurements[J]. Automatica, 2021, 132: 109796.
[40] ZHANG C, WANG J, ZHANG D, et al. Fault tolerant adaptive finite time attitude synchronization and tracking control for multi-spacecraft formation[J]. Aerospace Science and Technology, 2018, 73: 197-209.
[41] LI H. Global finite time attitude consensus tracking control for a group of rigid spacecraft[J]. International Journal of Systems Science, 2017, 48(13): 2703-2712.
[42] LU P, GAN C, LIU X. Finite-time distributed cooperative attitude control for multiple spacecraft with actuator saturation[J]. IET Control Theory and Applications, 2014, 8(18): 2186-2198.
[43] SUI W, DUAN G, HOU M, et al. Distributed fixed-time attitude synchronization control for multiple rigid spacecraft[J]. International Journal of Control, Automation and Systems, 2019, 17: 1117-1130.
[44] SUI W, DUAN G, HOU M, et al. Distributed fixed-time attitude coordinated tracking for multiple rigid spacecraft via a novel integral sliding mode approach [J]. Journal of the Franklin Institute, 2020, 357: 9399-9422.
[45] XU C, WU B, ZHANG Y. Distributed prescribed-time attitude cooperative control for multiple spacecraft[J]. Aerospace Science and Technology, 2021, 113: 106699.
[46] XU C, WU B, WANG D, et al. Distributed fixed-time output-feedback attitude consensus control for multiple spacecraft[J]. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56 (6): 4779-4795.
[47] HU D, ZHANG S, ZOU A. Velocity-free fixed-time attitude cooperative control for spacecraft formations under directed graphs[J]. International Journal of Robust and Nonlinear Control, 2021, 31 (8): 2905-2927.
[48] CAI H, HUANG J. Leader-following attitude consensus of multiple rigid body systems by attitude feedback control[J]. Automatica, 2016, 69: 87-92.
[49] YE T, DU C K, LU P L, et al. Nonsingular fixed-time attitude coordinated tracking control for multiple rigid spacecraft[J]. ISA Transactions, 2022. DOI: 10.1016/j.isatra.2022.02.024.
[50] LIU X, DU C K, LU P L, et al. Decentralised consensus for multiple Lagrangian systems based on event-triggered strategy[J]. International Journal of Control, 2016, 89(6):1111-1124.
[51] JIN X, SHI Y, TANG Y, et al. Event-triggered fixed-time attitude consensus with fixed and switching topologies[EB/OL]. (2021-08-30)[2022-05-01]. https://ieeexplore.ieee.org/document/9525305.
[52] YI H, LIU M, LI M. Event-triggered fault tolerant control for spacecraft formation attitude synchronization with limited data communication[J]. European Journal of Control, 2019, 48: 97-103.
[53] DI F, LI A, GUO Y, et al. Event-triggered sliding mode attitude coordinated control for spacecraft formation flying system with disturbances[J]. Acta Astronautica, 2021, 188: 121-129.
[54] WANG C, GUO L, WEN C, et al. Attitude coordination control for spacecraft with disturbances and event-triggered communication[J]. IEEE Transactions on Aerospace and Electronic Systems, 2021, 57 (1): 586-596.
[55] XIE X, SHENG T, HE L. Distributed event-triggered attitude consensus control for spacecraft formation flying with unknown disturbances and uncertainties[J]. IEEE Transactions on Aerospace and Electronic Systems, 2021, 58(3): 1721-1732.
[56] ZHANG C, DAI M, DONG P, et al. Fault-tolerant attitude stabilization for spacecraft with low-frequency actuator updates: an integral-type event-triggered approach [J]. IEEE Transactions on Aerospace and Electronic Systems, 2021, 57(1): 729-737.
[57] WANG S, SHU Z, CHEN T. Event-triggered attitude synchronization of multiple rigid-body systems [J]. Systems and Control Letters, 2021, 149: 104879.
[58] LONG J, WANG W, LIU K, et al. Distributed adaptive attitude synchronization of multiple spacecraft with event-triggered communication[J]. IEEE Transactions on Aerospace and Electronic Systems, 2022, 58 (1): 262-274.
Distributed Attitude Cooperative Control for Multi-spacecraft Formation Based on Multi-agent Systems
LIUXiangdong1, LIUHaikuo2, DUChangkun2,3, TIANYe1, LUPingli1, CHENZhen1
(1.School of Automation, Beijing Institute of Technology, Beijing 100081, China; 2.School of Mechatronical Engineering, Beijing Institute of Technology, Beijing 100081, China; 3.Beijing Advanced Innovation Center for Intelligent Robots and Systems, Beijing Institute of Technology, Beijing 100081, China)
Multi-spacecraft formation plays a key role in the fields such as deep space exploration and cooperative earth observation. As one of the key technologies, the attitude tracking and cooperative control of multi-spacecrafts has attracted great attention. In recent years, with the development of distributed artificial intelligence, multi-agent systems (MASs) have attracted scholars in the field of spacecraft control and been applied to multi-spacecraft formation control. In this paper, the research progress of the cooperative control of MASs and its applications in the attitude cooperative control of multi-spacecraft formation are reviewed. First, the progress of the cooperative control of MASs is reviewed in terms of different control requirements of multi-spacecraft formation from three aspects, i.e.,consistent tracking control, finite time control, and event-triggered control. Then, the research progress of attitude cooperative control of multi-spacecraft formation in view of the above requirements is reviewed, and the corresponding distributed attitude cooperative control strategies are proposed based on the cooperative control theory for MASs.
multi-spacecraft formation; multi-agent systems; attitude control; distributed cooperative control
2022?05?23;
2022?07?14
國家自然科學(xué)基金(11972078)
劉向東(1972—),男,博士,教授,主要研究方向?yàn)楹教炱鲃恿W(xué)與控制、多智能體系統(tǒng)和分布式協(xié)同控制等。
劉海闊(1989—),男,博士,主要研究方向?yàn)槎嘀悄荏w系統(tǒng)分布式控制、多航天器編隊(duì)控制和姿態(tài)協(xié)同控制等。
TN 911.73; TP 391.9
A
10.19328/j.cnki.2096?8655.2022.04.009