谷海波 劉克新 呂金虎
1.北京航空航天大學(xué)自動(dòng)化科學(xué)與電氣工程學(xué)院北京100191 2.北京航空航天大學(xué)大數(shù)據(jù)科學(xué)與腦機(jī)智能高精尖創(chuàng)新中心北京100091
人工智能的迅速發(fā)展為人類生活提供了巨大便利,深刻改變了社會(huì)生產(chǎn)方式.2018年10月31日,習(xí)近平總書記在中共中央政治局第九次集體學(xué)習(xí)會(huì)上強(qiáng)調(diào):人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,加快發(fā)展新一代人工智能是事關(guān)我國能否抓住新一輪科技革命和產(chǎn)業(yè)變革機(jī)遇的戰(zhàn)略問題[1].為了搶抓人工智能發(fā)展的重大戰(zhàn)略機(jī)遇,增強(qiáng)人工智能發(fā)展的先發(fā)優(yōu)勢,我國已將人工智能研究作為加快建設(shè)世界科技強(qiáng)國的重要戰(zhàn)略指標(biāo).
集群系統(tǒng)的協(xié)同是一類重要的群體智能,是人工智能未來發(fā)展的必然趨勢,也是新一代人工智能的核心研究領(lǐng)域[2].集群系統(tǒng)是一類典型的復(fù)雜系統(tǒng),它是理解從局部到整體,從微觀到宏觀涌現(xiàn)現(xiàn)象的紐帶和橋梁,也是復(fù)雜系統(tǒng)研究的前沿方向之一.集群系統(tǒng)已經(jīng)滲透到自然社會(huì)的各個(gè)領(lǐng)域,與人們的日常生活息息相關(guān).集群系統(tǒng)是由大量智能體通過局部信息交互形成一個(gè)耦合的整體,每個(gè)智能體具有獨(dú)立的動(dòng)力學(xué)行為,系統(tǒng)整體在宏觀層面上涌現(xiàn)出個(gè)體單獨(dú)存在時(shí)不具備的行為特征,如同步、一致性、群集、相變、斑圖等[3?8].
在集群系統(tǒng)的協(xié)同控制中,由于涉及的問題具有典型的復(fù)雜性特征,如智能體之間的信息交互具有隨機(jī)性、智能體的動(dòng)力學(xué)行為易受外部噪聲干擾、智能體之間的信息傳輸具有滯后性、集群系統(tǒng)的網(wǎng)絡(luò)拓?fù)渚哂蟹较蛐浴⒓合到y(tǒng)的執(zhí)行器存在飽和等[9].因此,這類問題涉及面廣、具有很大的研究價(jià)值.此外,大量實(shí)際工程問題的解決也需要發(fā)展集群系統(tǒng)協(xié)同控制的新理論、新方法.控制論經(jīng)過半個(gè)多世紀(jì)的發(fā)展,在簡單系統(tǒng)的控制方面取得了巨大進(jìn)展,形成了一套完整有效的理論與方法,對(duì)航空航天、工農(nóng)業(yè)生產(chǎn)等領(lǐng)域的發(fā)展起到了巨大推動(dòng)作用[10?12].但這些理論與方法在處理具有多重復(fù)雜性的集群系統(tǒng)時(shí)大部分已不再適用,這給控制理論與控制工程的研究帶來了新的機(jī)遇和挑戰(zhàn).
隨著人工智能等信息技術(shù)的快速發(fā)展,作為集群智能涌現(xiàn)載體的集群系統(tǒng),在民用領(lǐng)域催生了社會(huì)經(jīng)濟(jì)發(fā)展的新動(dòng)力,在軍事領(lǐng)域促進(jìn)了現(xiàn)代化戰(zhàn)爭模式的重大變革[13].任務(wù)的復(fù)雜性與環(huán)境的不確定性決定了集群系統(tǒng)協(xié)同控制勢必朝著智能化和自主化方向發(fā)展.作為新一代人工智能的核心研究領(lǐng)域,集群協(xié)同控制技術(shù)已成為世界各國經(jīng)濟(jì)和國防發(fā)展的強(qiáng)大驅(qū)動(dòng)力.多機(jī)器人協(xié)同技術(shù)入選2014年Science 十項(xiàng)重大科學(xué)突破;2015年Floreano 教授等在Nature 中指出:仿生機(jī)器人群已經(jīng)廣泛應(yīng)用于國防、交通、環(huán)境保護(hù)、農(nóng)業(yè)等領(lǐng)域,微小型自主機(jī)器人時(shí)代正在到來[14];2018年喬治華盛頓大學(xué)Keidar教授等指出:利用微小型衛(wèi)星集群探索太空,不僅能夠加速宇宙空間探索的進(jìn)程,還可以降低太空探索的成本[15];2019年Rahwan 教授等在Nature 中指出:了解人工智能系統(tǒng)的行為對(duì)于控制它們的行為、獲取它們的利益、降低它們的危害至關(guān)重要,分析機(jī)器群體的行為規(guī)律,有望突破人工智能面臨的脆弱性、不可預(yù)見性、弱可解釋性等技術(shù)瓶頸[16].
集群現(xiàn)象廣泛存在于自然界中,大量生物個(gè)體聚集在一起就形成了生物集群,如鳥群、魚群、獸群、微生物群等.研究發(fā)現(xiàn),生物集群比單一個(gè)體在覓食、遷徙、逃避天敵等方面具有更大的優(yōu)勢[17?18].生物群體中的個(gè)體通過局部感知和行為交流,使整個(gè)集群在宏觀上涌現(xiàn)出復(fù)雜的智能行為,如鳥群編隊(duì)遷徙、魚群協(xié)同巡游、狼群合作圍捕等.圖1給出了自然界中兩種典型的生物集群現(xiàn)象示例[19].
現(xiàn)代仿生學(xué)的發(fā)展歷程表明,研究自然界中集群行為的內(nèi)在機(jī)理有助于闡明人類社會(huì)中的復(fù)雜集群現(xiàn)象,有利于解決工程領(lǐng)域中的諸多技術(shù)難題[20?21].一方面,人類社會(huì)中存在著大量的自組織現(xiàn)象[22],不同個(gè)體之間通過相互作用產(chǎn)生各種各樣的集群行為,研究自然界中的集群行為不僅可以揭示大自然的奧秘,而且能夠深刻理解人類社會(huì)的演化規(guī)律;另一方面,自然界中集群行為的研究成果將會(huì)為人類社會(huì)的科技革新提供理論與方法.軍事領(lǐng)域作為人類社會(huì)的重要領(lǐng)域之一,群體智能在軍事系統(tǒng)中有著廣闊的應(yīng)用前景[23?25].軍事領(lǐng)域的集群系統(tǒng)是由大量具有自主能力的智能體按照一定的規(guī)則構(gòu)成,如DAPAR 衛(wèi)星群、無人機(jī)蜂群、多導(dǎo)彈集群等;集群智能則是通過智能體之間的有效協(xié)作,克服個(gè)體自身能力的不足,完成個(gè)體難以實(shí)現(xiàn)的復(fù)雜任務(wù)所涌現(xiàn)出的集群行為,如協(xié)同探測、集群突防、蜂群攻擊等.圖2給出了軍事領(lǐng)域中兩種典型的集群現(xiàn)象示例[26].
集群系統(tǒng)涉及自動(dòng)化科學(xué)、系統(tǒng)科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、物理、生物等多學(xué)科的融合,是近年來涌現(xiàn)出的信息科學(xué)重大前沿交叉領(lǐng)域.集群系統(tǒng)通過自主感知、組網(wǎng)傳輸、集群控制一體化協(xié)同控制技術(shù)實(shí)現(xiàn)集群智能,完成個(gè)體難以實(shí)現(xiàn)的復(fù)雜任務(wù),在大面積災(zāi)情搜救、城市應(yīng)急反恐、集群作戰(zhàn)等社會(huì)服務(wù)、公共安全及國防裝備中有重大應(yīng)用.2014年,美軍將集群協(xié)同控制技術(shù)列入第三次“抵消戰(zhàn)略”的顛覆性基礎(chǔ)研究領(lǐng)域,并制定了詳細(xì)的發(fā)展路線圖[27];集群協(xié)同控制技術(shù)也被我國列入《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006-2020)》優(yōu)先發(fā)展領(lǐng)域.集群系統(tǒng)協(xié)同控制研究體現(xiàn)了面向國際學(xué)術(shù)前沿和國家重大戰(zhàn)略需求的有機(jī)統(tǒng)一,具有十分重要的科學(xué)價(jià)值和社會(huì)意義.
圖1 自然界中的生物集群現(xiàn)象Fig.1 Biological clusters in nature
集群系統(tǒng)協(xié)同控制是一類亟需研究的問題.集群系統(tǒng)的協(xié)同是一類重要的群體智能,是新一代人工智能研究的核心領(lǐng)域.集群協(xié)同控制技術(shù)入選2019年美國國家科學(xué)基金會(huì)《未來20年美國人工智能研究團(tuán)體路線圖》[28],同時(shí)也被美國商務(wù)部列為新興技術(shù)禁運(yùn)名單.2017年國務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中,明確將自主協(xié)同控制與優(yōu)化決策、集群智能、混合增強(qiáng)智能等3 項(xiàng)與集群協(xié)同控制相關(guān)的理論列為我國人工智能未來發(fā)展的基礎(chǔ)理論[29];2018年,科技部啟動(dòng)的《科技創(chuàng)新2030“新一代人工智能”重大項(xiàng)目申報(bào)指南》中明確將“集群智能”列為人工智能領(lǐng)域的5 大持續(xù)攻關(guān)方向之一[30];2020年,中國科學(xué)院發(fā)布的《2019年人工智能發(fā)展白皮書》中,也將“集群智能技術(shù)”列為8 大人工智能關(guān)鍵技術(shù)之一[31].協(xié)同控制技術(shù)是集群智能涌現(xiàn)的保障和途徑,是爭奪的技術(shù)制高點(diǎn),為保障我國在集群智能領(lǐng)域的世界引領(lǐng)作用和技術(shù)優(yōu)勢,深入開展集群協(xié)同控制技術(shù)研究迫在眉睫.
圖2 軍事領(lǐng)域中的集群現(xiàn)象Fig.2 Clusters in military field
1948年Wiener 經(jīng)典著作《控制論》的出版,標(biāo)志著控制論學(xué)科的誕生.集群系統(tǒng)協(xié)同控制是控制論研究的一個(gè)重要分支,它結(jié)合控制理論的一般原理研究集群系統(tǒng)涌現(xiàn)出的特定行為和功能,如一致性、同步、蜂擁、云集等[32?38].一般來說,集群系統(tǒng)由智能體、交互方式和行為準(zhǔn)則3 個(gè)要素組成.智能體是組成集群系統(tǒng)的基本單元,如無人機(jī)、機(jī)器人等;交互方式是描述集群系統(tǒng)中智能體之間的相互作用關(guān)系,如信息傳輸?shù)木W(wǎng)絡(luò)拓?fù)?行為準(zhǔn)則是描述智能體接收信息之后的反應(yīng)規(guī)則,如控制律生成規(guī)則等.在集群系統(tǒng)協(xié)同控制中,由于涉及的問題具有典型的復(fù)雜性特征,如智能體的動(dòng)力學(xué)具有異構(gòu)、非線性特性,智能體之間的信息交互具有隨機(jī)性,集群系統(tǒng)的執(zhí)行器存在飽和,智能體之間的信息傳輸具有滯后性等.因此,這類問題涉及領(lǐng)域廣,研究價(jià)值大,受到越來越多研究人員的青睞.集群系統(tǒng)具有大規(guī)模(智能體數(shù)量眾多)、自組織(無中心節(jié)點(diǎn))、分布式(局部信息交互)、涌現(xiàn)性(集群功能比單一智能體強(qiáng)大)等典型特征,可通過牽制控制、PID 控制、分布式觀測器設(shè)計(jì)等方法實(shí)現(xiàn)集群智能.下面分別綜述這3 種典型控制方法的相關(guān)研究工作.
集群系統(tǒng)具有大規(guī)模特征,直接控制系統(tǒng)中的每個(gè)個(gè)體是不可能的,也是不必要的.一個(gè)典型的自然現(xiàn)象是當(dāng)蜂群向新的巢穴遷徙時(shí),只有少數(shù)的偵查員蜜蜂知道應(yīng)該朝哪個(gè)方向飛行,僅依靠這些少量的偵查員就能引領(lǐng)整個(gè)蜂群飛到新的巢穴,而這些偵查員蜜蜂的數(shù)量僅占數(shù)千只蜂群中的5%[39].美國科學(xué)院院士Levin 教授等在Nature 中證實(shí)了集群系統(tǒng)的規(guī)模越大,需要控制的個(gè)體比例越小[17].這一生物現(xiàn)象的內(nèi)在機(jī)理對(duì)于移動(dòng)智能體系統(tǒng)的協(xié)同控制有著潛在的工程應(yīng)用[40].如何通過控制少部分關(guān)鍵節(jié)點(diǎn)實(shí)現(xiàn)對(duì)整個(gè)集群系統(tǒng)的有效控制,是集群協(xié)同控制面臨的本質(zhì)困難.受蜂群遷徙的啟發(fā),研究者提出了牽制控制方法.
假設(shè)集群系統(tǒng)含有N個(gè)相同的智能體,每個(gè)智能體是一個(gè)n維動(dòng)態(tài)系統(tǒng).不失一般性,假設(shè)選擇前l(fā)個(gè)智能體進(jìn)行牽制控制,其中,l=,0 <δ?1,表示實(shí)數(shù)δN的整數(shù)部分,牽制控制下集群系統(tǒng)描述為
其中,xi=(xi1,xi2,···,xin)∈Rn,ui∈Rn分別為智能體i的狀態(tài)變量和控制輸入,f(t,xi):R+×Rn→Rn是連續(xù)可微的非線性函數(shù),常數(shù)c>0 表示智能體之間的耦合強(qiáng)度,是內(nèi)部耦合矩陣,表示智能體之間信息交互的鄰接矩陣,如果智能體i和智能體j(i≠j)之間有信息交互,則ai j>0,否則aij=0.
牽制控制方法興起于21 世紀(jì)初,現(xiàn)已成為控制理論中研究系統(tǒng)集群行為的一種有力工具.2002年Wang 和Chen 首先采用牽制策略研究了無標(biāo)度動(dòng)態(tài)網(wǎng)絡(luò)的控制問題[41].Li,Wang 和Chen 進(jìn)一步給出了牽制控制策略下復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的穩(wěn)定性條件,并將牽制控制與虛擬控制相結(jié)合探究了牽制策略選取的有效性[42].Lu 等通過設(shè)計(jì)牽制控制算法研究了有向復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的全局穩(wěn)定性,給出了牽制節(jié)點(diǎn)的選取與網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的關(guān)系[43].此后,這一問題得到了大量的研究,產(chǎn)生了豐碩的研究成果,如自適應(yīng)牽制控制[44?45]、脈沖牽制控制[46]、牽制控制能控性[47?49]、牽制控制能觀性[50]、牽制控制有效性[51]等.
近年來,牽制控制方法廣泛應(yīng)用于大規(guī)模集群系統(tǒng)的協(xié)同控制研究中,利用個(gè)體狀態(tài)的局部信息和簡單規(guī)則,使集群系統(tǒng)在宏觀層面上涌現(xiàn)出集群智能[52?55].集群系統(tǒng)協(xié)同控制研究的挑戰(zhàn)在于智能體之間信息交互的網(wǎng)絡(luò)拓?fù)涫菚r(shí)變的,并且網(wǎng)絡(luò)初始時(shí)的連通性不能保證網(wǎng)絡(luò)拓?fù)涫冀K連通.為了克服這一困難,常規(guī)的做法是假設(shè)集群系統(tǒng)中存在一個(gè)真實(shí)或虛擬的領(lǐng)導(dǎo)者,并且其他個(gè)體都能夠獲得領(lǐng)導(dǎo)者的信息,無論網(wǎng)絡(luò)拓?fù)涑跏紶顟B(tài)是否連通,所有智能體都能保持內(nèi)聚性,最終實(shí)現(xiàn)期望的群體智能,但這一假設(shè)在實(shí)際工程系統(tǒng)中很難實(shí)現(xiàn).鑒于此,文獻(xiàn)[54] 提出了一種基于牽制策略的集群算法,即只有一少部分智能體獲得領(lǐng)導(dǎo)者的信息,其他智能體只要能夠受到這些獲得領(lǐng)導(dǎo)者信息的智能體的影響,整個(gè)集群系統(tǒng)就能夠?qū)崿F(xiàn)期望的群體智能.文獻(xiàn)[55]通過設(shè)計(jì)控制協(xié)議保持網(wǎng)絡(luò)在演化過程中的連通性實(shí)現(xiàn)群體智能.
課題組在集群系統(tǒng)的牽制控制方面進(jìn)行了大量探究,取得了一系列成果[44?45,50,56?58].復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的牽制控制存在一些挑戰(zhàn)性的基本問題:1)一個(gè)具有固定拓?fù)浜婉詈蠌?qiáng)度的網(wǎng)絡(luò),需要牽制多少個(gè)節(jié)點(diǎn)才能實(shí)現(xiàn)控制目標(biāo)?2)一個(gè)具有固定拓?fù)浜痛_定牽制節(jié)點(diǎn)的網(wǎng)絡(luò),需要多大的耦合強(qiáng)度才能實(shí)現(xiàn)控制目標(biāo)? 3)對(duì)于一個(gè)給定的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò),牽制哪些類型的節(jié)點(diǎn)易于控制目標(biāo)的實(shí)現(xiàn)? 針對(duì)上述問題,文獻(xiàn)[45] 給出了幾種自適應(yīng)牽制同步規(guī)則,揭示了復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、耦合強(qiáng)度、牽制節(jié)點(diǎn)數(shù)與控制增益之間的本質(zhì)定量關(guān)系;文獻(xiàn)[56]研究了一類典型復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的同步機(jī)理,給出了易于驗(yàn)證的牽制控制判別準(zhǔn)則,以及牽制節(jié)點(diǎn)的選擇方式和控制增益設(shè)計(jì)方法.針對(duì)有向復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò),文獻(xiàn)[57]研究了強(qiáng)連通網(wǎng)絡(luò)、有向生成樹網(wǎng)絡(luò)、弱連通網(wǎng)絡(luò)、有向森林網(wǎng)絡(luò)的牽制同步問題,首先給出了強(qiáng)連通網(wǎng)絡(luò)牽制節(jié)點(diǎn)的選取方法,即入度小的節(jié)點(diǎn)和出度大的節(jié)點(diǎn)需要優(yōu)先牽制;其次給出了由多個(gè)強(qiáng)連通分支組成的有向生成樹網(wǎng)絡(luò)的牽制同步判據(jù),即入度小的強(qiáng)連通元組成的超節(jié)點(diǎn)應(yīng)當(dāng)牽制;最后設(shè)計(jì)了上述4 種有向復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)實(shí)現(xiàn)同步的牽制控制算法.文獻(xiàn)[46]通過設(shè)計(jì)牽制脈沖控制算法,研究了有向復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的同步,并驗(yàn)證了算法的收斂性和魯棒性.文獻(xiàn)[58]闡述了牽制控制方法在集群系統(tǒng)協(xié)同控制中的一些研究進(jìn)展,對(duì)于具有固定拓?fù)涞木W(wǎng)絡(luò),分析了牽制控制的可行性、穩(wěn)定性以及有效性;對(duì)于拓?fù)鋾r(shí)變的移動(dòng)多智能體系統(tǒng),給出了基于牽制策略的集群控制方法.
集群系統(tǒng)是一類典型的復(fù)雜系統(tǒng).一方面,集群對(duì)象之間的強(qiáng)耦合相互作用、系統(tǒng)結(jié)構(gòu)的不確定性、信息傳輸?shù)臏笮?、外部噪聲干擾、執(zhí)行器飽和等因素,導(dǎo)致系統(tǒng)受到多種約束條件的制約;另一方面,集群協(xié)同控制采用的策略大都僅利用了系統(tǒng)狀態(tài)的當(dāng)前信息,難以滿足諸如無人機(jī)群等高科技領(lǐng)域?qū)刂菩阅懿粩嗵岣叩囊?由于PID 控制是一種具有“過去-現(xiàn)在-未來”形式的簡單線性反饋機(jī)制的反饋控制;控制協(xié)議設(shè)計(jì)時(shí)不僅利用了系統(tǒng)狀態(tài)的當(dāng)前信息,還利用了系統(tǒng)狀態(tài)的過去信息和未來信息;PID 控制可以通過積分作用消除系統(tǒng)的靜態(tài)誤差,通過微分作用預(yù)測系統(tǒng)狀態(tài)的未來發(fā)展趨勢;PID 控制不僅應(yīng)用于能夠建立精確數(shù)學(xué)模型的確定性系統(tǒng)中,還可以應(yīng)用于難以建立精確數(shù)學(xué)模型的不確定性系統(tǒng)中[59?60].因此,PID 控制方法為集群系統(tǒng)協(xié)同控制的研究提供了強(qiáng)有力的工具.
PID 控制協(xié)議由比例項(xiàng)P,積分項(xiàng)I和微分項(xiàng)D三部分組成,通過調(diào)節(jié)這三部分的系數(shù)KP,KI和KD實(shí)現(xiàn)對(duì)系統(tǒng)控制的目的.PID 控制協(xié)議的具體形式為
其中,u(t)是系統(tǒng)的控制輸入,e(t)=x(t)?(t)是系統(tǒng)誤差,KP>0,KI≥0,KD≥0 分別為比例項(xiàng)、積分項(xiàng)和微分項(xiàng)的控制增益.PID 控制流程如圖3:
圖3 PID 控制流程圖Fig.3 The process of PID control
在國內(nèi)外相關(guān)研究的推動(dòng)下,學(xué)術(shù)界在基于PID協(xié)議的集群系統(tǒng)協(xié)同控制這一新型領(lǐng)域取得了一系列研究成果[61?72].早期的研究工作主要集中在神經(jīng)網(wǎng)絡(luò)系統(tǒng)的調(diào)控上,2009年Cong 等針對(duì)不確定單輸入多輸出集群系統(tǒng),根據(jù)混合局部遞歸神經(jīng)網(wǎng)絡(luò)的思想,設(shè)計(jì)了基于非線性神經(jīng)網(wǎng)絡(luò)的自適應(yīng)PID 控制協(xié)議,該協(xié)議具有穩(wěn)定的學(xué)習(xí)速率,能夠根據(jù)系統(tǒng)誤差和外部干擾等不確定因素產(chǎn)生的誤差,在線實(shí)時(shí)更新神經(jīng)網(wǎng)絡(luò)的權(quán)值[61].2013年Cheng 等研究了帶有多個(gè)領(lǐng)導(dǎo)者的多智能體系統(tǒng)在離散時(shí)域和連續(xù)時(shí)域中的約束控制問題,為了使所有跟隨者都能同步到由領(lǐng)導(dǎo)者生成的凸包上,提出了一種PIn型約束算法,并從理論上證明了該算法的有效性[62].同年,Jing 等將前饋神經(jīng)網(wǎng)絡(luò)的魯棒學(xué)習(xí)問題轉(zhuǎn)化為線性動(dòng)態(tài)離散系統(tǒng)的魯棒PID 控制問題,提出了最優(yōu)PID控制算法,保證了算法的全局魯棒收斂性,提高了算法的收斂速度[63].
對(duì)于具有無向拓?fù)涞亩嘀悄荏w系統(tǒng),2014年Andreasson 等通過設(shè)計(jì)分布式PI 控制協(xié)議,探究了一階與二階同構(gòu)(homogenous)線性多智能體系統(tǒng)的一致性,進(jìn)而采用所設(shè)計(jì)的控制協(xié)議實(shí)現(xiàn)了智能電網(wǎng)的一致性[64].2015年Bernardo 等通過設(shè)計(jì)PID 控制協(xié)議分析了一階異構(gòu)(heterogeneous)線性多智能體系統(tǒng)的同步和一致性,通過適當(dāng)?shù)臓顟B(tài)變換和構(gòu)造相應(yīng)的Lyapunov 函數(shù),證明了PID 控制協(xié)議的收斂性[66].隨后,他們提出了一種基于雙層網(wǎng)絡(luò)的PI控制策略,用于解決受外部噪聲干擾的異構(gòu)多智能體系統(tǒng)的一致性問題,在這種策略中比例項(xiàng)和積分項(xiàng)分別部署在兩個(gè)拓?fù)浣Y(jié)構(gòu)不同的網(wǎng)絡(luò)層上[67].針對(duì)受定常數(shù)擾動(dòng)干擾的異構(gòu)線性多智能體系統(tǒng)的一致性問題,他們?cè)O(shè)計(jì)了具有自校正自適應(yīng)增益的分布式PI 控制協(xié)議[68].對(duì)于有向多智能體系統(tǒng)的一致性協(xié)議設(shè)計(jì)問題,段志生教授等通過設(shè)計(jì)分布式PI控制協(xié)議,給出了系統(tǒng)實(shí)現(xiàn)一致性的判別準(zhǔn)則和控制協(xié)議參數(shù)選擇的充分條件[69].進(jìn)一步,他們通過引入虛擬的領(lǐng)導(dǎo)者,設(shè)計(jì)了分布式自適應(yīng)PI 控制協(xié)議,給出了領(lǐng)導(dǎo)-跟隨一致性實(shí)現(xiàn)的充分條件[70].最近,郭雷院士等通過設(shè)計(jì)非耦合PID 控制協(xié)議,研究了一類高維二階耦合不確定多自主體系統(tǒng)的跟蹤問題,每個(gè)自主體僅利用自身的跟蹤誤差信息,分別對(duì)每個(gè)自主體設(shè)計(jì)不同的PID 控制器,從而實(shí)現(xiàn)系統(tǒng)的全局一致性[71].
課題組在基于PID 協(xié)議的集群系統(tǒng)協(xié)同控制方面進(jìn)行了大量研究,取得了一定的研究成果[73?77].文獻(xiàn)[73]探討了含節(jié)點(diǎn)時(shí)滯的多智能體網(wǎng)絡(luò)的同步及PID 控制器設(shè)計(jì)問題,給出了系統(tǒng)全局同步時(shí),PI 和PD 控制器參數(shù)的設(shè)計(jì)方法.研究表明,網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、內(nèi)部耦合矩陣、節(jié)點(diǎn)動(dòng)力學(xué)、時(shí)滯在含節(jié)點(diǎn)時(shí)滯的多智能體網(wǎng)絡(luò)的同步中起著重要作用.文獻(xiàn)[74]研究了具有非線性動(dòng)態(tài)和有向拓?fù)涞亩嘀悄荏w網(wǎng)絡(luò)的全局同步及PID 控制協(xié)議設(shè)計(jì)問題,給出了全局同步的充分條件.為了探究PID 控制中積分項(xiàng)和微分項(xiàng)對(duì)網(wǎng)絡(luò)同步性能的影響,分別設(shè)計(jì)了PI 和PD 協(xié)議對(duì)具有不同拓?fù)浣Y(jié)構(gòu)的有向動(dòng)態(tài)網(wǎng)絡(luò)(包括平衡強(qiáng)連通網(wǎng)絡(luò)、強(qiáng)連通網(wǎng)絡(luò)、含有向生成樹的網(wǎng)絡(luò))進(jìn)行了研究,建立了PID 協(xié)議與有向網(wǎng)絡(luò)全局同步之間的聯(lián)系.文獻(xiàn)[75] 研究了含節(jié)點(diǎn)時(shí)滯的有向多智能體網(wǎng)絡(luò)的協(xié)同控制問題,通過構(gòu)造A矩陣,分別設(shè)計(jì)了PI 和PD 控制協(xié)議,給出了這類多智能體網(wǎng)絡(luò)全局同步的充分條件.對(duì)于受噪聲干擾的多智能體網(wǎng)絡(luò),文獻(xiàn)[76] 通過設(shè)計(jì)PI 和PD 協(xié)議,給出了系統(tǒng)全局同步的判別準(zhǔn)則及控制器參數(shù)設(shè)計(jì)方法,闡明了網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、節(jié)點(diǎn)動(dòng)力學(xué)、隨機(jī)擾動(dòng)、內(nèi)部耦合矩陣和PID 控制增益之間的本質(zhì)關(guān)系.針對(duì)隨機(jī)耦合非線性多智能體網(wǎng)絡(luò),文獻(xiàn)[77] 利用自適應(yīng)控制方法探討了這類網(wǎng)絡(luò)的同步問題.根據(jù)智能體的狀態(tài)信息,分別設(shè)計(jì)了基于節(jié)點(diǎn)和基于邊的自適應(yīng)PI 同步協(xié)議,給出了隨機(jī)耦合多智能體網(wǎng)絡(luò)在均方意義下同步的充分條件,揭示了網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、隨機(jī)耦合、節(jié)點(diǎn)動(dòng)力學(xué)和PI 控制增益之間的定量關(guān)系.設(shè)計(jì)的自適應(yīng)PI 控制協(xié)議結(jié)構(gòu)簡單且易于在未來實(shí)際工程中設(shè)計(jì)使用.
在實(shí)際工程控制問題中,不是所有的狀態(tài)信息都能直接獲得,為了解決這個(gè)問題,常用的做法是設(shè)計(jì)系統(tǒng)的狀態(tài)觀測器,利用觀測到的輸出信息近似地估計(jì)系統(tǒng)的狀態(tài)信息.傳統(tǒng)的集中式觀測器設(shè)計(jì)中,需要獲得系統(tǒng)狀態(tài)的全部輸出信息,但對(duì)于大規(guī)模的集群系統(tǒng)而言,由于傳感器觀測能力的限制,每個(gè)觀測器通常只能獲得系統(tǒng)狀態(tài)的局部輸出信息,因此,需要部署大量的傳感器來觀測系統(tǒng)的狀態(tài),從而造成集中式觀測器面臨巨大的存儲(chǔ)壓力,這使傳感器網(wǎng)絡(luò)上的分布式觀測器算法為解決集群系統(tǒng)協(xié)同控制問題提供了強(qiáng)有力的工具.
觀測器作為控制輸入的集群系統(tǒng)通常描述為
其中,xi∈Rn是系統(tǒng)的狀態(tài)變量,yi∈Rmi是系統(tǒng)的輸出變量,A∈Rn,B∈Rn,Ci∈Rmi×n是系統(tǒng)矩陣,ui∈Rn是控制輸入.分布式觀測器設(shè)計(jì)為
圖4 兩種觀測器設(shè)計(jì)方法的區(qū)別Fig.4 The difference between two observer design methods
觀測器的設(shè)計(jì)問題是控制理論與控制工程研究中的一類重要問題.有關(guān)觀測器設(shè)計(jì)問題的早期研究工作可追溯到1964年Luenberger 發(fā)表在IEEE Transactions on Military Electronics 的論文[78].此后,研究者對(duì)觀測器設(shè)計(jì)問題進(jìn)行了大量研究,產(chǎn)生了多種類型的觀測器設(shè)計(jì)方法,如魯棒自適應(yīng)觀測器設(shè)計(jì)[79?80]、T-S 模糊系統(tǒng)觀測器設(shè)計(jì)[81]、高增益觀測器設(shè)計(jì)[82]等.2007年Olfati 教授等利用分布式Kalman 濾波的思想,研究了一類連續(xù)時(shí)變系統(tǒng)的分布式觀測器設(shè)計(jì)問題,給出了分布式觀測器結(jié)構(gòu)的具體形式,但這種觀測器參數(shù)的求解需要依賴于復(fù)雜的Riccati 方程[83].2012年,Li 等研究了多智能體系統(tǒng)的協(xié)同控制問題,設(shè)計(jì)了基于觀測器的一致性協(xié)議算法,分析了算法的收斂性,給出了一致性實(shí)現(xiàn)的參數(shù)設(shè)計(jì)方法[84].隨后,Lewis 教授等研究了離散同構(gòu)多智能體系統(tǒng)的一致性問題,通過引入分布式收斂域的概念,提出了協(xié)同式觀測器和控制器設(shè)計(jì)方法,并驗(yàn)證了所設(shè)計(jì)觀測器的魯棒性[85].2014年,段廣仁院士等針對(duì)連續(xù)時(shí)間和離散時(shí)間多智能體系統(tǒng),設(shè)計(jì)了一種截?cái)嘈徒惦A觀測器,解決了系統(tǒng)動(dòng)力學(xué)開環(huán)且不是指數(shù)穩(wěn)定情況下的多智能體系統(tǒng)的一致性問題[86].
針對(duì)基于分布式觀測器設(shè)計(jì)的集群系統(tǒng)輸出調(diào)節(jié)問題,2012年Su 等提出了動(dòng)態(tài)通信網(wǎng)絡(luò)下分布式觀測器的設(shè)計(jì)方法,通過設(shè)計(jì)外系統(tǒng)的分布式觀測器,解決了線性多智能體系統(tǒng)的協(xié)同輸出調(diào)節(jié)問題[87].隨后,他們將相關(guān)結(jié)果推廣到了切換網(wǎng)絡(luò)情形,通過設(shè)計(jì)動(dòng)態(tài)狀態(tài)反饋控制器和測量輸出反饋控制器,解決了多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨一致性問題[88].2015年Liu 等通過設(shè)計(jì)分布式觀測器,解決了含有任意大有界擾動(dòng)的異構(gòu)不確定多智能體系統(tǒng)的分散式魯棒輸出調(diào)節(jié)問題,并分析了分布式觀測器設(shè)計(jì)算法的收斂性[89].上述研究中分布式觀測器的設(shè)計(jì)需要部分個(gè)體獲得外部擾動(dòng)的信息.在不需要個(gè)體獲得外部擾動(dòng)信息的情況下,2016年Seyboth 教授等給出了全局和局部擾動(dòng)情形下的分布式輸出調(diào)節(jié)問題的設(shè)計(jì)算法,解決了線性多智能體系統(tǒng)的協(xié)同控制問題[90].
課題組在集群系統(tǒng)分布式觀測器設(shè)計(jì)方面進(jìn)行了大量研究,取得了一系列研究成果[91?95].文獻(xiàn)[91]研究了兩類典型連續(xù)時(shí)間多智能體系統(tǒng)的分布式觀測器設(shè)計(jì)問題,在網(wǎng)絡(luò)拓?fù)錈o向連通的情況下,給出了分布式觀測器達(dá)到漸近全能的充分必要條件;針對(duì)強(qiáng)連通網(wǎng)絡(luò)和含有向生成樹的網(wǎng)絡(luò),給出了分布式觀測器設(shè)計(jì)方法,以及反饋增益矩陣和網(wǎng)絡(luò)耦合強(qiáng)度的設(shè)計(jì)算法.為了克服高維系統(tǒng)集中式觀測器的通信瓶頸問題,文獻(xiàn)[93] 構(gòu)建了基于分布式觀測器的連續(xù)時(shí)間LTI 系統(tǒng)的鎮(zhèn)定問題框架,給出了幾類典型有向網(wǎng)絡(luò)協(xié)同鎮(zhèn)定的充分條件以及參數(shù)設(shè)計(jì)算法.針對(duì)集群系統(tǒng)中智能體只能獲得局部輸出信息及網(wǎng)絡(luò)中存在通信時(shí)滯約束的情形,文獻(xiàn)[94] 研究了含有任意大通信時(shí)滯的分布式觀測器設(shè)計(jì)問題.基于低增益反饋和協(xié)同式控制方法,通過設(shè)計(jì)網(wǎng)絡(luò)化觀測器,使得每個(gè)觀測器都以指數(shù)速度漸進(jìn)跟蹤系統(tǒng)的狀態(tài),從而避免了使用積分型預(yù)測控制器引發(fā)的系統(tǒng)數(shù)值算法不穩(wěn)定問題.文獻(xiàn)[95] 研究了含有外部擾動(dòng)的線性時(shí)不變系統(tǒng)的協(xié)同輸出調(diào)節(jié)問題,基于網(wǎng)絡(luò)化系統(tǒng)的內(nèi)模原理,設(shè)計(jì)了分布式狀態(tài)觀測器和擾動(dòng)觀測器,每個(gè)觀測器只能獲得一部分量測輸出,通過不同個(gè)體間的相互作用實(shí)現(xiàn)對(duì)系統(tǒng)狀態(tài)的觀測,分別給出了在固定網(wǎng)絡(luò)拓?fù)浜蜁r(shí)變網(wǎng)絡(luò)拓?fù)湎聟?shù)設(shè)計(jì)算法及實(shí)現(xiàn)輸出調(diào)節(jié)的條件.
“需求牽引、技術(shù)推動(dòng)”是人類社會(huì)文明進(jìn)步的不竭動(dòng)力.集群系統(tǒng)協(xié)同控制技術(shù)的廣泛應(yīng)用,必將對(duì)社會(huì)生產(chǎn)生活方式產(chǎn)生深刻的變革.展望集群系統(tǒng)協(xié)同控制對(duì)新時(shí)代智能控制技術(shù)的發(fā)展,藉以重塑我們所面臨的諸多機(jī)遇和挑戰(zhàn).任務(wù)多樣性、通信復(fù)雜性以及環(huán)境不確定性,決定了集群系統(tǒng)協(xié)同控制技術(shù)勢必朝著自主化、智能化、最優(yōu)化、網(wǎng)絡(luò)化和安全化方向發(fā)展.這些發(fā)展趨勢值得我們關(guān)注和進(jìn)一步研究.
1)集群系統(tǒng)協(xié)同控制“自主化”.未來集群系統(tǒng)不僅局限于底層控制,更多的是與信息層、決策層、鏈路層相結(jié)合,從而實(shí)現(xiàn)協(xié)同感知-自主決策-動(dòng)態(tài)組網(wǎng)集群控制一體化,實(shí)現(xiàn)任務(wù)分配-路徑規(guī)劃-自主控制一體化.隨著集群系統(tǒng)載荷計(jì)算能力的迅速增強(qiáng),利用網(wǎng)絡(luò)結(jié)構(gòu)耦合設(shè)計(jì)的智能協(xié)同算法,能夠有效提升集群系統(tǒng)的自主協(xié)同能力,有助于在實(shí)際工程系統(tǒng)中應(yīng)用.
2)集群系統(tǒng)協(xié)同控制“智能化”.智能控制能夠提升系統(tǒng)的控制性能,人工智能技術(shù)的發(fā)展為研究集群系統(tǒng)協(xié)同控制提供了新思路.基于新一代人工智能技術(shù)構(gòu)建協(xié)同控制框架,使集群中的個(gè)體在局部感知能力下,通過集群數(shù)據(jù)鏈技術(shù),實(shí)現(xiàn)復(fù)雜的群體行為,充分激發(fā)群體間的智能是未來協(xié)同控制技術(shù)的發(fā)展趨勢.
3)集群系統(tǒng)協(xié)同控制“最優(yōu)化”.集群系統(tǒng)的某些性能指標(biāo)達(dá)到最優(yōu)是實(shí)際控制場景的需求.優(yōu)化技術(shù)與集群系統(tǒng)相結(jié)合,產(chǎn)生了集群系統(tǒng)的分布式優(yōu)化與協(xié)同博弈技術(shù),支撐了大規(guī)模集群系統(tǒng)的協(xié)同控制,為集群智能的涌現(xiàn)提供了保障.基于分布式優(yōu)化方法的協(xié)同控制是集群系統(tǒng)智能化的未來發(fā)展趨勢.
4)集群系統(tǒng)協(xié)同控制“網(wǎng)絡(luò)化”.網(wǎng)絡(luò)化通信是集群控制的重要信息層保障,目前集群系統(tǒng)協(xié)同控制研究中未充分考慮通信層的影響.快速組網(wǎng)技術(shù)在實(shí)現(xiàn)復(fù)雜高動(dòng)態(tài)環(huán)境下的協(xié)同控制中起著至關(guān)重要的作用,為了使控制層與信息層更好地匹配,提高協(xié)同控制性能,實(shí)現(xiàn)協(xié)同感知-通信匹配-快速組網(wǎng)-集群控制一體化是未來集群系統(tǒng)研究的重要方向.
5)集群系統(tǒng)協(xié)同控制“安全化”.安全性是集群系統(tǒng)協(xié)同控制任務(wù)實(shí)現(xiàn)的關(guān)鍵因素,對(duì)系統(tǒng)的控制和決策起到保護(hù)作用.在現(xiàn)有集群系統(tǒng)協(xié)同控制基礎(chǔ)上,通常采用故障診斷與容錯(cuò)控制、干擾抑制與信息補(bǔ)償?shù)确绞浇鉀Q單一的攻擊或防御問題.在集群系統(tǒng)的框架下,實(shí)現(xiàn)攻擊和防御的協(xié)調(diào)統(tǒng)一是協(xié)同控制未來發(fā)展的趨勢.
通過對(duì)集群系統(tǒng)協(xié)同控制技術(shù)研究、分析,發(fā)現(xiàn)各類問題雖然已有許多行之有效的解決方法,但仍存在諸多不足.將人工智能領(lǐng)域出現(xiàn)的新技術(shù)、新方法引入到集群系統(tǒng)協(xié)同控制研究中,對(duì)提升集群系統(tǒng)的自主化、智能化、最優(yōu)化、網(wǎng)絡(luò)化、安全化程度起著重要的推動(dòng)作用.
本文首先介紹了集群系統(tǒng)協(xié)同控制的研究背景及研究意義;其次探討了集群系統(tǒng)協(xié)同控制方面的研究進(jìn)展,針對(duì)集群系統(tǒng)具有大規(guī)模、復(fù)雜性、分布式、信息不完備的特征,從牽制控制、PID 控制、分布式觀測器設(shè)計(jì)等方面闡述了集群系統(tǒng)的協(xié)同控制問題;最后給出了集群系統(tǒng)協(xié)同控制技術(shù)面臨的挑戰(zhàn)及未來發(fā)展趨勢,以期為讀者提供進(jìn)一步的思考與研究.