王 建,盧一相,高清維,余 益
(安徽大學(xué) 電氣與自動(dòng)化學(xué)院,安徽 合肥 230601)
隨著物聯(lián)網(wǎng)范式的廣泛應(yīng)用,網(wǎng)絡(luò)化多智能體控制技術(shù)在許多實(shí)際系統(tǒng)中都扮演著關(guān)鍵的角色,例如智能電網(wǎng)[1]、衛(wèi)星編隊(duì)、自動(dòng)駕駛系統(tǒng)[2]、飛行編隊(duì)[3]、機(jī)械臂[4]和移動(dòng)機(jī)器人[5]等。因此,通過(guò)通信網(wǎng)絡(luò)連接所有個(gè)體或者子系統(tǒng)形成的分布式控制系統(tǒng)(網(wǎng)絡(luò)化多智能體系統(tǒng))成為近年來(lái)的熱門研究領(lǐng)域[6-7]。對(duì)網(wǎng)絡(luò)化多智能體系統(tǒng)的分析,主要是研究網(wǎng)絡(luò)結(jié)構(gòu)和個(gè)體之間的交互對(duì)系統(tǒng)全局目標(biāo)的影響。一般而言,分布式控制器在使用共享局部信息的情況下,將擁有和使用與全局信息同樣的性能,這也是分布式控制廣受關(guān)注的一大原因。文獻(xiàn)[8]針對(duì)具有不確定性和定向通信拓?fù)涞木W(wǎng)絡(luò)拉格朗日系統(tǒng)的協(xié)調(diào)跟蹤控制,提出了一種自適應(yīng)容錯(cuò)協(xié)同控制方案。文獻(xiàn)[9]研究了具有通信延遲的網(wǎng)絡(luò)化多主體系統(tǒng)的平均一致性,并獲得了用于平均一致性的充分條件,得出在有界通信延遲下系統(tǒng)仍存在平均共識(shí)的結(jié)論。文獻(xiàn)[10]提出了設(shè)計(jì)分布控制律的統(tǒng)一框架,而且證明了后向水平動(dòng)態(tài)優(yōu)化方法可以用來(lái)實(shí)現(xiàn)非線性多主體系統(tǒng)的預(yù)測(cè)次優(yōu)共識(shí)。
在分布式系統(tǒng)中,聯(lián)網(wǎng)的多主體之間不可避免地存在通信約束,例如網(wǎng)絡(luò)延遲、數(shù)據(jù)包丟失和數(shù)據(jù)攻擊。顯然,這些通信約束會(huì)降低所設(shè)計(jì)控制器的性能。為了克服這些不利因素,基于網(wǎng)絡(luò)傳輸矢量數(shù)據(jù)流的特性和模型預(yù)測(cè)控制策略,文獻(xiàn)[11]提出了一種網(wǎng)絡(luò)預(yù)測(cè)控制方案。文獻(xiàn)[12-14]將這些網(wǎng)絡(luò)化的多主體預(yù)測(cè)控制方法應(yīng)用于不同類型的多主體系統(tǒng)。對(duì)于具有不變網(wǎng)絡(luò)時(shí)延的同構(gòu)網(wǎng)絡(luò)多主體系統(tǒng),文獻(xiàn)[12]設(shè)計(jì)了一種基于網(wǎng)絡(luò)預(yù)測(cè)控制的分布式協(xié)議。對(duì)于具有網(wǎng)絡(luò)延遲和狀態(tài)不可測(cè)的異構(gòu)網(wǎng)絡(luò)多主體系統(tǒng),文獻(xiàn)[13]提出了使用網(wǎng)絡(luò)預(yù)測(cè)控制方案的分布式控制協(xié)議,這使得共識(shí)的充分必要條件與網(wǎng)絡(luò)延遲無(wú)關(guān)。文獻(xiàn)[14]通過(guò)引入同時(shí)穩(wěn)定性和共識(shí)性的概念,建立了一種主動(dòng)補(bǔ)償網(wǎng)絡(luò)延遲和分組數(shù)據(jù)丟失的預(yù)測(cè)性控制器設(shè)計(jì)方法,實(shí)現(xiàn)了網(wǎng)絡(luò)化多主體控制系統(tǒng)的穩(wěn)定性和共識(shí)性。文獻(xiàn)[15]研究了具有可變網(wǎng)絡(luò)拓?fù)涞耐ㄐ叛舆t多智能體系統(tǒng),并提供了共識(shí)機(jī)制。
文獻(xiàn)[16-17]將智能電網(wǎng)系統(tǒng)建模為網(wǎng)絡(luò)化多智能體系統(tǒng),然后借助一致性理論設(shè)計(jì)分布式控制器,以解決其電壓、頻率同步及功率分配等問(wèn)題。文獻(xiàn)[18]將物聯(lián)網(wǎng)技術(shù)和混成控制理論引入微電網(wǎng)中, 形成了多目標(biāo)控制問(wèn)題,改進(jìn)了混成控制原有的系統(tǒng)層級(jí)模型,并基于電壓控制約束條件實(shí)現(xiàn)了微電網(wǎng)電能質(zhì)量的實(shí)時(shí)控制。不同于主從和對(duì)等控制[19],文獻(xiàn)[20]基于多智能體一致性理論提出了一種分布式無(wú)功功率控制策略,應(yīng)用動(dòng)態(tài)一致性算法對(duì)無(wú)功功率的差值進(jìn)行迭代求和,借助積分控制器對(duì)下垂特性曲線的參考電壓幅值進(jìn)行自適應(yīng)地補(bǔ)償,從而實(shí)現(xiàn)無(wú)功功率的合理分配。
現(xiàn)有的關(guān)于分布式預(yù)測(cè)控制解決通信約束下系統(tǒng)輸出一致性問(wèn)題的文獻(xiàn)中,基本上都是假設(shè)其系統(tǒng)模型為線性的。而在實(shí)際應(yīng)用中,如智能電網(wǎng),由于濾波電路和耦合連接器的存在,系統(tǒng)往往是非線性的。這使得已有的分布式預(yù)測(cè)控制算法并不能很好地適應(yīng)于這些場(chǎng)景,因此,如何設(shè)計(jì)協(xié)調(diào)控制協(xié)議,實(shí)現(xiàn)多智能體之間的協(xié)調(diào),并主動(dòng)補(bǔ)償通信約束,是一個(gè)重要問(wèn)題。本文將針對(duì)具有異質(zhì)通信約束的非線性網(wǎng)絡(luò)化多智能體系統(tǒng),提出一種分布式協(xié)調(diào)預(yù)測(cè)控制算法,實(shí)現(xiàn)多智能體的輸出一致性。在四節(jié)點(diǎn)微電網(wǎng)系統(tǒng)上執(zhí)行了一系列的仿真,用來(lái)驗(yàn)證所提出的控制策略的有效性和魯棒性。
將一個(gè)具有N個(gè)智能體的多智能體系統(tǒng)描述為一個(gè)具有N個(gè)頂點(diǎn)的無(wú)向圖G={V,E,A}。V是圖G的頂點(diǎn)集,滿足V={1,…,N},1,…,N是頂點(diǎn)的序號(hào)。E是圖G的邊集,滿足E?V×V。圖G的一條邊(i,j)∈E表示一對(duì)頂點(diǎn)i和j互為鄰居,鄰居之間可以彼此接收到對(duì)方發(fā)送的信息。頂點(diǎn)i的鄰居集可表示為Ni={j∈V|(i,j)∈E}。圖G的鄰接矩陣表示為A=(aij)N×N,當(dāng)頂點(diǎn)i與頂點(diǎn)j之間存在連接時(shí),aij=1,否則,aij=0。假設(shè)圖G沒(méi)有自環(huán),即(i,i)?E,且令鄰接矩陣A的主對(duì)角元素為aii=0。如果圖G中任意兩個(gè)頂點(diǎn)都互為鄰居,則圖G為完全圖。如果從頂點(diǎn)i到另一個(gè)頂點(diǎn)j有一條路徑,那么頂點(diǎn)i和j是連通的。若圖G中任意一對(duì)頂點(diǎn)都是連通的,則圖G稱為連通圖。對(duì)于非平衡圖,可以定義出度為dout(i)=∑j∈Niaij,入度為din(i)=∑j∈Niaji,當(dāng)出度等于入度時(shí),稱G為平衡圖,否則,為非平衡圖。d=diag{d(i)}定義為平衡圖G的度矩陣,其中d(i)=∑j∈Niaij。相應(yīng)地,圖G的拉普拉斯矩陣L定義為L(zhǎng)=D-A。
考慮以下具有N個(gè)智能體的非線性網(wǎng)絡(luò)化系統(tǒng)[11]:
(1)
其中:xi為系統(tǒng)的狀態(tài)變量;u′i為控制輸入;f′i和g′i為已知的非線性函數(shù);Di為外部干擾。
在非線性多智能體系統(tǒng)中,存在多個(gè)控制器,并且各個(gè)代理控制器之間必須考慮多智能體之間的交互。在單個(gè)智能體系統(tǒng)中,代理控制器單獨(dú)采用控制策略,例如,網(wǎng)絡(luò)預(yù)測(cè)控制[14]?,F(xiàn)在,不僅要考慮動(dòng)態(tài)性能和控制目標(biāo),而且還需考慮智能體通信過(guò)程中的限制。在這種情況下,由于網(wǎng)絡(luò)化多智能體系統(tǒng)中的所有代理都通過(guò)網(wǎng)絡(luò)與多智能體系統(tǒng)進(jìn)行通信,每個(gè)代理控制器基于自身的信息以及與其他代理控制器共享的信息來(lái)解決控制問(wèn)題,以提高整體性能。隨著系統(tǒng)規(guī)模的增加,非線性多智能體系統(tǒng)所捕獲的實(shí)時(shí)數(shù)據(jù)和實(shí)時(shí)計(jì)算的密度和大小都將急劇增加。因此,引出了許多挑戰(zhàn),包括數(shù)據(jù)的捕獲、存儲(chǔ)、可視化、共享、傳輸、搜索和分析,以及計(jì)算任務(wù)的分配和協(xié)調(diào)等。
關(guān)鍵的通信約束是網(wǎng)絡(luò)延遲和數(shù)據(jù)丟失。這些通信約束會(huì)嚴(yán)重影響網(wǎng)絡(luò)化多智能體系統(tǒng)的性能。因此,接下來(lái)將在控制器的設(shè)計(jì)中考慮如何消除這些通信約束對(duì)系統(tǒng)帶來(lái)的不利影響。假設(shè)第i個(gè)代理的網(wǎng)絡(luò)延遲為ρi,數(shù)據(jù)丟包為si,令通信約束τi=ρi+si,i∈{1,2,…,N}。為了解決這些約束,需要開(kāi)發(fā)一種新的網(wǎng)絡(luò)化控制結(jié)構(gòu)。通信網(wǎng)絡(luò)的關(guān)鍵特性之一是每次可以傳輸一個(gè)數(shù)據(jù)包,而不是單個(gè)數(shù)據(jù),這在非網(wǎng)絡(luò)控制系統(tǒng)中是無(wú)法做到的。充分利用這一網(wǎng)絡(luò)特性,為網(wǎng)絡(luò)化多智能體系統(tǒng)引入網(wǎng)絡(luò)化預(yù)測(cè)控制策略,克服網(wǎng)絡(luò)隨機(jī)時(shí)延和數(shù)據(jù)丟失的影響。該策略由控制預(yù)測(cè)發(fā)生器和網(wǎng)絡(luò)約束補(bǔ)償器組成?;趧?dòng)力學(xué)模型和待優(yōu)化的性能函數(shù),預(yù)測(cè)控制器將利用直到時(shí)間t的所有可用信息生成控制預(yù)測(cè)序列,該信息包含從時(shí)間t開(kāi)始向前幾步的控制預(yù)測(cè)。所生成的預(yù)測(cè)控制序列將被打包并通過(guò)網(wǎng)絡(luò)傳輸?shù)奖豢卮矶?。被控代理端的網(wǎng)絡(luò)約束補(bǔ)償器根據(jù)通信約束的類型,從所有可用的控制預(yù)測(cè)序列中選擇時(shí)間t的最新預(yù)測(cè)控制,并將其應(yīng)用于被控智能體的執(zhí)行器。這樣,通信約束,尤其是網(wǎng)絡(luò)延遲和數(shù)據(jù)丟失將被預(yù)測(cè)項(xiàng)主動(dòng)補(bǔ)償,同時(shí)預(yù)測(cè)控制器將提供與沒(méi)有通信約束的網(wǎng)絡(luò)化多智能體系統(tǒng)相同或漸近的控制性能。對(duì)網(wǎng)絡(luò)化多智能體進(jìn)行以下假設(shè)和約定:
(Ⅰ)控制器與第i個(gè)智能體傳感器之間存在通信約束τi。
(Ⅱ)控制器與第i個(gè)智能體執(zhí)行器之間存在的延遲遠(yuǎn)小于網(wǎng)絡(luò)延遲,此通道延時(shí)將被忽略。
(Ⅲ)通信約束τi是系統(tǒng)采樣周期的整數(shù)倍,為已知整數(shù)。
對(duì)于式(1)中表示的非線性多智能體系統(tǒng)的動(dòng)力學(xué),假設(shè)其輸出和輸入之間的直接關(guān)系可以由輸出的二階導(dǎo)數(shù)生成,則非線性系統(tǒng)(1)可以寫成如下二階系統(tǒng)[21]:
(2)
?(?hi/?xi·f′i)/?xi≠0的假設(shè)成立。
(3)
其中:
為得到離散化系統(tǒng),對(duì)系統(tǒng)(3)施加歐拉離散化,有:
(4)
為了設(shè)計(jì)分布式控制器的預(yù)測(cè)項(xiàng),對(duì)于第i個(gè)代理考慮如下成本函數(shù)Ji(t):
(5)
其中:Ny,Nu分別為輸出預(yù)測(cè)窗口和輸入預(yù)測(cè)窗口的大??;bi和ci分別為協(xié)同和控制成本增益;gi為牽制增益;
系統(tǒng)的狀態(tài)量可測(cè),但是在實(shí)際系統(tǒng)中,高頻振蕩及測(cè)量誤差噪聲的存在,往往使得傳感器的測(cè)量值并不準(zhǔn)確。因此,對(duì)于分布式發(fā)電單元i的各狀態(tài)變量值,將采用如下?tīng)顟B(tài)觀測(cè)器的估計(jì)值:
(6)
接下來(lái),將第i個(gè)分布式單元的狀態(tài)預(yù)測(cè)分為以下3個(gè)階段:
(Ⅰ)狀態(tài)預(yù)測(cè),從t-τi+2到t:
循環(huán)代入式(6),有:
其中:k=2,…,τi。
(Ⅱ)狀態(tài)預(yù)測(cè),從t+1到t+Nu:
(7)
其中:k=1,…,Nu。
(Ⅲ)狀態(tài)預(yù)測(cè),從t+Nu+1到t+Ny:
其中:k=1,…,Nu+2,…,Ny,…,Ny+τj。
因此,根據(jù)式(6)和式(7)可以得到如下預(yù)測(cè)輸出方程:
(8)
即
將輸出方程(8)代入上式,有:
整理有:
因此,網(wǎng)絡(luò)預(yù)測(cè)發(fā)生器的輸出為:
(9)
其中:
以上完成了網(wǎng)絡(luò)預(yù)測(cè)發(fā)生器部分的設(shè)計(jì),接下來(lái)網(wǎng)絡(luò)約束補(bǔ)償器將發(fā)揮作用,將在預(yù)測(cè)序列中選擇合適的預(yù)測(cè)量用于實(shí)際系統(tǒng)中。在分布式單元i的控制側(cè),執(zhí)行器中的網(wǎng)絡(luò)約束補(bǔ)償器會(huì)根據(jù)當(dāng)前的時(shí)延情況選擇需要的控制輸入?;谑?9),t時(shí)刻網(wǎng)絡(luò)約束補(bǔ)償器輸出的最優(yōu)預(yù)測(cè)控制計(jì)算如下:
其中:Hv,i是第i個(gè)元素為1,其余均為0的N維數(shù)列向量。
為驗(yàn)證網(wǎng)絡(luò)化分布式預(yù)測(cè)控制算法的有效性,將其應(yīng)用于一個(gè)具有4個(gè)分布式發(fā)電單元的交流微電網(wǎng)系統(tǒng)的電壓恢復(fù)問(wèn)題。其大信號(hào)模型如下:
其中:xi(t)=[PiQiiLdiiLqivodivoqiiodiioqi]T;Di=[vbdivbqi]T;fi,ki,gi的具體形式見(jiàn)文獻(xiàn)[22]。
通過(guò)MATLAB/Simulink仿真軟件搭建微電網(wǎng)仿真模型,其中,濾波電路參數(shù)、下垂系數(shù)和耦合連接器的參數(shù)均參見(jiàn)文獻(xiàn)[21]??紤]有向拓?fù)?,其中拓?fù)渚仃嚍閍12=1,a23=1,a34=1,a41=1,其余元素為0,且分布式發(fā)電單元之間的時(shí)延為τ1=2,τ2=3,τ3=2,τ4=4。控制器各系數(shù)為Ny=14,Nu=12,對(duì)于i=1,…,4,選擇觀測(cè)器參數(shù)為L(zhǎng)i=[0.3,-2.5], 選擇bi=5,ci=0.2,且g1=0.3,其他元素的牽制增益為g=0。接下來(lái)所有仿真中出現(xiàn)的變量值都采用標(biāo)幺值。特別值得注意的是,仿真圖中的DG表示分布式發(fā)電單元,給定值表示設(shè)定的參考輸入。為驗(yàn)證本文所提出的控制策略在微電網(wǎng)電壓恢復(fù)方面的有效性,設(shè)計(jì)了不同工況,對(duì)所提出的控制策略的性能進(jìn)行分析。一種是使用含有和不含協(xié)調(diào)項(xiàng)的分布式預(yù)測(cè)控制器進(jìn)行電壓控調(diào)節(jié)。不具有協(xié)調(diào)項(xiàng)控制器作用下的微電網(wǎng)電壓輸出幅值如圖1所示,含有協(xié)調(diào)項(xiàng)的電壓輸出幅值如圖2所示。另一種是使用含有協(xié)調(diào)項(xiàng)的分布式預(yù)測(cè)控制器在不同權(quán)重因子下進(jìn)行電壓調(diào)節(jié),其不同的電壓輸出幅值見(jiàn)圖3。
圖1 控制器中無(wú)協(xié)同控制項(xiàng)的電壓輸出幅值
圖2 控制器中含協(xié)同控制項(xiàng)的電壓輸出幅值
圖3 不同協(xié)調(diào)增益和跟蹤增益的電壓輸出幅值
由圖1可知:由于控制器中沒(méi)有引入?yún)f(xié)調(diào)項(xiàng),只有牽制節(jié)點(diǎn),第1個(gè)發(fā)電單元可以完成給定電壓值的跟蹤,而其他發(fā)電單元?jiǎng)t不能完成跟蹤任務(wù)。圖2則顯示了施加協(xié)調(diào)項(xiàng)結(jié)果,從圖2中可以看出:分布式預(yù)測(cè)控制器可以很好地實(shí)現(xiàn)微電網(wǎng)輸出電壓幅值的跟蹤,而且系統(tǒng)能夠很快地恢復(fù)到期望值。綜合比較圖1和圖2可以得出結(jié)論:在牽制控制的框架下,網(wǎng)絡(luò)中的發(fā)電單元必須直接或間接地獲得參考值,否則將無(wú)法完成跟蹤;對(duì)于并非所有發(fā)電單元均可獲得參考值的情況,預(yù)測(cè)控制器中的協(xié)調(diào)項(xiàng)是不可或缺的。圖3為不同協(xié)調(diào)增益和跟蹤增益的輸出電壓幅值圖,其中增益取bi=9,ci=0.2,且g1=0.2。從圖3中可以看出:控制器可以很好地實(shí)現(xiàn)微電網(wǎng)輸出電壓的跟蹤,從而恢復(fù)到期望值。為進(jìn)一步說(shuō)明協(xié)調(diào)增益、跟蹤增益和控制增益對(duì)控制性能的影響,給出了4組不同控制增益下的控制成本、跟蹤成本和總成本,如表1所示。從表1中可以看出:控制器增益的選取會(huì)影響閉環(huán)系統(tǒng)的性能,具體而言,隨著協(xié)調(diào)增益與控制增益比值的增大,跟蹤效果會(huì)更好。
表1 不同控制增益下的控制成本、跟蹤成本及總成本
本文提出了一種針對(duì)網(wǎng)絡(luò)化非線性多智能體系統(tǒng)的分布式預(yù)測(cè)控制方法,利用分布式預(yù)測(cè)控制策略解決了一類可輸入、輸出線性化的非線性多智能體系統(tǒng)在遭受通信約束時(shí)的輸出一致性問(wèn)題。該方法能夠同時(shí)實(shí)現(xiàn)一致性和穩(wěn)定性,并能主動(dòng)補(bǔ)償系統(tǒng)所遇到的異質(zhì)通信約束,如時(shí)延和數(shù)據(jù)丟包。介紹了分布式預(yù)測(cè)控制的體系結(jié)構(gòu),給出了非線性系統(tǒng)的分布式預(yù)測(cè)控制器的設(shè)計(jì)過(guò)程,并在微電網(wǎng)系統(tǒng)的電壓恢復(fù)問(wèn)題上對(duì)所提出的控制器進(jìn)行了仿真驗(yàn)證。微電網(wǎng)系統(tǒng)上的仿真驗(yàn)證了所提出的針對(duì)非線性多智能體系統(tǒng)的分布式預(yù)測(cè)控制策略的有效性、實(shí)用性及穩(wěn)定性。值得一提的是,在現(xiàn)實(shí)生產(chǎn)過(guò)程中,部分高維的非線性系統(tǒng)并不滿足輸入輸出線性化所需的對(duì)合條件。因此,對(duì)于這樣的高維非線性多智能體系統(tǒng),如何設(shè)計(jì)網(wǎng)絡(luò)化預(yù)測(cè)控制器以解決其狀態(tài)、輸出一致性等問(wèn)題將是未來(lái)值得研究的方向。