韓 笑,亓慶源,紀(jì)志堅(jiān)
(青島大學(xué)自動(dòng)化學(xué)院,山東 青島 266071)
網(wǎng)絡(luò)控制系統(tǒng)(NCSs)是空間分布式系統(tǒng),其中傳感器、控制器和執(zhí)行器通過(guò)共享的網(wǎng)絡(luò)實(shí)現(xiàn)通信[1-2]。因?yàn)镹CSs具有成本低、重量輕、結(jié)構(gòu)簡(jiǎn)單和提高系統(tǒng)可靠性的優(yōu)點(diǎn),所以被廣泛應(yīng)用于遠(yuǎn)程手術(shù),無(wú)人機(jī),人工智能等領(lǐng)域[3-5]。然而,在網(wǎng)絡(luò)控制系統(tǒng)信息傳遞過(guò)程中,網(wǎng)絡(luò)通信帶寬有限、網(wǎng)絡(luò)擁塞和網(wǎng)絡(luò)連接中斷等現(xiàn)象都會(huì)導(dǎo)致系統(tǒng)產(chǎn)生數(shù)據(jù)包丟失的問(wèn)題[6]。由于丟包的存在,系統(tǒng)的狀態(tài)信息不能精確得到,只能依賴(lài)接收到的量測(cè)信息來(lái)對(duì)系統(tǒng)進(jìn)行分析,使得系統(tǒng)的估計(jì)狀態(tài)有效的跟蹤實(shí)際狀態(tài),具有重要的實(shí)際意義[7]。對(duì)于具有數(shù)據(jù)包丟失的NCSs,經(jīng)典的卡爾曼濾波失去了有效性,不能直接用來(lái)設(shè)計(jì)估計(jì)器[8-9]。因此,估計(jì)器可以通過(guò)量測(cè)過(guò)程zk推導(dǎo)出來(lái)。
近幾十年來(lái),對(duì)具有數(shù)據(jù)包丟失的網(wǎng)絡(luò)控制系統(tǒng)進(jìn)行研究已經(jīng)成為一個(gè)熱門(mén)的話(huà)題。Nahi考慮了具有數(shù)據(jù)包丟失的網(wǎng)絡(luò)控制系統(tǒng)的估計(jì)器,并得到了線(xiàn)性最小均方差估計(jì)器(LMMSE)[10]。然而,在文獻(xiàn)[11]中LMMSE是次優(yōu)的。文獻(xiàn)[12]利用時(shí)間戳技術(shù),在隨機(jī)過(guò)程γk的條件下推導(dǎo)出了間歇卡爾曼濾波器。Imer提出了具有不可靠通信信道的線(xiàn)性時(shí)不變系統(tǒng)的最優(yōu)控制[13]。對(duì)于UDP網(wǎng)絡(luò)的最優(yōu)控制,雖然控制具有雙重效應(yīng),但它們給出了一個(gè)最優(yōu)估計(jì)器。然而,估計(jì)器是否是最優(yōu)的并沒(méi)有得到證明。Qi考慮了具有數(shù)據(jù)包丟失的網(wǎng)絡(luò)控制系統(tǒng)的最優(yōu)測(cè)量反饋控制和鎮(zhèn)定性[14]。Zhang等提出了一種次優(yōu)估計(jì)量[15],它可以看作是LMMSE與間歇卡爾曼估計(jì)器的折中。
本文在之前工作的基礎(chǔ)上擴(kuò)展了有關(guān)的內(nèi)容,給出了UDP情況下的最優(yōu)估計(jì)器,得到的結(jié)果可以在將來(lái)解決相關(guān)的最優(yōu)輸出反饋控制問(wèn)題。本文通過(guò)嚴(yán)格的計(jì)算,運(yùn)用遞推的方法得到兩種不同情形下系統(tǒng)的最優(yōu)估計(jì)(基于條件期望)和協(xié)方差矩陣。但是,在大的有限域下,這種方法變得困難。所以為了簡(jiǎn)單的使用,本文開(kāi)發(fā)了一個(gè)次優(yōu)估計(jì)器,這對(duì)研究在大的有限域下含有丟包的網(wǎng)絡(luò)控制系統(tǒng)有所幫助。
主要符號(hào)說(shuō)明:Rn表示n維Euclidean空間;AT意味著矩陣A的轉(zhuǎn)置;E[·]是數(shù)學(xué)期望;E[·|Zk]是對(duì)Zk的條件期望;δkl表示Kronecker Delta函數(shù),當(dāng)k=l時(shí),δkl=1;否則δkl=0;P(A)是事件A發(fā)生的概率,P(A|B)描述條件概率;I{A}是指示函數(shù),表示當(dāng)元素ω∈A時(shí),I{A}=1,否則I{A}=0;N(μ,Σ)表示具有均值為μ,協(xié)方差為Σ的正態(tài)分布。
卡爾曼濾波(Kalman filtering)是一種利用線(xiàn)性系統(tǒng)狀態(tài)方程,通過(guò)系統(tǒng)輸入輸出觀測(cè)數(shù)據(jù),對(duì)系統(tǒng)狀態(tài)進(jìn)行最優(yōu)估計(jì)的算法。由于觀測(cè)數(shù)據(jù)中包括系統(tǒng)中的噪聲和干擾的影響,所以最優(yōu)估計(jì)也可看作是濾波過(guò)程。
考慮以下經(jīng)典的動(dòng)態(tài)系統(tǒng):
(1)
假設(shè)1在整個(gè)論文中,做出如下假設(shè):
1)假設(shè)ek和vk是獨(dú)立的,均值為0的高斯白過(guò)程。
(2)
2)進(jìn)一步假設(shè)初始狀態(tài)x0是一個(gè)具有均值為μ和協(xié)方差為E[(x0-μ)(x0-μ)T]=P0的高斯隨機(jī)變量,它與{ek}和{vk}相互獨(dú)立。
確定估計(jì)器和相關(guān)的誤差協(xié)方差矩陣:
(3)
(4)
(5)
引理1[23]考慮經(jīng)典的動(dòng)態(tài)系統(tǒng):
(6)
(7)
(8)
(9)
(10)
網(wǎng)絡(luò)控制系統(tǒng)的通信通道通常使用以下兩種協(xié)議之一:傳輸控制協(xié)議(TCP)或用戶(hù)數(shù)據(jù)報(bào)協(xié)議(UDP)。兩者的區(qū)別之一是數(shù)據(jù)在網(wǎng)絡(luò)控制系統(tǒng)中傳輸時(shí),是否發(fā)生丟包的行為是可知還是未知的。若是可知的,稱(chēng)之為T(mén)CP情形下的網(wǎng)絡(luò)控制系統(tǒng),反之,則稱(chēng)之為UDP情形下的網(wǎng)絡(luò)控制系統(tǒng)。
為了基于量測(cè)過(guò)程{z0,z1,…,zk}來(lái)估計(jì)系統(tǒng)狀態(tài)xk,在給出最優(yōu)估計(jì)器之前,首先介紹如下的引理。
引理2[24]假設(shè)X,Y為任意聯(lián)合分布的隨機(jī)變量,則當(dāng)隨機(jī)變量Y取值為y時(shí),對(duì)隨機(jī)變量X的最小均方差估計(jì)可以如式(11)計(jì)算:
(11)
假設(shè)γk在每一個(gè)k時(shí)刻都能夠直接觀測(cè)到,隨機(jī)過(guò)程γk與量測(cè)數(shù)據(jù)zk在估計(jì)器設(shè)計(jì)中都是可知的??紤]動(dòng)態(tài)系統(tǒng):
(12)
其中,xk∈Rn是狀態(tài)過(guò)程,zk∈Rn是量測(cè)信息,A∈Rn×n,H∈Rn×n是給定的確定性矩陣,γk∈{0,1}描述了數(shù)據(jù)從執(zhí)行器傳輸?shù)娇刂破鞯膩G包過(guò)程。
假設(shè)2γk是獨(dú)立同分布(i.i.d)的Bernoulli隨機(jī)變量,其中P(γk=1)=p,P(γk=0)=q=1-p。
確定估計(jì)器和相關(guān)的誤差協(xié)方差矩陣:
(13)
(14)
(15)
其中,Zk表示集合{z0,z1,…,zk}。
定理1在假設(shè)1與假設(shè)2的條件下,對(duì)于給定的動(dòng)態(tài)系統(tǒng)(12),最優(yōu)估計(jì)可計(jì)算為:
(16)
(17)
Σk/k=I{zk=0}Σk/k-1+I{zk≠0}[Σk/k-1-KkHΣk/k-1]
(18)
Σk+1/k=AΣk/kAT+R
(19)
最優(yōu)估計(jì)器與文獻(xiàn)[12]中所得的結(jié)果一致。
其中,γk是獨(dú)立同分布的伯努利隨機(jī)變量,概率為P(γk=1)=p。
證明:
(20)
fx0|z0(x|z)是條件概率密度函數(shù)。
(21)
其中,fx0,z0是(x0,z0)的聯(lián)合密度函數(shù),fz0(z)是z0的概率密度函數(shù)。
1)當(dāng)z0=0時(shí),x0,z0相互獨(dú)立,f(x0,z0)=f(x0)f(z0)。
(22)
(23)
2)當(dāng)z0≠0時(shí),
x0/0=E[x0|z0=Hx0+υ0]
(24)
(25)
因此,在這種情況下,x0是條件為z0的高斯隨機(jī)向量,可以得到以下式子
(26)
Σ0/0=P0-P0HT(HP0HT+Q)-1HP0
(27)
定義K0=P0HT(HP0HT+Q)-1,因此,
(28)
(29)
由于系統(tǒng)噪聲{ek}和{γk}是相互獨(dú)立的,由公式(12)可得
(30)
(31)
由于z1是以z0為條件的,所以
(32)
(33)
應(yīng)用于基本的結(jié)果,可以得到在z0和z1條件下x1的均值為
(34)
協(xié)方差為
Σ1/1=Σ1/0-Σ1/0HT(HΣ1/0HT+Q)-1HΣ1/0
(35)
因此,
(36)
(37)
(38)
(39)
(40)
Σk/k=I{zk=0}Σk/k-1+I{zk≠0}[Σk/k-1-KkHΣk/k-1]
(41)
(42)
證畢。
本節(jié)中考慮隨機(jī)過(guò)程γk不能直接被觀測(cè)到的情形,其中僅知道γk的概率分布。
系統(tǒng)的動(dòng)態(tài)方程為
(43)
其中,xk∈Rn是狀態(tài)過(guò)程,zk∈Rn是量測(cè)信息,A∈Rn×n,H∈Rn×n是給定的確定性矩陣。
假設(shè)3{γk}是獨(dú)立同分布(i.i.d)的Bernoulli隨機(jī)變量,其中,P(γk=1)=p,P(γk=0)=q=1-p。另外,γk不能在系統(tǒng)中觀測(cè)到。
定理2在假設(shè)1和假設(shè)3的情況下,系統(tǒng)(43)的最優(yōu)濾波可以通過(guò)迭代的方法推得
(44)
(45)
(46)
(47)
(48)
Σk+1/k=AΣk/kAT+R
(49)
證明:
(50)
其中,fx0|z0(x|z)是條件概率密度函數(shù),
(51)
fx0,z0是(x0,z0)的聯(lián)合密度函數(shù),fz0(z)是z0的概率密度函數(shù)。
1)當(dāng)γ0=0時(shí),
fz0(y)=fυ0(y),fx0,z0(x,y)=fx0(x)fυ0(y)
2)當(dāng)γ0≠0時(shí),
其中,
(52)
(53)
Fx0,Hx0+υ0(x,y)=P(x0≤x,Hx0+υ0≤y)
Fx0,υ0(x,y)=P(x0≤x,υ0≤y)
(54)
(55)
進(jìn)而得到,
(56)
(57)
由于x1=Ax0+e0,所以
(58)
(59)
則最優(yōu)估計(jì)
(60)
定義fx1,z0,z1(x,y,z)=Δ1,fz0,z1(y,z)=Δ2,
(61)
Δ2=p2fHx0+υ0,Hx1+υ1(y,z)+p(1-p)fυ0,Hx1+υ1(y,z)+p(1-p)fHx0+υ0,υ1(y,z)+(1-p)2fυ0,υ1(y,z)
(62)
(63)
(64)
(65)
以此類(lèi)推,可以得到:
(66)
(67)
(68)
(69)
Σk+1/k=AΣk/kAT+R
(70)
證畢。
由于求得的最優(yōu)濾波太復(fù)雜,難以實(shí)際應(yīng)用,因此,為了更簡(jiǎn)單的使用,需要給出一個(gè)次優(yōu)近似估計(jì)器。這種情況考慮的基本模型中沒(méi)有量測(cè)噪聲,不包括任何量測(cè)噪聲的理由是假設(shè)傳感器和控制器之間的通信發(fā)生在網(wǎng)絡(luò)層,其中發(fā)送的數(shù)據(jù)包是接收或丟失的。或者,也可以認(rèn)為傳感器和控制器通過(guò)具有無(wú)限容量的二進(jìn)制擦除信道連接,即沒(méi)有狀態(tài)的量化或編碼。
(71)
定理3對(duì)于系統(tǒng)(70),基于量測(cè)過(guò)程{z0,…,zk}的次優(yōu)估計(jì)器可以表示為
(72)
(73)
證明:具體證明過(guò)程參考文獻(xiàn)[14]。
在本節(jié)中,將進(jìn)行數(shù)值仿真模擬來(lái)進(jìn)一步說(shuō)明理論結(jié)果。一方面,通過(guò)圖1展示在網(wǎng)絡(luò)控制系統(tǒng)中經(jīng)典卡爾曼濾波的最優(yōu)性。另一方面,對(duì)于具有數(shù)據(jù)包丟失的網(wǎng)絡(luò)控制系統(tǒng),本文給出定理1最優(yōu)估計(jì)與定理3次優(yōu)估計(jì)的仿真實(shí)例,并且分別與線(xiàn)性最小均方差誤差估計(jì)(LMMSE)進(jìn)行比較。
假設(shè)經(jīng)典動(dòng)態(tài)系統(tǒng)(1)的參數(shù):A=1,H=0.2,ek~N(0,1),vk~N(0,1),時(shí)域N=200。由圖1可以看出,對(duì)于經(jīng)典的動(dòng)態(tài)系統(tǒng),系統(tǒng)觀測(cè)值與真實(shí)值的誤差比較大,而卡爾曼濾波的結(jié)果與系統(tǒng)真實(shí)值的誤差較小,能有效跟蹤系統(tǒng)的狀態(tài)。
由于在具有數(shù)據(jù)包丟失的NCSs當(dāng)中,經(jīng)典的卡爾曼濾波失去有效性,因此,本文通過(guò)量測(cè)過(guò)程推導(dǎo)出系統(tǒng)的最優(yōu)估計(jì)器。首先對(duì)于隨機(jī)過(guò)程γk能直接被觀測(cè)到的情形,針對(duì)定理1,假設(shè)線(xiàn)性離散隨機(jī)系統(tǒng)(12)的參數(shù):A=1.01,H=1,ek~N(0,1),vk~N(0,1),μ=0,P0=1,p=0.4,時(shí)域N=100。
從圖2可以明顯看出本文得出的最優(yōu)估計(jì)器與系統(tǒng)真實(shí)值之間誤差較小,而LMMSE與系統(tǒng)的真實(shí)狀態(tài)誤差較大,因此驗(yàn)證了本文定理1的有效性。
圖1 系統(tǒng)的真實(shí)狀態(tài),觀測(cè)值與卡爾曼濾波之間的比較
圖2 系統(tǒng)的真實(shí)狀態(tài),最優(yōu)估計(jì)與LMMSE之間的比較
圖3 系統(tǒng)的真實(shí)狀態(tài),次優(yōu)估計(jì)與LMMSE之間的比較
對(duì)于隨機(jī)過(guò)程γk不能直接被觀測(cè)到的情形,由于求得的最優(yōu)濾波太復(fù)雜,不能實(shí)際應(yīng)用,所以本文只考慮次優(yōu)估計(jì)器的數(shù)值算例。因此,針對(duì)定理3,假設(shè)系統(tǒng)(71)的參數(shù)為:A=1.02,H=0.8,ek~N(0,1),μ=0,P0=1,p=0.4,時(shí)域N=100。
從圖3中可以明顯看出本文給出的次優(yōu)估計(jì)器與系統(tǒng)的真實(shí)值的誤差比較小,而LMMSE與系統(tǒng)的真實(shí)值誤差比較大,由此證明本文提出的方法是可靠的。
本文對(duì)具有丟包的網(wǎng)絡(luò)控制系統(tǒng)的估計(jì)問(wèn)題進(jìn)行了研究,當(dāng)量測(cè)方程帶有噪聲時(shí),由于經(jīng)典的卡爾曼濾波失效,針對(duì)不同的情形采用遞推的方法求出了系統(tǒng)的最優(yōu)估計(jì)(條件期望)和協(xié)方差矩陣。同時(shí),為進(jìn)一步研究大的有限域下的網(wǎng)絡(luò)控系統(tǒng)的問(wèn)題,開(kāi)發(fā)了一個(gè)次優(yōu)估計(jì)器,具有實(shí)際應(yīng)用價(jià)值。最后,通過(guò)數(shù)值模擬驗(yàn)證了文中提出的估計(jì)器能有效跟蹤系統(tǒng)的狀態(tài),并且比LMMSE的性能更好,本文提出的方法是可行的。因此,研究具有數(shù)據(jù)包丟失的網(wǎng)絡(luò)控制系統(tǒng)的估計(jì)問(wèn)題具有重要的理論和現(xiàn)實(shí)意義。