王 平,趙 敏
(上海理工大學 光電信息與計算機工程學院,上海 200093)
模型預測控制因其適用于處理約束和多變量問題而備受工業(yè)界青睞,是一種重要的控制技術(shù)[1-2]。文獻[3]針對多面體描述的線性時變系統(tǒng)和線性時不變系統(tǒng),提出了基于顯式模型的魯棒約束預測控制算法。文獻[4]將這種思想應用于線性變參數(shù)系統(tǒng),在假設(shè)系統(tǒng)狀態(tài)精確可測的前提下,采用了一種基于擬最小最大算法的狀態(tài)反饋預測控制方案。然而預測控制是基于模型的控制策略,精確的系統(tǒng)模型起著重要的作用,模型的不確定性在實際系統(tǒng)中是不可避免的,因此基于不確定模型魯棒控制器的設(shè)計已成為一個重要的研究方向[5]。
為解決這一問題,文獻[6~8]針對帶有輸入約束的LPV(Linear Parameter Variable)系統(tǒng),采用了一種基于輸出反饋的MPC(Model Predictive Control)方法。該MPC方法在線設(shè)計魯棒狀態(tài)觀測器,基于狀態(tài)觀測器在線獲得系統(tǒng)每一時刻狀態(tài)的估計值,通過設(shè)計魯棒輸出反饋控制器得到最優(yōu)控制律,保證了受輸入約束系統(tǒng)的魯棒穩(wěn)定性。文獻[9~12]采用一種基于擬最小最大算法的輸出反饋魯棒預測控制策略,基于線性矩陣不等式設(shè)計離線魯棒狀態(tài)觀測器,利用魯棒狀態(tài)觀測器觀測系統(tǒng)狀態(tài),進而在線通過魯棒輸出反饋預測控制算法,得到最優(yōu)控制律。雖然該算法考慮了LPV系統(tǒng)的不確定因素,但是難以保證受擾動系統(tǒng)的漸近穩(wěn)定性。因此,本文將給出一種新的輸出反饋預測控制方法來解決這一問題。
針對一類帶有有界狀態(tài)干擾的多胞描述LPV系統(tǒng),本文以保證系統(tǒng)的漸近穩(wěn)定性為目標,提出一種魯棒預測控制改進方法,并設(shè)計了輸出反饋控制器。該控制器考慮了無擾動LPV模型,基于線性矩陣不等式求解最小最大魯棒輸出反饋控制律;隨后,獲得保證擾動LPV系統(tǒng)魯棒漸近穩(wěn)定的最優(yōu)偏移量,與無擾動系統(tǒng)反饋控制律組合得到最優(yōu)控制律,并施加于實際系統(tǒng);最后,證明了擾動LPV系統(tǒng)的漸近穩(wěn)定性。
考慮以下不確定LPV系統(tǒng)
xc(k+1)=A(ρ(k))xc(k)+B(ρ(k))uc(k)+w(k)
yc(k)=C(ρ(k))xc(k)
(1)
式中,uc(k)∈Rnu、xc(k)∈Rnx、yc(k)∈Rny分別為系統(tǒng)的控制輸入、不可測狀態(tài)以及可測輸出;w(k)?W為有界干擾,且W?Rnx;A(ρ(k))、B(ρ(k))、C(ρ(k))屬于多面體矩陣集合
[A(ρ(k))|B(ρ(k))|C(ρ(k))]∈Ω
(2)
其中
Ω=Co{[A1|B1|C1],[A2|B2|C2],…,[Al|Bl|Cl]}
(3)
式中,Co為凸包;{[A1|B1|C1],[A2|B2|C2],…,[Al|Bl|Cl]},j∈{1,2,…,l}為多面體Ω的頂點;l為多面體頂點的個數(shù)。
假設(shè)1ρ(k)在k時刻可測量,即[A(ρ(k)),B(ρ(k)),C(ρ(k))]在k時刻已知。
假設(shè)2(A(ρk)),B(ρ(k)))以及(C(ρ(k)),A(ρ(k))),對于所有k≥0為完全可控可觀。
本文針對如式(1)所示的帶有有界狀態(tài)干擾的不確定LPV系統(tǒng),設(shè)計輸出反饋魯棒預測控制器,得到最優(yōu)控制律,并施加于該系統(tǒng),保證了擾動LPV系統(tǒng)的魯棒漸近穩(wěn)定性。
考慮無擾動LPV系統(tǒng)模型如式(4)所示。
(4)
為求取控制律使如式(4)所示的系統(tǒng)漸近穩(wěn)定,首先提出一種魯棒狀態(tài)觀測器的離線設(shè)計方法;進而構(gòu)造具有LMI(Linear Matrix Inequality)約束的在線優(yōu)化MPC問題;最后通過求解該優(yōu)化問題得到最小最大魯棒輸出反饋控制律。
由于如式(4)所示的系統(tǒng)狀態(tài)不可測,故采取如下所示的狀態(tài)觀測器[13]
x0(k+1)=A(ρ(k))x0(k)+B(ρ(k))u(k)+
Lpy(k)-C(ρ(k))x0(k))
(5)
式中,x0(k)、u(k)、y(k)分別為估計狀態(tài)、控制輸入以及可測輸出。為確定觀測器增益Lp,定義該系統(tǒng)的估計誤差e(k)=x(k)-x0(k),則下一時刻
e(k+1)=(A(ρ(k))-LpC(ρ(k)))e(k)
(6)
定義一個二次函數(shù)
(7)
且滿足二次穩(wěn)定性條件
E(e(k+1))-μE(e(k))≤0
(8)
式中,μ(0<μ<1)是預先指定的衰減率,可保證當k→∞時,e(k)→0。將式(6)和(7)代入(8)中,且左右分別乘以對角矩陣{I,Pe},令Ye=LpPe,可得
(9)
通過求解以下優(yōu)化問題可得Lp。
(10)
為保證式(4)的漸近穩(wěn)定性,引入以下預測模型[14]
g(k+1+i|k)=A(ρ(k+i))g(k+i|k)+
B(ρ(k+i))u(k+i|k)
(11)
g(k+1|k)=x0(k+1)
式中,i≥1;g(k+i|k),u(k+i|k)分別為式(4)在k時刻預測k+i時刻的系統(tǒng)狀態(tài)以及控制輸入。令g(k|k)=x0(k),u(k)=u(k|k),未來控制律描述為
u(k+i|k)=F(k)g(k+i|k)
(12)
式中,F(xiàn)(k)為k時刻確定的反饋增益。
針對式(4)在每個時刻求解如下最小最大優(yōu)化問題
(13)
式中
(14)
同時二次函數(shù)V(g(k+i|k))滿足以下約束條件[15]
(15)
由魯棒穩(wěn)定性可得g(∞|k)=0,即V(g(∞|k))=0,將式(15)左右兩端從i=1到∞分別相加可得
(16)
式中
V(g(k+1|k))=g(k+1|k)TP(k)g(k+1|k)
(17)
對系統(tǒng)性能附加約束
(18)
其中γ(k)是待最小化的非負變量。
基于式(15)、式(18),可將所提出的最小最大優(yōu)化問題修改為
(19)
為保證式(19)的魯棒穩(wěn)定性,附加如下所示的穩(wěn)定性條件。
γ(k)<γ(k-1)
(20)
在滿足式(15)、(20),式(18)的條件下,解決式(19)可得控制律u(k)及反饋增益F(k),因此,設(shè)計上述魯棒控制器的問題可轉(zhuǎn)化為一個帶有LMI約束的優(yōu)化問題,如下定理所示。
(21)
s.t.式(4)、式(5)、式(13)
(22)
(23)
γ(k)-γ(k-1)<0
(24)
式中
(25)
若對于給定的x0(k)和y(k)存在u(k|k)、Y(k)、Q(k),則反饋增益F(k)可由F(k)=Y(k)Q(k)-1計算得到。
證明將式(18)中P(k)替換為γ(k)Q(k)-1可得
1-Ψ(k)-T(k)TQ(k)-1T(k)>0
(26)
式中
(27)
通過應用Schur補定理,可得
(28)
式中
(29)
同理對式(28)應用Schur補定理,由此可得式(22),因此式(18)可由式(22)保證。
令u(k+i|k)=F(k)g(k+i|k) (i≥1),將式(12)代入式(15),可得
ζ(k)-ξ(k+i)TP(k)ξ(k+i)>0
(30)
其中
(31)
式(30)兩邊分別乘以γ(k)P(k)-1,令P(k)=γ(k)Q(k)-1且應用Schur補定理可得到
(32)
式中
(33)
令Y(k)=F(k)Q(k)后應用Schur補定理可得
(34)
式中
R(k)=A(ρ(k+i))Q(k)+B(ρ(k+i))Y(k)
(35)
將不等式(34)映射于式(36)中
[A(ρ(k+i))|B(ρ(k+i))|C(ρ(k+i))]∈Ω
(36)
若存在Q(k)和Y(k)使式(34)成立,則可證得式(23)成立,因此式(15)可由式(23)保證,此時證畢。
定理2(遞歸可行性) 對于式(21),若k時刻能確定一個遞歸可行解,則在所有t>k時刻,式(21)都是有解的。
證明若證明k時刻得到的優(yōu)化問題的解是k+1時刻的可行解。設(shè)
(37)
基于式(5)、式(11)、式(24)及式(37),則式(22)和式(24)可被改寫為
(38)
式中
(39)
由于式(23)在k時刻被滿足,所以式(38)成立,因此若能在k時刻確定一個可行解,則式(21)在k+1時刻可行;證畢。
定理3(漸近穩(wěn)定性) 式(21)的可行解保證系統(tǒng)的漸近穩(wěn)定性,即當k→∞時,x(k)→0。
證明若式(21)對于所有步驟可行,基于式(15)的式(24)保證g(k+1|k)收斂到0,此外從狀態(tài)觀測器的設(shè)計中可保證當k→∞時,e(k)→0,即估計狀態(tài)x0(k)收斂于式(4)真實狀態(tài)x(k),因此式(21)的可行解保證系統(tǒng)的漸近穩(wěn)定性,即k→∞時,x(k)→0,此時證畢。
綜上所述,本文針對無擾動系統(tǒng)模型提出的在線優(yōu)化MPC問題描述如下
(40)
通過求解式(40)可獲得基于輸出反饋的魯棒預測控制律u(k+i|k),保證無擾動LPV系統(tǒng)的漸近穩(wěn)定性,下面則考慮在有界狀態(tài)干擾的情況下,如何求取最優(yōu)控制律。
考慮擾動LPV系統(tǒng),由于式(1)狀態(tài)xc(k)不可測,采取如下所示的狀態(tài)觀測器
xc0k+1)=Aρk))xc0k)+Bρk))uk)+
Lpyk)-Cρk))xc0k))
(41)
uck)=uk)+Kxc0k)-x0k))
(42)
由式(42)可得,xc0(k)與x0(k)的差值可分別基于式(41)、式(5)得到,u(k)可通過求解式(40)得到,而反饋增益K未確定,故下面通過狀態(tài)反饋確定反饋增益K,根據(jù)式(5)、式(41)定義z(k)=xc0(k)-x0(k)為控制誤差,則下一時刻控制誤差
(43)
式中,ec(k)、e(k)分別為式(1)、式(4)的估計誤差,基于上述離線狀態(tài)觀測器的設(shè)計可得,當k→∞時,ec(k) →0,e(k) →0。因此為使式(43)穩(wěn)定,(A(ρ(k))+B(ρ(k))K)一定趨于0,根據(jù)式(43)可得[16]
(44)
定義二次函數(shù)
(45)
并滿足以下二次穩(wěn)定性條件
(46)
其中,α(0<α<1)是預先指定的衰減率,將式(44)、式(45)代入式(46)中可得
(47)
將式(47)左右分別乘以{I,Pz},并令Yz=LpPz,有
(48)
故求取下列優(yōu)化問題即可確定反饋增益K。
(49)
最后根據(jù)式(42)可得最優(yōu)控制律uc(k)。
定理4最優(yōu)控制律uc(k)施加于擾動LPV式(1)中,保證了擾動LPV系統(tǒng)的魯棒漸近穩(wěn)定性。
證明狀態(tài)反饋增益K可保證當k→∞時,(A(ρ(k))+B(ρ(k))K)→0,且當k→∞時,ec(k)→0,e(k)→0,因此由式(43)可得,當k→∞時,控制誤差z(k)趨于0,所以xc0(k)最終會收斂到x0(k)。無擾動控制律的設(shè)計保證式(4)的漸近穩(wěn)定性,即當k→∞時,x0(k) →0,因此當k→∞時,xc0(k) →0;又因為當k→∞時,ec(k) →0,所以式(1)的估計狀態(tài)xc0(k)將會收斂到式(1)的實際狀態(tài)xc(k),即當k→∞時,xc(k)→0;由此可得將最優(yōu)控制律uc(k)施加于式(1)中,保證式(1)的魯棒漸近穩(wěn)定性;證畢。
當系統(tǒng)的初始狀態(tài)在某一輸入的驅(qū)動下,系統(tǒng)從這一初始狀態(tài)運動到末態(tài),若存在擾動使系統(tǒng)的初始狀態(tài)在某一范圍內(nèi)發(fā)生偏移,但系統(tǒng)的終態(tài)仍能回到給定的末態(tài)范圍內(nèi),則稱該系統(tǒng)是穩(wěn)定的,這就是普通意義上的穩(wěn)定性。而漸近穩(wěn)定性是穩(wěn)定性的一種,它要求當時間趨于無窮時,當系統(tǒng)的初始狀態(tài)在某一范圍內(nèi),系統(tǒng)的終態(tài)會回到零點??梢姖u近穩(wěn)定比穩(wěn)定對系統(tǒng)的要求嚴格,前者只需系統(tǒng)末態(tài)所在的范圍是零點周圍的一個區(qū)域,而后者要求系統(tǒng)末態(tài)趨近的這一點必須是零點,這就是漸近穩(wěn)定性與穩(wěn)定性的區(qū)別。通過上述定理4的證明,說明本文所提出的方法控制性能較好,能夠保證擾動LPV系統(tǒng)的漸近穩(wěn)定性。算法具體步驟如下文所述。
離線階段步驟:
步驟1計算Lp、K;選擇合適的L和R;
步驟2選擇合適的衰減律μ(0<μ<1)、α(0<α<1)使得式(10)、式(49)可行。
在線階段(k≥0)步驟:
步驟1在k= 0時刻,分別選定式(4)、式(5)的初始狀態(tài)x(0)、x0(0);
步驟2在k≥0時刻,根據(jù)式(5)得到x0(k),根據(jù)式(41)得到xc0(k),并計算xc0(k)-x0(k);
步驟3基于式(5)在線求解式(40)獲得控制輸入u(k)以及反饋增益F(k);
步驟4計算uc(k)=u(k)+K(xc0(k)-x0(k)),并將uc(k)施加于實際系統(tǒng)中;
步驟5重復在線階段的步驟2,直至xc0(k)=0,結(jié)束。
通過下面的數(shù)值算例證明該方法的有效性,首先給出如下所示的LPV系統(tǒng)
(50)
引用模型系數(shù)[17]
(51)
給式(50)加入有界擾動w(k)∈W
W={w∈R2||w|∞≤0.01}
根據(jù)反饋增益K、式(5)以及式(41)每一時刻所估計的狀態(tài)值可得到每一時刻的擾動LPV系統(tǒng)控制輸入的偏移量,隨后在線求解式(40)得到無擾動系統(tǒng)控制輸入u(k),最后將無擾動控制律組合最優(yōu)偏移量得到式(50)的最優(yōu)控制律u*(k)。下面將對文獻[10]中的方法與本文中的方法做對比分析。
由圖1可以看出,文獻[10]所提出的方法能夠保證擾動LPV系統(tǒng)的末態(tài)進入零點周圍的一個區(qū)域,但是難以保證擾動LPV系統(tǒng)的漸近穩(wěn)定性;而本文所提出的方法可使得擾動LPV系統(tǒng)狀態(tài)更快地進入穩(wěn)態(tài),并且能夠保證擾動LPV系統(tǒng)的漸近穩(wěn)定性,因此本文所提出的方法要優(yōu)于文獻[10]。本文中,在MPC的設(shè)計中考慮到了有界狀態(tài)干擾所造成的偏移量,因此相比于未考慮擾動的MPC方法[18],本文所提出的方法在實際生活中更加具有通用性。存在干擾的式(50)估計狀態(tài)與實際狀態(tài)的橫、縱坐標分別繪制在圖2、圖3中,估計狀態(tài)軌跡的坐標設(shè)定從[-0.8,-0.2]開始,實際狀態(tài)軌跡坐標設(shè)定從[-1,1.2]開始,圖2以估計狀態(tài)與實際狀態(tài)的橫坐標為y軸,以時間為x軸。
圖1 系統(tǒng)狀態(tài)軌跡對比圖Figure 1. Comparison diagram of system state trajectories
圖2 估計狀態(tài)與實際狀態(tài)橫坐標軌跡Figure 2. Estimated and actual state abscissa trajectories
圖3以估計狀態(tài)與實際狀態(tài)的縱坐標為y軸,以時間為x軸。
圖3 估計狀態(tài)與實際狀態(tài)的縱坐標軌跡Figure 3. Estimated and actual state longitudinal trajectories
由圖2、圖3可以看出,式(50)估計狀態(tài)與實際狀態(tài)的坐標軌跡最終匯合并且收斂于0,所以表明本文所提出的狀態(tài)觀測器效果良好。系統(tǒng)的最優(yōu)控制律如圖4所示。
圖4 擾動LPV系統(tǒng)的最優(yōu)控制律Figure 4. Optimal control law for a perturbed LPV system
由圖4可以看出,本文所提出的方法具有遞歸可行性,每一時刻都可求得最優(yōu)控制律。該仿真針對二維系統(tǒng),只有兩個變量,當變量個數(shù)增加后,系統(tǒng)維數(shù)增加,若采用本文方法,計算量會增大,因為相對應的矩陣維數(shù)會隨之增加,因此基于線性矩陣不等式的在線優(yōu)化問題的求解,離線狀態(tài)觀測器增益以及反饋增益K的確定都更加繁瑣。對于高維數(shù)系統(tǒng)的漸近穩(wěn)定性而言,定理4同樣適用于高維數(shù)系統(tǒng),因此當系統(tǒng)維數(shù)增高,本文所提出的方法同樣可保證系統(tǒng)的漸近穩(wěn)定性。
本文針對一類帶有有界狀態(tài)干擾的多胞描述LPV系統(tǒng),提出了一種改進魯棒預測控制方法,設(shè)計了可保證系統(tǒng)漸近穩(wěn)定的輸出反饋控制器。該控制器考慮無擾動LPV系統(tǒng)模型,基于LMI約束求解輸出反饋控制律。為抵消有界狀態(tài)干擾,本文設(shè)計并求取擾動LPV系統(tǒng)控制輸入的最優(yōu)偏移量,基于無擾動系統(tǒng)模型求取的控制律組合最優(yōu)偏移量即可得到擾動LPV系統(tǒng)的最優(yōu)控制律,最后將最優(yōu)控制律施加到實際系統(tǒng)中,并通過仿真實驗驗證了算法的有效性。