毛艷嶺 富 月
實(shí)際工業(yè)過程的被控對象大多是非線性的,比如電镕鎂砂熔煉過程的電極、鋼球磨煤機(jī)制粉過程的磨機(jī)等等.非線性系統(tǒng)結(jié)構(gòu)復(fù)雜,往往難以得到精確的數(shù)學(xué)模型,其控制問題一直是控制領(lǐng)域相關(guān)學(xué)者和工程師的研究難點(diǎn)和熱點(diǎn)之一.
經(jīng)典的非線性控制方法,如反饋線性化方法[1-2],由于需要已知精確的數(shù)學(xué)模型,無法應(yīng)用到實(shí)際的工業(yè)過程中.為了解決這個(gè)問題,文獻(xiàn)[3]針對具有全狀態(tài)約束的高階非線性隨機(jī)系統(tǒng),利用模糊邏輯系統(tǒng)逼近未知非線性函數(shù),提出了一種新的模糊自適應(yīng)反步控制方法.文獻(xiàn)[4]在文獻(xiàn)[3]的基礎(chǔ)上,針對具有指數(shù)型性能函數(shù)的高階非線性隨機(jī)系統(tǒng),提出了基于模糊邏輯系統(tǒng)和反步法的模糊自適應(yīng)有限時(shí)間跟蹤控制方法.當(dāng)被控對象的非線性較弱或在某一平衡點(diǎn)附近運(yùn)行時(shí),通常采用近似線性模型進(jìn)行描述,并針對該模型設(shè)計(jì)控制器.例如,文獻(xiàn)[5]利用遞歸近似理論,將非線性系統(tǒng)看作線性時(shí)變序列系統(tǒng)的極限,針對線性時(shí)變序列系統(tǒng)設(shè)計(jì)線性二次最優(yōu)序列控制器,從而實(shí)現(xiàn)原非線性系統(tǒng)的二次最優(yōu)控制.文獻(xiàn)[6]利用泰勒公式將非線性系統(tǒng)在某一平衡點(diǎn)附近表示為線性模型與高階非線性項(xiàng)的組合,將開環(huán)解耦補(bǔ)償器、非線性神經(jīng)網(wǎng)絡(luò)補(bǔ)償器和一步超前最優(yōu)加權(quán)自適應(yīng)控制器結(jié)合,提出了非線性系統(tǒng)基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)動(dòng)態(tài)解耦控制方法.文獻(xiàn)[7]考慮到模型階次的不匹配問題,通過引入降階模型,采用帶死區(qū)的歸一化投影算法對線性模型參數(shù)進(jìn)行辨識(shí),利用高階神經(jīng)網(wǎng)絡(luò)估計(jì)高階非線性項(xiàng),將帶有濾波器的極點(diǎn)配置自適應(yīng)比例積分微分(Proportional integral derivative)控制器與神經(jīng)網(wǎng)絡(luò)補(bǔ)償器相結(jié)合,提出了非線性系統(tǒng)基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)PID 控制方法.神經(jīng)網(wǎng)絡(luò)收斂速度較慢且容易陷入局部極小點(diǎn),高階非線性項(xiàng)的估計(jì)精確度較低.為了解決這一問題,文獻(xiàn)[8]首次引入了控制器驅(qū)動(dòng)模型和虛擬未建模動(dòng)態(tài)的概念,基于線性控制器驅(qū)動(dòng)模型構(gòu)造一步超前最優(yōu)自適應(yīng)控制器,結(jié)合虛擬未建模動(dòng)態(tài)補(bǔ)償器,提出了非線性系統(tǒng)自適應(yīng)切換控制方法.文獻(xiàn)[9]針對復(fù)雜的熱交換過程,設(shè)計(jì)了具有虛擬未建模動(dòng)態(tài)補(bǔ)償?shù)囊徊阶顑?yōu)比例積分(Proportional integral)控制器,并提出了數(shù)據(jù)驅(qū)動(dòng)的雙速率控制方法.上述控制方法雖然能夠取得良好的控制效果,但是當(dāng)系統(tǒng)的非線性較強(qiáng)或平衡點(diǎn)發(fā)生變化時(shí),這種只考慮單一平衡點(diǎn)的控制方法往往會(huì)使控制性能下降甚至導(dǎo)致整個(gè)系統(tǒng)失穩(wěn).
很多實(shí)際工業(yè)過程的平衡點(diǎn)都會(huì)隨著工況的不同而發(fā)生變化,比如電熔鎂砂熔煉過程的平衡點(diǎn)隨著原料成分和加料階段的不同會(huì)發(fā)生變化;鋼球磨煤機(jī)制粉系統(tǒng)中磨機(jī)的平衡點(diǎn)隨著原煤成分和濕度的不同而發(fā)生變化.本文針對一類具有M個(gè)平衡點(diǎn)的非線性系統(tǒng),研究基于多模型切換的自適應(yīng)控制方法.多模型自適應(yīng)控制方法一般用于改善系統(tǒng)的暫態(tài)性能或解決參數(shù)跳變系統(tǒng)的控制問題,如文獻(xiàn)[10]針對一類連續(xù)時(shí)間線性系統(tǒng),為改善系統(tǒng)的暫態(tài)性能,提出了基于直接模型參考自適應(yīng)控制的多模型切換控制方法.文獻(xiàn)[11]針對一類參數(shù)跳變離散時(shí)間線性系統(tǒng),提出了基于間接自校正控制的多模型切換控制方法.文獻(xiàn)[12]針對一類參數(shù)跳變離散時(shí)間非線性系統(tǒng),通過引入k-差分算子,分別設(shè)計(jì)了線性自適應(yīng)控制器和基于神經(jīng)網(wǎng)絡(luò)的非線性自適應(yīng)控制器,通過兩個(gè)控制器之間的切換,可以提高系統(tǒng)的性能和穩(wěn)定性.為了避免不良切換行為,文獻(xiàn)[13]采用滯后切換邏輯消除了參數(shù)估計(jì)器對初始條件的依賴,通過利用魯棒線性時(shí)不變工具實(shí)現(xiàn)高性能的控制目標(biāo),結(jié)合控制器混合策略,提出了多模型自適應(yīng)混合控制方法.針對文獻(xiàn)[13]所提方法需要模型數(shù)量大的問題,文獻(xiàn)[14]采用分離處理原則,充分利用所有辨識(shí)模型信息,采用二級(jí)自適應(yīng)方法建立自適應(yīng)控制器.為了消除系統(tǒng)非線性項(xiàng)對控制輸入應(yīng)嚴(yán)格線性的限制,文獻(xiàn)[15]針對離散時(shí)間非線性系統(tǒng),采用極點(diǎn)配置控制方法,提出了由線性間接自校正控制器、基于神經(jīng)網(wǎng)絡(luò)的非線性間接自校正控制器和切換機(jī)制組成的多模型自適應(yīng)控制器.很多研究將多模型自適應(yīng)控制方法應(yīng)用到實(shí)際系統(tǒng)中,并且取得了較好的控制效果.文獻(xiàn)[16]將多模型自適應(yīng)切換控制方法應(yīng)用于電力系統(tǒng)低頻振蕩中,建立了不同工況下的線性小信號(hào)模型,采用遞歸貝葉斯方法計(jì)算每個(gè)模型代表實(shí)際電力系統(tǒng)的概率,根據(jù)這個(gè)概率得到每個(gè)控制器輸出的占比權(quán)重,最終的控制輸出即為每個(gè)控制器輸出的概率加權(quán)平均值.文獻(xiàn)[17]針對動(dòng)態(tài)特性隨不同負(fù)載狀態(tài)而變化的柔性傳送系統(tǒng),分別在不同負(fù)載狀態(tài)處建立線性模型,提出了基于閉環(huán)輸出誤差最小化的參數(shù)估計(jì)算法和基于極點(diǎn)配置的多模型自適應(yīng)切換控制方法.文獻(xiàn)[18]以鋼球磨煤機(jī)制粉系統(tǒng)為例,針對一類具有多變量強(qiáng)耦合強(qiáng)非線性且動(dòng)態(tài)特性隨不同運(yùn)行條件而變化的復(fù)雜工業(yè)過程,將其在不同平衡點(diǎn)處用不同的線性模型和非線性未建模動(dòng)態(tài)項(xiàng)組成的估計(jì)模型來描述,提出了由非線性解耦控制器、線性解耦控制器和多模型切換機(jī)制組成的智能解耦控制方法.文獻(xiàn)[19]針對串聯(lián)電容補(bǔ)償輸電線路的風(fēng)力系統(tǒng)次同步諧振問題,采用傳統(tǒng)線性控制方法設(shè)計(jì)控制器,根據(jù)系統(tǒng)條件設(shè)計(jì)該控制器的監(jiān)控控制器,該方法之后被拓展到了雙饋異步發(fā)電機(jī)在串聯(lián)補(bǔ)償輸電系統(tǒng)中的次同步振蕩問題[20].上述多模型控制方法中,用于切換的控制器是針對單一時(shí)刻的性能指標(biāo)設(shè)計(jì)的,具有次優(yōu)性,無法保證切換序列和控制系統(tǒng)的最優(yōu)性.
在實(shí)際工業(yè)生產(chǎn)過程中,保證控制系統(tǒng)性能最優(yōu)對實(shí)現(xiàn)工業(yè)過程整體優(yōu)化控制是至關(guān)重要的.本文針對具有未知?jiǎng)討B(tài)和M個(gè)平衡點(diǎn)的連續(xù)時(shí)間非線性系統(tǒng),將嵌入轉(zhuǎn)換法和近似動(dòng)態(tài)規(guī)劃技術(shù)相結(jié)合,提出了一種自適應(yīng)最優(yōu)切換控制方法,一方面能夠保證切換序列的最優(yōu)性,另一方面可以實(shí)現(xiàn)控制系統(tǒng)的最優(yōu)性能,改善控制系統(tǒng)的動(dòng)態(tài)品質(zhì).首先在非線性系統(tǒng)的M個(gè)平衡點(diǎn)附近采集M組輸入和狀態(tài)數(shù)據(jù),利用黎卡提方程的迭代求解公式和最小二乘方法得到針對每個(gè)線性模型的最優(yōu)控制器增益的估計(jì),利用極小值原理得到M個(gè)近似線性化模型.然后利用嵌入轉(zhuǎn)換法將M個(gè)近似線性化模型嵌入到一個(gè)連續(xù)時(shí)間大系統(tǒng)中,通過二次規(guī)劃技術(shù)得到非線性系統(tǒng)的線性自適應(yīng)最優(yōu)切換控制器和最優(yōu)切換序列.最后,將線性自適應(yīng)最優(yōu)切換控制器和未建模動(dòng)態(tài)補(bǔ)償器相結(jié)合,實(shí)現(xiàn)了控制目標(biāo).仿真實(shí)驗(yàn)驗(yàn)證了本文所提方法的有效性、優(yōu)越性和實(shí)際可應(yīng)用性.
本文針對具有未知?jiǎng)討B(tài)和M個(gè)平衡點(diǎn)的連續(xù)時(shí)間非線性系統(tǒng),提出了自適應(yīng)最優(yōu)切換控制方法.主要?jiǎng)?chuàng)新點(diǎn)如下:
1)提出了由線性最優(yōu)切換控制器、切換準(zhǔn)則和未建模動(dòng)態(tài)補(bǔ)償器組成的控制器結(jié)構(gòu);
2)模型參數(shù)已知時(shí),基于嵌入轉(zhuǎn)換技術(shù)提出了由M個(gè)模型、M個(gè)最優(yōu)控制器和切換準(zhǔn)則組成的線性最優(yōu)切換控制器;
3)模型參數(shù)未知時(shí),基于嵌入轉(zhuǎn)換技術(shù)和近似動(dòng)態(tài)規(guī)劃思想提出了由M個(gè)近似線性化模型、M個(gè)自適應(yīng)最優(yōu)控制器和切換準(zhǔn)則組成的線性自適應(yīng)最優(yōu)切換控制器.
考慮由如下模型描述的具有M個(gè)平衡點(diǎn)的連續(xù)時(shí)間非線性非仿射系統(tǒng):
其中x(t)=[x1(t),x2(t),···,xn(t)]T是n維狀態(tài)向量,u(t)=[u1(t),u2(t),···,um(t)]T是m維控制輸入向量,f(x(t),u(t))=[f1(·,·),f2(·,·),···,fn(·,·)]T:Rn×Rm →Rn表示連續(xù)可微的未知非線性向量函數(shù).
本文的目標(biāo)是針對具有M個(gè)平衡點(diǎn)的未知非線性系統(tǒng)(1),尋找最優(yōu)切換序列和自適應(yīng)最優(yōu)切換控制律u(t),使得閉環(huán)系統(tǒng)漸近穩(wěn)定.
非線性非仿射系統(tǒng)結(jié)構(gòu)復(fù)雜,很難直接根據(jù)它的模型設(shè)計(jì)控制器.通常的做法是將非線性系統(tǒng)在某一平衡點(diǎn)附近線性化,針對等價(jià)的近似線性模型設(shè)計(jì)控制器,從而實(shí)現(xiàn)對原非線性系統(tǒng)的有效控制,如文獻(xiàn)[4-5]等.為此本文將非線性系統(tǒng)(1)在M個(gè)平衡點(diǎn)附近泰勒展開,得到第i∈{1,2,···,M}個(gè)平衡點(diǎn)(xi,ui)附近的等價(jià)近似線性模型:
其中b是整數(shù),則系統(tǒng)(1)可表示為
其中σ(t)∈{1,2,···,M}表示切換信號(hào).與此同時(shí),本文所提出的控制器結(jié)構(gòu)也包括兩部分,第一部分根據(jù)基于線性化模型建立的如下控制器設(shè)計(jì)模型進(jìn)行設(shè)計(jì):
第二部分根據(jù)線性化產(chǎn)生的建模誤差來設(shè)計(jì),用于消除未建模動(dòng)態(tài)影響,實(shí)現(xiàn)閉環(huán)系統(tǒng)漸近穩(wěn)定.在不引起混淆的情況下,接下來我們將簡化為.
當(dāng)Ai和Bi(i=1,···,M)已知時(shí),我們提出了如圖1 所示的由線性最優(yōu)切換控制器、切換準(zhǔn)則、未建模動(dòng)態(tài)補(bǔ)償器以及非線性系統(tǒng)組成的控制系統(tǒng)結(jié)構(gòu),其中線性最優(yōu)切換控制器和切換準(zhǔn)則根據(jù)控制器設(shè)計(jì)模型(4),利用嵌入轉(zhuǎn)換法[21]、極小值原理和二次規(guī)劃方法獲得;未建模動(dòng)態(tài)補(bǔ)償器根據(jù)非線性系統(tǒng)狀態(tài)和最優(yōu)模型狀態(tài)之間的誤差設(shè)計(jì).
圖1 Ai和Bi已知時(shí)的控制系統(tǒng)結(jié)構(gòu)Fig.1 Control system structure whenAiandBiare known
首先令δ(σ(t)-i)在區(qū)間[0,1]內(nèi)連續(xù)變化,利用嵌入轉(zhuǎn)換法將式(4)嵌入到一個(gè)連續(xù)時(shí)間大系統(tǒng)中.然后根據(jù)該嵌入式連續(xù)時(shí)間大系統(tǒng)的最優(yōu)控制問題:
其中δ(σ(t)-i)∈[0,1],Q、R為適當(dāng)維數(shù)的參數(shù)矩陣且可觀,采用極小值原理和二次規(guī)劃方法得到切換準(zhǔn)則函數(shù):
其中Pσ(t)根據(jù)如下黎卡提方程求解:
每一時(shí)刻,比較Jσ(t),選擇與最小的Jσ(t)對應(yīng)的線性最優(yōu)切換控制律:
其中σ(t)為最優(yōu)切換序列,Kσ(t)表示線性最優(yōu)切換控制器的增益,通過下式求解:
接下來,為消除未建模動(dòng)態(tài)對控制系統(tǒng)性能的影響,我們設(shè)計(jì)了如下未建模動(dòng)態(tài)補(bǔ)償器:
其中a1∈Rm×n為可調(diào)參數(shù)矩陣,a2為可調(diào)參數(shù),em=x-x*為建模誤差,x*為最優(yōu)線性化模型σ(t)的狀態(tài).
綜上,Ai和Bi(i=1,···,M)已知時(shí)最優(yōu)切換控制律為:
注 1.線性最優(yōu)切換控制律和最優(yōu)切換序列推導(dǎo)過程見附錄A.
注 2.針對控制器設(shè)計(jì)模型(4),通過嵌入擴(kuò)大δ(σ(t)-i)的取值范圍,令δ(σ(t)-i)在區(qū)間[0,1]內(nèi)連續(xù)變化,將由多個(gè)近似線性模型組成的式(4)嵌入到一個(gè)連續(xù)時(shí)間大系統(tǒng)中;通過轉(zhuǎn)換將針對控制器設(shè)計(jì)模型(4)的最優(yōu)切換控制問題轉(zhuǎn)化為針對該嵌入式連續(xù)時(shí)間大系統(tǒng)的最優(yōu)切換控制問題.
當(dāng)Ai和Bi(i=1,···,M)未知時(shí),無法通過式(7)得到Pσ(t),無法得到如式(6)所示的切換準(zhǔn)則函數(shù)和式(8)所示的線性最優(yōu)切換控制律.為解決這一問題,本文提出了一種自適應(yīng)最優(yōu)切換控制方法.首先在非線性系統(tǒng)的M個(gè)平衡點(diǎn)附近采集M組輸入、狀態(tài)數(shù)據(jù),利用黎卡提方程的迭代求解公式和最小二乘算法得到針對線性化模型σ(t)的自適應(yīng)最優(yōu)控制器增益以及黎卡提方程近似解,并根據(jù)貝爾曼方程得到Pσ(t)Aσ(t)的估計(jì),從而得到M個(gè)平衡點(diǎn)附近的M個(gè)線性化模型;然后將M個(gè)線性化模型嵌入到一個(gè)連續(xù)時(shí)間大系統(tǒng)中,針對該嵌入式連續(xù)時(shí)間大系統(tǒng)基于極小值原理和二次規(guī)劃技術(shù)設(shè)計(jì)線性二次型最優(yōu)控制律,進(jìn)而得到最優(yōu)切換序列和線性自適應(yīng)最優(yōu)切換控制律;最后將線性自適應(yīng)最優(yōu)切換控制律和未建模動(dòng)態(tài)補(bǔ)償器相結(jié)合應(yīng)用到非線性系統(tǒng)中,實(shí)現(xiàn)對未知?jiǎng)討B(tài)非線性系統(tǒng)的自適應(yīng)最優(yōu)切換控制.
針對控制器設(shè)計(jì)模型(4),當(dāng)Ai和Bi(i=1,···,M)已知時(shí),根據(jù)Kleinman 定理[22],很容易得到如下推論:
推論 1.令Kσ(t),0∈Rm×n為針對線性化模型σ(t)的穩(wěn)定反饋控制器增益矩陣,Pσ(t),k為下面李雅普諾夫方程的對稱正定解:
其中δ(σ(t)-i)∈{0,1}且,k=1,2,···表示迭代次數(shù),Kσ(t),k滿足
則Kσ(t),k和Pσ(t),k分別收斂于針對線性化模型σ(t)的最優(yōu)控制器增益Kσ(t)和黎卡提方程解Pσ(t),即
定理 1.針對控制器設(shè)計(jì)模型(4),當(dāng)Ai和Bi(i=1,···,M)未知時(shí),使性能指標(biāo)
最小的切換準(zhǔn)則函數(shù)為:
其中Θσ(t),和Ξσ(t)的定義見后文,vec(C)是把m×n維矩陣C按列的順序一列接一列地組成的mn維向量,?代表克羅內(nèi)克積,
線性自適應(yīng)最優(yōu)切換控制律為:
其中σ(t)為與最小的Jσ(t)對應(yīng)的最優(yōu)切換序列.
證明.首先根據(jù)離線采集的M組輸入、狀態(tài)數(shù)據(jù),計(jì)算針對線性化模型σ(t)的自適應(yīng)最優(yōu)控制器增益以及黎卡提方程近似解.受文獻(xiàn)[23]啟發(fā),將式(4)等價(jià)表示為:
其中Aσ(t),k=Aσ(t)-Bσ(t)Kσ(t),k.根據(jù)式(12)和式(13),沿著式(20)的解,可以得到
由克羅內(nèi)克積的定義,可知
其中,In表示n維單位矩陣.定義如下運(yùn)算
對于正整數(shù)l,定義矩陣
其中0≤t0<t1<···<tl.由式(22)和式(23)可知,式(21)可等價(jià)表示為:
當(dāng)Θσ(t),k為列滿秩矩陣時(shí),
由此,可以得到線性化模型σ(t)第k次迭代的自適應(yīng)最優(yōu)控制器增益Kσ(t),k+1.
接下來,針對線性化模型σ(t)求解矩陣Pσ(t)Bσ(t)和Pσ(t)Aσ(t)的估計(jì),從而得到M個(gè)平衡點(diǎn)附近的M個(gè)線性化模型.當(dāng)Ai和Bi已知時(shí),易知
因此,Ai和Bi未知時(shí),若記Lσ(t)為Pσ(t)Bσ(t)的估計(jì),則
Pσ(t)Aσ(t)的估計(jì)可根據(jù)線性化模型σ(t)的貝爾曼方程得到,易知
將式(27)代入上式,利用離線采集的第σ(t)組輸入、狀態(tài)數(shù)據(jù),通過求取最小二乘解可以得到如式(18)所示的矩陣Pσ(t)Aσ(t)的估計(jì)Nσ(t).根據(jù)Dσ(t),Nσ(t)以及,可以很容易得到M個(gè)平衡點(diǎn)附近的近似控制器設(shè)計(jì)模型:
最后求取最優(yōu)切換序列和線性自適應(yīng)最優(yōu)切換控制律.針對模型(29),應(yīng)用嵌入變換法,使δ(σ(t)-i)在[0,1]內(nèi)連續(xù)變化,為此令δ(t)=[δ(σ(t)-1),···,δ(σ(t)-M)]T并記1,δ(σ(t)-i)≥0}.定義哈密頓函數(shù):
易知,針對嵌入式近似控制器設(shè)計(jì)模型的最優(yōu)控制律為:
將式(31)代入式(30),化簡可得
下面將δ(σ(t)-i)作為決策變量,通過最小化H(x,δ),可以得到最優(yōu)切換序列.
實(shí)際上,選擇δ(σ(t)-i)使H(x,δ)最小等價(jià)為使式(33)最小
這是一個(gè)二次規(guī)劃問題,由于W是凸集,是凹函數(shù),該問題的全局極小值一定在δ(σ(t)-i)∈{0,1}取得[21],且該全局極小值對應(yīng)的σ(t)即為最優(yōu)切換序列.由此可以得到如式(16)的切換準(zhǔn)則函數(shù)和式(19)的線性自適應(yīng)最優(yōu)切換控制律.
注3.由式(27)可知Lσ(t)的估計(jì)精度由的估計(jì)精度決定.由文獻(xiàn)[23]易知,收斂于參數(shù)已知時(shí)的最優(yōu)控制器增益Kσ(t),因此Lσ(t)收斂于Pσ(t)Bσ(t).由式(28)可知Nσ(t)的估計(jì)精度由最小二乘估計(jì)算法的精度和的估計(jì)精度共同決定.
注4.在每個(gè)平衡點(diǎn)附近,如果存在正整數(shù)l0,使得對于任意l≥l0,都有mn,即矩陣Θσ(t),k是滿秩的,那么序列和分別收斂到黎卡提方程的解Pσ(t)和最優(yōu)控制器增益Kσ(t)[23].
未建模動(dòng)態(tài)補(bǔ)償器的設(shè)計(jì)與線性模型參數(shù)已知時(shí)的情況類似,即
其中a1∈Rm×n為可調(diào)參數(shù)矩陣,a2為可調(diào)參數(shù),為建模誤差,為最優(yōu)線性化模型σ(t)的狀態(tài).
綜上,Ai和Bi(i=1,···,M)未知時(shí)自適應(yīng)最優(yōu)切換控制律為:
自適應(yīng)最優(yōu)切換控制器設(shè)計(jì)流程如圖2 所示.
圖2 自適應(yīng)最優(yōu)切換控制器設(shè)計(jì)算法流程Fig.2 Flow chart of adaptive optimal switching control algorithm
為了驗(yàn)證本文所提方法的有效性,我們分別進(jìn)行了模型參數(shù)已知時(shí)最優(yōu)切換控制和模型參數(shù)未知時(shí)自適應(yīng)最優(yōu)切換控制的數(shù)值仿真實(shí)驗(yàn),并分別與單一的針對一個(gè)模型的最優(yōu)控制器和自適應(yīng)最優(yōu)控制器進(jìn)行了對比.除此之外,為了驗(yàn)證本文所提方法的實(shí)際可應(yīng)用性,我們進(jìn)行了模型參數(shù)未知時(shí)雙容水箱液位系統(tǒng)的自適應(yīng)最優(yōu)切換控制仿真實(shí)驗(yàn).
考慮如下連續(xù)時(shí)間非線性系統(tǒng):
其中x=[x1,x2]T∈R2是狀態(tài)向量,u=[u1,u2]T∈R2是輸入向量.
我們的目標(biāo)是針對已知的非線性系統(tǒng)(36),尋找最優(yōu)切換序列和最優(yōu)切換控制律,使得閉環(huán)系統(tǒng)漸近穩(wěn)定.為此,首先分別將u=[u1,u2]T=[-3,10]T,[-2,10]T和[-1,10]T施加到非線性系統(tǒng)(36)上,并令得到非線性系統(tǒng)(36)的三個(gè)平衡點(diǎn),即 [ur1,ur2,xr1,xr2]T=[-3,10,-4.4685,0.5592]T,[-2,10,-4.2642,0.7565]T和 [-1,10,-4.0264,1.1119]T.將式(36)分別在上述三個(gè)平衡點(diǎn)處泰勒展開,并令δ(σ(t)-i)∈{0,1}且i)=1,可以得到非線性系統(tǒng)(36)在3 個(gè)平衡點(diǎn)附近的控制器設(shè)計(jì)模型:
其中
接下來給定隨機(jī)初始狀態(tài)x(0)=[x1(0),x2(0)]T=[-4.4685,0.5592]T,并選擇控制器參數(shù)矩陣
和未建模動(dòng)態(tài)補(bǔ)償器參數(shù)
最后將最優(yōu)切換控制器(6)~(11)加入到系統(tǒng)(36),得到如圖3 所示的狀態(tài)曲線,如圖4 所示的控制輸入曲線和如圖5 所示的最優(yōu)切換序列.結(jié)合圖3和圖4,在t=50 s和t=100 s時(shí),雖然系統(tǒng)的平衡點(diǎn)發(fā)生變化,但是采用本文提出的最優(yōu)切換控制方法仍能夠?qū)顟B(tài)很快調(diào)節(jié)到平衡點(diǎn)附近并保持不變.
圖3 采用最優(yōu)切換控制器時(shí)系統(tǒng)的狀態(tài)Fig.3 State curves of the system when using the optimal switching controller
圖4 采用最優(yōu)切換控制器時(shí)系統(tǒng)的控制輸入Fig.4 Input curves of the system when using the optimal switching controller
圖5 采用最優(yōu)切換控制器時(shí)系統(tǒng)的最優(yōu)切換序列Fig.5 Optimal switching sequence of the system when using the optimal switching controller
為了驗(yàn)證本文所提最優(yōu)切換控制方法的優(yōu)越性,我們與單一的針對一個(gè)模型的最優(yōu)控制方法進(jìn)行了對比實(shí)驗(yàn).以針對平衡點(diǎn)[ur1,ur2,xr1,xr2]T=[-1,10,-4.0264,1.1119]T處的線性化模型為例,給定初始狀態(tài)x(0)=[x1(0),x2(0)]T=[-4.4685,0.5592]T,選擇控制器參數(shù)矩陣如式(38)所示,未建模動(dòng)態(tài)補(bǔ)償器參數(shù)如式(39)所示.
圖6和圖7 分別為所得到的狀態(tài)曲線和控制輸入曲線.根據(jù)圖6 和圖7 可以看出,針對平衡點(diǎn)[ur1,ur2,xr1,xr2]T=[-1,10,-4.0264,1.1119]T處的線性化模型設(shè)計(jì)的控制器只能將狀態(tài)調(diào)節(jié)到對應(yīng)的平衡點(diǎn)附近.當(dāng)平衡點(diǎn)發(fā)生變化時(shí),系統(tǒng)的狀態(tài)存在穩(wěn)態(tài)誤差.但是由于平衡點(diǎn)的變化引起的建模誤差可近似為常數(shù),因此狀態(tài)曲線雖然偏離平衡點(diǎn)但恒定不變.
圖6 采用最優(yōu)控制器時(shí)系統(tǒng)的狀態(tài)Fig.6 State curves of the system when using the optimal controller
圖7 采用最優(yōu)控制器時(shí)系統(tǒng)的控制輸入Fig.7 Input curves of the system when using the optimal controller
本節(jié)的目標(biāo)是針對未知非線性系統(tǒng)(36),尋找最優(yōu)切換序列和自適應(yīng)最優(yōu)切換控制律,使得閉環(huán)系統(tǒng)漸近穩(wěn)定.不失一般性,這里我們以兩個(gè)平衡點(diǎn)為例進(jìn)行仿真實(shí)驗(yàn).結(jié)合圖2,首先分別在平衡點(diǎn)[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T和[ur1,ur2,xr1,xr2]T=[2,10,-2.5517,3.6570]T附近施加激勵(lì)輸入信號(hào),即[u1,u2]T=[sin(0.1t),sin(0.5t)]T,從t=0 s到t=2 s,以0.01 s 為采樣周期,分別采集201 組輸入和狀態(tài)數(shù)據(jù),計(jì)算δxx,Ixx,Ixu.選擇控制器參數(shù)矩陣
終止循環(huán)的條件為||Pσ(t),k-Pσ(t),k-1||≤10-3,其中σ(t)=1,2;k代表迭代次數(shù).根據(jù)式(17)分別得到針對兩個(gè)模型的,即:
然后利用所采集的輸入和狀態(tài)數(shù)據(jù)求解式(18),分別得到針對兩個(gè)模型的Nσ(t),即:
最后,根據(jù)式(29)可以得到兩個(gè)線性化模型如下式所示:
將兩個(gè)線性化模型嵌入到一個(gè)連續(xù)時(shí)間大系統(tǒng)中,結(jié)合圖2,給定初始狀態(tài)x(0)=[x1(0),x2(0)]T=[-4,0]T和初始時(shí)間t0=0 s,設(shè)置tmax=100 s,選擇未建模動(dòng)態(tài)補(bǔ)償器參數(shù)
將自適應(yīng)最優(yōu)切換控制器(35)加入到非線性系統(tǒng),當(dāng)滿足t≥tmax時(shí),可以得到如圖8 所示的狀態(tài)曲線,如圖9 所示的控制輸入曲線和如圖10 所示的切換序列.在t=50 s,由于平衡點(diǎn)突變,切換序列發(fā)生改變,導(dǎo)致系統(tǒng)的狀態(tài)震蕩,經(jīng)過1.8 s 的調(diào)節(jié)時(shí)間,系統(tǒng)的狀態(tài)被調(diào)節(jié)到平衡點(diǎn)附近并保持不變.
圖8 采用自適應(yīng)最優(yōu)切換控制器時(shí)系統(tǒng)的狀態(tài)Fig.8 The state curves of the system when using the adaptive optimal switching controller
圖9 采用自適應(yīng)最優(yōu)切換控制器時(shí)系統(tǒng)的控制輸入Fig.9 The input curves of the system when using the adaptive optimal switching controller
圖10 采用自適應(yīng)最優(yōu)切換控制器時(shí)系統(tǒng)的切換序列Fig.10 The switching sequence of the system when using the adaptive optimal switching controller
為了驗(yàn)證本文所提自適應(yīng)最優(yōu)切換控制方法的優(yōu)越性,我們以平衡點(diǎn)[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T為例,與單一的針對一個(gè)模型的自適應(yīng)最優(yōu)控制方法進(jìn)行了對比實(shí)驗(yàn).選擇控制器參數(shù)矩陣如式(40),根據(jù)式(17)和式(18)可以得到和N1分別如式(41)和式(42)所示,根據(jù)式(29)可以得到線性化模型如式(43)所示,選擇未建模動(dòng)態(tài)補(bǔ)償器參數(shù)如式(44)所示.所得到的狀態(tài)曲線和控制輸入曲線如圖11 和圖12 所示.從圖11 和圖12 可以看出,針對平衡點(diǎn)[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T設(shè)計(jì)的自適應(yīng)最優(yōu)控制器只能將狀態(tài)調(diào)節(jié)到對應(yīng)的平衡點(diǎn)附近.與模型參數(shù)已知時(shí)情況相同,當(dāng)t=50 s時(shí),平衡點(diǎn)發(fā)生變化,系統(tǒng)狀態(tài)存在穩(wěn)態(tài)誤差.但是由于平衡點(diǎn)的變化引起的建模誤差可近似為常數(shù),因此狀態(tài)曲線雖然偏離平衡點(diǎn)但恒定不變.
圖11 采用自適應(yīng)最優(yōu)控制器時(shí)系統(tǒng)的狀態(tài)Fig.11 State curves of the system when using the adaptive optimal controller
圖12 采用自適應(yīng)最優(yōu)控制器時(shí)系統(tǒng)的控制輸入Fig.12 Input curves of the system when using the adaptive optimal controller
為了進(jìn)一步驗(yàn)證所提方法的實(shí)際可應(yīng)用性,接下來針對如圖13 所示的雙容水箱液位系統(tǒng)進(jìn)行仿真實(shí)驗(yàn)[24].它主要由水池、水泵1、水泵2、水罐1 和水罐2 及兩個(gè)液位傳感器組成.水泵1 和水泵2 分別將水池中的水經(jīng)過橡膠管抽取到水罐1 和水罐2 中,兩個(gè)水罐底部存在漏水孔,水罐1 中的水經(jīng)過漏水孔流入水罐2,水罐2 中的水經(jīng)過漏水孔流入水池,形成閉環(huán).
圖13 雙容水箱結(jié)構(gòu)Fig.13 Structure of the coupled-tank
根據(jù)物料平衡原理,建立雙容水箱液位系統(tǒng)的機(jī)理模型:
其中x1和x2分別表示水罐1 和水罐2 的液位,u1和u2分別表示水泵1 和水泵2 的電壓,Kp1、Kp2、Ao1、Ao2、At1、At2和g的含義及取值如表1 所示.
表1 模型中涉及的符號(hào)含義及取值Table 1 The symbol meaning and value involved in the model
我們的目標(biāo)是針對雙容水箱液位系統(tǒng)(45),尋找最優(yōu)切換序列和自適應(yīng)最優(yōu)切換控制律,使系統(tǒng)的液位漸近穩(wěn)定.為此,首先分別將u=[u1,u2]T=[6.5,4]T和[8,4]T施加到雙容水箱液位系統(tǒng)(45)上,并令得到雙容水箱液位系統(tǒng)(45)的兩個(gè)平衡點(diǎn),即[6.5,4,14.17,25.2]T和[8,4,11.2,21.17]T.結(jié)合圖2,分別在兩個(gè)平衡點(diǎn)附近施加激勵(lì)輸入信號(hào),即[u1,u2]T=[sin(0.1t),sin(0.5t)]T,從t=0 s到t=2 s,以0.01 s 為采樣周期,分別采集201 組輸入和狀態(tài)數(shù)據(jù),計(jì)算δxx,Ixx,Ixu.選擇控制器參數(shù)矩陣
終止循環(huán)的條件為||Pσ(t),k-Pσ(t),k-1||≤10-3,其中σ(t)=1,2;k代表迭代次數(shù).根據(jù)式(17)分別得到針對兩個(gè)模型的,即:
然后利用所采集的輸入和狀態(tài)數(shù)據(jù)求解式(18),分別得到針對兩個(gè)模型的Nσ(t),即:
最后,根據(jù)式(29)可以得到兩個(gè)近似線性化模型如下式所示:
將兩個(gè)近似線性化模型嵌入到一個(gè)連續(xù)時(shí)間大系統(tǒng)中,結(jié)合圖2,給定初始狀態(tài)x(0)=[x1(0),x2(0)]T=[0,0]T和初始時(shí)間t0=0 s,設(shè)置tmax=160 s和輸入電壓限幅為0~22 V,選擇未建模動(dòng)態(tài)補(bǔ)償器參數(shù)
當(dāng)t=80 s時(shí),將自適應(yīng)最優(yōu)切換控制器(35)加入到雙容水箱液位系統(tǒng),當(dāng)滿足t≥tmax時(shí),可以得到如圖14 所示的液位曲線,如圖15 所示的控制輸入曲線和如圖16 所示的切換序列.在t=120 s,平衡點(diǎn)突變,經(jīng)過2.1 s 的調(diào)節(jié)時(shí)間,系統(tǒng)的液位被調(diào)節(jié)到平衡點(diǎn)附近并保持不變.
圖14 采用自適應(yīng)最優(yōu)切換控制器時(shí)水箱的液位Fig.14 Levels of the coupled-tank when using the adaptive optimal switching controller
圖15 采用自適應(yīng)最優(yōu)切換控制器時(shí)水箱的控制輸入Fig.15 Input curves of the coupled-tank when using the adaptive optimal switching controller
圖16 采用自適應(yīng)最優(yōu)切換控制器時(shí)水箱的切換序列Fig.16 Switching sequence of the coupled-tank when using the adaptive optimal switching controller
為了驗(yàn)證本文所提自適應(yīng)最優(yōu)切換控制方法的優(yōu)越性,我們以平衡點(diǎn)[6.5,4,14.17,25.2]T為例,與單一的針對一個(gè)模型的自適應(yīng)最優(yōu)控制方法進(jìn)行了對比實(shí)驗(yàn).選擇控制器參數(shù)矩陣如式(46)所示.根據(jù)式(17)和式(18)可以得到和N1分別如式(47)和式(48)所示.根據(jù)式(29)可以得到線性化模型如式(49)所示.選擇未建模動(dòng)態(tài)補(bǔ)償器參數(shù)如式(50)所示.可以得到如圖17 所示的液位曲線和如圖18 所示的控制輸入曲線.根據(jù)圖17 和圖18可以看出,針對平衡點(diǎn)[6.5,4,14.17,25.2]T設(shè)計(jì)的自適應(yīng)最優(yōu)控制器只能將液位調(diào)節(jié)到對應(yīng)的平衡點(diǎn)附近.當(dāng)t=120 s時(shí),平衡點(diǎn)發(fā)生變化,系統(tǒng)液位存在穩(wěn)態(tài)誤差.
圖17 采用自適應(yīng)最優(yōu)控制器時(shí)水箱的液位Fig.17 Levels of the coupled-tank when using the adaptive optimal controller
圖18 采用自適應(yīng)最優(yōu)控制器時(shí)水箱的控制輸入Fig.18 Input curves of the coupled-tank when using the adaptive optimal controller
針對具有未知?jiǎng)討B(tài)和M個(gè)平衡點(diǎn)的連續(xù)時(shí)間非線性系統(tǒng),本文提出了一種自適應(yīng)最優(yōu)切換控制方法.該方法首先在非線性系統(tǒng)的M個(gè)平衡點(diǎn)附近采集狀態(tài)信息和輸入信息,利用最小二乘法和黎卡提方程迭代求解公式得到最優(yōu)控制器增益的估計(jì),利用極小值原理得到M個(gè)平衡點(diǎn)附近的線性化模型.然后將嵌入轉(zhuǎn)換法和近似動(dòng)態(tài)規(guī)劃方法相結(jié)合,得到了非線性系統(tǒng)的最優(yōu)切換序列和線性自適應(yīng)最優(yōu)切換控制器.最后,將線性自適應(yīng)最優(yōu)切換控制器和未建模動(dòng)態(tài)補(bǔ)償器相結(jié)合,實(shí)現(xiàn)了對非線性系統(tǒng)的最優(yōu)控制.仿真實(shí)驗(yàn)表明和單一的最優(yōu)控制方法相比,本文所提方法能夠?qū)崿F(xiàn)較好的控制效果且具有實(shí)際可應(yīng)用性.
附錄A 參數(shù)已知時(shí)的線性最優(yōu)切換控制律和最優(yōu)切換序列推導(dǎo)過程
令δ(t)=[δ(σ(t)-1),···,δ(σ(t)-M)]T,并記.針對控制器設(shè)計(jì)模型(4)的嵌入式模型:
其中δ(σ(t)-i)∈[0,1],定義哈密頓函數(shù):
則協(xié)態(tài)方程為
把式(A4)代入式(A2)可以得到
接下來,我們將問題轉(zhuǎn)化為如何選擇δ(σ(t)-i)使H最小.易知,選擇δ(σ(t)-i)使H最小可簡化為使下式最小:
它可看作是一個(gè)二次規(guī)劃問題:
其中G(t)=λT(t)Bσ(t)R-1BσT(t)λ(t),W={δ∈RM:為凸集.當(dāng)R為正定矩陣時(shí),-G(t)≤0,因此問題式(A7)可看作凹函數(shù)在凸集W上的最小化問題,H0的全局最小值一定在δ(σ(t)-i)∈{0,1}取得[21].根據(jù)式(A6),選擇切換準(zhǔn)則函數(shù):
其中Pσ(t)為對稱實(shí)矩陣.對式(A9)兩邊分別求導(dǎo)并整理得
將式(A3)和式(A10)對比,可以得到
式(A9)分別代入式(A8)和式(A4)可以得到:
由于δ(σ(t)-i)∈{0,1},結(jié)合式(A12)和式(A11),可以得到切換準(zhǔn)則函數(shù):
其中Pσ(t)根據(jù)黎卡提方程求解:
每一時(shí)刻,計(jì)算并比較Jσ(t),求出最小的Jσ(t)對應(yīng)的線性最優(yōu)切換控制律:
其中σ(t)表示最優(yōu)切換序列,Kσ(t)表示線性最優(yōu)切換控制器的增益,通過下式求解: