何之煜,楊志杰,呂旌陽(yáng)
(1.中國(guó)鐵道科學(xué)研究院研究生部,北京 100081; 2.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司通信信號(hào)研究所,北京 100081; 3.北京郵電大學(xué)信息與通信工程學(xué)院,北京 100876)
迭代學(xué)習(xí)控制(Iterative Learning Control, ILC)是在有限區(qū)間內(nèi)處理重復(fù)運(yùn)行系統(tǒng)跟蹤控制問(wèn)題最有效的方法之一,其特點(diǎn)是原理簡(jiǎn)單、易于實(shí)現(xiàn)且對(duì)模型要求不高,是一種近乎無(wú)模型的前饋學(xué)習(xí)控制算法。自1978年日本學(xué)者Uchiyama提出迭代學(xué)習(xí)控制理論至今[1],國(guó)內(nèi)外專家學(xué)者對(duì)其做了大量的工作[2-5],逐步形成了具有嚴(yán)格數(shù)學(xué)描述的控制理論體系。目前,對(duì)迭代學(xué)習(xí)控制的研究和應(yīng)用已遍及工業(yè)生產(chǎn)的方方面面,如工業(yè)機(jī)器人[6,7]、數(shù)控機(jī)床[8]、工業(yè)化學(xué)反應(yīng)堆[9]、注模機(jī)[10]、列車自動(dòng)駕駛系統(tǒng)[11]和汽車防抱死系統(tǒng)[12]等。
高速列車自動(dòng)駕駛系統(tǒng)是一個(gè)具有高度重復(fù)性的控制系統(tǒng),具體表現(xiàn)為運(yùn)行環(huán)境的重復(fù)性、運(yùn)行計(jì)劃的重復(fù)性、運(yùn)行目標(biāo)的重復(fù)性以及列車動(dòng)力學(xué)模型的重復(fù)性。文獻(xiàn)[13]首次將ILC思想引入到列車自動(dòng)駕駛系統(tǒng)中,文獻(xiàn)[14]研究了距離域反饋、迭代域前饋學(xué)習(xí)的列車自動(dòng)駕駛控制方法,基于距離域建模,結(jié)合壓縮映射方法,控制列車逐漸逼近期望軌跡。文獻(xiàn)[15]提出預(yù)測(cè)迭代學(xué)習(xí)控制算法來(lái)處理系統(tǒng)輸入受限問(wèn)題,實(shí)現(xiàn)對(duì)期望軌跡的精確跟蹤,但需要知道控制系統(tǒng)的精確模型。文獻(xiàn)[16]設(shè)計(jì)了一個(gè)動(dòng)態(tài)建模的ILC算法,通過(guò)遞推最小二乘法辨識(shí)模型參數(shù),基于范數(shù)最優(yōu)理論,實(shí)現(xiàn)對(duì)跟蹤誤差關(guān)于2范數(shù)收斂,但沒有考慮系統(tǒng)初態(tài)和受限問(wèn)題。
系統(tǒng)受限問(wèn)題普遍存在于現(xiàn)代工業(yè)控制系統(tǒng)中,主要表現(xiàn)為輸入受限和狀態(tài)受限。目前,對(duì)于控制系統(tǒng)受限問(wèn)題下的迭代學(xué)習(xí)控制研究已有了大量的研究成果,文獻(xiàn)[17]設(shè)計(jì)了一個(gè)雙環(huán)ILC控制器來(lái)解決系統(tǒng)輸入受限問(wèn)題,ILC環(huán)1用來(lái)學(xué)習(xí)標(biāo)稱系統(tǒng)的控制器,ILC環(huán)2則用來(lái)擬合非線性控制輸入項(xiàng),但是雙環(huán)結(jié)構(gòu)復(fù)雜且獨(dú)立工作。文獻(xiàn)[18]以受限狀態(tài)下的Euler-Bernoulli梁結(jié)構(gòu)為研究對(duì)象,在非周期性分布式擾動(dòng)和邊界擾動(dòng)作用下,建立了基于時(shí)間加權(quán)的Lyapunov-Krasovskii能量函數(shù),實(shí)現(xiàn)了跟蹤誤差沿迭代軸的漸進(jìn)收斂。文獻(xiàn)[19-20]將飽和函數(shù)sat(·)引入輸入受限控制系統(tǒng)的研究中。文獻(xiàn)[21]針對(duì)一個(gè)線性狀態(tài)受限的系統(tǒng),將迭代學(xué)習(xí)控制問(wèn)題轉(zhuǎn)化為凸函數(shù)優(yōu)化問(wèn)題,證明了算法的跟蹤誤差是關(guān)于2范數(shù)收斂的,但是沒有對(duì)非線性系統(tǒng)進(jìn)行深入研究。文獻(xiàn)[22]利用雙曲正切函數(shù)和飽和函數(shù)處理機(jī)械手控制系統(tǒng)輸入受限問(wèn)題,實(shí)現(xiàn)跟蹤誤差隨迭代軸的漸進(jìn)收斂。
與大多數(shù)工業(yè)控制系統(tǒng)相同,高速列車自動(dòng)駕駛系統(tǒng)也是一個(gè)受限的控制系統(tǒng),主要體現(xiàn)為執(zhí)行器物理結(jié)構(gòu)對(duì)控制輸入的限制、線路的固定限速和臨時(shí)限速等。本文充分考慮上述限制因素,針對(duì)時(shí)變、非線性的高速列車自動(dòng)駕駛控制系統(tǒng),提出一種受限狀態(tài)下的迭代學(xué)習(xí)控制算法,建立類Lyapunov函數(shù)的復(fù)合能量函數(shù),對(duì)所設(shè)計(jì)的算法的收斂性進(jìn)行證明,通過(guò)計(jì)算機(jī)仿真驗(yàn)證,證明了算法的有效性。
為便于描述,通常將列車看作是一個(gè)剛性質(zhì)點(diǎn),理想狀態(tài)下的列車動(dòng)力學(xué)模型可以表示為
(1)
式中,i為系統(tǒng)迭代運(yùn)行次數(shù);x1,i(t)為列車運(yùn)行距離,m;x2,i(t)為列車運(yùn)行速度,m/s;f(Xi,t)為列車運(yùn)行的單位非線性阻力函數(shù),N/kg;b為系統(tǒng)的輸入增益,這里取列車的質(zhì)量的倒數(shù)1/M;ui(t)為列車的輸入牽引力/制動(dòng)力,kN;fb(t)為列車的單位基本阻力,N/kg;fa(s)為線路上的單位附加阻力,包括坡道附加阻力fg、曲線附加阻力fc和隧道附加阻力ft,N/kg;a0,a1,a2分別為列車基本阻力函數(shù)的系數(shù)。
列車在實(shí)際運(yùn)行過(guò)程中會(huì)受到以下兩方面的限制。
(1)輸入受限
umin(t)≤ui(t)≤umax(t)
(2)
式中,umax(t),umin(t)分別為系統(tǒng)控制輸入的上、下界。
(2)狀態(tài)受限
xk,min(t)≤xk,i(t)≤xk,max(t)
(3)
式中,k為系統(tǒng)階數(shù),k=1,2;xk,max(t),xk,min(t)分別為系統(tǒng)狀態(tài)信息的上、下界。
考慮系統(tǒng)受限情況,可以將式(1)改寫為
(4)
(5)
本文的控制目標(biāo)是,對(duì)于給定的列車運(yùn)行期望曲線xd,在式(2)、式(3)限制條件下,基于迭代學(xué)習(xí)控制理論,找到一個(gè)最優(yōu)的控制序列ui(t),使得當(dāng)i→∞時(shí),系統(tǒng)能夠精確跟蹤期望曲線。
為方便控制器設(shè)計(jì),提出如下合理假設(shè)。
假設(shè)1:列車在每次運(yùn)行前滿足相同的初始條件,即
Xi(0)=Xd(0), ?i∈Z*
(6)
假設(shè)2:存在一個(gè)最優(yōu)的控制序列ui(t),使得列車能夠在有限時(shí)間t∈[0,T]內(nèi)完全跟蹤上期望的軌跡曲線。
為便于對(duì)下一節(jié)控制器收斂性的分析,這里給出關(guān)于飽和函數(shù)的性質(zhì)。
(7)
在設(shè)計(jì)控制器之前,首先定義系統(tǒng)的跟蹤誤差ei(t)=xi(t)-xd(t),進(jìn)一步,系統(tǒng)在第i次迭代的擴(kuò)展誤差可以表示為
si(t)=c1e1,i+e2,i
(8)
定義系統(tǒng)第i次迭代的Lyapunov函數(shù)為
(9)
上式關(guān)于時(shí)間t求導(dǎo),可得
(10)
為滿足Lyapunov穩(wěn)定性要求,對(duì)于重復(fù)運(yùn)行的列車自動(dòng)駕駛系統(tǒng),基于迭代學(xué)習(xí)的思想,在受限情況下,設(shè)計(jì)如下控制器
(11)
時(shí)變的模型系數(shù)向量βi可以通過(guò)飽和函數(shù)和迭代學(xué)習(xí)的思想來(lái)實(shí)現(xiàn),表示為
(12)
針對(duì)高速列車自動(dòng)駕駛系統(tǒng),給出所設(shè)計(jì)控制律的收斂性分析,下述定理是主要的結(jié)論。
定理1:對(duì)于高速列車自動(dòng)駕駛系統(tǒng)模型式(1)執(zhí)行重復(fù)運(yùn)行任務(wù)時(shí),應(yīng)用迭代學(xué)習(xí)控制器,本文所設(shè)計(jì)的控制律和學(xué)習(xí)增益更新律具有以下的性質(zhì)。
(L1)?t∈[0,T],當(dāng)?shù)螖?shù)i趨向于無(wú)窮時(shí),跟蹤誤差向量ei(t)趨向于零。
(L2)系統(tǒng)狀態(tài)信號(hào)ui(t),xi(t)均有界,且在任意時(shí)刻任意迭代次都能滿足約束條件(2)和(3)。
證明 首先,構(gòu)造類Lyapunov的復(fù)合能量函數(shù)(為了表述清晰,會(huì)對(duì)函數(shù)的表達(dá)作一定的簡(jiǎn)化)
(13)
式中,δβi為時(shí)變學(xué)習(xí)增益的估計(jì)誤差,δβi=β-βi。
接下來(lái),分別對(duì)定理1中的(L1)、(L2)部分進(jìn)行證明。
(1)定理1中(L1)部分的證明
首先,在迭代域?qū)?fù)合能量函數(shù)Ei(t)進(jìn)行差分,得到
ΔEi(t)=Ei(t)-Ei-1(t)=
(14)
式中,Δδβi為δβi在迭代軸的差分,Δδβi=δβi-δβi-1。
(βi-1-βi)dτ=
(15)
(16)
成立。
因此,利用上式可以將式(15)改寫為
(17)
對(duì)式(14)第一項(xiàng),將控制律式(11)代入,可以得到
(18)
將上兩式代入到式(14)中,得
(19)
由于上式中兩項(xiàng)均具有正定性,因此式(19)成立,即能量函數(shù)沿迭代軸具有差分負(fù)定性。
接下來(lái),將對(duì)E0(t)的有界性進(jìn)行證明。令i=0,將式(13)重寫為
(20)
對(duì)上式關(guān)于時(shí)間t求導(dǎo),可得
(21)
考慮到?t∈[0,T],β-1=0,可以將上式改寫為
(22)
因此,可以得到
(23)
由于β為已知閉區(qū)間上的連續(xù)函數(shù),且有界,因此,必然存在一個(gè)已知上界D*,使得
(24)
那么,式(20)就可以表示為
(25)
根據(jù)復(fù)合能量函數(shù)Ei(t)的差分負(fù)定性,可以將第i次迭代學(xué)習(xí)的能量函數(shù)表示為
(26)
對(duì)上式兩端取極限
(27)
由于能量函數(shù)Ei(t)是正定的,且E0(t)在時(shí)域[0,T]上有界,所以根據(jù)級(jí)數(shù)收斂的條件,可以得知,當(dāng)?shù)螖?shù)i趨于無(wú)窮時(shí),有
(28)
即列車運(yùn)行的跟蹤誤差在迭代域上會(huì)逐漸收斂到零。
(2)定理1中(L2)部分的證明
由于能量函數(shù)Ei(t)的正定性,且E0(t)在時(shí)域[0,T]上是有界的,那么根據(jù)式(27),Ei(t)在時(shí)域[0,T]上也是有界的。另外,根據(jù)上述的級(jí)數(shù)收斂定理,當(dāng)?shù)螖?shù)i趨于無(wú)窮時(shí),系統(tǒng)跟蹤誤差ei(t)也會(huì)收斂到零。根據(jù)學(xué)習(xí)增益更新律式(12),在飽和函數(shù)意義下,可以得出結(jié)論,時(shí)變的學(xué)習(xí)參數(shù)向量βi(t)同樣是有界的。
此外,基于迭代學(xué)習(xí)控制的控制目標(biāo)可達(dá)性可以描述為存在一系列的控制輸入ud(t),使得系統(tǒng)可以完全跟蹤上期望運(yùn)行曲線。那么,對(duì)于?t∈[0,T],系統(tǒng)狀態(tài)xd(t)是有界的。又由于系統(tǒng)實(shí)際的控制狀態(tài)可以描述為xi(t)=xd(t)+ei(t),根據(jù)ei(t)的有界性,可知,系統(tǒng)狀態(tài)xi(t)也是有界的,由此可知,控制輸入ui(t)同樣是有界的。
以高速動(dòng)車組某型車作為仿真對(duì)象,仿真線路長(zhǎng)度為112.46 km,計(jì)劃運(yùn)行時(shí)間為1 800 s。列車線路上受到的附加阻力如圖1所示,根據(jù)列車動(dòng)力學(xué)模型和線路條件,求解出列車在區(qū)間的期望速度曲線和期望位移曲線,如圖2所示。通過(guò)Matlab仿真,將PID控制算法和D型迭代學(xué)習(xí)控制算法,與本文提出的受限狀態(tài)下的迭代學(xué)習(xí)控制算法進(jìn)行比較,驗(yàn)證算法在受限狀態(tài)下的有效性和收斂性。
圖1 列車單位附加阻力
圖2 列車運(yùn)行期望速度和位移曲線
(1)PID反饋控制算法
工業(yè)上廣泛使用PID反饋控制器,控制律設(shè)計(jì)如下
(29)
式中,Kp為控制器的比例項(xiàng)系數(shù),取0.5;Ki為控制器的積分項(xiàng)系數(shù),取0.1;Kd為控制器的微分項(xiàng)系數(shù),取10。
(2)D型迭代學(xué)習(xí)控制算法
列車的初次迭代采用(1)的PID反饋控制器得到,從第2次開始,采用如下D型迭代學(xué)習(xí)控制器
(30)
式中,G為常學(xué)習(xí)增益,G=[g1,g2]T,取g1=1.5,g2=3。
(3)本文提出的參數(shù)化迭代學(xué)習(xí)控制算法
列車的初次迭代同樣采用(1)的PID反饋控制器,根據(jù)所提出的迭代學(xué)習(xí)控制律和參數(shù)更新律,設(shè)置c1=1,θi(0)=[0,0,0]T,參數(shù)向量θ(t)的上界定義為θmax(t)=[1,0.01,0.000 5]T,下界定義為θmax(t)=[0.01,0.001,0.000 05]T,參數(shù)更新增益矩陣γ=[0.01,0.000 4,0.000 000 4]T。
圖3 PID控制跟蹤效果
圖4 D型迭代學(xué)習(xí)控制跟蹤效果
圖5 本文所提出的迭代學(xué)習(xí)控制跟蹤效果
由圖3~圖5可以看出,當(dāng)列車進(jìn)行工況轉(zhuǎn)換時(shí),PID反饋控制會(huì)產(chǎn)生較大的暫態(tài),導(dǎo)致列車運(yùn)行偏離期望軌跡;而D型迭代學(xué)習(xí)控制器對(duì)期望曲線跟蹤的收斂速度較慢,且控制輸入會(huì)超過(guò)執(zhí)行器上界,不利于列車安全運(yùn)行;而本文提出的受限狀態(tài)下的迭代學(xué)習(xí)控制算法,通過(guò)飽和函數(shù)sat(·)的作用,保證列車運(yùn)行控制輸入和狀態(tài)始終在允許范圍內(nèi),并且能夠較快地跟蹤上期望軌跡曲線。
圖6 三種控制算法的距離跟蹤誤差對(duì)比
圖7 3種控制算法的速度跟蹤誤差對(duì)比
圖6和圖7給出了3種控制算法在距離和速度跟蹤誤差的對(duì)比圖,可以看出,PID算法由于沒有學(xué)習(xí)機(jī)制,無(wú)法隨著迭代次數(shù)提高距離和速度的跟蹤精度;D型迭代學(xué)習(xí)控制算法由于沒有對(duì)控制系統(tǒng)模型的學(xué)習(xí),因此跟蹤收斂速度較慢;而本文提出的迭代學(xué)習(xí)控制算法,可以很好的學(xué)習(xí)系統(tǒng)的重復(fù)性信息,達(dá)到較快的收斂速度和跟蹤精度。
為分析在受限狀態(tài)下高速列車的跟蹤控制問(wèn)題,首先建立了在受限狀態(tài)下的列車動(dòng)力學(xué)模型,然后根據(jù)擴(kuò)展誤差建立Lyapunov函數(shù),推導(dǎo)出基于迭代學(xué)習(xí)控制的控制律和參數(shù)更新律,并給出嚴(yán)格的數(shù)學(xué)收斂性分析,最后通過(guò)計(jì)算機(jī)仿真對(duì)所提出的算法進(jìn)行驗(yàn)證,分析其對(duì)期望運(yùn)行軌跡的跟蹤性能,主要結(jié)論如下。
(1)飽和函數(shù)sat(·)可以有效限制列車自動(dòng)駕駛系統(tǒng)執(zhí)行器的控制輸入過(guò)大問(wèn)題,保證了系統(tǒng)的運(yùn)行安全。
(2)通過(guò)嚴(yán)格的數(shù)學(xué)證明,驗(yàn)證了所提出的控制律沿迭代軸可以達(dá)到漸進(jìn)收斂,證明了算法收斂性和穩(wěn)定性。
(3)通過(guò)計(jì)算機(jī)仿真驗(yàn)證以及與PID算法和D型迭代學(xué)習(xí)控制算法對(duì)期望運(yùn)行軌跡跟蹤性能的比較,證明所提出的算法具有較快的收斂速度和較高的跟蹤精度,且能夠保證控制輸入在允許的范圍內(nèi)。