何之煜,徐 寧
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司通信信號(hào)研究所,北京100081)
高速列車(chē)自動(dòng)駕駛系統(tǒng)(Automatic Train Operation,ATO)是未來(lái)智能高速鐵路發(fā)展的關(guān)鍵技術(shù)之一[1],然而,高速列車(chē)運(yùn)行速度快,運(yùn)行環(huán)境復(fù)雜多變,系統(tǒng)受內(nèi)部和外部未知擾動(dòng)影響,呈現(xiàn)出快時(shí)變、強(qiáng)非線性的特征,控制器的設(shè)計(jì)仍然是一個(gè)難點(diǎn).
列車(chē)自動(dòng)駕駛研究已取得大量成果,現(xiàn)有控制方法多以反饋思想構(gòu)造控制律,通過(guò)列車(chē)運(yùn)行狀態(tài)信息的偏差產(chǎn)生控制輸入,忽略了高速列車(chē)運(yùn)行過(guò)程中的一個(gè)重要的特征——高度重復(fù)性,具體體現(xiàn)在運(yùn)行環(huán)境的重復(fù)性,運(yùn)行計(jì)劃的重復(fù)性,運(yùn)行目標(biāo)的重復(fù)性和列車(chē)動(dòng)力學(xué)模型的重復(fù)性.如何有效利用這些重復(fù)性信息處理時(shí)變、非線性的不確定系統(tǒng)的跟蹤控制問(wèn)題,是目前亟待解決的問(wèn)題.
迭代學(xué)習(xí)控制(Iterative Learning Control,ILC)是解決重復(fù)運(yùn)動(dòng)系統(tǒng)的跟蹤控制問(wèn)題的最有效方法之一,基本原理是通過(guò)前一次或幾次的跟蹤誤差來(lái)修正當(dāng)前迭代次的控制輸入,更精確地跟蹤期望運(yùn)行軌跡.在列車(chē)自動(dòng)運(yùn)行控制領(lǐng)域:文獻(xiàn)[2]首次將迭代學(xué)習(xí)控制引入列車(chē)自動(dòng)駕駛系統(tǒng)控制問(wèn)題的研究中;文獻(xiàn)[3]將終端迭代學(xué)習(xí)控制用于列車(chē)進(jìn)站停車(chē)的控制中,根據(jù)前次迭代終端停車(chē)誤差更新當(dāng)前迭代次的控制輸入,最終跟蹤誤差收斂到一個(gè)很小的鄰域內(nèi);文獻(xiàn)[4]設(shè)計(jì)了反饋—前饋迭代學(xué)習(xí)控制器,利用反饋控制在時(shí)域?qū)Ω櫿`差的修正,提高了跟蹤的收斂速度和精度.以上研究考慮了系統(tǒng)初態(tài)擾動(dòng)和執(zhí)行器控制輸入飽和的情況,但沒(méi)有考慮列車(chē)復(fù)雜運(yùn)行環(huán)境導(dǎo)致阻力參數(shù)的不確定性,以及在高速運(yùn)行狀態(tài)下列車(chē)等效重量變化對(duì)列車(chē)控制性能的影響.
列車(chē)運(yùn)行速度不斷提高,其實(shí)際運(yùn)行的動(dòng)態(tài)環(huán)境也越來(lái)越復(fù)雜.時(shí)變非線性的外部擾動(dòng)導(dǎo)致列車(chē)動(dòng)力學(xué)模型參數(shù)發(fā)生攝動(dòng),對(duì)控制器的設(shè)計(jì)帶來(lái)困難.高速列車(chē)的控制研究中,通常將阻力參數(shù)系數(shù)視為恒值[3-5],這顯然不符合控制器高精度跟蹤控制的要求.此外,列車(chē)運(yùn)行阻力參數(shù)系數(shù)的估計(jì)也有大量的研究[6-7].文獻(xiàn)[8]考慮速度延時(shí)和輸入受限的情況,建立列車(chē)動(dòng)力學(xué)模型,借助Lyapunov-Krasovskii函數(shù),設(shè)計(jì)了自適應(yīng)迭代學(xué)習(xí)控制器.文獻(xiàn)[9]設(shè)計(jì)了一個(gè)動(dòng)態(tài)建模的迭代學(xué)習(xí)控制算法,通過(guò)遞推最小二乘法辨識(shí)阻力系數(shù),利用范數(shù)最優(yōu)理論,實(shí)現(xiàn)模型辨識(shí)誤差和跟蹤控制誤差的2-范數(shù)收斂.
基于以上分析,針對(duì)高速列車(chē)自動(dòng)駕駛系統(tǒng)這一快時(shí)變、強(qiáng)非線性的復(fù)雜控制系統(tǒng),同時(shí)存在外部擾動(dòng)、輸入受限等因素的影響,根據(jù)系統(tǒng)對(duì)期望軌跡的跟蹤誤差,用迭代學(xué)習(xí)控制理論更新阻力參數(shù)系數(shù),用飽和函數(shù)約束系統(tǒng)控制輸入在合理的范圍內(nèi),在迭代域上對(duì)期望參數(shù)實(shí)現(xiàn)漸進(jìn)逼近,控制系統(tǒng)最終能夠完全跟蹤上期望軌跡.基于Lyapunov函數(shù)設(shè)計(jì)迭代學(xué)習(xí)控制律,并對(duì)其收斂性進(jìn)行證明,通過(guò)計(jì)算機(jī)仿真,驗(yàn)證所提出算法的有效性.
不失一般性,連續(xù)時(shí)間的非線性系統(tǒng)模型為
式中:i為系統(tǒng)重復(fù)運(yùn)行次數(shù),i∈N-;t為時(shí)間變量;xk,i(t)為系統(tǒng)第i次迭代k階的狀態(tài)信息;,i(t)為系統(tǒng)狀態(tài)信息xk,i(t)的一階導(dǎo)數(shù);K為系統(tǒng)的階數(shù);θi(t)為系統(tǒng)模型系數(shù)向量;ξi(t)是系統(tǒng)模型參數(shù)向量;b(t)是系統(tǒng)的未知輸入增益;ui(t)是控制輸入量;di(t)是未知時(shí)變的外部擾動(dòng).
為方便控制器設(shè)計(jì),給出以下假設(shè):
假設(shè)1系統(tǒng)在每次運(yùn)行前滿(mǎn)足相同的初態(tài)條件.
假設(shè)2非線性連續(xù)函數(shù)b(·)滿(mǎn)足
式中:g(·)為非負(fù)連續(xù)函數(shù);α1,α2分別為函數(shù)b(·)的兩個(gè)狀態(tài)信息變量
假設(shè)3存在一個(gè)最優(yōu)的控制序列ud,使得系統(tǒng)在有限時(shí)間t∈[ 0,T](T為給定的系統(tǒng)運(yùn)行時(shí)間)內(nèi),可以完全跟蹤期望的運(yùn)行軌跡.
本文控制目標(biāo)是,對(duì)于給定的系統(tǒng)期望運(yùn)行曲線xd,在初態(tài)一致的情況下,利用迭代學(xué)習(xí)控制方法,找到一個(gè)最優(yōu)的控制輸入序列ud,當(dāng)i趨于無(wú)窮時(shí),跟蹤誤差能夠收斂到0.
定義系統(tǒng)跟蹤誤差為
式中:xk,d(t)為系統(tǒng)k階向量期望的狀態(tài)信息.
定義擴(kuò)展誤差為
式中:c1,c2, …為Hurwitz多項(xiàng)式的系數(shù),為正實(shí)數(shù);c為多項(xiàng)式系數(shù)集合的向量;ei(t)為系統(tǒng)跟蹤誤差向量ek,i(t)集合的向量.
為處理非線性系統(tǒng)輸入受限問(wèn)題,將式(1)改寫(xiě)為
為方便控制器收斂性分析,給出以下性質(zhì):
性質(zhì) 1[9]對(duì)于a,b∈Rm,如果參數(shù)a滿(mǎn)足,那么,有
對(duì)于時(shí)變、非線性復(fù)雜系統(tǒng)式(6),給出所設(shè)計(jì)控制律的收斂性分析,下述定理是本文的主要結(jié)論.
定理1針對(duì)非線性系統(tǒng)式(6)執(zhí)行重復(fù)運(yùn)行任務(wù)時(shí),基于迭代學(xué)習(xí)控制理論,應(yīng)用所設(shè)計(jì)的控制律和參數(shù)更新律,當(dāng)?shù)螖?shù)i趨于無(wú)窮時(shí),對(duì)于t∈[ 0,T],跟蹤誤差逐漸趨于0,閉環(huán)系統(tǒng)狀態(tài)xi有界.
證明定義類(lèi)Lyapunov的復(fù)合能量函數(shù)為
對(duì)式(14)的第1項(xiàng)Lyaounov函數(shù)進(jìn)行求解,結(jié)合迭代學(xué)習(xí)控制律式(10),將函數(shù)重寫(xiě)為
由系統(tǒng)模型式(1)和擴(kuò)展誤差式(4)可知
從而,證明了復(fù)合能量函數(shù)Ei沿迭代軸的差分負(fù)定性.接下來(lái),若是證明了E0(t)是有界的,那么Ei(t)也是有界的.
令i=0,對(duì)式(14)關(guān)于時(shí)間t求導(dǎo),并結(jié)合式(16)和式(17)的結(jié)論,得
即系統(tǒng)跟蹤誤差隨迭代軸逐漸收斂到0.
迭代學(xué)習(xí)控制目標(biāo)的可達(dá)性可以描述為存在一系列的控制輸入ud(t),使得系統(tǒng)可以完全跟蹤上期望運(yùn)行曲線.那么,對(duì)于t∈[0 ,T],系統(tǒng)狀態(tài)xd(t)是有界的.又由于系統(tǒng)實(shí)際的控制狀態(tài)可以描述為xi=xd+ei,根據(jù)ei的有界性,可知,系統(tǒng)狀態(tài)xi(t)也是有界的.
對(duì)所提出的自適應(yīng)迭代學(xué)習(xí)控制算法進(jìn)行仿真驗(yàn)證,充分考慮外部擾動(dòng)、系統(tǒng)受限,以及等效質(zhì)量攝動(dòng)的情況.仿真線路長(zhǎng)度為183.2 km,列車(chē)計(jì)劃運(yùn)行時(shí)間為2 700 s,列車(chē)滿(mǎn)載重量為530 t,時(shí)變外部擾動(dòng)在有界域內(nèi)隨機(jī)分布,其上界設(shè)置為0.03 N/kg.如圖1所示,給出列車(chē)區(qū)間運(yùn)行的期望速度和期望位移曲線圖.
圖1 列車(chē)運(yùn)行期望速度和距離曲線圖Fig.1 Desired speed and distance profiles of train operation
根據(jù)式(1),列車(chē)動(dòng)力學(xué)模型可以表示為
式中:x1,i為列車(chē)運(yùn)行距離(km);x2,i是列車(chē)運(yùn)行速度(km/h);θi是列車(chē)阻力模型系數(shù);ξi是列車(chē)阻力模型參數(shù)向量,;M是列車(chē)的質(zhì)量(t);γ(t)是列車(chē)時(shí)變的回轉(zhuǎn)質(zhì)量系數(shù);ui是列車(chē)輸入的牽引/制動(dòng)力(kN);di是外部時(shí)變的未知擾動(dòng)(N/kg).
本文提出的自適應(yīng)迭代學(xué)習(xí)控制算法參數(shù)設(shè)置如下:Γ=[0.002,0.000 4,0.000 000 4]T,η=2.4,阻力系數(shù)上界
為便于說(shuō)明,將PID控制算法和D型迭代學(xué)習(xí)控制算法對(duì)列車(chē)運(yùn)行期望曲線跟蹤性能與本文提出的算法進(jìn)行比較,如圖2~圖4所示.可以看出:PID控制是基于時(shí)間域的反饋控制,在目標(biāo)曲線工況轉(zhuǎn)換時(shí),出現(xiàn)較大的暫態(tài),不利于列車(chē)平穩(wěn)運(yùn)行;D型迭代學(xué)習(xí)控制則是基于迭代域的反饋控制,雖然能夠?qū)W習(xí)列車(chē)運(yùn)行的重復(fù)性信息,速度曲線隨迭代次數(shù)逐漸逼近參考曲線,但收斂速度較慢,跟蹤誤差較大;本文提出的自適應(yīng)迭代學(xué)習(xí)算法,既能基于迭代域?qū)W習(xí)列車(chē)運(yùn)行的重復(fù)性信息,也能在時(shí)間域上對(duì)列車(chē)進(jìn)行反饋控制,實(shí)現(xiàn)對(duì)期望曲線的精確跟蹤.
圖2 PID控制曲線圖Fig.2 PID control profile
圖3 D型迭代學(xué)習(xí)控制曲線圖Fig.3 D-type iteration learning control profiles
圖4 自適應(yīng)迭代學(xué)習(xí)控制曲線圖Fig.4 Adaptive iteration learning control profiles
圖5和圖6給出3種算法的距離和速度跟蹤均方根誤差曲線圖.可以看出,本文所提出的自適應(yīng)迭代學(xué)習(xí)控制算法具有較高的跟蹤精度和較快的收斂速度,能夠快速實(shí)現(xiàn)對(duì)期望速度曲線的精確跟蹤.
為進(jìn)一步驗(yàn)證算法的有效性,基于實(shí)驗(yàn)室CTCS-3+ATO仿真測(cè)試環(huán)境,選取京沈客運(yùn)專(zhuān)線(遼寧段)中的阜新站—新民北站線路,以實(shí)際運(yùn)營(yíng)的某車(chē)型作為仿真對(duì)象.線路總長(zhǎng)97.9 km,計(jì)劃運(yùn)行時(shí)間1 320 s,其中,設(shè)置了一段長(zhǎng)度為4 km的250 km/h的固定限速路段.執(zhí)行上述任務(wù),重復(fù)迭代40次,算法的設(shè)置參數(shù)與4.1節(jié)內(nèi)容相同.
圖5 3種算法的距離跟蹤誤差對(duì)比圖Fig.5 Comparison of distance tracking error profiles
圖6 3種算法的速度跟蹤誤差對(duì)比圖Fig.6 Comparison of speed tracking error profiles
圖7給出所提出算法在第10、20次迭代與現(xiàn)有算法對(duì)期望曲線的跟蹤性能對(duì)比.可以看出,現(xiàn)有算法在列車(chē)由牽引工況進(jìn)入巡航工況時(shí),會(huì)出現(xiàn)較大的暫態(tài),而本文提出的自適應(yīng)迭代學(xué)習(xí)控制算法通過(guò)對(duì)列車(chē)運(yùn)行參數(shù)的學(xué)習(xí),能夠控制列車(chē)的運(yùn)行逐漸收斂到期望曲線上.
圖7 所提算法與現(xiàn)有算法在跟蹤曲線上的對(duì)比Fig.7 Comparison of tracking profiles between proposed and existing algorithms
圖8和圖9給出實(shí)驗(yàn)中列車(chē)對(duì)期望軌跡跟蹤的速度和距離誤差隨迭代域變化的曲線與現(xiàn)有算法的對(duì)比,以均方根誤差表征.可以看出:所提算法在速度和距離的跟蹤性能上均具有較高的精度和收斂速度;在第15次迭代時(shí),速度跟蹤誤差達(dá)到0.01 m/s,距離跟蹤誤差則降到1 m.
圖8 兩種算法的距離跟蹤誤差對(duì)比圖Fig.8 Comparison of distance tracking error profile
圖9 兩種算法的速度跟蹤誤差對(duì)比圖Fig.9 Comparison of speed tracking error profiles
本文以高速列車(chē)自動(dòng)駕駛系統(tǒng)作為研究對(duì)象,考慮其受到外部擾動(dòng)、系統(tǒng)受限的情況,設(shè)計(jì)自適應(yīng)迭代學(xué)習(xí)控制律和參數(shù)更新律,通過(guò)迭代域的學(xué)習(xí)和時(shí)間域的反饋共同作用輸出系統(tǒng)的控制輸入,并基于Lyapunov函數(shù)構(gòu)造復(fù)合能量函數(shù),證明了所提算法的收斂性和穩(wěn)定性.仿真結(jié)果表明,本文提出的自適應(yīng)迭代學(xué)習(xí)控制算法對(duì)列車(chē)期望曲線的跟蹤具有較快的收斂速度和較高的跟蹤精度,具有魯棒性強(qiáng)、穩(wěn)定性高、實(shí)現(xiàn)方便等優(yōu)勢(shì),有較好的工程應(yīng)用參考意義.